
今年AI技術(shù)在市場(chǎng)上備受關(guān)注,許多企業(yè)對AI技術(shù)的采用躍躍欲試,各家云端大廠(chǎng)也推出自家多項服務(wù)提供給企業(yè),但是都得在云端上運行,AI技術(shù)的熱潮,是否也意味著(zhù)企業(yè)將資料上云端是未來(lái)必然的趨勢?讓資料倉儲龍頭Teradata的技術(shù)長(cháng)Stephen Brobst來(lái)告訴你。
Stephen Brobst在高階主管排名服務(wù)ExecRank排名中,曾與Amazon、Tesla Motors以及Intel的技術(shù)長(cháng)并列全球前4大技術(shù)長(cháng),并曾創(chuàng )立過(guò)3家新創(chuàng )公司,而後到Teradata擔任技術(shù)長(cháng),17年技術(shù)長(cháng)資歷更讓他成為歐巴馬的技術(shù)顧問(wèn)。
依照Stephen Brobst的觀(guān)察,企業(yè)將資料上云端,并非必然的趨勢,企業(yè)要先厘清上云端的目的,他表示,根據Gartner統計,「目前只有低於3分之1的企業(yè)將資料放到公有云,」安全性是企業(yè)最大的疑慮,目前多半企業(yè)只將自家資料,放在本地端或是私有云。
許多人對云端的安全性有所疑慮,Stephen Brobst卻有截然不同的觀(guān)點(diǎn),「云端其實(shí)比本地端還要安全!」他表示,想像如云端龍頭大廠(chǎng)AWS,大約有6,000人在維護云端的安全性,但是,若是一家企業(yè),可能很難做到如此大規模的投入,他舉例,之前Sony公司被駭客入侵許多明星的薪水資訊外流,其實(shí),被駭的全是本地端的系統,云端完全沒(méi)有被入侵,因此,他認為,其實(shí)云端比本地端來(lái)的安全。
不過(guò),他表示,也有不少企業(yè)想將資料搬上云端是為了節省成本,「那些云端公司沒(méi)說(shuō)的是,資料搬移的費用是非常昂貴的!」他坦言,并不是所有的企業(yè)都適合用云端的服務(wù),許多企業(yè)認為云端比較便宜,其實(shí)若是像ICBC Bank、eBay這種大規模的企業(yè),擁有大量的數據,將資料搬上云端的費用十分驚人,但是,若資料量小的企業(yè),將資料放上云端確實(shí)相對便宜許多。
他也舉例一個(gè)有趣的作法,有些企業(yè)會(huì )用本地端和云端互相配合的方式,用本地端部署系統,但是將備份全放在云端,作為災難恢復(Disaster Recovery)的策略,他認為這是非常聰明的混合策略,由於云端收費是按用量計費,但是備份資料平時(shí)幾乎不會(huì )使用,只需付存放的費用,對企業(yè)來(lái)說(shuō)相對便宜許多。
即使上云端的費用昂貴,Stephen Brobst表示,也有企業(yè)是為了敏捷性的考量,將企業(yè)所有的資料、系統搬上云端,他舉例,Netflix現在沒(méi)有資料中心,Netflix為了省去在各地建立資料中心的工作,將所有的系統放上云端,美國售票公司Ticketmaster也將所有本地端的系統,花了60天就搬上云端,他認為企業(yè)上云端也是達到敏捷性的策略之一,并非全然是價(jià)格。
「數據不會(huì )跟著(zhù)分析,是分析要跟著(zhù)數據,」他提醒,企業(yè)要清楚數據產(chǎn)生的位置,若數據都是在本地端產(chǎn)生,那要在云端分析,就會(huì )花費不少費用,但是,像Ticketmaster就把訂購系統、財務(wù)系統等都放到云端,如此一來(lái),數據本來(lái)就在云端,不需要額外付搬移數據的費用。
企業(yè)AI應用目前還面臨兩大難題
提到現在最火紅的AI技術(shù),Stephen Brobst認為,AI這個(gè)詞匯比喻成雨傘,由於現在A(yíng)I這個(gè)詞包山包海,任何與智能有關(guān)的東西,都包含在內,他表示,AI對他而言,更像一個(gè)行銷(xiāo)的用語(yǔ),若以技術(shù)層面來(lái)看,他會(huì )先聚焦於機器學(xué)習和深度學(xué)習來(lái)探討。
依照Stephen Brobst的觀(guān)察,其實(shí)市場(chǎng)上許多企業(yè)高喊采用AI技術(shù),但其實(shí),真正有使用AI技術(shù)的企業(yè),卻是少數,在大多數的企業(yè)中,以應用層面來(lái)看,都還在很初期的階段。
為什麼真正應用AI技術(shù)的企業(yè)目前少之又少?他坦言,AI技術(shù)目前還有兩大問(wèn)題尚未解決,第一,企業(yè)的資料科學(xué)家需要知道數據分析過(guò)程中,每個(gè)決策的原因,他將深度學(xué)習演算法比喻成黑盒子,資料科學(xué)家就是要透過(guò)數據分析,了解數據的前因後果,但深度學(xué)習不像機器學(xué)習是線(xiàn)性回歸的模型,可以解釋每個(gè)決策過(guò)程,深度學(xué)習的隱藏層則埋沒(méi)了這些重要資訊,甚至,每次執行演算法所產(chǎn)生的隱藏層數量也不一樣,讓企業(yè)無(wú)法得到數據的洞察(Insight)。
他舉例,即使深度學(xué)習的結果令人滿(mǎn)意,像是銀行信用評估分析模型,管理者必須了解部門(mén)如何做出這樣的決策,避免是因為偏見(jiàn)、種族、性別歧視等不公正的評斷,醫療業(yè)亦是如此,若系統就只告訴醫生用這些藥治療病人,醫生不會(huì )憑著(zhù)未知的知識,將病人的生命,冒著(zhù)風(fēng)險替病人治療。
不過(guò),他表示,目前高科技制造業(yè)良率判斷和詐騙偵測這兩大領(lǐng)域,已經(jīng)很成熟地運用深度學(xué)習技術(shù),因為良率和詐騙偵測的決策原因沒(méi)有這麼重要,只要企業(yè)持續看到改善即可,但是醫療業(yè)、信用檢測這些就需要了解決策原因。
他也補充,目前有許多頂尖的科學(xué)家,正在開(kāi)發(fā)可以看見(jiàn)每一層決策的類(lèi)神經(jīng)網(wǎng)路,也就是可以解釋的分析預測模型,若能解決這項問(wèn)題,將會(huì )是企業(yè)能夠采用深度學(xué)習的關(guān)鍵之一。
第二則是AI的技術(shù)中,不管是機器學(xué)習或是深度學(xué)習都需要非常大量的資料,但大部分的企業(yè)資料量是不足的,導致企業(yè)采用深度學(xué)習演算法的效果不彰。
許多企業(yè)以為50,000筆數據是很大的資料量,但Stephen Brobst強調,用這樣的資料量來(lái)執行深度學(xué)習是不夠,「若要深度學(xué)習執行的結果是好的,你需要好幾百萬(wàn)筆的數據才夠!」他比喻,深度學(xué)習演算法大約就像8歲的小孩,要一直不斷地給他資訊,從錯誤中不斷學(xué)習,才能慢慢的歸納出一套法則。
數據分析重點(diǎn)不是資料量,是如何整合多元數據
除此之外,雖然Stephen Brobst身為大數據倉儲公司的技術(shù)長(cháng),他表示,他從來(lái)就不喜歡大數據這個(gè)用語(yǔ),大數據就只是數據的一種,目前,數據已經(jīng)不是只看量多大,而是要去研究如何分析多元結構的數據。
由於目前許多數據來(lái)自不同的通道,像是網(wǎng)站的點(diǎn)擊紀錄、圖片、影音等,包含了結構化、半結構化和非結構化的數據,甚至還要結合政府的開(kāi)放資料,例如天氣、交通等數據,他表示,若要能將這些多元的數據,妥善地分析、應用,是需要結合許多不同的方法和平臺,這也是目前數據分析最具挑戰的工作。
未來(lái)全產(chǎn)業(yè)都需分析IoT和感測器數據
近幾年,數據的收集與分析變化很快,Stephen Brobst強調,未來(lái)每個(gè)企業(yè)都免不了要分析IoT、感測器等裝置的數據,不再只局限於制造業(yè)的良率判斷或是生產(chǎn)線(xiàn)優(yōu)化,邊緣運算(Edge Computing)將會(huì )是新的機會(huì ),但他認為,目前是以端點(diǎn)收集數據,共同回饋到中心的系統進(jìn)行運算的方式進(jìn)行,中心系統產(chǎn)生適合的演算法,再部署到各個(gè)端點(diǎn)裝置運行。
「你不會(huì )想在邊緣裝置上做learning,因為太慢,」Stephen Brobst一語(yǔ)點(diǎn)出目前邊緣運算,為何還是以中心產(chǎn)生模型推到邊緣裝置的方式,他解釋?zhuān)粢_成即時(shí)分析的能力,就得每百萬(wàn)分之一秒,來(lái)來(lái)回回在這些裝置的網(wǎng)路中,傳送、分析資料,這并不是很有效率,因此,基本上,大部分都是先從不同地方的裝置,收集數據,在中心系統建立適用的模型,在部署到邊緣裝置執行。
他表示,如此一來(lái),可以避免時(shí)間延遲的問(wèn)題,也可以用強化學(xué)習(Reinforcement Learning)的方式,讓裝置執行的過(guò)程可以一邊作為下一次改善的參考,若這次做錯了,可以把錯誤的訊息送回到中心的「大腦」調整演算法,再迅速地部署新版本的演算法到各個(gè)邊緣。
此外,他補充,若某個(gè)端點(diǎn)裝置發(fā)生例外情況,也可以將資訊送回中心,進(jìn)而改善,這樣一來(lái),未曾發(fā)生狀況的端點(diǎn)也可以了解到可能發(fā)生的問(wèn)題,若有狀況則可以快速反應。