
機器學(xué)習的出現是人工智能發(fā)展中最令人期待的科技之一。正如其名稱(chēng)所示,利用機器學(xué)習技術(shù)的應用程序會(huì )隨著(zhù)使用次數的增加而變得越來(lái)越智能。機器學(xué)習是當今搜索算法、無(wú)人駕駛汽車(chē)革命以及先進(jìn)垃圾郵件檢測和反欺詐偵察的核心。在旅游業(yè),機器學(xué)習被用來(lái)提升用戶(hù)界面、分析海量數據以及實(shí)現對話(huà)式商業(yè)。本文將探討機器學(xué)習技術(shù)在旅游業(yè)應用的實(shí)際使用,并解讀這一新興科技的真實(shí)潛力。
簡(jiǎn)介
機器學(xué)習的核心是能在不編寫(xiě)特定程序的情況下讓電腦提供答案。傳統而言,電腦的應用程序內儲存了根據特定數據編寫(xiě)的信息,在用戶(hù)提出請求時(shí),應用程序直接調用這些信息。上世紀70年代,關(guān)系數據庫問(wèn)世,80年代,結構化查詢(xún)語(yǔ)言(SQL)開(kāi)始發(fā)展,這都使數據更容易被接觸和利用到,但熟識SQL編程仍然是關(guān)鍵。90年代和21世紀初,Cognos等商業(yè)智能平臺涌現,這些平臺都采用了對用戶(hù)而言更簡(jiǎn)易的前端,但實(shí)際上仍依賴(lài)于SQL查詢(xún)方法。
軟件應用程序也只能接觸到已經(jīng)編程好的信息。上世紀80年代和90年代,應用程序編程接口(API)的發(fā)展實(shí)現了一種成品或服務(wù)和其它產(chǎn)品或服務(wù)的對話(huà)。在21世紀初,在利用一系列標準的情況下,網(wǎng)絡(luò )API使程序員們能更容易地接觸到其它應用服務(wù),但應用程序仍限制于已經(jīng)編程好的信息。比如,如果想有效地查詢(xún)某一航班的信息,你需要根據特定的全球分銷(xiāo)系統(GDS)API編寫(xiě)一條特定的查詢(xún)代碼告訴電腦提取特定的數據(多數情況下,電腦會(huì )把用戶(hù)請求再轉變?yōu)樘貏e的GDS格式)。根據這個(gè)例子類(lèi)推,要查詢(xún)航班價(jià)格,則需要根據另一個(gè)GDSAPI編寫(xiě)另一條代碼。對編程的依賴(lài)也限制了用戶(hù)的使用。比如,90年代時(shí)發(fā)展的早期聊天機器人經(jīng)常出現故障,因為任何沒(méi)有編入應用程序內的用戶(hù)回應都會(huì )導致聊天機器人終止服務(wù)。
互聯(lián)網(wǎng)和社交媒體的發(fā)展增加了大量可用的數據,其中絕大部分都是非結構化格式,因此使數據檢索的復雜程度更進(jìn)一層。這也促使越來(lái)越多的大數據科學(xué)家們創(chuàng )造出更成熟的算法來(lái)分析和利用這些海量的結構化及非結構化數據。
機器學(xué)習是計算機科學(xué)進(jìn)化中的一次飛躍。機器學(xué)習使應用程序能夠自己進(jìn)行編程,而不再只依賴(lài)于人類(lèi)編程。整體而言,機器學(xué)習目前的應用較淺,只基于特定系列的功能。但學(xué)習型的機器如今已經(jīng)問(wèn)世,而且已經(jīng)對旅游業(yè)產(chǎn)生了影響。
機器學(xué)習的今天和未來(lái)
包含數十億數據元素的大容量數據庫已經(jīng)存在了數十年,但只在近來(lái)機器學(xué)習技術(shù)才把這些數據轉變?yōu)橛杏玫闹R。以下三個(gè)要素的變化引發(fā)了利用機器學(xué)習的浪潮:
—每天產(chǎn)生的海量數據,以及分析這些數據的需要——在過(guò)去兩年內,這種需要增加了數個(gè)重量級。以下為少數幾個(gè)例子:
5億條推特
4百萬(wàn)小時(shí)的視頻被上傳到YouTube上
Instagram上36億個(gè)“贊”
臉書(shū)上發(fā)布了43億條信息
臉書(shū)上57.5億個(gè)“贊”
60億次谷歌搜索
—云計算的出現使大眾接觸到數據存儲和處理。
—開(kāi)源技術(shù)使程序員等發(fā)展人員能夠創(chuàng )建和使用機器學(xué)習算法,將這一科技帶進(jìn)更大的發(fā)展人員社區。
在機器學(xué)習獲得更多突破前,我們必須承認這一技術(shù)目前仍處于起步幾段。在很多科幻小說(shuō)中,智能機器超越了人類(lèi)大腦并威脅到人類(lèi)生存。在過(guò)去幾年里,著(zhù)名物理學(xué)家史蒂芬·霍金(Stephen Hawking)曾稱(chēng)“發(fā)展完全的人工智能可能加速人類(lèi)的滅絕”,企業(yè)家埃爾隆·馬斯克(Elon Musk)也稱(chēng)人工智能是“我們人類(lèi)生存的最大威脅”,這些言論促使大眾以為先進(jìn)的人工智能技術(shù)不僅即將到來(lái),而且還是令人恐懼的“怪物”。
人工智能超越人類(lèi)智能、并具有人類(lèi)情感的時(shí)候被稱(chēng)為“奇點(diǎn)”。奇點(diǎn)也被假設為超級智能機器的未來(lái)。超級智能被定義為一種由科技創(chuàng )造的認知能力,這種能力遠超人類(lèi)能力。這一未知的超級智能就是霍金教室和馬斯克所說(shuō)的“威脅”。谷歌人工智能總監雷·庫茲韋爾(Ray Kurzweil)預測奇點(diǎn)很快將會(huì )成為現實(shí)(在25到30年內)。但即使是庫茲韋爾也無(wú)法確定奇點(diǎn)是好現象還是壞現象。不過(guò),現在我們不該被超級智能機器的未來(lái)景愿所嚇倒,而是應該積極認識機器學(xué)習的價(jià)值。
雖然當前機器學(xué)習仍處于發(fā)展中,其應用也處于初步階段,但只要讓機器理解了相關(guān)的術(shù)語(yǔ)、選項和細微差異,機器學(xué)習就可以應用在旅游應用程序中,并能幫助解決很多疑難問(wèn)題。
機器學(xué)習的工作原理
要使機器學(xué)習成功進(jìn)入服務(wù),程序員需要在系統內輸入相關(guān)的主題數據(例子)。目前機器學(xué)習只集中在少數主題的較小范圍,因為系統需要理解許多行業(yè)專(zhuān)有的詞匯和關(guān)系。也就是說(shuō)應用程序必須同時(shí)理解某一行業(yè)內的分類(lèi)(比如概念層次)和本體(不同概念間的復雜關(guān)系)。舉個(gè)例子:支持一家酒店聊天機器人的機器學(xué)習系統必須理解酒店星級的評級(即分類(lèi)),同時(shí)也需要掌握房?jì)r(jià)和支付條款間的關(guān)系(本體),比如特價(jià)房不退訂房費等。因此要創(chuàng )建這個(gè)機器學(xué)習應用程序的第一步是在系統內輸入例子,讓系統理解相關(guān)主題的術(shù)語(yǔ)、關(guān)系和細微差異。之后,機器學(xué)習平臺的創(chuàng )建還需以下三個(gè)關(guān)鍵步驟:
—建模:機器學(xué)習算法(即一系列電腦指令)在數據中發(fā)掘相應的模式,并利用這些發(fā)現建立數據模型。最初的模型由人工輸入,但隨后模型會(huì )自我進(jìn)步并由機器學(xué)習流程驅動(dòng)。
—生成參數:學(xué)習算法會(huì )發(fā)展出一系列參數讓軟件學(xué)會(huì )“自己做決定”。比如,系統可能發(fā)展出一個(gè)參數指示需要某些域認證特定數據的質(zhì)量,沒(méi)有這些域,這些特定數據可能會(huì )被拒絕。
—學(xué)習者:應用程序會(huì )根據預測和實(shí)際結果的不同而對參數進(jìn)行調整,模型也會(huì )相應進(jìn)行調整。學(xué)習者部分會(huì )隨之提升模型的精確度。
深度學(xué)習
機器學(xué)習的一個(gè)分支子集為深度學(xué)習。深度學(xué)習集中利用更小范圍的機器學(xué)習工具及技術(shù),并將其應用在解決需要人類(lèi)或人工“思想”的特定問(wèn)題上。2016年,谷歌深度學(xué)習應用程序在圍棋大戰中打敗了韓國圍棋大師李昌鎬。要知道,圍棋擁有2500年的歷史,比象棋復雜許多倍,而且在實(shí)際對戰中(最起碼是人類(lèi)對戰)需要某種程度的直覺(jué)。所以深度學(xué)習在旅游業(yè)內可能非常適于解決如管理大規模旅程混亂狀況等復雜問(wèn)題。
如今機器學(xué)習在旅游業(yè)內的利用
如今機器學(xué)習在旅游業(yè)內得到了大量應用。由于數量仍在持續增加,以下僅列出幾個(gè)例子:
—聊天機器人:在過(guò)去的一年半里,大量聊天機器人進(jìn)入市場(chǎng)。以下是利用機器學(xué)習技術(shù)的聊天機器人例子。
-Mezi——Mezi利用深度學(xué)習將旅行知識構建到自己的應用程序內,使這一程序能與用戶(hù)對話(huà),并過(guò)濾掉不相關(guān)的回應,每次在用戶(hù)提出要求后都彈出三個(gè)最符合用戶(hù)需求的選項。
-Expedia——Expedia推出了Facebook Messenger聊天機器人來(lái)幫助旅客訂酒店。這款機器人利用自然語(yǔ)言處理(NLP)和機器學(xué)習技術(shù)創(chuàng )造結構化的對話(huà)流。
-30 Seconds to Fly——這家公司的人工智能助理Claire是個(gè)旅行聊天機器人,設計這款機器人的目的在于給中小企業(yè)市場(chǎng)提供旅行管理能。它利用NLP和機器學(xué)習技術(shù)幫助旅客找到符合企業(yè)政策的選項。
—谷歌旅行規劃“Google Trips”:通過(guò)閱讀用戶(hù)的谷歌郵件,這款程序自動(dòng)生成旅行行程,包括旅行地點(diǎn)的信息,同時(shí)還提供附近地標信息和休閑活動(dòng)建議。它利用機器學(xué)習技術(shù)根據用戶(hù)的重復使用率實(shí)現持續的個(gè)人化推薦。
—Lola:這個(gè)信息平臺由人工和一個(gè)人工智能平臺支持。這個(gè)人工智能平臺利用機器學(xué)習技術(shù)根據具體的旅行要求為旅客提供相關(guān)度最高的各種選項,而且會(huì )隨著(zhù)旅客請求和用戶(hù)數量的增加而提升。
—Sift Science:利用機器學(xué)習技術(shù)分析如反欺詐偵察等風(fēng)險的多種類(lèi)型。
—DataArt:是企業(yè)對企業(yè)的定制應用程序。該程序利用機器學(xué)習來(lái)理解非結構化的酒店和交通數據。此外,DataArt還利用基礎設施級別的機器語(yǔ)言解決方案來(lái)幫助發(fā)現預測的故障預防,進(jìn)而提升運營(yíng)效率。
—Trip.com(之前名為Gogobot):它利用機器學(xué)習技術(shù)整合數百萬(wàn)數據點(diǎn),包括旅行的日期、天氣、部落(指興趣相同的人群)以及旅程和城市密度等,及時(shí)為用戶(hù)個(gè)人提供真正相關(guān)且智能的選擇。
—Way Blazer和Go Moment:IBM的人工智能技術(shù)平臺Watson的核心在于利用機器學(xué)習(以及其它人工智能技術(shù)如自然語(yǔ)言流程)為用戶(hù)查詢(xún)提供正確的答案。Watson在《危險邊緣》(Jeopardy!)上的勝利中不僅檢索出正確的問(wèn)題答案,而且還利用機器學(xué)習技術(shù)評估答案的指令。Way Blazer和Go Moment這兩家公司正在利用IBMWatson的核心技術(shù)為旅游行業(yè)帶來(lái)更多解決方案。
機器學(xué)習的今天和未來(lái)
如今,機器學(xué)習技術(shù)正在使應用程序越來(lái)越智能,但和科幻電影里出現的超人類(lèi)智能機器人還有很遠距離。在旅游業(yè)內,機器學(xué)習技術(shù)被用來(lái)解決某些特定問(wèn)題,比如初步的預訂查詢(xún)和客戶(hù)服務(wù)要求等。但由于任何糟糕的體驗都會(huì )迅速毀壞一個(gè)品牌的形象,企業(yè)并不會(huì )將客戶(hù)溝通完全交由智能機器處理。
在接下來(lái)數年內,我們可能會(huì )迅速從當前早期的機器學(xué)習階段轉移到更完全的方案提供階段,從目前由搜索驅動(dòng)的旅行計劃流程轉移到智能助理結合自身對客戶(hù)偏好的了解與對旅行選擇的深度了解為用戶(hù)提供旅行選擇的階段。機器學(xué)習將會(huì )結合深度學(xué)習、自然語(yǔ)言流程、知識圖譜(對特定領(lǐng)域結構化和非結構化數據的語(yǔ)義理解)和類(lèi)神經(jīng)網(wǎng)絡(luò )(由大量簡(jiǎn)單并高度內聯(lián)的流程元素構成、模仿人類(lèi)大腦功能的計算系統)。機器學(xué)習令人期待的地方在于其通過(guò)向客戶(hù)學(xué)習而提供更好體驗的能力。我們希望,這能帶來(lái)更個(gè)性化的服務(wù)、更相關(guān)的建議和更好的旅程服務(wù),因此最終提升旅行體驗。我們正處于迎來(lái)機器學(xué)習智能計算新時(shí)代的大門(mén)口,而機器學(xué)習將會(huì )利用客戶(hù)的重復使用而不斷創(chuàng )造出更卓越的應用程序。(李曉燕/編譯)