3月28日消息,據國外媒體報道,(編者按:Norman Winarsky是Ventures的副總裁,Bill Mark是科學(xué)研究發(fā)展組織SRI國際的信息計算科學(xué)部門(mén)副總裁。Norman和Bill合作支持了Siri的投資,同時(shí)Norman也是投資委員會(huì )的成員。這篇文章也是他們二位合作完成。)自從iPhone4S發(fā)布以來(lái),Siri已經(jīng)成為一種潮流。Siri是基于突破性的語(yǔ)音和人工智能技術(shù)的革命性消費軟件產(chǎn)品。Siri作為一種消費習慣也廣泛應用在其他消費媒體,甚至去年11月谷歌CEO施密特曾向美國參議院司法委員會(huì )作證表示Siri具有成為谷歌主要威脅的潛力,Siri也一度成為熱播美劇《生活大爆炸》的劇情。
毫無(wú)疑問(wèn),Siri是蘋(píng)果和史蒂夫喬布斯的杰作,將虛擬個(gè)人助理(VPA)帶給億萬(wàn)消費者,改變了人們看待智能電話(huà)的態(tài)度。研發(fā)團隊的天才設計使得Siri超越了簡(jiǎn)單工具本身,并賦予其人類(lèi)的個(gè)性和交互特征。正像某些與Siri的有趣對話(huà):“Siri你喜歡我么?你知道哪能埋人么?”
我們都堅信蘋(píng)果將持續改進(jìn)Siri,未來(lái)的新技術(shù)也會(huì )不斷創(chuàng )造出不同種類(lèi)的VPA。舉例來(lái)說(shuō)蘋(píng)果很可能面向開(kāi)發(fā)者開(kāi)放Siri的API,繼而孕育出成千上萬(wàn)的與個(gè)人助理相關(guān)的應用。或許不久之后所有的應用都可以進(jìn)行有實(shí)用價(jià)值的語(yǔ)音交互,用戶(hù)也會(huì )漸漸習慣并將之視為順理成章的功能。
暫且拋開(kāi)贊美之詞和理性思考,鑒于Siri的核心價(jià)值,那么接下來(lái)的發(fā)展方向是什么?
我們通常會(huì )這樣認為:人們已經(jīng)認識到VPA發(fā)展的廣闊前景,Siri正好處于這個(gè)過(guò)程的第一步。下文描繪了我們對Siri未來(lái)的暢想。
首先,Siri的巨大影響力改變了整個(gè)產(chǎn)業(yè),在SRI,我們將VPA技術(shù)看作是未來(lái)產(chǎn)品的核心特性,無(wú)論是智能電視、健康護理助手、虛擬教育助理等等,都將具備語(yǔ)音交互能力。VPA不會(huì )是一時(shí)風(fēng)靡,而是計算領(lǐng)域長(cháng)期致力的方向和終極目標。正如我們所言,SRI正在著(zhù)手三項與VPA相關(guān)的研發(fā),這三個(gè)項目已經(jīng)有風(fēng)險投資跟進(jìn),具體的新產(chǎn)品正準備發(fā)布,前景不可估量。
從技術(shù)角度來(lái)說(shuō),Siri真正的影響力是正如廣泛宣傳的“具有實(shí)用性的自然語(yǔ)言輸入”,這一用語(yǔ)音代替鍵盤(pán)與計算機交流的方式是一個(gè)古老的夢(mèng)想,歷經(jīng)三十多年才達到現在這種能與用戶(hù)進(jìn)行簡(jiǎn)單流暢溝通的程度。
開(kāi)發(fā)一套具備“有限詞匯和口語(yǔ)識別”能力的軟件是第一步,公眾熟悉的呼叫中心的自動(dòng)應答系統就是這樣首先登上歷史舞臺的。但一套能夠讓計算機對很寬泛的口語(yǔ)輸入做出可信回應的軟件,開(kāi)發(fā)過(guò)程的確相當具有挑戰性。Siri不僅需要語(yǔ)音識別技術(shù),還需理解自然語(yǔ)言、文本的含義,并最終理解句意(這一點(diǎn)也是現今大多數人工智能研究的核心)。
繼Siri之后,新的增強語(yǔ)音的人工智能將成為SRI投資重點(diǎn),尤其是被美國國防部看中的項目,將著(zhù)重增強處理復雜用戶(hù)情況的性能表現。
那么對于那些即將面世的技術(shù),VPA最需要具備的素質(zhì)是什么?
下一代VPA將會(huì )與用戶(hù)建立更加深入的關(guān)系。今天的Siri有一個(gè)使用語(yǔ)音對話(huà)的界面,但對話(huà)通常只能持續一到兩個(gè)問(wèn)答語(yǔ)句。將來(lái)的用戶(hù)與VPA的對話(huà)會(huì )是復雜的帶有多層次和更多細節的過(guò)程,主題涉及健康保健、旅游計劃、購買(mǎi)衣服或者闡述計劃書(shū)等復雜背景。
下一代VPA將有可能長(cháng)時(shí)間保留對話(huà)內容,清晰記錄人機討論的細節、提供的答案、具體執行的任務(wù),因為只有越多的進(jìn)行學(xué)習,VPA才能顯著(zhù)改善性能。同樣可以看到用戶(hù)與Siri進(jìn)行溝通時(shí),提供的細節越多,Siri可以提供的服務(wù)也越具個(gè)性化。這樣的結果是VPA變得更具前瞻性,可以持續關(guān)注用戶(hù)潛在的可能需求,甚至在對話(huà)開(kāi)始前就已經(jīng)預測到用戶(hù)的需求。
為展示新一代VPA的能力,現在讓我們假設一段對話(huà),真實(shí)使用者名為L(cháng)isa,VPA購物助理名為Nina,背景時(shí)某一天Lisa想買(mǎi)一個(gè)皮包:
L:Nina,我想買(mǎi)一個(gè)新皮包。
N:好啊!那你是想買(mǎi)上次那個(gè)Michael Kors牌子的么?
L:行,我喜歡Michael Kors牌,但是這次預算的上限是400元。
N:上次你是從Nordstrom購買(mǎi)的,Nordstrom現在仍然銷(xiāo)售Michael Kors牌皮包,并且同時(shí)還有其他品牌款式,或許你會(huì )喜歡。
L:嗯,我覺(jué)得Michael Kors的一款巧克力色的包不錯,標價(jià)329元,你發(fā)現其他商家有優(yōu)惠價(jià)格么?
N:我發(fā)現確實(shí)有其他零售商銷(xiāo)售的這款皮包標價(jià)只有310元,但退換貨政策不如Nordstrom的好。
L:那好,我們就去Nordstrom買(mǎi)吧。
Lisa希望Nina具備所有關(guān)于購物方面的知識與能力,并且能夠利用這些知識協(xié)助她進(jìn)行正確的選擇。而VPA也將從這段對話(huà)中進(jìn)行學(xué)習,同時(shí)會(huì )保留這段對話(huà)作為歷史紀錄,為將來(lái)的購買(mǎi)活動(dòng)做準備。
正因為VPA的學(xué)習行為,它將變得越來(lái)越有效率。這種自行學(xué)習的能力經(jīng)常被提及,卻很少被實(shí)現。“在自然界中學(xué)習”(Learning in the wild)這一古老的夢(mèng)想也剛剛開(kāi)始成真,因為實(shí)現真正具備極強適應性的VPA非常困難。
當然,隨著(zhù)Nina的能力不斷完善,Lisa越來(lái)越信任VPA。VPA這種應用不僅高度個(gè)性化,還將具備保護個(gè)人信息的能力。對于一個(gè)VPA,信任較安全和隱私而言更加屬于核心需求,下一代VPA將會(huì )在這方面顯著(zhù)增強。
這一切是否聽(tīng)起來(lái)十分完美?幸運的是,一個(gè)能夠與用戶(hù)真正進(jìn)行深層次和細節溝通的VPA不再只是科學(xué)幻想。SRI正在進(jìn)行這些方面的研究,我們和研究伙伴正全力以赴努力讓這些早日實(shí)現。
至于VPA是否會(huì )增進(jìn)人類(lèi)的智力水平這個(gè)古老的爭議,可以追述到發(fā)明鼠標的年代,鼠標的發(fā)明者Doug Engelbart在1962年撰文闡述如下:
增進(jìn)人類(lèi)智力的意思是提高人類(lèi)理解復雜問(wèn)題的能力、為自己獨有的需求提供解決方案、并最終解決問(wèn)題。
我們相信VPA正是這方面的代表,VPA是目前我們能夠看到的協(xié)助人類(lèi)和機器交流的最佳的方式,并將最終改變人類(lèi)看待機器的態(tài)度,正如Doug Engelbart50年前發(fā)明鼠標之后對世界產(chǎn)生的深遠影響一樣。
TechWeb.com.cn