• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    您當前的位置是:  首頁(yè) > 新聞 > 文章精選 >
     首頁(yè) > 新聞 > 文章精選 >

    微軟小冰武威:聊天機器人的演進(jìn)之路

    2019-01-08 10:04:36   作者:   來(lái)源:智東西   評論:0  點(diǎn)擊:


      聊天機器人一直都是一個(gè)性感的話(huà)題,電影《Her》中那個(gè)風(fēng)趣又善解人意的虛擬戀人,可謂是我們對于人工智能技術(shù)的美好遐想,但要達到那一步對于我們還是一場(chǎng)長(cháng)途跋涉。
      但這絲毫不影響當下聊天機器人的火熱,尤其是隨著(zhù)近兩年智能音箱的爆發(fā)。在A(yíng)I的舞臺上,微軟小冰是一個(gè)明星人物,憑借著(zhù)“鄰家女孩”溫柔可人般的形象,以及良好的交互體驗,可謂風(fēng)靡萬(wàn)千少男少女。
      自2014年誕生以來(lái),在微軟(亞洲)互聯(lián)網(wǎng)工程院諸位技術(shù)大牛的辛勤培育下,目前已經(jīng)成長(cháng)至第六代,從最初的閑聊走入更多應用場(chǎng)景,從大家熟悉的主持節目、唱歌、講故事、寫(xiě)詩(shī),到新聞評論、金融、智能家居、手機助手等都有它的蹤影。
      在近期舉辦的自然語(yǔ)言處理領(lǐng)域的世界頂級會(huì )議之一EMNLP(Empirical Methods in Natural Language Processing)上,作為6場(chǎng)Tutorial分享之一,微軟小冰團隊總結了他們在聊天機器人領(lǐng)域的探索。
    ▲微軟小冰首席科學(xué)家武威博士
      近期,智東西來(lái)到微軟(亞洲)互聯(lián)網(wǎng)工程院,與微軟小冰首席科學(xué)家武威博士圍繞聊天機器人技術(shù)進(jìn)行一場(chǎng)深入溝通。透過(guò)微軟小冰背后人機交互技術(shù)的演進(jìn),我們看到了小冰由最初單一模態(tài)的文字回復升級到如今可以用語(yǔ)音、文字、圖像等多模態(tài)的交互,其背后對話(huà)模型也由檢索模型升級到生成模型、共感模型,小冰由最初靜態(tài)、被動(dòng)的聊天機器人變成了一個(gè)動(dòng)態(tài)、交互性更強的虛擬助手。
      一、從單一模態(tài)到多模態(tài)演進(jìn)
      四年前,剛誕生的微軟小冰只能在微信中被動(dòng)的回復用戶(hù)的文字消息,而如今它已經(jīng)成長(cháng)到第六代,逐漸具備了語(yǔ)音、視覺(jué)的能力;在交互能力上,也實(shí)現了從被動(dòng)回復到主動(dòng)交互的轉變;在與6.6億人類(lèi)用戶(hù)的交談中,小冰的交互體驗越來(lái)越好。
      武威就微軟小冰的技術(shù)迭代談道,最開(kāi)始小冰是一個(gè)單一模態(tài)(文字)的聊天機器人,等到了第三代的時(shí)候,小冰有了視覺(jué)感官。當時(shí)用戶(hù)發(fā)送一張照片給小冰,小冰就可以“看”到這張照片,并基于這張照片跟用戶(hù)進(jìn)行聊天。
      而隨著(zhù)小冰升級到第五代后,它有了實(shí)時(shí)視覺(jué)感官,此時(shí)小冰擁有了對視覺(jué)信息的動(dòng)態(tài)感知能力。比如當你從小冰面前走過(guò),向它揮手,它可以感知到這些動(dòng)態(tài)的信息并作出回應。
      在第六代小冰中,微軟小冰團隊又將實(shí)時(shí)視覺(jué)感官、聽(tīng)覺(jué)、全雙工語(yǔ)音以及對話(huà)引擎進(jìn)一步融合,形成一個(gè)交互能力更強的更智能的“物種”。
      而這背后正是多模態(tài)交互技術(shù),也是當下業(yè)界的一個(gè)研究熱點(diǎn)。武威表示,“多模態(tài)一定是未來(lái)人工智能研究的一個(gè)方向。”多模態(tài)跨過(guò)了自然語(yǔ)言,是一種更加貼近人的交互方式。因為人的交互本身,無(wú)論輸入還是輸出都是多模態(tài)的,而做人工智能,我們本身就希望能模擬人的行為。
      武威認為,從自然語(yǔ)言的角度來(lái)講,多模態(tài)技術(shù)還處在行業(yè)的探索與發(fā)力期。目前大家都意識到了多模態(tài)的重要性,但是同時(shí)又缺乏相應的數據進(jìn)行研究。目前無(wú)論是學(xué)界還是業(yè)界也都在進(jìn)行一些數據集的建設。
      小冰在多模態(tài)上也發(fā)展的較為靠前,目前微軟小冰團隊已經(jīng)同構多感官融合的架構實(shí)現了一些多模態(tài)交互,比如你輸入一段文字/語(yǔ)音/圖片,小冰會(huì )根據它看到或聽(tīng)到的進(jìn)行回復,而回復的內容可能是文字、語(yǔ)音或者一個(gè)表情等,武威認為這種交互已經(jīng)是一個(gè)近似多模態(tài)的場(chǎng)景。
      像目前的智能音箱,主要以語(yǔ)音交互為主,未來(lái)人機交互又是否會(huì )以一種模態(tài)為主模態(tài)呢?武威認為,這一問(wèn)題要結合具體的交互場(chǎng)景來(lái)判斷。但如果從人類(lèi)交互的角度來(lái)講,可能某一時(shí)刻,某一種模態(tài)扮演更加重要的作用,但基本上人所有模態(tài)都的需要的,所有模態(tài)都影響人的感知。
      二、從回復到交互三種模型的迭代
      最初微軟小冰團隊的目標是,無(wú)論用戶(hù)給出怎樣的輸入,小冰都能夠給出一個(gè)不錯的回復,并且盡可能的將小冰與用戶(hù)之間的對話(huà)維持下去。或許正是基于這樣的目標,小冰在模型上經(jīng)歷了從檢索模型到生成模型再到基于生成模型的共感模型,自身交互能力也經(jīng)歷了從被動(dòng)回復到動(dòng)態(tài)交互的演進(jìn)。
      在小冰誕生以前,搜索引擎的技術(shù)已經(jīng)相當成熟,微軟在做小冰時(shí),將微軟在Bing搜索引擎中積累的技術(shù)能力應用到聊天機器人中,就形成了檢索模型。
      武威介紹道,得益于搜索引擎的發(fā)展,檢索技術(shù)更加成熟,隨著(zhù)深度學(xué)習時(shí)代的到來(lái),它們能夠更好的讓機器學(xué)習特征,并建立更好的排序模型。檢索模型的特點(diǎn)在于對數據庫信息的重用,只要數據庫中有對應的信息,機器就可能給出一個(gè)很好的回復。
      但檢索模型的局限在于,一方面如果索引中沒(méi)有相關(guān)的回復,那機器人就沒(méi)有辦法給出很好的回答;另一方面檢索模型是對相關(guān)信息的重復使用,這就導致回答相對單一,交互體驗受到局限。
      正是檢索模型的局限性,學(xué)界與業(yè)界開(kāi)始研究生成模型,就自然語(yǔ)言而言,目前生成模型也是一塊前沿的研究領(lǐng)域。武威稱(chēng),生成模型是未來(lái)對話(huà)研究的一個(gè)方向,未來(lái)還有非常大的發(fā)展空間。它是更接近人說(shuō)話(huà)過(guò)程的一個(gè)模型,簡(jiǎn)單來(lái)說(shuō)就是對語(yǔ)言的合成。比如小冰可以根據你的說(shuō)話(huà)內容,合成出不同模態(tài)的回復,或者合成出不同性格的回復,這樣回復的內容就會(huì )更加豐富,更加像人類(lèi)的表達。
      目前這兩種模型都應用在微軟小冰中,并承擔不同的分工。武威介紹道這兩種模型各有特點(diǎn),檢索技術(shù)非常成熟,直接使用已有的回復,并且符合語(yǔ)言的邏輯,相對來(lái)說(shuō)效果會(huì )更好一些,在主流的聊天機器人產(chǎn)品上仍扮演著(zhù)重要角色。
      而生成模型是一個(gè)更自然的對人類(lèi)交互進(jìn)行建模的過(guò)程,但技術(shù)還不那么成熟,比如生成的回復,經(jīng)常會(huì )是一些萬(wàn)能回復“我知道了”、“我也是”等,語(yǔ)言本身可能也相矛盾等,這些問(wèn)題都是對話(huà)生成的一個(gè)研究重點(diǎn),很多問(wèn)題有待解決。
      在兩個(gè)模型的配合上他認為,生成模型更適合從全局出發(fā),對人機交互對話(huà)的全流程進(jìn)行把控,而檢索模型可以解決目前生成模型做的不太好的一些問(wèn)題,針對交互細節進(jìn)行優(yōu)化。比如在具體應用中,如果小冰識別到了用戶(hù)的意圖,并且能夠在數據庫中找到一個(gè)非常合適的回復,就可以使用檢索模型進(jìn)行回答;如果無(wú)法找到一個(gè)合適的回復,就可以依靠生成模型進(jìn)行對話(huà)的生成。武威還補充道,在印度尼西亞、日本等地,微軟的聊天機器人都是基于生成模型進(jìn)行回復的。
      但是在武威看來(lái),單純的生成模型在人機交互中仍然是一種被動(dòng)回復,讓回復的結果更加人性化,但還算不上交互。而共感模型是基于生成模型,逐漸解決的就是小冰從回復到交互的問(wèn)題。
      武威說(shuō),共感模型的關(guān)鍵在于交互,它是主動(dòng)與被動(dòng)回復的結合,是一個(gè)帶有策略的動(dòng)態(tài)的對話(huà)過(guò)程。比如在人與人的交互中,會(huì )有主動(dòng)的一方與被動(dòng)的一方,并且雙方的角色也可能會(huì )不斷轉換,這構成了一個(gè)完整的交互過(guò)程。共感模型也是如此,它是一個(gè)動(dòng)態(tài)的交流過(guò)程,小冰可以去察覺(jué)用戶(hù)的對話(huà)意愿,來(lái)判斷是該主動(dòng)一點(diǎn),還是多一點(diǎn)傾聽(tīng),通過(guò)主動(dòng)與被動(dòng)的對話(huà)策略來(lái)引導對話(huà)的延續。
      從檢索模型到生成模型再到第六代微軟小冰中的共感模型,武威稱(chēng),這是一個(gè)由淺層、簡(jiǎn)單層次的回復,上升到對話(huà)引導和管理的過(guò)程。
      三、NLP技術(shù)的前沿探索
      但目前聊天機器人仍屬于早期的探索階段,盡管微軟小冰已經(jīng)在行業(yè)中走到一個(gè)比較靠前的位置,但也仍存在許多問(wèn)題有待解決。
      武威從技術(shù)與場(chǎng)景兩個(gè)維度談道,從技術(shù)上來(lái)說(shuō),如今的聊天機器人在回復上仍有很多問(wèn)題,比如不相關(guān)、缺乏內容等;從場(chǎng)景來(lái)說(shuō),聊天機器人最終會(huì )走向什么樣的場(chǎng)景也有待探索。
      針對與當下行業(yè)在人機交互技術(shù)上的難點(diǎn),他說(shuō)機器如何更好的理解用戶(hù),怎么理解用戶(hù)的意圖,怎么能夠產(chǎn)生更加流暢、內容豐富的回復,都是聊天機器人行業(yè)需要解決的問(wèn)題,行業(yè)仍然在探索期。
      盡管對話(huà)生成領(lǐng)域有大量工作致力于增強對話(huà)生成的多樣性,但武威指出這一領(lǐng)域仍有較大空間,多模態(tài)盡管是未來(lái)的一個(gè)研究方向,但是多模態(tài)進(jìn)入人機交互后,會(huì )帶來(lái)怎么的新問(wèn)題,目前行業(yè)都有待進(jìn)一步探索。
      而被譽(yù)為人工智能桂冠上的明珠的NLP(自然語(yǔ)言處理)技術(shù),武威稱(chēng),只能說(shuō)我們有了大模型、大數據,我們可以利用它們產(chǎn)生一個(gè)不錯的表示,但這個(gè)表示離理解有多遠,則很難講。
      比如在機器閱讀理解中,如果我們稍微波動(dòng)一下數據,這對人來(lái)講可能沒(méi)有太大影響,但是機器就會(huì )產(chǎn)生較大的錯誤,這就說(shuō)明機器在很多問(wèn)題上理解的并不到位。此外端到端的生成模型就像一個(gè)“黑盒子”,我們很難解釋為什么會(huì )生成這樣的回復,這也導致我們很難進(jìn)一步去解決其中的問(wèn)題。
      2018年伊始,阿里和微軟亞洲研究院相繼刷新了斯坦福大學(xué)發(fā)起的SQuAD(Stanford Question Answering Dataset)文本理解挑戰賽成績(jì),一時(shí)間機器閱讀理解得分超過(guò)人類(lèi)成為一個(gè)熱議的話(huà)題。
      武威對機器閱讀理解的這一進(jìn)展持肯定觀(guān)點(diǎn),他稱(chēng)正是得益于SQuAD之類(lèi)數據集的出現,我們在此基礎上不斷迭代算法模型,近幾年來(lái)整個(gè)機器閱讀理解取得了飛躍性的發(fā)展。
      但是不能憑空說(shuō)機器閱讀理解超過(guò)人類(lèi),應該說(shuō)在特定數據以及特定的評估準則下,機器可以跟人類(lèi)水平持平,甚至在指標上超過(guò)人類(lèi)。
      盡管近兩年NLP開(kāi)始在諸如智能硬件、車(chē)載以及垂直行業(yè)領(lǐng)域開(kāi)始落地,并且取得一些不錯的效果,但武威認為NLP最終還是要回到通用上來(lái)。因為人理解世界是以一種通用的認知進(jìn)行的,開(kāi)放式對話(huà)才是人的一般狀態(tài)。
      此外他還強調道,通用NLP是基礎,細分領(lǐng)域的NLP只有扎根在這個(gè)基礎上,才能夠有更深的發(fā)展。
      但在通用NLP上,盡管有谷歌的BERT模型在11項NLP任務(wù)中都取得不錯的效果,但數據背后模型究竟理解到了什么,都有待行業(yè)探索。
      武威就自然語(yǔ)言談道,當下已有機構將通用的開(kāi)放式聊天對話(huà)和基于任務(wù)式的對話(huà)結合在一起去做相關(guān)的研究,并且微軟小冰也在做相關(guān)領(lǐng)域的探索。
      結語(yǔ):多模態(tài)、個(gè)性化交互成趨勢
      通過(guò)與武威的溝通和微軟小冰在人機交互上的一些探索可以發(fā)現,多模態(tài)交互、任務(wù)與非任務(wù)結合的對話(huà)方式等都可能是未來(lái)人機交互的一個(gè)研究趨勢。
      此外,他認為個(gè)性化也是聊天機器人的一個(gè)方向,目前很多高校、機構也都在朝著(zhù)這一方向探索。微軟未來(lái)也會(huì )在小冰框架基礎上,生產(chǎn)各種各樣的具有不同個(gè)性的聊天機器人。
      要想推動(dòng)聊天機器人進(jìn)一步發(fā)展,武威認為一方面數據非常重要,另一方面在模型的方法論上也有待突破。比如當下我們深度依賴(lài)深度學(xué)習這種基于序列到序列的建模,但下一個(gè)這種級別的模型是什么?能帶來(lái)本質(zhì)變化的模型是什么?有有待業(yè)界去研究。
      如果說(shuō)電影《Her》代表了我們對人工智能的一種探尋,那我們還需要多久才能達到那一狀態(tài)?武威謹慎地稱(chēng)很難評估,因為有些東西一旦能夠評估,就說(shuō)明你已經(jīng)知道答案了,而NLP之所以我們當下難以攻克,正是因為我們目前不知道未來(lái)的答案是什么。
    【免責聲明】本文僅代表作者本人觀(guān)點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對文中陳述、觀(guān)點(diǎn)判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

    專(zhuān)題

    CTI論壇會(huì )員企業(yè)

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 香港 | 定襄县| 易门县| 麦盖提县| 车致| 仙桃市| 临洮县| 阳信县| 巩留县| 闵行区| 南投市| 鲁山县| 曲麻莱县| 丹东市| 长泰县| 南丹县| 正安县| 金沙县| 菏泽市| 江阴市| 呼图壁县| 东兰县| 准格尔旗| 交城县| 庆阳市| 阳朔县| 宁津县| 武清区| 罗江县| 海盐县| 陇川县| 南陵县| 潞西市| 巴彦淖尔市| 滦平县| 乐平市| 陆丰市| 藁城市| 嫩江县| 曲周县| 张北县| http://444 http://444 http://444 http://444 http://444 http://444