趨勢1:為每一個(gè)企業(yè)提供語(yǔ)音助理
像Siri、Alexa、GoogleAssistant和Bixby這樣的通用語(yǔ)音助理被設計成各行各業(yè)的高手,涵蓋了廣泛的主題。但是,語(yǔ)音助理的創(chuàng )建成本很高,因此不太可能出現新的通用語(yǔ)音助理。相反,未來(lái)的語(yǔ)音助理將專(zhuān)注于滿(mǎn)足組織及其客戶(hù)的特定需求。
正如每個(gè)企業(yè)都有一個(gè)網(wǎng)頁(yè)來(lái)描述其產(chǎn)品和服務(wù)一樣,每個(gè)企業(yè)都會(huì )有一個(gè)語(yǔ)音助理來(lái)吸引現有和潛在的客戶(hù)。更專(zhuān)注的語(yǔ)音助理的例子包括BBC的語(yǔ)音助理Beeb;JiLL,由房地產(chǎn)公司JLL開(kāi)發(fā);MBUX,梅賽德斯-奔馳的語(yǔ)音助理;eno,來(lái)自CapitalOne。
除了傳統的基于網(wǎng)絡(luò )的助理之外,人們越來(lái)越需要交互式、靈活的會(huì )話(huà)助理。其好處是巨大的:語(yǔ)音助理可以提供一套完整的自助指南:選擇、訂購、交付跟蹤、安裝、故障排除、調試和修復公司的產(chǎn)品,必要時(shí)還可以連接到實(shí)時(shí)座席。
IVAs也變得越來(lái)越容易創(chuàng )建。像Jovo、RASA、AlanAI和SpokeStack這樣的初創(chuàng )公司為語(yǔ)音助理提供開(kāi)發(fā)工具、模板和代碼生成器。教育書(shū)籍、網(wǎng)絡(luò )研討會(huì )、演示、研討會(huì )、視頻和課程可用于開(kāi)發(fā)人員培訓。一個(gè)由專(zhuān)家語(yǔ)音開(kāi)發(fā)人員組成的社區現在可以實(shí)現語(yǔ)音助理。
結果是:每個(gè)企業(yè)都將很快擁有自己的語(yǔ)音助理,這些語(yǔ)音助理將不再局限于一個(gè)平臺,我們將在下一個(gè)趨勢中看到這一點(diǎn)。
趨勢2:獨立于平臺的語(yǔ)音助理
讓語(yǔ)音助理在多個(gè)平臺上工作有幾個(gè)非常令人信服的原因:
方便客戶(hù)。語(yǔ)音助理需要方便客戶(hù)。畢竟,如果可以從任何地方(在家里、工作中、旅行時(shí))使用嵌入智能手機、可穿戴設備、汽車(chē)、電器和智能揚聲器中的麥克風(fēng)和揚聲器訪(fǎng)問(wèn)語(yǔ)音助理,語(yǔ)音助理將永遠陪伴在您身邊。
對供應商行為的擔憂(yōu)。特定平臺供應商可能會(huì )更改其使用策略和服務(wù)費用。一些組織可能懷疑供應商偷聽(tīng)組織與其客戶(hù)之間的私人對話(huà)。
客戶(hù)使用習慣的變化。當新平臺可用時(shí),客戶(hù)可能會(huì )更換平臺。您的公司可能會(huì )發(fā)現與需要其他平臺的客戶(hù)進(jìn)行信息傳遞和聯(lián)系的新方法。
能力有限。一些平臺可能缺乏最新的安全技術(shù)。其他平臺可能無(wú)法辨別客戶(hù)情緒,這可能會(huì )影響語(yǔ)音助理對客戶(hù)的反應。其他供應商可能會(huì )阻止使用sonic品牌。
為了提高可用性,語(yǔ)音助理將支持多種模式(稍后將詳細介紹),如語(yǔ)音、文本、圖形、視頻,以及可能的觸覺(jué)設備。
為多個(gè)平臺開(kāi)發(fā)幾乎相似的語(yǔ)音助理有一個(gè)缺點(diǎn):當需要更新時(shí),開(kāi)發(fā)人員必須要么修改每個(gè)代碼庫,要么修改主副本并為每個(gè)平臺生成代碼。為了克服這個(gè)問(wèn)題,開(kāi)放語(yǔ)音論壇(OpenVoiceForum)正在為座席制定可互操作的協(xié)議,以便一個(gè)平臺上的座席可以被另一個(gè)平臺上的座席調用。
趨勢3:多模式
美國的數據表明,平均而言,人類(lèi)說(shuō)話(huà)的速度是打字速度的三倍(每分鐘120個(gè)字,而不是40個(gè)字),閱讀(和理解)的速度是準確聆聽(tīng)速度的兩倍。這表明用戶(hù)界面應該支持語(yǔ)音數據輸入,基于屏幕的數據輸出。文本還有其他優(yōu)點(diǎn);它可用于聲音難以聽(tīng)到的情況(嘈雜的機場(chǎng))、有噪音污染的情況(交通、建筑)或有隱私問(wèn)題的情況(餐廳、酒店大堂)。
語(yǔ)音助理(如VoiceXML中實(shí)現的語(yǔ)音助理)將得到增強,以克服只使用語(yǔ)音的缺點(diǎn)。語(yǔ)音菜單將顯示在靠近用戶(hù)的屏幕上,長(cháng)文字描述將以文本和/或圖形的形式呈現。方便是這里的一個(gè)因素。帶有顯示器的耳機,可能是在用戶(hù)的手表或其他可穿戴設備上,似乎會(huì )勝過(guò)獨立揚聲器,而獨立揚聲器的受歡迎程度可能會(huì )隨著(zhù)顯示器的增加而下降。
當然,向多模式的轉變意味著(zhù)只使用文本的聊天助理也將適應,因為他們將通過(guò)語(yǔ)音演示中嵌入情感的語(yǔ)音增強,以克服只使用文本的缺點(diǎn)。
網(wǎng)頁(yè)通常會(huì )對顯示它們的屏幕大小做出“響應”,從而根據屏幕大小自動(dòng)調整布局。但當屏幕很小或不存在時(shí),內容可以顯示為語(yǔ)音內容。例如,可以將圖片呈現為語(yǔ)音字幕。有了這樣的多模式功能,用戶(hù)可以在進(jìn)行日常業(yè)務(wù)時(shí)輕松地在設備之間切換,而不會(huì )丟失任何交互內容。
下一步是情緒檢測。如果語(yǔ)音助理能夠檢測到用戶(hù)的情緒狀態(tài),那么如果用戶(hù)的情緒突然從平靜變?yōu)閼嵟涂梢宰龀鲞m當的反應,例如,語(yǔ)音助理可能會(huì )通過(guò)改變措辭來(lái)做出更平靜的反應。捕捉用戶(hù)的好惡也很重要;幫助聊天和廣告可以針對用戶(hù)的興趣。
情感的使用以及語(yǔ)音、圖形、文本、視頻和其他模式之間的折衷仍然沒(méi)有被完全理解。需要更多的研究、經(jīng)驗和測試來(lái)為當前的語(yǔ)音平衡和其他模式制定指導方針,以及如何在用戶(hù)界面中恰當地使用情感。
退一步說(shuō),語(yǔ)音系統正在進(jìn)化。如果您還沒(méi)有這樣做,就應該開(kāi)始準備您的業(yè)務(wù),以支持語(yǔ)音助理。并計劃您的新語(yǔ)音系統是獨立于平臺和多模式的。
聲明:版權所有 非合作媒體謝絕轉載
作者:James A.Larson
原文網(wǎng)址:
https://www.speechtechmag.com/Articles/Columns/Forward-Thinking/3-Trends-That-Will-Shape-IVA-Development-147637.aspx