Cogito的信號處理和機器學(xué)習主管JohnKane說(shuō),人工智能和語(yǔ)音終于達到了一個(gè)新的高度。
“這個(gè)行業(yè)正在經(jīng)歷重大的勝利,比如能夠準確地從語(yǔ)音中識別文本,創(chuàng )造出聽(tīng)起來(lái)自然的計算機聲音。”他說(shuō):“新產(chǎn)品現在可以分析語(yǔ)言的非言語(yǔ)特征。言語(yǔ)中的許多意義來(lái)自于說(shuō)話(huà)的方式,而不僅僅是所說(shuō)的話(huà)。而語(yǔ)音技術(shù)讀取和分析這些特征的能力是該行業(yè)向前邁出的一大步。”
Orbita首席執行官Bill Rogers也同意這一觀(guān)點(diǎn)。
“如今的機器學(xué)習算法可以預測并提出建議,從而實(shí)現與人類(lèi)水平的自動(dòng)對話(huà)。這方面的高級應用包括結合生物標記來(lái)理解人類(lèi)的情緒,并從語(yǔ)調模式和基于語(yǔ)音識別的用戶(hù)識別中得出結論,”他解釋道。
其他人也同意,后一點(diǎn)尤為重要。
“在同理心和同情心對成功互動(dòng)至關(guān)重要的時(shí)代,語(yǔ)音技術(shù)的門(mén)檻已經(jīng)提高,”Interactions的研究與創(chuàng )新總監Michael Johnston堅持說(shuō)。“現代人工智能系統不僅提供日常自動(dòng)化,而且已經(jīng)開(kāi)始依靠客戶(hù)和座席之間的對話(huà),并以許多新的方式增加價(jià)值,例如提供個(gè)性化建議和呈現相關(guān)信息和內容。”
最新的統計數據強調了語(yǔ)音和人工智能的重要性:
- Allied Market Research預計,未來(lái)7年,全球虛擬助理市場(chǎng)將增長(cháng)37.7%,到2027年將達到443億美元。
- 根據insightSLICE的數據,到2030年,全球語(yǔ)音和語(yǔ)音識別市場(chǎng)預計將達到430億美元。
- 據谷歌統計,全球27%的在線(xiàn)用戶(hù)使用語(yǔ)音搜索;eMarketer顯示,幾乎40%的美國互聯(lián)網(wǎng)用戶(hù)和三分之一的總人口使用語(yǔ)音;據Perficient統計,目前55%的智能手機用戶(hù)使用語(yǔ)音搜索。
- 根據New Vantage的研究,10家企業(yè)中有9家以上正在對人工智能進(jìn)行投資。
年度回顧
如果不優(yōu)先考慮COVID-19以及它如何迫使人工智能迎接挑戰,就不可能評估2020年。
毫不奇怪,冠狀病毒是人工智能采用和語(yǔ)音技術(shù)創(chuàng )新的主要催化劑。廣泛的社會(huì )隔離以及對遠程通信和連接的需求將會(huì )話(huà)人工智能推向了中心舞臺,“Rogers說(shuō)。
例如:傳統的聯(lián)絡(luò )中心越來(lái)越多地轉向對話(huà)式人工智能,以確保業(yè)務(wù)連續性。
Johnston說(shuō):“在一個(gè)充滿(mǎn)不確定性和混亂的時(shí)代,為客戶(hù)提供一致、有效服務(wù)的能力可能比以往任何時(shí)候都更為重要。”
醫療保健組織和提供者也令人印象深刻地采用人工智能和語(yǔ)音技術(shù)來(lái)清除冠狀病毒的障礙。
Just AI首席執行官兼創(chuàng )始人Kiril lPetrov說(shuō):“以人工智能為動(dòng)力的聊天機器人和虛擬助理站在對抗COVID的最前線(xiàn),幫助篩選和分類(lèi)患者、進(jìn)行調查、共享信息,并在人們無(wú)法離開(kāi)家的時(shí)候實(shí)現遠程醫療。”
使用語(yǔ)音分析和護理協(xié)調團隊,高危患者也能夠更頻繁地聯(lián)系,從而推動(dòng)實(shí)時(shí)數據和參與。
Cosán集團創(chuàng )始人兼首席營(yíng)銷(xiāo)和發(fā)展官DavidHunt說(shuō):“隨著(zhù)疫情的持續,人們對心理健康的擔憂(yōu)增加,人工智能技術(shù)已經(jīng)被用來(lái)提高患者的參與度,監測心理健康的變化。”
總的來(lái)說(shuō),2020年讓商界領(lǐng)袖意識到,消費者習慣將繼續快速演變。
“越來(lái)越多的公司認識到,人工智能可以幫助應對這些變化,繼續提供優(yōu)質(zhì)的客戶(hù)體驗,從而幫助公司與客戶(hù)建立更好的關(guān)系。”Read Speaker北美區總裁Matt Muldoon說(shuō):“公司已經(jīng)開(kāi)始利用人工智能開(kāi)發(fā)出更感性、更高質(zhì)量的聲音,品牌也使用了更多的交互式語(yǔ)音廣告,讓他們能夠直接與消費者交談。”
2020年的其他亮點(diǎn)也很重要:
- 自動(dòng)語(yǔ)音識別通過(guò)不斷增加的遞歸神經(jīng)網(wǎng)絡(luò )傳感器的應用,實(shí)現了又一個(gè)飛躍,從而提高了準確性,減少了計算量。
- FacebookAI的wav2vec2.0吸引了大量的關(guān)注。Kane說(shuō):“wav2vec2.0是音頻和語(yǔ)音的一項創(chuàng )新,不需要自動(dòng)語(yǔ)音識別,它為下游的音頻和語(yǔ)音分類(lèi)任務(wù)提供了強大的原材料。”
- 引入OpenAI的GPT-3,以實(shí)現自然語(yǔ)言的預測和生成。
- 語(yǔ)音克隆得到改進(jìn),AI的本地化功能證明了這一點(diǎn)。“他們的合成語(yǔ)音克隆可以被訓練說(shuō)六種語(yǔ)言。這項新功能允許將數字語(yǔ)音翻譯成其他語(yǔ)言,這將使本地化更加容易,”Petrov說(shuō)。
展望未來(lái)
業(yè)內專(zhuān)家看好未來(lái)幾個(gè)月相關(guān)技術(shù)的快速擴張。
“到2021年,我們將看到越來(lái)越多地使用會(huì )話(huà)人工智能來(lái)替代人類(lèi)智能的增強。”Johnston預測:“我們還將見(jiàn)證對話(huà)人工智能從語(yǔ)音和文本渠道不斷擴展到富媒體和多模式交互,智能虛擬助理將能夠通過(guò)語(yǔ)音和文本的視覺(jué)媒體組合向客戶(hù)呈現信息。”
Muldoon預測,由于流感大流行而改變的消費者習慣可能會(huì )加速人工智能和語(yǔ)音技術(shù)的應用,特別是在今年上半年。
“我們將開(kāi)始看到支持語(yǔ)音的人工智能能力的擴展。”他說(shuō):“隨著(zhù)越來(lái)越多的模型繼續被構建,將會(huì )有機會(huì )創(chuàng )造出更強大的交互,幾年后,人工智能將成為完成任務(wù)的第二種方式,而不是支持性角色。”
Kane預計,由于無(wú)監督的表征學(xué)習,諸如聲音事件檢測和語(yǔ)音情感識別等分類(lèi)問(wèn)題的準確率會(huì )有顯著(zhù)的提高。
Kane說(shuō):“今年可能是交互式會(huì )話(huà)數據得到應有的研究和開(kāi)發(fā)關(guān)注的一年,我們看到了更多關(guān)于交互式語(yǔ)音合成的學(xué)術(shù)研究,以幫助語(yǔ)音助理等強大應用。”
其他人則希望,人工智能的進(jìn)步將在智能手機上帶來(lái)更好的語(yǔ)音文本轉換功能。
“現在,當我們要求手機通過(guò)語(yǔ)音創(chuàng )建信息時(shí),我們會(huì )看到很多錯誤。但隨著(zhù)創(chuàng )新的繼續和算法的日益強大,我們將受益于這一應用的準確性提高,這也將影響智能說(shuō)話(huà)者擴大他們對人類(lèi)語(yǔ)言的理解,以及更廣泛地與用戶(hù)交談的能力,”Rogers建議。
Wolters Kluwer的應用數據科學(xué)主管John Langton認為,我們可以預期,今年人工智能和其他技術(shù)(如面部識別和語(yǔ)音識別)之間的協(xié)同效應將會(huì )增強。
“為了改進(jìn)整合,我們現在可以使用情感計算作為額外的信號到語(yǔ)音輸入,在回答消費者問(wèn)題時(shí)推斷用戶(hù)意圖,”他說(shuō)。
許多人同意,人工智能也將繼續在醫療保健領(lǐng)域提供更好的患者護理服務(wù)。
“我們將觀(guān)察到為患者提供更加個(gè)性化的護理,為提供者提供更加高效和有效的手術(shù)。此外,遠程醫療的迅速采用,加上消費者對語(yǔ)音智能家居技術(shù)的廣泛使用,將可能推動(dòng)交流醫療AI機器人的發(fā)展,”Hunt說(shuō)。
聲明:版權所有 非合作媒體謝絕轉載
作者:Erik J.Martin
原文網(wǎng)址:https://www.speechtechmag.com/Articles/Editorial/Features/The-State-of-Artificial-Intelligence-145107.aspx