• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    您當前的位置是:  首頁(yè) > 資訊 > 文章精選 >
     首頁(yè) > 資訊 > 文章精選 >

    2021年語(yǔ)音技術(shù)產(chǎn)業(yè)狀況——語(yǔ)音開(kāi)發(fā)平臺的現狀

    2021-02-25 09:25:55   作者:   來(lái)源:CTI論壇   評論:0  點(diǎn)擊:


      CTI論壇(ctiforum.com)(編譯/老秦):語(yǔ)音應用程序開(kāi)發(fā)市場(chǎng)主要由消費產(chǎn)品驅動(dòng)。最近,對于公司來(lái)說(shuō),構建自己的語(yǔ)音解決方案變得越來(lái)越容易,盡管這一領(lǐng)域并不像企業(yè)所希望的那樣完全明確。
     
      到目前為止,供應商主要專(zhuān)注于創(chuàng )建消費者語(yǔ)音應用程序。“Alexa擁有超過(guò)10萬(wàn)種技能,但其中很少有用于嚴肅業(yè)務(wù)用例的,”會(huì )話(huà)技術(shù)負責人、萬(wàn)維網(wǎng)聯(lián)盟多模式交互工作組主席Deborah Dahl解釋道。“很多技能都是學(xué)生項目和各種類(lèi)型的實(shí)驗。在構建工業(yè)級應用程序方面投入的精力還不夠多。”
      年度回顧
      事實(shí)上,亞馬遜、蘋(píng)果和谷歌等頂級供應商通過(guò)創(chuàng )建消費者解決方案來(lái)打造自己的業(yè)務(wù)。2020年,一個(gè)企業(yè)平臺出現了。通過(guò)Nuance Communications'Mix,公司現在可以構建自己的企業(yè)智能助理。
      該解決方案包括許多組件,使組織能夠創(chuàng )建通過(guò)應用程序編程接口(APIs)與企業(yè)軟件集成的語(yǔ)音應用程序。通過(guò)Mix。nlu,一個(gè)自定義自然語(yǔ)言理解(NLU)系統,公司編寫(xiě)從Mix項目?jì)x表板部署的語(yǔ)音模型。Mix的自動(dòng)語(yǔ)音識別(ASR)功能由Krypton提供支持,Krypton是一個(gè)用于轉錄音頻的實(shí)時(shí)語(yǔ)音到文本引擎。Krypton使用域語(yǔ)言模型和詞集來(lái)定制特定環(huán)境的識別。
      Dahl指出:“Nuance Mix與Alexa Skills Kit在功能上非常相似,它為希望構建語(yǔ)音應用程序的第三方提供了這些功能。”由于Nuance解決方案剛剛開(kāi)始發(fā)布,它在可用技能的數量和豐富性方面遠遠落后于更大、更成熟的消費者平臺。
      大多數企業(yè)開(kāi)發(fā)人員都使用過(guò)傳統的文本應用程序,需要熟悉語(yǔ)音APIs中提供的功能。Nuance似乎意識到了這種需要。Dahl說(shuō):“Nuance創(chuàng )造了非常精良和有用的培訓材料。一個(gè)視頻引導新手完成開(kāi)發(fā)過(guò)程,最佳實(shí)踐和技巧提供了額外的指導。
      供應商還繼續調整他們的語(yǔ)音引擎。例如,今年10月,Artificial Solutions更新了Teneo語(yǔ)言,該語(yǔ)言以Teneo NLU本體和語(yǔ)義網(wǎng)絡(luò )為特征,并將語(yǔ)言映射到聲音。
      Teneo現在也應用句法條件,比如理解一個(gè)詞在句子中何時(shí)被用作名詞或動(dòng)詞。附加的會(huì )話(huà)模塊提供了預構建的解決方案,具有用于常見(jiàn)對話(huà)的后端集成,例如實(shí)時(shí)聊天切換或預訂會(huì )議室。
      即使在用戶(hù)保持沉默的情況下,該產(chǎn)品仍能繼續進(jìn)行對話(huà);保持與公司品牌價(jià)值相一致的個(gè)性;即使在用戶(hù)偏離主題的情況下,該產(chǎn)品也能保持動(dòng)力。
      另一家開(kāi)發(fā)平臺提供商Voiceitt首先通過(guò)與具有非典型語(yǔ)音模式的人合作,建立了自己的語(yǔ)音識別算法和語(yǔ)音數據庫。去年12月,供應商讓殘疾人可以使用Alexa。Voiceitt移動(dòng)應用程序應用機器學(xué)習和語(yǔ)音識別技術(shù),幫助因中風(fēng)、退行性疾病或發(fā)育障礙導致的語(yǔ)音障礙患者進(jìn)行交流。
      此前,Inglis House是一個(gè)長(cháng)期護理輪椅社區,它的試點(diǎn)取得了成功。兩者開(kāi)發(fā)了一個(gè)應用程序,幫助腦癱患者使用自己的聲音獨立完成常見(jiàn)任務(wù),比如控制電視頻道或播放音樂(lè )。
      不過(guò),總的來(lái)說(shuō),語(yǔ)音解決方案在很大程度上是自主發(fā)展的,盡管企業(yè)希望將它們相互連接起來(lái)。
      8月份,Genesys加強了Engage,它的云聯(lián)絡(luò )中心語(yǔ)音解決方案,因此它在多云部署中運行。
      Engage的容器化體系結構支持私有、公共或混合云部署。該產(chǎn)品與領(lǐng)先的基礎設施即服務(wù)提供商合作,如Amazon Web Services(AWS)、GoogleCloud和MicrosoftAzure。有了它,組織可以在不同的云之間移動(dòng)他們的軟件,或者使用多個(gè)提供者來(lái)滿(mǎn)足不同的系統需求、地理需求或數據主權法規。
      展望未來(lái)
      到目前為止,語(yǔ)音開(kāi)發(fā)平臺主要是由大型成功技術(shù)公司推出的專(zhuān)有解決方案。有很多產(chǎn)品可用,但它們有不同的目標、設計基礎和接口,而且很少在緊密結合的生態(tài)系統之外工作。
      因此,企業(yè)無(wú)法輕松地將在其中一個(gè)平臺上完成的工作應用到在另一個(gè)平臺上運行的具有類(lèi)似需求的應用程序。慢慢地,這個(gè)行業(yè)正以幾種不同的方式轉向標準的、開(kāi)放的系統。
      其中一個(gè)重點(diǎn)領(lǐng)域是開(kāi)源解決方案。Rasa是一家通過(guò)風(fēng)險投資籌集了4000萬(wàn)美元的初創(chuàng )公司,它開(kāi)發(fā)了一個(gè)開(kāi)源的語(yǔ)音開(kāi)發(fā)平臺。供應商提供程序員用來(lái)創(chuàng )建聊天機器人、語(yǔ)音應用程序和會(huì )話(huà)服務(wù)的基礎設施和編程工具。
      Rasa在其會(huì )話(huà)AI套件中提供三種產(chǎn)品。Rasa Open Source于2019年發(fā)布,創(chuàng )建了語(yǔ)音AI軟件。RasaX是一個(gè)免費的工具集,幫助開(kāi)發(fā)人員在Rasa開(kāi)源平臺上構建智能語(yǔ)音助手。RasaEnterprise提供企業(yè)級IVA開(kāi)發(fā)平臺。
      Dahl認為,開(kāi)源軟件有優(yōu)缺點(diǎn)。價(jià)格始終是部署的考慮因素,開(kāi)源解決方案幾乎總是免費提供的。此外,這些產(chǎn)品是柔韌的,人們可以用任何他們想要的方式使用它們。他們反應迅速。有了自己動(dòng)手的工具包,企業(yè)可以立即更改軟件,而不是等待供應商添加所需的功能。
      但開(kāi)源解決方案也有其局限性。核心升級通常需要一段時(shí)間,因為它們需要獲得社區的同意,而社區對如何改進(jìn)功能可能有很大不同的看法。通常,這些系統很復雜,企業(yè)缺乏部署和維護它們所需的專(zhuān)業(yè)知識。如果出現問(wèn)題,用戶(hù)通常無(wú)法拿起電話(huà)并獲得技術(shù)支持。
      另一個(gè)新興趨勢是推動(dòng)行業(yè)標準的發(fā)展,這也使得組織構建和連接語(yǔ)音軟件變得更加簡(jiǎn)單。開(kāi)放語(yǔ)音網(wǎng)絡(luò )(OVN)是由麻省理工學(xué)院(MIT)汽車(chē)識別實(shí)驗室、凱捷咨詢(xún)公司和英特爾公司在2016年夏天進(jìn)行的研究開(kāi)發(fā)出來(lái)的。”我們認識到語(yǔ)音用戶(hù)界面有可能改變人類(lèi)與計算機系統的交互方式,“開(kāi)放語(yǔ)音網(wǎng)絡(luò )的執行董事JonStine解釋說(shuō)。
      OVN是Linux基金會(huì )的一個(gè)定向基金,去年春天推出。目前,大約有十幾家企業(yè)和150多名設計師、開(kāi)發(fā)人員和戰略家正在研究創(chuàng )建通用語(yǔ)音軟件體系結構的方法。它們有四個(gè)目標:安全;提供用戶(hù)、生態(tài)系統和體系結構選擇;具有包容性和可訪(fǎng)問(wèn)性;支持開(kāi)放式軟件和硬件,但仍能實(shí)現商業(yè)差異化。
      該集團計劃解決一個(gè)市場(chǎng)限制。”目前,企業(yè)沒(méi)有辦法注冊他們的語(yǔ)音產(chǎn)品。“Stine指出:“沒(méi)有用于語(yǔ)音的DNS[域名服務(wù)]。”
      OVN已經(jīng)開(kāi)始研究如何建立一個(gè)數據庫和流程,這樣公司就可以注冊,比如他們的名字。有了它,例如,消費者可以區分Delta Airlines和Delta Dental語(yǔ)音技能。
      到目前為止,消費類(lèi)應用已經(jīng)推動(dòng)了語(yǔ)音開(kāi)發(fā)市場(chǎng)。新的以企業(yè)為中心的平臺已經(jīng)開(kāi)始出現,向開(kāi)源和基于標準的系統的轉移有可能使公司在2021年更容易創(chuàng )建更多業(yè)務(wù)質(zhì)量的語(yǔ)音應用程序。
      聲明:版權所有 非合作媒體謝絕轉載
      作者:Paul Korzeniowski
      原文網(wǎng)址:
      https://www.speechtechmag.com/Articles/ReadArticle.aspx?ArticleID=145091
     
    【免責聲明】本文僅代表作者本人觀(guān)點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對文中陳述、觀(guān)點(diǎn)判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

    專(zhuān)題

    CTI論壇會(huì )員企業(yè)

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 长海县| 望都县| 平武县| 顺平县| 龙井市| 北宁市| 会东县| 漯河市| 呈贡县| 镇江市| 永平县| 阜新市| 丰县| 惠安县| 北流市| 乐山市| 江川县| 偃师市| 密山市| 容城县| 巧家县| 衢州市| 家居| 广西| 五家渠市| 买车| 孟津县| 牙克石市| 浪卡子县| 沂南县| 江城| 凤台县| 乐都县| 临朐县| 绥德县| 宜都市| 和田市| 响水县| 淮阳县| 齐河县| 深圳市| http://444 http://444 http://444 http://444 http://444 http://444