• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    您當前的位置是:  首頁(yè) > 資訊 > 文章精選 >
     首頁(yè) > 資訊 > 文章精選 >

    構建引人注目的語(yǔ)音體驗時(shí)要避免四個(gè)陷阱

    2021-08-11 09:22:41   作者:   來(lái)源:CTI論壇   評論:0  點(diǎn)擊:


      CTI論壇(ctiforum.com)(編譯/老秦):語(yǔ)音體驗無(wú)處不在,從家中的智能技術(shù)到汽車(chē)中的命令。語(yǔ)音是一種新興的、更人性化的與周?chē)h(huán)境互動(dòng)的方式,正在推動(dòng)下一波消費者和員工體驗。事實(shí)上,Opus的研究發(fā)現,80%的受訪(fǎng)者認為流感大流行加速了自動(dòng)語(yǔ)音識別的采用。
      由于開(kāi)發(fā)人員利用了這種新的通信模式,因此在創(chuàng )建健壯的用戶(hù)體驗時(shí),瀏覽所有不同的組件可能會(huì )很棘手。作為一名專(zhuān)注于人工智能通信領(lǐng)域的首席技術(shù)官,我與許多客戶(hù)交談,了解他們需要什么才能使他們的語(yǔ)音體驗獲得成功。以下是創(chuàng )建強健的語(yǔ)音體驗時(shí)要避免的四個(gè)關(guān)鍵事項:
      忽略音頻源的質(zhì)量。基于語(yǔ)音的體驗在很大程度上取決于音頻輸入的質(zhì)量和融入體驗的轉錄能力。作為一名開(kāi)發(fā)人員,提倡高質(zhì)量的語(yǔ)音數據非常重要,因為低質(zhì)量的語(yǔ)音音頻不僅很難聽(tīng)到,而且會(huì )使開(kāi)發(fā)您的語(yǔ)音體驗變得更加困難。確保您使用的是良好的語(yǔ)音格式,并采用FLAC和Opus等標準,這些標準提供了良好的壓縮和優(yōu)化。好的ASR提供商將能夠處理您擁有的任何數據,但如果您避免使用低采樣率(如8kHz),而使用更高質(zhì)量的采樣率(如16kHz),您的數據將更干凈。在一天結束時(shí),與您的團隊合作以確保您的錄音要求被聽(tīng)到是很重要的。
      依靠具有剛性架構的ASR。我經(jīng)常看到開(kāi)發(fā)人員被鎖定在提供最小靈活性的現成解決方案中。尋找一家提供低成本解決方案和易于導航的實(shí)時(shí)功能的提供商是現實(shí)的目標,但沒(méi)有一種適合所有人的解決方案。開(kāi)發(fā)者需要確切地知道他們希望從音頻數據中得到什么,這樣他們就可以選擇一種技術(shù)來(lái)分析最相關(guān)的見(jiàn)解。尋找能夠提供部署靈活性和速度、高精度、實(shí)時(shí)能力、可擴展性和定制培訓的提供商非常重要。這些功能的重要性排名將根據您的使用情況而有所不同,但選擇一種對每種功能都很好的ASR技術(shù)將使您的語(yǔ)音體驗更好,因為它們會(huì )隨著(zhù)最終用戶(hù)的需求而變化和增長(cháng)。
      忽略應用程序將在其中使用的上下文。如果你想讓你的語(yǔ)音體驗在電腦上運行,你就不需要擔心連接和帶寬。另一方面,如果您的團隊成員主要使用可能出現連接問(wèn)題的移動(dòng)設備,那么您應該選擇針對低帶寬進(jìn)行優(yōu)化的最適合的音頻編解碼器,這樣您就不會(huì )占用用戶(hù)的網(wǎng)絡(luò )連接。對封閉源代碼音頻編解碼器保持警惕也很好,因為它不需要標準化。只要有可能,就嘗試使用開(kāi)源音頻編解碼器。
      沒(méi)有留下試驗和失敗的空間。所有的公司對語(yǔ)音體驗都會(huì )有不同的需求,有時(shí)他們并不清楚語(yǔ)音體驗在實(shí)時(shí)和現實(shí)生活中是如何工作的。在構建應用程序或API的過(guò)程中,可能會(huì )出現很多問(wèn)題,因此,當您越來(lái)越接近找到滿(mǎn)足企業(yè)需求的產(chǎn)品時(shí),在構建系統時(shí)考慮到健壯性和靈活性是至關(guān)重要的。
      作為一名開(kāi)發(fā)人員,您希望為您服務(wù)的任何受眾創(chuàng )造最佳的語(yǔ)音體驗。比以往任何時(shí)候都更重要的是,確保您的語(yǔ)音數據是高質(zhì)量的,您了解您的基礎ASR技術(shù)可以做什么,并創(chuàng )建一個(gè)能夠準確處理您需要的敏捷后端體驗。語(yǔ)音體驗的時(shí)機就在現在,通過(guò)盡早加入適當的API,您的語(yǔ)音體驗將蓬勃發(fā)展并適應客戶(hù)的需求。
      聲明:版權所有 非合作媒體謝絕轉載
      作者:Deepgram首席技術(shù)官Adam Sypniewski
      原文網(wǎng)址:
      https://www.speechtechmag.com/Articles/Editorial/Industry-Voices/Four-Pitfalls-to-Avoid-When-Building-Compelling-Voice-Experiences-148050.aspx
     
    【免責聲明】本文僅代表作者本人觀(guān)點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對文中陳述、觀(guān)點(diǎn)判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

    專(zhuān)題

    CTI論壇會(huì )員企業(yè)

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 安乡县| 田阳县| 泸水县| 武定县| 新密市| 当涂县| 察隅县| 金山区| 临清市| 米易县| 临沧市| 湟中县| 德昌县| 延庆县| 芮城县| 海兴县| 镇原县| 永川市| 丰顺县| 安陆市| 兰西县| 定兴县| 博乐市| 腾冲县| 安丘市| 内丘县| 通州市| 渝中区| 溧水县| 荆州市| 赤城县| 南丹县| 于田县| 扎鲁特旗| 常德市| 白水县| 武安市| 鹤岗市| 孝感市| 丰城市| 闽清县| http://444 http://444 http://444 http://444 http://444 http://444