• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    您當前的位置是:  首頁(yè) > 資訊 > 國內 >
     首頁(yè) > 資訊 > 國內 >

    捷通華聲靈云:揭開(kāi)語(yǔ)音識別能力的神秘面紗

    2022-02-15 08:19:18   作者:   來(lái)源:CTI論壇   評論:0  點(diǎn)擊:


      信息是如何從我們的大腦傳遞給計算機的?從早期的鍵盤(pán)到我們口袋里的觸摸屏,我們逐步擴展了人機數字交互的方式。隨著(zhù)自動(dòng)語(yǔ)音識別(ASR)技術(shù)的發(fā)展,人工智能系統與真正“人類(lèi)”交流的方式的差距逐漸縮短。
      本質(zhì)上講,語(yǔ)音識別可將人的語(yǔ)音轉換為文字,允許人機進(jìn)行語(yǔ)音對話(huà)。
      揭開(kāi)語(yǔ)音識別能力的神秘面紗
      現今的語(yǔ)音識別主要通過(guò)將數據集直接輸入算法來(lái)進(jìn)行語(yǔ)音模型的訓練。通常,工業(yè)界為了適應不同年齡、不同地域、不同人群、不同信道、不同終端和不同噪聲環(huán)境的應用環(huán)境,往往需要大量語(yǔ)音語(yǔ)料和文本語(yǔ)料來(lái)進(jìn)行訓練,使之有效提高識別率。隨著(zhù)移動(dòng)互聯(lián)網(wǎng)的發(fā)展,大量文本和語(yǔ)音語(yǔ)料可從多個(gè)渠道進(jìn)行獲取,為語(yǔ)音識別的語(yǔ)言模型和聲學(xué)模型的訓練提供了豐富的資源,使得通用大規模語(yǔ)言模型和聲學(xué)模型成功構建。
      靈云語(yǔ)音識別能力基于捷通華聲公司最新一代的識別算法、解碼器核心、現今的聲學(xué)模型和語(yǔ)言模型訓練方法,在核心的聲學(xué)模型、語(yǔ)言模型、解碼器上都有創(chuàng )新和突破。目前,靈云語(yǔ)音識別系統的主力模型為CTF模型,該模型有效的提升了語(yǔ)音識別引擎的執行效率、增強了對不同口音、語(yǔ)速的適配能力,大幅提升了多人會(huì )談、遠揚講話(huà)的識別率。
      靈云語(yǔ)音識別能力基于聲學(xué)模型,用于搭建音頻信號和音素,就像應用數字溫度計將溫度度數轉換為數字一樣,聲學(xué)模型可將聲波轉換為計算機語(yǔ)言。靈云語(yǔ)音識別系統應用端到端(E2E)模型,可快速拓展多語(yǔ)種,減少解碼時(shí)間,提高語(yǔ)音識別準確率。
      靈云語(yǔ)音識別能力可以準確實(shí)現話(huà)者分離,不但在多人會(huì )議談話(huà)場(chǎng)景下應用智能會(huì )議記錄中至關(guān)重要,而且還可避免因兩位發(fā)言者同時(shí)發(fā)言的語(yǔ)音組合一個(gè)無(wú)意義的記錄而造成的混淆。靈云語(yǔ)音識別的話(huà)者分離模塊采用了聲紋識別技術(shù)及語(yǔ)義理解技術(shù),新版本引擎在原有話(huà)者分離算法基礎上,增加了對采用字詞分割輔助的方法進(jìn)行話(huà)者分離的支持。該算法下,在正常 VAD 切分獲得初始分段的基礎上,還會(huì )使用免 VAD 的 方法先進(jìn)行識別,得到識別出的詞邊界,再利用此邊界對初始分段進(jìn)行修正,并輔助話(huà)者的聚類(lèi)。
      靈云語(yǔ)音識別技術(shù)的應用
      捷通華聲作為國內最早期從事人工智能技術(shù)研發(fā)和產(chǎn)業(yè)化應用的企業(yè),在成立之初便確定“融合技術(shù)、融合應用、融合服務(wù)”發(fā)展理念,以場(chǎng)景需求為導向,本著(zhù)對核心技術(shù)孜孜不倦的探索精神和務(wù)實(shí)推進(jìn)的原則,在保持技術(shù)先進(jìn)性的同時(shí),不斷創(chuàng )新場(chǎng)景應用。
      靈云語(yǔ)音識別能力在各行各業(yè)都有出色承擔應用程序和創(chuàng )新用例,在會(huì )議、談話(huà)、演講等現實(shí)場(chǎng)景中,它都可為客戶(hù)提供語(yǔ)音支撐技術(shù),為客戶(hù)提供便捷工作、生活方式。
      以呼叫中心為例,靈云語(yǔ)音識別能力可部署到全自動(dòng)聊天機器人中,可監控客戶(hù)人機交互,以更快地解決問(wèn)題以及改進(jìn)員工培訓。“某公司應用靈云語(yǔ)音識別能力將客戶(hù)事件平均處理時(shí)間減少40%,自助服務(wù)率從 5% 提高到20%,員工成本降低多達 500 萬(wàn),提高服務(wù)轉化率近 50%,極大提升了客戶(hù)滿(mǎn)意度和員工敬業(yè)度”。
     
    【免責聲明】本文僅代表作者本人觀(guān)點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對文中陳述、觀(guān)點(diǎn)判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

    專(zhuān)題

    CTI論壇會(huì )員企業(yè)

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 浮山县| 桦南县| 贺兰县| 鄂州市| 香格里拉县| 正蓝旗| 宿迁市| 福贡县| 积石山| 车险| 汤原县| 台湾省| 织金县| 江口县| 依安县| 璧山县| 临武县| 宝山区| 梁河县| 渭源县| 原阳县| 华坪县| 攀枝花市| 广州市| 吐鲁番市| 吐鲁番市| 安仁县| 泸州市| 建昌县| 涞源县| 绵竹市| 湾仔区| 鄂尔多斯市| 贵溪市| 玉屏| 镶黄旗| 揭东县| 泗阳县| 大名县| 霍城县| 富平县| http://444 http://444 http://444 http://444 http://444 http://444