• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    您當前的位置是:  首頁(yè) > 新聞 > 國內 >
     首頁(yè) > 新聞 > 國內 >

    依圖語(yǔ)音平臺上線(xiàn),華為微軟聯(lián)合發(fā)布

    2018-12-12 09:02:50   作者:   來(lái)源:CTI論壇   評論:0  點(diǎn)擊:


      華少的快,矮大緊的京范兒口音,神仙打架的《奇葩說(shuō)》,這些復雜場(chǎng)景的語(yǔ)音識別有多難?今天依圖帶你領(lǐng)略新鮮出爐的語(yǔ)音識別算法實(shí)力。
      今天開(kāi)始,依(zui)圖(hao)語(yǔ)音開(kāi)放平臺上線(xiàn)了!
      業(yè)內首次系統測試主流語(yǔ)音識別廠(chǎng)商的技術(shù)性能
    (測試完成于2018年11月底)
      在全球最大中文普通話(huà)數據庫AISHELL-2的三個(gè)測試子集、Accent近場(chǎng)口音測試集、Chat近場(chǎng)安靜聊天測試集上,依圖語(yǔ)音識別算法最近測得多項第一。AISHELL-2數據規模達1000小時(shí),是目前全球最大的中文開(kāi)源數據庫。在A(yíng)ISHELL2-2018A-EVAL數據集中,依圖語(yǔ)音識別準確率達到96.29%,字錯率(CER)為3.71%,領(lǐng)先第二名約17%。
      無(wú)論是語(yǔ)音助手還是節目,電話(huà)客服或是閑聊,依圖更懂你。
      依圖語(yǔ)音識別性能優(yōu)于第二名約17%語(yǔ)音未來(lái)任重道遠
      通過(guò)手機近距離收集聲音,依圖優(yōu)于第二名約17%,字字再現強時(shí)效內容
      語(yǔ)速超快又有地方口音?依圖和訊飛挺下來(lái)了
      考驗系統是不是夠“皮實(shí)”、夠“穩健”的時(shí)候到了!在遠距離場(chǎng)景,環(huán)境中會(huì )存在噪聲、混響和反射,依圖和訊飛聽(tīng)見(jiàn)優(yōu)勢明顯
      從技術(shù)性能來(lái)說(shuō),字錯率曲線(xiàn)抖動(dòng)越小,算法的場(chǎng)景通用性越好。綜合各場(chǎng)景測試的結果,業(yè)界主流算法中,依圖和訊飛的算法字錯率抖動(dòng)相對較小。
      但是同樣說(shuō)明了語(yǔ)音識別的發(fā)展既有驚喜也有遺憾。各大廠(chǎng)商的近場(chǎng)場(chǎng)景識別能力讓我們感受到了科技的力量,而加入遠場(chǎng)演講的高難度場(chǎng)景的識別能力不足,也表明了未來(lái)的路還很遠。
      花式挑戰算法性能依圖表現穩定
      聽(tīng)寫(xiě)大會(huì )小程序一經(jīng)發(fā)布,各種評(tiao)測(xi)洶涌而來(lái)。依圖語(yǔ)音憑借自身優(yōu)秀的技術(shù),展現了極其穩定的語(yǔ)音識別能力。
      再熱血的足球解說(shuō)我們hold住
      繞口令?依圖能聽(tīng)清!
      語(yǔ)音識別歌詞,依圖可帶勁啦!
      呂昊博士現場(chǎng)演示的這款“聽(tīng)寫(xiě)大會(huì )”小程序也是業(yè)界第一次基于公開(kāi)API將市場(chǎng)上的主流語(yǔ)音識別技術(shù)性能做比較——歡迎大家去花式調戲!
      語(yǔ)音識別命題深遠 攜手華為、微軟共同推動(dòng)技術(shù)發(fā)展
      語(yǔ)音是語(yǔ)言的物質(zhì)外殼,它最直接記錄了人的思維活動(dòng),從語(yǔ)言的誕生第一天起,用語(yǔ)音溝通就成了最自然的一件事情。直到今天,它還是人與人之間交流的最重要的渠道。在語(yǔ)音識別發(fā)展的漫長(cháng)過(guò)程中,不僅僅需要對聲音的記錄,還有對語(yǔ)言句子的理解和當事人的經(jīng)驗,語(yǔ)音識別能力與對知識理解的能力正相關(guān)。
      正因如此,人工智能的語(yǔ)音識別不僅有趣,更是很有意義,它是機器理解世界的重要組成部分,是人人交互、人機交互最重要的入口,也是邁向智能發(fā)展更高階段的必經(jīng)之路。盡管這條道路已經(jīng)顯得非常擁擠,語(yǔ)音識別落地場(chǎng)景隨處可見(jiàn),做語(yǔ)音識別的機構百家爭鳴,人工智能的語(yǔ)音識別仍處于初步發(fā)展的階段。
      作為一家對人工智能有著(zhù)深入理解和推廣應用的公司,語(yǔ)音識別是依圖人工智能布局下一個(gè)不可或缺的組成部分。我們將始終保持在技術(shù)層面的投入,通過(guò)技術(shù)的突破來(lái)解鎖更多的可能,也期待更多合作伙伴與我們共同探索語(yǔ)音技術(shù)的行業(yè)應用,共同推動(dòng)行業(yè)發(fā)展。
    (依圖首席創(chuàng )新官呂昊博士與微軟大中華區合作伙伴發(fā)展總經(jīng)理周芳女士聯(lián)合發(fā)布語(yǔ)音開(kāi)放平臺)
    (依圖首席創(chuàng )新官呂昊博士與華為智能計算渠道合作部部長(cháng)康鑫先生聯(lián)合發(fā)布智能語(yǔ)音聯(lián)合解決方案)
      今天,依圖還與微軟Azure聯(lián)合推出依圖語(yǔ)音開(kāi)放平臺(speech.yitutech.com),與華為聯(lián)合發(fā)布“智能語(yǔ)音聯(lián)合解決方案”,將依圖最新的語(yǔ)音識別技術(shù)能力提供給第三方應用開(kāi)發(fā)者,共同推動(dòng)行業(yè)進(jìn)步。
      就像物理學(xué)家理查德·費曼所說(shuō):“我無(wú)法創(chuàng )造的東西,我就不能理解。”我們認為只有真的實(shí)現了人工智能,才有可能弄明白學(xué)習是怎么回事。依圖對人工智能的探索永無(wú)止境。
      (極客公園創(chuàng )始人張鵬對話(huà)依圖首席創(chuàng )新官呂昊博士、依圖科學(xué)家吳雙博士)
    【免責聲明】本文僅代表作者本人觀(guān)點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對文中陳述、觀(guān)點(diǎn)判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

    專(zhuān)題

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 肇东市| 连州市| 阳信县| 工布江达县| 平乡县| 上高县| 疏勒县| 南皮县| 扶余县| 临泉县| 五大连池市| 修文县| 荥经县| 安龙县| 新宁县| 乐至县| 鄂托克前旗| 舟山市| 东乌| 蓬溪县| 武夷山市| 广丰县| 宜宾县| 垣曲县| 阳江市| 宁陕县| 柘荣县| 茶陵县| 平罗县| 泰来县| 东安县| 大埔县| 吐鲁番市| 淮北市| 丰县| 全南县| 金溪县| 柳河县| 阿城市| 正蓝旗| 察哈| http://444 http://444 http://444 http://444 http://444 http://444