• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
     首頁(yè) > 新聞 > IT與互聯(lián)網(wǎng) >

    東芝開(kāi)發(fā)出語(yǔ)音區分技術(shù),可快速區分10余人聲音

    2014-08-29 08:36:54   作者:   來(lái)源:日經(jīng)技術(shù)在線(xiàn)   評論:0  點(diǎn)擊:


      東芝開(kāi)發(fā)出了可用于會(huì )議記錄等的語(yǔ)音區分軟件技術(shù)。該軟件技術(shù)應用于開(kāi)會(huì )等場(chǎng)合時(shí),可以準確區分出10余人的聲音。軟件可在筆記本電腦及平板終端等移動(dòng)產(chǎn)品上運行,只要有普通的立體聲麥克風(fēng)就可以使用。該技術(shù)將在2014年9月3~5日于日本札幌市舉行的日本音響學(xué)會(huì )2014年秋季研究發(fā)布會(huì )上發(fā)布。
     

      東芝開(kāi)發(fā)出語(yǔ)音區分技術(shù),可快速區分10余人的聲音此次開(kāi)發(fā)的新技術(shù)結合“輸入聲音的特點(diǎn)”和“說(shuō)話(huà)人的方位信息”來(lái)區分聲音。利用聲音特點(diǎn)區分聲音時(shí),如果說(shuō)話(huà)的人數增多,聲音的特點(diǎn)會(huì )隨之增多,難以區別。東芝為解決該問(wèn)題設計的方法是結合說(shuō)話(huà)人的方位信息。就是根據多個(gè)麥克風(fēng)所錄音的相位差來(lái)推斷說(shuō)話(huà)人所在的方位。根據這一信息來(lái)提高分辨的準確度。

      對此,存在的問(wèn)題是需要特殊指向性的麥克風(fēng);推斷方位的處理量大、計算成本高等。另外,由于難以區分位于同一方位的不同說(shuō)話(huà)人,有時(shí)也會(huì )影響分辨性能。

      為此,東芝此次開(kāi)發(fā)出了使用普通立體聲麥克風(fēng)的快速且準確的方位推斷算法和不影響分辨性能的組合算法。比如,使用配備Core i7(最大工作頻率為2.7GHz)CPU和4GB主存的個(gè)人電腦,普通會(huì )議(參與者為10人左右)在錄音結束后5秒左右就能完成分辨處理。分辨成功率(能否準確區分說(shuō)話(huà)人聲音)方面,原方法為50%左右,而新技術(shù)達到了70%以上。

      新技術(shù)計劃在2014年度內完成。將嵌入到會(huì )議記錄輔助軟件等產(chǎn)品中。新技術(shù)不含語(yǔ)音轉換(如將內容做成文字數據)功能,所以有可能與該公司的語(yǔ)音識別技術(shù)配套提供。

    相關(guān)閱讀:

    分享到: 收藏

    專(zhuān)題

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 出国| 麻阳| 云林县| 阳高县| 三台县| 黄龙县| 顺平县| 邹平县| 阜宁县| 达日县| 手游| 昂仁县| 楚雄市| 陆河县| 石楼县| 拉孜县| 涞源县| 兴宁市| 孙吴县| 雷州市| 图片| 达拉特旗| 科尔| 肥城市| 巩留县| 黄山市| 方城县| 贡嘎县| 湘西| 佛坪县| 大港区| 桑日县| 云南省| 台州市| 新沂市| 娱乐| 保亭| 蓬溪县| 菏泽市| 镇赉县| 马公市| http://444 http://444 http://444 http://444 http://444 http://444