• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    您當前的位置是:  首頁(yè) > 資訊 > 國內 >
     首頁(yè) > 資訊 > 國內 >

    聯(lián)想研究院:用語(yǔ)音技術(shù),解讀人類(lèi)首次登月通訊數據

    2021-09-07 14:13:43   作者:   來(lái)源:CTI論壇   評論:0  點(diǎn)擊:


      在8月底9月初舉行的語(yǔ)音領(lǐng)域國際頂級會(huì )議Interspeech2021上,聯(lián)想研究院和昆山杜克SMIIP實(shí)驗室合作完成的兩篇語(yǔ)音技術(shù)論文被大會(huì )收錄。
      這兩篇論文分別是The DKU-Duke-Lenovo System Description for the Fearless StepsChallenge Phase III(昆山杜克-聯(lián)想第三屆“無(wú)畏腳步挑戰賽”系統描述),以及The 2020 Personalized Voice Trigger Challenge: Open Database, Evaluation Metrics and the Baseline Systems(2020個(gè)性化語(yǔ)音喚醒挑戰賽:開(kāi)放數據庫,評價(jià)標準以及基線(xiàn)系統)。
      第一篇論文介紹了今年聯(lián)想和昆山杜克聯(lián)隊參加第三屆無(wú)畏腳步挑戰賽(Fearless Steps Challenge)的獲獎系統。
      無(wú)畏腳步挑戰賽---用語(yǔ)音技術(shù)解讀人類(lèi)首次登月語(yǔ)音
      該挑戰賽在Interspeech2019大會(huì )上由德克薩斯大學(xué)達拉斯分校發(fā)起,今年已是第三屆。挑戰賽基于人類(lèi)第一次登月任務(wù)---阿波羅11號登月真實(shí)通訊語(yǔ)音數據,包括從發(fā)射到返回地球各階段,3位宇航員和29個(gè)負責不同任務(wù)的站點(diǎn)之間的通訊語(yǔ)音,設置了5類(lèi)語(yǔ)音分析和識別任務(wù),包括:
    • 語(yǔ)音端點(diǎn)檢測(SAD,Speech Activity Detection)
    • 聲紋識別(SID,Speaker Identification)
    • 說(shuō)話(huà)人日志(SD,Speaker Diarization)
    • 語(yǔ)音識別(ASR,Automatic Speech Recognition)
    • 對話(huà)分析(CA,Conversational Analysis)
      阿波羅11號登月語(yǔ)音數據包含600多個(gè)說(shuō)話(huà)人,類(lèi)型復雜,包含環(huán)境噪聲、信道噪聲、設備噪聲等干擾因素,每一個(gè)信道采集的聲音都可能包含幾個(gè)或者十幾個(gè)其他信道的干擾,因此屬于高難度的實(shí)時(shí)通訊和自然交談場(chǎng)景,為語(yǔ)音識別和分析任務(wù)帶來(lái)了很大的挑戰。
    語(yǔ)音端點(diǎn)檢測任務(wù)獲得國際第二名
      在本次比賽中,聯(lián)想和昆山杜克聯(lián)隊參加了其中的端點(diǎn)檢測、聲紋識別和說(shuō)話(huà)人日志三項子任務(wù),最終在端點(diǎn)檢測任務(wù)中獲得了國際第二名,而聲紋識別和說(shuō)話(huà)人日志分別獲得冠軍。
    聲紋識別任務(wù)獲得國際第一名
      語(yǔ)音端點(diǎn)檢測用以檢測連續語(yǔ)音中人說(shuō)話(huà)的起始點(diǎn),即有效話(huà)音檢測。快速準確的端點(diǎn)檢測算法,不僅能夠提升語(yǔ)音識別準確率,還可以提高計算效率,通常在語(yǔ)音識別、聲紋識別等任務(wù)中擔負著(zhù)前端預處理作用。
      而聲紋識別是判斷一段語(yǔ)音是否是某個(gè)目標人所說(shuō)。除了在安全領(lǐng)域的應用,在智能物聯(lián)網(wǎng)設備以及智慧客服、智能辦公等垂直行業(yè)中也有廣泛的應用需求。
      說(shuō)話(huà)人日志,則是基于聲紋識別的擴展任務(wù),即檢測一段語(yǔ)音中什么人、什么時(shí)間在說(shuō)話(huà)。該技術(shù)在智能會(huì )議場(chǎng)景中有重要作用,結合語(yǔ)音識別可以形成帶有發(fā)言人信息的自動(dòng)會(huì )議紀要。
      基于聲紋識別的個(gè)性化語(yǔ)音喚醒
      另外一篇入圍論文,即2020個(gè)性化語(yǔ)音喚醒挑戰賽:開(kāi)放數據庫,評價(jià)標準以及基線(xiàn)系統,介紹了由聯(lián)想研究院與昆山杜克大學(xué)、北京郵電大學(xué)聯(lián)合主辦的“2020個(gè)性化語(yǔ)音喚醒挑戰賽”(PVTC 2020 - Personalized Voice Trigger Challenge)及基線(xiàn)系統的情況。PVTC2020是國際語(yǔ)音通信協(xié)會(huì )中文口語(yǔ)語(yǔ)言處理專(zhuān)委會(huì )旗艦會(huì )議ISCSLP2021(International Symposium on Chinese Spoken Language Processing)的組成部分。本次挑戰賽考察的是帶有聲紋認證功能的語(yǔ)音喚醒技術(shù),喚醒詞是聯(lián)想產(chǎn)品中最廣泛應用的喚醒詞之一“小樂(lè )小樂(lè )”。活動(dòng)歷時(shí)3個(gè)月,參賽團隊來(lái)自著(zhù)名高校、知名企業(yè)和人工智能創(chuàng )業(yè)公司,包括北京大學(xué)、西北工業(yè)大學(xué)、廈門(mén)大學(xué)、小米、出門(mén)問(wèn)問(wèn)、普強、實(shí)地地產(chǎn)、杭州國芯等,其中來(lái)自小米、西工大、出門(mén)問(wèn)問(wèn)、實(shí)地地產(chǎn)的四支隊伍分別躋身不同賽道的前三名。這次活動(dòng)為業(yè)界同行構建了良好的交流平臺,促進(jìn)了資源和技術(shù)共享,推動(dòng)了學(xué)術(shù)界和工業(yè)界更密切的合作。
      另外,在剛剛揭曉的Interspeech 2021副語(yǔ)言語(yǔ)音屬性評測中(ComParE 2021),聯(lián)想研究院團隊在靈長(cháng)類(lèi)動(dòng)物叫聲分類(lèi)任務(wù)中奪得國際第三名。音頻分類(lèi)是語(yǔ)音領(lǐng)域一個(gè)重要的方向,應用場(chǎng)景非常廣泛,如檢測環(huán)境噪聲、特殊音頻場(chǎng)景和事件,在智能家居、智慧城市等行業(yè)都有重要應用。
      ComParE是Interspeech系列評測之一,在語(yǔ)音領(lǐng)域屬于重量級評測。語(yǔ)音是語(yǔ)言的聲音表現形式,不僅包含了語(yǔ)言語(yǔ)義信息,同時(shí)也傳達了說(shuō)話(huà)人、語(yǔ)種、性別、年齡、情感、信道、嗓音、病理、生理、心理等多種豐富的副語(yǔ)言語(yǔ)音屬性信息。ComParE的目的就是識別或檢測各類(lèi)副語(yǔ)言語(yǔ)音屬性,如情感識別、哭聲檢測、嗓音病理識別、方言語(yǔ)種識別等。
      作為聯(lián)想智能語(yǔ)音技術(shù)核心研發(fā)團隊,聯(lián)想研究院人工智能實(shí)驗室語(yǔ)音團隊已經(jīng)構建了全鏈自研語(yǔ)音技術(shù)棧,全面賦能聯(lián)想的智能設備、智能化服務(wù)和行業(yè)智能化解決方案。
      兩篇語(yǔ)音技術(shù)論文鏈接,歡迎訪(fǎng)問(wèn):
      1.The DKU-Duke-Lenovo System Description for theFearless Steps Challenge Phase III:
      https://www.isca-speech.org/archive/pdfs/interspeech_2021/wang21i_interspeech.pdf
      2.The 2020 Personalized Voice Trigger Challenge:Open Database, Evaluation Metrics and the Baseline Systems:
      https://www.isca-speech.org/archive/pdfs/interspeech_2021/jia21b_interspeech.pdf
    【免責聲明】本文僅代表作者本人觀(guān)點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對文中陳述、觀(guān)點(diǎn)判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

    專(zhuān)題

    CTI論壇會(huì )員企業(yè)

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 得荣县| 江都市| 察雅县| 辛集市| 海丰县| 贵阳市| 香港 | 乌恰县| 油尖旺区| 昭苏县| 印江| 双江| 德钦县| 萨迦县| 溧阳市| 中阳县| 南岸区| 彭泽县| 南宫市| 大竹县| 衡水市| 岳池县| 长阳| 南康市| 西畴县| 赤壁市| 西藏| 民乐县| 疏勒县| 竹北市| 凌源市| 芜湖县| 高安市| 霸州市| 当阳市| 阿克苏市| 尉氏县| 阳泉市| 保康县| 怀来县| 金昌市| http://444 http://444 http://444 http://444 http://444 http://444