主持人
謝磊
西北工業(yè)大學(xué)計算機學(xué)院教授、博導,音頻語(yǔ)音與語(yǔ)言處理研究組負責人
謝磊
西北工業(yè)大學(xué)計算機學(xué)院教授、博導,音頻語(yǔ)音與語(yǔ)言處理研究組負責人

活動(dòng)開(kāi)場(chǎng),由西工大謝磊教授主持,對CSRC競賽做了重點(diǎn)回顧。SLT2021CSRC參賽隊伍共計超過(guò)50家,分別來(lái)自美國、印尼、新加坡和中國等不同地區的科研高校、機構和廠(chǎng)商。經(jīng)過(guò)3個(gè)月的激烈角逐,賽道一前三名分別由上海交通大學(xué)、遼寧鼎漢奇輝電子系統工程有限公司、網(wǎng)易有道信息技術(shù)(北京)有限公司摘得,而賽道二冠軍分別由Ethiopian隊伍(小米、小冰和Seasalt AI)、東芝中國、浙江核心同花順摘得。與此同時(shí)競賽論文已發(fā)布在賽事官網(wǎng)(點(diǎn)擊了解https://www.data-baker.com/system_description.html)。恭喜以上參賽隊伍。
賽道一冠軍隊伍—上海交通大學(xué)
《SJTU SpeechLab ASR System Description for SLT 2021 CSRC Challenge》
《SJTU SpeechLab ASR System Description for SLT 2021 CSRC Challenge》

賽道一冠軍來(lái)自上海交大,比賽CER為18.50%。針對本次賽事,上海交大圍繞模型結構參數、encoder預訓練方法、數據增廣、模型在童聲上的適應調優(yōu)、以及解碼策略做重點(diǎn)剖析。為同賽道隊伍帶來(lái)精彩分享。
賽道二冠軍隊伍—“Ethiopian”
由小米、小冰和SeasaltAILLC等3家公司員工組成
《Data Augmentation For Children's Speech Recognition》
由小米、小冰和SeasaltAILLC等3家公司員工組成
《Data Augmentation For Children's Speech Recognition》

賽道二冠軍隊伍為“Ethiopian”,其成員代表閆志勇圍繞比賽策略、數據擴增、Kaldi框架、ESPnet模型結構與調參等做重點(diǎn)分享。最終CER成績(jì)16.53%,獲得該賽道冠軍。
謝磊·西北工業(yè)大學(xué)
《面向端側部署的流式端到端語(yǔ)音識別技術(shù)》
《面向端側部署的流式端到端語(yǔ)音識別技術(shù)》

謝磊教授圍繞當前熱門(mén)端到端的語(yǔ)音識別課題做分享,包括端到端語(yǔ)音識別介紹、主流的RNN-T模型、Cascade RNN-T模型、Unified模型和應用工具包Wenet等,讓大家看到端到端的語(yǔ)音模型在端側設備進(jìn)行部署應用的潛力。
歐智堅
清華大學(xué)電子工程系副教授、博士生導師,
《基于直通梯度的端到端語(yǔ)音識別神經(jīng)架構搜索》
清華大學(xué)電子工程系副教授、博士生導師,
《基于直通梯度的端到端語(yǔ)音識別神經(jīng)架構搜索》

歐智堅教授帶來(lái)了最新的研究課題,讓大家了解到當前學(xué)術(shù)研究重點(diǎn)和未來(lái)方向。從CTC-CRF模型入手引出ST-NAS(基于直通梯度的神經(jīng)網(wǎng)絡(luò )架構搜索),包括研究動(dòng)機、相關(guān)工作、方法本身和應用結果等方面做了詳細介紹。
黃辰
美團高級算法專(zhuān)家
《語(yǔ)音技術(shù)在美團中應用》
美團高級算法專(zhuān)家
《語(yǔ)音技術(shù)在美團中應用》

黃辰圍繞美團語(yǔ)音技術(shù)及其在業(yè)務(wù)中應用做重點(diǎn)介紹,包括美團語(yǔ)音技術(shù)構成、語(yǔ)音架構體系、ASR模型詳情等內容,并舉例語(yǔ)音助手、語(yǔ)音智能分析、外呼機器人等技術(shù)產(chǎn)品在相關(guān)場(chǎng)景的落地應用,讓大家對美團語(yǔ)音有更清楚的了解與認識。語(yǔ)音技術(shù)連接用戶(hù)、商家與平臺,價(jià)值突出。
湯志遠
貝殼找房資深算法工程師
《貝殼找房的語(yǔ)音技術(shù)應用與研究》
貝殼找房資深算法工程師
《貝殼找房的語(yǔ)音技術(shù)應用與研究》

圍繞貝殼語(yǔ)音基本能力、應用現狀及其研究熱點(diǎn)做分享。貝殼基本語(yǔ)音技術(shù)能力包括語(yǔ)音前端處理、語(yǔ)音識別、聲紋識別、情緒識別、語(yǔ)音合成、口音識別、口語(yǔ)評測等,以AI機器人服務(wù)于貝殼經(jīng)紀人和客戶(hù)。湯志遠通過(guò)小貝助手、VR語(yǔ)音帶看、語(yǔ)音智能硬件、VR訓練場(chǎng)、直播看房、智能客服等產(chǎn)品案例,讓大家詳細了解了貝殼語(yǔ)音的相關(guān)應用。
吳本谷
標貝科技語(yǔ)音算法負責人
《數據服務(wù)技術(shù),技術(shù)服務(wù)數據》
標貝科技語(yǔ)音算法負責人
《數據服務(wù)技術(shù),技術(shù)服務(wù)數據》

吳本谷介紹,由于兒童天然對語(yǔ)音的使用友好,加上大多數公司的基礎模型缺少兒童數據,導致當前兒童語(yǔ)音識別是行業(yè)難點(diǎn),標貝科技希望為行業(yè)研究應用與溝通交流搭建平臺,因而標貝聯(lián)合多家機構共同舉辦賽事。除了兒童數據,標貝科技一如既往的為當前包括智能硬件、車(chē)載、內容審核等熱門(mén)語(yǔ)音場(chǎng)景提供語(yǔ)料支持。標貝科技擁有全方位采集標注能力,具有專(zhuān)業(yè)的服務(wù)合作和項目執行流程體系,通過(guò)自研技術(shù)創(chuàng )新輔助數據工場(chǎng)、語(yǔ)音平臺等產(chǎn)品,提升數據服務(wù)質(zhì)量與效率。截至目前,標貝已累計服務(wù)客戶(hù)超過(guò)350余家,擁有豐富的數據服務(wù)項目經(jīng)驗。
點(diǎn)擊鏈接:https://www.bilibili.com/video/BV15N411o7JL/,觀(guān)看活動(dòng)視頻回訪(fǎng)
需要嘉賓ppt,關(guān)注“標貝科技”官方公眾號,留下姓名-學(xué)校/機構名稱(chēng)-機構郵箱等聯(lián)系方式,會(huì )有專(zhuān)人發(fā)送
關(guān)于標貝科技
標貝科技是一家專(zhuān)注于智能語(yǔ)音交互和AI數據服務(wù)的人工智能公司,擁有業(yè)內領(lǐng)先的AI語(yǔ)音交互技術(shù)及高精度數據采標處理技術(shù),創(chuàng )新打造多場(chǎng)景應用的語(yǔ)音交互解決方案,包括聲音復刻、標貝悅讀、AI虛擬人等在內的語(yǔ)音交互產(chǎn)品;數據業(yè)務(wù)包括語(yǔ)音合成、語(yǔ)音識別、語(yǔ)義理解、計算機視覺(jué)等采標服務(wù)和數據眾包平臺-數據工場(chǎng)。
作為一家以AI技術(shù)創(chuàng )新驅動(dòng)的企業(yè),標貝科技堅持“語(yǔ)音連接場(chǎng)景、數據服務(wù)技術(shù)“的理念,通過(guò)有溫度、個(gè)性化的語(yǔ)音交互方案,讓人機交互變得更美好、更簡(jiǎn)單。目前,標貝科技已與微軟、百度、阿里、騰訊、京東、滴滴、字節跳動(dòng)、網(wǎng)易、三星等國內外百余家企業(yè)客戶(hù)建立合作,服務(wù)項目累計超過(guò)600項,涵蓋汽車(chē)、教育、客服、零售、閱讀、智能硬件等多個(gè)領(lǐng)域。