
為了讓更多有障礙同學(xué)能夠參與其中,交流會(huì )引入了捷通華聲提供的“靈云智錄”智能語(yǔ)音轉寫(xiě)系統,可將講演者的發(fā)言實(shí)時(shí)轉寫(xiě)成文字上屏,精準的識別效果引發(fā)一致好評。
“這是我第一次親身感受到,人工智能技術(shù)所帶來(lái)的便捷。”一名負責組織交流會(huì )的志愿者說(shuō)道,“有了這個(gè)智錄系統,再組織尤其是有聽(tīng)力障礙人士參加的活動(dòng)時(shí),會(huì )議的溝通真變得‘無(wú)障礙’了。”
靈云智錄系統現場(chǎng)轉寫(xiě)效果
此前,靈云智錄系統已經(jīng)在去年的無(wú)障礙發(fā)展國際學(xué)術(shù)大會(huì )成功應用,受到現場(chǎng)各國研究學(xué)者、清華師生及各界人士高度好評。
無(wú)障礙國際大會(huì )現場(chǎng)轉寫(xiě)效果
在一些有殘障人士參與的會(huì )議中,尤其是有聽(tīng)力障礙的人士,“聽(tīng)會(huì )”成為了巨大的問(wèn)題。靈云智錄系統可以讓會(huì )議現場(chǎng)的發(fā)言實(shí)時(shí)以字幕的形式展現出來(lái),一方面便捷、加快了會(huì )議的交流,另一方面也極大地方便了聽(tīng)力障礙人士。
清華交流會(huì )上應用的靈云智能轉錄系統,采用靈云最新一代語(yǔ)音識別技術(shù),擁有超快的轉寫(xiě)速度和超高的準確率,對不同口音、語(yǔ)速的發(fā)言人都能輕松適配,面對遠場(chǎng)講話(huà)等場(chǎng)景亦能準確識別并轉寫(xiě)。系統可實(shí)現會(huì )議場(chǎng)景的現場(chǎng)語(yǔ)音轉錄、發(fā)言實(shí)時(shí)上屏、離線(xiàn)錄音轉寫(xiě)、語(yǔ)音自動(dòng)合成播報、實(shí)時(shí)編輯、關(guān)鍵詞優(yōu)化等多種功能。
實(shí)時(shí)語(yǔ)音轉寫(xiě):通過(guò)多個(gè)話(huà)筒預設發(fā)言人角色,系統可將每個(gè)人的發(fā)言實(shí)時(shí)轉寫(xiě)并分別呈現在系統中,極大地方便了多角色會(huì )議記錄。
除了支持中文普通話(huà),系統也可支持四川話(huà)、廣東陽(yáng)江話(huà)、粵語(yǔ)以及維吾爾語(yǔ)、英語(yǔ)、哈薩克語(yǔ)、藏語(yǔ)安多、藏語(yǔ)康巴、朝鮮語(yǔ)、蒙文等多種語(yǔ)言的轉寫(xiě),并針對金融、電信、公檢法、會(huì )議、醫療等領(lǐng)域訓練了專(zhuān)用ASR模型,可根據自身企業(yè)需求進(jìn)行定制。

在線(xiàn)實(shí)時(shí)編輯:記錄人員根據實(shí)時(shí)轉寫(xiě)的內容,可在編輯框里實(shí)時(shí)對語(yǔ)音轉寫(xiě)輸出的文字內容進(jìn)行修改、刪除、替換,使會(huì )議記錄更為準確、精煉。
發(fā)言實(shí)時(shí)上屏:針對不同會(huì )議的需求,系統可將實(shí)時(shí)語(yǔ)音轉寫(xiě)的結果,以彈幕的形式展現在大屏上,方便現場(chǎng)聽(tīng)會(huì )者閱讀。

離線(xiàn)錄音轉寫(xiě):歷史錄音文件針可直接導入系統進(jìn)行轉寫(xiě),系統支持wma/wav/mp3/m4a/amr等多種格式音頻,轉寫(xiě)結果支持錄音文字同步調聽(tīng)矯正,讓錄音整理者可快速完成文字校核。
語(yǔ)音合成播報:系統為會(huì )議主持者提供語(yǔ)音合成服務(wù),可通過(guò)輸入文字,選擇男聲、女聲等不同的音色,完成廣播音頻合成。通過(guò)采用深度神經(jīng)算法的語(yǔ)音合成技術(shù),合成的聲音清晰優(yōu)美、抑揚頓挫,滿(mǎn)足會(huì )議會(huì )場(chǎng)廣播等各種場(chǎng)景需求。
文本訓練優(yōu)化:針對不同行業(yè)、不同會(huì )議場(chǎng)景,系統可以預先進(jìn)行語(yǔ)音識別模型的優(yōu)化訓練,并在會(huì )前預先導入與會(huì )議相關(guān)的文字材料,或直接輸入人名、地名、專(zhuān)業(yè)術(shù)語(yǔ)等關(guān)鍵詞進(jìn)行優(yōu)化,從而提高專(zhuān)業(yè)領(lǐng)域會(huì )議的語(yǔ)音識別準確率。
“讓每家企業(yè)都擁有人工智能,讓人工智能像‘水和電’一樣便捷服務(wù)大眾無(wú)處不在”一直都是捷通華聲的企業(yè)愿景,清華交流會(huì )上靈云智錄系統成功服務(wù)殘障人士即是一次典型的AI技術(shù)落地應用。捷通華聲將繼續專(zhuān)注于A(yíng)I技術(shù)與產(chǎn)品的研發(fā),不斷深入行業(yè)了解需求,開(kāi)發(fā)更多能夠“落地應用”的產(chǎn)品與方案,從而讓更多人享受到人工智能所帶來(lái)的輕松與便捷。