語(yǔ)音轉寫(xiě)(ASR)引擎,是將客戶(hù)輸入的語(yǔ)音文件進(jìn)行轉寫(xiě),向客戶(hù)返回文本結果的一種AI能力工具。為呼叫中心而生的語(yǔ)音轉寫(xiě)引擎,源自客戶(hù)的期待。
2018年,一些客戶(hù)陸續找到天潤融通,他們的需求非常簡(jiǎn)單——電話(huà)語(yǔ)音轉寫(xiě)。這些客戶(hù)大多屬于業(yè)務(wù)場(chǎng)景復雜多元,擁有自己的呼叫中心或業(yè)務(wù)系統,他們希望根據自身業(yè)務(wù)的實(shí)際需求,自行對文本做分析。基于對天潤融通慧智平臺的了解,許多客戶(hù)知道天潤融通具備轉寫(xiě)服務(wù)能力,所以希望能對接轉寫(xiě)引擎,幫助他們完成轉寫(xiě),再通過(guò)業(yè)務(wù)系統做文本分析。
近年來(lái),天潤融通深入行業(yè)場(chǎng)景,收集客戶(hù)需求,不斷探索智能語(yǔ)音轉寫(xiě)在呼叫中心的落地應用,經(jīng)過(guò)技術(shù)沉淀與積累,語(yǔ)音轉寫(xiě)商用實(shí)踐超過(guò)3500萬(wàn)分鐘。通過(guò)技術(shù)與產(chǎn)品的持續演進(jìn)與優(yōu)化,天潤融通語(yǔ)音轉寫(xiě)引擎擁有更大的并發(fā)量、更快的轉寫(xiě)速度和更靈活的彈性,行業(yè)轉寫(xiě)模型的生產(chǎn)能力不斷加強。基于此,天潤融通轉寫(xiě)引擎全面開(kāi)放。
語(yǔ)音轉寫(xiě)三大需求
客戶(hù)對語(yǔ)音轉寫(xiě)的需求主要體現在語(yǔ)音轉寫(xiě)識別準確率、隨需而變的彈性和成本控制三方面。
語(yǔ)音轉寫(xiě)識別準確率是質(zhì)檢、分析的基礎。語(yǔ)音屬于非結構化的數據,無(wú)法進(jìn)行檢索和分析。轉寫(xiě)所要做的就是將語(yǔ)音這類(lèi)非結構化數據,轉化為結構化數據,也就是文本信息。文本信息可被檢索,提取關(guān)鍵詞進(jìn)行分析。但如果轉寫(xiě)識別不夠精準,即使轉寫(xiě)完成,也會(huì )影響數據分析的成效,所以要求轉寫(xiě)識別準確率必須達到較高水平。
客戶(hù)所需的轉寫(xiě)引擎還要具備隨需而變的彈性,以滿(mǎn)足業(yè)務(wù)需求。比如,客戶(hù)第一天可能轉寫(xiě)70小時(shí)的語(yǔ)音文件,但第二天業(yè)務(wù)量激增,轉寫(xiě)量會(huì )從70小時(shí)上漲到400小時(shí),這就要求轉寫(xiě)引擎在響應速度和轉寫(xiě)效率上不受任何影響,能夠彈性擴容。
成本控制。假如企業(yè)呼叫中心有100小時(shí)的錄音需要轉寫(xiě),以傳統人工聽(tīng)錄音方式,需要專(zhuān)門(mén)組建一支團隊。但現在,只需要通過(guò)天潤融通開(kāi)放的轉寫(xiě)引擎,就能直接將語(yǔ)音自動(dòng)轉寫(xiě)成文本,節省大量的人力成本投入。
攜手打造呼叫中心專(zhuān)用轉寫(xiě)引擎
位于北京中關(guān)村的天潤融通新技術(shù)實(shí)驗室里,坐滿(mǎn)了研發(fā)人員和大量輔助機器學(xué)習的年輕人。實(shí)驗室與科大訊飛、阿里等一流AI技術(shù)企業(yè)合作,基于人工智能底層技術(shù),結合客戶(hù)的語(yǔ)音文件進(jìn)行模型訓練,最終打造一個(gè)專(zhuān)注于呼叫中心行業(yè)場(chǎng)景的轉寫(xiě)引擎。客戶(hù)若要使用轉寫(xiě)引擎,只需通過(guò)接口方式,發(fā)起一個(gè)轉寫(xiě)任務(wù)。轉寫(xiě)完成后,客戶(hù)可通過(guò)回調來(lái)接收轉寫(xiě)內容,簡(jiǎn)單、高效,易操作。
天潤融通語(yǔ)音轉寫(xiě)引擎專(zhuān)為呼叫中心而生。目前,市面上主流的語(yǔ)音轉寫(xiě)服務(wù)商側重點(diǎn)各有不同,雖然底層技術(shù)發(fā)展逐漸成熟,但大多為通用型轉寫(xiě)模型,對具有行業(yè)屬性的企業(yè)來(lái)說(shuō),轉寫(xiě)識別率提升慢,文本效用相對較低。
天潤融通基于10多年扎根呼叫中心的服務(wù)經(jīng)驗,深諳以“話(huà)務(wù)”為基礎的呼叫中心業(yè)務(wù)場(chǎng)景。采用私有化部署保障客戶(hù)數據的安全,基于海量語(yǔ)音數據,針對客戶(hù)的專(zhuān)用詞和行業(yè)術(shù)語(yǔ)做長(cháng)期優(yōu)化,為企業(yè)提供專(zhuān)屬語(yǔ)音轉寫(xiě)訓練模型,提高轉寫(xiě)識別率。
雙軌錄音、電話(huà)語(yǔ)音采樣為8K赫茲、通話(huà)雙方情緒、自然語(yǔ)言交流,是呼叫中心業(yè)務(wù)場(chǎng)景特征,基于這些特征開(kāi)發(fā)符合行業(yè)實(shí)際使用需要的轉寫(xiě)引擎,包括轉寫(xiě)文本區分說(shuō)話(huà)方,針對電話(huà)語(yǔ)音采樣的轉寫(xiě)識別率,整理符合場(chǎng)景的話(huà)術(shù)對機器進(jìn)行訓練,以此來(lái)提高企業(yè)呼叫中心語(yǔ)音轉文本的實(shí)際效用。目前不僅支持天潤融通系列產(chǎn)品生成的通話(huà)錄音轉寫(xiě),還支持第三方呼叫中心語(yǔ)音轉寫(xiě)。
自上線(xiàn)以來(lái),天潤融通語(yǔ)音轉寫(xiě)引擎已覆蓋保險、企業(yè)服務(wù)和新零售等多個(gè)行業(yè),為眾安保險、BOSS直聘、多點(diǎn)等企業(yè)客戶(hù)提供了高效的語(yǔ)音轉寫(xiě)服務(wù)。現在開(kāi)通,贈送免費轉寫(xiě)時(shí)長(cháng),歡迎試用。更多詳情,請咨詢(xún)1010-9099.

