1、系統現狀
隨著(zhù)人工智能技術(shù)的不斷進(jìn)步,及近年來(lái)保險、證券等行業(yè)的飛速發(fā)展,傳統金融服務(wù)模式已經(jīng)難以全方位滿(mǎn)足用戶(hù)需求。為更好的滿(mǎn)足用戶(hù)多樣化的金融服務(wù)需求,提升用戶(hù)體驗,實(shí)現降本增效,引入智能語(yǔ)音交互技術(shù)已成為行業(yè)趨勢。用戶(hù)可以使用語(yǔ)音進(jìn)行交互,并獲得其所需的服務(wù)結果。
為打造智能語(yǔ)音交互新功能,實(shí)現機器“聽(tīng)懂”人類(lèi)語(yǔ)言,將語(yǔ)音信號轉變?yōu)橄鄳谋荆枰胫悄苷Z(yǔ)音技術(shù)與自身業(yè)務(wù)及智能服務(wù)相結合,建立智能語(yǔ)音平臺。
2、建設目標
本次項目建設內容整體包括AI+語(yǔ)音平臺軟件的搭建部署,平臺能支撐客戶(hù)系統在A(yíng)SR語(yǔ)音識別和TTS語(yǔ)音合成等方面的需要。
構建AI+語(yǔ)音平臺,提供語(yǔ)音識別、語(yǔ)音合成等實(shí)現與多種人工智能能力的靈活組合與掛接,并提供豐富的接口與客戶(hù)系統進(jìn)行平滑對接,實(shí)現量身定制的語(yǔ)音交互平臺級系統服務(wù),方便各渠道前端敏捷迭代開(kāi)發(fā)調用。
AI+語(yǔ)音平臺通過(guò)語(yǔ)音識別、語(yǔ)音合成等能力,實(shí)現對接客戶(hù)系統實(shí)現高頻業(yè)務(wù)改造,支持客戶(hù)以語(yǔ)音方式進(jìn)行交互,實(shí)現各種智能化業(yè)務(wù)應用。
AI+語(yǔ)音平臺將語(yǔ)音合成、語(yǔ)音識別和聲紋識別等無(wú)縫的集成在同一個(gè)系統架構中,降低運維成本,提高利用率。
總體方案

1、方案概述
圖片AI+語(yǔ)音平臺整體分為平臺接入層、平臺能力層和平臺服務(wù)層,其中平臺接入層和平臺服務(wù)層面向客戶(hù)提供能力和服務(wù)的整體集成解決方案。AI+語(yǔ)音平臺可提供統一的AI能力,實(shí)現共享和按需配置,以及產(chǎn)品應用和能力的解耦,方便部署和靈活對接。同時(shí),智能語(yǔ)音技術(shù)平臺統一建設和規劃,可以起到統一優(yōu)化資源、統一發(fā)布服務(wù)、統一進(jìn)行業(yè)務(wù)接入的益處,做到一次建設,多處受益,構建新型的服務(wù)能力平臺。結合實(shí)際業(yè)務(wù)狀況,重點(diǎn)提供語(yǔ)音識別、語(yǔ)音合成核心能力。
以云服務(wù)的方式為應用終端提供語(yǔ)音服務(wù),通過(guò)集成標準的SDK控件,為最終用戶(hù)提供語(yǔ)音、自然語(yǔ)言理解、圖像等人工智能應用。
2、組網(wǎng)說(shuō)明

從上述圖中可以看到,用戶(hù)的請求進(jìn)入AI+語(yǔ)音平臺時(shí),首先防火墻要對其進(jìn)行安全性檢查,以保證系統的正常穩定運行。之后用戶(hù)的請求將送至接入服務(wù)器,接入服務(wù)器會(huì )根據用戶(hù)請求的業(yè)務(wù)類(lèi)型,如語(yǔ)音合成、語(yǔ)音識別等,并結合系統負載均衡策略,將請求分發(fā)至業(yè)務(wù)服務(wù)器。業(yè)務(wù)服務(wù)器先解析用戶(hù)請求,將用戶(hù)請求和業(yè)務(wù)相關(guān)的信息存儲至數據庫,加載業(yè)務(wù)資源,調用相應的語(yǔ)音引擎服務(wù)器,將請求響應結果返回給接入服務(wù)器,接入服務(wù)器進(jìn)一步返回給用戶(hù)。在此架構中,系統運行管理服務(wù)器會(huì )實(shí)時(shí)監測到所有服務(wù)器節點(diǎn)的運行狀態(tài)。
運營(yíng)優(yōu)化方案
核心效果優(yōu)化主要包含對智能語(yǔ)音平臺語(yǔ)音合成、語(yǔ)音識別、語(yǔ)義和聲紋效果優(yōu)化等幾個(gè)方面。
- 合成效果優(yōu)化:通過(guò)對發(fā)言參數的調整,可以對語(yǔ)速、流程性等一系列關(guān)鍵參數進(jìn)行調整,結合預錄音等方式,使語(yǔ)音合成播報效果更加流暢飽滿(mǎn),貼合滿(mǎn)足業(yè)務(wù)應用要求;
- 語(yǔ)音識別優(yōu)化:主要是對實(shí)測數據進(jìn)行詳盡分析,擴展測試集、訓練集,擴充說(shuō)法、提升語(yǔ)料覆蓋度等方法,重點(diǎn)解決反饋的一些單點(diǎn)問(wèn)題,分析影響識別效果的原因,若是聲學(xué)層面導致的,則補充進(jìn)行音頻數據標注和優(yōu)化訓練,若是語(yǔ)言層面,則通過(guò)擴充覆蓋度、增大句式概率等進(jìn)行效果調優(yōu)。

為了實(shí)現AI+語(yǔ)音平臺項目要求,云翌結合目前項目的現狀,準備通過(guò)持續的運營(yíng)優(yōu)化不斷提升服務(wù)應用效果與定制化配合。主要通過(guò)業(yè)務(wù)應用保障和能力效果優(yōu)化等手段對該系統進(jìn)行優(yōu)化,持續迭代以保證語(yǔ)音能力效果的穩定性、可靠性及優(yōu)良性。根據應用場(chǎng)景的不同,差異化保障和支撐各業(yè)務(wù)效果指標。
關(guān)于云翌
上海云翌通信科技有限公司總部位于上海市浦東軟件園世博分園,致力于向社會(huì )企事業(yè)單位提供自主研發(fā)的VoIP全系列通信產(chǎn)品。包括統一通信、智能呼叫中心、IP指揮調度、云平臺等產(chǎn)品及方案。
公司是上海市雙軟認定企業(yè)、重點(diǎn)高新技術(shù)企業(yè)。公司核心管理與研發(fā)團隊均為通信行業(yè)內從業(yè)十年以上的資深人士,在IP融合通信、行業(yè)應用、云平臺等領(lǐng)域有著(zhù)豐富的專(zhuān)業(yè)經(jīng)驗。公司產(chǎn)品充分利用Internet和全球IP互聯(lián)的環(huán)境,提供比傳統業(yè)務(wù)更全面、更專(zhuān)業(yè)的服務(wù)解決方案。
公司成立以來(lái),已經(jīng)成功為上萬(wàn)家企事業(yè)單位提供通信解決方案,超高的性?xún)r(jià)比以及全面的定制服務(wù)贏(yíng)得了用戶(hù)的一致認可。