2009/04/15
CTI論壇(ctiforum)04月15日消息: 2009年4月14日至15日,CTI論壇主辦2009中國呼叫中心及企業(yè)通信大會(huì )在北京國際會(huì )議中心隆重召開(kāi),會(huì )議展開(kāi)三十多場(chǎng)精彩紛呈的演講,邀請了一批業(yè)界知名專(zhuān)家在會(huì )上發(fā)表演說(shuō),以下是主題演講現場(chǎng)圖文報道:
安徽科大訊飛信息科技股份有限公司 吳曉如
這個(gè)是我們叫做呼叫導航的系統,大家可以看到這個(gè)下拉菜單是用戶(hù)希望得到的服務(wù),但是我們這個(gè)服務(wù)列得不是很全。如果我們希望得到一項服務(wù),我家的煤氣費沒(méi)錢(qián)了,我想交一點(diǎn)煤氣費。大家可以看到,我可以以比較自由的方式,告訴IVR一件什么事情呢?就是我家的媒體費沒(méi)錢(qián)了,我要交煤氣費。在以前傳統的IVR的按鍵上,你可能需要按3、4次,但是現在用戶(hù)只需要說(shuō)他的需求。
我們再來(lái)看一個(gè)。
(演講人演示,說(shuō):"我想把定期的儲蓄轉成活期的", 菜單自動(dòng)跳轉到:定期轉活期)
我想把定期的儲蓄轉成活期的。這個(gè)演示實(shí)際上是給大家介紹一個(gè)什么叫做呼叫導航,與之前的基于命令的識別有什么差別。它可以給我們的呼叫中心起到一個(gè)什么幫助。
在這種基于自由說(shuō)話(huà)的呼叫導航中,我們的用戶(hù)不用這么痛苦,必須記住我們的菜單名稱(chēng)。我們在設計我們的菜單的時(shí)候,我們整個(gè)呼叫中心的管理者,也不需要設計一個(gè)非常復雜的菜單。實(shí)際說(shuō)準確的呼叫導航是怎么做到的呢?叫做特定語(yǔ)音的語(yǔ)音識別,如果要語(yǔ)音識別,對于識別每一個(gè)字是很困難的,但是對于我們銀行的語(yǔ)音菜單是很簡(jiǎn)單的。即使1、2個(gè)字發(fā)生的困難,對于我們最后的解析也可以讓它理解我們最后用戶(hù)的需求是什么。所以,語(yǔ)音導航用戶(hù)只需要做什么事情呢?只需要說(shuō)說(shuō)你的需求。
我們說(shuō)的呼叫中心,剛才說(shuō)怎么讓我們的呼叫中心變得更加聰明。第二個(gè)問(wèn)題是呼叫中心還面臨一個(gè)挑戰,當前的呼叫中心轉成成本中心,在一些用戶(hù)轉向呼叫中心做一些實(shí)際業(yè)務(wù)的時(shí)候,如何讓我們的呼叫中心變得更加安全。以我們銀行的呼叫中心,電話(huà)銀行是大家非常信任的業(yè)務(wù)的手段,但是有很多安全須知,千萬(wàn)不要泄露你的帳號、密碼,如果你泄露了你可能會(huì )很痛苦,你的財產(chǎn)會(huì )受到損失。對于這方面,我們的語(yǔ)音技術(shù)能不能做一些工作,使我們的呼叫中心變得更加安全呢?目前的語(yǔ)音識別可以使我們的呼叫中心在風(fēng)險控制方面得到很大的幫助。
如果我們的座席人員了解他家里面每一個(gè)家人的聲音那么熟悉去了解用戶(hù)的聲音,對于座席人員有點(diǎn)難,幾乎不可能完成。但是語(yǔ)音識別可以做到,實(shí)際上我們對于我們的用戶(hù)和座席,在說(shuō)話(huà)的過(guò)程當中我們可以實(shí)時(shí)監控。如果發(fā)現當前的通話(huà)是一個(gè)可疑的對話(huà),可以告知座席,座席可以采取銀行要求他采取的步驟,這樣可以加強我們的風(fēng)險控制。
對于有一些用戶(hù),我們實(shí)際上在他做這個(gè)業(yè)務(wù)的過(guò)程中,我們可以采用一些,吸入說(shuō)聲紋系統,對于他的聲紋進(jìn)行實(shí)時(shí)的監控,如果沒(méi)有聲紋識別,我們可以提醒這個(gè)用戶(hù)提高安全級別。
聲紋識別是辨別說(shuō)話(huà)人身份的一項技術(shù),通話(huà)人說(shuō)的可以是特定的內容,也可以說(shuō)一些任意無(wú)關(guān)的內容。
其中兩個(gè)最關(guān)鍵的技術(shù),一個(gè)是聲紋確認,比如說(shuō)這個(gè)用戶(hù)是某某帳號的聲紋,他說(shuō)話(huà)的時(shí)候可以跟語(yǔ)音庫里的聲音進(jìn)行對照。開(kāi)始我不知道你這個(gè)用戶(hù)是誰(shuí),你進(jìn)來(lái)之后我看你是不是屬于特殊的群體,比如說(shuō)是我們銀行需要關(guān)注的黑名單。這樣的話(huà),這個(gè)人在通話(huà)的過(guò)程中,我們可以和目標聲紋庫里的聲紋模板進(jìn)行匹配。如果是可疑分子,我們要通知銀行注意這個(gè)業(yè)務(wù)當中有風(fēng)險。
實(shí)際上大家對于語(yǔ)音識別前期也在關(guān)注,但是我們覺(jué)得一個(gè)成功的語(yǔ)音識別有很多的核心技術(shù)。我們不但針對命令詞,而且對于連續的語(yǔ)音也可以識別,而且我們語(yǔ)音識別可以有很好的排除干擾的能力。同時(shí),我們的語(yǔ)音識別應該有語(yǔ)義解析,正確理解一個(gè)人說(shuō)話(huà)的目的。
語(yǔ)音識別在實(shí)際的應用中,它會(huì )面臨不同的口音、不同的應用環(huán)境,需要我們對使用中大規模的語(yǔ)音數據通過(guò)語(yǔ)音模型進(jìn)行訓練,使我們可以排除不同的噪音。
實(shí)際上,所有的語(yǔ)音識別的技術(shù)都是基于統計的。如果我們了解過(guò)不同的口音、不同的信道地之后就可以很好地處理這些不同的數據,一些不同口音的影響。
科大訊飛我們在全國建了4個(gè)聯(lián)合實(shí)驗室,在中國科技大學(xué)、清華大學(xué)、社科院語(yǔ)言所、國家普通話(huà)測試站中心,最后會(huì )整合成我們最后的語(yǔ)音合成、語(yǔ)音識別、聲紋識別等等。
另外,對于我們相關(guān)很重要的處理語(yǔ)音識別所需要的口音、信道,目前我們在全國省級電信運營(yíng)商部署的音樂(lè )搜索等大規模語(yǔ)音識別業(yè)務(wù)已超過(guò)50個(gè),覆蓋不同地域等,使我們的語(yǔ)音識別可以應用于不同的環(huán)境。
自助式的語(yǔ)音服務(wù)之前一直是按鍵加錄音,TTS技術(shù)的出現,使我們的語(yǔ)音呼叫是按鍵+TTS。我們語(yǔ)音導航可以進(jìn)入ASR&TTS,用戶(hù)的需求不但可以通過(guò)3鍵和9鍵。
我們科大訊飛是語(yǔ)音技術(shù)領(lǐng)域唯一的國家863計劃產(chǎn)業(yè)化基地、國家規劃布局內重點(diǎn)軟件企業(yè)、國家級企業(yè)技術(shù)中心。中國語(yǔ)音市場(chǎng)占有率最高達到了70%,同時(shí)我們代表工信部制定語(yǔ)音技術(shù)的國家標準,目前我們有700人左右,設有博士后的工作站在全國有4個(gè)聯(lián)合實(shí)驗室,公司是在去年的5月份在深交所正式發(fā)行上市。
科大訊飛的中文語(yǔ)音合成技術(shù),在理歷屆的國內、國際的評測中都名列第一。2006年和2008年我們參加了全球英文語(yǔ)音技術(shù)合成大賽,我們也連續三年蟬聯(lián)了第一名。在這里,我簡(jiǎn)單地把我們的語(yǔ)音合成技術(shù),簡(jiǎn)單地做一個(gè)演示。
同時(shí),我們的語(yǔ)音合成可以提供不同的音樂(lè )和語(yǔ)種。目前,我們的音樂(lè )合成技術(shù)首先整合了我們06到08年三年比賽的成果,同時(shí)我們的產(chǎn)品可以支持各種主流的語(yǔ)種,同時(shí)可以支持不同的方言音色,合成系統可以有男女老少各種因素供我們用戶(hù)選擇。
為了使我們相關(guān)的產(chǎn)品可以在主流行業(yè)有更好的效果,我們針對像電信、金融等一些主流的行業(yè)進(jìn)行專(zhuān)門(mén)的優(yōu)化,可以提供專(zhuān)業(yè)的優(yōu)化版本。同時(shí),我們的系統還提供了多種實(shí)用的特性,它不僅僅是是文本轉語(yǔ)音,還可以進(jìn)行音頻的管理,可以進(jìn)行日志的管理和動(dòng)態(tài)的重啟。
比如說(shuō)你分散式部署IVR的系統,你可以把所有的提示音通過(guò)我們TTS的音頻管理進(jìn)行統一的安排,這樣各地的IVR的服務(wù)器,可以通過(guò)FTP、HTTP的格式進(jìn)行轉換。
聲紋識別目前在國際上最有名的技術(shù)評測是美國的國家標準技術(shù)研究院,每年會(huì )舉行一次大規模的聲紋識別大賽。科達訊飛在2008年我們參加了這次評測,這次評測包含了國際上像MIT和斯坦福參加的比賽,我們取得了第一名。這有一個(gè)識別錯誤里,如果有100個(gè)人想冒充別人,我發(fā)生錯誤的是3個(gè),我可以抓住97個(gè)。這次比賽也表明了我們科大訊飛在識別方向上我們是國際領(lǐng)先。
目前,我們的語(yǔ)音識別除了目前已經(jīng)在各地電信廣泛音樂(lè )搜索中所使用的命令識別,你一說(shuō)一個(gè)歌曲的名稱(chēng)我就可以幫你下載下來(lái),我們目前有成熟的呼叫導航,可以進(jìn)行語(yǔ)義的解析,同時(shí)我們可以提供相關(guān)的語(yǔ)音搜索和檢索。以后有大量的音視頻的呼叫,怎么管理,我們可以制定一些語(yǔ)音的標簽,使我們搜索的時(shí)候更加方便。
實(shí)際上我們說(shuō)了很多不同的語(yǔ)音服務(wù)的模塊,聽(tīng)上去很多,但是應用起來(lái)非常方便。
我們有多種的語(yǔ)音合成,多種的語(yǔ)音識別,我們的聲紋識別引擎等等。所有這些我們都可以通過(guò)統一的網(wǎng)絡(luò )平臺技術(shù)封裝。這種封裝既可以通過(guò)之前各個(gè)廠(chǎng)商非常熟悉的接口形式進(jìn)行封裝,也可以通過(guò)最新的基于SIP的、MRCP的服務(wù)進(jìn)行統一的管理。用戶(hù)無(wú)論使用什么引擎都可以得到我們的語(yǔ)音管理的服務(wù)。
目前我們這種平臺已經(jīng)可以支持華為、Avaya、思科等眾多的平臺,可以支持眾多主流的操作系統。我們科大訊飛有著(zhù)非常完備的研發(fā)和質(zhì)量體系,早在2006年的12月份我們就通過(guò)了CMMI L4評估認證,目前我們也是首個(gè)國家的標準試點(diǎn)基地。
目前,我們在全國24個(gè)主要的城市設有子公司和辦事處,可以為我們所有的合作伙伴和用戶(hù)提供非常完備的技術(shù)支持和服務(wù)。
科大訊飛在去年5月份上市以后,也是成立了我國第一家以語(yǔ)音技術(shù)為主要產(chǎn)業(yè)化方向的上市公司。在當前比較惡劣的經(jīng)濟環(huán)境下,科大訊飛受到了股市和分析師非常好的評價(jià),去年11月份開(kāi)始我們中小版上升了60%,我們大概上升了140%。我們現在的股價(jià)大概維持在30多元。其中股價(jià)只是很表面的表現,最主要的原因是各個(gè)行業(yè)的分析師,對于語(yǔ)音技術(shù)的水平,以及語(yǔ)音技術(shù)各個(gè)行業(yè)的廣泛應用,表示高度的認可。我們也希望我們不斷提供最優(yōu)的語(yǔ)音技術(shù),我們期待和我們的產(chǎn)業(yè)、呼叫中心相關(guān)的產(chǎn)業(yè)能夠合作共贏(yíng)、共同發(fā)展。我的介紹就到這里,謝謝大家!
本文根據CTI論壇主辦的2009中國呼叫中心及企業(yè)通信大會(huì )會(huì )議記錄整理,轉載請注明出處!
CTI論壇報道