劉澤陽(yáng):各位下午好!很高興代表云之訊來(lái)參加CTI論壇主辦的交流活動(dòng),我接到這個(gè)主題之后,就在想給大家分享一些什么樣的內容,能讓大家有所收獲,而不僅僅是作為一個(gè)乙方來(lái)推廣產(chǎn)品和應用。今天我想給大家分享,云之訊在探索人工智能、大數據過(guò)程中,遇到的問(wèn)題和收獲,以及人工智能這個(gè)技術(shù)在呼叫中心領(lǐng)域有哪些可以實(shí)現的比較好的應用。“AI+通訊,智能通訊服務(wù)平臺助力客服產(chǎn)業(yè)升級”是我此次分享的主題,下面我給大家匯報一下。
云之訊一直以來(lái)在通信行業(yè)做深根,后來(lái)隨著(zhù)市場(chǎng)的逐步變革,云之訊也轉型到企業(yè)通訊,向這個(gè)行業(yè)領(lǐng)域去探索、去進(jìn)軍。云之訊基于公司在通信行業(yè)的積累,以及在云計算、大數據方面的探索,我們定義自己為通信能力服務(wù)平臺,這個(gè)平臺其實(shí)是融合了人工智能、大數據、融合了安全管控中心,來(lái)幫助客戶(hù)解決他們的問(wèn)題。
在基礎技術(shù)的應用上,如語(yǔ)音合成、語(yǔ)音識別、大數據分析,這幾個(gè)在時(shí)下都非常火熱的人工智能詞匯,目前,我們已經(jīng)具備。而這些技術(shù)的應用,會(huì )產(chǎn)生怎樣的火花?通過(guò)在通信平臺上的集成,我們其實(shí)有4個(gè)主要應用,第一個(gè)是在2018年非常火爆的智能客服機器人,其次是智能通知、智能安全管理,最后一個(gè)是智能碼號狀態(tài)監測,就像剛才劉博濤劉總(電話(huà)邦副總裁)講到的,通過(guò)號碼的標識,我們可以提升在呼叫過(guò)程中的效率。而我們的目標和愿景是把這些能力開(kāi)放給全社會(huì )的呼叫中心企業(yè)。
在多年的發(fā)展過(guò)程中,我們服務(wù)了很多標桿企業(yè),包括頂尖的互聯(lián)網(wǎng)巨頭、保險、銀行,以及證券、物流這些行業(yè)企業(yè),他們在呼叫中心方面都與我們有廣泛的合作。
下面分享一下我們對現在的AI包括通訊這個(gè)行業(yè)的看法和思考。之前在探索AI的過(guò)程中,我們總覺(jué)得它是一個(gè)玩具,不能商用,而隨著(zhù)AI技術(shù)的進(jìn)步,尤其是在2017年底-2018年的發(fā)展過(guò)程中,它從一個(gè)高高在上的技術(shù)逐漸走上了商業(yè)化的道路。從2018年開(kāi)始,AI在呼叫中心這個(gè)行業(yè)的商業(yè)化進(jìn)展是非常迅速的,我們看到在整個(gè)行業(yè)內出現了幾百家AI外呼企業(yè),而反過(guò)來(lái),商業(yè)化也是可以驅動(dòng)技術(shù)的成長(cháng)和前進(jìn)的。我們在跟客戶(hù)交流的時(shí)候,幾乎所有的客戶(hù)都愿意去嘗試,看看這個(gè)機器人可以帶來(lái)什么樣的效果。然而在這個(gè)過(guò)程中我們也發(fā)現了一些問(wèn)題,在座都是行業(yè)內的,業(yè)內在試用過(guò)之后覺(jué)得它好像未必可以達到我們理想的狀態(tài)。那人工智能+通訊到底有沒(méi)有用呢?答案是肯定的,但是我們要選擇它適合的場(chǎng)景,它能做什么,我們就讓它做什么。隨著(zhù)技術(shù)的不斷革新,這種情況會(huì )變得更好。
目前,它所應用的行業(yè)有教育、汽車(chē)、金融、房產(chǎn)等,客戶(hù)服務(wù)和營(yíng)銷(xiāo)外呼,都在這些行業(yè)中。我們認為現在呼叫中心產(chǎn)業(yè)迎來(lái)了第五代產(chǎn)業(yè)升級,第一代呼叫中心它可能基于傳統硬件,像華為,是傳統硬件的一個(gè)代表,可能在2010年之前以傳統硬件為主。后面的軟件+硬件,我們稱(chēng)之為第二代呼叫中心。第三代是純軟件的時(shí)代,在2010年的時(shí)候,純軟件的呼叫中心,由于受限于一些技術(shù)上的瓶頸,它在通話(huà)質(zhì)量以及各種能力上并沒(méi)有達到當時(shí)的商用水平,但是隨著(zhù)軟件化的逐漸提升,有了第三代。第四代是多媒體,第五代是人工智能呼叫中心。那第五代呼叫中心需要具備哪些能力呢?有大數據的能力、業(yè)務(wù)應用的能力以及AI的能力。在這幾方面的能力,云之訊都有一些積累,并且可以把這些服務(wù)提供出來(lái)。其實(shí)人工智能在語(yǔ)音識別,在文本,在語(yǔ)音轉文字,在智能識別,在知識圖譜還有圖片識別各個(gè)方面都有了階段性的突破,AI將會(huì )引領(lǐng)第五代呼叫中心的產(chǎn)業(yè)升級。
下面我給大家介紹一下,在這樣的大背景下,人工智能和通訊結合的具體應用場(chǎng)景,就是我們前面講到的4個(gè)應用場(chǎng)景。
第一個(gè)是智能對話(huà)機器人的場(chǎng)景,在這個(gè)工程中,有很多同仁都已經(jīng)體驗過(guò)這個(gè)機器人,它會(huì )面臨很多問(wèn)題,比如說(shuō)訓練過(guò)程復雜。我了解到像某銀行的信用卡中心,它做智能客服的時(shí)候,有12000個(gè)需要完成的問(wèn)題,每一個(gè)問(wèn)題有5100個(gè)相似的,基本需要半年的時(shí)間去訓練,如果不經(jīng)過(guò)訓練好像未必能達到我們想要的效果。因為有一句話(huà)講得比較有道理:人工智能有多少產(chǎn)品,產(chǎn)品就會(huì )有多少智能。第二個(gè)影像效果,語(yǔ)音識別的技術(shù),我接觸過(guò)很多這種做語(yǔ)音識別的,像傳統的廠(chǎng)家,其實(shí)會(huì )有一個(gè)問(wèn)題,他們在做實(shí)體機器人的時(shí)候,如銀行的實(shí)體機器人、醫院的實(shí)體機器人,還有電話(huà)機器人,他們遇到的最大的問(wèn)題是,語(yǔ)音識別準確率并沒(méi)有達到要求,很多時(shí)候會(huì )受到環(huán)境噪聲的影響。什么時(shí)候你打斷,什么時(shí)候你不打斷呢?環(huán)境噪聲該把它識別到什么,降噪要降到什么程度,還有反應速度慢,這些都是行業(yè)中普遍遇到的問(wèn)題。
云之訊是怎么思考這些問(wèn)題的呢?其實(shí)在智能機器人,語(yǔ)音識別,還有可視化的流程設計中,我們可以把業(yè)務(wù)的訓練從業(yè)務(wù)端轉化到客戶(hù)這一側。我們推出了自己的核心模塊,用模塊組成,盡可能緩解我們面臨的問(wèn)題。
下面主要介紹跟大家一下在這些模塊中我們遇到的像NLU意圖識別,我們是怎么解決的。在人工智能這個(gè)領(lǐng)域,我們會(huì )跟很多做語(yǔ)音識別的公司交流,比如說(shuō)像追一,像三角獸,我們發(fā)現傳統的AI大部分是應用于超大型的客戶(hù),他們會(huì )投入很長(cháng)的時(shí)間去做機器人的嘗試。但是現在社會(huì )上僅僅是他們需要嗎?其實(shí)有很多中型企業(yè)或者小型企業(yè)也面臨這樣的訴求。我們之前在NLU遇到的主要問(wèn)題,這些傳統的廠(chǎng)商更多是在單一的行業(yè)做深耕,將機器人訓練成非常聰明的狀態(tài)。假設我要提供產(chǎn)品化的服務(wù),我怎么辦?云之訊就做了這樣一個(gè)NLU意圖分層的邏輯,這個(gè)比較好理解,我們針對各個(gè)不同的行業(yè),每個(gè)場(chǎng)景都有一個(gè)自己全行業(yè)的通用數據庫,它是基于很豐富的語(yǔ)料訓練和積累,經(jīng)過(guò)長(cháng)期的沉淀,獲得的一個(gè)行業(yè)通用數據庫。針對每一個(gè)數據庫,假設他進(jìn)來(lái)的話(huà),我把他作為一個(gè)意圖分層中的分支,它的FAQ是怎么樣的,對于同樣一個(gè)詞的理解,它的意圖一定是要分區塊。然后再下一層去區分具體的客戶(hù)分層,這樣其實(shí)可以大大地減少企業(yè)做訓練的周期,給企業(yè)做成一個(gè)產(chǎn)品化的服務(wù),而非項目式的服務(wù)。我們經(jīng)過(guò)了幾層,在多輪對話(huà)的時(shí)候看有沒(méi)有上下輪關(guān)聯(lián),是基于關(guān)鍵字,還有搜索近似匹配這兩個(gè)模塊。統計模型是基于復雜場(chǎng)景。最后是實(shí)現意圖的分化和匹配,到各個(gè)不同行業(yè)的意圖庫里面。我們逐步優(yōu)化每一個(gè)庫,形成一個(gè)強大的NLU知識儲備,有知識儲備這個(gè)機器人才能成為智能可用的機器人。NLU是逐步強大的,公共庫越強,我們的產(chǎn)品能力就越強。
這是我們服務(wù)保險客戶(hù)的場(chǎng)景--保險續費,有很多保險公司都很在意這個(gè)成本。我們當時(shí)跟保險客戶(hù)聊的時(shí)候,他們已經(jīng)把續費環(huán)節從人工客服的環(huán)節去掉了,這主要是出于節省成本的考慮。我們跟他們聊了機器人之后,他們發(fā)現在續費的場(chǎng)景是可以用得到的。在續費場(chǎng)景,機器人會(huì )查詢(xún)在一個(gè)月內即將到期的客戶(hù),比如說(shuō)車(chē)險到期了需要續費,可能客戶(hù)自己不會(huì )想到這一點(diǎn)。然后機器人就需要根據客戶(hù)信息合成話(huà)術(shù),自動(dòng)提醒客戶(hù)應繳費信息,如某某先生,你的保費已到期,現在需要幫您代扣,您是否接受這樣的代扣。在這個(gè)過(guò)程中,客戶(hù)需要有全部的名字,并且保存錄音,作為日后查證的一個(gè)依據。第三步是機器人根據反饋的信息做一個(gè)標記,“你幫我續費”,“你不需要幫我續費”,“我不需要了”,出現幾種不同類(lèi)型的客戶(hù)。如果客戶(hù)答復說(shuō)可以扣款,就可以直接調用銀行的接口扣款。對于其他類(lèi)型的的客戶(hù),再轉到人工去受理這個(gè)業(yè)務(wù)。在這個(gè)過(guò)程中,我們通過(guò)智能機器人的中心不斷去優(yōu)化錄音,優(yōu)化管理和訓練,去提升整個(gè)機器人的智能度。這個(gè)場(chǎng)景非常好,給客戶(hù)帶來(lái)的效果也非常好。
下一個(gè)場(chǎng)景是智能通知。我們發(fā)現,在今年7月份的時(shí)候,智能通知的百度搜索量翻了2-3倍。在高度市場(chǎng)化的過(guò)程中,大家都積極探索人工智能能夠應用在哪些方面,相比機器人,智能通知更加簡(jiǎn)潔,它只是根據一段錄音,來(lái)實(shí)現跟客戶(hù)意向度的溝通,或者是通知型、生產(chǎn)型的這種。那智能通知現在的痛點(diǎn)是什么呢?其實(shí)好多客戶(hù)都需要文字轉語(yǔ)音,他們面臨的問(wèn)題,是失真程度很大。根據我們了解來(lái)看,目前市面上所有的TTS技術(shù)都沒(méi)辦法做到跟人一模一樣,機器的聲音給用戶(hù)的體驗是非常不好的。我們是怎么做的呢?我們通過(guò)人工智能技術(shù)去把機械化的聲音變得更加智能,更加像人說(shuō)話(huà),這樣可以給客戶(hù)更好的體驗。應用場(chǎng)景像催收、快遞用得比較多。
這里我講的是TTS的同音同色技術(shù)。市面上很多公司可能也在做,像阿里,在TTS同音同色的上面也下了很多功夫。TTS技術(shù),所有的文字轉成的語(yǔ)音其實(shí)都是有一個(gè)音色庫,像百度地圖有林志玲的聲音,這些聲音并不是林志玲說(shuō)的,他們只是把她的聲音提取參數,通過(guò)文字轉語(yǔ)音去實(shí)現了同音同色。我們在變量和實(shí)際錄音的時(shí)候,沒(méi)辦法通過(guò)人去錄,而是將文字去轉的聲音和人工來(lái)錄的聲音結合,如“某某先生,你下個(gè)月需要還款多少錢(qián)”,中間溝通是人錄音,而人名、時(shí)間、錢(qián)數,則是通過(guò)同音同色技術(shù)實(shí)現的,它可以使TTS變量聽(tīng)起來(lái)像人一樣去溝通,這樣客戶(hù)體驗比較好。
現在TTS有兩種方式去實(shí)現,第一種是我們講的拼接法,第二種是參數法。參數法是我剛剛講的林志玲給百度地圖做的方式,提取林志玲的參數,它的音色是怎么樣,基于電子來(lái)合成。這個(gè)是現在比較節約成本的方式,因為你只要大概知道這個(gè)音色,然后把它轉化出來(lái)就好。我們現在采用的是拼接法,它有好處和壞處,它的好處是,在變量比較少的時(shí)候,可以通過(guò)拼接法來(lái)完成一個(gè)短的通知,假設這個(gè)內容非常的長(cháng),非常的復雜,拼接法在字與字的停頓中會(huì )有一些問(wèn)題。但是在智能通知場(chǎng)景中,它通知的無(wú)非是十幾二十秒的對話(huà),我們基于這種場(chǎng)景包裝了自己智能通知的產(chǎn)品,支持選擇音色,有自己的錄音室,有自己的音色庫,去給客戶(hù)做這種催收、物流、取餐語(yǔ)音通知等,對這個(gè)感興趣的到時(shí)候可以找我們體驗一下。
我們在催收場(chǎng)景大概是這樣的:1、TTS音色庫錄音師預先完成主要通話(huà)內容錄音,把常用的錄下來(lái)。大家可能不一定了解,其實(shí)所有的聲音一共有1604個(gè)音調,可能有的字是相同的。2、我們把這個(gè)內容去做一個(gè)音色庫,當客戶(hù)提出這個(gè)需求的時(shí)候,就把他想表達的內容通過(guò)人工再去錄音,再加上調用的音色庫變量,實(shí)現催收欠費的通知。這樣給人的感受不會(huì )像機器一樣很生硬,我們現在對這一點(diǎn)非常關(guān)注。如果讓大家感覺(jué)非常生硬,企業(yè)根本不會(huì )去嘗試這個(gè)產(chǎn)品。客戶(hù)滿(mǎn)意度比他實(shí)現這個(gè)內容更加重要。
下面是大家都會(huì )關(guān)注的安全。我們把咱們工信部發(fā)的要求和規范提取出來(lái)了,首要的就是嚴格規范業(yè)務(wù),這個(gè)信息明確可回溯,包括呼叫規范,杜絕虛假號碼,這個(gè)大家了解得比較多了。
我們其實(shí)是把通話(huà)過(guò)程分到幾類(lèi)。第一個(gè)主叫是誰(shuí)?這個(gè)是偏管理型的,包括主叫注冊用戶(hù)的認證和號碼報備,或者你要求他允許你去回放他。第二是被叫,被叫涉及到數據庫的能力。有些用戶(hù)他可能比較喜歡投訴,比較喜歡標記,建立一個(gè)龐大的數據庫,對我們的呼叫中心的業(yè)務(wù)本身幫助是很大的。云之訊現在有600萬(wàn)的免打擾用戶(hù),這些用戶(hù)是在各種環(huán)節中,他可能表達了自己不愿意接聽(tīng)這個(gè)電話(huà),或者他可能接上你的電話(huà)會(huì )標記你,這個(gè)是一個(gè)很大量的數據積累,我們做得時(shí)間比較久,在這方面積累比較多。基于此,會(huì )誕生黑名單和意向度比較高的客戶(hù)白名單。第三個(gè)是通話(huà)過(guò)程。我們在做短信的安全監控的時(shí)候,其實(shí)它相對要簡(jiǎn)單一些,因為短信的傳輸是明文傳輸,在這個(gè)過(guò)程中,對于垃圾短信,我們能很快過(guò)濾它的內容。但是語(yǔ)音是聲音,它不是文字,怎么辦?我們就把它轉化成文字,一個(gè)是基于錄音的監聽(tīng),第二個(gè)基于語(yǔ)音識別的技術(shù),把通話(huà)內容實(shí)時(shí)轉化成文字,及時(shí)識別它在這個(gè)過(guò)程中所表達的傾向。“請轉賬5000萬(wàn)”,這個(gè)可能是詐騙電話(huà),可以通過(guò)與通信層的聯(lián)通,呼叫控制,把這個(gè)通話(huà)掛斷,保護客戶(hù)的財產(chǎn)安全。第四個(gè)是關(guān)鍵指標。關(guān)鍵指標是有一個(gè)行為分析的,包括呼叫頻次、平均通話(huà)時(shí)長(cháng),還有應答率的評估等。通過(guò)分析,我們可能發(fā)現外呼的用戶(hù)并不是他們的注冊用戶(hù),有可能是盲打。我們基于各種信息的監控,實(shí)現系統上的安全。
要實(shí)現這個(gè)邏輯是我們有自己的錄音平臺,云之訊可以給所有客戶(hù)提供錄音服務(wù)。在這個(gè)過(guò)程中,我們有語(yǔ)音識別引擎,對錄音文件進(jìn)行實(shí)時(shí)的分析和檢索,同時(shí)推送到我們的大數據中心,和呼叫控制中心。在大數據中心,我們看到這個(gè)結果,如果不達標就要整改。而在呼叫中心控制,我們可以及時(shí)地去避免很多不安全行為的發(fā)生。我們其實(shí)是把人工智能和通信給連接起來(lái)了,以此凈化我們的環(huán)境,給我們一個(gè)綠色、健康、規范的語(yǔ)音通話(huà)環(huán)境。
下面這個(gè)是我們系統的展示,我們可以根據用戶(hù)的通話(huà)內容標識出通話(huà)重點(diǎn),如分期、信用卡、還款等。我們在這里分類(lèi)的趨勢,有敏感詞,有教育培訓,有詐騙的敏感詞,這些分析出來(lái)以后,可以分等級,一級二級三級四級,對于非常敏感的要立即處理,對于其他的則可以提示他去改進(jìn)他的業(yè)務(wù)。另外我們在提供服務(wù)的時(shí)候,有些客戶(hù)比如說(shuō)他是做貸款業(yè)務(wù)的,可能他又跑了一個(gè)催收的業(yè)務(wù),系統可以甄別客戶(hù)使用的真實(shí)行業(yè)。假如客戶(hù)報備實(shí)名制的資料跟他所使用的通話(huà)并不匹配,一個(gè)拿了房地產(chǎn)的資質(zhì),卻做了金融的業(yè)務(wù),系統就可以發(fā)現,馬上杜絕掉。
剛才講的安全中心的能力,是第三個(gè)場(chǎng)景,第四個(gè)場(chǎng)景是號碼狀態(tài)的檢測。據了解,在2018年6月份,全國放出去的號段已經(jīng)有40.2萬(wàn)個(gè),整個(gè)號碼容量有40多億,我們按人均一個(gè)號碼可能只有12億個(gè)在正常使用,其中有大量的無(wú)效號碼。在這個(gè)過(guò)程中,我們的客戶(hù)服務(wù)效率很低,因為我們發(fā)現有些客戶(hù)呼叫接通率沒(méi)那么高,很大的原因是有些客戶(hù)已經(jīng)銷(xiāo)號了,但是他還在聯(lián)系。在這個(gè)時(shí)候,我們通過(guò)人工智能的技術(shù)就可以完成一個(gè)號碼狀態(tài)的識別和檢測。這里要講一個(gè)技術(shù)背景,在實(shí)際情況中,運營(yíng)商的反饋其實(shí)并不能標識客戶(hù)到底是關(guān)停,未接通還是信號不好,它可能只會(huì )給你回一個(gè)408錯誤。而我們可以給客戶(hù)提供一個(gè)基于號碼狀態(tài)識別的精準服務(wù),我可以告訴你,你打了這些號碼,他是關(guān)機或者空號或者停機,有的正在通話(huà)中你可以下次去聯(lián)系他,有的客戶(hù)是不是換了其他的號碼,這些都是基于號碼可以做的運營(yíng)的事情。
這個(gè)背后的技術(shù)并不復雜,我們基于大數據的積累,在通話(huà)的數據量基礎上,分析哪些客戶(hù)是通的,哪些客戶(hù)反饋是不對的。這個(gè)積累,比如說(shuō)發(fā)短信有回復,運營(yíng)商完全是知道用戶(hù)的狀態(tài)是什么,我們調用了三大運營(yíng)商的接口。在判斷碼號狀態(tài)的時(shí)候運用語(yǔ)音識別,通話(huà)的回鈴音這個(gè)數據是可以被采集到的,這個(gè)內容里面都是標準的普通話(huà),所以它的識別率和精準率非常高,可以達到99%以上。號碼現在處在什么狀態(tài),我們都可以反饋給你。
基于此我們有哪些應用呢?第一個(gè)應用是空號檢測。第二個(gè)是號碼狀態(tài)識別,關(guān)機,不在服務(wù)區,可以反饋。第三個(gè)是實(shí)名認證。最后一個(gè)是羊毛黨的檢測,根據碼號行為分析,辨別出哪些是羊毛黨,哪些是正常的優(yōu)質(zhì)的用戶(hù),幫助企業(yè)規避業(yè)務(wù)風(fēng)險。
接下來(lái)我要談的是能力開(kāi)放。其實(shí)云之訊在這么久的技術(shù)積累中,也是通過(guò)不斷地探索和實(shí)踐,然后有了這些技術(shù)方面的能力和基礎,包括在A(yíng)I,在大數據,在安全,在基本通訊能力上。我們非常愿意把這些開(kāi)放給整個(gè)行業(yè),所有的能力都提供一個(gè)開(kāi)放的API接口,因為云之訊不止是軟件服務(wù)的提供商,我們還希望成為一個(gè)服務(wù)能力的提供商。很多企業(yè)有自己的呼叫中心,有自己的能力,但是它又不想在通信,在人工智能上投入過(guò)多,這個(gè)時(shí)候就可以調用我們的接口。我們把接口的能力賦能給相應的合作伙伴,比如像語(yǔ)音識別,包括NLP、語(yǔ)音理解的,基于關(guān)鍵字的,基于神經(jīng)網(wǎng)絡(luò )的機器人學(xué)習的技術(shù),以及話(huà)術(shù)能力,各行業(yè)的知識庫,還有通信方面的,像955,代理商運營(yíng)商的能力開(kāi)放。我們支持所有能力向全行業(yè)開(kāi)放,支持大家去調用。
人工智能這個(gè)技術(shù)在高速地發(fā)展過(guò)程中,我們會(huì )面臨各種各樣的問(wèn)題和困難。但是我們看到人工智能從阿爾法狗到現在的智能機器人,它是在不斷提升和改變的。人工智能+通訊+數據會(huì )產(chǎn)生怎么樣的化學(xué)反應,在呼叫中心行業(yè)里,我們可以一起去嘗試,去探索。我們現在可以提供第五代的全能力的呼叫中心系統,也歡迎大家能跟我們一起來(lái)合作,一起來(lái)溝通,一起來(lái)進(jìn)步。謝謝各位!以上是我的分享。