由CTI論壇(www.yshhuang.com)主辦的2017中國客戶(hù)體驗創(chuàng )新大會(huì )<http://www.yshhuang.com/expo/2017/awards2017/index.html>于9月14日在深圳益田威斯汀酒店盛大開(kāi)幕,本次會(huì )議以"在聯(lián)絡(luò )中心數字化轉型中搶得先機"為主題,北京神州泰岳軟件股份有限公司AI大數據副總裁張瑞飛應邀出席此次會(huì )議并發(fā)表題為《無(wú)人值守智能客服中心》的主題演講。張瑞飛介紹了泰岳無(wú)人客服方案,包括:智能機器人虛擬坐席,多輪會(huì )話(huà),知識管理,語(yǔ)音質(zhì)檢,語(yǔ)義質(zhì)檢,場(chǎng)景化應用,智能IVR導航,工單機器學(xué)習,對接業(yè)務(wù)流程引擎及客服智能運維,以及同合作伙伴聯(lián)合打造無(wú)人客服生態(tài)。
張瑞飛:大家好!我接下來(lái)的半個(gè)小時(shí)給大家介紹一下神州泰岳無(wú)人值守的客服中心的解決方案。我們人工智能發(fā)展到現在到底有沒(méi)有可能形成真正無(wú)人值守的客戶(hù)中心的方式這是比較有爭議的,最近兩年我們做越來(lái)越多的工作,我們看到有越來(lái)越多輪工智能的東西在逐漸取代我們比較傳統的用人來(lái)實(shí)現的操作。這些內容當它越來(lái)越多的時(shí)候,我們想是不是真的有一天有可能逐漸代替人的10%的工作量,20%,甚至50%的工作量。這樣我們把人工智能技術(shù)的核心結合其他的流程技術(shù)、數據技術(shù),把它合成在一起,跟我們的客服中心的合作伙伴在一起,我們想打造無(wú)人值守的客服中心。我們在金融和稅務(wù)兩個(gè)行業(yè)在進(jìn)行嘗試,我們發(fā)現用人工智能方式做虛擬座席和虛擬服務(wù)窗口的時(shí)候,效率和準確率超出人們比較繁瑣工作流程的工作限度,減少工作時(shí)間,提高生產(chǎn)效率。
簡(jiǎn)單介紹參與研究的人員,我們給這些人員做一個(gè)致謝。首先是李生教授,他是咱們國內第一個(gè)獲得國際ACL國際語(yǔ)言協(xié)會(huì )的終身成就獎的第一個(gè)科學(xué)家,是哈工大的黨委書(shū)記。也是人工智能研究院的名譽(yù)院長(cháng),是我們的首席科學(xué)家。顏永紅教授是Intel做人機界面的總架構師,是中科院的科學(xué)家,主要負責語(yǔ)言學(xué)和聲學(xué)研究部分。趙慶衛教授是中科院聲學(xué)所的研究員,推出的語(yǔ)音識別和語(yǔ)音上面具體的應用場(chǎng)景。晉耀紅博士是我們人工智能研究院的院長(cháng),是原北京師范大學(xué)的博士生導師,他在語(yǔ)義里面曾經(jīng)參與過(guò)HAC概念層次網(wǎng)絡(luò )的語(yǔ)義研究,是當時(shí)跟著(zhù)中科院的團隊,是研究組的組長(cháng),提出一些不同的概念分詞和語(yǔ)義分局的方法。我們把這個(gè)方法用在現在人工智能平臺里面,去構建OEC平臺。蔣宏飛博士是原來(lái)阿里做訓練的訓練小組的專(zhuān)家,他在我們這邊負責小富機器人的開(kāi)發(fā)。這是我們的核心研究團隊。
無(wú)人值守的客服系統,傳統的電話(huà)服務(wù)和無(wú)人值守的智能服務(wù),我們想代替傳統電話(huà)不足的地方,可能是用戶(hù)體驗和用戶(hù)24小時(shí)接聽(tīng)電話(huà)的能力,他的感知和傳統IVR繁瑣的操作,我們想在其中優(yōu)化的地方。我們想做智能客服,但是智能客服和無(wú)人值守的客服中心還是有一點(diǎn)不一樣:1、智能客服沒(méi)有辦法有效解決口語(yǔ)標準化的問(wèn)題。2、多輪會(huì )話(huà)的場(chǎng)景里面表現不好。3、不能對復雜邏輯和復雜的業(yè)務(wù)流程進(jìn)行有效的診斷。4、缺乏語(yǔ)義糾錯的能力。我們講傳統的智能客服只是在以前的客服里面部分注入人工智能的能力,并沒(méi)有形成基于人工智能形成判斷和形成虛擬座席的能力。
我們的設計原則:在客服中心問(wèn)答的時(shí)候,我們想做到一步到位的精確語(yǔ)義理解。在進(jìn)行人機智能會(huì )話(huà)的時(shí)候進(jìn)行自由調整,人機會(huì )話(huà),我們設想由機器和人進(jìn)行互動(dòng)和回答問(wèn)題的時(shí)候,無(wú)論問(wèn)題涉及其他的場(chǎng)景或者這個(gè)問(wèn)題涉及到要辦的業(yè)務(wù),比如要辦理一個(gè)房貸,買(mǎi)保險或者申請信用卡,無(wú)論什么樣的業(yè)務(wù),我們希望在會(huì )話(huà)的過(guò)程中進(jìn)行自由跳轉。智能問(wèn)答除了渠道界面,更需要處理業(yè)務(wù)和保留歷史記憶來(lái)進(jìn)行多輪會(huì )話(huà)的能力,我們在這個(gè)能力上取得一定突破,才取得無(wú)人客服的概念。
無(wú)人客服并不是我們現在提得很新的話(huà)題,京東本身去年的時(shí)候開(kāi)始嘗試京東無(wú)人客服,我們這里講和京東的區別,我們發(fā)現一些在銀行或者是稅務(wù)或者政府、企業(yè)里面應用的企業(yè)級客服重要需要的,不是消費型市場(chǎng)的客服中心需要的東西,比如我們的業(yè)務(wù)流程需要更強的定制,比如我們對個(gè)人的肖像需要更好的面向企業(yè)的管理,這是企業(yè)里面不同的,我們打造的是面向企業(yè)級大B的生產(chǎn)端的無(wú)人構成。技術(shù)架構,基于文本語(yǔ)義交互式引擎和智能語(yǔ)音交互式引擎,對語(yǔ)音系統和語(yǔ)義系統分別做解析。智能客服接入網(wǎng)關(guān)對各個(gè)業(yè)務(wù)進(jìn)行各個(gè)接口,比如銀行,存貸款、理財等等業(yè)務(wù)的流程接口。部署架構,我們通過(guò)語(yǔ)音PBX系統,進(jìn)入IVR,在IVR對接無(wú)人值守客服系統,再生成語(yǔ)音,再和CTI系統進(jìn)行交互。
這樣的會(huì )話(huà)架構里面,我們需要能夠進(jìn)行智能交互的引擎結構,這個(gè)和傳統機器人不一樣,我們分五層:知識學(xué)習、知識引擎本身的建設、問(wèn)答引擎、對話(huà)引擎、場(chǎng)景引擎,這里面分五層進(jìn)行管理,所以它不再是我們單一的機器人,只是智能問(wèn)答的交互引擎,是知識構建到最上層管理的完整功能。具體的組件,包括推薦學(xué)習、地圖學(xué)習、閑聊學(xué)習、場(chǎng)景關(guān)聯(lián)、碎片化的業(yè)務(wù)能力的架構和業(yè)務(wù)要素的了解,概念的理解以及會(huì )話(huà)歷史和會(huì )話(huà)間的記憶,會(huì )話(huà)和場(chǎng)景的關(guān)聯(lián)。這里面的能力有這樣幾個(gè):1、我們如何進(jìn)行相關(guān)意圖的學(xué)習,有時(shí)候我們的人類(lèi)自然問(wèn)法背后隱藏的是概念化的語(yǔ)義表示,比如我們說(shuō)能吃多少吃多少,能吃多少吃多少,重音不同意思不同。這是結合語(yǔ)音和語(yǔ)義一起做到的。2、知識加工,如何讓機器人去學(xué)習到一個(gè)業(yè)務(wù),我們以前做機器人智能問(wèn)答的時(shí)候,有一個(gè)標準問(wèn)答,對應一些答案,做出擴展。一個(gè)標準問(wèn)對應1200個(gè)擴展問(wèn),這個(gè)概念在現在的無(wú)人值守的客服中心里面可能要顛覆掉,首先不能以問(wèn)答來(lái)理解語(yǔ)義和用戶(hù)的業(yè)務(wù)系統。我們要有入口告訴機器人怎么學(xué)會(huì )業(yè)務(wù)知識,然后我們構建業(yè)務(wù)框架的東西,在這上面通過(guò)跟機器人的會(huì )話(huà),首先交給一個(gè)機器人業(yè)務(wù)知識。這是傳統給人工座席的培訓,當我的一個(gè)人工座席來(lái)的時(shí)候,我應該講我的業(yè)務(wù)框架和業(yè)務(wù)要素,以前的機器人是沒(méi)有的,只有問(wèn)答,這個(gè)不夠,所以把這個(gè)補起來(lái)了。3、我們對概念歸一化的講解,我們在嘗試能不能直接把問(wèn)題和答案自動(dòng)匹配,在銀行或者在特定的應用場(chǎng)景里面,我們讓擴展問(wèn)消失,這樣機器人維護過(guò)程中,我們就可以基于純粹的人工智能的語(yǔ)義技術(shù)來(lái)進(jìn)行維護,這種場(chǎng)景到底可不可能發(fā)生,我們嘗試做這樣的場(chǎng)景。我們也做了測試,最近在上海銀行,我們做了兩輪:一是帶擴展問(wèn)測試。二是把所有擴展問(wèn)刪掉的測試,兩輪測試效果都很好。4、話(huà)題站的管理,話(huà)題記憶管理和場(chǎng)景管理,后面分別說(shuō)。
整個(gè)構成,無(wú)人值守的智能客服交互式架構,從知識學(xué)習到線(xiàn)下訓練到線(xiàn)上的知識的發(fā)布,這是完整的框架。
技術(shù)特色,語(yǔ)音識別,我們做了幾個(gè)特定功能:1、如何將連續的語(yǔ)音能夠自動(dòng)轉換為文字,這里面主要用到的算法是大家看到的雙向LSTM的深度學(xué)習神經(jīng)網(wǎng)絡(luò )的算法,利用這個(gè)算法我們把這個(gè)速度做到比國際開(kāi)源軟件快5倍以上,基于WFST的語(yǔ)音和語(yǔ)音特點(diǎn)和句法進(jìn)行整合的識別技術(shù)。通過(guò)這個(gè)實(shí)現人機交互和人人交互,準確率分別是90%和80%,我們在單臺服務(wù)器處理并發(fā)語(yǔ)音。人機交互是手機打電話(huà)是最常見(jiàn)的人機交互,我們的語(yǔ)音進(jìn)入到手機,在手機里面進(jìn)行識別。人人交互是通過(guò)電信的線(xiàn)路來(lái)進(jìn)行語(yǔ)音識別,他們主要的區別在于對音質(zhì)的線(xiàn)路損耗和后臺處理算法的差別。
2、關(guān)鍵詞的檢索,對用戶(hù)的敏感詞、業(yè)務(wù)詞、提供詞和與說(shuō)話(huà)人無(wú)關(guān)的詞,還有支持電話(huà)、網(wǎng)絡(luò )和互聯(lián)網(wǎng)的自然語(yǔ)言的對話(huà)來(lái)進(jìn)行關(guān)鍵詞的檢索,保證在講話(huà)的時(shí)候,第一個(gè)是合規,第二個(gè)是在質(zhì)檢的時(shí)候有些使用。
3、通過(guò)對語(yǔ)音進(jìn)行語(yǔ)音、語(yǔ)速、輕重音以及語(yǔ)音相關(guān)概念的層次分析,通過(guò)層次分析理解基本音頻,以及語(yǔ)調之間的相關(guān)性,這是基于語(yǔ)音聲學(xué)特征進(jìn)行分析。
4、場(chǎng)景分割,我能夠去定義語(yǔ)音的角色、場(chǎng)景的背景,可以把語(yǔ)音部分和人的身份去做自動(dòng)的聚類(lèi),可以給出客服語(yǔ)音和用戶(hù)語(yǔ)音相區分,即使在這兩個(gè)語(yǔ)音相重疊的時(shí)候,客服正在回答問(wèn)題,機器人正在回答問(wèn)題,你好,請您按照步驟一、步驟二,這時(shí)候打斷,客戶(hù)語(yǔ)音進(jìn)來(lái)了,他可以分出來(lái)客戶(hù)的語(yǔ)音是什么、要點(diǎn)是什么,不會(huì )吧兩個(gè)語(yǔ)音疊加在一起,造成含混不清。
語(yǔ)音引擎突出體現幾個(gè)優(yōu)勢:1、語(yǔ)音的性能優(yōu)勢,首先準確率上能做到80%和90%,這是語(yǔ)音性能上的優(yōu)勢。當然我們在實(shí)驗室里面有時(shí)候說(shuō)這不一定是很高的數據結果或者大家都差不多的數據結果,是這樣的。在語(yǔ)音識別里面,我想大家不會(huì )說(shuō)哪家的語(yǔ)音識別的效率會(huì )特別高或者會(huì )特別低,比如科大訊飛特別高或者特別低,都不會(huì )。我覺(jué)得關(guān)鍵在于我們是不是有專(zhuān)家在優(yōu)化,給企業(yè)級或者再一個(gè)領(lǐng)域里面優(yōu)化企業(yè)的使用場(chǎng)景。當你的語(yǔ)音引擎在使用場(chǎng)景上進(jìn)行一系列的優(yōu)化之后,它的表現在應用里面的差異特別大,這時(shí)候這是語(yǔ)音上面和別人的差別,我們在應用的窄領(lǐng)域內去聚焦和投入,去做這樣的語(yǔ)音引擎。
2、語(yǔ)音的抗噪性,對于語(yǔ)速的識別,準確率和語(yǔ)音的適應性上,都做了相關(guān)的學(xué)習和建模的技術(shù)。
為了配合無(wú)人職守的客服中心,語(yǔ)義上我們做了相關(guān)的提升,主要是三個(gè)方向:1、場(chǎng)景化;、多輪問(wèn)答。3、業(yè)務(wù)本體建模。說(shuō)白了是為了使得我們的智能問(wèn)答的機器人更接近予人類(lèi)的操作能力。它除了能夠回答問(wèn)題以外,它應該還能夠去干活,能夠做業(yè)務(wù),能夠進(jìn)行系統的錄入,甚至能夠辦理一些簡(jiǎn)單的業(yè)務(wù)流程或者能夠提示或者能夠進(jìn)行推銷(xiāo)。我們定義不同的業(yè)務(wù)場(chǎng)景,要能基于人類(lèi)的一個(gè)問(wèn)題,讓機器有多輪問(wèn)答,引導出它整個(gè)問(wèn)題。第三個(gè)是機器人要了解業(yè)務(wù),它要進(jìn)行業(yè)務(wù)的建模。
場(chǎng)景,它等于業(yè)務(wù)框架+知識類(lèi)型+交互方式,這就是我們實(shí)際上對場(chǎng)景基于語(yǔ)義管理的定義。我們知道一個(gè)用戶(hù)有不同的業(yè)務(wù)類(lèi)別,我們可以對應不同的場(chǎng)景。這些業(yè)務(wù)類(lèi)別對用戶(hù)而言,首先看到的是業(yè)務(wù)框架,對于學(xué)習的知識庫而言,能夠看到不同的業(yè)務(wù)框架下有不同的知識類(lèi)型。在交互方式上也會(huì )看到機器人給他的表述方式是不同的,這個(gè)我們管它叫場(chǎng)景化。以前的機器人在過(guò)于單一的場(chǎng)景里面使用同一種方式,都是問(wèn)答。有時(shí)候不是,營(yíng)銷(xiāo)的時(shí)候交互方式是更副文本一點(diǎn),普通的時(shí)候可能交互方式適合簡(jiǎn)單的回答,這樣一方面考慮機器的復雜和成本,也使得我們在不同場(chǎng)景下的使用變得更靈活,不同場(chǎng)景的答案不同。另外,以前過(guò)于強調單一的知識,這里面大家看到的FAQ的知識,像人類(lèi)一樣,我們有不同的知識,機器人也應該學(xué)習不同的知識。等下我舉個(gè)海關(guān)的例子給大家講列表型知識。通常我們進(jìn)海關(guān),仿真槍能不能帶出海關(guān)?這時(shí)候機器人給的回答就是整個(gè)法規,一個(gè)海關(guān)的規范,但實(shí)際上如果人回答那就直接回答仿真槍不能帶出海關(guān)就可以。這句話(huà)意思在列表知識型里面解析,如果以機器人不具備知識架構,永遠做不到人類(lèi)這樣回答問(wèn)題,就不能從列表中解析。這是我們想要求的讓他辦理業(yè)務(wù)或者做場(chǎng)景化所必備不同的知識能力。這三個(gè)我們叫場(chǎng)景定義。
場(chǎng)景定義下涉及到建模,定義一個(gè)場(chǎng)景怎么建模,這里面引入BOT建模的方式,通過(guò)BOT框架,通過(guò)它的底層自帶的概念庫來(lái)滿(mǎn)足機器人在不同場(chǎng)景下的表現出不同角色的能力,這是BOT概念建模。BOT就是一個(gè)業(yè)務(wù)體系或者一個(gè)圖譜或者就是一個(gè)多維度的業(yè)務(wù)樹(shù),都可以。這是用戶(hù)很常見(jiàn)的BOT的拓普圖。招商銀行的業(yè)務(wù)劃分,業(yè)務(wù)劃分是像我們培訓普通座席一樣,有對公業(yè)務(wù)、個(gè)人業(yè)務(wù)。對公業(yè)務(wù)、個(gè)人業(yè)務(wù)再一級一級展開(kāi)。這樣可以告訴他,在機器的情況下,比如我個(gè)人業(yè)務(wù)里面信用卡,它包括什么,它的知識要點(diǎn)應該包括業(yè)務(wù)流程、業(yè)務(wù)劃分等。機器人可以在相關(guān)類(lèi)別情況下進(jìn)行回答,二是它可以去推測你下一個(gè)問(wèn)題可能是和什么相關(guān)的,就不會(huì )在所有的問(wèn)題里面隨意列舉,而是在業(yè)務(wù)框架里面推測,這個(gè)思維是模仿人的思維進(jìn)行的。我們人回答問(wèn)題的時(shí)候也是這樣,屬于信用卡類(lèi),問(wèn)了這個(gè),我要找信用卡相關(guān)的,我們在BOT概念樹(shù)的情況下進(jìn)行分析,大家可以列為一個(gè)寬表對屬性的窮舉,這個(gè)概念展開(kāi)可以非常寬。這里面列舉了涉及BOT里面很多場(chǎng)景,不一一解釋?zhuān)囊饬x是一樣的。基于這個(gè)我們形成框架庫,我給招商銀行建立BOT場(chǎng)景,我就可以把領(lǐng)域定義為整個(gè)銀行領(lǐng)域,這個(gè)框架我可以定義為銀行哪類(lèi)業(yè)務(wù)框架,基金辦、概念型知識或者整個(gè)銀行框架或者信用卡框架,我可以把業(yè)務(wù)領(lǐng)域和業(yè)務(wù)框架定義下來(lái),結果是我到別的銀行的時(shí)候就可以復用。比如我到長(cháng)沙銀行或者基金管理公司的時(shí)候,我可以把知識進(jìn)行復用。基金辦理的框架(見(jiàn)PPT)。
概念庫,這是業(yè)務(wù)領(lǐng)域常涉及到的場(chǎng)景。這個(gè)概念不單單是以前定義的打語(yǔ)義標簽的概念,應該還包括里面列舉的,比如它的集合概念、同義概念、業(yè)務(wù)概念、敏感概念、糾錯概念、停用概念、成長(cháng)概念等,把復雜的概念進(jìn)行處理,使我們在業(yè)務(wù)場(chǎng)景里,能使機器人應答更加靈活,可以更符合我去探訪(fǎng)問(wèn)題本質(zhì)訴求的能力,我知道它應該從屬概念的哪類(lèi),看到不同的概念進(jìn)行答案的提取。在這個(gè)基礎上我們再進(jìn)行不同類(lèi)型的知識加工,比如問(wèn)答類(lèi)知識,概念型知識,列表型知識和要素型知識等等。不同知識的特色,這是典型問(wèn)答型知識,信用卡怎么辦、信用卡如何辦理,這就是問(wèn)答型知識。概念型知識,信用卡主要通過(guò)訪(fǎng)問(wèn)什么方式辦理,這里面提取的語(yǔ)義概念要素是信用卡辦理,信用卡辦理的方式、訪(fǎng)問(wèn)、網(wǎng)點(diǎn)等等,這些要素是被自動(dòng)提取出來(lái),提取出來(lái)以后,這句問(wèn)話(huà)變得更加靈活,信用卡怎么辦、信用卡該如何辦理、我該如何辦卡等等,這些內容將被列舉成同一條知識。我們做過(guò)一個(gè)測試,剛才講了銀行里面一個(gè)基本問(wèn)會(huì )對應1200個(gè)擴展問(wèn)題,通過(guò)概念型知識加工,可以把問(wèn)題的類(lèi)別擴展類(lèi)大大縮減,第一步縮減為幾十條,幾十條還不夠,我們希望最后消除擴展問(wèn),我們拿到適當的語(yǔ)料訓練之后,最終的目的是消除擴展問(wèn),讓問(wèn)題自動(dòng)找答案,或者使用很少的擴展問(wèn),把機器人維護的工作降到最低,對機器人有知識的人知道它的維護工作有多復雜,大家看其他銀行上線(xiàn)的機器人可能就會(huì )有體會(huì )。概念型知識,這是我們自動(dòng)提煉出來(lái)的語(yǔ)義概念,信用卡辦理等等。
要素型知識,典型的是剛才說(shuō)的賣(mài)保險的問(wèn)題,我要辦一個(gè)保險或者買(mǎi)一張火車(chē)票等等這樣的問(wèn)題,后面包含一個(gè)要素,保險人是誰(shuí)、年齡是多少、辦什么樣的保險,火車(chē)票是從哪兒到哪兒,哪一天,買(mǎi)什么樣的座位、什么等級,這就是要素型知識。里面避免不了的話(huà)題是要給用戶(hù)畫(huà)他的歷史肖像,以前的行為更喜歡什么樣的,喜歡買(mǎi)一等座還是二等座還是喜歡坐票還是臥鋪,這些是我們要給用戶(hù)畫(huà)像的能力。這要結合起來(lái)。列表型知識,我們通過(guò)對列表型知識進(jìn)行加工的時(shí)候,我們可以把機器人的人機回答變化一下,例如仿真槍能不能帶上飛機,這里說(shuō)某某違禁品是違禁品,不可以帶上飛機。這是從列表知識里面提取的答案,仿真槍能不能帶上飛機?他告訴你仿真槍是違禁品,不能帶上飛機。比如度秘搜索,他會(huì )回答整個(gè)公約,這不是客服想要的答案。
語(yǔ)義技術(shù)在這方面進(jìn)行增強,一是場(chǎng)景化。二是業(yè)務(wù)建模。三是知識不同表示和知識加工。四是持續化的優(yōu)化和服務(wù)的能力。
我們用了深度學(xué)習的算法,一是信息抽取和信息發(fā)現,主要是用在問(wèn)題的識別上。現在的算法主要是兩種,CNN的方式和LSTM的方式,在機器學(xué)習上學(xué)習情感表達和多輪會(huì )話(huà)的能力,這是用LSTM的算法來(lái)進(jìn)行提取,它也用在答案自動(dòng)生成和提取上,也用在實(shí)體提取和標注上,實(shí)體標注上我們對應的CRF等等,還有其他算法的組合。這樣一些算法的提取,包括答案生成,我們用對抗學(xué)習的機制來(lái)自動(dòng)模擬人類(lèi)自然語(yǔ)言生成答案,這樣的算法機制使我們完成了什么呢?我們說(shuō)一個(gè)和以前的對比,以前我們在做語(yǔ)義標簽的時(shí)候,我們自己的引擎是通過(guò)傳統的機器學(xué)習算法構成的,我們做擴展的時(shí)候,我們怎么都做不靈活,我們在上海銀行實(shí)際測試的時(shí)候,我們用這樣的算法替掉原來(lái)的引擎,做兩種引擎的對比,在沒(méi)有擴展論的時(shí)候,機器應答的準確率和召回效果,和以前維護標準兩百條擴展論問(wèn)答效果差不多。
這是學(xué)習流程,結合用戶(hù)畫(huà)像當前提問(wèn)和用戶(hù)的歷史提問(wèn),把這三個(gè)作為我們判別的數據源,通過(guò)我們對問(wèn)題的處理,包括對概念的規劃處理,對問(wèn)題的分類(lèi),對信息的識別,最后拿出一個(gè)結構化的用戶(hù)意圖,是用JASON表示的,意味著(zhù)我們的系統可以開(kāi)放給所有人,只要用JSON進(jìn)行編程的人,我們可以把引擎的意圖開(kāi)放給所有咱們在座的系統。語(yǔ)義識別的例子,幫我訂一張明天從北京到上海的機票,最好不經(jīng)常晚點(diǎn)的。我們得出的結論,這個(gè)人是高大偉,男,36歲,商務(wù)人士,經(jīng)常拜訪(fǎng)客戶(hù),經(jīng)常攜帶藏刀、佛像等禮品。這就是他歷史的畫(huà)像,這是我們的數據鏈。加上他的問(wèn)題,我們就輸出這樣的JSON格式,他要做機票預定從北京到上海,名字叫高大偉,36歲,商務(wù)認識,對航班準確率要求高,他要攜帶禮品。我們會(huì )把完整的JSON數據發(fā)放出來(lái),可以結合數據源讓機器人做后臺的自動(dòng)分析架構結合語(yǔ)義。
同時(shí)我們考慮對話(huà)棧的技術(shù),像人一樣,人是有記憶的,機器人回答問(wèn)題的時(shí)候,最方便的回答是你帶著(zhù)機器人和人回答,比如我說(shuō),幫我推薦個(gè)信用卡?這個(gè)問(wèn)題入棧,你問(wèn)什么幣種、什么職業(yè)。他又說(shuō),我想再問(wèn)一下保險,他把你的問(wèn)題打斷了,說(shuō)了一個(gè)其他的問(wèn)題,機器人還是可以自動(dòng)問(wèn)答,你要什么險種、額度是什么,這個(gè)是話(huà)題的入棧,我把話(huà)題推到棧里面去。什么時(shí)候話(huà)題會(huì )出棧?一是話(huà)題中斷。二是話(huà)題徹底解決完了。三是話(huà)題異常終止或者完美解決。如果不想買(mǎi),他就知道。接著(zhù)回到信用卡,他說(shuō),請問(wèn)你什么職業(yè)?這是不是比較接近客服的自然響應。我們把話(huà)束記憶也加入機器人的多輪會(huì )話(huà)里面去。通過(guò)這個(gè)也可以做所謂的引擎算法熱切換,第一種,傳統語(yǔ)義標簽的方式,通過(guò)語(yǔ)義標簽的方式去減少機器人在語(yǔ)義和句式變化上對人需求的維護,減少這樣的需求。二是基于深度學(xué)習的方式,基于深度學(xué)習的匹配,對兩類(lèi)內容進(jìn)行匹配,一個(gè)是問(wèn)題到問(wèn)題,哪些問(wèn)題是標準問(wèn),哪些是擴展問(wèn),問(wèn)題到問(wèn)題的自動(dòng)匹配。二個(gè)是問(wèn)題到答案,問(wèn)題到答案的生成很新,我們正在做這方面的努力,也正在跟招商銀行聯(lián)合做這方面的研究,我們怎么從問(wèn)題里面生成答案,這樣我們既希望于最后能夠脫離所有的擴展問(wèn)。
我們看一個(gè)例子,傳統語(yǔ)義標簽的匹配方式,這個(gè)匹配方式做了語(yǔ)義優(yōu)化。比我們以前看到的機器人好很多,大家可以看到幾年前的機器人效果比這個(gè)還差。比如我說(shuō)微信密碼不記得,他回答的方式是我回答不了,小滬功力不足。微信密碼丟了,微信密碼不記得,其實(shí)是一回事。滬是上海銀行實(shí)測的機器人,我們把語(yǔ)義標簽去掉,換一個(gè)方式,熱切換深度語(yǔ)義,這時(shí)候召回的問(wèn)題,微信密碼不記得,他會(huì )回答如果忘了微信密碼,我可以推薦知識。最神奇的是說(shuō)到微信密碼丟的時(shí)候,還會(huì )推薦相關(guān)的其他類(lèi)型的知識。這時(shí)候我們發(fā)現通過(guò)深度學(xué)習可以極大的提升機器人問(wèn)題的維護和回答的能力。
場(chǎng)景應用,語(yǔ)音質(zhì)檢,語(yǔ)義質(zhì)檢,通過(guò)聲音質(zhì)檢可能比較常見(jiàn),語(yǔ)義質(zhì)檢大家可能看到的比較少,但是可以通過(guò)文字內容理解這個(gè)人的思維,判斷他回答問(wèn)題的合規性。潛客挖掘,貴金屬結算卡在基金理財上,分別挖掘出不同的潛在的營(yíng)銷(xiāo)客戶(hù)。這使呼叫中心從成本中心變成有可能盈利的利潤中心。智能投訴管理的場(chǎng)景化應用,我們把投訴分成三類(lèi)76級別,把它的機構來(lái)自于上級機構的投訴還是有哪些投訴的升級,把投訴分類(lèi)進(jìn)行劃分。我們把整個(gè)客戶(hù)中心的投訴看得非常清楚,我通過(guò)一張表,我們叫三元組云圖,可以看到所有投訴里面最真實(shí)的投訴內容是什么,而不只是關(guān)鍵字。這是我們有些項目投標的時(shí)候正在做的,越來(lái)越多的銀行提智能IVR語(yǔ)音導航,我們不再使用關(guān)鍵字,以前的方法是關(guān)鍵字,你可以說(shuō)關(guān)鍵字,用戶(hù)很多時(shí)候不說(shuō)關(guān)鍵字,他直接希望智能客服來(lái)問(wèn)他,請問(wèn)有什么可以幫你?他直接說(shuō)我信用卡丟了怎么掛失,然后你直接跳到菜單里面。這是我們倡導的,我們現在也在投一些銀行的項目,我們也覺(jué)得越來(lái)越多的銀行用戶(hù)直接跟我們講,到底機器人能替掉人工工作多少的比例,我們在這個(gè)方向上一直努力。
我們希望實(shí)現虛擬座席,我們通過(guò)客戶(hù)的問(wèn)題轉接到虛擬座席,這個(gè)座席是給他普通座席和權限的,給他普通數據庫的操作權限和訪(fǎng)問(wèn)權限,以及知識庫的訪(fǎng)問(wèn)權限。首先它通過(guò)小滬機器人的引擎來(lái)做用戶(hù)的意圖理解和智能處理,實(shí)時(shí)去辨別知識類(lèi)型和場(chǎng)景,同時(shí)也顯示在我們人的客服的屏幕上,人類(lèi)客服可以通過(guò)關(guān)鍵字做相應的跳轉,進(jìn)知識庫和頁(yè)面。我們把虛擬座席做成人的助理,而且某些情況下對固定流程、煩瑣的流程、固定的問(wèn)答方式,虛擬座席可以完全輔助人類(lèi)化解,而且他們之間可以一鍵進(jìn)行切換,機器人可以呼叫人,人也可以呼叫機器人,進(jìn)行場(chǎng)景切換。
渠道是咱們講的全渠道,不用通過(guò)任何渠道,網(wǎng)絡(luò )、短信各種方式。我們最近研究一個(gè)有意思的渠道,通過(guò)VR的方式來(lái)實(shí)現一個(gè)機器人的渠道,這里面的場(chǎng)景我通過(guò)虛擬座席可以做什么,可以咨詢(xún)銀行的業(yè)務(wù),可以進(jìn)行意圖的識別,做多輪會(huì )話(huà)。我可以進(jìn)行營(yíng)銷(xiāo)的主動(dòng)推送,或者推地圖過(guò)去告訴你地點(diǎn)在哪里,我可以進(jìn)行各種寒喧、聊天,大家可以在線(xiàn)上找我們的小滬試試,昨天有合作伙伴測試效果不錯。我覺(jué)得電影不好看,小滬說(shuō)我理解您很憤怒。說(shuō)了一些很有意思的話(huà),這不是你的錯什么的。他們寒喧的能力比較強。它也可以做一些超時(shí)的處理,比如時(shí)間過(guò)長(cháng)的時(shí)候,他可以知道提示電話(huà)要斷掉,也可以做無(wú)縫轉人工和人工和虛擬座席的互轉,也可以做沒(méi)聽(tīng)清楚問(wèn)題的提示,也可以做一些幫助。包括用戶(hù)的個(gè)人畫(huà)像,我們的畫(huà)像以前都是在大數據平臺下打數據標簽做出來(lái)的,這里面講的是用戶(hù)和實(shí)時(shí)繪畫(huà)過(guò)程中自然加工出來(lái)的,完全不一樣。我們做精準營(yíng)銷(xiāo)的畫(huà)像,大部分來(lái)自歷史畫(huà)像,但是時(shí)間已經(jīng)過(guò)去了,不是現在的用戶(hù)行為。今天的用戶(hù)行為是正在講話(huà)的時(shí)候的畫(huà)像,價(jià)值是不一樣的。包括他的知識點(diǎn)建設。
虛擬座席的知識學(xué)習怎么做的?你怎么進(jìn)一個(gè)人類(lèi)知識告訴他?一是對現有學(xué)習知識學(xué)習、現有知識強化、新知識的發(fā)現。以前的機器人沒(méi)有彈出過(guò)界面,我們現在把這個(gè)知識點(diǎn)可以做到普通人就可以加工和維護的場(chǎng)景,不需要懂人工智能的專(zhuān)業(yè)知識。知識特征我們可以做運維統計。系統的實(shí)施團隊,技術(shù)上有三個(gè)團隊負責,語(yǔ)義建模是張笑然領(lǐng)6個(gè)人的團隊,語(yǔ)音訓練是劉雪蓮領(lǐng)10個(gè)木團隊,接口開(kāi)發(fā)是張青領(lǐng)20多人團隊來(lái)做開(kāi)發(fā),這是技術(shù)支持和服務(wù)隊伍。整個(gè)實(shí)施周期如果并行起來(lái),在4-5個(gè)月可以把無(wú)人值守的客戶(hù)中心建起來(lái)。大家看到這里面有些售后,從業(yè)務(wù)調研開(kāi)始,然后到知識庫的建立,一直到語(yǔ)義理解的系統功能,到鏈條測試到整體上線(xiàn),大概是4-5個(gè)月時(shí)間就可以建立整個(gè)系統。這是實(shí)時(shí)服務(wù)體系,我們做的7×24小時(shí)保障。
案例,長(cháng)沙銀行的機器人在微信和Web客戶(hù)端進(jìn)行會(huì )話(huà),這個(gè)機器人是我們前一個(gè)版本,沒(méi)有用深度學(xué)習的樣例,但是已經(jīng)用了語(yǔ)義標簽的樣例,長(cháng)沙銀行整個(gè)維護的時(shí)間和維護周期非常短,整個(gè)實(shí)施周期控制在2個(gè)月左右的時(shí)間,整個(gè)機器人的知識建模已經(jīng)做好。招商銀行智能問(wèn)答做的測試,這個(gè)測試是把小招85萬(wàn)個(gè)匹配不到的問(wèn)題做了第二次答案,原來(lái)匹配不到的問(wèn)題,小招一鍵轉人工,這時(shí)候有大量人工工作量,后面又放一個(gè)機器人,發(fā)現85萬(wàn)個(gè)問(wèn)題,我們召回60萬(wàn)個(gè)問(wèn)題。棘輪是機器人無(wú)法回答的85萬(wàn)個(gè)問(wèn)題,通過(guò)智能匹配,有60萬(wàn)個(gè)問(wèn)題以90%+的準確率找到了答案。
我們通過(guò)二次匹配進(jìn)行高知性運作,通過(guò)語(yǔ)義加工和深度學(xué)習的能力,去減少用戶(hù)的人工維護。智能語(yǔ)音導航也要對接其他平臺,比如GeneSys、Avaya、華為、中興等等,這是我們做過(guò)的一些案例(見(jiàn)PPT)。廣發(fā)做了機器人的語(yǔ)音質(zhì)檢,大家看一下它的應用,廣發(fā)銀行傳統的人工調取的方法是效率比較低,成本比較高,而且它也面臨很大的壓力,通過(guò)上線(xiàn)以后,制止三千個(gè)座席規模的客服在基于大數據的基礎上來(lái)實(shí)現自動(dòng)的語(yǔ)音質(zhì)檢。紅色體現出來(lái)客戶(hù)價(jià)值,我們的覆蓋率可以做到100%,對于業(yè)務(wù)熱詞可以自動(dòng)統計,自動(dòng)推送培訓的內容,有95%的合規內容被發(fā)現,客服實(shí)時(shí)報檢是可以做一些分析。現在廣發(fā)也正在做一些關(guān)于語(yǔ)義質(zhì)檢和語(yǔ)義防欺詐的關(guān)聯(lián)分析。比如廣發(fā)辦信用卡的時(shí)候,有很多人寫(xiě)地址是瞎寫(xiě)的地址,這個(gè)地址有可能是信用卡的欺詐行為。用常規的方法很難理解哪個(gè)地址是正確的,哪個(gè)是錯誤的,今天的威斯汀也有很多說(shuō)法,可以說(shuō)某路某號,也可以說(shuō)威斯汀酒店,我們通過(guò)機器學(xué)習的方法來(lái)做地址歸一化的校驗,提出錯誤的地址,做防欺詐。重慶的案例,我們想做無(wú)人值守的客服中心,光有人工智能不夠。我們應該用人工智能的能力連接一切。重慶交委做的例子,我們把數據用專(zhuān)門(mén)的數據平臺連起來(lái),把業(yè)務(wù)平臺、開(kāi)發(fā)平臺、數據平臺、運維平臺、公共平臺做起來(lái),整個(gè)做成應用服務(wù)平臺,這才是無(wú)人值守的客服中心。今天我們重點(diǎn)展開(kāi)語(yǔ)音和語(yǔ)義兩部分,后面只是給案例的方法給大家展示。
這是我們實(shí)際做的一些原子服務(wù)和原子組合,這是我們現場(chǎng)做的采訪(fǎng),做成業(yè)務(wù)圖譜。
謝謝各位!