今天的報告主要分為四個(gè)部分,第一部分是呼叫中心面臨的挑戰和趨勢,第二部分是自然語(yǔ)言處理的重要性,第三部分是深度語(yǔ)義理解核心技術(shù),第四部分是深度語(yǔ)義理解的應用。
首先來(lái)看呼叫中心面臨的挑戰,我認為呼叫中心的挑戰主要是關(guān)于人的三個(gè)矛盾,第一個(gè)矛盾是,我們知道呼叫中心的投入和規模每年都在持續的增長(cháng),這樣的話(huà)就需要招聘更多的人,但是我國的勞動(dòng)力人口已經(jīng)在逐年下降越來(lái)越少,這樣就構成第一個(gè)矛盾;第二個(gè)矛盾是,我們希望呼叫中心的人工座席團隊盡可能的保持穩定,但是事實(shí)上呼叫中心的離職率相對于別的行業(yè)來(lái)說(shuō)始終處于一個(gè)比較高的水平;第三個(gè)矛盾,根據統計顯示呼叫中心的人力成本占到了總成本的82%,我們呼叫中心預算的增長(cháng)的速度低于人力成本的增長(cháng)速度,這樣就構成了第三個(gè)矛盾。
這三個(gè)矛盾就使得智能化成為呼叫中心發(fā)展的一個(gè)必然趨勢,這里面我們可以從兩個(gè)角度來(lái)看。第一個(gè)角度就是機器可以替代人,也就是說(shuō)我們不需要招更多的話(huà)務(wù)員。比如說(shuō)智能客服、智能IVR、智能營(yíng)業(yè)廳、智能外呼的應用。Garter有一個(gè)報告,2020年智能機器人的座席能夠滿(mǎn)足40%的客服市場(chǎng)的需求,中國到時(shí)候就會(huì )有一千萬(wàn)的智能機器人的座席;第二個(gè)角度來(lái)講的話(huà)就是說(shuō)機器也可以輔助人、協(xié)助人,比如智能坐席助手和智能知識庫,我們可以提高座席人員的工作效率,讓同樣一個(gè)坐席人員可以去做更多的工作、去有更多的產(chǎn)出。
同時(shí)我們今天很高興的看到,就是說(shuō)越來(lái)越多的用戶(hù)已經(jīng)開(kāi)始適應和習慣智能化的服務(wù)方式。國外報告是說(shuō)在過(guò)去的2017年,已經(jīng)有超過(guò)15%的用戶(hù)有了跟智能機器人對話(huà)的經(jīng)歷,雖然說(shuō)傳統的一些渠道,比如說(shuō)電話(huà)、郵件的比例仍然遠遠高于對話(huà)機器人的比例,但是我們可以看到從趨勢上來(lái)講,就是智能服務(wù)的比例會(huì )占的越來(lái)越高。
在呼叫中心這個(gè)領(lǐng)域里面,智能服務(wù)、智能技術(shù)起作用的一個(gè)主要著(zhù)力點(diǎn)就是語(yǔ)言的處理。語(yǔ)言的形式可能有語(yǔ)音、有文本。對于語(yǔ)音來(lái)講,通過(guò)語(yǔ)音識別的技術(shù),我們可以把它轉換成文本,所以說(shuō)歸根到底可能主要還是一個(gè)文本處理的問(wèn)題。這里面主要用到的就是自然語(yǔ)言處理的技術(shù),也就是NLP的技術(shù)。
我們可以看一看NLP在人工智能中的位置。人工智能可以劃分為三個(gè)層次,第一個(gè)就是計算智能,就是讓計算機具備能存會(huì )算的能力。第二個(gè)層次是感知智能,讓計算機能聽(tīng)會(huì )說(shuō)、能看會(huì )認,比如說(shuō)語(yǔ)音識別、語(yǔ)音合成、人臉識別都屬于感知智能的范疇。第三個(gè)層次就是認知智能,讓計算機具備能理解會(huì )思考的能力,NLP就是在研究如何讓機器人像人一樣去理解人類(lèi)的語(yǔ)言,屬于認知智能的范疇,著(zhù)名的圖靈測試主要就是基于NLP的技術(shù)提出的。
在NLP的處理里面其實(shí)是面臨四個(gè)非常大的挑戰和困難。第一個(gè)是表達方式是非常靈活的,第二個(gè)是我們在語(yǔ)言當中其實(shí)是普遍存在很多的不確定性,第三個(gè)是語(yǔ)言知識處理本身非常復雜,第四個(gè)是輸入可能是存在不規范性。比如講一個(gè)智能回訪(fǎng)的場(chǎng)景,我們都知道機器人做回訪(fǎng),或者我們人工座席做回訪(fǎng),往往第一個(gè)問(wèn)題是身份的核對,比如“您好,請問(wèn)你是張三先生嗎?”可能我們期望用戶(hù)說(shuō)我是或者說(shuō)我不是,這是非常簡(jiǎn)單非常容易處理的;但是我們分析實(shí)際的錄音數據,針對用戶(hù)表明自己就是張三,從表述上我們可以分為四類(lèi),第一類(lèi)就是我剛才講的最簡(jiǎn)單一個(gè)情況,第二類(lèi)比如說(shuō)用戶(hù)會(huì )說(shuō)“有事趕緊說(shuō)”,第三類(lèi)他可能反問(wèn)你,“你為什么午休時(shí)間給我打電話(huà)”,第四類(lèi),他甚至會(huì )拒絕你,“我現在不方便接電話(huà)”,但是后面這三類(lèi)他都在變相的承認自己是張三。我們就可以看到,其實(shí)對于一個(gè)簡(jiǎn)單的身份核對,用戶(hù)就會(huì )有各種各樣非常靈活、非常多變的表達方式,要求我們能夠通過(guò)NLP的技術(shù)能夠去處理。
某種意義上來(lái)講就是一個(gè)問(wèn)題它有多難,它就會(huì )有多重要。關(guān)于自然語(yǔ)言處理,微軟創(chuàng )始人比爾蓋茨很早之前就說(shuō)過(guò),自然語(yǔ)言處理是人工智能皇冠上的明珠。最近微軟的沈向洋博士提出了一個(gè)說(shuō)法“懂語(yǔ)言者得天下”,就是強調人工智能接下來(lái)的突破就是在自然語(yǔ)言的理解。
我們看看NLP在實(shí)際中的應用場(chǎng)景,可以劃分為三塊,第一塊就是通用領(lǐng)域,我們都知道搜索引擎、拼音輸入法,背后都是一些NLP的技術(shù)。第二塊是面對特定行業(yè)的應用,比如說(shuō)智能投顧、疾病診斷、還有教育、法律都有一些應用場(chǎng)景,第三塊就是呼叫中心。
呼叫中心相對特殊,這個(gè)特殊性我認為主要是因為它的兩個(gè)特點(diǎn)決定,第一個(gè)就是說(shuō)各行各業(yè)都有這方面的需求,市場(chǎng)空間非常大;第二個(gè)特點(diǎn)是針對具體的客戶(hù)具體的行業(yè)來(lái)講,其實(shí)解決的是特定封閉領(lǐng)域的問(wèn)題,這樣的話(huà)使得技術(shù)難度相對來(lái)講比較低。
接下來(lái)就是深度語(yǔ)義理解的核心技術(shù),對于NLP,從大的方面來(lái)看可以劃分為兩種技術(shù)路線(xiàn),第一種是傳統的方法,基于符號的語(yǔ)義表示,在語(yǔ)義處理上是依賴(lài)于大量的規則還有淺層的分析,準確率往往取決于你到底投入多少的人工,很難超過(guò)80%。第二種是深度語(yǔ)義理解的方法,基于分布式的語(yǔ)義表示,語(yǔ)義處理上是把傳統的機器學(xué)習和深度學(xué)習去結合起來(lái),另外在知識層面很好的利用知識圖譜作為支撐,準確率可以做到95%以上。
深度語(yǔ)義理解有兩個(gè)要素,一個(gè)是關(guān)鍵算法,有語(yǔ)義相似度計算、語(yǔ)義復述、多意圖識別、自學(xué)習;第二個(gè)是知識圖譜,從知識圖譜技術(shù)上來(lái)看是五方面的問(wèn)題,第一個(gè)是知識的體系和表示,第二個(gè)是知識的建模,第三個(gè)是知識的獲取,第四個(gè)是知識的集成,第五個(gè)是知識的存儲和服務(wù)。下面我分別仔細介紹。
最終的話(huà)把算法和知識的所有技術(shù)整合起來(lái),就構成了我們的深度語(yǔ)義理解引擎,大概涉及到二十多種技術(shù)。
最后介紹一下我們在深度語(yǔ)義理解的具體的實(shí)踐和應用。中興通訊的NGCC解決方案主要面向政企和運營(yíng)商市場(chǎng),我們的解決方案具備三方面的特點(diǎn),第一個(gè)就是智能化,第二個(gè)是純云化、第三個(gè)是整體化。我們在中國平安、江蘇電信規模分別是15000座席和13400坐席,在建設銀行我們是兩地三中心12000坐席。這些案例都是呼叫中心少有的智能水平非常高、容量非常大,可靠性非常高的應用案例,在這里面深度語(yǔ)義理解的技術(shù),應用到了系統的各個(gè)部分,使得人工座席和機器可以密切的配合,有一個(gè)非常好的人機協(xié)作的效果。
最后總結下,中興通訊的NGCC解決方案,我們將深度語(yǔ)義理解的技術(shù)應用到了系統的各個(gè)部分,具體來(lái)講有智能客服、智能IVR、智能營(yíng)業(yè)廳、智能知識庫和智能外呼,這些智能的方案跟對于呼叫中心傳統功能的完全支持,一起構成我們完整化的解決方案,我們希望通過(guò)以深度語(yǔ)義理解為代表的智能化技術(shù),把智能化與服務(wù)場(chǎng)景、接入渠道,還有業(yè)務(wù)系統做一個(gè)無(wú)縫的融合,希望在業(yè)務(wù)場(chǎng)景里面能夠給用戶(hù)提供舒適、無(wú)感、有效、快速的智能服務(wù)。謝謝大家。