背景
為什么客服需要調度?阿里集團客戶(hù)體驗事業(yè)群(CCO)目前承接了阿里集團以及生態(tài)體的客戶(hù)服務(wù)業(yè)務(wù),我們的客戶(hù)通過(guò)各個(gè)渠道來(lái)尋求解決各類(lèi)問(wèn)題,每天的進(jìn)線(xiàn)量巨大,而且經(jīng)常伴隨著(zhù)突發(fā)性進(jìn)線(xiàn),比如天貓代金券出了問(wèn)題,在幾分鐘內就會(huì )造成幾千通熱線(xiàn)或在線(xiàn)咨詢(xún)。面對種類(lèi)繁多、海量、突發(fā)的客戶(hù)問(wèn)題,我們的服務(wù)能力往往難以滿(mǎn)足,常常造成用戶(hù)排隊,甚至放棄,自然我們產(chǎn)生了對調度的需求。

客服調度的核心問(wèn)題是什么?提升客服資源的利用率和服務(wù)水平,用更少的客服資源獲得更佳的用戶(hù)體驗。如果我們招聘大量的客服,也能讓用戶(hù)獲得更好的體驗,但是容易造成人力浪費,更多的人手意味著(zhù)更多的培訓成本、管理成本和人力成本。
與機器調度相比,客服調度有它的復雜點(diǎn):
1)機房增加一臺新物理機,機器虛擬化后就可以快速被使用,而招募一個(gè)新客服,得需要長(cháng)時(shí)間的培訓才能讓他具備線(xiàn)上服務(wù)能力;
2)客服間差別大,不同客服的業(yè)務(wù)技能有區別,很難直接讓B技能組的客服處理A技能組的任務(wù),即使是掌握同一技能的客服,他們的服務(wù)能力也有大的差別,而機器差別不大,很多業(yè)務(wù)可以使用相同類(lèi)型的機器;
3)客服是人,他有權利選擇上班、小休,他的工作效率、質(zhì)量會(huì )隨著(zhù)他的情緒、體驗、服務(wù)的會(huì )員、工作時(shí)長(cháng)等波動(dòng),調度時(shí)需要考慮他們的感受,而調度機器時(shí)無(wú)需顧忌;
4)突發(fā)場(chǎng)景多,業(yè)務(wù)問(wèn)題、系統故障等都是無(wú)規律爆發(fā),波動(dòng)特別大,很難準確的提前排好一天的人力。
現場(chǎng)管理員是否能應對如此復雜的客服調度?答案是否定的。在沒(méi)有調度系統之前,現場(chǎng)管理員基本靠手工來(lái)調度,隨著(zhù)體量越來(lái)越大,缺陷逐漸暴露:
1)響應慢:比如周末線(xiàn)上排隊時(shí),現場(chǎng)管理員可能會(huì )收到電話(huà)反饋,然后再打開(kāi)電腦去手工放個(gè)臨時(shí)班等等,從排隊發(fā)生到調度生效超過(guò)十幾分鐘很正常;
2)不精準:缺乏數據指導,統籌優(yōu)化能力弱。舉個(gè)例子,A技能組排隊時(shí)現場(chǎng)管理員想將A技能組的流量切一些到B里,切多少,分給誰(shuí),可能都是拍腦袋決定,決策結果也無(wú)法沉淀;
3)手段缺:可用的手段非常少,無(wú)非就是手動(dòng)排班放班、手工切個(gè)流,管控下小休、發(fā)個(gè)公告等,沒(méi)有充分挖掘出客服的能力和潛力。
明確了客服調度的核心問(wèn)題,也知道了難點(diǎn),更看到了目前的現狀后,我們決定打造一款自動(dòng)、智能的客服調度系統——XSigma。
1.XSigma大圖
XSigma調度系統按功能模塊可以分為手、腦、眼幾塊。手就是能提升客服資源利用率、客服服務(wù)水平以及提升客戶(hù)滿(mǎn)意度的手段,比如溢出分流、預約回撥、現場(chǎng)管控、激勵、排班、應急放班、培訓等。手段這么多,在不同業(yè)務(wù)不同場(chǎng)景下如何抉擇是一個(gè)難點(diǎn),這里需要大腦也就是調度中心來(lái)做決策。決策產(chǎn)生的復雜調度邏輯如何能讓現場(chǎng)管理員、業(yè)務(wù)人員和開(kāi)發(fā)人員更好地理解?我們通過(guò)可視化技術(shù)將復雜的調度邏輯轉化為可以理解的實(shí)時(shí)圖形界面,即調度系統的眼睛-調度大屏。手、腦、眼功能具備后,如何讓他們磨合得越來(lái)越好?我們通過(guò)仿真演練系統來(lái)錘煉。

下面會(huì )對圖里的模塊一一介紹。
2.提前準備:排好班
如果能預測好需,準備好供,那客服調度就成功了一半。在我們業(yè)務(wù)中,不同類(lèi)型的客服排班模式不同。云客服采用的是自主選班模式,管理員只需設置好每個(gè)時(shí)間段的選班人數,讓云客服根據自己的時(shí)間來(lái)自行選班。而SP(合作伙伴)采用的是排班模式,需要管理員根據每個(gè)時(shí)間段的話(huà)務(wù)量來(lái)安排每一個(gè)客服,既要能夠保證每個(gè)時(shí)間段的接通率達到最大,又要能夠協(xié)調好客服人員的休息和工作時(shí)間,保證每個(gè)客服人員的總工時(shí)大致相等,這非常考驗管理員的統籌能力,當客服數目變多后,人工排班給管理員帶來(lái)了巨大挑戰。
不管哪種模式,都需要提前預測未來(lái)兩周的需要服務(wù)量(業(yè)務(wù)上按1~2周的粒度排班),這其實(shí)是個(gè)標準的時(shí)間序列預測問(wèn)題。結合歷史數據,我們可以按照部門(mén)-技能組的粒度預測出未來(lái)2周的服務(wù)量,當然,這種離線(xiàn)的預測只是一種近似,很難精準預測。

對于合作伙伴公司客服的排班,可以抽象為多約束條件下的優(yōu)化問(wèn)題,在實(shí)際場(chǎng)景中,我們采用了組合優(yōu)化算法。
3.水平擴容:預測式應急放班
提前排班很難精確預估服務(wù)量,我們不可能提前知道下周一13點(diǎn)25分會(huì )出現個(gè)代金券問(wèn)題導致大量用戶(hù)進(jìn)線(xiàn)咨詢(xún)。
對于這種突發(fā)性質(zhì)的流量或者比上班服務(wù)量大的流量,我們能不能像調度機器一樣,快速水平擴容一批客服來(lái)上班。對于社會(huì )化的云客服,我們可以做到,比如排隊數超過(guò)某值時(shí),自動(dòng)觸發(fā)云客服的應急放班。通過(guò)實(shí)踐發(fā)現云客服從選班到上班一般需要十多分鐘時(shí)間,如何進(jìn)一步節省這十多分鐘的黃金處理時(shí)間?將應急放班升級為預測式應急放班!提前幾分鐘預測到即將到來(lái)的大流量,提前放班。
這里涉及兩個(gè)模型,一個(gè)是服務(wù)量實(shí)時(shí)預測模型,該模型能根據實(shí)時(shí)數據如會(huì )員的操作行為,會(huì )員在小蜜的行為,故障場(chǎng)景,并結合歷史進(jìn)線(xiàn)量來(lái)綜合預測某一技能組未來(lái)30分鐘每一分鐘的進(jìn)線(xiàn)量。
有了服務(wù)量預測數據輸入后,應急放班模型就可以結合當前服務(wù)會(huì )員情況,未來(lái)30分鐘客服排班情況、會(huì )員消耗速度、溢出關(guān)系等綜合指標,來(lái)推斷出是否要觸發(fā)應急放班以及放班的服務(wù)量。一旦觸發(fā)應急放班后,線(xiàn)下通知模塊會(huì )通過(guò)電話(huà)、短信等手段來(lái)通知合適的客服來(lái)上班。
與調度機器不同,我們需要時(shí)刻考慮客服感受,為了避免打擾沒(méi)有上班意愿的客服,我們讓客服自主設置是否要接收通知。
4.負載均衡:溢出、分流
盡管預測式應急放班效果不錯,但目前只針對云客服有效,對于SP類(lèi)這種非選班類(lèi)的客服怎么辦?我們發(fā)現,線(xiàn)上排隊時(shí),往往是某幾個(gè)技能組出現大量排隊場(chǎng)景,比如商家線(xiàn)爆了,消費者線(xiàn)的客服可能處于空閑狀態(tài)。如何解決這種忙閑不均問(wèn)題?一個(gè)直觀(guān)的極端想法就將所有的組變成一個(gè)大池子組,通過(guò)負載均衡分配讓每一個(gè)客服都處于繁忙狀態(tài),從而達到效率最大化。而事實(shí)上并不是所有的技能組之間都能互相承接,這里既要權衡業(yè)務(wù),又要線(xiàn)下培訓讓客服具備多技能。
XSigma提供了技能組相互分流、溢出的配置功能,只要滿(mǎn)足觸發(fā)條件,就能實(shí)時(shí)分流溢出,解決了以往靠現場(chǎng)管理員手工改客服技能組的痛苦。


對于一些場(chǎng)景而言,技能組間的溢出粒度有點(diǎn)粗,比如設置了A技能組排隊可以溢出到B技能組,并不是B技能組的每一個(gè)客服都能承接A的業(yè)務(wù),只有進(jìn)行了培訓的客服才能承接,XSigma同樣提供了給客服打技能標簽的功能。
5.垂直擴容:彈性+1
有些業(yè)務(wù)比較復雜,很難找到其他技能組進(jìn)行溢出,我們將注意力轉到正在上班的客服上。在線(xiàn)客服可以同時(shí)服務(wù)多個(gè)會(huì )員,如果一個(gè)客服最大服務(wù)能力是3,那么他最多同時(shí)服務(wù)3個(gè)會(huì )員,這個(gè)值由管理員根據客服的歷史服務(wù)水平來(lái)設置。
我們發(fā)現盡管很多小二的最大并發(fā)能力是相同的,在他們滿(mǎn)負荷服務(wù)會(huì )員時(shí),他們的服務(wù)水平有很大不同,他們的忙閑程度也有非常大的差異,為什么?
- 小二本身水平有差異
如下圖所示,某技能組的客服最大服務(wù)能力都是3,最近一個(gè)月這個(gè)技能組的客服在同時(shí)服務(wù)3個(gè)會(huì )員場(chǎng)景下的平均響應時(shí)間分布(平均響應時(shí)間正比于客服回復速度),可以看到數據呈一個(gè)大致正太分布,說(shuō)明小二服務(wù)水平有差異。

- 場(chǎng)景不同
舉個(gè)例子,A和B兩個(gè)客服最大服務(wù)能力都是5,同樣都在處理5個(gè)會(huì )員,但是A的5個(gè)會(huì )員差不多都到會(huì )話(huà)結束尾聲了,B的5個(gè)會(huì )員都才剛剛開(kāi)始,這個(gè)例子下A和B兩個(gè)客服當下的忙閑程度明顯不同。
既然小二的服務(wù)水平有差別,實(shí)際場(chǎng)景千差萬(wàn)別,那能不能在技能組排隊時(shí)刻讓那些有余力的小二突破最大服務(wù)上限?
XSigma提供了兩種策略來(lái)讓小二突破服務(wù)上限。
1)主動(dòng)+1模式
當技能組達到觸發(fā)條件時(shí),XSigma會(huì )主動(dòng)點(diǎn)亮客服工作臺的+1按鈕(如下圖紅框所示),客服可以點(diǎn)擊來(lái)主動(dòng)增加一個(gè)會(huì )員進(jìn)線(xiàn),這種方式相當于是將擴容權利交給客服,因為只有客服自己知道目前忙不忙。

2)強制+1模式
如果某些技能組是強管控類(lèi)型,可以選擇開(kāi)啟強制+1模式,XSigma會(huì )結合數據自動(dòng)選擇一些合適的客服來(lái)突破服務(wù)能力上限,比如他之前最大服務(wù)能力是5,我們會(huì )同時(shí)讓他服務(wù)6個(gè)會(huì )員。
6.削峰填谷:預約回撥
對于熱線(xiàn)來(lái)說(shuō),小二不可能同時(shí)接好幾個(gè)電話(huà),而且業(yè)務(wù)上可承接的線(xiàn)下客服也少,這時(shí)候如果出現大面積排隊怎么辦?
通過(guò)數據分析發(fā)現,很多技能組在一天內的繁忙度在波動(dòng),有高峰也有低峰,下圖所示展示了某技能組的剩余服務(wù)數,可以看到有兩個(gè)繁忙時(shí)間段,10~13點(diǎn),17~21點(diǎn),這兩個(gè)時(shí)間段的空閑服務(wù)數很多時(shí)候都是0,而其它時(shí)間段相對比較空閑,如果能將這些繁忙時(shí)間段的進(jìn)線(xiàn)量騰挪到非繁忙時(shí)間段,這樣就能大大提升客服的人員利用率,也能避免客戶(hù)排隊的煩惱。
怎么做呢?通過(guò)預約回撥,將當下服務(wù)轉變?yōu)槲磥?lái)服務(wù)。如下圖所示,主要有兩個(gè)模塊構成。
1)預約觸發(fā)器。用戶(hù)電話(huà)進(jìn)來(lái)后,預約觸發(fā)器會(huì )根據技能組的繁忙情況,來(lái)判定是否要觸發(fā)預約;
2)回撥觸發(fā)器。采用系統主動(dòng)外呼模式,一旦發(fā)現技能組繁忙度處于低峰,就會(huì )觸發(fā)回撥,只要用戶(hù)電話(huà)被接通,就會(huì )以高優(yōu)先級進(jìn)入到分配環(huán)節,從而讓客服人員在有效的工作時(shí)間內都在真正的與客戶(hù)通話(huà)。

7.最優(yōu)分配
調度的目標是:“提升客服資源的利用率和服務(wù)水平,用更少的客服資源獲得更佳的用戶(hù)體驗”。前面這些策略的關(guān)注點(diǎn)更多是在提升客服資源利用率上,有沒(méi)有什么策略能提升用戶(hù)的滿(mǎn)意度?我們從分配這一環(huán)節入手。
本質(zhì)上我們要解決的是“會(huì )員(任務(wù))-客服匹配優(yōu)化”問(wèn)題。在傳統模式下,分配就是從某技能組的排隊隊列中找到一個(gè)等待時(shí)間最長(cháng)的會(huì )員,然后再找一個(gè)該技能組下最空閑的客服完成匹配。這種公平分配方式考慮維度單一,未能在全局層面上掌握和調度分配有關(guān)的會(huì )員、客服、問(wèn)題等各類(lèi)信息。
匹配優(yōu)化問(wèn)題其實(shí)是二部圖匹配問(wèn)題,如圖所示,在某一時(shí)刻,我們可以得到某技能組下未分配的客戶(hù)(任務(wù))以及具備剩余服務(wù)能力的客服,如果能知道每個(gè)任務(wù)與每個(gè)客服之間的匹配概率,那就可以通過(guò)穩定婚姻算法找到最佳匹配。

如何求得任務(wù)與客服之間的匹配概率?抽象為分類(lèi)回歸問(wèn)題,核心在于構建大量樣本(x1,x2,x3,…,xn)(y)。針對一通歷史會(huì )話(huà)任務(wù),y是客戶(hù)評分或會(huì )話(huà)時(shí)長(cháng)(目標可選),而x既包含了客服特征如過(guò)去30天的滿(mǎn)意度、平均響應時(shí)間等等離線(xiàn)指標,以及客服當前會(huì )話(huà)的服務(wù)會(huì )員數、最大會(huì )員數等實(shí)時(shí)指標,也包含了任務(wù)的特征,如問(wèn)題類(lèi)型、等待時(shí)間、訂單編號、重復咨詢(xún)次數等等。樣本有了后,下面就是選擇分類(lèi)算法進(jìn)行訓練,最終我們采用了CNN。
在迭代過(guò)程中發(fā)現,模型會(huì )將流量更多分配給好的客服,而指標相對較差的客服的流量則變少,為了避免少量客服上班接不到客反彈的情景,我們將公平性的指標引入到模型中。
8.智能培訓:大黃機器人
通過(guò)最優(yōu)分配來(lái)提升滿(mǎn)意度的一個(gè)重要原因是將流量更多分給了能力強水平高的客服,而這部分客服的占比不高,為什么?為了應對11、12這兩個(gè)特殊月份的高流量,業(yè)務(wù)團隊要招募培訓大量的云客服。這些新手涌入必然會(huì )對滿(mǎn)意度帶來(lái)影響,換句話(huà)說(shuō),如果要想進(jìn)一步提升滿(mǎn)意度指標,必須提升新手客服的服務(wù)水平。
對于新手,在上崗前提升他們水平的唯一方式就是培訓,傳統的培訓都是通過(guò)線(xiàn)下讓云客服看視頻等學(xué)習資料,然后進(jìn)行筆試,通過(guò)后就直接上崗,帶來(lái)的問(wèn)題是很多新客服對平臺的工具、解決方案都不熟悉就直接服務(wù)會(huì )員,會(huì )員體感較差。
對比練車(chē)場(chǎng)景,我們發(fā)現練車(chē)有科目1、科目2、科目3等不同流程,科目1學(xué)習理論,科目2和科目3實(shí)戰模擬,如果我們引入這種實(shí)戰模擬就能大大提升新客服的服務(wù)水平。
我們創(chuàng )新的提出了使用機器人(大黃)來(lái)培訓客服這一全新的客服培訓模式(已申請專(zhuān)利)。新客服在培訓租戶(hù)里,通過(guò)點(diǎn)擊大黃頭像,會(huì )產(chǎn)生一通非常真實(shí)的模擬會(huì )話(huà),通過(guò)和會(huì )員聊天,不斷學(xué)習平臺工具使用,不斷提升解決客戶(hù)問(wèn)題能力。一旦會(huì )話(huà)結束后,大黃機器人會(huì )對這通會(huì )話(huà)進(jìn)行評價(jià),并會(huì )告知應該使用某種具體的解決方案來(lái)回答用戶(hù)問(wèn)題。


對于新客服,目前必須完成大黃80通會(huì )話(huà)后才能上崗,整個(gè)財年培訓客服幾萬(wàn)人,服務(wù)會(huì )話(huà)量達到幾百萬(wàn)輪次。abtest顯示通過(guò)大黃試崗的客服不管在滿(mǎn)意度、不滿(mǎn)意、平均響應時(shí)間、平均服務(wù)時(shí)長(cháng)等各項指標上都有非常明顯提升。
9.統一的調度中心
從上面可以看到我們的客服調度策略多且復雜,每種策略都起到了一定提升客服資源的利用率和服務(wù)水平的作用。現在的問(wèn)題來(lái)了,不同場(chǎng)景下這么多策略如何選擇?比如現在技能組A突然排隊100個(gè)會(huì )員,這個(gè)時(shí)候是直接溢出到其他技能組,還是觸發(fā)主動(dòng)+1或觸發(fā)應急放班呢?這里需要一個(gè)大腦來(lái)做決策。
如何讓這個(gè)大腦適用于各種復雜的業(yè)務(wù)場(chǎng)景是難點(diǎn)。我們平臺目前租戶(hù)就有幾十個(gè),僅淘系這一個(gè)租戶(hù)就劃分了幾十個(gè)客服部門(mén),每個(gè)部門(mén)下又細分了一系列技能組,不同部門(mén)間業(yè)務(wù)場(chǎng)景不同。在嚴重缺乏歷史數據積累情況下,很難直接通過(guò)訓練一個(gè)決策模型來(lái)適應多種業(yè)務(wù)。于是我們的思路就轉換為直接利用現場(chǎng)管理員的專(zhuān)家知識,讓他們將決策邏輯沉淀為一條條的規則。
目前平臺上已經(jīng)配置了上萬(wàn)條規則,每天生效的規則也有幾千條,這些數據的沉淀讓我們可以通過(guò)智能優(yōu)化技術(shù)實(shí)現真正的智能調度決策大腦。
10.調度監控大屏
客服調度策略繁多、邏輯復雜,調度結果會(huì )切實(shí)影響整個(gè)環(huán)節參與者的感受,因此我們搭建了XSigma調度大屏,方便大家理解。在實(shí)踐過(guò)程中發(fā)現調度大屏能建立起使用方對調度系統的信任感,降低開(kāi)發(fā)人員和管理員發(fā)現、定位并解決系統問(wèn)題的成本。舉個(gè)例子,管理員在XSigma平臺上設置一些規則,比如A技能組排隊數>=1觸發(fā)溢出到B技能組,設置完后他心里沒(méi)底,他也不知道設置的邏輯是否生效,往往會(huì )讓開(kāi)發(fā)同學(xué)再次確定下有沒(méi)有生效,而現在有了可視化調度大屏,既能觀(guān)察到各個(gè)技能組的服務(wù)量、剩余服務(wù)量等實(shí)時(shí)監控數據,也能看到實(shí)時(shí)調度各種策略生效的過(guò)程,以及每天調度的實(shí)時(shí)匯總明細數據。
11.仿真演練
在調度優(yōu)化場(chǎng)景中,如何評估調度系統的好壞至關(guān)重要。有沒(méi)有一種手段能評估XSigma是否能適應各種場(chǎng)景?能提前證明在雙11這種大促期間也能順暢的調度?能及時(shí)發(fā)現調度過(guò)程中出現的問(wèn)題?這不僅是我們也是業(yè)務(wù)同學(xué)迫切需要知道的。
仔細思考發(fā)現,要解決的問(wèn)題和技術(shù)的全鏈路壓測要解決的問(wèn)題很相似,我們要做的其實(shí)是業(yè)務(wù)上的全鏈路壓測,于是我們搭建了客服調度的仿真演練系統。
基于大黃機器人,我們已經(jīng)能模擬會(huì )員進(jìn)線(xiàn),通過(guò)定制改造,機器人可以制造各種主題類(lèi)型的題目,比如雙十一類(lèi)型場(chǎng)景等。在此基礎上,結合業(yè)務(wù)同學(xué)的預估量,可以設置出各個(gè)技能組的進(jìn)線(xiàn)量。
在雙十一之前,業(yè)務(wù)同學(xué)使用這套演練系統大規模演練過(guò)兩次,由于是基于真實(shí)服務(wù)量進(jìn)行演練,而不是以前的口頭相傳的方式,讓調度上下游每一個(gè)參與的同學(xué)都有壓力感。在演練過(guò)程中發(fā)現的一些問(wèn)題改進(jìn)后,大大提升了我們應對大促突發(fā)流量的信心。
12.小結
XSigma智能客服調度系統采用自動(dòng)化配置、機器學(xué)習等技術(shù),將復雜的調度問(wèn)題分層處理,并在日益增長(cháng)的會(huì )員任務(wù)基礎上,不斷精細化調度模型依賴(lài)的狀態(tài)預估數值,不斷提高調度模型的多目標規劃能力,同時(shí)通過(guò)大量運用平臺可視化技術(shù),以實(shí)時(shí)、圖表化的方式將系統運行狀態(tài)呈現出來(lái),最終在客服效率和用戶(hù)體驗時(shí)間上得到優(yōu)化效果。該系統上線(xiàn)后,相比于往年,服務(wù)不可用時(shí)長(cháng)這一業(yè)務(wù)核心指標直接下降98%。