開(kāi)放化的語(yǔ)音平臺結合場(chǎng)景化的應用,使得云呼叫中心平臺對容量和穩定性提出了更大的要求。如何滿(mǎn)足客戶(hù)彈性業(yè)務(wù)需求,應對業(yè)務(wù)時(shí)段峰值?下面就以某訂餐業(yè)務(wù)模型為例,探討下云呼叫中心架構該如何應對?
某外賣(mài)業(yè)務(wù)模型
某外賣(mài)業(yè)務(wù)模型

某外賣(mài)業(yè)務(wù)流量圖
每天中午11:00-12:30,晚上17:00-19:00訂餐業(yè)務(wù)高峰,極不均衡
設計原則
在智能云呼叫中心平臺設計之初,我們根據平臺客戶(hù)的業(yè)務(wù)需求特點(diǎn),對平臺架構設計確認了如下幾點(diǎn)原則:
1.平臺架構應基于開(kāi)放成熟的云IaaS服務(wù);
2.在云端進(jìn)行架構設計時(shí)要保持悲觀(guān),假設所有事物都會(huì )發(fā)生故障。換句話(huà)來(lái)說(shuō),架構需要面向故障的自動(dòng)化恢復來(lái)設計,實(shí)施和部署。平臺任何模塊必須是HA架構,消除單點(diǎn)模塊;
3.應用云IaaS服務(wù)與IDC機房由DX專(zhuān)線(xiàn)組成混合架構云;
4.分布式架構,必須非常容易擴容,支持自動(dòng)彈性伸縮;
5.平臺中模塊之間的關(guān)系降低耦合,便于業(yè)務(wù)的快速演進(jìn);
6.以業(yè)務(wù)監控、日志和統計為運營(yíng)核心構建平臺;
7.具備跨機房級別的高可用結構;
8.完善的完全機制,自我保護與服務(wù)降級能力;
實(shí)踐之路
憑借“云中優(yōu)勢”進(jìn)行系統組網(wǎng)。
基于云平臺的架構在組網(wǎng)結構上具備明顯的商業(yè)優(yōu)勢。體現在幾乎為零的啟動(dòng)成本,靈活的資源按需付費模式,快速的擴容上線(xiàn)能力等方面。
在技術(shù)層面云平臺架構也存在明顯優(yōu)勢。可實(shí)現自動(dòng)化構建和部署,自動(dòng)擴展無(wú)需人工干預,可將測試持續注入到開(kāi)發(fā)過(guò)程各個(gè)階段,實(shí)現改進(jìn)的可預測性。
天潤融通智能云呼叫中心平臺,基于A(yíng)WS云/阿里云+DX直連IDC組建的混合架構云,既能利用云平臺的“云中優(yōu)勢”又能兼容特殊應用讓平臺的運行上線(xiàn)無(wú)縫切換。在網(wǎng)絡(luò )架構上,將核心機房和落地機房通過(guò)專(zhuān)線(xiàn)打通,形成環(huán)線(xiàn)。其中任何一點(diǎn)的專(zhuān)線(xiàn)故障都可以通過(guò)整體的網(wǎng)絡(luò )調度,由其他專(zhuān)線(xiàn)或互聯(lián)網(wǎng)進(jìn)行切換傳送,從而不影響業(yè)務(wù)的正常運轉。

高可用的組網(wǎng)結構圖
在基礎IaaS云服務(wù)上構建大容量高可用的系統。
在基礎IaaS云服務(wù)方面,AWS與阿里云差別不大,以下僅以AWS為例說(shuō)明如何在基礎IaaS服務(wù)之上構建大容量高可用的系統。
目前智能云呼叫中心平臺架構基于A(yíng)WS所提供的3層基礎服務(wù):

AWS云平臺組件服務(wù)
第一層。 基礎計算、存儲和網(wǎng)絡(luò )組件,包括EC2,S3,EBS,VPC和DX等等。其中S3服務(wù)由AWS提供11個(gè)9的持久性,DX專(zhuān)線(xiàn)采用2條互為備份的1G直連保證了網(wǎng)絡(luò )性能。
第二層。高可用的數據庫RDS,Cache,SNS和SQS應用組件,支持跨機房的高可用和可靈活擴容。實(shí)時(shí)處理部分全部使用Rediscache降低數據庫壓力,大量使用SQS做異步化處理實(shí)現削峰填谷。
第三層。應用層的ELB負載均衡器,AutoScaling彈性伸縮,以及完善的監控和日志服務(wù)。系統各模塊首先全部是無(wú)狀態(tài)的,AutoScaling的應用使得通過(guò)ELB收集采樣來(lái)的當前負載和伸縮策略相結合,能夠動(dòng)態(tài)調整EC2的實(shí)例個(gè)數,當業(yè)務(wù)高峰時(shí)啟動(dòng)大量實(shí)例承接業(yè)務(wù),而低谷時(shí)減小實(shí)例降低成本。
在平臺架構設計中必須意識到,故障和故障切換是作為系統架構的一部分存在的。通過(guò)AWS/阿里云等云環(huán)境提供的容錯架構,大大降低了系統運維方面的復雜性,實(shí)際上這部分架構是由云環(huán)境完成了。與基礎硬件故障設計一樣,平臺軟件方面也必須進(jìn)行故障切換的架構設計,比如:如果一個(gè)模塊down掉,平臺上的應用怎么辦?如果接口請求超時(shí)或異常怎么處理?如果突發(fā)請求超過(guò)系統容量又怎么辦?
我們的經(jīng)驗是基于SOA面向服務(wù)的架構理念,構建組件之間的關(guān)鍵是減小組件之間的依賴(lài)。如果一個(gè)組件掛了沒(méi)有響應或響應時(shí)間過(guò)長(cháng),系統中其他組件應該能繼續工作。組件之間盡量相互獨立,通過(guò)異步交互方式使用消息隊列設計組件間的接口。這樣即使某些功能暫時(shí)不能用,整個(gè)系統仍然繼續運行,當出問(wèn)題的組件恢復后仍然可以使用消息隊列中的數據恢復運行狀態(tài)。
基于SOA面向服務(wù)的架構理念,我們解耦和拆分構建了大量的生態(tài)子系統,系統之間通過(guò)API調用構建完整的功能生態(tài)鏈,比如NOSS網(wǎng)管中心,BOSS營(yíng)帳中心,NMC碼號中心,TTS-proxy語(yǔ)音合成中心,SMSC短信平臺等等,整體架構如下圖所示意:

整體架構圖
除了整體生態(tài)系統層面做了解耦和面向微服務(wù)架構的拆分工作,智能云呼叫中心核心交換平臺也進(jìn)行了大量微模塊拆分。共計拆分了25個(gè)子系統,其中主要的子系統如下:
模塊名 | 用途 | 支持集群 | 主要協(xié)議 |
sip-media-server | 核心交換服務(wù) | 支持 | SIP/RTP |
sip-proxy | 核心調度服務(wù) | 支持 | SIP/TCP |
Webrtc-gateway | Webrtc接入網(wǎng)關(guān) | 支持 | SIP/Websocket |
realtime | 運行時(shí)實(shí)時(shí)數據服務(wù) | 支持 | HTTP |
cdr | 話(huà)單采集和處理服務(wù) | 支持 | HTTP |
webcall | Webcall接口模塊 | 支持 | HTTP |
PredictDialer | 預測外呼模塊 | 支持 | HTTP |
ASR | 智能語(yǔ)音轉寫(xiě)模塊 | 支持 | HTTP |
conf-api | 配置接口服務(wù) | 支持 | HTTP |
data-api | 業(yè)務(wù)數據接口 | 支持 | HTTP |
control-api | 控制接口服務(wù) | 支持 | HTTP |
task-engine | 任務(wù)引擎服務(wù) | 支持 | HTTP |
agent-gateway | 坐席管理模塊 | 支持 | Websocket/Redis |
big-queue | 統一排隊服務(wù) | 支持 | HTTP |
上述子系統,全部實(shí)現了無(wú)狀態(tài)邏輯,用集群堆疊的方式實(shí)現高可用和高性能。架構實(shí)現要點(diǎn)有:
1.對上層提供統一的接口服務(wù),接口服務(wù)版本可靈活擴展;
2.ConfDB和CacheDB完全分離,實(shí)時(shí)業(yè)務(wù)不依賴(lài)于配置庫,只使用高性能緩存庫;
3.將超大量數據存儲和運行時(shí)數據存儲完全分離,使用云環(huán)境對象存儲和nosql數據庫實(shí)現海量數據的存儲和處理;
4.AutoScaling彈性伸縮時(shí)實(shí)例自舉,實(shí)例向控制服務(wù)詢(xún)問(wèn):“我是誰(shuí)?我該干什么?”盡量減少人為部署失誤,創(chuàng )建一個(gè)自愈環(huán)境;
5.使用開(kāi)源dubbo自動(dòng)管理服務(wù);
6.要有完整的監控服務(wù)。

核心交換平臺模塊架構圖
云服務(wù)的安全機制
云時(shí)代所面臨的安全問(wèn)題極其重要。天潤融通智能云呼叫中心平臺的架構設計準備了三重備份機制:第一基于A(yíng)WS云平臺。首先在A(yíng)WSA/B機房實(shí)現雙活的數據中心;第二將業(yè)務(wù)數據在核心機房進(jìn)行熱備,一旦AWS云服務(wù)出現全局問(wèn)題立刻切換業(yè)務(wù)到核心機房保持業(yè)務(wù)持續服務(wù);第三將數據進(jìn)行孤島離線(xiàn)冷備份,確保數據可恢復。

在安全架構上,除了技術(shù)上防范比如sql注入,web漏洞,暴力破解等,還采用一系列安全架構提供安全保障,包括對外的入侵檢測系統、WAF防護、網(wǎng)絡(luò )防火墻,和對內的賬號權限管理審計等。

實(shí)踐成果
天潤融通大容量高可用的呼叫中心平臺架構,使云呼叫中心在性能上可以有能力比肩,甚至超過(guò)原有的以硬件為核心的呼叫中心系統,徹底打破了人們對曾經(jīng)云呼叫中心只能做小客戶(hù)的固有印象。具體實(shí)踐成果如下:
1、解決大容量并發(fā)問(wèn)題。
基本指標包括:呼叫并發(fā)能力超過(guò)10000線(xiàn);并發(fā)坐席超過(guò)20000席;CPS(每秒處理呼叫數)能力在200-400之間;支持單平臺最大1000租戶(hù);呼叫響應時(shí)間小于1秒;每天處理200萬(wàn)分鐘通話(huà);TTS平均響應時(shí)間少于1秒;消息響應時(shí)間小于1秒;錄音轉換效率應通話(huà)結束后小于1分鐘可用;每天處理800G錄音(壓縮后);
2.解決平臺高可用問(wèn)題,消除單點(diǎn),跨機房級負載均衡,平臺有超高穩定性
3.彈性伸縮能力解決業(yè)務(wù)峰值問(wèn)題
4.完整的生態(tài)子系統解決運營(yíng)成本問(wèn)題
憑借大容量高可用的智能云呼叫中心平臺,天潤融通收獲了各行業(yè)客戶(hù)的認可。快速靈活可擴展的云模式,也更加適應未來(lái)技術(shù)及業(yè)務(wù)的成長(cháng)性需求,讓呼叫中心的能力在未來(lái)可以持續增長(cháng)。