整天說(shuō)大數據,多大算大?
這么大的數據,怎么管?
語(yǔ)塞,心塞,喝酒吃飯...
后來(lái)想了一項,這看似門(mén)外的問(wèn)法其實(shí)涉及到了一個(gè)嚴肅的技術(shù)討論問(wèn)題,那就是DataGovernance,又叫做數據治理。第一次我在接觸這個(gè)詞的時(shí)候努力試圖把它與DataManagement數據管理分開(kāi),以宏觀(guān)(政府)和微觀(guān)(企業(yè))想映射。

數據就是二十一世紀的石油,所以“DataLake數據湖”產(chǎn)生了。對于企業(yè)來(lái)說(shuō),掌握數據就掌握了更多的可能。聯(lián)絡(luò )中心則是日以繼夜地生產(chǎn)大量數據的后方根據地,以一個(gè)100坐席規模的多媒體聯(lián)絡(luò )中心,每天產(chǎn)生的數據量也是驚人的:如通話(huà)數據、錄音數據、坐席數據、工單數據、日志數據、網(wǎng)頁(yè)數據等,如果是一個(gè)外呼的營(yíng)銷(xiāo)型聯(lián)絡(luò )中心或者工單派發(fā)型的服務(wù)聯(lián)絡(luò )中心,再配合CRM所產(chǎn)生的業(yè)務(wù)數據,日積月累,存儲空間會(huì )以T比特級別直線(xiàn)上升。
經(jīng)常業(yè)務(wù)部門(mén)要一個(gè)數據ETL做匹配篩選,或者來(lái)一份CDR詳單對一下明細,數據庫管理員DBA的內心深處其實(shí)是奔潰的,就好比:

hmm,來(lái)點(diǎn)干貨吧:
聯(lián)絡(luò )中心本質(zhì)上是一種綜合的信息處理系統,包括了多方的參與者,因此數據的生成可以從多個(gè)維度來(lái)進(jìn)行剖析。從宏觀(guān)來(lái)說(shuō)可以從業(yè)務(wù)流、知識流、信息流、數據流這四個(gè)層次去觀(guān)察。
- 業(yè)務(wù)流根據不同企業(yè)對聯(lián)絡(luò )中心的任務(wù)定義通過(guò)不同分工完成,各個(gè)崗位和組織之間的協(xié)作構成業(yè)務(wù)流,典型的就是一個(gè)電話(huà)訂單受理的流程,客戶(hù)來(lái)電下單,CSR在線(xiàn)受理后,提交工單,流轉到財務(wù)、審核、生產(chǎn)、物流形成一個(gè)線(xiàn)性的流程。站在這個(gè)維度,聯(lián)絡(luò )中心可以將觸角延伸到后臺處理,以一個(gè)“流程360度視圖”數據的方式來(lái)綜合提高運營(yíng)效率。
- 知識流則是在不同的崗位和組織之間進(jìn)行業(yè)務(wù)活動(dòng)時(shí)候,知識也在不斷的遷移。比如新產(chǎn)品的對應的營(yíng)銷(xiāo)話(huà)術(shù),投訴工單的聚類(lèi)和歸集輸出等等。
- 信息流的直接表現形式就是ERP/BPM或者CRM軟件,讓各種知識流在不同的IT信息系統中傳遞。
- 信息流最終具象成數據,要么短暫使用,要么持久化在數據庫中,形成數據湖,等待后期數據挖掘。
如果只有數據一直在存而不做數據挖掘分析,那就會(huì )形成數據“沼澤”,因此數據治理的第一步就應該是頂層設計,也就是數據分層。抽象地理解,聯(lián)絡(luò )中心的數據大致可以分為:
- 元數據:描述數據的數據MetaData
- 參考數據:如知識庫等包含通用不變的數據(網(wǎng)點(diǎn)、利率、等常見(jiàn)知識)
- 組織結構數據:坐席、崗位和后臺流程部門(mén)等
- 業(yè)務(wù)結構數據:用戶(hù)信息、理財產(chǎn)品、工單表格等
- 業(yè)務(wù)活動(dòng)數據:交互記錄、活動(dòng)數據、合同信息等
- 業(yè)務(wù)審計數據:操作記錄、審批記錄、質(zhì)檢記錄等
從聯(lián)絡(luò )中心層面來(lái)說(shuō),多種媒體渠道(語(yǔ)音、聊天、APP),各種工具軟件(知識庫、錄音)和應用程序(機器人)越來(lái)越復雜,相互依存度逐年增加,相應的追蹤整個(gè)客戶(hù)鏈條各組件之間數據流動(dòng)、了解數據元素含義和上下文的需求越來(lái)越強烈。比如一個(gè)客戶(hù)在A(yíng)PP上通過(guò)聊天機器人對話(huà)轉到人工,坐席后又主動(dòng)致電客戶(hù),后續質(zhì)檢人員在追蹤此條對話(huà)需要對應地抽取聊天記錄和通話(huà)錄音兩種數據,甚至還有后續客戶(hù)短信滿(mǎn)足度回放的結果。
從總量上來(lái)看,聯(lián)絡(luò )中心的元數據越來(lái)越多,光現有的數據模型中就包含了成千上萬(wàn)的表,同時(shí)還有更多的模型等著(zhù)上線(xiàn),同時(shí)隨著(zhù)大數據時(shí)代的來(lái)臨,企業(yè)需要處理的數據類(lèi)型越來(lái)越多,需要明確元數據管理策略和元數據集成體系結構,依托成熟的方法論和工具實(shí)現元數據管理,并有步驟的提升其元數據管理成熟度。
為了實(shí)現大數據治理,構建智慧的分析洞察Insight,僅僅是分析聯(lián)絡(luò )中心自身的數據,很難建立完整且一致的元數據管理策略,聯(lián)絡(luò )中心需要實(shí)現貫穿整個(gè)企業(yè)的元數據集成。該策略不僅僅針對某個(gè)數據倉庫項目、業(yè)務(wù)分析項目、某個(gè)大數據項目或某個(gè)應用單獨制定一個(gè)管理策略,而是針對整個(gè)企業(yè)構建完整的管理策略。
通俗的話(huà)說(shuō),就是聯(lián)絡(luò )中心在自身的元數據整理好、數倉建設好后,以ETL標準件方式主動(dòng)融入業(yè)務(wù)部門(mén)的大數據分析系統,形成更有力的數據治理。

其實(shí)后來(lái)想得清楚一些了,這就是道與術(shù)的區別,抖音一個(gè)機靈:《黃帝內經(jīng)》之素問(wèn)·四氣調神大論中提出到:“是故圣人不治已病治未病,不治已亂治未亂,此之謂也。呃~大概也就是這個(gè)意思。