首頁(yè)>>>技術(shù)>>>CRM  CRM產(chǎn)品

數據挖掘在電信行業(yè)關(guān)系管理的應用

龍志勇 中國電信集團北京研究院技術(shù)部研發(fā)人員 2004/01/06

  摘 要 文章介紹了數據挖掘技術(shù)的相關(guān)知識及其在電信行業(yè)客戶(hù)關(guān)系管理中的應用,并以客戶(hù)流失分析作為實(shí)例,詳細描述了數據挖掘的整個(gè)應用過(guò)程,最后對國內數據挖掘應用的現狀進(jìn)行了分析。

  關(guān)鍵詞 數據挖掘 客戶(hù)關(guān)系管理 客戶(hù)流失

  隨著(zhù)國內電信市場(chǎng)競爭的日趨激烈,電信運營(yíng)商的經(jīng)營(yíng)模式逐漸從“技術(shù)驅動(dòng)”向“市場(chǎng)驅動(dòng)”、“客戶(hù)驅動(dòng)”轉化。這就要求運營(yíng)商要采取以客戶(hù)為中心的策略,根據客戶(hù)的實(shí)際需求提供多樣化、層次化、個(gè)性化的服務(wù)解決方案。因此,客戶(hù)關(guān)系管理(CRM)成了電信運營(yíng)商增加收入和利潤,提高客戶(hù)滿(mǎn)意度、忠誠度的有效工具。在客戶(hù)關(guān)系管理的流程中,為了準確、及時(shí)地進(jìn)行經(jīng)營(yíng)決策,必須充分獲取并利用相關(guān)的數據信息對決策過(guò)程進(jìn)行輔助支持。近幾年迅速發(fā)展起來(lái)的數據挖掘技術(shù)就是實(shí)現這一目標的重要手段。

一、數據挖掘的概念和過(guò)程

1.數據挖掘的概念

  數據挖掘是根據企業(yè)的既定業(yè)務(wù)目標和存在的問(wèn)題,對大量的業(yè)務(wù)數據進(jìn)行探索,揭示其中隱藏的規律,并將其模型化,指導并應用于企業(yè)的實(shí)際經(jīng)營(yíng)。

  數據挖掘是建立在數據倉庫基礎上的高層應用,但數據挖掘跟數據倉庫的其它一些應用如OLAP分析、預定義報表和即席查詢(xún)等有很大的區別。后三者通常是用戶(hù)根據已知的情況對所關(guān)心的業(yè)務(wù)指標進(jìn)行分析;而前者則是在業(yè)務(wù)問(wèn)題和目標明確但考察的問(wèn)題不清楚時(shí),對數據進(jìn)行探索,揭示隱藏其中的規律性,進(jìn)而將其模型化。

2.數據挖掘過(guò)程

  數據挖掘是一個(gè)循環(huán)往復的過(guò)程,通常涉及數據準備、建立模型、評估和解釋模型、運用和鞏固模型等步驟。

(1)數據準備:數據準備工作包括數據的選擇(選擇相關(guān)和合適的數據)、探索(了解數據分布情況和異常數據等)、修正(包括缺失數據的插值等)和變換(離散值數據與連續值數據的相互轉換,數據的分組分類(lèi),數據項的計算組合等)。

(2)建立模型:選取數據挖掘工具提供的算法并應用于準備好的數據,選取相應參數,生成模型。

(3)評估和解釋模型:對模型進(jìn)行比較和評估,生成一個(gè)相對最優(yōu)模型,并對此模型用業(yè)務(wù)語(yǔ)言加以解釋。

(4)運用和鞏固模型:對模型在實(shí)際應用中的表現進(jìn)行監控,如果模型表現不好,則對模型作進(jìn)一步的考察和修正,以反映業(yè)務(wù)運作規律的變化。

二、數據挖掘在客戶(hù)關(guān)系管理中的應用

  電信運營(yíng)商擁有許多成熟的數據庫應用系統,如網(wǎng)管系統、財務(wù)系統、計費賬務(wù)系統、112障礙管理系統、繳費銷(xiāo)賬系統等,并產(chǎn)生了大量的業(yè)務(wù)處理數據。如果針對客戶(hù)關(guān)系管理相關(guān)決策分析的需求,對這些數據進(jìn)行重組整合,就能充分利用這些寶貴的數據,體現信息的真正價(jià)值。

數據挖掘技術(shù)在電信行業(yè)客戶(hù)關(guān)系管理的主要應用領(lǐng)域如下:

(1)客戶(hù)消費模式分析

  客戶(hù)消費模式分析(如固話(huà)話(huà)費行為分析)是對客戶(hù)歷年來(lái)長(cháng)話(huà)、市話(huà)、信息臺的大量詳單、數據以及客戶(hù)檔案資料等相關(guān)數據進(jìn)行關(guān)聯(lián)分析,結合客戶(hù)的分類(lèi),可以從消費能力、消費習慣、消費周期等諸方面對客戶(hù)的話(huà)費行為進(jìn)行分析和預測,從而為固話(huà)運營(yíng)商的相關(guān)經(jīng)營(yíng)決策提供依據。

(2)客戶(hù)市場(chǎng)推廣分析

  客戶(hù)市場(chǎng)推廣分析(如優(yōu)惠策略預測仿真)是利用數據挖掘技術(shù)實(shí)現優(yōu)惠策略的仿真,根據數據挖掘模型進(jìn)行模擬計費和模擬出賬,其仿真結果可以揭示優(yōu)惠策略中存在的問(wèn)題,并進(jìn)行相應的調整優(yōu)化,以達到優(yōu)惠促銷(xiāo)活動(dòng)的收益最大化。

(3)客戶(hù)欠費分析和動(dòng)態(tài)防欺詐

  通過(guò)數據挖掘,總結各種騙費、欠費行為的內在規律,并建立一套欺詐和欠費行為的規則庫。當客戶(hù)的話(huà)費行為與該庫中規則吻合時(shí),系統可以提示運營(yíng)商相關(guān)部門(mén)采取措施,從而降低運營(yíng)商的損失風(fēng)險。

(4)客戶(hù)流失分析

  根據已有的客戶(hù)流失數據,建立客戶(hù)屬性、服務(wù)屬性、客戶(hù)消費情況等數據與客戶(hù)流失概率相關(guān)聯(lián)的數學(xué)模型,找出這些數據之間的關(guān)系,并給出明確的數學(xué)公式。然后根據此模型來(lái)監控客戶(hù)流失的可能性,如果客戶(hù)流失的可能性過(guò)高,則通過(guò)促銷(xiāo)等手段來(lái)提高客戶(hù)忠誠度,防止客戶(hù)流失的發(fā)生。這就徹底改變了以往電信運營(yíng)商在成功獲得客戶(hù)以后無(wú)法監控客戶(hù)流失、無(wú)法有效實(shí)現客戶(hù)關(guān)懷的狀況。

三、數據挖掘的應用實(shí)例——客戶(hù)流失分析

  一個(gè)完整的數據挖掘過(guò)程可進(jìn)一步細分為:業(yè)務(wù)問(wèn)題定義,數據選擇,數據清洗和預處理,模型選擇與預建立,模型建立與調整,模型的評估與檢驗,模型解釋與應用。

1.業(yè)務(wù)問(wèn)題定義

  針對客戶(hù)流失的不同種類(lèi)分別定義業(yè)務(wù)問(wèn)題,進(jìn)而區別處理。在客戶(hù)流失分析中有兩個(gè)核心變量:財務(wù)原因/非財務(wù)原因、主動(dòng)流失/被動(dòng)流失。客戶(hù)流失可以相應分為四種類(lèi)型,其中非財務(wù)原因主動(dòng)流失的客戶(hù)往往是高價(jià)值的客戶(hù),他們會(huì )正常支付服務(wù)費用,并容易對市場(chǎng)活動(dòng)有所響應。這種客戶(hù)是我們真正需要保住的客戶(hù)。此外在分析客戶(hù)流失時(shí)必須區分集團/個(gè)人客戶(hù),以及不同消費水平的客戶(hù),并有針對性地制定不同的流失標準。例如,平均月消費額2 000元的客戶(hù)連續幾個(gè)月消費額降低到500元以下,就可以認為客戶(hù)流失發(fā)生了,而這個(gè)流失標準不適用于原來(lái)平均月消費額500元的客戶(hù)。國外成熟的應用中通常根據相對指標來(lái)判別客戶(hù)流失,例如大眾的個(gè)人通信費用約占總收入的1%~3%,當客戶(hù)的個(gè)人通信費用遠低于此比例時(shí),就認為發(fā)生了客戶(hù)流失。

2.數據選擇

  數據選擇包括目標變量的選擇、輸入變量的選擇和建模數據的選擇。

(1)目標變量的選擇

  客戶(hù)流失分析的目標變量通常為客戶(hù)流失狀態(tài)。根據業(yè)務(wù)問(wèn)題的定義,可以選擇一個(gè)已知量或多個(gè)已知量的組合作為目標變量。實(shí)際的客戶(hù)流失形式有兩種:因賬戶(hù)取消發(fā)生的流失,因賬戶(hù)休眠發(fā)生的流失。對于因賬戶(hù)取消發(fā)生的流失,目標變量可以直接選取客戶(hù)的賬戶(hù)狀態(tài)(取消或正常);對于因賬戶(hù)休眠發(fā)生的流失,可以認為持續休眠超過(guò)一定時(shí)間長(cháng)度的客戶(hù)發(fā)生了流失。這時(shí)需要對相關(guān)的具體問(wèn)題加以考慮:持續休眠的時(shí)間長(cháng)度定義為多少?每月通話(huà)金額低于多少即認為處于休眠狀態(tài),或者是綜合考慮通話(huà)金額、通話(huà)時(shí)長(cháng)和通話(huà)次數來(lái)劃定休眠標準?選擇目標變量時(shí)面臨的這些問(wèn)題需要業(yè)務(wù)人員給予明確的回答。

(2)輸入變量的選擇

  輸入變量是模型中的自變量,在建模過(guò)程中需要尋找自變量與目標變量的關(guān)聯(lián)。輸入變量分為靜態(tài)數據和動(dòng)態(tài)數據。靜態(tài)數據指不常變化的數據,包括服務(wù)合同屬性(如服務(wù)類(lèi)型、服務(wù)時(shí)間、交費類(lèi)型)和客戶(hù)的基本資料(如性別、年齡、收入、婚姻狀況、學(xué)歷、職業(yè)、居住地區);動(dòng)態(tài)數據指頻繁或定期改變的數據,如月消費金額、交費記錄、消費特征。業(yè)務(wù)人員在實(shí)際業(yè)務(wù)活動(dòng)中可能會(huì )感覺(jué)到輸入變量與目標變量的內在聯(lián)系,只是無(wú)法量化表示出來(lái),這就給數據挖掘留下了發(fā)揮的空間。如果一時(shí)無(wú)法確定某種數據是否與客戶(hù)流失概率有關(guān)聯(lián),應該暫時(shí)將其選入模型,并在后續步驟考察各變量分布情況和相關(guān)性時(shí)再行取舍。

(3)建模數據的選擇

  客戶(hù)流失的方式有兩種。第一種是客戶(hù)的自然消亡,例如身故、破產(chǎn)、遷徙、移民而導致客戶(hù)不再存在,或者由于客戶(hù)服務(wù)的升級(如撥號接入升級為ADSL接入)造成特定服務(wù)的目標客戶(hù)消失。第二種是客戶(hù)的轉移流失,通常指客戶(hù)轉移到競爭對手,并使用其服務(wù)。第二種流失的客戶(hù)才是運營(yíng)商真正關(guān)心的、具有挽留價(jià)值的客戶(hù)。因此在選擇建模數據時(shí)必須選擇第二種流失客戶(hù)數據參與建模,才能建立有效的模型。

3.數據清洗和預處理

  數據清洗和預處理是建模前的數據準備工作,一方面保證建模數據的正確性和有效性,另一方面通過(guò)對數據格式和內容的調整,使數據更符合建模的需要。數據整理的主要工作包括對數據的轉換和整合、抽樣、隨機化、缺失值處理等等。例如按比例抽取未流失客戶(hù)和已流失客戶(hù),將這兩類(lèi)數據合并,構成建模的數據源。此外,模型在建立之后需要大量的數據來(lái)進(jìn)行檢驗,因此通常把樣本數據分為兩部分,2/3的數據用于建模,1/3的數據用于模型的檢驗和修正。

4.模型選擇與預建立

  在模型建立之前,可以利用數據挖掘工具的相關(guān)性比較功能,找出每一個(gè)輸入變量和客戶(hù)流失概率的相關(guān)性,刪除相關(guān)性較小的變量,從而可以縮短建模時(shí)間,降低模型復雜度,有時(shí)還能使模型更精確。現有的數據挖掘工具提供了決策樹(shù)、神經(jīng)網(wǎng)絡(luò )、近鄰學(xué)習、回歸、關(guān)聯(lián)、聚類(lèi)、貝葉斯判別等多種建模方法。可以分別使用其中的多種方法預建立多個(gè)模型,然后對這些模型進(jìn)行優(yōu)劣比較,從而挑選出最適合客戶(hù)流失分析的建模方法。此外數據挖掘工具還提供了選擇建模方法的功能,系統可自動(dòng)判別最優(yōu)模型,供使用者參考。

5.模型建立與調整

  模型建立與調整是數據挖掘過(guò)程中的核心部分,通常由數據分析專(zhuān)家完成。需要指出的是,不同的商業(yè)問(wèn)題和不同的數據分布屬性會(huì )影響模型建立與調整的策略,而且在建模過(guò)程中還會(huì )使用多種近似算法來(lái)簡(jiǎn)化模型的優(yōu)化過(guò)程。因此還需要業(yè)務(wù)專(zhuān)家參與調整策略的制定,以避免不適當的優(yōu)化造成業(yè)務(wù)信息丟失。

6.模型的評估與檢驗

  應該利用未參與建模的數據進(jìn)行模型的評估,才能得到準確的結果。檢驗的方法是使用模型對已知客戶(hù)狀態(tài)的數據進(jìn)行預測,將預測值與實(shí)際客戶(hù)狀態(tài)作比較,預測正確率最高的模型是最優(yōu)模型。

7.模型解釋與應用

  業(yè)務(wù)人員應該針對最優(yōu)模型進(jìn)行合理的解釋。如發(fā)現開(kāi)戶(hù)時(shí)長(cháng)與客戶(hù)流失概率的相關(guān)度較高,利用業(yè)務(wù)知識可以解釋為:客戶(hù)在使用一定年限后需要換領(lǐng)新SIM卡,而這一手續的繁瑣導致客戶(hù)寧愿申請新號碼,從而造成客戶(hù)流失。通過(guò)對模型做出合理的業(yè)務(wù)解釋?zhuān)梢哉页鲆恍撛诘囊幝桑糜谥笇I(yè)務(wù)行為。反過(guò)來(lái),通過(guò)業(yè)務(wù)解釋也能證明數學(xué)模型的合理性和有效性。

  在模型應用過(guò)程中,可以先選擇一個(gè)試點(diǎn)實(shí)施應用,試點(diǎn)期間隨時(shí)注意模型應用的收益情況。一旦發(fā)生異常偏差,則立即停止應用,并對模型進(jìn)行修正。試點(diǎn)結束后,若模型被證明應用良好,可以考慮大范圍推廣。推廣時(shí)應注意,由于地區差異,模型不能完全照搬。可以先由集團總部建立一個(gè)通用模型,各省分公司在此基礎上利用本地數據進(jìn)行修正,從而得到適用于本省的精確模型。在模型應用一段時(shí)期,或經(jīng)濟環(huán)境發(fā)生重大變化后,模型的偏差可能會(huì )增大,這時(shí)應該考慮重新建立一個(gè)適用性更強的模型。

四、國內數據挖掘應用中存在的問(wèn)題

(1)數據質(zhì)量和完備性

  國內電信運營(yíng)商現有的、面向事務(wù)的數據在質(zhì)量、完整性和一致性上存在許多問(wèn)題,必須投入大量的精力去進(jìn)行數據的抽取、凈化和處理。此外,業(yè)務(wù)問(wèn)題的相關(guān)數據有時(shí)難以全面收集。例如客戶(hù)信用是客戶(hù)價(jià)值評估中的關(guān)鍵因素,但由于國內未建立完善的信用體系,無(wú)法根據現有客戶(hù)數據建立優(yōu)質(zhì)的信用評價(jià)模型,從而導致客戶(hù)價(jià)值模型有效性的降低。

(2)相應的人員素質(zhì)

  在數據挖掘應用過(guò)程的多個(gè)環(huán)節中,人的主觀(guān)辨識和控制是應用成敗的關(guān)鍵,這就對系統使用人員提出了很高的要求。如果沒(méi)有具備相應素質(zhì)的使用和維護人員,必將導致分析系統與現實(shí)脫鉤,無(wú)法達到預期效果。

(3)應用周期

  數據挖掘存在一個(gè)較長(cháng)的應用周期。技術(shù)本身不能給使用者解決任何問(wèn)題,只能從數據中把一些潛在的情況呈現到使用者面前,由使用者采取相應措施。數據挖掘應用的有效方法是:從一個(gè)較小的、關(guān)鍵的問(wèn)題出發(fā),建立起相對有效的模型,并通過(guò)應用實(shí)踐不斷檢驗和完善模型,逐步替使用者解決問(wèn)題。

中國通信網(wǎng)(www.c114.net)—信息網(wǎng)絡(luò )


相關(guān)鏈接:
2003年CRM市場(chǎng)發(fā)展回顧 2004-01-06
HOLLYCRM:側重應用 2004-01-06
客戶(hù)關(guān)系管理中的另一核心:服務(wù)和支持體系 2004-01-05
2004年CRM發(fā)展方向預測 2003-12-31
智能化您的CRM 2003-12-29

分類(lèi)信息:  電信_與_CRM     文摘   行業(yè)_電信_解決方案   技術(shù)_CRM_技術(shù)文摘
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 无为县| 闻喜县| 庆云县| 万载县| 云梦县| 化州市| 濮阳市| 宁国市| 新宾| 洱源县| 太仓市| 长治县| 峡江县| 成武县| 若羌县| 丹东市| 蒙山县| 夏河县| 竹北市| 山西省| 财经| 汉川市| 张北县| 绥滨县| 古交市| 中牟县| 吴旗县| 正安县| 山丹县| 手机| 安多县| 晋宁县| 三门峡市| 根河市| 孝感市| 梁河县| 育儿| 新郑市| 临沂市| 高雄市| 宜章县| http://444 http://444 http://444 http://444 http://444 http://444