2015年3月份,巴塞羅那通信展上有個(gè)北歐小公司KLarna(網(wǎng)上可以查到),是做電商的。KLarna的電商和一般電商不同,用戶(hù)注冊身份后,不需要關(guān)聯(lián)銀行賬戶(hù),不需要支付寶,憑借的是信用交易,先買(mǎi)喜歡的商品,由KLarna墊付資金給商家,然后在一定期限內,用戶(hù)可以通過(guò)多種方式(包含郵寄)將欠款還上。其欠費風(fēng)險控制主要來(lái)自大數據,至少你惡意欠過(guò)一次后就不會(huì )那么方便欠第二次。
第一次聽(tīng)到KLarna CEO的演講,覺(jué)得在中國這樣信用缺失嚴重的國家不可能生存。仔細想一想,其實(shí)不然。過(guò)去銀行給窮學(xué)生發(fā)信用卡,憑借的也只是一個(gè)身份,沒(méi)有任何可抵押的東西,就可以給幾千的受信額度,實(shí)際上這些學(xué)生的惡意欠費占總信用消費的比例,一定在一個(gè)可以控制的水平之內。在一個(gè)個(gè)人信用越來(lái)越受重視的社會(huì ),類(lèi)似這樣的信用經(jīng)濟一定有廣闊的空間,這也是KLarna快速融資數億美金并受追捧的重要原因。
最近阿里的“芝麻信用”分數與旅行社辦理新加坡、盧森堡的簽證進(jìn)行關(guān)聯(lián),這是信用生活的一種應用形式,其實(shí),更廣泛的想一想,目前的拼車(chē)、租車(chē)如果加入信用評級結果,業(yè)務(wù)量一定進(jìn)一步提升,用戶(hù)體驗及保障也會(huì )進(jìn)一步增強。
第二、信息安全是繞不過(guò)去的門(mén)檻
如果說(shuō)市場(chǎng)前景可以通過(guò)畫(huà)餅進(jìn)行預期的話(huà),那么信息安全是制約運營(yíng)商大數據變現的最艱難的門(mén)檻。
2013年7月19日工信部發(fā)布的《電信和互聯(lián)網(wǎng)用戶(hù)個(gè)人信息保護規定》,其總則中明確提出“用戶(hù)個(gè)人信息”的定義“用戶(hù)個(gè)人信息,是指電信業(yè)務(wù)經(jīng)營(yíng)者和互聯(lián)網(wǎng)信息服務(wù)提供者在提供服務(wù)的過(guò)程中收集的用戶(hù)姓名、出生日期、身份證件號碼、住址、電話(huà)號碼、賬號和密碼等能夠單獨或者與其他信息結合識別用戶(hù)的信息以及用戶(hù)使用服務(wù)的時(shí)間、地點(diǎn)等信息”,能夠追溯到個(gè)人終端的使用服務(wù)時(shí)間、地點(diǎn)信息也屬于個(gè)人信息,其采集要遵行必要性原則,起使用要遵行告知并取得用戶(hù)同意的原則,而且明確不得泄露、篡改或者毀損,不得出售或者非法向他人提供。
按照該規定,目前互聯(lián)網(wǎng)上的眾多數據采集與交易都在規定的邊緣,甚至或多或少存在違規現象。2015年3月華為在巴塞羅那通信展上的大數據解決方案中,專(zhuān)門(mén)有一個(gè)模塊,滿(mǎn)足防守條款要求,也就是允許客戶(hù)選擇公開(kāi)或關(guān)閉個(gè)人信息(或某個(gè)部分的個(gè)人信息)。
如果嚴格按照該條款,任何能夠關(guān)聯(lián)到客戶(hù)號碼或終端的個(gè)性化精準廣告推薦都是行走在邊緣地帶,雖然以畫(huà)像或標簽化方式能夠規避其中的部分風(fēng)險。中國電信在大數據應用上走得較領(lǐng)先,也把安全性原則列在開(kāi)放DMP業(yè)務(wù)規范基本原則第一條,如“進(jìn)入大數據能力平臺的用戶(hù)屬性數據與行為數據必須脫敏,脫敏數據不得包含能夠直接或與其他數據關(guān)聯(lián)后可間接追溯真實(shí)用戶(hù)信息的內容”,但實(shí)際應用中,如果不能關(guān)聯(lián)到用戶(hù)終端,如何應用于RTB實(shí)時(shí)精準廣告推薦?
受該規定的影響,任何能夠追溯到個(gè)人或終端的數據變現應用,與第三方進(jìn)行變現合作均存在不可預料難以管控的風(fēng)險。即便是經(jīng)過(guò)用戶(hù)授權同意的征信應用,往往蹦出一例安全事件(合作方將數據應用在非合作應用領(lǐng)域),媒體放大后就會(huì )成為運營(yíng)商不可承受之重。
從未來(lái)的趨勢看,即便大數據應用專(zhuān)家呼吁新的數據倫理,但關(guān)系到個(gè)人信息保護,其規定只會(huì )越來(lái)越強。國外運營(yíng)商之所以少有大數據變現成功經(jīng)驗,大多受此制約。如Verizon的Pricision Insight服務(wù),跟合作方共享面向商場(chǎng)、體育館、廣告牌業(yè)主等特定場(chǎng)所手機用戶(hù)的活動(dòng)和背景信息。因為只有2%的用戶(hù)愿意提供自身信息,實(shí)際應用價(jià)值大打折扣。
第三、端到端變現能力不足
如果運營(yíng)商能和BAT一樣,有自己完整的端到端變現能力,比如獨立申請征信拍照并推廣征信應用,比如獨自經(jīng)營(yíng)廣告業(yè)務(wù),如廣點(diǎn)通、阿里媽媽、百度一樣,獨立的廣告變現渠道,所有的用戶(hù)數據流轉在自身的體系內,那么一切風(fēng)險都變得可控。因為對外提供的是評分結果,是推薦的廣告內容,而不是用戶(hù)的行為特征數據。
但問(wèn)題在于,BAT是先有變現渠道,后有大數據應用,就如先有微信用戶(hù)群、先有朋友圈分享,后有精準feed廣告一樣,數據變現渠道是一項直接到達用戶(hù)的核心能力,并不是簡(jiǎn)單投入就能獲取的。
說(shuō)到這兒,感覺(jué)有點(diǎn)憋屈,運營(yíng)商的大數據就如蒙古國的煤礦與稀土一樣,自身消化不了,只能靠賣(mài)給中國或通過(guò)中國的火車(chē)賣(mài)到海外,才能實(shí)現價(jià)值。
除了變現渠道之外,還有一項變現能力存在不足,該能力與運營(yíng)商自身密切相關(guān),那就是面向應用的數據理解與模型應用能力,該部分能力其實(shí)更為重要,更需要持續的資源投入。
目前的問(wèn)題也在于此,一方面需要資源投入鍛煉數據理解與模型應用能力。這里特別強調面向真實(shí)應用,因為脫離真實(shí)應用的研究性投入并不能給實(shí)際數據模型能力提升產(chǎn)生多大幫助。比如對上網(wǎng)日志的解讀,只有針對具體的應用場(chǎng)景,才有可能對某些電商網(wǎng)站的行為對應的URL代碼進(jìn)行深入爬蟲(chóng)分析。只有參與到征信模型及應用中去,才能檢驗想象中的影響因素與真實(shí)情況的一致性,比如打電話(huà)多的其綜合信用評分可能不是更高,而是更低。另一方面缺少外部合作,較難理解真實(shí)數據需求,同時(shí)缺少變現收益來(lái)支撐持續資源投入。
四、合作試點(diǎn)是解決之道
雖然步履蹣跚,但廣闊的前景仍然吸引運營(yíng)商省公司積極探索、大膽創(chuàng )新。受去年上海踩踏事件的影響,目前面向政府、旅游部門(mén)的區域人流量統計與告警應用如火如荼,并逐步向其它應用領(lǐng)域積極探索。
在數據分析方面,有一個(gè)很老的拇指法則:數據分析工作有70%-80%的時(shí)間花在收集和準備數據上面,僅有20%-30%的時(shí)間花在分析本身上。在剛開(kāi)始處理大數據時(shí),這個(gè)比例估計會(huì )更低。確定大數據中有價(jià)值的部分,并確定如何最優(yōu)而精確地提取這些部分,非常關(guān)鍵,其實(shí)這也是探索并優(yōu)化應用模型的重要過(guò)程。
大數據公司通常定期展示一些洞察報告,就是邊理解邊實(shí)踐的一種良性循環(huán),不管這些洞察報告多么微不足道。這些不定期的洞察報告一方面讓人們保持這一過(guò)程的興趣,一方面不斷探索數據應用領(lǐng)域與價(jià)值,不斷完善既定的應用模型。
就如站在河邊學(xué)不會(huì )游泳一樣,大數據變現應用實(shí)踐比什么都重要。否則空對著(zhù)自身的數據通過(guò)想象的方式去研究,無(wú)法真正鍛煉變現能力。在當前缺少變現渠道的情況下,與有限合作伙伴在一定范圍內的試點(diǎn)才是正確的解決之道。