抱著(zhù)對人工智能的極大興趣,我這樣一位大叔,意外的遇到一個(gè)機器人蘿莉…。一切都是個(gè)意外!這個(gè)機器人蘿莉就是京東客服機器人JIMI,我更想把它叫做京東機密。
在某個(gè)場(chǎng)合,我見(jiàn)到了京東深度神經(jīng)網(wǎng)絡(luò )實(shí)驗室(DNN Lab)首席科學(xué)家李成華,這位擁有博士后學(xué)位的深度學(xué)習領(lǐng)域的頂級專(zhuān)家,正在人工智能和機器學(xué)習領(lǐng)域進(jìn)行研究。而京東JIMI,正是他創(chuàng )造出來(lái)的智能機器人,目前的工作是在售前咨詢(xún)、售后服務(wù)和生活伴侶三個(gè)場(chǎng)景,承擔超過(guò)30%的京東客服任務(wù)。
帶著(zhù)對JIMI的好奇心,就產(chǎn)生了這段對話(huà).jIMI的答復很有趣:它是一個(gè)蘿莉。可是,難道所有的智能機器人都具有類(lèi)似的邏輯反應嗎?顯然,另一個(gè)業(yè)界知名的機器人“某小二”的反應卻略顯生澀,讓我這位大叔頓時(shí)失去了搭訕的欲望。
看來(lái),機器學(xué)習再到深度學(xué)習,反映在智能機器人身上的效果還真是相差很大。
那么,問(wèn)題來(lái)了,什么是深度學(xué)習,它跟傳統的智能機器人為什么差別那么大?
深度學(xué)習 小蘿莉的神經(jīng)網(wǎng)絡(luò )
簡(jiǎn)單說(shuō),深度學(xué)習是模擬人腦進(jìn)行分析學(xué)習的神經(jīng)網(wǎng)絡(luò ),它模仿人腦的機制來(lái)解釋和處理各種數據,包括文本數據、圖像數據和語(yǔ)音數據等。
而深度學(xué)習和普通的機器學(xué)習的最大區別就就是:神經(jīng)網(wǎng)絡(luò )的層數。
傳統神經(jīng)網(wǎng)絡(luò )一般只有兩三層的神經(jīng)網(wǎng)絡(luò ),其有限的參數和計算單元,對復雜函數的表示能力有限,學(xué)習能力有限;而深度學(xué)習則具有5到10層的神經(jīng)網(wǎng)絡(luò )。為什么JIMI能夠達到這樣的智能,李成華說(shuō),京東的深度學(xué)習已經(jīng)能夠做到8到9層。
對比傳統的神經(jīng)網(wǎng)絡(luò ),傳統神經(jīng)網(wǎng)絡(luò )在大數據量的學(xué)習上性能較差,不符合大數據所需的時(shí)效性。另一方面,大數據的演進(jìn)催生了軟硬件系統的進(jìn)步,分布式架構的產(chǎn)生,使得算法的性能已經(jīng)不是瓶頸,并行化框架和訓練加速方法,讓深度學(xué)習的前景變得光明。同時(shí),大數據也會(huì )讓深度學(xué)習的效果越來(lái)越好。所以,從某種意義上說(shuō),深度學(xué)習是大數據的最佳拍檔。
可是,目前深度學(xué)習也有很多的困難。最為突出的就是人才稀少,李成華說(shuō),學(xué)這個(gè)專(zhuān)業(yè)的人才本身就少,能夠建立起一個(gè)實(shí)驗室的專(zhuān)家資源,甚至需要從全世界去尋找,京東的深度學(xué)習實(shí)驗室的8位專(zhuān)家就來(lái)自于全球各地。可見(jiàn),深度學(xué)習,還沒(méi)有廣為人知,做深度學(xué)習的專(zhuān)家更是鳳毛麟角。
那么,問(wèn)題又來(lái)了。京東把這么難找的一群專(zhuān)家聚集在一起,要做什么?
大數據價(jià)值 蘿莉也有長(cháng)大時(shí)
其實(shí),京東之所以能夠進(jìn)入深度學(xué)習的領(lǐng)域,首先得益于開(kāi)放生態(tài)系統的構建,和擁有的龐大的業(yè)務(wù)量并積累了較為完善的數據。李成華說(shuō)“我們數據比較突出,從大數據來(lái)說(shuō)京東的數據可能是所有電商中數據鏈最長(cháng)的,包括經(jīng)銷(xiāo)商的數據、用戶(hù)一開(kāi)始瀏覽我們的數據,可能別的電商有,最后我們做到客服有沒(méi)有返修,返修的時(shí)候跟我們人交互的時(shí)候他的情緒是什么樣的,這是別的平臺他們沒(méi)有的,因為他們服務(wù)不是自己做的,我們推送服務(wù)全是自己做的,所以京東對用戶(hù)數據掌握非常全,所以我們的描述也是最準的。”
其次,京東雖然有近5000人的人工客服團隊,但應付618或者雙十一大促仍然顯得捉襟見(jiàn)肘。2012年12月,京東開(kāi)始籌劃成立JIMI智能客服團隊,通過(guò)一些機器算法模擬人的思維,達到客服跟用戶(hù)交流的效果。隨后深度學(xué)習技術(shù)的研究,加深了京東完善JIMI的想法。
直到2014年9月9日,京東成立了京東深度神經(jīng)網(wǎng)絡(luò )實(shí)驗室(DNN Lab),旨在通過(guò)神經(jīng)網(wǎng)絡(luò )、知識層次、異構計算等新興領(lǐng)域的研究和應用來(lái)確保京東技術(shù)的領(lǐng)先性,提高JIMI的智能性及其應用的廣泛性是實(shí)驗室的首個(gè)直接目標。目前JIMI,已承擔超過(guò)30%的京東客服任務(wù),但李成華希望未來(lái)JIMI可以包攬至少80%的客服工作。
看來(lái)小蘿莉也會(huì )有長(cháng)大成人的時(shí)候。
JIMI的成長(cháng)也許是電商的未來(lái)
其實(shí),在文章開(kāi)頭并沒(méi)有引用這段有趣的對話(huà)。我和JIMI還用這樣的對話(huà),針對李成華的性別開(kāi)了個(gè)小玩笑。玩笑歸玩笑,作為JIMI的創(chuàng )造者,李成華也可以說(shuō)是JIMI之母。這個(gè)答案不知道李sir會(huì )不會(huì )滿(mǎn)意呢?
李成華的深度學(xué)習實(shí)驗室直接隸屬于京東副總裁馬松,而馬松本人是電商及人工智能領(lǐng)域的資深專(zhuān)家,在美國日本做過(guò)多年的研究,其他8名成員也是來(lái)自全球知名高校、企業(yè)和研究機構的技術(shù)精英,具有多年的實(shí)踐經(jīng)驗和技術(shù)積累。目前,實(shí)驗室正從意圖識別,命名實(shí)體識別,自動(dòng)問(wèn)答和用戶(hù)畫(huà)像四個(gè)方向進(jìn)行研究。
全球最有名的的深度學(xué)習技術(shù)首推IBM Watson,之后google和微軟等公司也把很多技術(shù)研發(fā)放到上面。在京東布局JIMI的同時(shí),阿里也在積極布局深度學(xué)習實(shí)驗室。這說(shuō)明,深度學(xué)習和數據挖掘技術(shù)已經(jīng)被電商企業(yè)視為核心競爭力,也許JIMI成長(cháng)到承擔咨詢(xún)業(yè)務(wù)量80%的時(shí)候,深度學(xué)習的智能機器人就真正成為電商平臺的未來(lái)。
未來(lái)?誰(shuí)知道好萊塢電影里的機器人時(shí)代,會(huì )不會(huì )真的變成未來(lái)呢!