策劃 / LiveVideoStackLiveVideoStack:請簡(jiǎn)單介紹自己和負責的工作?和業(yè)界其他廠(chǎng)商相比,有什么特別的故事?
朱浩齊:網(wǎng)易云安全(易盾)是網(wǎng)易云旗下的一站式安全服務(wù),脫胎于網(wǎng)易安全部門(mén)。我們在過(guò)去20年主要是為網(wǎng)易所有產(chǎn)品提供安全風(fēng)控支持,覆蓋內容安全、移動(dòng)安全、網(wǎng)絡(luò )安全和業(yè)務(wù)安全。
網(wǎng)易云安全和其他安全廠(chǎng)商不同的是,我們一直是業(yè)務(wù)場(chǎng)景驅動(dòng)的安全保障,例如內容安全團隊就是因為當時(shí)網(wǎng)易博客等UGC產(chǎn)品遇到有組織大規模的有害垃圾內容攻擊,在網(wǎng)易集團高層的決策下,快速成立的,我們應該是國內第一個(gè)大公司中成立這類(lèi)的團隊。我在易盾主要負責云安全服務(wù)的技術(shù)研發(fā),特別是涉及到智能識別的內容安全和基于大數據的業(yè)務(wù)安全服務(wù)。
LiveVideoStack:據說(shuō)從網(wǎng)易新聞到網(wǎng)易云音樂(lè )的跟帖文化,你都在背后做支撐,能否分享一些你印象深刻的事?或者有趣的事?
朱浩齊:信息技術(shù)革命使得社會(huì )分工協(xié)同越來(lái)越緊密,何況在一個(gè)公司內部,所以我們作為網(wǎng)易產(chǎn)品的基礎安全支持部門(mén),也只是做了我們應該做的事情。但是在幫助產(chǎn)品搭建內容安全體系的時(shí)候,確實(shí)有很多細節需要相互討論和理解。比如新聞跟貼,網(wǎng)易有蓋樓的特色,但是存在一種可能就是一些樓層有問(wèn)題,其他沒(méi)問(wèn)題,那我們就需要跟產(chǎn)品討論,讓產(chǎn)品增加拆樓的功能,可以把我們認為有問(wèn)題的樓層都拆掉(刪除)。這其實(shí)對整個(gè)跟貼系統來(lái)說(shuō)是比較大的改動(dòng),公司確實(shí)投入了較大資源進(jìn)行架構升級。
此外,云音樂(lè )在設計之初就借鑒了跟貼的問(wèn)題,設計上就不允許多層樓。(最多兩層)。但是跟云音樂(lè )的合作中我們更進(jìn)了一步,除了有害內容清理之外,我們還嘗試做一些“運營(yíng)需求”的功能:比如對于無(wú)意義灌水,破壞社區氛圍的謾罵等內容進(jìn)行識別和清理。結果也還不錯,其實(shí)網(wǎng)民在網(wǎng)絡(luò )上也會(huì )跟隨社區的風(fēng)氣而調整自己的行為。
LiveVideoStack:LiveVideoStack社區的目標在于聚集國內首個(gè)專(zhuān)注多媒體視聽(tīng)行業(yè)的技術(shù)社群,成立來(lái),我們的確驗證了業(yè)界以及工程師在這個(gè)行業(yè)的巨大需求,網(wǎng)易云易盾在視聽(tīng)領(lǐng)域有什么特別的洞見(jiàn)?
朱浩齊:我們非常看好視聽(tīng)行業(yè)的發(fā)展,也看好LiveVideoStack所代表的多媒體視聽(tīng)技術(shù)社群的未來(lái)。網(wǎng)易在娛樂(lè )多媒體方面一直有探索性產(chǎn)品,但易盾是從一個(gè)特別的側面感受到視聽(tīng)行業(yè)的爆發(fā)。本質(zhì)上我們的內容安全服務(wù)是內容識別,我們目前一天大概識別十億條信息,成立以來(lái),發(fā)現圖片、視頻、音頻所占比例爆發(fā)性提升。
我們和服務(wù)客戶(hù)的交流也驗證了,內容行業(yè)一直朝向更富媒體和社交互動(dòng)的方向發(fā)展,不斷為用戶(hù)拓展新的體驗。近兩年,產(chǎn)業(yè)中凸顯出三個(gè)趨勢:第一是垂直滲透,視聽(tīng)互動(dòng)正在作為標配功能嵌入到旅游、金融、電商等行業(yè)應用。另外,不同媒體形式的交叉融合正在加快,媒體不斷增加新的視聽(tīng)內容,音樂(lè )應用上線(xiàn)短視頻等,泛媒體泛娛樂(lè )成為共識。最后,更多媒體形式、更多互動(dòng)和海量?jì)热菀步o視聽(tīng)平臺帶來(lái)更大更復雜的內容安全監管壓力,內容安全必須走向智能化。
LiveVideoStack:我們的會(huì )員很多是視聽(tīng)平臺,他們的確也非常關(guān)注如何構建高效的內容安全系統?請問(wèn)有什么建議嗎?
朱浩齊:在技術(shù)上,盡快采用基于自然語(yǔ)言處理、深度學(xué)習技術(shù)的智能識別技術(shù)改造傳統以關(guān)鍵字和特征庫為代表的內容識別技術(shù),保證對文字、圖片、語(yǔ)音,特別是直播視頻的覆蓋。在產(chǎn)品上,應該注意內容發(fā)布特別是UGC互動(dòng)接口的覆蓋度,除了評論、博客、相冊、彈幕等,不能疏漏昵稱(chēng)、頭像等簽名等角落。在策略上,應該建立對有害信息精細明確的審核體系和應對流程,做好應急響應。
LiveVideoStack:從文字、圖像、視頻與音頻,對于信息的理解難度也在不斷加大,能分享一些您和您的團隊正在做的技術(shù)探索嗎?比如NLP,聲紋識別的。
朱浩齊:信息理解的難度確實(shí)越來(lái)越大,但近年來(lái)有效的技術(shù)手段也在不斷更新。一方面我們嘗試使用多種技術(shù)融合的方式去理解日趨復雜的多媒體內容,例如在圖片分析過(guò)程中我們會(huì )使用多個(gè)深度網(wǎng)絡(luò )結合的方式去提取圖片語(yǔ)義信息,同時(shí)通過(guò)NLP技術(shù)對OCR抓取的文字信息進(jìn)行情感、意義的理解,最后綜合圖像、文字的理解對信息進(jìn)行有效判定;另一方面,由于互聯(lián)網(wǎng)視頻內容不斷增多,在靜態(tài)圖像處理的基礎上,我們使用了視頻分析技術(shù)更好地對流媒體內容進(jìn)行解讀。此外,聲紋識別技術(shù)也是安全領(lǐng)域的重要研究課題,我們也在嘗試使用端到端的聲紋技術(shù)去輔助身份認證。
LiveVideoStack:在這么多年的安全從業(yè)經(jīng)歷過(guò)程中,有哪些樂(lè )趣所在?
朱浩齊:安全是一個(gè)嚴肅又嚴謹的行業(yè),一個(gè)小的問(wèn)題可能都會(huì )導致企業(yè)嚴重危機,其實(shí)不應該談什么樂(lè )趣吧(對比游戲,社交,電商等領(lǐng)域)。因為很有可能你的樂(lè )趣是建立在別人的痛苦之上的(比如研究安全問(wèn)題會(huì )很有意思,了解發(fā)生的細節,思考補救的措施,探索新的風(fēng)險點(diǎn)等等,但那往往是有產(chǎn)品被通報有安全問(wèn)題了之后發(fā)生的)。當然幫助客戶(hù)解決安全問(wèn)題帶來(lái)的成就感是很強的,跟黑產(chǎn)的斗智斗勇也算苦中作樂(lè )吧。我們是在解決一些“反人性”的問(wèn)題,做起來(lái)很難,做成了會(huì )很開(kāi)心。
LiveVideoStack:能否簡(jiǎn)要回顧和展望下安全系統的歷史與未來(lái)?
朱浩齊:計算機發(fā)明之前的信息安全歷史主要是密碼學(xué)范疇,比如加密電報之類(lèi)的。隨著(zhù)計算機技術(shù)的發(fā)展,信息安全領(lǐng)域不斷擴大,現在已經(jīng)包含有網(wǎng)絡(luò )安全,系統安全,移動(dòng)安全,業(yè)務(wù)安全,內容安全等等業(yè)務(wù)了。與此同時(shí),信息安全的威脅也在不斷升級,安全事件頻發(fā),對安全工作帶來(lái)的挑戰也越來(lái)越大。我認為未來(lái)也會(huì )有一樣的發(fā)展趨勢:安全范圍和安全威脅同時(shí)增加。
LiveVideoStack:安全部門(mén)在企業(yè)中的地位往往不高,對于許多管理層而言,安全是成本中心而非利潤中心。但安全又無(wú)小事,一個(gè)小紕漏可能給公司和客戶(hù)帶來(lái)巨大的損失。您是如何看待安全這一特殊的行業(yè)?有哪些難忘的故事可以分享。
朱浩齊:安全行業(yè)門(mén)檻比較高,并且確實(shí)有吃力不討好的嫌疑,所以圈子不如其他信息技術(shù)行業(yè)廣大。但是隨著(zhù)安全事件的發(fā)生,越來(lái)越多的企業(yè)領(lǐng)導和政府官員都開(kāi)始意識到信息安全的重要性了,相關(guān)法律法規也不斷完善。我認為安全行業(yè)的地位隨著(zhù)時(shí)間的推移必然會(huì )慢慢升高。并且規模化之后安全行業(yè)也可以有商業(yè)化的探索,既能幫助公司解決安全問(wèn)題,又可以成為利潤來(lái)源。
LiveVideoStack:在網(wǎng)易內部,安全算盈利中心嗎?是把內部技術(shù)開(kāi)放給了外部對嗎?為什么會(huì )有這樣的舉措?
朱浩齊:確切的說(shuō),網(wǎng)易內部的安全工作分成了兩個(gè)部分,一個(gè)是為集團服務(wù)的基礎技術(shù)研究工作,一個(gè)是商業(yè)化安全產(chǎn)品的易盾團隊,商業(yè)化的部門(mén)是盈利中心,它做的就是把網(wǎng)易20年積累的部分內部技術(shù)提供給有需要的企業(yè),形成商業(yè)化的服務(wù)。產(chǎn)生這樣的舉措我覺(jué)得是順理成章的事情。一方面技術(shù)需要落地到更多的場(chǎng)景來(lái)證明和保持其先進(jìn)性,另外一方面把高門(mén)檻的安全服務(wù)商業(yè)化之后能更快的滿(mǎn)足安全市場(chǎng)的需求,幫助有需要的企業(yè)迅速實(shí)現安全體系建設,減少安全風(fēng)險,提高企業(yè)的效率并且減少其成本。
LiveVideoStack:現在各個(gè)行業(yè)都在談AI,在安全領(lǐng)域AI應用的現狀是什么?業(yè)界看好的探索方向是什么?
朱浩齊:其實(shí)AI技術(shù)很早就有了,只是近年來(lái)在新的算法和新的高性能硬件助力下產(chǎn)生的效果有明顯進(jìn)步,在特定范圍內甚至可以做到比人更精準高效的結果。目前我們把AI技術(shù)應用在內容安全和業(yè)務(wù)安全領(lǐng)域,使用更好的模型來(lái)識別內容和識別風(fēng)險行為。至于A(yíng)I探索的方向那太多了,語(yǔ)音識別、翻譯、機器人、人臉識別、自動(dòng)駕駛等等,可以說(shuō)現在資本投入多的大熱方向都是被看好的。
LiveVideoStack:為了更好的分辨正常用戶(hù)和有威脅的用戶(hù),需要對用戶(hù)做畫(huà)像分析,與此同時(shí)如何保護用戶(hù)的隱私,您和您的團隊做了哪些工作?
朱浩齊:其實(shí)做用戶(hù)畫(huà)像只需要用戶(hù)各個(gè)維度的數據,但不需要明文數據。對于模型來(lái)說(shuō)只要數據能保持一致性即可。所以我們一方面在部門(mén)內部建立了數據保密制度,根據數據重要性等級劃分了權限,另外一個(gè)方面盡量的把真實(shí)的數據做了脫敏處理,比如手機號碼,直接哈希成另外一個(gè)值即可,無(wú)法逆向,人也不能理解,這樣數據就算泄露也不會(huì )造成隱私泄露的問(wèn)題。
LiveVideoStack:不久前在西班牙世界通信大會(huì )MWC上,5G成為熱點(diǎn)。可以預見(jiàn)4K乃至8K視頻將在不久的將來(lái)普及,這是否會(huì )對安全服務(wù)帶來(lái)新的挑戰?
朱浩齊:5G的理論速度提升,對于更大更清楚的內容傳播肯定會(huì )帶來(lái)好處,不過(guò)這對內容安全來(lái)說(shuō)還好,不會(huì )有太大的壓力。但是5G普及對于接入設備數量的大幅提升,可能會(huì )進(jìn)一步降低黑客的攻擊門(mén)檻,導致安全成本大幅提升。
娛樂(lè )多媒體開(kāi)發(fā)應用實(shí)踐隨著(zhù)海量多媒體應用的普及和爆發(fā),用戶(hù)體驗、成本控制以及內容安全等方面也提出了更高的要求。如果你想了解泛娛樂(lè )行業(yè)的發(fā)展趨勢與技術(shù)難點(diǎn),5月19日,上海,歡迎來(lái)到《娛樂(lè )多媒體開(kāi)發(fā)應用實(shí)踐》專(zhuān)題,與網(wǎng)易云易盾CTO朱浩齊、咪咕視訊技術(shù)總監王琦、PP云資深架構師朱明亮、戰旗直播流媒體研發(fā)工程師石碩面對面,他們將分別從海量與高帶寬下的內容安全挑戰,5G帶來(lái)的基于與挑戰,高清賽事直播的挑戰,以及成本控制與用戶(hù)體驗保障等角度分享多媒體開(kāi)發(fā)最新技術(shù)實(shí)踐與應用案例。
