作為移動(dòng)互聯(lián)網(wǎng)行業(yè)最為熱門(mén)的創(chuàng )業(yè)領(lǐng)域,在過(guò)去的幾年中,移動(dòng)社交類(lèi)App和UGC類(lèi)App大量涌現,因此在盡力確保產(chǎn)品定位差異化的同時(shí),打造健康的社交生態(tài)也成為這些App能得以獲得長(cháng)期發(fā)展的關(guān)鍵。然而,由于這類(lèi)App每天生成的圖片信息量通常很大,并且有大量的色情圖片混雜其中,所以高效準確地鑒別和剔除這些淫穢色情信息成為一項十分艱巨的任務(wù)。
傳統鑒黃方法及其局限性
常用的鑒黃方式有3種:公眾舉報、人工鑒黃和使用基于開(kāi)源圖像識別算法的鑒黃工具。這些方法雖然能讓網(wǎng)絡(luò )環(huán)境的健康程度得到部分緩解,但仍存在一些局限性。
公眾舉報。目前很多帶有社交屬性的網(wǎng)站和App,都會(huì )為用戶(hù)開(kāi)通了舉報功能。用戶(hù)在瀏覽內容中發(fā)現黃色圖片等淫穢信息,都能通過(guò)點(diǎn)擊相應按鈕或者鏈接的形式,向網(wǎng)站管理員舉報,并由網(wǎng)站管理員完成刪圖或者封號等后續處理。但從目前實(shí)踐情況來(lái)看,這個(gè)方式收效甚微,用戶(hù)的參與度并不高,而且舉報數量較少。
人工鑒黃。隨著(zhù)鑒黃重要性的日益凸顯,很多企業(yè)都設有類(lèi)似“鑒黃師”這樣的崗位,以最快的速度瀏覽、審核用戶(hù)上傳的圖片,并及時(shí)處理所發(fā)現的色情信息。但隨著(zhù)色情信息量日益增多并且傳播方式愈發(fā)隱蔽,人工鑒黃的速度和質(zhì)量都在逐漸降低,遺漏和判斷失誤在所難免。而且由于黃色圖片強大的視覺(jué)沖擊,鑒黃師們很難連續工作幾個(gè)小時(shí),通常工作2到3個(gè)小時(shí)之后,就要換成其他工作內容或者短暫休息一下緩解一下?tīng)顟B(tài)和心情。
使用基于開(kāi)源圖像識別算法的鑒黃工具。由于人工鑒黃存在諸多局限性,所以有越來(lái)越多的企業(yè)開(kāi)始嘗試結合一些開(kāi)源圖像識別算法來(lái)自己開(kāi)發(fā)相應的鑒黃工具。但這其中存在著(zhù)很高的技術(shù)門(mén)檻:首先圖像識別、機器學(xué)習、圖標分類(lèi)標定等方面的算法非常復雜,要結合這些算法做研發(fā)和優(yōu)化,需要很精專(zhuān)的技術(shù)人員,而絕大數企業(yè)都不具備這樣的人才資源;其次,即便這樣的鑒黃工具能夠開(kāi)發(fā)成功,但識別過(guò)程中所需的樣本圖卻很難收集,需要很長(cháng)時(shí)間的積累,并且積累過(guò)程中需要不停地修正圖像識別模型,以提高準確度。
七牛云國內首推圖片鑒黃服務(wù)
基于此,七牛云攜手專(zhuān)注于圖像識別技術(shù)的圖普科技推出了圖片鑒黃服務(wù)(nrop),幫助七牛用戶(hù)有效判斷保存在七牛云的圖片是屬于色情、性感還是正常,并給出判斷的分數,分數越高判斷為該類(lèi)別的概率越大。該服務(wù)是通過(guò)基于深度學(xué)習的人工智能技術(shù)來(lái)實(shí)現圖像識別的,從而用計算機替代人工對黃色圖片的審核服務(wù),有相關(guān)鑒定需求的企業(yè)直接接入該系統即可實(shí)現圖片的自動(dòng)檢測。
據了解,七牛云是國內第一家提供此項服務(wù)的云服務(wù)提供商,意在通過(guò)高效準確的自動(dòng)化鑒黃服務(wù),降低企業(yè)使用鑒黃服務(wù)的技術(shù)門(mén)檻,從而很大程度上幫助企業(yè)減少相關(guān)人力成本的投入。
與以往的人工鑒黃方式相比,七牛本次推出的圖片鑒黃服務(wù)有以下幾個(gè)很明顯的優(yōu)勢。
1.成本降低的同時(shí),效率大大提高。鑒黃師平均每天審核處理的圖片數只能在1萬(wàn)張左右,每臺機器一天可以審1000萬(wàn)張圖片。
2.準確率提高,誤判少。 根據第三方服務(wù)提供商評測的結果顯示,七牛鑒黃服務(wù)的準確度超過(guò)99.5%,可以替代90%以上的人工審核,并且機器有強大的自學(xué)習能力,可以通過(guò)不斷學(xué)習提高鑒別的準確度。 此外,鑒黃服務(wù)每周會(huì )更新升級一次樣本庫,以便更好地鑒別越來(lái)越隱蔽的色情圖片。
3.全時(shí)工作。由于工作內容的特殊性,人工鑒黃很難長(cháng)時(shí)間連續工作,而機器鑒黃可以做到7*24小時(shí)不眠不休。
而與前面講述的企業(yè)使用自研發(fā)的鑒黃工具相比,圖片樣本缺乏和準確度需要長(cháng)期訓練才能達到可用標準等問(wèn)題,在七牛云提供的鑒黃服務(wù)中完全不存在。因為在正式接入七牛平臺之前,圖普科技的鑒黃服務(wù)已成功接入迅雷、酷狗和比鄰網(wǎng)等多個(gè)平臺,樣本庫中的圖片樣本已積累過(guò)億,而且每周會(huì )對樣本庫做一次版本升級,將新識別出的樣本加入其中。此外,經(jīng)過(guò)大量的實(shí)踐很好地訓練了圖像識別模型,這使得圖普科技的圖片鑒黃服務(wù)的準確度能達到上文中所提到的99.5%。接入七牛之后,鑒黃服務(wù)將以公有云服務(wù)的形式供七牛平臺上的所有用戶(hù)使用,這樣圖片樣本將在很短時(shí)間內大量積累,準確度也會(huì )同時(shí)得到更快的提升。
開(kāi)放第三方數據處理服務(wù),打造完整的數據生態(tài)
幾年來(lái),七牛云一直在全力打造高效穩定的云服務(wù)平臺,并基于此提供了一站式數據管理服務(wù),能有效地幫助開(kāi)發(fā)者提高開(kāi)發(fā)效率、優(yōu)化產(chǎn)品體驗和降低業(yè)務(wù)風(fēng)險,使用戶(hù)縮短了產(chǎn)品從想法到上線(xiàn)的距離。目前,七牛云平臺上已有數十萬(wàn)企業(yè)和開(kāi)發(fā)者用戶(hù),日均上傳文件量為5億,獨立IP覆蓋國內50%以上的網(wǎng)民。所服務(wù)的企業(yè)中不乏一些重量級和明星企業(yè),如新型創(chuàng )業(yè)中的美圖、Camera360、窮游、豌豆莢、陌陌、唱吧等,也有傳統企業(yè)中的順豐、PPTV、步步高、OPPO、海康威視、平安科技等。
在移動(dòng)互聯(lián)的時(shí)代下,七牛認為從數據的產(chǎn)生、傳輸、托管,到數據處理以及分發(fā),在數據全生命周期上的每一個(gè)節點(diǎn),都可以通過(guò)云服務(wù)的技術(shù)和產(chǎn)品,加以支持。因此,七牛致力于成為為用戶(hù)提供完整解決方案的海量數據管理平臺,除了基礎的數據托管,加速以及基本處理,也逐步支持各類(lèi)圍繞數據的第三方服務(wù)的接入,或用戶(hù)自定義的數據服務(wù)開(kāi)發(fā),以形成圍繞數據管理展開(kāi)的生態(tài)體系。本次推出的圖片鑒黃服務(wù)是七牛云平臺上推出的首個(gè)第三方數據處理服務(wù),后續會(huì )聯(lián)合更多的第三方開(kāi)發(fā)者接入七牛云平臺,打造更為完整的數據管理生態(tài)。通過(guò)一段時(shí)間的內測,七牛小伙伴Same和小恩愛(ài)已在使用圖片鑒黃服務(wù),節省了90%的人力成本。
目前,七牛圖片鑒黃服務(wù)已正式上線(xiàn)。即日起至2015年6月30日,用戶(hù)均可參與我們的“七牛用戶(hù)關(guān)愛(ài)計劃之--鑒黃服務(wù)免費用”活動(dòng),申請免費使用本服務(wù),免費使用期為2015年6月至8月,每月免費額度上限為60萬(wàn)次(即當月鑒黃服務(wù)賬單可免1500元),超出部分按85折計費。免費使用期結束后,用戶(hù)還可以享受三個(gè)月(9月~11月)的鑒黃服務(wù)85折優(yōu)惠。查看“閱讀原文”了解活動(dòng)詳情。
并且為了進(jìn)一步地豐富和完善數據管理生態(tài)體系,七牛將于6月15日推出小廣告過(guò)濾功能,為七牛小伙伴們提供更多貼心選擇,還廣大網(wǎng)友一片清新寧靜。