除了應用模式,技術(shù)也是目前橫亙在視頻大數據發(fā)展道路上的另一座大山。有很多方面,涉及采集、存儲、管理等多方面的領(lǐng)域,但是在作者看來(lái),最大的技術(shù)障礙還是在于視頻的結構化。商業(yè)應用上的數據多為結構化數據,每個(gè)數據都由一系列明確的描述屬性組成,大數據處理系統則可以根據使用者的要求將不同的屬性進(jìn)行歸類(lèi),從而發(fā)現和掌握事物發(fā)展的客觀(guān)規律。而視頻則不然,除了時(shí)間和空間的屬性外,并沒(méi)有其他的標簽。除了按照時(shí)間和地點(diǎn)查找相應的視頻外,大多的視頻只能靠人慢慢甄別,這離大數據應用還相去甚遠。
要做到大數據應用,就必須為每個(gè)視頻貼上更多的屬性標簽,也就是業(yè)內所說(shuō)的結構化過(guò)程。作者認為這是未來(lái)視頻應用技術(shù)的制高點(diǎn),其核心是模式識別算法,要做到自動(dòng)把視頻中的特征識別出來(lái)貼上標簽后入庫。這樣在日后需要的時(shí)候,才能實(shí)現海量視頻的快速查詢(xún)和碰撞研判,甚至能像商業(yè)大數據那樣做到歸類(lèi)統計。
結構化的意義不難理解,只是真正實(shí)現起來(lái)很難,作者總結了有幾個(gè)原因:
1.識別什么特征?一副圖像或者一段視頻可以有無(wú)數角度的標簽屬性去描述,什么才是我們需要的屬性?這與我們需要得到的目的密切相關(guān),這就需要公安圖偵的人才來(lái)歸納終結。
2.識別算法開(kāi)發(fā)難,由于是平面圖像,因此特征的識別主要原理就是看圖像區域中的輪廓、顏色、紋理與特征庫進(jìn)行比較。但是在同一個(gè)物體在不同監控角度的攝像頭中顯示出的輪廓都不相同,因此無(wú)法做到識別。
3.大規模數據處理難,即使做到了識別算法,但是如果要通過(guò)數據處理服務(wù)器的形式對大規模的視頻進(jìn)行結構化處理,這個(gè)建造成本巨大,其能源的耗費在中國這個(gè)夏季需要限電的情況里也不切實(shí)際。
如此看來(lái),視頻結構化的路似乎走不通,但是,目前在業(yè)內也出現了許多“曲線(xiàn)救國”的方法。比如:
1.大力發(fā)展電警卡口建設:目前電警卡口在圖偵上的應用需求和頻率早就超越了交警,因為案件基本都要與車(chē)輛發(fā)生聯(lián)系,這能找出很多的線(xiàn)索。而卡口電警對于車(chē)輛的抓拍角度是相對固定的,能夠開(kāi)發(fā)出相應的車(chē)輛特征識別技術(shù),電警卡口屬于業(yè)務(wù)需求和技術(shù)實(shí)現的一個(gè)很好的匹配點(diǎn)。
2.結構化識別前移:在攝像機采集到圖像的同時(shí)就要做好結構化的工作,例如卡口攝像機,就應該把智能識別的算法集成進(jìn)去。目前不少廠(chǎng)商都推出了相應的智能卡口攝像機,建議政府應該大力推廣,在老卡口攝像機更新?lián)Q代的時(shí)候使用這類(lèi)智能卡口攝像機進(jìn)行替代,為未來(lái)大規模進(jìn)行視頻結構化做好準備。
3.雙目等特種攝像機的開(kāi)發(fā),突破平面圖像特征的局限,得到更精準的三維系信息,如人體數量,高度,物體長(cháng)度等。類(lèi)似的產(chǎn)品適合應用在重點(diǎn)區域,符合國內目前嚴峻的反恐形勢。
4.物聯(lián)網(wǎng)等更多感知技術(shù)的應用,本文雖然主題是視頻大數據,但在業(yè)務(wù)的發(fā)展中,也積極倡議除了視頻外,融入更多的物聯(lián)網(wǎng)感知技術(shù),如RFID技術(shù)等,作為視頻結構化信息的一個(gè)有效補充。
總而言之,對于視頻大數據的產(chǎn)業(yè)發(fā)展,一句話(huà)來(lái)總結:前途一片光明,同志仍需努力。