• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    您當前的位置是:  首頁(yè) > 新聞 > IT與互聯(lián)網(wǎng) >
     首頁(yè) > 新聞 > IT與互聯(lián)網(wǎng) >

    圖森互聯(lián):另辟蹊徑,用智能駕駛實(shí)現圖像識別商業(yè)化

    2016-09-01 14:14:20   作者:   來(lái)源:搜狐科技   評論:0  點(diǎn)擊cti:


      從本科后半段到PhD期間,他們一直都在思考如何將所學(xué)技術(shù)做成有用的產(chǎn)品,也一直在考慮創(chuàng )業(yè)機會(huì )。
      侯曉迪和郝佳男曾是人大附中同學(xué),高中時(shí)兩人同班。本科畢業(yè)后,侯曉迪去了加州理工讀PhD,研究方向是計算與神經(jīng)系統,郝佳男則去了南洋理工大學(xué)攻讀博士學(xué)位,研究并行和分布式運算。從本科后半段到PhD期間,他們一直都在思考如何將所學(xué)技術(shù)做成有用的產(chǎn)品,也一直在考慮創(chuàng )業(yè)機會(huì )。
    \
      2014年,還在香港科技大學(xué)讀機器學(xué)習與計算機視覺(jué)PhD的王乃巖去美國訪(fǎng)問(wèn),在那里認識了侯曉迪。經(jīng)過(guò)一段時(shí)間的交流,兩人在創(chuàng )業(yè)想法上達成了一致,于是王乃巖決定和他們一起創(chuàng )業(yè)。
      而陳默的加入則是在去年初。作為一位連續創(chuàng )業(yè)者,陳默曾獨立創(chuàng )立運營(yíng)過(guò)三家公司,后成功出售并退出。多年的商務(wù)合作和投資經(jīng)驗,讓他在互聯(lián)網(wǎng)領(lǐng)域積累了廣泛的資源。
      2015年8月,圖森互聯(lián)正式成立。陳默任CEO,負責公司的戰略、資金等事務(wù)。侯曉迪任CTO,帶領(lǐng)北美研究院團隊,王乃巖任首席科學(xué)家,帶領(lǐng)國內算法團隊,郝佳男任工程VP,帶領(lǐng)工程部門(mén)。
      從去年成立至今,圖森一直在探索圖像識別技術(shù)的商業(yè)化方向。得益于新浪5000萬(wàn)A輪融資及相關(guān)資源的進(jìn)入,他們首先從新浪微博的廣告開(kāi)始做起。
      圖像識別+廣告
      圖森所做的事情是用圖片識別技術(shù),為用戶(hù)瀏覽過(guò)的圖片打上關(guān)鍵詞標簽,讓廣告主找到最適合產(chǎn)品定位的投放廣告位,達到最佳的品牌傳播效果。比如在汽車(chē)廣告方面,圖森可以通過(guò)后端的圖像識別,為用戶(hù)之前瀏覽過(guò)的汽車(chē)圖片加上特定標簽,從而幫助汽車(chē)廣告商進(jìn)行更精準的定位。
      除了精細化廣告定位,圖森還用圖像識別技術(shù)為新浪微博的廣告投放物料做審核。以前,平臺上每天50萬(wàn)張素材都是人工審核,現在這一任務(wù)可以由機器執行,大大提高了審核效率。
      圖像識別+企業(yè)級應用
      圖森廣告業(yè)務(wù)目前每年2000萬(wàn)營(yíng)收。不過(guò),由于廣告市場(chǎng)更多的是由資源而非技術(shù)驅動(dòng),因此圖森決定探索更多可以讓算法落地的領(lǐng)域。圖森CEO陳默在調研時(shí)表示,公司定位是做計算機視覺(jué)和機器學(xué)習領(lǐng)域的算法研究和企業(yè)端服務(wù)。
      算法研究方面,圖森一直圍繞最前沿的技術(shù)進(jìn)行探索,同時(shí)也會(huì )做一些可演示的Demo,作為其技術(shù)實(shí)力的一種展示。此外,他們還會(huì )把一些容易商業(yè)化的技術(shù)拿出來(lái),根據第三方企業(yè)的產(chǎn)品需求去做定制。
      識車(chē)神器就是其中一例。這個(gè)專(zhuān)門(mén)為新浪汽車(chē)頻道研發(fā)的技術(shù),近日也在圖森官網(wǎng)開(kāi)放了大眾試玩入口。只要用戶(hù)上傳汽車(chē)圖片,系統即可識別2016年3月前發(fā)布的主流乘用車(chē)品牌和車(chē)型。目前,該識別系統已覆蓋國內市面上2000多種車(chē)型,識別準確率達到95%以上。
    \
      據圖森首席科學(xué)家王乃巖介紹,在車(chē)型識別方面,從數據的收集、整理,到預處理和清洗,圖森都有一套完整的自動(dòng)化算法,不僅把數據采集和標定做到了基本沒(méi)有人工干預,而且還實(shí)現了在一兩天之內采集到百萬(wàn)級別數據量的高效成果。
      除了車(chē)型識別,圖森也在人臉識別、汽車(chē)自動(dòng)駕駛、SLAM 3D地圖、數據平臺等方面做出了一些2B的技術(shù),用來(lái)開(kāi)放給不同的企業(yè)需求方。
      人臉識別方面,圖森已經(jīng)在一些國際比賽中拿到了很高的分數,但是由于進(jìn)入市場(chǎng)較晚,因此不會(huì )作為主攻方向,目前主要是將人臉識別技術(shù)應用于駕駛員監控系統(DMS)中。
      自動(dòng)駕駛領(lǐng)域,圖森會(huì )做一些車(chē)輛、行人、車(chē)道線(xiàn)、自行車(chē)、三輪車(chē)識別,以及道路分割、可行駛區域、車(chē)輛軌跡預測、自身定位等技術(shù),打包提供給想做自動(dòng)駕駛的汽車(chē)廠(chǎng)商。
      SLAM技術(shù)方面,圖森會(huì )用攝像頭做一些3D繪圖,四維地圖等,提供給騰訊、高德等相關(guān)企業(yè)產(chǎn)品。
      數據平臺方面,圖森也會(huì )做一些數據采集標定方案,包括數據的采集、加工、標定、降噪等處理過(guò)程,提供給國外企業(yè)客戶(hù)。
      圖像識別+智能駕駛
      圖像識別技術(shù)目前的需求主要集中在人臉識別、安防和交通三大領(lǐng)域。
      人臉識別方面,國內幾家計算機視覺(jué)公司已有布局;安防領(lǐng)域市場(chǎng)相對封閉,而且已經(jīng)有海康威視、大華等上市公司占領(lǐng)市場(chǎng);而智能駕駛領(lǐng)域,目前各大公司尚在嘗試,整個(gè)市場(chǎng)還處在探索階段,于是圖森選擇了智能駕駛作為其未來(lái)商業(yè)化的主要方向。
      在智能駕駛領(lǐng)域,圖森選擇了兩個(gè)方向進(jìn)行布局。一方面,圖森看重國內車(chē)企對于研究無(wú)人駕駛的技術(shù)需求,通過(guò)和車(chē)企合作,在比較好的實(shí)驗場(chǎng)景中,不斷磨練和提升自己的算法。另一方面,圖森也希望把的一些無(wú)人駕駛技術(shù)直接做成硬件級別的產(chǎn)品,形成一套完整的ADAS(高級輔助駕駛系統)解決方案,從而實(shí)現商業(yè)化落地。
      在無(wú)人駕駛技術(shù)研發(fā)方面,圖森已經(jīng)正式宣布和北奔研究院、北京理工大學(xué)合作,聯(lián)合研發(fā)軍用重型汽車(chē)的自動(dòng)駕駛技術(shù)。北奔主要提供整車(chē)平臺以及相關(guān)試驗資源,北理工為自動(dòng)駕駛車(chē)輛的研發(fā)提供運動(dòng)控制技術(shù),圖森負責計算機視覺(jué)和深度學(xué)習算法部分,提供以攝像頭為主、配合毫米波雷達和視覺(jué)芯片的、經(jīng)濟型自動(dòng)駕駛解決方案。
      這種方案一方面降低了自動(dòng)駕駛技術(shù)的應用門(mén)檻,另一方面能夠實(shí)現數據采集和高精地圖標定的快速部署,在自動(dòng)駕駛領(lǐng)域建立算法和數據的雙重優(yōu)勢。
      而在A(yíng)DAS硬件方面,圖森選擇從“兩客一危”、室內公交等運營(yíng)車(chē)輛入手。通過(guò)將4路攝像頭連接車(chē)內計算機,在碰撞之前,對周邊行人和車(chē)輛進(jìn)行識別以及運行軌跡的測算,從而為司機提供碰撞預警。該產(chǎn)品將在4個(gè)月后投入市場(chǎng),目標客戶(hù)是公交公司以及運營(yíng)車(chē)企等。
    \
      商業(yè)化落地
      當前,隨著(zhù)人工智能越來(lái)越火,國內幾家圖像識別公司已然成為明星公司,不僅在各類(lèi)活動(dòng)、論壇、會(huì )議上頻繁亮相,也經(jīng)常被各路媒體報道和提及,甚至合伙人的流動(dòng)也成為業(yè)內八卦熱點(diǎn)。
      然而,光鮮背后,各家公司商業(yè)化落地情況并不樂(lè )觀(guān),大多都還處于探索和規劃階段,要么通過(guò)和大公司合作,提供一些定制化需求來(lái)實(shí)現營(yíng)收。
      安防領(lǐng)域已有上市公司占領(lǐng)市場(chǎng),圖片審核、服裝電商、金融等領(lǐng)域的需求尚未形成,各家公司很難說(shuō)已經(jīng)找到明確的市場(chǎng)需求來(lái)落地自己的技術(shù),而圖森選擇的智能駕駛領(lǐng)域,除了國內大公司紛紛試水,國外公司也早有研究和布局。
      在美股上市的以色列公司Mobileye已經(jīng)做了近20年的ADAS系統,目前全球市場(chǎng)占有率已達70%。與谷歌等大公司的方向不同,Mobileye通過(guò)強大算法,僅用單攝像頭就實(shí)現了ADAS主要功能,大大降低了設備成本,因此受到各大車(chē)企青睞。2015年,Mobileye營(yíng)收2.4億美元,比2011年翻了12倍多,凈利潤6800萬(wàn)美金,公司財務(wù)狀況良好。
      今年3月,成立不到3年的自動(dòng)駕駛初創(chuàng )公司Cruise Automation被通用以超過(guò)10億美元的價(jià)格收購。該公司的第一款產(chǎn)品就是安裝在普通汽車(chē)上的自動(dòng)駕駛套件,可以在高速公路上接管汽車(chē)行駛,其組件包括毫米波雷達、立體攝像頭(雙目)、GPS 以及慣性傳感器,而非谷歌所采用的價(jià)格高昂的激光測距雷達系統。目前,該公司也開(kāi)始研發(fā)全棧式無(wú)人駕駛技術(shù),成為谷歌競爭對手之一。
      雖然這一方向前景未知,但至少可以證明,高昂的激光雷達并非無(wú)人車(chē)標配,用毫米波雷達、立體攝像頭等也可以實(shí)現一定程度的自動(dòng)駕駛,低成本和易量產(chǎn)反而更容易實(shí)現商業(yè)化落地。
      對圖森來(lái)說(shuō),無(wú)人駕駛技術(shù)的商業(yè)化現在看來(lái)還很遠,能夠短期落地的就是針對運營(yíng)車(chē)輛的ADAS硬件產(chǎn)品,但這一細分市場(chǎng)未來(lái)落地情況如何,現在還不好說(shuō)。不過(guò)陳默也表示,今年9月15日以后,圖森將開(kāi)始針對其第三方服務(wù)向B端企業(yè)進(jìn)行收費。可見(jiàn),在圖像識別的商業(yè)化上,圖森至少已經(jīng)有了明確兩條路徑。
    \
      近期,愛(ài)分析對圖森互聯(lián)CEO陳默、首席科學(xué)家王乃巖、工程總監郝佳男進(jìn)行了調研訪(fǎng)談,現將部分內容摘錄如下。
      Q:目前團隊規模和構成如何?
      陳:北美和國內團隊加起來(lái)一共70人左右,北美研究院有20個(gè)人在做核心算法,國內算法部門(mén)10人,硬件部門(mén)10人,工程部門(mén)10人,工程部門(mén)主要負責科研成果的產(chǎn)品化,比如系統對接,數據輸入輸出等。
      Q:最開(kāi)始是怎么考慮國內和北美團隊兩邊協(xié)作的?
      陳:計算機視覺(jué)這個(gè)領(lǐng)域很新,生源也比較少。在這一領(lǐng)域北美又領(lǐng)先國內平均水平。而且我們聯(lián)合創(chuàng )始人侯曉迪博士也在UCLA帶過(guò)一個(gè)研究院,之后出來(lái)創(chuàng )業(yè)就是為了把積累的技術(shù)商業(yè)化,他本身在美國各個(gè)大學(xué)有良好的關(guān)系,也是這個(gè)領(lǐng)域論文被引用最多的作者,所以就由他帶隊,創(chuàng )建了北美研究院團隊,幫助我們吸引更多的PhD畢業(yè)生加入我們的團隊。
      Q:車(chē)型識別的技術(shù)實(shí)現過(guò)程是怎樣的?
      王:先從數據準備開(kāi)始,也就是你要識別什么樣的車(chē),每一類(lèi)車(chē)對應什么樣的圖片,然后就是訓練數據,把數據放到神經(jīng)網(wǎng)模里面去訓練。同時(shí)在標準程度上做一些改進(jìn),比如有些車(chē)很相似,就需要在原有基礎上增加一些約束和限制,來(lái)辨識相似的圖片。
      Q:圖片識別目前的難點(diǎn)在哪?
      王:最難的地方還是數據的收集。這部分我們利用了在做互聯(lián)廣告時(shí)的技術(shù)架構,因此能夠比較快地拿到這些數據。
      Q:數據是從哪獲取的?如何實(shí)現快速獲取?
      郝:來(lái)源主要是互聯(lián)網(wǎng)的公開(kāi)數據。從技術(shù)上講,大家都是利用爬蟲(chóng)獲取公開(kāi)數據,但是關(guān)鍵在于能否在極短時(shí)間完成有效的下載、解析、清洗、標注。對于每個(gè)環(huán)節,我們都有很深的技術(shù)積累,人工干預的部分很少。比如對于解析,我們可以做到半自動(dòng)地從未知結構的網(wǎng)站獲取結構化的數據。
      Q:車(chē)型識別技術(shù)能否直接遷移到其他領(lǐng)域?
      王:對模型來(lái)說(shuō)沒(méi)有問(wèn)題,主要還是數據方面,會(huì )有不同的采集方式。
      Q:和車(chē)企合作研發(fā)無(wú)人駕駛技術(shù)是出于什么考慮?
      郝:國內車(chē)企確實(shí)有這方面的需求。一方面國外技術(shù)比較封閉,沒(méi)辦法給到國內的車(chē)企,另一方面他們也想做無(wú)人駕駛,所以就有一些合作機會(huì )。但其實(shí)無(wú)人駕駛技術(shù)離真正實(shí)現,或者說(shuō)離大家都買(mǎi)得起,還有很長(cháng)的時(shí)間。在這段時(shí)間,我們更多的還是去磨練算法,并且跟車(chē)企合作,他們能夠提供一些比較好的實(shí)驗場(chǎng)景,反過(guò)來(lái)也可以幫助提升我們的算法。
      Q:針對運營(yíng)車(chē)輛的ADAS產(chǎn)品需求如何?
      陳:這一塊需求還是很大的。我國每年運營(yíng)車(chē)輛造成10萬(wàn)人死亡,近百萬(wàn)人受傷,不僅給運營(yíng)車(chē)企造成巨大損失,也給社會(huì )安全也帶來(lái)了巨大隱患。政府和相關(guān)監管部門(mén)以及運營(yíng)車(chē)企都對車(chē)輛安全存在很大需求。
      Q:產(chǎn)品自己生產(chǎn)嗎?計劃以什么形式收費?
      陳:攝像頭從外部采購,芯片用英偉達的,其他部分找代工生產(chǎn),銷(xiāo)售可以找代理,我們就提供技術(shù)。
      收費方面,按每臺車(chē)收取月服務(wù)費,我們負責做軟硬件升級,軟件系統需要經(jīng)常更新,硬件大概兩三年升級一次。
      Q:國外在這一領(lǐng)域有類(lèi)似形式嗎?
      陳:國外主要還是以賣(mài)硬件為主。
      Q:目前這一塊投入人力有多少?
      陳:獨立立項投入20個(gè)人。
      Q:在智能駕駛領(lǐng)域如何與現有玩家競爭?
      郝:目前這一領(lǐng)域的玩家主要是谷歌、百度等大公司,以及基于Mobileye技術(shù)的車(chē)企。
      谷歌采用的激光雷達,雖然點(diǎn)云數據處理難度較低,但設備價(jià)格高昂,大概 7 萬(wàn)美金左右。而且這種雷達目前基本都是手工制作,很難進(jìn)行工業(yè)化生產(chǎn),想要大幅度降價(jià)并不容易。因此,谷歌無(wú)人車(chē)的最終落地也很困難。
      Mobileye十幾年來(lái)一直采用的是傳統算法,而對于近兩年才得以突破的深度學(xué)習技術(shù),大家都處在同一水平,至少沒(méi)有隔代差距。Mobileye的產(chǎn)品思路是供給芯片,但是完成支持深度學(xué)習的芯片,并把芯片做到量產(chǎn)還要花費多年時(shí)間。我們則選擇更多從算法優(yōu)化層面來(lái)做優(yōu)化,使得深度學(xué)習算法可以在已經(jīng)發(fā)布的SoC(系統芯片)上運行。
      我們的目標是可商業(yè)化、低成本的自動(dòng)駕駛解決方案,通過(guò)攝像頭、慣性制導、GPS、毫米波雷達等廉價(jià)傳感器,配合深度學(xué)習算法完成感知、決策和控制。

    專(zhuān)題

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 新竹市| 上饶县| 平利县| 诏安县| 平邑县| 来安县| 大足县| 寻乌县| 曲阳县| 泾阳县| 定西市| 马鞍山市| 嘉善县| 三台县| 十堰市| 海兴县| 上犹县| 临漳县| 武清区| 阳西县| 西华县| 灵石县| 嘉鱼县| 扎鲁特旗| 花莲县| 鄄城县| 三台县| 佛坪县| 丰台区| 江源县| 忻州市| 永善县| 昭平县| 清新县| 定兴县| 太原市| 巴彦淖尔市| 台东县| 宁武县| 上虞市| 宿迁市| http://444 http://444 http://444 http://444 http://444 http://444