
車(chē)載語(yǔ)音市場(chǎng),將要迎來(lái)一位挑戰者。普強信息已進(jìn)入語(yǔ)音數據分析和車(chē)載語(yǔ)音并行的時(shí)代。
“繼續做,干嘛要停?”
接觸計算機30年,做語(yǔ)音20年的何國濤,并不想停止他在語(yǔ)音分析領(lǐng)域的腳步。他在2009年創(chuàng )立的普強信息科技有限公司現在已經(jīng)坐穩中國市場(chǎng)語(yǔ)音大數據分析行業(yè)第一的寶座,接下來(lái),他瞄準的是車(chē)載語(yǔ)音的戰場(chǎng)。
數據顯示,語(yǔ)音交互的市場(chǎng)規模預計將超過(guò)200億美元。國內外IT巨頭,包括車(chē)廠(chǎng)都在想盡辦法涉足這個(gè)領(lǐng)域,搶奪語(yǔ)音交互的賽道。亞馬遜開(kāi)放Echo音箱的語(yǔ)音識別技術(shù);Facebook創(chuàng )始人扎克伯格去年自己花100小時(shí)完成AI管家Jarvis的開(kāi)發(fā);而在國內,除了BAT們在抓緊時(shí)間謀篇布局,思必馳、云知聲、聲智科技、Rokid等創(chuàng )業(yè)公司也在發(fā)力這個(gè)領(lǐng)域。
2015年,普強切入車(chē)載場(chǎng)景,聯(lián)手四維圖新和騰訊,共同開(kāi)發(fā)出“云+端+芯片”的智能車(chē)聯(lián)網(wǎng)大數據系統。
何國濤知道,這一戰,他要跑得比科大訊飛更快。
不斷膨脹的夢(mèng)想
何國濤思索了一下,說(shuō):“我發(fā)現,我開(kāi)始欠他們一個(gè)夢(mèng)想”。
這個(gè)名為“普強信息”的夢(mèng)想包含了太多人的期待。2009年創(chuàng )立普強信息的時(shí)候,何國濤只想當好一個(gè)程序員,和喜歡的人一起做有價(jià)值的事情,花兩年時(shí)間寫(xiě)程序,然后賣(mài)掉。
“誰(shuí)知道,兩年過(guò)后,程序寫(xiě)完了,為了證明程序有用,需要自己回國找客戶(hù)。找了之后發(fā)現確實(shí)賣(mài)不掉,又要重新在上面加一層再加一層,加人、加錢(qián),又要去找投資人。到最后,終于有了客戶(hù)。”
但是程序員何國濤不知不覺(jué)間已經(jīng)轉身成為普強信息CEO何國濤。
他要完成投資人和員工們的夢(mèng)想。把普強信息做成語(yǔ)音數據分析市場(chǎng)的第一,做出世界最好的人機交互系統,讓員工能在北京買(mǎi)得起房子……
這個(gè)不斷膨脹的夢(mèng)想起源于何國濤9歲時(shí)。當時(shí)的他和澳門(mén)其他孩子沒(méi)有什么區別,愛(ài)做大他3歲的哥哥后面的跟屁蟲(chóng)。唯一不一樣的地方,可能就是兄弟倆早早就表現出對數學(xué)異乎尋常的天賦。
因為家庭經(jīng)濟拮據,兄弟倆想用其他方法賺零花錢(qián)。當時(shí)澳門(mén)對于童工的各項規范尚未健全,哥哥就帶著(zhù)弟弟出去打暑期工。整個(gè)暑假都在制衣廠(chǎng)里剪線(xiàn)頭,把賺到的錢(qián)偷偷存起來(lái)。攢了兩年,一數,竟然有3000多元。
這筆巨款最后變成了一臺蘋(píng)果電腦。兄弟倆就在這部電腦上玩游戲,玩膩了就考慮能不能把游戲修改一下,于是哥哥又帶著(zhù)何國濤,靠著(zhù)一本書(shū)自學(xué)編程。
在興趣作為源動(dòng)力的時(shí)間里,兄弟倆靠著(zhù)這臺電腦,寫(xiě)編程參賽。1989年,何國濤被保送到華僑大學(xué),選擇了計算機專(zhuān)業(yè)。“也沒(méi)有什么高大上的理由,只是覺(jué)得計算機容易找工作”。
大學(xué)的前兩年,何國濤迷失了方向。在學(xué)生會(huì )、辦酒會(huì )、做兼職,他知道這樣的狀態(tài)不能延續,但是又不知道該往哪走。
這時(shí),在北京大學(xué)物理系讀研的哥哥問(wèn)他:“北大還不錯,要不要過(guò)來(lái)試一下?”
本科畢業(yè),何國濤考上了北京大學(xué)的網(wǎng)絡(luò )研究室。在北大,何國濤開(kāi)始深入接觸計算機網(wǎng)絡(luò ),跟著(zhù)導師為廣東建設銀行寫(xiě)一個(gè)基于TCP-IP的銀行網(wǎng)絡(luò )中間件,對方非常滿(mǎn)意,以一套100萬(wàn)的價(jià)格購買(mǎi),產(chǎn)品非常成功,后來(lái)還賣(mài)給了多家銀行。
何國濤所在的網(wǎng)絡(luò )實(shí)驗室,就是著(zhù)名的北大“天網(wǎng)”項目成立的地方,北大天網(wǎng)是國內第一個(gè)基于網(wǎng)頁(yè)索引搜索的搜索引擎。在這個(gè)被譽(yù)為國內中文搜索領(lǐng)域一面旗幟的天網(wǎng)項目中,培養出一批國內早期的互聯(lián)網(wǎng)搜索領(lǐng)域人才。何國濤的師兄,劉建國、雷鳴、周利民,后來(lái)跟隨當時(shí)名不見(jiàn)經(jīng)傳的李彥宏,成為了“百度七劍客”。
何國濤沒(méi)有留下,他再次選擇跟隨哥哥的步伐,來(lái)到美國雪城大學(xué)(SyracuseUniversity)。3年后,身處硅谷的哥哥再次問(wèn)他:“硅谷這邊還不錯,要不要過(guò)來(lái)試一下?”
何國濤點(diǎn)了點(diǎn)頭。
語(yǔ)音數據分析市場(chǎng)的NO.1
在硅谷,何國濤做了很多次嘗試。他曾在HP、Arubanetworks等公司從事Opencall、VoiceXML、無(wú)線(xiàn)網(wǎng)關(guān)等產(chǎn)品的研究和開(kāi)發(fā),HP多媒體服務(wù)器的語(yǔ)音識別技術(shù),就是他所在的小組研發(fā)的。他對創(chuàng )業(yè)公司情有獨鐘,精兵、高效、靈活,非常符合何國濤的追求。
“決定創(chuàng )業(yè)的時(shí)候,我本想著(zhù)做兩年,把產(chǎn)品做好了就夠了”。沒(méi)想到,光是語(yǔ)音識別引擎,何國濤的團隊就寫(xiě)了5年。
這對何國濤來(lái)說(shuō),是異常艱辛的5年。整個(gè)普強信息團隊整天寫(xiě)算法,方向從一開(kāi)始的圖像識別轉移到語(yǔ)音識別,他們唯一的產(chǎn)出就是代碼,但是這些代碼能不能變成真金白銀,還是一個(gè)未知數。
語(yǔ)音識別是底層技術(shù),可以與口語(yǔ)教育、安防、監聽(tīng),甚至機器人完美結合。何國濤也探索過(guò)移動(dòng)APP,做過(guò)訂票系統和在線(xiàn)教育的產(chǎn)品,但是始終達不到標準。
“如果你做一兩年完成的產(chǎn)品,別人花一兩年也能做出來(lái),產(chǎn)品就沒(méi)有太大的價(jià)值。所以他一直要求我們要做到很深很深,做出一件別人需要花十年才能做出的東西。”
何國濤口中的“他”就是黃炎松。這位硅谷華人圈里最成功的創(chuàng )投家,成為何國濤創(chuàng )業(yè)道路上的引路人,同時(shí),也是普強信息的天使投資人。
當時(shí)的黃炎松已經(jīng)60多歲,成功帶領(lǐng)4家公司在美國上市,他沒(méi)有像其他投資者一樣急于求成,反而提高了對普強信息技術(shù)實(shí)力的要求。
有了產(chǎn)品,何國濤把公司從美國加州硅谷轉移到國內運營(yíng)。找客戶(hù),何國濤找到了當年在北大的師弟雷鳴,此時(shí)的雷鳴已經(jīng)離開(kāi)百度,自創(chuàng )門(mén)戶(hù)建立了酷我音樂(lè )。而另一位師弟劉建國,身份也從百度的CTO轉換成了生活搜索網(wǎng)站愛(ài)幫網(wǎng)的CEO。
后來(lái),酷我音樂(lè )和愛(ài)幫網(wǎng),開(kāi)始嵌入普強智能的語(yǔ)音搜索引擎。慢慢地,何國濤發(fā)現,和這些移動(dòng)互聯(lián)網(wǎng)APP的合作,很難找到贏(yíng)利點(diǎn)。這讓他陷入焦慮。
此時(shí),普強信息遇到第一個(gè)大客戶(hù),聯(lián)想。負責的是呼叫中心的數據分析和語(yǔ)音識別。這次合作,讓何國濤見(jiàn)識到了大公司對語(yǔ)音識別的巨大需求以及背后雄厚的利潤回報。
何國濤開(kāi)始分析科大訊飛的財報,他發(fā)現,作為語(yǔ)音技術(shù)領(lǐng)域當仁不讓的老大,科大訊飛在語(yǔ)音數據分析上每年能獲得3000萬(wàn)的收入,而在系統集成、安防、教育領(lǐng)域的盈利以?xún)|的規模計算。作為盈利能力最強的云數據分析,卻沒(méi)有被放在最受重視的位置。何國濤發(fā)現了其中隱藏著(zhù)的機會(huì )。他決定,“打他的弱項”。
于是何國濤決定專(zhuān)注于語(yǔ)音數據分析領(lǐng)域。
2010年,普強科技推出了“千語(yǔ)語(yǔ)音識別引擎系統”和“千語(yǔ)千尋語(yǔ)音分析系統”。
這款引擎的開(kāi)發(fā)應用了深度神經(jīng)網(wǎng)絡(luò )技術(shù),通過(guò)語(yǔ)音切分技術(shù)和對識別結果的算法,進(jìn)行語(yǔ)速探測、情緒識別等,以及對講話(huà)對象、時(shí)間邊界等進(jìn)行分割,不僅提高了語(yǔ)音識別結果,也可以輔助企業(yè)進(jìn)一步挖掘和分析海量語(yǔ)音數據。
千語(yǔ)千尋語(yǔ)音分析系統面向呼叫中心,在客服與顧客通話(huà)過(guò)程中,將不同方言的來(lái)電轉換成文字,還能根據不同的系統用戶(hù)需求,標注出關(guān)鍵用詞,并針對其進(jìn)行統計和專(zhuān)業(yè)化分析,挖掘客戶(hù)需求。
“快”和“準”,是語(yǔ)音分析市場(chǎng)顛撲不破的標準。千語(yǔ)千尋語(yǔ)音分析系統的全文識別率可達85%以上,關(guān)鍵詞識別率達95%以上。中文語(yǔ)音分析速度國內最快,它擁有的文本分析引擎和索引處理技術(shù),能夠實(shí)現分析操作在秒級以?xún)韧瓿桑鴺I(yè)內多數語(yǔ)音公司的產(chǎn)品則要半小時(shí)甚至更久。
“當時(shí)我就跟客戶(hù)說(shuō),我們現在的分析系統就分析這塊,15秒出結果,而其他競爭對手需要2個(gè)小時(shí)。”目前普強在業(yè)界公開(kāi)招投標的項目中,中標率能達到70%。“我們拿什么打敗科大訊飛那種積淀和實(shí)力雄厚的大企業(yè),只有產(chǎn)品、服務(wù)和口碑。”
隨著(zhù)2014年底與保險電銷(xiāo)的龍頭企業(yè)招商信諾開(kāi)始深入合作,經(jīng)過(guò)三年的發(fā)展,普強已經(jīng)和數十家大型保險、銀行和互聯(lián)網(wǎng)金融公司進(jìn)行合作,占據了金融行業(yè)語(yǔ)音分析市場(chǎng)的80%份額。
2017年FINTECH金融科技的概念,也無(wú)意間驗證了何國濤當年的判斷。
隨著(zhù)語(yǔ)音數據分析市場(chǎng)的領(lǐng)先地位確立,何國濤又開(kāi)始思考起人機對話(huà)主要剛需場(chǎng)景:車(chē)載語(yǔ)音。
看準800億的車(chē)載語(yǔ)音市場(chǎng)
800億的車(chē)載市場(chǎng),就是何國濤對準的阿喀琉斯之踵。
2015年,何國濤帶領(lǐng)著(zhù)普強信息切入車(chē)載場(chǎng)景,聯(lián)手四維圖新和騰訊,共同開(kāi)發(fā)出“云+端+芯片”的智能車(chē)聯(lián)網(wǎng)大數據系統WeDrive。
四維圖新是國內領(lǐng)先的綜合地理信息服務(wù)提供商,其數字地圖一直主導中國前裝車(chē)載導航市場(chǎng),合作品牌幾乎囊括國內各大主流車(chē)廠(chǎng)。近年來(lái),在四維圖新CEO程鵬的領(lǐng)導下,采取創(chuàng )新+戰略投資的“雙輪驅動(dòng)”策略,由傳統地圖轉向車(chē)聯(lián)網(wǎng)和自動(dòng)駕駛。正是何國濤對四維這一戰略的強烈認同,最終接受了四維的投資。
在這次聯(lián)姻中,四維負責導航,騰訊負責內容,普強提供語(yǔ)音交互技術(shù)。相對于群雄逐鹿的后裝市場(chǎng),市場(chǎng)份額更穩定、價(jià)值收入更高的前裝市場(chǎng)更具吸引力。全球老大Nuance占了較大的份額,國內龍頭科大訊飛也躍躍欲試。但在另一方面,出品周期長(cháng)和對接流程復雜也擋住了吃螃蟹者的腳步。
何國濤的智能車(chē)載語(yǔ)音系統,是由“云+端+芯片”組成的。普強自主研發(fā)的云+端語(yǔ)音交互系統能有效的避免車(chē)內網(wǎng)絡(luò )不通對語(yǔ)音識別的影響。另外方案中的陣列麥克風(fēng)可抑制噪音回音,進(jìn)行聲源定位。車(chē)載降噪DSP芯片可進(jìn)行車(chē)載降噪去回聲。
此外,為了極致的用戶(hù)體驗,普強會(huì )針對不同車(chē)輛本身的胎躁、風(fēng)噪、發(fā)動(dòng)機噪等噪音特性,量身定制屬于該款車(chē)輛的聲學(xué)模型算法,提高行駛過(guò)程中的語(yǔ)音識別率。
何國濤想要的不僅是這塊市場(chǎng),更是想把這套系統作為入口,將更多的數據收入囊中。
百度首席科學(xué)家吳恩達曾說(shuō)過(guò),“語(yǔ)音識別從95%的準確度到99%的準確度帶來(lái)的不是量變而是質(zhì)變,是從你偶爾使用語(yǔ)音變到常常使用。做到99%準確,將徹底改變人與設備的交互。”
當時(shí),吳恩達正在百度負責“百度大腦”項目,而作為基礎的就是百度的語(yǔ)音技術(shù)。BAT也有意涉足語(yǔ)音分析領(lǐng)域,他們最大的優(yōu)勢在于海量的數據。
沒(méi)有人會(huì )比何國濤更了解數據的價(jià)值。但是如何以道德的方式收集數據,更好地運用數據為用戶(hù)服務(wù),何國濤想了很多種方法。比如車(chē)險。
“中國的車(chē)險市場(chǎng)是大概6000億,現在的車(chē)險大多采用平均主義,與你的駕駛時(shí)間和習慣無(wú)關(guān)。我可以把車(chē)機系統免費送給駕駛習慣良好的司機,在這一年內,通過(guò)系統記錄到的數據證實(shí)沒(méi)有違規行為,年底用戶(hù)買(mǎi)車(chē)險就可以減免一大塊費用。
對于用戶(hù)來(lái)說(shuō),這是看得見(jiàn)摸得著(zhù)的好處。激勵司機追求更好的駕駛行為,對于社會(huì )的交通狀況有益。對于普強信息來(lái)說(shuō),這一年積累下來(lái)的駕駛數據,能夠讓他們看得更深更遠。
另一方面,何國濤還想過(guò),針對暴雨等惡劣天氣,推出短時(shí)間的保險。“你從家里到公司是五公里,半個(gè)小時(shí)就到了,你害怕這段路車(chē)子會(huì )被暴雨沖走,就可以通過(guò)車(chē)機系統買(mǎi)一個(gè)半小時(shí)的保險,系統實(shí)時(shí)監控,結束之后自動(dòng)計算金額,可能兩毛錢(qián),你只需要在車(chē)里面點(diǎn)了一下說(shuō):“好,同意。”
把這些數據通過(guò)符合法律和道德的方式挖掘出來(lái),通過(guò)數據分析和模擬,可能會(huì )在不遠的未來(lái)徹底改變整個(gè)汽車(chē)服務(wù)生態(tài)及周邊行業(yè)。
越過(guò)塔尖的勇氣
“大客戶(hù)將從目前70左右擴展到100個(gè),在車(chē)載系統方面,樹(shù)立至少兩個(gè)標桿客戶(hù)。”
這是何國濤給普強信息定下的年底目標。離線(xiàn)的語(yǔ)音識別和語(yǔ)義理解,是普強信息的優(yōu)勢所在。做云端的云識別引擎,在世界市場(chǎng)上有谷歌、微軟、亞馬遜和蘋(píng)果這些巨頭,國內有科大訊飛和云知聲,中文的在線(xiàn)語(yǔ)音識別引擎加起來(lái)超過(guò)50家。但能實(shí)現中文車(chē)載嵌入式引擎加起來(lái)不超過(guò)5家。
“如果再努力一下,我們就是第一。”
“我們要先把中文的車(chē)載系統做到國內最好,然后是全世界最好!”
何國濤坦誠地表達他對普強信息未來(lái)的期望,但橫亙在他面前的,是人才和技術(shù)的難關(guān)。“語(yǔ)音分析市場(chǎng)其實(shí)并不熱,只是最近才比較熱”。市場(chǎng)熱鬧起來(lái),人才也就更加難求。
“所以我現在最大任務(wù)就是穩住這幫兄弟”,普強信息的核心團隊很穩定,創(chuàng )立時(shí)的第一個(gè)員工現在還在團隊內,何國濤認為這是最值得自豪的事情之一。
其次,要加快技術(shù)和客戶(hù)端匹配的速度。每次合作一個(gè)客戶(hù),團隊都要花1~3個(gè)月時(shí)間對接,隨著(zhù)市場(chǎng)的蘇醒,普強信息的客戶(hù)群體越來(lái)越大,但為了保證用戶(hù)滿(mǎn)意度,讓他們不敢接單。
為解決以上問(wèn)題,普強將在今年下半年引進(jìn)最新的神經(jīng)網(wǎng)絡(luò )技術(shù),用神經(jīng)網(wǎng)絡(luò )去自動(dòng)建模,這樣將會(huì )加快用戶(hù)產(chǎn)品的適配速度,從而加速市場(chǎng)布局,也為明年年底實(shí)現千個(gè)客戶(hù)的市場(chǎng)規模做好準備。
萬(wàn)事俱備,何國濤耐心地等待著(zhù)東風(fēng)的到來(lái)。他把創(chuàng )業(yè)形容為彩排,“需要一個(gè)節點(diǎn)一個(gè)節點(diǎn)地去完成,如果直接跳到結局就沒(méi)意思了”。
下一個(gè)節點(diǎn),將會(huì )在三到四年之后。何國濤透露,明年年中將會(huì )進(jìn)行下一輪融資,下一步,就是上市。
“每一步都要有階段性成果,唯一的驗證就是在這個(gè)領(lǐng)域做到最好”。何國濤在心里計算著(zhù)普強信息與行業(yè)金字塔塔尖的距離,完成超越的油門(mén),就在他的腳下。