掌控語(yǔ)音就將掌控一切。語(yǔ)音之“熱”是真正的產(chǎn)業(yè)良機還是過(guò)度炒作?中國語(yǔ)音企業(yè)該選擇怎樣的成長(cháng)路徑?如何揚長(cháng)避短與國際巨頭一較高下?
科大訊飛立體云、捷通華聲套餐云、云知聲靈巧云和百度開(kāi)放云……且看各門(mén)各派如何搶灘中國智能語(yǔ)音市場(chǎng)。
這是一個(gè)最好的時(shí)代,這是一個(gè)聲控的時(shí)代,這是個(gè)光明的季節,也是個(gè)希望的春日。
從幾年前蘋(píng)果Siri將語(yǔ)音迅速升溫推至消費者面前,到現在語(yǔ)音助手幾乎已成為智能手機、汽車(chē)電子、智能家居的標配,從人們過(guò)去在路邊招手打車(chē)到現在先用微信與出租車(chē)師傅說(shuō)好再出門(mén)……似乎,智能語(yǔ)音產(chǎn)業(yè)已經(jīng)迎來(lái)生機盎然的春天。語(yǔ)音一時(shí)間成為輿論的焦點(diǎn):“語(yǔ)音將徹底替代鼠標、鍵盤(pán)”,“語(yǔ)音將成為移動(dòng)互聯(lián)網(wǎng)主流信息入口”,“誰(shuí)掌控語(yǔ)音誰(shuí)就將掌控一切”……看好、贊揚語(yǔ)音之聲不絕于耳。
但一個(gè)技術(shù)從萌芽期開(kāi)始不斷發(fā)展,要醞釀多久才會(huì )到爆發(fā)期?智能語(yǔ)音產(chǎn)業(yè)是真的到爆發(fā)期了,還是被提前過(guò)度炒作了?智能語(yǔ)音產(chǎn)業(yè)現狀和未來(lái)發(fā)展方向如何?中國智能語(yǔ)音企業(yè)又該如何選擇適合自己的成長(cháng)路徑?帶著(zhù)這些疑問(wèn),記者先后采訪(fǎng)多位智能語(yǔ)音專(zhuān)家,力求探知一二。
莫錯失趕超良機
智能語(yǔ)音是新一代的人機交互技術(shù)手段之一。就像人與人之間對話(huà)交流一樣,智能語(yǔ)音是要通過(guò)語(yǔ)音實(shí)現人與機器之間的交互,即機器能聽(tīng)懂,并能回答提問(wèn),實(shí)現對話(huà)互動(dòng)。“智能語(yǔ)音技術(shù)主要包括語(yǔ)音識別、自然語(yǔ)言理解和語(yǔ)音合成三個(gè)環(huán)節,完成讓機器聽(tīng)懂人說(shuō)話(huà),再讓機器說(shuō)人話(huà)的過(guò)程。這種交互需要基于海量的語(yǔ)料庫,通過(guò)模型實(shí)現語(yǔ)音識別和語(yǔ)義理解,包括對語(yǔ)法、分詞、情景,甚至是情緒等的理解,再通過(guò)知識庫系統找到答案,然后通過(guò)語(yǔ)音合成技術(shù)說(shuō)出答案,來(lái)回交互。”在接受記者采訪(fǎng)時(shí),中國語(yǔ)音產(chǎn)業(yè)聯(lián)盟副秘書(shū)長(cháng)李德升這樣給出他對智能語(yǔ)音的理解。
百度語(yǔ)音首席研究員賈磊在第十八屆中國國際軟件博覽會(huì )的演講中介紹,百度語(yǔ)音就是通過(guò)語(yǔ)音識別、語(yǔ)義理解和后臺資源來(lái)實(shí)現“你說(shuō)我聽(tīng)”、“你說(shuō)我想”和“你說(shuō)我做”的過(guò)程,打造人機交互的閉環(huán)過(guò)程。
人機智能語(yǔ)音交互,說(shuō)起來(lái)容易做起來(lái)難。20世紀50年代,AT&T開(kāi)發(fā)出第一個(gè)語(yǔ)音識別系統Audry;20世紀80年代,智能語(yǔ)音技術(shù)研究由傳統的基于標準模型匹配的技術(shù)思路開(kāi)始轉向基于統計模型的技術(shù)思路;21世紀初,智能語(yǔ)音從技術(shù)研究走向實(shí)用并進(jìn)入產(chǎn)業(yè)化,進(jìn)入呼叫中心、家電、汽車(chē)等領(lǐng)域;而近期,以蘋(píng)果Siri發(fā)布為重要引爆點(diǎn),智能語(yǔ)音應用才開(kāi)始向移動(dòng)互聯(lián)網(wǎng)等新興領(lǐng)域延伸,產(chǎn)業(yè)進(jìn)而不斷積累、發(fā)展。
智能語(yǔ)音技術(shù)是人工智能的研究領(lǐng)域之一,其原理涉及聲學(xué)、語(yǔ)言學(xué)、數字信號處理和計算機科學(xué)等多個(gè)學(xué)科,研究周期長(cháng),投入成本大,技術(shù)壁壘高。全球和中國智能語(yǔ)音市場(chǎng)基本形成寡頭壟斷的格局。隨著(zhù)智能語(yǔ)音產(chǎn)業(yè)的快速發(fā)展,產(chǎn)業(yè)競爭進(jìn)一步加劇,也吸引了IT巨頭和中小創(chuàng )業(yè)團隊爭相進(jìn)入,與傳統語(yǔ)音技術(shù)提供商共同角逐智能語(yǔ)音市場(chǎng)。
在國際市場(chǎng),既有像Nuance這樣的占據全球62%語(yǔ)音市場(chǎng)的傳統語(yǔ)音技術(shù)巨頭,也有谷歌、蘋(píng)果、微軟、IBM等IT巨頭的競爭參與。在國內市場(chǎng),李德升告訴記者,目前我國語(yǔ)音技術(shù)廠(chǎng)商基本分為三類(lèi):一類(lèi)是傳統語(yǔ)音技術(shù)廠(chǎng)商,一般從科研院所基礎研究脫胎,包括像科大訊飛(中國科技大學(xué))、捷通華聲(清華大學(xué)、中科院聲學(xué)所、北京大學(xué))、中科模識(中科院自動(dòng)化所)、中科信利(中科院聲學(xué)所)等;第二類(lèi)是互聯(lián)網(wǎng)廠(chǎng)商,包括百度、騰訊、搜狗等,它們?yōu)榻o其廣大的互聯(lián)網(wǎng)用戶(hù)提供更好的增值服務(wù),普遍采用戰略合作或者收購等方式,掌握智能語(yǔ)音技術(shù),推廣語(yǔ)音服務(wù);第三類(lèi)是創(chuàng )業(yè)企業(yè),像云知聲、思必馳等,它們專(zhuān)注于某些行業(yè)領(lǐng)域,比如汽車(chē)、家電、教育、社交網(wǎng)絡(luò )來(lái)推廣自己的語(yǔ)音技術(shù)和產(chǎn)品。