首頁(yè)>>>技術(shù)>>>語(yǔ)音應用>>>語(yǔ)音識別(ASR)  語(yǔ)音識別產(chǎn)品

語(yǔ)音識別領(lǐng)域的VC投資機會(huì )

周春兵 2009/06/23

一、行業(yè)簡(jiǎn)單描述

  語(yǔ)音是人類(lèi)溝通和獲取信息最自然便捷的方式。自上世紀6、70年代作為殘障人士的輔助型技術(shù)產(chǎn)生,到今天已逐漸在各類(lèi)實(shí)用領(lǐng)域嶄露頭角并發(fā)揮獨特效能的一項高科技,語(yǔ)音識別技術(shù)在業(yè)界正得到越來(lái)越廣泛的認可并予以密切的關(guān)注。在信息化時(shí)代,人們對信息獲取和信息溝通方式提出了更加智能的要求,輕松便捷地解決一切日常問(wèn)題成為業(yè)界爭相尋求突破的著(zhù)眼點(diǎn)。而語(yǔ)音識別技術(shù)以其得天獨厚的優(yōu)勢越來(lái)越多地進(jìn)入到人們日常生活和工作的方方面面:讓電腦、手機、玩具等各種機器設備能聽(tīng)懂主人的命令,提供更為人性化的操作方式;在電話(huà)里對自動(dòng)語(yǔ)音發(fā)出指令即能解決問(wèn)題;用語(yǔ)音軟件進(jìn)行文字輸入等等。在人們享受日益豐富的語(yǔ)音技術(shù)應用所帶來(lái)的便利性、人性化和個(gè)性化的同時(shí),語(yǔ)音技術(shù)廣闊的產(chǎn)業(yè)化前景正越來(lái)越清晰地展現在世人眼前。毋庸置疑,其可預見(jiàn)的應用市場(chǎng)和潛在的無(wú)限商機正同時(shí)吸引著(zhù)具有遠大目光的技術(shù)提供商和資本運營(yíng)商。

  語(yǔ)音識別技術(shù)根據識別對象的不同分為聲紋識別技術(shù)和語(yǔ)意識別技術(shù)。

  聲紋識別:是根據語(yǔ)音波形中反映說(shuō)話(huà)人生理和行為特征的語(yǔ)音參數自動(dòng)識別說(shuō)話(huà)人身份的一門(mén)技術(shù)。聲紋識別的作用主要有兩個(gè)方面:一是說(shuō)話(huà)人辨認(Speaker Identification),主要用于判斷某一語(yǔ)音材料是由若干發(fā)音者中哪一人所說(shuō),屬于“多選一”的識別;二是說(shuō)話(huà)人確認(Speaker Verification),主要用于確認某一語(yǔ)音材料是否由指定的某個(gè)人所說(shuō)的,屬于“一對一”識別。聲紋識別賴(lài)以實(shí)現的基礎是蘊含于語(yǔ)音信號中的說(shuō)話(huà)人發(fā)音特征,這一技術(shù)強調說(shuō)話(huà)人的個(gè)性,而不考慮以語(yǔ)音為物質(zhì)外殼的話(huà)語(yǔ)意義。從本質(zhì)上說(shuō),聲紋識別技術(shù)屬于“生物因子”認證范疇。聲紋同指紋有著(zhù)類(lèi)似的屬性。每個(gè)人的指紋都是唯一的,而聲紋也是人的個(gè)性特征,很難找到兩個(gè)聲紋完全相同的人。

  語(yǔ)意識別:是對語(yǔ)音材料所承載的實(shí)際意義的識別。它有別于聲紋識別,聲紋識別主要著(zhù)眼于語(yǔ)音的物理屬性和生理屬性,以辨認或確認說(shuō)話(huà)人為目的;而語(yǔ)意識別則著(zhù)眼于語(yǔ)音的社會(huì )屬性,以識別語(yǔ)音信號所承載的話(huà)語(yǔ)內容為目的。語(yǔ)意識別比聲紋識別要困難得多。說(shuō)話(huà)人的語(yǔ)音通常會(huì )受到母語(yǔ)、方言、發(fā)音器官和發(fā)音狀態(tài)等諸多因素的影響,正是因為說(shuō)話(huà)人語(yǔ)音特征各異,才為聲紋識別提供了可能性。但是,要將具有個(gè)性的聲紋與具有共性的語(yǔ)法和語(yǔ)義模型相匹配,要通過(guò)詞語(yǔ)切分、詞性標注、結構分析和語(yǔ)境理解等程序,達到正確識別話(huà)語(yǔ)內容,則是一個(gè)相當復雜的處理過(guò)程。

二、語(yǔ)音識別市場(chǎng)分析

  語(yǔ)音識別技術(shù)是生物識別技術(shù)的一種,自上世紀6、70年代語(yǔ)音識別技術(shù)的產(chǎn)生,到如今該技術(shù)已日漸完善,并逐步走出實(shí)驗室在各領(lǐng)域進(jìn)入實(shí)際應用階段。語(yǔ)音比起其他交互方式有著(zhù)更多獨特的優(yōu)勢,在生物識別領(lǐng)域,它以其靜態(tài)(聲紋)和動(dòng)態(tài)(語(yǔ)意)的雙重屬性具有其他生物特征無(wú)可比擬的廣闊應用前景,因而在許多發(fā)達國家已被廣泛接受和使用。而在中國,語(yǔ)音技術(shù)的應用起步較晚,以至于有些在國外已經(jīng)十分常見(jiàn)的語(yǔ)音產(chǎn)品在國內看來(lái)仍十分新鮮甚至令人不可思議。眾所周知,市場(chǎng)空白并不意味著(zhù)零市場(chǎng),相反,尚未被喚醒的市場(chǎng)需求經(jīng)過(guò)信息流動(dòng)和共享后有可能得到“井噴”式的爆發(fā)增長(cháng)。

  語(yǔ)音識別技術(shù)根據其屬性,基本功能可歸為兩大類(lèi),一類(lèi)是根據人本身的聲紋特征來(lái)進(jìn)行身份認證,另一類(lèi)是根據人發(fā)出特定的語(yǔ)音指令來(lái)進(jìn)行命令控制。由此引出的應用市場(chǎng)基本可以包括這幾個(gè)方面:桌面應用、嵌入式應用、電話(huà)系統、Web應用以及特殊應用領(lǐng)域等。

1. 桌面應用

  即語(yǔ)音識別技術(shù)集成在PC機上的應用,不僅可以用語(yǔ)音識別來(lái)進(jìn)行身份認證和編輯文本,而且可以通過(guò)聽(tīng)取和響應用戶(hù)講述的命令來(lái)運行程序并與操作系統實(shí)現交互。但是跨國IT巨頭如微軟、IBM等已介入該領(lǐng)域,且可以充分利用其成熟產(chǎn)品的協(xié)同性來(lái)進(jìn)行市場(chǎng)滲透,如Windows XP、Vista及Office 2007等都內嵌了語(yǔ)音識別功能,具有壟斷優(yōu)勢。

2. 嵌入式應用

  嵌入式應用的范疇很廣,需要根據市場(chǎng)需求考慮不同的嵌入式硬件平臺,如手持或移動(dòng)通訊設備及家用電器的語(yǔ)音控制和內容輸入。從目前的市場(chǎng)來(lái)看,嵌入式語(yǔ)音識別系統最大的市場(chǎng)主要是針對玩具、手機、車(chē)載GPS、MP3/MP4等。

3. 電話(huà)系統應用

  語(yǔ)音識別技術(shù)應用于企業(yè)自動(dòng)語(yǔ)音服務(wù),可以為企業(yè)提供一種智能化的并且相對安全的自動(dòng)服務(wù)方式。主要包括,企業(yè)的用戶(hù)服務(wù)中心(Call-Center),電話(huà)銀行,股票交易,電子商務(wù)等應用領(lǐng)域,用戶(hù)可以在電話(huà)中進(jìn)行身份認證及菜單流程的快捷選擇。

4.Web應用

  Web應用是把語(yǔ)音技術(shù)與Web應用結合,例如語(yǔ)音瀏覽器、語(yǔ)音搜索引擎、網(wǎng)上語(yǔ)音聊天室及語(yǔ)音網(wǎng)游等。

5. 行業(yè)特殊應用領(lǐng)域

  語(yǔ)音識別技術(shù)可以為有關(guān)部門(mén)提供應用方案,幫助它們通過(guò)電話(huà)采集的語(yǔ)音進(jìn)行自動(dòng)的身份辨認,節省大量的人力,并大大提高工作效率和識別的成功率。

三、已開(kāi)始處于商用化的市場(chǎng)

1、特殊行業(yè)市場(chǎng)

  指國家安全、偵破等特殊領(lǐng)域,由于該市場(chǎng)專(zhuān)業(yè)性強,進(jìn)入壁壘非常高,同業(yè)競爭者非常少。

2、民用市場(chǎng)

  手機市場(chǎng):中國近兩年在通訊業(yè)發(fā)展迅猛,工業(yè)和信息化部2009年1季度發(fā)布的統計顯示,截至2月底,全國手機用戶(hù)已逼近6.6億,這意味著(zhù)國內平均每2人就擁有1部手機。手機行業(yè)日趨成熟,而愈演愈烈的同質(zhì)化競爭必然促使商家在手機所提供的附加價(jià)值上翻花樣、做文章,以此來(lái)提高身價(jià)。隨著(zhù)功能越來(lái)越強大的智能手機走紅市場(chǎng),語(yǔ)音識別技術(shù)更有了發(fā)展的空間。研究表明,智能手機市場(chǎng)將在今后的數年里繼續保持增長(cháng)勢頭,全球出貨量將從去年的1460萬(wàn)部增長(cháng)到2009年的1.25億部,2009年全球智能手機將增長(cháng)至占全球手機市場(chǎng)的16%,而據預測中國智能手機2010年銷(xiāo)售量將達5190萬(wàn)臺。按此數據,以語(yǔ)音識別技術(shù)開(kāi)發(fā)包應用平均收入為7元/臺計算,相關(guān)市場(chǎng)規模可達3.5億元/年。

  車(chē)載導航市場(chǎng):在國內市場(chǎng)當中,截止到2006年,中國汽車(chē)數量已經(jīng)超過(guò)3300萬(wàn)輛,其中10萬(wàn)元以下轎車(chē)占40%,10至30萬(wàn)元之間的轎車(chē)占40%,30萬(wàn)元以上的轎車(chē)大約占20%,但是車(chē)載GPS的安裝率卻僅為2%,遠遠低于日本59%、韓國40%、歐美25%的水平。根據計世資訊(CCW Research)最新研究報告《2007-2008年中國汽車(chē)電子市場(chǎng)發(fā)展趨勢研究報告》研究表明, 2007-2008年中國汽車(chē)GPS導航系統市場(chǎng)年增長(cháng)率將超過(guò)80%。在不考慮車(chē)輛市場(chǎng)中每年新增量的前提下,以此潛在市場(chǎng)規模預測,GPS市場(chǎng)普及達到三者的平均水平41.3%,其中約70%的加裝語(yǔ)音識別人機交互系統。按此數據,以嵌入式語(yǔ)音識別芯片平均收入為40元/套計算,相關(guān)市場(chǎng)規模可達3.8億元。

  MP3/MP4:中國的MP3/MP4市場(chǎng)已趨成熟,整體產(chǎn)銷(xiāo)的增長(cháng)量也逐漸下滑,但是語(yǔ)音識別技術(shù)在此領(lǐng)域的滲透率卻微乎其微,仍有很大的增長(cháng)空間。據賽迪顧問(wèn)預計,2009年中國MP3/MP4播放機市場(chǎng)銷(xiāo)售量將達到596.7萬(wàn)臺,同比增長(cháng)4.9%,到2011年MP3/MP4播放機市場(chǎng)銷(xiāo)售量將達到650.2萬(wàn)臺,2009-2011年中國MP3/MP4播放機市場(chǎng)銷(xiāo)量年均復合增長(cháng)率達到4.6%。以此為計算依據。按此數據,以語(yǔ)音識別技術(shù)開(kāi)發(fā)包應用平均收入為7元/臺計算,相關(guān)市場(chǎng)規模可達0.46億元/年。

  玩具市場(chǎng):中國是世界重要的玩具生產(chǎn)及出口地,75%的世界玩具產(chǎn)量均來(lái)自國內,僅2006年,玩具生產(chǎn)的產(chǎn)值便達到770億元,出口達到70.55億美元。中國有13億人口,自身又是玩具消費的大市場(chǎng),據有關(guān)部門(mén)預測,到2010年中國的玩具消費額有望超過(guò)千億元人民幣。近來(lái)智能玩具發(fā)展勢頭看好,每年以40%左右的速度遞增,估計未來(lái)幾年間將占到整個(gè)玩具市場(chǎng)1/5左右的市場(chǎng)份額,這是一個(gè)數百億產(chǎn)值的市場(chǎng),語(yǔ)音識別智能玩具即便只占這個(gè)市場(chǎng)份額的1/3,每年也會(huì )有數十億到上百億的產(chǎn)值。由于玩具本身的生產(chǎn)成本較低,附加值不高,因此語(yǔ)音識別智能芯片將至少占到其中一半甚至3/4的市值。

  行業(yè)應用市場(chǎng):除了以上個(gè)人消費品市場(chǎng)以外,利用我們的核心軟件,生產(chǎn)出語(yǔ)音平臺銷(xiāo)售給二次開(kāi)發(fā)商,最終產(chǎn)品可以進(jìn)入電信、銀行、網(wǎng)絡(luò )等客戶(hù),具有不可估量的擴展市場(chǎng)容量。

四、行業(yè)主要品牌

國際品牌

  Nuance:世界上最大的專(zhuān)業(yè)的語(yǔ)音識別軟件提供商,提供語(yǔ)音識別、語(yǔ)言理解和聲紋鑒定等一系列軟件,其產(chǎn)品被應用于旅行預定、股票交易和企業(yè)門(mén)戶(hù)等眾多領(lǐng)域。公司在世界各地都設有分部或者合作伙伴,亞太總部設在香港,中國大陸地區的代理商為科大訊飛公司。Nuance的具體產(chǎn)品包括語(yǔ)音識別引擎,聲紋鑒定軟件,TTS引擎,SpeechObject組件(用于VXML以增強其功能),語(yǔ)音瀏覽器等等。

  IBM:IBM公司在語(yǔ)音識別領(lǐng)域有很長(cháng)的研究歷史,其著(zhù)名的產(chǎn)品是ViaVoice。如今,IBM公司在這個(gè)領(lǐng)域中的努力主要體現在Voice Server及其SDK上,該服務(wù)器建立在VXML基礎上以幫助開(kāi)發(fā)商建立廣泛的電話(huà)語(yǔ)音應用。由于擁有多元化的產(chǎn)業(yè)和雄厚的資金實(shí)力,它作為語(yǔ)音識別市場(chǎng)的先驅?zhuān)ㄟ^(guò)花費大量資金培育市場(chǎng),讓人們知道了什么是語(yǔ)音識別技術(shù)。

  Microsoft:微軟作為世界上最大的軟件提供商,一直視語(yǔ)音識別技術(shù)為其優(yōu)先研究項目,也適時(shí)地推出過(guò)許多產(chǎn)品,近年推出的Windows Vista系統已經(jīng)內嵌了語(yǔ)音控制軟件。微軟強大的品牌效應、龐大的研究機構、優(yōu)秀的市場(chǎng)整合能力使得它成為業(yè)界強有力的競爭對手。

  國內品牌有科大訊飛(以語(yǔ)音合成技術(shù)為主,當初的戰略投資者獲得了數十倍的回報)等少數幾家。

五、項目公司的優(yōu)勢

  項目公司是國內專(zhuān)業(yè)從事語(yǔ)音識別技術(shù)研究、軟件開(kāi)發(fā)和銷(xiāo)售的高科技公司。經(jīng)過(guò)多年的努力,公司發(fā)明了擁有完全自主知識產(chǎn)權的語(yǔ)音識別核心技術(shù),并以此內核為基礎,由公司的技術(shù)團隊開(kāi)發(fā)出專(zhuān)用的聲紋識別系統、語(yǔ)音關(guān)鍵詞識別系統和語(yǔ)音搜索引擎,將語(yǔ)音識別技術(shù)推廣到市場(chǎng)的同時(shí),也獲得了市場(chǎng)的認可,在該專(zhuān)用領(lǐng)域占領(lǐng)了相當的市場(chǎng)份額。公司自成立以來(lái),一直致力于從事聲紋識別技術(shù)及產(chǎn)品的研究、開(kāi)發(fā)和銷(xiāo)售,利用其在身份識別上獨有的特性,深耕挖掘其使用價(jià)值。公司的聲紋識別技術(shù)現包括ATD聲紋識別技術(shù)和TI聲紋識別技術(shù)。開(kāi)集區間技術(shù)實(shí)用化測試,以行業(yè)標準相等錯誤率(EER指標)測試出其結果為0.6%,識別性能超過(guò)了指紋識別技術(shù)的識別水平,成為業(yè)內唯一一家實(shí)現利用聲紋識別技術(shù)作為身份識別的唯一依據,而非輔助依據的公司。公司正準備啟動(dòng)下一步的發(fā)展計劃,在已有產(chǎn)品的基礎之上,利用在語(yǔ)意識別技術(shù)上的新突破,開(kāi)發(fā)針對于各種移動(dòng)設備的語(yǔ)音識別軟件開(kāi)發(fā)包、可進(jìn)行二次開(kāi)發(fā)的軟件工具包,以及通用型的語(yǔ)音識別芯片,將語(yǔ)音識別技術(shù)與具有更廣泛市場(chǎng)基礎的領(lǐng)域相結合。

項目公司技術(shù)優(yōu)勢與特色:
  1. 仿生性——模擬人對語(yǔ)音和說(shuō)話(huà)人的聽(tīng)辨功能,而不是使用統計的方法。

  2. 可學(xué)習性——與人相類(lèi)似,識別能力和準確性隨著(zhù)樣本量的增加而提高。

  3. 實(shí)時(shí)性——對瞬間語(yǔ)音信號的感知,而不是對固定長(cháng)度的語(yǔ)音信號進(jìn)行處理。

  4. 強魯棒性〔robustness〕——在充分訓練的情況下,識別能力具有極強的穩定性和可靠性。

  5. 識別速度快——識別過(guò)程是一種快速的并行過(guò)程,實(shí)際上是一種輸入到輸出的映射,不需要在一個(gè)龐大的語(yǔ)音庫中進(jìn)行搜索。

  6. 強分辨能力——神經(jīng)網(wǎng)絡(luò )的非線(xiàn)性映射,比概率方法有更強的分辨能力;平均識別分辨度已接近或超過(guò)人耳分辨度。

  7. 開(kāi)集識別——建立在高識別分辨度及無(wú)關(guān)性訓練基礎上。

博銳管理在線(xiàn)


相關(guān)鏈接:
3G時(shí)代語(yǔ)音識別成本仍然是“攔路虎” 2009-06-10
自動(dòng)語(yǔ)音識別決定呼叫中心未來(lái) 2009-06-02
紫金礦業(yè)視頻會(huì )議系統備份需求 2009-05-21
吳曉如:語(yǔ)音技術(shù)助力更智能更安全的新一代呼叫中心 2009-04-22
VoiceXML論壇官方認證平臺 2008-12-10
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 南溪县| 高雄市| 枝江市| 永康市| 大丰市| 双桥区| 鹤庆县| 新和县| 桓台县| 如皋市| 邮箱| 海淀区| 嘉鱼县| 仙游县| 北辰区| 新郑市| 凤台县| 化隆| 大关县| 广丰县| 江阴市| 许昌市| 衡阳市| 丹江口市| 仙游县| 平谷区| 荔浦县| 阳谷县| 上饶县| 乐都县| 青岛市| 新龙县| 徐汇区| 道孚县| 沙湾县| 双鸭山市| 全椒县| 新营市| 盘锦市| 沂源县| 临沭县| http://444 http://444 http://444 http://444 http://444 http://444