首頁>>>技術(shù)>>>語音應(yīng)用>>>語音識別(ASR)  語音識別產(chǎn)品

淺析語音識別的移動互聯(lián)網(wǎng)應(yīng)用

2010/08/18

  摘要:語音識別技術(shù)發(fā)展到現(xiàn)在已經(jīng)達(dá)到應(yīng)用水平,這項(xiàng)技術(shù)的推廣普及必在移動互聯(lián)網(wǎng)行業(yè)。也許有一天我們可以通過藍(lán)牙耳機(jī)直接呼出我們的問題,在通過藍(lán)牙耳機(jī)聽到我們想得到的答案,而這除了浪費(fèi)點(diǎn)流量一切都是免費(fèi)的。

  最早接觸的語音識別軟件是臺灣的賽微,這家公司的語音識別技術(shù)在當(dāng)時(shí)已經(jīng)達(dá)到應(yīng)用的水平。軟件本身不錯(cuò),但是有兩個(gè)問題:一是對不常用的詞語的識別率不高,識別速度一般,占用先相對多的內(nèi)存;二是市場需求不強(qiáng)烈,因?yàn)榧夹g(shù)不是非常成熟和市場處于培育期,多數(shù)用戶只是打著試試的想法試用軟件。

  賽微的語音識別技術(shù)只是應(yīng)用于手機(jī)本身并不應(yīng)用于網(wǎng)絡(luò)搜索,讓我們意料之外的是,最早將語音識別技術(shù)應(yīng)用于移動搜索的是歌曲的移動搜索。在這類移動應(yīng)用中佼佼者要數(shù):midomi和shazam,這兩個(gè)軟件都支持多個(gè)手機(jī)平臺,感興趣的用戶可以下載,注意的是shazam是免費(fèi)的。

  這類應(yīng)用的功能和百度即將推出的哼唱搜索是一個(gè)概念,用戶只需打開軟件通過話筒哼唱歌曲或接受播放的音樂,軟件根據(jù)采集的數(shù)據(jù)來識別相應(yīng)的歌曲。原理是采集音頻數(shù)據(jù),上傳數(shù)據(jù),核對數(shù)據(jù)庫里類似的音頻數(shù)據(jù),發(fā)送結(jié)果到設(shè)備。這種技術(shù)已經(jīng)達(dá)到非常成熟的水平,識別率達(dá)到90%以上甚至更高(這里的識別率只針對標(biāo)準(zhǔn)的唱片音頻,每個(gè)人的水平參差不齊識別率的標(biāo)準(zhǔn)不好確定)。而且通過這類手機(jī)軟件產(chǎn)生的流量也很少,一般維持在15k~30k。

  賽微的語音識別技術(shù)止步于單純的手機(jī)應(yīng)用,midomi和shazam等移動終端應(yīng)用也止步于音樂的在線搜索,而搜索引擎廠商如Google、Bing、還有后面跟進(jìn)的百度都在大力推進(jìn)語音識別搜索的網(wǎng)絡(luò)化。微軟的Bing移動版和Google的Google地圖等率先實(shí)現(xiàn)語音識別技術(shù)應(yīng)用于移動搜索領(lǐng)域,而百度在語音移動搜索這個(gè)領(lǐng)域看來也想分一杯羹。

  從已經(jīng)發(fā)布的微軟和Google語音搜索應(yīng)用中我們可以發(fā)現(xiàn),語音搜索離我們的生活還是有一段距離。最大的阻礙還是語音識別率不高,尤其是生詞的識別率超低,生詞基本不能識別,識別時(shí)間較長,占用的內(nèi)存和CPU較多等。就拿Bing移動版來說,目前只支持英文語音搜索,而像Washington、blog、twitter等這類超常用的詞匯識別率很高,識別用時(shí)也很短,而比較生僻的詞匯用時(shí)較長,識別率也很低。我們平時(shí)用手機(jī)鍵盤或虛擬鍵盤只要2~3秒可以完成的輸入,在語音搜索這里可能需要多達(dá)1分鐘才能輸入,而且還不一定準(zhǔn)確。這就是我們現(xiàn)在語音搜索還不普及的原因,用戶要的是效率而不是新穎的噱頭。

  個(gè)人還是相對看好百度的歌曲哼唱搜索,原因是這方面的語音識別中的音樂搜索技術(shù)相對要成熟些,但鑒于每個(gè)人哼唱的水平不一,識別率自然天差地別。今年以來,百度開始加強(qiáng)語音識別的投入力度。尤其上個(gè)月連續(xù)發(fā)出啟事,招募語音識別的技術(shù)帶頭人、高級工程師和工程師等崗位。并提出能敏銳把握語音識別技術(shù)方向,主導(dǎo)開發(fā)過應(yīng)用級別的語音識別系統(tǒng),四年以上語音方向的研究經(jīng)驗(yàn)等要求。

  從國內(nèi)來看,除百度外,盛大也對語音識別技術(shù)情有獨(dú)鐘。盛大網(wǎng)絡(luò)創(chuàng)新院早在去年便靜悄悄地組建了中國最強(qiáng)悍的語音識別團(tuán)隊(duì),而且盛大決定對外開放哼唱搜索技術(shù)相關(guān)源代碼,以幫助國內(nèi)這個(gè)領(lǐng)域的研究人員得到分享和幫助。

  音樂搜索只是語音搜索的冰山一角,移動語音搜索才是語音搜索的重頭戲。而現(xiàn)在語音搜索技術(shù)正在逐漸成熟,語音搜索正在擺脫噱頭的頭銜走向普及應(yīng)用。請大家放心,短時(shí)間內(nèi)語音搜索只能是噱頭,無聊地時(shí)候當(dāng)噱頭在眾人前面擺弄下還是游刃有余的。 若干年后,我們的生活可以被“語音”得很科幻。

21世紀(jì)網(wǎng)



相關(guān)閱讀:
再見,潮水退去的裸泳者SP 2010-08-17
移動設(shè)備的實(shí)時(shí)視頻將引發(fā)車輛工業(yè)的技術(shù)升級 2010-08-17
馬斯洛需求層次理論啟示下的移動應(yīng)用 2010-08-16
電信運(yùn)營商對手機(jī)吸費(fèi)如何防范? 2010-08-13
手機(jī)購買彩票安全嗎? 2010-08-09

熱點(diǎn)專題:  語音合成TTS 語音識別ASR    移動增值   移動互聯(lián)網(wǎng)
分類信息:  移動增值_與_移動互聯(lián)網(wǎng)  移動互聯(lián)網(wǎng)_與_移動
相關(guān)頻道:  增值電信文摘    

亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 黑山县| 九江县| 泰来县| 重庆市| 西吉县| 蓝田县| 岢岚县| 扶余县| 遂昌县| 巴彦县| 迁西县| 镇安县| 瑞丽市| 阳谷县| 文水县| 韶山市| 沁水县| 澜沧| 资中县| 河间市| 富源县| 方正县| 怀仁县| 天津市| 嵊州市| 沁阳市| 新竹县| 克什克腾旗| 华容县| 大足县| 长武县| 德庆县| 凤凰县| 万年县| 湖口县| 高邑县| 开阳县| 罗定市| 长治市| 墨竹工卡县| 洞口县| http://444 http://444 http://444 http://444 http://444 http://444