發(fā)表評論分享按鈕

蘋(píng)果Siri善解人意 語(yǔ)音應用引爆在即

2011/11/23

  多年來(lái),語(yǔ)音識別技術(shù)始終磕磕巴巴、欲語(yǔ)還休。現在,Siri橫空出世,將這項技術(shù)推向了主流,同時(shí)還帶來(lái)了非常廣泛的應用前景

  語(yǔ)音識別并不是什么新鮮事物。多年來(lái),消費電子產(chǎn)品、汽車(chē)和自動(dòng)呼叫中心一直就在“傾聽(tīng)”使用者的指令。從2009年開(kāi)始,谷歌公司(Google)就一直在采錄語(yǔ)音信箱的信息。而在此之前三年,微軟公司(Microsoft)也將類(lèi)似的技術(shù)置入了Windows Vista。那么,蘋(píng)果這個(gè)名為Siri的全新虛擬個(gè)人助理到底有什么神奇之處呢?


  它能讀懂你的心。

  換句話(huà)說(shuō),Siri不僅僅是語(yǔ)音識別技術(shù),它還能理解語(yǔ)言——正是這一點(diǎn)開(kāi)始改變用戶(hù)與手機的互動(dòng)方式。現在,很多人預測,Siri將對這項長(cháng)期以來(lái)呼之欲出的技術(shù)起到重大推動(dòng)作用,正如蘋(píng)果iPhone的觸控系統讓觸控技術(shù)躋身主流一樣。這項技術(shù)將掃清眾多創(chuàng )新應用發(fā)展道路上的障礙。市場(chǎng)調研公司Opus Research稱(chēng),今年語(yǔ)音識別行業(yè)的產(chǎn)值將達到約27億美元。該公司還預計,2012年,市場(chǎng)將掀起后Siri語(yǔ)音應用熱潮。

  是什么讓Siri如此與眾不同呢?戰略咨詢(xún)公司Creative Strategies總裁提姆•巴佳瑞稱(chēng),答案在于精確性。他說(shuō):“Siri推出的是真正的新一代人機界面,它對語(yǔ)音理解及精確把握語(yǔ)音的市場(chǎng)產(chǎn)生了重大影響。”

  Siri當然談不上完美無(wú)缺。這項技術(shù)在理解某些口音上還頗為困難,不過(guò)蘋(píng)果已經(jīng)在努力解決這些小問(wèn)題了。但對一款軟件來(lái)說(shuō),Siri的表現可圈可點(diǎn)。Siri的始創(chuàng )者是位于加州的門(mén)羅帕克市的研究實(shí)驗室SRI International,據它稱(chēng),Siri的關(guān)鍵在于自然語(yǔ)言處理技術(shù)。Siri的工作原理是:捕捉語(yǔ)音信號,直接將其轉換為文本,它們與用戶(hù)在手機屏幕上看到的文本并無(wú)二致。Siri然后將這些語(yǔ)句與某些預先編制好的指令配比,比如“撥打電話(huà)”,或“編輯短信”。

  這一技術(shù)潛力巨大,絕不是只適用于平板電腦和智能手機。語(yǔ)音識別系統Nuance公司是語(yǔ)音識別軟件Dragon的開(kāi)發(fā)者,這款軟件在醫療保健行業(yè)的應用已經(jīng)長(cháng)達十年之久。內科醫生的桌面上正運行著(zhù)Nuance的最新軟件,它利用一個(gè)夾式微型話(huà)筒來(lái)錄音。隨著(zhù)問(wèn)診的推進(jìn),這款軟件會(huì )及時(shí)更新病人的電子健康記錄。Nuance公司醫療保健部門(mén)的資深研發(fā)副總裁喬•佩特羅稱(chēng):“病人可能在這一秒說(shuō)的是母親的病史,下一秒又提起父親的病歷。而這些情況這款軟件都能理解。”

  它是如何做到的呢?它的工作原理和Siri非常相似:通過(guò)從它所識別的語(yǔ)匯中獲取意義,然后參照一個(gè)醫療信息數據庫,將其與病人的病史做比對。隨后,它會(huì )運用統計推斷的方法,在其所發(fā)現的信息片段之間建立聯(lián)系,甚至為對癥治療給出建議。全美大約有45萬(wàn)名內科醫生正在使用Nuance公司的軟件。佩特羅稱(chēng),這一技術(shù)的準確率超過(guò)90%,而且還會(huì )隨著(zhù)時(shí)間推移而不斷提高。顯然,這款軟件盈利前景良好,因此Nuance公司決定,將其第四財季的收入預期調高約1,000萬(wàn)美元。

  然而,研究人員對這一技術(shù)的未來(lái)抱有更大的希望。思凱普•里佐是南加州大學(xué)創(chuàng )新技術(shù)學(xué)院(the University of Southern California's Institute for Creative Technologies)的助理總監。他正在開(kāi)發(fā)一種互動(dòng)仿真技術(shù),用以幫助退伍軍人針對創(chuàng )傷后緊張癥(post-traumatic stress disorder)尋求醫療咨詢(xún)服務(wù)。這款軟件名為SimCoach,它的最終目的是要設法理解人們口語(yǔ)背后的情緒狀態(tài)。里佐稱(chēng):“這是個(gè)十分巨大的挑戰。因為必須采集語(yǔ)音模式,然后得像人類(lèi)的大腦那樣對它們進(jìn)行分析。”里佐稱(chēng),人類(lèi)或許能察覺(jué)自己的好友或家人情緒異常,因為這時(shí)人們的語(yǔ)速往往會(huì )變慢,重音也更少,但電腦要捕捉這些信號可就相當困難了。

  不過(guò)這個(gè)領(lǐng)域的有些研究卻能更快獲得成果,而不用再苦苦等待。去年春天,里佐的研究伙伴——麻省理工學(xué)院(MIT)教授阿歷克斯•彭特蘭在美國銀行(Bank of America)的呼叫中心開(kāi)展了一項類(lèi)似的語(yǔ)音推斷技術(shù)試驗,旨在分析員工的溝通對業(yè)務(wù)成功的影響。彭特蘭讓員工連續六周在脖子上戴著(zhù)小型電子設備,它們能記錄員工的實(shí)際位置以及身體語(yǔ)言和聲音。所記錄的數據能顯示這些員工是在和誰(shuí)溝通,他們站著(zhù)時(shí)與溝通對象距離有多遠,談話(huà)的語(yǔ)調如何。彭特蘭稱(chēng):“我們發(fā)現,效率最高的員工不光與大量對象交談,他們還與同樣表現出這種特點(diǎn)的同事交談。”結果,他說(shuō),只需要調整一下員工的茶歇時(shí)間,使這類(lèi)員工之間的步調更為同步,這個(gè)呼叫中心每年就能節省1,500萬(wàn)美元。

  用戶(hù)現在對Siri的廣泛關(guān)注很可能將大大促進(jìn)這類(lèi)研究,并進(jìn)一步推進(jìn)其應用。里佐說(shuō):“語(yǔ)音識別技術(shù)確實(shí)是技術(shù)領(lǐng)域至高無(wú)上的圣杯(holy grail)。我們已經(jīng)掌握了這項技術(shù)的90%,但剩下的10%要求攻克更多難關(guān)。一旦到了引爆點(diǎn),我們將迎來(lái)一片十分廣闊的市場(chǎng)。”看起來(lái),這個(gè)引爆點(diǎn)很可能非Siri莫屬。

財富中文網(wǎng)



相關(guān)閱讀:
美國ITC:蘋(píng)果沒(méi)有侵犯宏達電任何一項專(zhuān)利 2011-11-22
摩托羅拉為蘋(píng)果鋪路:喬布斯iPhone橫空出世 2011-11-21
人人都愛(ài)上Siri 智能機器人大行其道 2011-11-21
開(kāi)發(fā)商破解Siri工作原理 實(shí)現在其他設備使用 2011-11-15
John Briggs:Siri 背后的聲音 2011-11-14

熱點(diǎn)專(zhuān)題:  語(yǔ)音合成TTS 語(yǔ)音識別ASR  
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 彭山县| 镶黄旗| 河东区| 荃湾区| 晋江市| 军事| 秀山| 新泰市| 大同市| 达州市| 虎林市| 迁安市| 慈利县| 五原县| 沅陵县| 句容市| 麻江县| 涿州市| 西峡县| 大英县| 温泉县| 锡林郭勒盟| 油尖旺区| 河津市| 桐庐县| 图们市| 越西县| 永昌县| 保亭| 长宁县| 漳平市| 招远市| 武宁县| 隆化县| 蓬溪县| 霍林郭勒市| 灵石县| 惠州市| 额尔古纳市| 安顺市| 丹阳市| http://444 http://444 http://444 http://444 http://444 http://444