首頁(yè)>>>技術(shù)>>>cti平臺

語(yǔ)音識別技術(shù)將開(kāi)啟另一扇大門(mén)?

陳一斌 2011/06/03

  語(yǔ)音識別技術(shù)擁有足夠高的評價(jià),但一直以來(lái)缺乏足夠的表現。由于無(wú)法精確的識別人類(lèi)語(yǔ)音的表達,使人們在使用語(yǔ)音識別技術(shù)的時(shí)候總會(huì )遇上各種各樣的錯誤,結果就是人們無(wú)法通過(guò)語(yǔ)音直接打電話(huà)和寫(xiě)短信。不過(guò),這一切都有可能改變,關(guān)鍵詞又是蘋(píng)果(Apple)。

  蘋(píng)果去年4月收購一家名為 Siri 的公司,該公司之前推出了一個(gè)應用,能夠識別人們的語(yǔ)音,針對人們提出的問(wèn)題進(jìn)行回答。Siri 所使用的語(yǔ)音識別技術(shù)由在該領(lǐng)域浸淫已久的 Nuance 所開(kāi)發(fā)的。此后,蘋(píng)果與 Nuance 一直保持接觸,并取得了專(zhuān)利授權,現在大家都知道了,蘋(píng)果將在 iOS 5 整合名為 Dragon 的語(yǔ)音識別技術(shù)。因此,iOS 5 也許會(huì )內建語(yǔ)音識別接口(API)供開(kāi)發(fā)者調用。

  而這,有可能讓蘋(píng)果開(kāi)啟下一扇人機交互的大門(mén)。

  語(yǔ)音識別技術(shù)已經(jīng)足夠成熟

  Dragon 語(yǔ)音識別引擎是相當的成熟,在 iOS 平臺上使用該引擎的 Dragon Dictionary 以極高的識別精確度,效果讓人驚異。而 Android 平臺上由 Nuance 推出的 FlexT9,即使售價(jià)為 5 美元都收到 1100 份評論,以及平均 4 顆星的評價(jià)。可見(jiàn)語(yǔ)音識別技術(shù)已經(jīng)邁向成熟,能耐得住市場(chǎng)的考驗。

  Google 也注意到語(yǔ)音識別技術(shù)的潛力。之前 Google 從 Nuance 中挖來(lái)了一位創(chuàng )始人,在 Nuance 工作十年之久的專(zhuān)家。如今用于 Android 上的語(yǔ)音識別技術(shù)被 Slate 評價(jià)為“確實(shí)可用”。即使拐著(zhù)彎問(wèn)的問(wèn)題也難不倒它,比如說(shuō)一英里等于多少埃(計量單位 1 埃 = 1.0 × 10 -10 米)這樣。

  在手機越變越大,觸控屏越來(lái)越流行的情況下,語(yǔ)音識別技術(shù)讓人能夠用一只手來(lái)操作手機,提供了方便。至少,有短信來(lái)的時(shí)候不必痛苦的按虛擬鍵盤(pán),只需要動(dòng)動(dòng)嘴巴就行了。

  蘋(píng)果知道如何讓用戶(hù)接受新的操控方式

  盡管語(yǔ)音識別技術(shù)已經(jīng)足夠成熟,但未必就能讓如今的手機更加易用。因為新的操作方式等于改變用戶(hù)過(guò)往的習慣,這等于用戶(hù)過(guò)往的經(jīng)驗全不管用。假如手機提供了語(yǔ)音識別功能,但用戶(hù)都不去用的話(huà),這項技術(shù)即使再革新也沒(méi)有意義。

  因此 Nuance 引導 FlexT9 的用戶(hù)到一系列的視頻教程去,讓用戶(hù)明白如何操作。作為反例,Slate 指出 Android 的語(yǔ)音識別技術(shù)不夠人性,用戶(hù)需要念出“逗號”、“句號”才能輸入標點(diǎn)符號。

  而蘋(píng)果能夠讓消費者輕易地接受新的科技:第一個(gè) iPhone 廣告其實(shí)是一個(gè)教程,消費者從廣告中就學(xué)會(huì )如何利用 iPhone 上網(wǎng)、收發(fā)郵件以及搜索附近的商店。最終,消費者接受了觸摸操控,也成就了 iPhone 的輝煌。

  如今,語(yǔ)音識別技術(shù)也是一種新的操控方式,而蘋(píng)果是去做推廣的廠(chǎng)商。至少蘋(píng)果不會(huì )只通過(guò)枯燥的視頻教程來(lái)讓用戶(hù)學(xué)會(huì )如何用語(yǔ)音來(lái)操控手機。

  蘋(píng)果是用戶(hù)體驗大師

  一個(gè)產(chǎn)品有成熟的技術(shù),和成功的推廣,也未必能夠留住用戶(hù)的心。

  在 iPhone 之前已經(jīng)有很多款使用觸控屏的手機出現了,但是蘋(píng)果的長(cháng)處就是讓科技變得簡(jiǎn)單易用,貼合人性。這使 iPhone 完成了手機的設計上的革命。現在人們已經(jīng)忘卻了實(shí)體鍵盤(pán),忘卻了軌跡球,取而代之的是一整塊觸控屏。

  通過(guò)深度整合語(yǔ)音識別技術(shù),相信蘋(píng)果還能讓變革再一次發(fā)生,至少可以讓人們對著(zhù)手機說(shuō)幾句話(huà)就能發(fā)一條短信或瀏覽網(wǎng)頁(yè)。而對于開(kāi)發(fā)者來(lái)說(shuō),語(yǔ)音識別技術(shù)無(wú)疑開(kāi)啟另一扇大門(mén),讓他們的應用設計更具有想象力。

  我們仍然無(wú)法得知蘋(píng)果和 Nuance 合作的具體內容,但我們有理由相信蘋(píng)果能夠成功的把語(yǔ)音識別技術(shù)帶入移動(dòng)領(lǐng)域。

ifanr.com



相關(guān)閱讀:
車(chē)載語(yǔ)音識別十年沉浮路 各領(lǐng)風(fēng)騷幾多年? 2011-05-05
英立訊前置IVR系統優(yōu)勢分析與在農行的應用 2011-04-28
企業(yè)采用自助IVR應用程序節約成本 2011-04-26
語(yǔ)音識別技術(shù):讓你的智能手機更聰明 2011-03-31
多人手機游戲:可愛(ài)多的手機互動(dòng)營(yíng)銷(xiāo)案例 2011-03-23

熱點(diǎn)專(zhuān)題:  語(yǔ)音合成TTS 語(yǔ)音識別ASR  
分類(lèi)信息:  CTI文摘_與_移動(dòng)  CTI文摘_與_CTI平臺技術(shù)  移動(dòng)_與_CTI平臺技術(shù)

亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 聊城市| 古浪县| 夹江县| 宣化县| 涿州市| 石渠县| 东乌珠穆沁旗| 水城县| 涡阳县| 会东县| 枣强县| 四川省| 曲靖市| 仁布县| 永登县| 海南省| 武宣县| 武陟县| 苏尼特左旗| 社旗县| 突泉县| 无为县| 台北市| 博乐市| 扶绥县| 根河市| 陕西省| 逊克县| 洛南县| 孝义市| 营山县| 平陆县| 蒲江县| 米泉市| 逊克县| 山东省| 周至县| 吉木乃县| 汝阳县| 平远县| 安庆市| http://444 http://444 http://444 http://444 http://444 http://444