• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
     首頁(yè) > 新聞 > 國內 >

    語(yǔ)音識別:谷歌眼鏡們的五指山

    2013-02-22 15:12:16   作者:張春暉    來(lái)源:36氪   評論:0  點(diǎn)擊:



     

      2月21日,馬克·扎克伯格在參加“生命科學(xué)突破獎”基金會(huì )發(fā)布儀式上第一次嘗試了谷歌眼鏡。據在場(chǎng)記者說(shuō),他看上去對這款谷歌產(chǎn)品非常感興趣,還說(shuō)Facebook已有幾位工程師等著(zhù)在為這款產(chǎn)品做開(kāi)發(fā)了。據說(shuō),他問(wèn)谷歌創(chuàng )始人謝爾蓋·布林,“怎么能戴上去不顯得尷尬?怎么能不破壞跟別人的眼光接觸而用這個(gè)眼鏡?”無(wú)從得知布林當時(shí)做何回答。連一向將谷歌視做最大競爭對手的扎克伯格,都愿意為谷歌眼鏡率先做開(kāi)發(fā),這個(gè)產(chǎn)品前景太值得想象了。

      是的,太具有想像力了,扎克伯格可以用同樣的話(huà)去問(wèn)蘋(píng)果和三星:你們的手機怎么能握上去不顯得象塊石頭?他可以去問(wèn)Kindle:你們的電子閱讀器能不能卷起來(lái)塞屁股口袋里?

      無(wú)論是手機、平板、眼鏡、手表,產(chǎn)品設計的追求總是無(wú)止境的,但基于工藝的限制,在某個(gè)時(shí)代那個(gè)產(chǎn)品就只能在某一個(gè)尺寸標準下下功夫而無(wú)法突破,業(yè)內的朋友形容這就象如來(lái)佛的五指山,只要芯片還是那么大,你想做得小都不現實(shí),例如蘋(píng)果手表,例如谷歌眼鏡。

      實(shí)際上,真正的如來(lái)佛的五指山,是人機互動(dòng)體驗,我無(wú)數次在想,蘋(píng)果手表真的需要那么大的屏幕嗎?它非得通過(guò)一個(gè)手指的觸控才能操控嗎?谷歌眼鏡戴起來(lái)能更能再?lài)妩c(diǎn)么?我們想想,如果說(shuō)手表還能用觸控來(lái)解決體驗,那谷歌眼鏡最好的操控體驗是什么?搖頭晃腦?上下其手?

      對眾多電子產(chǎn)品而言,又要追求越做越小,越做越薄,又要追求更好的操控體驗,如來(lái)佛的五指山又變大了,突破口,只能等待語(yǔ)音識別!目前中國最好的語(yǔ)音識別效果最好的當仁不讓是訊飛,連微信新增的語(yǔ)音提醒體驗用的都是訊飛的,或者說(shuō)他們自己的語(yǔ)音團隊揉入了訊飛的技術(shù)。全球語(yǔ)音技術(shù)做得最好的當然就是Nuance了,從軍事到Siri,它全干了。

      很多人樂(lè )此不彼的在玩Siri,在玩訊飛語(yǔ)音輸入,并且覺(jué)得還不錯,甚至覺(jué)得非常好。實(shí)話(huà)講,是挺好的,只不過(guò)如果要說(shuō)能放到谷歌眼鏡上去,那還差十萬(wàn)八千里呢,這十萬(wàn)八千里,就是“可信識別技術(shù)”。

      一種技術(shù),無(wú)論用的是什么算法,無(wú)論是中國人還是以色列人還是美國寫(xiě)的,都無(wú)所謂,特別是對于普羅大眾而言,我們哪懂啥算法是啥啊?我們需要的,就是在任何自然環(huán)境下,人類(lèi)自然的講話(huà),這包括無(wú)論是在房間,還是馬路邊,還是酒吧里,在各種環(huán)境下,只要人與人之間能聽(tīng)得見(jiàn),聽(tīng)得懂,手表們眼鏡們就要聽(tīng)得懂。以及象小孩子一樣去學(xué)習。三個(gè)月前你和家里的小孩子講話(huà)你還覺(jué)得挺累的,因為他牛頭不對馬嘴,詞不成詞,句不成句,三個(gè)月后你突然發(fā)現他詞藻豐富起來(lái),話(huà)語(yǔ)節奏以及條理一下子很清楚,開(kāi)始有邏輯性。這才是真正的“實(shí)用”與“自然體驗”,所以,手表真的不再需要什么觸控,因為一個(gè)手指頭的觸控本來(lái)也談不上什么好體驗。所以,眼鏡真的不需要搖頭晃腦或上下其手,本來(lái)鏡框也裝不下那么多的東西。

      “可信識別技術(shù)”所面對的還不僅僅是語(yǔ)音識別這一個(gè)領(lǐng)域,而是幾乎整個(gè)數字世界,就象中國傳統文化周易中的“八卦”,世間萬(wàn)物,一個(gè)“八卦”全部解釋清楚。Nuance、google、訊飛們能做到嗎?難,太難了,他們的技術(shù)框架同出一宗,都來(lái)自于“馬爾可夫模型理論”,這三十年以來(lái)全世界的語(yǔ)音研究幾乎都在同這個(gè)理論下做文章,可理論模型這東西就象一棟大樓的設計,圖紙設計好是30層,你蓋好之后,是不可能改成100層的,如果你想改就得重新設計圖紙重新蓋,而上述的這些公司,現在已經(jīng)在28層了。如果不是這幾年的“云計算”所帶來(lái)的海量語(yǔ)料,那可能還在蓋十幾層呢。

      我們現在需要耐心等待就是這個(gè)數字世界的“八卦”,全世界無(wú)數的科學(xué)家這三十年來(lái)為語(yǔ)音識別技術(shù)而奮斗,可能是明天,可能是十年…時(shí)間不是問(wèn)題,因為人類(lèi)需要一種象空氣一樣的技術(shù),你感覺(jué)不到它,而你卻每時(shí)每刻的依賴(lài)著(zhù)它!

     

    分享到: 收藏

    專(zhuān)題

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 桐庐县| 台南市| 建阳市| 贺兰县| 柳州市| 离岛区| 体育| 大兴区| 高尔夫| 峨山| 泸西县| 三穗县| 英德市| 泗水县| 海伦市| 太谷县| 元朗区| 宁阳县| 左贡县| 辉南县| 韩城市| 奉化市| 攀枝花市| 永兴县| 宜兴市| 万安县| 康马县| 宜君县| 陈巴尔虎旗| 宁波市| 成武县| 平江县| 永顺县| 镇平县| 广东省| 银川市| 靖宇县| 成安县| 五原县| 沈阳市| 岳普湖县| http://444 http://444 http://444 http://444 http://444 http://444