• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
     首頁 > 技術(shù) > 技術(shù)動態(tài) > 谷歌手機(jī)語音搜索幕后:一封郵件拉起中國團(tuán)隊

    谷歌手機(jī)語音搜索幕后:一封郵件拉起中國團(tuán)隊

    2009-10-16 00:00:00   作者:   來源:   評論:0 點擊:1715



      谷歌9月15日宣布即將在華推出手機(jī)語音搜索的消息引起各方關(guān)注。谷歌中國工程研究院副院長林斌,向新浪科技講述了如何從一封郵件開始,建立這一項目中國團(tuán)隊的幕后故事,并表示新服務(wù)不會為用戶帶來使用成本方面的負(fù)擔(dān)。
      14日中午11時,谷歌負(fù)責(zé)全球移動搜索的副總裁Vic Gundotra出現(xiàn)在谷歌中國總部,他此行的目的是向從兩岸三地匯集于此的媒體宣布,谷歌將于近期推出中文手機(jī)語音搜索服務(wù),這也是谷歌手機(jī)語音搜索首次推出非英語版本。
      在現(xiàn)場的中文手機(jī)語音搜索演示中,只要用戶對著手機(jī)說出想要搜索的內(nèi)容,這一應(yīng)用就能將用戶所發(fā)出的語音信息識別為文字,隨后自動進(jìn)行搜索并迅速反饋回結(jié)果——無論你想要的是文字還是圖片。
      甚至在某些看似“極端”的情況下,比方故意發(fā)出略帶口音的普通話、或說出一長串的內(nèi)容,谷歌中文手機(jī)語音搜索都能良好完成自己的任務(wù)。
      實際上,谷歌這項新技術(shù)的最核心的部分,已經(jīng)不是如何搜索到最佳的結(jié)果。
      如何準(zhǔn)確識別出用戶發(fā)出的語音內(nèi)容成為關(guān)鍵。而中文和英文之間的巨大差異,注定谷歌手機(jī)語音搜索推出中文版意味著眾多關(guān)鍵技術(shù)的重構(gòu)。領(lǐng)導(dǎo)中國團(tuán)隊進(jìn)行這項工作的,正是谷歌中國工程研究院副院長林斌。
      林斌最初接到這一任務(wù)的時候,谷歌手機(jī)語音搜索的英文版已初具雛形但尚未向外發(fā)布,林斌意識到要完成相應(yīng)的中文版必須借助語音方面專業(yè)人員的力量。而就在谷歌中國總部的周圍,中科院和清華都有這方面的研究團(tuán)隊。
      不過林斌并沒有依靠外援,他的最終選擇是發(fā)送了一封內(nèi)部郵件:谷歌中國所有懂語音技術(shù)的工程師,立即集合。林斌的信心來源于谷歌中國此前就有五六位語音技術(shù)的專家,而且時任谷歌中國總裁的李開復(fù)本身就是語音識別領(lǐng)域的權(quán)威。
      林斌對新浪科技表示,中國團(tuán)隊所要面臨的挑戰(zhàn)之一就是構(gòu)建分詞算法。英語不存在分詞的問題,一個單詞就是一個單詞,而對于中文語音識別來說分詞則是重要基礎(chǔ)。
      規(guī)則在此就變得尤為重要。語境分析是最好的判斷標(biāo)準(zhǔn)之一,林斌表示如果語境分析不足以判斷如何分詞,中文谷歌手機(jī)語音搜索將根據(jù)某一組詞出現(xiàn)的概率,由高到低進(jìn)行選取。
      另一個重要的工作是在全國范圍內(nèi)采樣。雖然中文谷歌手機(jī)語音搜索主要支持的是普通話輸入,但考慮到更廣泛的用戶適用性,林斌的團(tuán)隊還跑到中國各個地方去采集當(dāng)?shù)貛в蟹窖郧徽{(diào)的普通話樣本。
      于是,就算不標(biāo)準(zhǔn)的普通話輸入,中文谷歌搜索也能識別,即便是夾雜著英文的港臺腔,中文谷歌搜索也能識別。
      不止一個人會想到這一技術(shù),完全可以與谷歌眾多的產(chǎn)品相結(jié)合,比方谷歌辦公套件、谷歌輸入法、Gmail等等。
      Vic Gundotra表示之所以率先用在手機(jī)上,是因為這個平臺的需求最迫切,此后將在電腦平臺上進(jìn)行推廣,并表示將考慮將這一技術(shù)應(yīng)用在更廣泛的輸入應(yīng)用領(lǐng)域。林斌對此也表示不排除進(jìn)一步融合相關(guān)產(chǎn)品,但谷歌中國要與谷歌總部步調(diào)一致。
      談及這項谷歌耗費巨資的技術(shù)時,Vic Gundotra用“many many years(很多很多年)”來形容研發(fā)過程的漫長。而在這一基礎(chǔ)上,林斌和中國團(tuán)隊僅用不到十個月的時間,就完成了中文版的全部工作,林斌說推出其他語言版本的時間將越來越快。
      據(jù)介紹,中文版谷歌手機(jī)語音搜索采用云計算的模式工作,采集到的語音樣本將送到云端處理,轉(zhuǎn)化成文字內(nèi)容。對于用戶而言,無疑會帶來手機(jī)數(shù)據(jù)傳輸流量的增加。
      對于谷歌這一新技術(shù)的使用成本,林斌直言并不會給用戶帶來明顯的負(fù)擔(dān)。林斌對新浪科技表示,谷歌的工程師將語音采樣的數(shù)據(jù)包進(jìn)行了深入的優(yōu)化,這使得通過用戶手機(jī)發(fā)送的數(shù)據(jù)非常小。
      林斌以自己為例說,目前他平均每天用手機(jī)語音搜索服務(wù)十次。據(jù)其推算按這一標(biāo)準(zhǔn),購買5元包30M流量的資費套餐,足以應(yīng)付谷歌中文手機(jī)語音搜索服務(wù)的要求。

    新浪科技(tech.sina.com.cn)

    相關(guān)閱讀:

    • 0

    • 0

    • 0

    • 0

    • 0

    • 0

    • 0

    • 0

    分享到:   收藏

    專題

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 塔河县| 达拉特旗| 望奎县| 大名县| 株洲县| 资中县| 侯马市| 噶尔县| 安西县| 乌拉特中旗| 进贤县| 井研县| 南丹县| 八宿县| 苍溪县| 鄯善县| 阿鲁科尔沁旗| 平原县| 阳高县| 台南市| 土默特右旗| 铜山县| 云龙县| 四平市| 九台市| 莎车县| 中卫市| 大姚县| 孟津县| 西乡县| 萝北县| 贡嘎县| 定西市| 卓资县| 桦甸市| 确山县| 绥化市| 南昌市| 平度市| 曲阳县| 秦安县| http://444 http://444 http://444 http://444 http://444 http://444