• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
     首頁(yè) > 技術(shù) > 技術(shù)文摘 > 顏永紅:“搜索”語(yǔ)音識(shí)別技術(shù)的未來(lái)

    顏永紅:“搜索”語(yǔ)音識(shí)別技術(shù)的未來(lái)

    2010-05-28 00:00:00   作者:   來(lái)源:   評(píng)論:0 點(diǎn)擊:



      顏永紅:中科院聲學(xué)所中科信利語(yǔ)音識(shí)別實(shí)驗(yàn)室主任。
      1990年畢業(yè)于清華大學(xué),1995年獲得美國(guó)俄勒岡研究院博士學(xué)位,后在該校任教,曾擔(dān)任OGI口語(yǔ)研究中心的副主任、英特爾微處理器實(shí)驗(yàn)室的主任工程師和人機(jī)界面總框架師,英特爾中國(guó)研究中心的主任和首席研究員,英特爾全球人機(jī)界面學(xué)術(shù)委員會(huì)主席。
      2002年入選中科院百人計(jì)劃,任聲學(xué)所研究員、博士生導(dǎo)師,中科信利語(yǔ)音實(shí)驗(yàn)室主任和所長(zhǎng)助理。長(zhǎng)期從事人機(jī)界面研究工作,目前從事的研究領(lǐng)域:大詞表非特定人連續(xù)語(yǔ)音識(shí)別,多模口語(yǔ)系統(tǒng),嵌入式系統(tǒng),多媒體數(shù)據(jù)檢索,系統(tǒng)自適應(yīng)和快速搜索算法。

      10年前,他曾是英特爾微處理器實(shí)驗(yàn)室的主任工程師和人機(jī)界面總框架師,英特爾中國(guó)研究中心的主任和首席研究員。
      如今,他一手創(chuàng)辦的中科院聲學(xué)所中科信利語(yǔ)音識(shí)別實(shí)驗(yàn)室已發(fā)展成為國(guó)內(nèi)語(yǔ)言聲學(xué)領(lǐng)域規(guī)模最大、學(xué)科最全的實(shí)驗(yàn)室,與實(shí)驗(yàn)室同時(shí)成立的中科信利技術(shù)有限公司也取得了長(zhǎng)足的發(fā)展。
      兩個(gè)“孩子”的長(zhǎng)大讓他倍感欣慰。而同時(shí),他錯(cuò)過(guò)了兩個(gè)寶貝女兒的成長(zhǎng),這是他最遺憾的。
      “沒(méi)有什么后悔的,時(shí)間無(wú)法倒流,只能往前看。”中科院聲學(xué)所中科信利語(yǔ)音識(shí)別實(shí)驗(yàn)室主任顏永紅說(shuō)。
      一項(xiàng)技術(shù),牽制搜索引擎
      “在不久的將來(lái),互聯(lián)網(wǎng)將成為一個(gè)浩大的音視頻檔案庫(kù),對(duì)下一代搜索引擎來(lái)說(shuō),語(yǔ)音識(shí)別技術(shù)是關(guān)鍵。”顏永紅說(shuō)。
      在浩繁的音視頻數(shù)據(jù)庫(kù)中,要查找出所需的音視頻片斷,已經(jīng)成為困擾互聯(lián)網(wǎng)搜索的難題——目前的技術(shù)主要是搜索音視頻的關(guān)鍵詞,比如音視頻的名字或作者,并沒(méi)有辦法搜索音視頻內(nèi)容。而通過(guò)語(yǔ)音識(shí)別技術(shù),可以把多媒體文件變成可識(shí)別的計(jì)算機(jī)語(yǔ)言,從而有效快速的實(shí)現(xiàn)準(zhǔn)確搜索。
      事實(shí)上,語(yǔ)音識(shí)別技術(shù)也是各大公司競(jìng)爭(zhēng)的一大焦點(diǎn)。
      去年11月份,谷歌推出的語(yǔ)音搜索引起極大關(guān)注。用戶只需在手機(jī)上安裝一個(gè)軟件,然后利用手機(jī)原有的麥克風(fēng),用普通話對(duì)手機(jī)說(shuō)出需要查詢的內(nèi)容,谷歌中文語(yǔ)音搜索會(huì)自動(dòng)返回整合的搜索結(jié)果。
      “從實(shí)驗(yàn)室成立到現(xiàn)在,我們一直在做這方面的技術(shù)積累,很快,我們和國(guó)內(nèi)公司合作的語(yǔ)音搜索將面世。”顏永紅笑著說(shuō)。
      目前,中科信利的中文電視廣播新聞節(jié)目識(shí)別系統(tǒng),就已經(jīng)被多家公司采用,并作為其提供給全國(guó)各電視臺(tái)的數(shù)字媒體管理系統(tǒng)中一個(gè)核心技術(shù)模塊。
      這個(gè)系統(tǒng)立刻引起本報(bào)記者的強(qiáng)烈興趣——當(dāng)系統(tǒng)“收聽(tīng)”到一段“新聞聯(lián)播”節(jié)目,自動(dòng)將節(jié)目?jī)?nèi)容生成文字,并且識(shí)別準(zhǔn)確率驚人地高。
      “那是不是我們的采訪錄音直接可以被轉(zhuǎn)化成文字?”記者頓時(shí)興致勃勃。
      “現(xiàn)在還不行。”顏永紅笑著說(shuō),“因?yàn)檎Z(yǔ)音識(shí)別包括語(yǔ)言模型和聲學(xué)模型,新聞?wù)Z言可以建立語(yǔ)言模型,但口語(yǔ)卻很難建立語(yǔ)言模型。”
      在語(yǔ)音識(shí)別實(shí)驗(yàn)室里,視頻精確搜索已不是問(wèn)題。
      在一段王楠比賽的視頻中,你只要輸入“側(cè)身?yè)尷薄ⅰ扒叭濉钡汝P(guān)鍵詞,就可以找到精確到秒的視頻。這就意味著,如果你想找一部電影里的精彩片段,只需記得其中的經(jīng)典臺(tái)詞即可搜索。
    共 2 頁(yè):1 2 

    《科技日?qǐng)?bào)》

    相關(guān)閱讀:

    分享到:   收藏

    專題

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 双辽市| 黔南| 馆陶县| 留坝县| 白银市| 昆明市| 皮山县| 涪陵区| 龙井市| 西青区| 松滋市| 柳林县| 临沭县| 洪江市| 石屏县| 柯坪县| 大名县| 临西县| 西吉县| 厦门市| 马鞍山市| 全椒县| 嘉定区| 高清| 航空| 岳池县| 威信县| 汝州市| 壶关县| 巴青县| 新巴尔虎右旗| 洪湖市| 湟源县| 潜山县| 边坝县| 河东区| 桐庐县| 海南省| 碌曲县| 三河市| 句容市| http://444 http://444 http://444 http://444 http://444 http://444