首頁>>>技術>>>語音應用>>>語音識別(ASR)  語音識別產品


國內電腦語音識別技術屢獲突破

  記者日前在中國科大人機語音通信實驗室采訪時看到令人震驚的一幕:操作人員只需按動電腦電源,隨后信口發(fā)號施令,電腦即可按主人的意思進行文字輸入、文件處理、收發(fā)郵件,甚至可以與使用者對話等等。該研究室負責人、智能計算機成果轉化基地中央研究院院長王仁華教授告訴記者:“中文‘傻瓜’電腦悄然向我們走來!”

  “讓電腦聽懂說話,讓電腦開口說話。”幾乎在計算機誕生的時候,專家們就開始向這一方面努力。只有達到這一目標,電腦才能成為世界上最聰明的“傻瓜”。

  在計算機王國美國,行業(yè)頭號霸主IBM率先進行電腦語音識別研究。經過20多年的努力,先后推出英文、法文、德文等近十種文字的語音識別技術。由于漢語結構復雜,單章節(jié)為主,同音字多,方言多,語法亦不規(guī)范,直到1997 年底,IBM才推出不太成熟的漢語識別技術。這些頂尖高手們深知漢語音識別技術艱難,自身難以攻克,就以較低的價格,或技術互換的方式向全世界二次開發(fā)商、科研機構提供軟件內核。

  此后的一年多時間里,“讓電腦聽懂說話”技術獲得迅疾突破,微軟、IBM、摩托羅拉等世界級開發(fā)商投入大量人力物力。首創(chuàng)電腦聲卡的新加坡創(chuàng)新公司,臺灣清華大學和香港中文大學等華語研究開發(fā)機構在漢語音技術方面做了大量工作,語音導航、語音識別等技術日臻成熟。IBM公司1998年推出的漢語識別軟件ViaVioice98,可在普通話基礎上適應廣東、四川、上海等有代表性的方音,只要讀5個詞、3句話即可建立一個語音模型,并有使用中自學功能。

  “英雄所見略同”,漢語音技術在我國是“863”計劃支持最早、時間最長的智能計算機領域攻關課題。清華大學、中國科學院聲學所、中國科學技術大學等8家研究機構成立相關技術攻關組,接受“863”計劃支持。到1997年底,由王仁華教授領導的中國科大人機語音通信實驗室、國家智能計算機研究開發(fā)中心在漢語音識別、合成方面取得突破;與 IBM進行技術交流獲得語音識別內核基礎上進行再開發(fā),漢語音識別技術與IBM同步;語音合成方面通過十幾年的摸索,毅然放棄國際通行的方法,獨創(chuàng)“人聲道模擬技術”,結束了在語音信號處理,音頻、視頻編碼和傳輸等領域內多項關鍵技術上達到國際領先水平,結束了漢語音合成清晰度與自然度的制約,電腦終于可以說出流利的漢語。

  記者在中國科大看到,操作者從因特網上下載一篇新聞,電腦即可略帶情感地讀出它。“863”專家組曾作過檢測,把電臺播音員播出水平打成5分,中國科大電腦合成的語音可打4分。

  理論研究基礎和科技上的突破,為漢語“能聽會說”電腦問世提供了前提。以中國科大研究機構為依托成立的國家863智能計算機成果轉化基地中央研究院、安徽硅谷天音信息科技有限公司對已取得的高新技術產品進行了產品化,其第一個語音輸入和控制計算機產品“天音話王”已投放市場,月銷量達百萬元,港、臺地區(qū)總銷量逾10成萬套。此前的IBM 產品、“漢王”聽寫產品在市場上都有較好表現。

  王仁華教授介紹,國內智能電腦技術發(fā)展相當迅速。中國科大的漢語音識別軟件對電腦常用命令、術語,如打開文件、刪除、新開窗口等,使用者不用進行適應性訓練,亦可有較高的識別率;接受訓練后的電腦,語音識別已超過實用標準,配合手寫修改,完全可以讓普通人享受電腦文本處理的便利。中國科大研究成功的語音合成技術則是通過建立語音庫,先期大量錄入語音,用特殊的算法對要合成的語音進行尋找、對應,因此擺脫了機器發(fā)聲,實際播出的聲音就是人聲。電腦已能初步識別諸如人手勢、形體動作。

  但王教授也表示,包括語音識別在內,技術上要走的路還很遠。如人的耳朵可以在嘈雜的聲音中區(qū)別出需要的聲音,而現行語音識別軟、硬件對背景場都沒有什么辦法。只有在弄清人耳朵語音識別機理,做出仿生識別系統,才是語音識別的新臺階。

  盡管語音識別與合成技術是基礎而又專業(yè)的領域,但人們已認定“傻瓜”電腦技術勢將對以家電為主的其他領域帶來新一輪的產業(yè)革命:將來不僅是電腦操作,洗衣、調整電視、甚至是開車、控制車床等,只要動動口即可;保安系統不僅可以報告發(fā)生不測,還可以告訴您具體發(fā)生什么事情,如此等等。“傻瓜”電腦技術的成熟,使真正意義上的智能電器、智能家庭、智能大廈得以出現。可喜的是,國內這一方面基礎理論研究成果、關鍵技術屢獲突破,專家預測,不久的將來,民族化、能聽會說、善于察言觀色的聰明的“傻瓜”電腦將出現在千家萬戶。

摘自《光明日報》1999年11月17日



相關鏈接:
IBM推出Linux版本的ViaVoice 2002-01-30
Intel推出語音軟件項目 2002-01-30
IBM公司舉行ViaVoice電話語音識別新技術發(fā)布會 2002-01-30
語音識別新天地 2002-01-30
語音識別用于國內呼叫中心 2002-01-30

分類信息:  語音合成TTS_與_語音識別ASR     技術_語音合成_新聞   技術_語音識別_新聞
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 海原县| 定边县| 平陆县| 乃东县| 平泉县| 习水县| 乌什县| 广西| 丰原市| 广宗县| 正安县| 隆林| 阳新县| 仁怀市| 抚远县| 左权县| 青神县| 漳州市| 西吉县| 乐安县| 隆林| 奉化市| 湘潭市| 英超| 蓬莱市| 台江县| 元氏县| 修水县| 汕尾市| 湾仔区| 云霄县| 龙江县| 南澳县| 广安市| 崇州市| 海丰县| 修武县| 凌海市| 灵石县| 永登县| 宁阳县| http://444 http://444 http://444 http://444 http://444 http://444