• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
     首頁(yè) > 技術(shù) > 技術(shù)文摘 > 語(yǔ)音技術(shù):走出實(shí)驗室的革命

    語(yǔ)音技術(shù):走出實(shí)驗室的革命

    2001-06-21 00:00:00   作者:   來(lái)源:   評論:0 點(diǎn)擊:


     

      最近在清華大學(xué)計算機系智能技術(shù)與系統國家重點(diǎn)實(shí)驗室里,記者參觀(guān)了一項名為“Talking Head”的技術(shù)展示。與近期十分熱鬧的“虛擬主持人”電腦合成的形象不同,這里屏幕上顯示的是一張真實(shí)的人臉,能清晰地朗讀出任選的一段中文或者中、英文夾雜的文字,她的嘴唇及整個(gè)面部隨著(zhù)發(fā)音的不同而變化。實(shí)驗室的陶建華博士跟記者開(kāi)玩笑說(shuō):“把你的照片拿來(lái),20分鐘我就能讓它開(kāi)口說(shuō)話(huà)。”苛刻地說(shuō)“說(shuō)話(huà)的人臉”仍顯得有些可怕。陶博士解釋說(shuō)數據分析的量很大,現在還未做到眼睛以上部分的緣故,所以“說(shuō)話(huà)時(shí)”整張臉的活動(dòng)還不太自然。

      如果有了十分自然的“Talking Head”,人們將會(huì )擁有許多個(gè)性化的TTS(語(yǔ)音合成技術(shù))應用。例如可以在用在E-mail里,用自己的形象和聲音“口述”郵件內容;母親可以利用它給獨自留在家中的小孩講故事。國外某機構甚至宣布了“復活夢(mèng)露”的瘋狂計劃,宣稱(chēng)夢(mèng)露可以在重新活躍在銀幕上,她甚至可以主演新的劇本,與觀(guān)眾談?wù)摤F在的時(shí)事。   種種美好的、有趣的、大膽的、革命性的應用得益于語(yǔ)音技術(shù)的發(fā)展。語(yǔ)音是核心技術(shù),與其他任何技術(shù)的交叉組合,就會(huì )產(chǎn)生活力。優(yōu)美而復雜的漢語(yǔ)因處理的困難屢次受到“是否阻礙了信息化進(jìn)程”的質(zhì)疑,如今在語(yǔ)音技術(shù)方面也慢慢地跟上來(lái)了。

      應用突圍

      語(yǔ)音技術(shù)可分為語(yǔ)音識別和語(yǔ)音合成兩大類(lèi)。語(yǔ)音識別涉及的問(wèn)題更復雜一些,例如方言、應用中語(yǔ)音通過(guò)電話(huà)(特別是無(wú)線(xiàn)方式)傳遞時(shí)的失真等等。就漢語(yǔ)來(lái)說(shuō)TTS技術(shù)更成熟,若把機器的發(fā)音分為能聽(tīng)懂——清晰——有表現力三個(gè)階段的話(huà),目前只能說(shuō)“接近比較自然”,能播新聞,但也許不能講故事。技術(shù)已經(jīng)到了可以走上應用的階段,各種產(chǎn)品早就迫不及待地冒出了頭。

      有關(guān)通信的應用是市場(chǎng)比較需要、產(chǎn)品也相對豐富的方面。在“移動(dòng)夢(mèng)網(wǎng)”建設中,炎黃新星公司與清華大學(xué)合作提供的IP—IVR與TTS語(yǔ)音網(wǎng)關(guān)產(chǎn)品已在5月安裝到了杭州和廣州的中國移動(dòng)統一信息平臺上。用戶(hù)將可以用手機、固定電話(huà)播打或接收電子消息,并可以利用IP網(wǎng)關(guān)技術(shù),進(jìn)行IP語(yǔ)音消息、IP傳真在公網(wǎng)與專(zhuān)網(wǎng)上的數據傳送。電子詞典以及圖書(shū)發(fā)行方面的應用也很廣泛。

      由新華書(shū)店等投資的新華世紀軟件公司新推出了以漢語(yǔ)普通話(huà)為標準發(fā)音的朗讀軟件—“新華音霸KingVoice1.0”,在電腦朗讀的同時(shí)能顯示具有口型變化的Talking Head。2000年掌上電腦“開(kāi)口說(shuō)話(huà)”的話(huà)題炒得很熱,捷通公司開(kāi)發(fā)出WinCE環(huán)境下的語(yǔ)音閱讀軟件。這些用的都是清華大學(xué)的核心技術(shù)。

      同為863計劃基地的中科大訊飛公司在“國家863計劃十五周年成就展”上展出了新穎有趣的“虛擬主持人”、“機器人足球賽虛擬評論員”,引得觀(guān)眾駐足圍觀(guān)。訊飛推出了一系列的“EVoice有聲電子郵件系統”、“電話(huà)語(yǔ)音金融雷達系統”等解決方案,以及針對教育領(lǐng)域的“老師家長(cháng)一線(xiàn)通”和“網(wǎng)絡(luò )信息凈化器”等軟件產(chǎn)品。由其承建的我國首家應用語(yǔ)音技術(shù)的數字化圖書(shū)館在安徽通過(guò)了驗收,突破了傳統數字圖書(shū)館只能通過(guò)計算機網(wǎng)絡(luò )查詢(xún)的限制,讀者通過(guò)電話(huà)就可以獲取圖書(shū)館的大量信息。

      企業(yè)需要一般公務(wù)及商業(yè)方面的應用,例如“統一消息處理系統”。只要一臺計算機或電話(huà),員工無(wú)論在家中、在路上,還是在辦公室或旅館,都可以隨時(shí)隨地處理個(gè)人語(yǔ)音信息、傳真和電子郵件,十分方便。例如員工通過(guò)電話(huà)登錄,系統可以用“口述”的方式讓員工了解郵件的內容。 TTS應用已經(jīng)開(kāi)始滲透到大眾身邊。打開(kāi)個(gè)人電腦,號稱(chēng)“無(wú)話(huà)不說(shuō)的超厚詞典”—金山詞霸.net 2001,就能夠對任意單詞、語(yǔ)句,甚至可以流利的帶語(yǔ)氣的朗讀出用戶(hù)指定的任何一段英文。

      與國內各大科研院所不同,IBM、Intel等跨國公司花了更多力氣在語(yǔ)音識別技術(shù)方面。IBM早在1997年就推出了中文的“聽(tīng)寫(xiě)機”。其“ViaVoice”軟件已經(jīng)不僅用于電腦,還應用于電視和便攜式信息終端等,如智能電話(huà)轉接系統、Web網(wǎng)站上的應用、在Word2000文檔模板中可以直接通過(guò)語(yǔ)音輸入文件等。Intel公司自己就采用了語(yǔ)音識別自動(dòng)轉接系統,撥通其總機后,說(shuō)出撥叫方的姓名,經(jīng)確認后就可自動(dòng)轉接過(guò)去,而無(wú)需按鍵。

      市場(chǎng)升溫

      一個(gè)方便的系統肯定需要語(yǔ)音識別與語(yǔ)音合成兩種技術(shù)的配合,例如系統通過(guò)語(yǔ)音識別來(lái)確定身份、了解要求,然后通過(guò)語(yǔ)音合成使移動(dòng)的用戶(hù)通過(guò)手機、PDA等便攜的終端“聽(tīng)”到消息。 技術(shù)最近看來(lái)不會(huì )有飛躍性的突破。各公司的技術(shù)基礎基本相同,倒是在系統的集成和市場(chǎng)的推廣上分出了高低。

      市場(chǎng)需求十分高漲。韓國的智能家電系列、美國的能提醒人們按時(shí)服藥的藥瓶、德國的會(huì )說(shuō)話(huà)的全自動(dòng)洗衣機、英國的能說(shuō)四國語(yǔ)言的新穎吸塵器等無(wú)不吸引了眾多傳媒的目光以及用戶(hù)的擁有欲望。語(yǔ)音不僅是“錦上添花”,使應用更方便的技術(shù),而且常常“雪中送炭”。例如印尼政府近日為盲人開(kāi)設了一個(gè)有聲網(wǎng)站www.mitranet.or.id,看不見(jiàn)屏幕的盲人也能在該網(wǎng)站的語(yǔ)音提示下進(jìn)行上網(wǎng)操作,大大方便了盲人與世界的交流。而且很多應用已帶來(lái)了巨大的經(jīng)濟效益。如幾年前Bell實(shí)驗室研制出的ZeroPlus自動(dòng)語(yǔ)音應答系統為AT&T電話(huà)公司每年節省1億美元的人工服務(wù)費用,該系統根據美國的多種電話(huà)付費方式,通過(guò)自動(dòng)語(yǔ)音交互應答,自動(dòng)識別用戶(hù)的付費方式。韓國使用語(yǔ)音股票交易服務(wù)的用戶(hù)以四五十歲的人士居多,雖然只占了整體用戶(hù)的20%,卻是交易量最高的一群。

      爭奪也很激烈,早在1998年市場(chǎng)上銷(xiāo)售的語(yǔ)音識別系統已經(jīng)超過(guò)80多種。2001年中國市場(chǎng)上語(yǔ)音產(chǎn)品也已經(jīng)形成了一定的市場(chǎng)規模。IBM和Intel 在中國市場(chǎng)上已經(jīng)努力了很久,IBM的語(yǔ)音識別軟件占據了大半的市場(chǎng)份額。2000年底兩大巨人牽手,IBM中國與Intel中國Dialogic分部聯(lián)合推出了語(yǔ)音開(kāi)發(fā)平臺。國內企業(yè)很小很弱,但是擁有一些語(yǔ)音合成方面的核心技術(shù),應該說(shuō)市場(chǎng)機會(huì )還是有的。

    相關(guān)閱讀:

    分享到: 收藏

    專(zhuān)題

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 达州市| 林甸县| 澄江县| 肃宁县| 尖扎县| 井冈山市| 龙胜| 娄烦县| 台安县| 会宁县| 高雄市| 揭东县| 博野县| 马尔康县| 庐江县| 保德县| 安仁县| 定襄县| 荥阳市| 曲周县| 平潭县| 连平县| 威远县| 金阳县| 瑞丽市| 日土县| 嘉峪关市| 喀喇| 同德县| 利川市| 于都县| 张家港市| 龙井市| 尚义县| 万源市| 马山县| 汾阳市| 元谋县| 德兴市| 秦皇岛市| 凤翔县| http://444 http://444 http://444 http://444 http://444 http://444