IBM“超人類(lèi)語(yǔ)音識別”電腦2010年面世
2002/01/25
21世紀頭十年結束之前,生產(chǎn)出能夠自動(dòng)理解多達20門(mén)語(yǔ)言,并能識別這些語(yǔ)言的各種語(yǔ)調變化、口音及上下文環(huán)境的機器。該機器還能絲毫不差地轉錄法律、醫療和法庭證詞。這正是IBM把這項新計劃稱(chēng)為“超人類(lèi)語(yǔ)音識別”的原因所在。
該項目已于本年度啟動(dòng),計劃于2010年完成。IBM稱(chēng),已經(jīng)制定出了整個(gè)研制過(guò)程的階段性任務(wù),而總體目標更加明確——使機器語(yǔ)音識別能力趕上并超越人類(lèi)。很多年來(lái),PC機及其更加小巧的后續產(chǎn)品(PDA和手機)就具備了聽(tīng)說(shuō)功能,但是用戶(hù)很少能夠充分利用這些功能,這是因為還存在以下制約因素:
機器在理解口音、語(yǔ)調變化特別是談話(huà)的上下文環(huán)境方面還有困難,英語(yǔ)對于機器來(lái)說(shuō)尤其困難。另外,機器尚無(wú)法有效處理背景噪音。除此之外,技術(shù)越復雜越需要大量的實(shí)驗和調整,比如:通過(guò)反復聽(tīng)同一段聲音,機器的識別能力將大為改善。
在過(guò)去的一段時(shí)間里,基于語(yǔ)音識別技術(shù)的產(chǎn)品在市場(chǎng)上取得了一定的進(jìn)展,被用于開(kāi)展查號服務(wù),以及安裝在一些電子設備中,例如:移動(dòng)電話(huà)、PDA、汽車(chē)儀表盤(pán)以及交互式電視等。
IDC預計,到2005年全球市場(chǎng)對電話(huà)語(yǔ)音處理設備的需求將達到35億美元,為此,IBM、AT&T、朗訊和飛利浦等許多大公司都在爭先恐后地進(jìn)行語(yǔ)音識別技術(shù)研究。IBM公司的100位全職語(yǔ)音識別研究人員中有20名正在專(zhuān)門(mén)投入此項研究課題之中。 他們正在著(zhù)手進(jìn)行音頻-視頻識別研究,這涉及計算機視覺(jué)技術(shù)的開(kāi)發(fā),以便改善語(yǔ)音識別的精確度。另一個(gè)研究重點(diǎn)是MALACH項目。在國家科學(xué)基金會(huì )的資助下,IBM正在和其他行業(yè)的研究人員并肩工作,試圖破解長(cháng)達10萬(wàn)小時(shí)的二戰納粹大屠殺幸存者的談話(huà)錄音,這些錄音內容紛繁多變,充滿(mǎn)各種方言,感情起伏,語(yǔ)調跌宕,還夾雜著(zhù)各種不同語(yǔ)言。
賽迪網(wǎng) 2002/01/25
IBM:CRM一體化推進(jìn)電信運營(yíng)新格局 2009-06-30 |
IBM榮獲“2009中國最佳呼叫中心”大獎 2009-05-22 |
3G時(shí)代來(lái)臨 IBM Lotus新服務(wù)幫客戶(hù)實(shí)現更智慧的運作 2009-05-14 |
IBM推出BlackBerry平臺上的Lotus應用軟件 2009-05-08 |
IBM“刀片”助印度電信削減IT成本 2009-02-26 |