目前的語(yǔ)音識別系統分為兩種:一種是面向計算機個(gè)人用戶(hù)的,一般安裝在用戶(hù)的個(gè)人計算機上;另一種是面向CTI領(lǐng)域的,主要是使CTI應用系統能夠實(shí)現語(yǔ)音識別功能。
■CTI對語(yǔ)音識別提高要求
應用于CTI領(lǐng)域的語(yǔ)音識別技術(shù)有別于一般PC機系統所使用的語(yǔ)音識別技術(shù),其面臨的困難體現為:電話(huà)錄音質(zhì)量差,識別率要求高,系統不能對電話(huà)用戶(hù)進(jìn)行訓練;另外,系統還要能夠完成大量用戶(hù)語(yǔ)音數據的并發(fā)識別請求,這就對應用于CTI領(lǐng)域的語(yǔ)音識別技術(shù)在功能和性能上要有更高要求。
■語(yǔ)音識別拓展CTI應用
ASR技術(shù)給CTI領(lǐng)域帶來(lái)了更加廣闊的前景。以往用戶(hù)使用電話(huà)接入時(shí),與系統進(jìn)行交互就只能通過(guò)電話(huà)按鍵或人工服務(wù)進(jìn)行交互,對于復雜的系統,如郵政編碼查詢(xún)、天氣預報、航班查詢(xún)等,如果使用按鍵表示的話(huà),用戶(hù)根本無(wú)法記住這些表示,而只能通過(guò)人工服務(wù)進(jìn)行查詢(xún)。像傳統的168信息服務(wù),由于只能使用按鍵進(jìn)行服務(wù),用戶(hù)又無(wú)法記住如此之多的號碼及功能選項數字,大大降低了使用168信息服務(wù)的用戶(hù)。而使用人工服務(wù),又增加了系統運營(yíng)商的運營(yíng)成本。
■IVR用語(yǔ)音識別還不多
目前主要的ASR廠(chǎng)商,國外的主要有飛利浦、Nuance、IBM等,國內的有香港特區的InfoTalk等。各個(gè)廠(chǎng)商都提供了多個(gè)層次的開(kāi)發(fā)包及相關(guān)開(kāi)發(fā)工具,實(shí)現的功能及效果也大致相近,但在細節上也存在許多差異。相比之下,Nuance公司的產(chǎn)品顯得功能更齊全,性能更優(yōu);而InfoTalk的產(chǎn)品則中文本土化的程度更高,在中文識別上絲毫不遜色。
新太科技一直密切關(guān)注ASR技術(shù)的發(fā)展,早在1999年10月,新太科技就與飛利浦公司在語(yǔ)音識別技術(shù)上簽定了合作協(xié)議。在今年又先后與Nuance和InfoTalk公司達成了合作意向。新太科技使用當今世界最先進(jìn)的ASR/TTS技術(shù),已開(kāi)發(fā)出了一系列全新的應用系統,并將在未來(lái)結合語(yǔ)音互聯(lián)網(wǎng)進(jìn)行全面的應用推廣。
《賽迪市場(chǎng)專(zhuān)家》 2000/12/07