憑心而論,語(yǔ)音識別是一項復雜的技術(shù),特別對于漢語(yǔ)語(yǔ)音識別尤其如此。因此,盡管多年前就有眾多公司和研究機構開(kāi)始了語(yǔ)音技術(shù),包括語(yǔ)音識別和語(yǔ)音合成技術(shù)的研究,但直到最近一兩年,在國內應該說(shuō)是今年,才開(kāi)始有規模的商用。
■用戶(hù)的獨立性
所謂用戶(hù)的獨立性,就是語(yǔ)音識別軟件能夠識別有不同嗓音和口音的用戶(hù),而無(wú)需通過(guò)訓練軟件來(lái)使其識別一個(gè)特殊用戶(hù)的聲音。目前的許多語(yǔ)音識別軟件,是基于標準的發(fā)音來(lái)進(jìn)行識別的。而實(shí)際上,人們說(shuō)話(huà)千差萬(wàn)別,發(fā)音也各不相同,特別對于有口音的語(yǔ)音來(lái)說(shuō),更是對語(yǔ)音識別軟件提出了嚴峻的挑戰。目前的語(yǔ)音識別軟件大部分是通過(guò)自學(xué)習功能,不斷的訓練來(lái)達到軟件對于特定用戶(hù)語(yǔ)音的識別。
■自然的語(yǔ)言能力
許多語(yǔ)音識別系統還具有自然的語(yǔ)言能力,這就是軟件理解講話(huà)者的能力。這種能力不僅表現在特定的單詞上,甚至還表現在短語(yǔ)和完整的句子上。自然的語(yǔ)言意味著(zhù)兩點(diǎn):第一,它可讓用戶(hù)用句子來(lái)表達意思。例如,為表達checking account,用戶(hù)可使用有更多單詞的自然句子,如I'd like my checking account balance。 第二指用戶(hù)可使用包含多義詞的句子。例如,我們可說(shuō)I want to transfer $500 dollars from my savings account to my checking account。這是自然語(yǔ)言的一個(gè)主要準則,用戶(hù)可在一個(gè)單句中使用多個(gè)多義詞。
■處理插入的能力
新增的插入的能力是語(yǔ)音識別軟件的另一個(gè)主要進(jìn)步。插入的能力允許用戶(hù)在系統提示時(shí)中斷系統,但系統依然能知道用戶(hù)的請求。
■軟件身份驗證的能力
語(yǔ)音識別銷(xiāo)售商最近還介紹了軟件身份驗證的能力,即根據用戶(hù)的嗓音和語(yǔ)言特點(diǎn),來(lái)達到識別用戶(hù)的能力。這在實(shí)際中是一個(gè)非常有價(jià)值的特點(diǎn),如可用于人事管理上。
《賽迪市場(chǎng)專(zhuān)家》 2000/12/07