國內語(yǔ)音合成技術(shù)“叫板”IBM
語(yǔ)音市場(chǎng)“一枝獨秀”將成歷史
“未來(lái)的十年是語(yǔ)音技術(shù)的時(shí)代”。隨著(zhù)語(yǔ)音技術(shù)研究的突破,其對計算機發(fā)展和社會(huì )生活的重要性日益凸現出來(lái),漢語(yǔ)語(yǔ)音輸入輸出技術(shù)更是孕育著(zhù)巨大的產(chǎn)業(yè)機遇。面對著(zhù)十幾億人使用漢語(yǔ)、聽(tīng)說(shuō)中國話(huà)的泱泱大國,中文語(yǔ)音技術(shù)的應用和經(jīng)濟社會(huì )效益前景非常巨大。據專(zhuān)家對未來(lái)國內市場(chǎng)預測,五年內,整個(gè)中文語(yǔ)音市場(chǎng)份額將至少在1000億人民幣以上。
1997:中文語(yǔ)音市場(chǎng)痛失半壁江山
面對如此巨大的中文語(yǔ)音市場(chǎng)前景,國際上一些大公司早就虎視眈眈地注視著(zhù)這塊市場(chǎng),紛紛加緊對中文語(yǔ)音技術(shù)、產(chǎn)品、市場(chǎng)的全面拓展。像IBM早就致力于語(yǔ)音技術(shù)的研究,在英語(yǔ)領(lǐng)域已經(jīng)進(jìn)行了近30年的研究。針對中國的廣大市場(chǎng),IBM推出了中文語(yǔ)音識別產(chǎn)品ViaVoice,并投入大量資金進(jìn)行市場(chǎng)開(kāi)拓。自1997年以來(lái),IBM ViaVoice搶占了中國90%的語(yǔ)音識別市場(chǎng),可以說(shuō),中文語(yǔ)音市場(chǎng)的半壁江山已經(jīng)落入人手。國內語(yǔ)音技術(shù)領(lǐng)域資金短缺、力量渙散、人才流失是導致語(yǔ)音識別市場(chǎng)痛失江山的主要原因。此外,英特爾、微軟、L&H、摩托羅拉等公司也都瞄準了中文語(yǔ)音市場(chǎng),投入了大量的人力、物力和資金。英特爾已推出電話(huà)語(yǔ)音識別的完整Demo系統;微軟也有了詳細的中文語(yǔ)音開(kāi)發(fā)和Windows操作系統的捆綁方案;L&H則推出了虛擬的中文語(yǔ)音播音員。目前,中文語(yǔ)音市場(chǎng)正面臨著(zhù)國際競爭的巨大壓力,這些國際型的大公司將基礎研究和產(chǎn)品開(kāi)發(fā)結合得較緊密,資金優(yōu)勢和市場(chǎng)優(yōu)勢的運作也相得益彰,國內如果不采取有效的措施,語(yǔ)音產(chǎn)業(yè)這塊陣地極有淪陷的危險。如果在將來(lái)整個(gè)中文語(yǔ)音市場(chǎng)都被外企所占領(lǐng),炎黃子孫所使用的語(yǔ)音軟件都是由金發(fā)碧眼的老外所發(fā)明所提供的,讓老外來(lái)教中國人怎么使用漢語(yǔ)產(chǎn)品,那將是整個(gè)中華民族的恥辱。難道中國人連自己的語(yǔ)音產(chǎn)品都做不出來(lái)嗎?當然不是。
2000:國內廠(chǎng)商重整山河
面對資金強大、實(shí)力雄厚的國際型企業(yè),國內的企業(yè)又拿什么來(lái)和他們競爭呢?記者在最近采訪(fǎng)在中文語(yǔ)音技術(shù)方面頗具實(shí)力的中國科大訊飛公司時(shí)了解到,作為一家在863智能計算機轉換基地的研發(fā)中心和科技大學(xué)語(yǔ)言研究基礎上成立的公司,科大訊飛將致力于成為全球最大的語(yǔ)音和語(yǔ)言技術(shù)提供商,為各行各業(yè)的系統開(kāi)發(fā)商、軟件開(kāi)發(fā)商和運營(yíng)服務(wù)商、設備制造商提供最好的語(yǔ)音和語(yǔ)言技術(shù)方案。當談及訊飛的優(yōu)勢時(shí),該公司總經(jīng)理劉慶峰告訴記者:通過(guò)融資之后,訊飛的資金問(wèn)題已經(jīng)基本解決。不久前成立的中國語(yǔ)音創(chuàng )業(yè)聯(lián)盟使原來(lái)國內語(yǔ)音技術(shù)力量各自為戰的現象徹底改變,國內語(yǔ)音技術(shù)的中堅力量通過(guò)聯(lián)盟實(shí)現了強強聯(lián)合、優(yōu)勢互補。
語(yǔ)音技術(shù)作為一種典型的交叉科學(xué),有三個(gè)重要方面:一、計算機的工程模擬,即能夠讓計算機模擬整個(gè)人講話(huà)的過(guò)程,像如何從肺部發(fā)出氣流,經(jīng)過(guò)聲帶的調整,通過(guò)口腔變成聲音出來(lái)等。這一方面中國科技大學(xué)做得最好,在幾次評比和國際大會(huì )上都得到公認。二、對聲音信號本身要有一個(gè)非常深刻的了解,這一點(diǎn)中國科學(xué)院聲學(xué)所做得最好。三、要對漢語(yǔ)本身的一個(gè)運用規則有所了解(不同的字、詞在不同環(huán)境下的聲調、時(shí)差、能量等),這一方面中國社會(huì )科學(xué)院語(yǔ)言所做得最好。現在,通過(guò)中國語(yǔ)音創(chuàng )業(yè)聯(lián)盟,由訊飛出資,將科大、聲學(xué)所、語(yǔ)言所這三支在語(yǔ)音技術(shù)方面最強的力量團結起來(lái),通過(guò)股權融合在一起,形成技術(shù)互補,共同將技術(shù)轉化為產(chǎn)業(yè)化的產(chǎn)品。這三塊的有力配合,將局部?jì)?yōu)勢化為整體優(yōu)勢;和相關(guān)的IT企業(yè)的結盟都為訊飛在自然語(yǔ)言理解方面尋求真正突破,為語(yǔ)音合成技術(shù)打下了一個(gè)非常好的基礎。
語(yǔ)音技術(shù)分為語(yǔ)音合成技術(shù)和語(yǔ)音識別技術(shù)。語(yǔ)音合成技術(shù)主要是好與不好的問(wèn)題,而語(yǔ)音識別技術(shù)主要是對與不對的問(wèn)題。目前大眾對語(yǔ)音識別技術(shù)知之較多,對語(yǔ)音合成技術(shù)所知不多。很多時(shí)候語(yǔ)音識別只是作為一種噱頭在用,雖是一個(gè)好東西,但沒(méi)有真正解決最普通老百姓的需求。其實(shí)語(yǔ)音合成技術(shù)更為實(shí)用,更能解決人民大眾的需求,更能夠深入到社會(huì )的各行各業(yè)中去。
中文語(yǔ)音合成技術(shù)中的合成自然度問(wèn)題是實(shí)現高性能文語(yǔ)轉換的關(guān)鍵。特殊符號處理、分詞處理和拼接處理是漢語(yǔ)文語(yǔ)轉換系統的整體性能提高的三大處理環(huán)節。劉慶峰告訴記者:目前科大訊飛以民族語(yǔ)音屏障作為切入點(diǎn),利用在漢語(yǔ)言文化方面的研究實(shí)力,利用中文語(yǔ)音創(chuàng )業(yè)聯(lián)盟在計算機模擬、聲訊號的了解和漢語(yǔ)本身的理解的優(yōu)勢,較好地解決了語(yǔ)音合成中的三大處理環(huán)節,使得漢語(yǔ)文語(yǔ)轉換系統的整體性能有很大提高。而在語(yǔ)音識別技術(shù)上,像IBM、微軟等公司所做的基本都是一種工作量的工作,都是在比誰(shuí)的音庫多,比誰(shuí)的音庫大。然而真正的語(yǔ)音識別應該有理解和自動(dòng)糾錯的功能。英特爾最關(guān)鍵的是自然語(yǔ)言理解的程度不夠。科大訊飛在中文語(yǔ)音、自然語(yǔ)言理解方面已經(jīng)做了大量的工作,在近期將有創(chuàng )新和突破。一旦自然語(yǔ)言理解方面有所突破后,就會(huì )在語(yǔ)音識別上超過(guò)IBM等國際大戶(hù)。而且,中文語(yǔ)音創(chuàng )業(yè)聯(lián)盟為這次突破做了長(cháng)期的積累和準備,在語(yǔ)音技術(shù)的自然語(yǔ)言理解方面已經(jīng)看到了曙光。明年,訊飛將要成為中國最大的語(yǔ)音合成提供商,這都將為語(yǔ)音識別技術(shù)的推廣打下接口。
整合我們的技術(shù)、人才和本土化的優(yōu)勢,用我們一流的語(yǔ)音合成的核心技術(shù)來(lái)鋪開(kāi)市場(chǎng),從而帶動(dòng)語(yǔ)音識別市場(chǎng),那么中文語(yǔ)音陣地終將為我們所占領(lǐng)。
摘自:〈中國經(jīng)營(yíng)報〉2000/11/07