CTI論壇(ctiforum)8月30日消息(記者凡易):比爾•蓋茨曾表示,“未來(lái)人機交互最重要的技術(shù)將是語(yǔ)音技術(shù)、觸摸技術(shù)和視覺(jué)技術(shù),而其中語(yǔ)音交互技術(shù)將帶來(lái)人機交互的根本性變革”。如今,語(yǔ)音技術(shù)的應用已經(jīng)隨處可見(jiàn),銀行、電信、政府、交通等社會(huì )服務(wù)領(lǐng)域均有它的身影,如:在汽車(chē)中,通過(guò)語(yǔ)音識別技術(shù)(ASR)可實(shí)現語(yǔ)音輸入目的地、語(yǔ)音查找興趣點(diǎn),菜單查找等語(yǔ)音聲控功能。
目前,隨著(zhù)Siri的出現引爆了整個(gè)智能人機交互領(lǐng)域,它讓人們對語(yǔ)音技術(shù)有了新的認識,也充滿(mǎn)了期待。眾多企業(yè)紛紛涉足語(yǔ)音識別市場(chǎng),一時(shí)間魚(yú)龍混雜,讓人眼花繚亂。然而用戶(hù)并不需要對技術(shù)有太多了解,只要覺(jué)得它好用就行。作為一家致力于智能人機交互(HCI)技術(shù)的高新技術(shù)企業(yè),捷通華聲公司可謂其中的佼佼者。
2011年,捷通華聲秉承“技術(shù)服務(wù)生活”的企業(yè)理念,推出全球第一個(gè)全方位智能人機交互感知云——靈云,通過(guò)“云+端”的方式,讓用戶(hù)感知機器,同時(shí)讓機器感知人,雙向感知交互的過(guò)程中,讓機器領(lǐng)會(huì )人的意思,更好的為人服務(wù);讓人收到機器反饋的結果,享受發(fā)號施令的愉悅。
基于靈云的語(yǔ)音識別技術(shù)更加完美,語(yǔ)音識別音庫更加豐富,不局限話(huà)題范圍,不限制發(fā)音人,用戶(hù)可以自由地和機器進(jìn)行“自由說(shuō)”。高質(zhì)量的識別效果,出色的環(huán)境適應能力,高達95%的識別率,讓捷通華聲語(yǔ)音識別技術(shù)脫穎而出。無(wú)論是PC、家電、汽車(chē)、手機等命令菜單的聲控,還是隨時(shí)隨地用聲音進(jìn)行查詢(xún)和搜索服務(wù),靈云語(yǔ)音識別技術(shù)均能一一滿(mǎn)足。
實(shí)際上,語(yǔ)音識別技術(shù)不僅是你說(shuō)它做的簡(jiǎn)單交互,而是更加人性化的感知問(wèn)答。在此基礎上,捷通華聲精益求精,對靈云語(yǔ)音識別技術(shù)進(jìn)行了語(yǔ)義理解的優(yōu)化,使用WEB、IM、WAP、SMS、APP等多種表現形式,與用戶(hù)進(jìn)行實(shí)時(shí)交互溝通,給用戶(hù)提供全方位的服務(wù)。當然,未來(lái)需要挑戰的項目還有很多,噪音處理、用戶(hù)情緒等機器還不能很好的判斷,HCI仍在路上,不過(guò),也許不久的將來(lái),這些都將在靈云上實(shí)現,我們期待人與機器真正的“交流”。
隨著(zhù)語(yǔ)音應用在各行各業(yè)的逐步深入,語(yǔ)音識別技術(shù)的應用范圍將迅速拓展。靈云語(yǔ)音識別技術(shù)將找到與更多行業(yè)的結合點(diǎn),與廣大行業(yè)合作伙伴攜手,量身打造特定的應用方案,去攻克各種技術(shù)難題,在推動(dòng)更多行業(yè)的智能化發(fā)展進(jìn)程的同時(shí),推動(dòng)整個(gè)HCI產(chǎn)業(yè)的發(fā)展。
HCI技術(shù)正逐步改變著(zhù)移動(dòng)產(chǎn)品乃至移動(dòng)互聯(lián)網(wǎng)的格局,更多的技術(shù)如手寫(xiě)識別技術(shù)(HWR)、光學(xué)字符識別(OCR)、人工智能技術(shù)(AI)等綜合使用才能完美詮釋HCI的內涵,靈云正是這樣一個(gè)涵蓋多項HCI技術(shù)的平臺。
通過(guò)語(yǔ)音合成技術(shù)(TTS)實(shí)現海量和動(dòng)態(tài)信息的播報;通過(guò)ASR技術(shù)解決傳統電話(huà)按鍵操作所無(wú)法實(shí)現的復雜菜單操作,實(shí)現通過(guò)人機自助式語(yǔ)音交互;通過(guò)OCR技術(shù)解決大量票據錄入的繁瑣工作,實(shí)現智能化服務(wù);通過(guò)HWR技術(shù)解決異地簽批文件的問(wèn)題,實(shí)現移動(dòng)辦公……靈云,將改變人們的生活方式,開(kāi)啟人機交互世界新精彩。更多詳情,請關(guān)注靈云網(wǎng)站(hcicloud.com)。