隨著(zhù)蘋(píng)果Siri的出現,語(yǔ)音識別技術(shù)開(kāi)始逐步走進(jìn)我們的視野。最直觀(guān)的感受,就是現在移動(dòng)互聯(lián)網(wǎng)的應用中越來(lái)越多地以語(yǔ)音識別作為新的人機交互手段。
那么語(yǔ)音識別究竟是怎么一回事,它又是怎樣被應用并實(shí)現其價(jià)值的,通過(guò)它企業(yè)又能獲取怎樣的增值服務(wù)?帶著(zhù)這些疑問(wèn),我們走進(jìn)普強信息技術(shù)(北京)有限公司,請被譽(yù)為語(yǔ)音識別領(lǐng)域舵手的普強CEO何國濤,和CTO李全忠先生來(lái)一一解說(shuō)。
語(yǔ)音識別技術(shù)未來(lái)將被普遍應用
語(yǔ)音識別技術(shù),簡(jiǎn)單地說(shuō)就是把用戶(hù)語(yǔ)音轉換成文本。它可以適用于不同的領(lǐng)域,例如移動(dòng)互聯(lián)網(wǎng),可以讓很多人工密集的呼叫中心實(shí)現自動(dòng)化和智能化,保障信息安全的如聲紋識別類(lèi),作為大數據挖掘的語(yǔ)音分析系統,以及車(chē)聯(lián)網(wǎng)和教育產(chǎn)品等等。
微信的語(yǔ)音輸入就是一個(gè)應用例子。未來(lái)在我們的日常生活中會(huì )越來(lái)越多的情況下使用語(yǔ)音識別技術(shù),能夠給我們的生活工作帶來(lái)很多便捷。
語(yǔ)音識別技術(shù)應用價(jià)值
語(yǔ)音識別技術(shù)可以應用于許多不同的領(lǐng)域。現在使用最多的是移動(dòng)互聯(lián)網(wǎng)領(lǐng)域,可以直接把語(yǔ)音轉換成文字,為用戶(hù)解決了在小屏幕鍵盤(pán)輸入的困難;呼叫中心領(lǐng)域,通過(guò)采用語(yǔ)音識別技術(shù),自動(dòng)化處理大量的重復性工作,例如語(yǔ)音分析、語(yǔ)音IVR導航;導航及車(chē)聯(lián)網(wǎng),通過(guò)智能語(yǔ)音輸入,使駕駛人員能夠通過(guò)語(yǔ)音控制相應的非駕駛操作,讓駕駛人員專(zhuān)注駕駛操作,增加駕駛的安全性;教育領(lǐng)域:口語(yǔ)評測;玩具領(lǐng)域:語(yǔ)音控制;聲紋識別領(lǐng)域:增強系統安全性能,這是今年語(yǔ)音識別的主要收入增長(cháng)點(diǎn);醫療保健領(lǐng)域:應用到電子病歷中,可自動(dòng)實(shí)現醫生口述病歷及醫囑等等。
引領(lǐng)語(yǔ)音識別領(lǐng)域 產(chǎn)品技術(shù)成熟
普強目前已經(jīng)為金融、電信、保險等行業(yè)提供高準確度和高性能的電話(huà)線(xiàn)信道的 ASR(語(yǔ)音識別)引擎。
移動(dòng)互聯(lián)網(wǎng)方面,普強早在2010年7月便與愛(ài)幫網(wǎng)推出了語(yǔ)音版的LBS手機應用,這是國內首個(gè)基于開(kāi)放語(yǔ)音云平臺下支持多操作系統的手機應用。近年來(lái),隨著(zhù)公司不斷的積累,語(yǔ)音識別的技術(shù)和產(chǎn)品都相應獲得了全方面領(lǐng)先優(yōu)勢的發(fā)展。在產(chǎn)品的聲學(xué)建模上,開(kāi)發(fā)使用了深度神經(jīng)網(wǎng)絡(luò )技術(shù);公司研發(fā)的語(yǔ)音切分技術(shù)及識別結果的置信度算法,不但為企業(yè)級應用提供準確的識別結果,同時(shí)也提供了精確的說(shuō)話(huà)人分割、時(shí)間邊界以及識別結果的置信度等信息,這些信息使企業(yè)在應用中(例如呼叫中心),更加便捷和準確地利用語(yǔ)音作為主要的交互方式,并且可以進(jìn)一步挖掘、分析和利用海量語(yǔ)音數據的內容。
普強智能語(yǔ)音分析系統可以廣泛應用于客服中心的質(zhì)檢和企業(yè)的精準營(yíng)銷(xiāo)中。該產(chǎn)品提供例如熱點(diǎn)發(fā)現,趨勢分析,自動(dòng)建模等領(lǐng)先的功能。在不斷開(kāi)發(fā)新技術(shù)的同時(shí),也在企業(yè)語(yǔ)音應用的多個(gè)領(lǐng)域,(例如保險、銀行、證券及電信等的客服中心、增值服務(wù)等)積累了海量的數據、模型信息和項目的經(jīng)驗。
目前,普強成熟的產(chǎn)品主要有,千語(yǔ)語(yǔ)音平臺,向企業(yè)提供語(yǔ)音識別產(chǎn)品和服務(wù);千語(yǔ)語(yǔ)音云平臺,為手機互聯(lián)網(wǎng)應用提供的語(yǔ)音識別云服務(wù);普強智能語(yǔ)音分析系統,為企業(yè)提供全方位、多維度的大數據分析(語(yǔ)音,視頻,文本數據等)。