本月28日,由北京捷通華聲語(yǔ)音技術(shù)有限公司(以下簡(jiǎn)稱(chēng)“捷通華聲”)打造的國內首款智能人機交互(簡(jiǎn)稱(chēng)“HCI”)感知云平臺——“靈云”將正式對外發(fā)布。這樣一款匯集融合了語(yǔ)音合成(TTS)、語(yǔ)音識別(ASR)、手寫(xiě)識別(HWR)、光學(xué)字符識別(OCR)、人工智能(AI)等多種HCI技術(shù)的全方位平臺,在國內屬首創(chuàng ),目前還沒(méi)有企業(yè)有能力跟進(jìn)。
在捷通華聲“靈云2012發(fā)布會(huì )”前夕,C114前往捷通總部對該公司董事長(cháng)張連毅進(jìn)行了獨家專(zhuān)訪(fǎng),請他對靈云平臺核心技術(shù)及市場(chǎng)拓展情況進(jìn)行了詳細解讀。
一周年的能量蓄積
如果說(shuō)Siri引爆了人們對智能語(yǔ)音對話(huà)的關(guān)注,那么靈云則開(kāi)啟了一個(gè)智能人機交互的新時(shí)代,這是信息社會(huì )自鍵盤(pán)時(shí)代、鼠標時(shí)代及觸摸時(shí)代后的又一浪潮。靈云以其豐富的識別手段,以及全面智能的感知為用戶(hù)提供了一個(gè)人機交互應用的良好環(huán)境。
這是一種可以用語(yǔ)音、手寫(xiě)、拍照、手勢識別,將來(lái)甚至可使用腦波識別等智能手段來(lái)操作,從而感知手機、計算機等數字設備的網(wǎng)絡(luò )云服務(wù)。通過(guò)靈云能讓人機交互像人與人溝通一樣簡(jiǎn)單自然,并可實(shí)現任何人通過(guò)任何設備在任何時(shí)間地點(diǎn)輕松享受到智能人機交互的便利。
早在去年12月初,“靈云”就已推出,但為了能將更成熟的技術(shù)推向市場(chǎng),捷通華聲在靈云推出之后陸續展開(kāi)了各方面的應用探索,直到一周年后的今天,靈云有了全新的2.0版本,并已在各行各業(yè)取得了良好的應用成果,捷通華聲才決定正式將靈云面世。
目前靈云主要有語(yǔ)音合成(TTS)、語(yǔ)音識別(ASR)、手寫(xiě)識別(HWR)、光學(xué)字符識別(OCR)、人工智能(AI)這五項核心技術(shù)。語(yǔ)音合成即文語(yǔ)轉換,主要利用計算機將文字轉換為聲音,語(yǔ)音識別則是將聲音轉換為文字,而手寫(xiě)識別主要將手寫(xiě)設備上書(shū)寫(xiě)時(shí)的有序軌跡信息轉化為漢字。另外,光學(xué)字符識別是對各種表格票據證件進(jìn)行掃描后,獲取文字及整個(gè)版面信息。智能客服機器人則是以語(yǔ)音擬人化的方式與人進(jìn)行互動(dòng)。
一周年中,捷通華聲不僅對靈云平臺穩定性及抗壓性等各項性能指標進(jìn)行了提升,還對靈云的產(chǎn)品性能、合作模式及各項HCI技術(shù)應用進(jìn)行了探索與擴展。張連毅說(shuō),“在此期間,靈云各大核心HCI技術(shù)上都有顯著(zhù)進(jìn)步,特別是‘自由說(shuō)’技術(shù)已進(jìn)入商用化階段。”
張連毅表示,目前靈云的主要目標是提升平臺能力及自身核心技術(shù),不斷將成熟的HCI技術(shù)通過(guò)靈云提供給大眾,而下一步就是促成更多的合作。
不斷拓寬的縱深合作
隨著(zhù)HCI技術(shù)在各行各業(yè)的大量需求,靈云的應用范圍也將無(wú)處不在。目前國內數以?xún)|計的用戶(hù)都在直接或間接地使用捷通華聲的HCI技術(shù),但很多用戶(hù)并不能明顯感覺(jué)到。“捷通華聲成立十幾年來(lái),更多的是作為幕后支持者,通過(guò)與各大系統集成商、手機制造商、導航產(chǎn)品廠(chǎng)商等合作來(lái)服務(wù)大眾。”
據張連毅介紹,目前,捷通華聲已與數千家企業(yè)合作,將HCI技術(shù)應用到各行各業(yè)中,不僅有政府、教育、金融、電信、能源、交通、醫療等傳統行業(yè)領(lǐng)域的客戶(hù),更有智能家電、智能家居、互聯(lián)網(wǎng)及移動(dòng)互聯(lián)網(wǎng)、智慧城市等新興領(lǐng)域的用戶(hù),大到服務(wù)成千上萬(wàn)用戶(hù)的平臺,小到個(gè)人開(kāi)發(fā)者,捷通華聲的HCI技術(shù)在中國已經(jīng)無(wú)處不在,默默服務(wù)數以?xún)|計的大眾。
談及與中國電信的合作,張連毅表示,早在2008年捷通華聲就開(kāi)始與電信進(jìn)行增值服務(wù)方面的合作。至今捷通華聲在電信的增值業(yè)務(wù)中仍居首位。目前捷通華聲已將靈云與中國電信正在開(kāi)發(fā)的EMP平臺實(shí)現無(wú)縫銜接,成為其開(kāi)放平臺的重要組成部分,而捷通華聲則負責提供其中的人機交互技術(shù)支持。
張連毅強調:“捷通華聲高度重視與中國電信的合作,靈云與中國電信EMP平臺的無(wú)縫銜接,標志著(zhù)捷通華聲與中國電信的合作已邁入新階段。之后捷通華聲將與中國電信拓寬合作面,包括在音樂(lè )基地、游戲基地、閱讀基地等方面,捷通華聲將發(fā)揮靈云優(yōu)勢,為中國電信提供更多的HCI技術(shù)支持。”
當問(wèn)及中國移動(dòng)與科大訊飛在語(yǔ)音云方面的合作是否會(huì )影響捷通華聲靈云與中國移動(dòng)的合作時(shí),張連毅說(shuō),“靈云與語(yǔ)音云有很大的不同,區別在于靈云不僅提供語(yǔ)音云服務(wù),同時(shí)也提供手寫(xiě)識別、OCR等更多項HCI技術(shù)云服務(wù),因此捷通仍然會(huì )與中國移動(dòng)保持合作,當然我們現在的重點(diǎn)是中國電信,也有中國聯(lián)通,我們也一直和中國聯(lián)通保持著(zhù)在增值服務(wù)領(lǐng)域的合作,希望日后也能在HCI技術(shù)上有相關(guān)合作。”
此外,捷通華聲的HCI技術(shù)不僅吸引了大批合作伙伴和個(gè)人開(kāi)發(fā)商,許多各大投資商也極為關(guān)注。C114前去采訪(fǎng)的當天,就見(jiàn)到了專(zhuān)程從南方遠道來(lái)訪(fǎng)捷通華聲洽談的投資商。
當然,除了與各大企業(yè)合作,捷通華聲也希望能與從事各種人機交互技術(shù)研究或開(kāi)發(fā)的企業(yè)合作,從而將靈云平臺作為其展現、推薦及提供自身技術(shù)服務(wù)的平臺。靈云作為一個(gè)開(kāi)放性平臺,定制化的目標更加明確,將讓更多HCI研發(fā)人員在此平臺實(shí)現創(chuàng )業(yè)夢(mèng)想,這也是此次捷通華聲2012靈云發(fā)布會(huì )的亮點(diǎn)之一。目前,靈云未來(lái)的版本已經(jīng)開(kāi)始與國內從事HCI技術(shù)的企業(yè)與研究機構進(jìn)行多項合作,力求將多樣化的HCI技術(shù)加載到靈云平臺上,服務(wù)更多企業(yè),服務(wù)廣大眾用戶(hù)。
牢固根基下的枝繁葉茂
按照去年的統計數據來(lái)看,捷通華聲已在國內語(yǔ)音市場(chǎng)占有50%的份額,而其手寫(xiě)識別技術(shù)已達到35%的份額。“一周年來(lái),這兩項份額穩中有增,雖然競爭對手強勁,但捷通在更加寬廣的HCI領(lǐng)域得到增長(cháng)。”張連毅透露,目前捷通華聲的HCI技術(shù)產(chǎn)品已經(jīng)展現出強勁發(fā)展勢頭,已全面深入滲透到各行各業(yè)。
2010年世博會(huì )廣播系統的語(yǔ)音技術(shù),80%是由捷通華聲提供支持。全國的高鐵所有站臺的信息播報系統,都是采用靈云的語(yǔ)音合成技術(shù)。目前國有五大銀行中的四家都使用著(zhù)捷通華聲的HCI技術(shù)。而最近其也剛剛與百度達成合作,將靈云的手寫(xiě)識別技術(shù)引入百度輸入法。
張連毅坦言,在公司初創(chuàng )時(shí),并沒(méi)有料到HCI技術(shù)會(huì )在今天有如此廣泛的應用,如今各行各業(yè)都需要這種智能的人機互動(dòng)技術(shù)。而隨著(zhù)未來(lái)人機交互技術(shù)的發(fā)展,靈云也將緊跟人類(lèi)的步伐,讓機器與人的互動(dòng)更接近人與人的交流。比如未來(lái)的語(yǔ)音合成技術(shù)應該能有音色、感情色彩等特色功能的選項,而語(yǔ)音識別也能對國內各個(gè)地方的方言有清晰的辨識。智能人機交互技術(shù)將是推動(dòng)未來(lái)信息產(chǎn)業(yè)發(fā)展最強勁的發(fā)動(dòng)機。
而在未來(lái)的發(fā)展中,捷通華聲最需要的就是各種優(yōu)秀人才,以滿(mǎn)足靈云與HCI應用到各個(gè)行業(yè)所產(chǎn)生的大量需求。張連毅表示,捷通華聲非常樂(lè )于為各方面的優(yōu)秀人才創(chuàng )造發(fā)展的舞臺。
“捷通華聲未來(lái)的發(fā)展就像一根樹(shù)干成長(cháng)到枝繁葉茂的過(guò)程。捷通華聲擁有的核心技術(shù)就是大樹(shù)的根,靈云平臺是大樹(shù)的主干,而靈云在各行各業(yè)的應用是大樹(shù)的枝杈。”張連毅表示,“包括由捷通華聲提供技術(shù)支持的智能手機助手小唐龍,一款可為用戶(hù)提供地圖導航、天氣查詢(xún)、音樂(lè )搜索、新聞播報等特色功能的手機應用程序。如果說(shuō)這是捷通華聲在手機App方面的探索產(chǎn)品,未來(lái)將有更多類(lèi)似小唐龍的創(chuàng )新產(chǎn)品出現。”
以牢固的根基養育大樹(shù)的枝繁葉茂,這就是捷通華聲所堅持的發(fā)展理念。而在這發(fā)展過(guò)程中,無(wú)論過(guò)去還是未來(lái)發(fā)展,捷通華聲不會(huì )吃獨食或分搶別家利潤。獨木不成林,只有無(wú)數棵茁壯成長(cháng)的大樹(shù)才能造就繁茂的森林。捷通華聲將與各界合作伙伴精誠合作,共同創(chuàng )造智能人機交互領(lǐng)域的繁榮景象。
注:捷通華聲“2012靈云發(fā)布會(huì )”將在中關(guān)村軟件園召開(kāi),歡迎各界人士到靈云網(wǎng)站(www.hcicloud.com)報名參加)