隨著(zhù)移動(dòng)互聯(lián)網(wǎng)、智能終端、云計算的飛速發(fā)展,智能人機交互(英文:Human-Computer Interaction,以下簡(jiǎn)稱(chēng)“HCI”)技術(shù)也迎來(lái)了大爆發(fā)的時(shí)代。HCI技術(shù),是指人與計算機之間使用某種對話(huà)語(yǔ)言,以一定的交互方式,為完成確定任務(wù)的人與計算機之間的信息交換過(guò)程。簡(jiǎn)單地說(shuō)就是讓機器能聽(tīng)會(huì )說(shuō),能寫(xiě)會(huì )識,甚至可以感知人們的想法并為之服務(wù)的過(guò)程。
在中關(guān)村有著(zhù)這樣一個(gè)人,他用了六年的時(shí)間去思索,并與HCI技術(shù)結下了不解的情緣;用13年的時(shí)間堅持做了一件事,把HCI技術(shù)做出“國際水準”;在很多人眼中他已經(jīng)功成名就,而在他眼中,他的事業(yè)才剛剛起步……他就是北京捷通華聲語(yǔ)音技術(shù)有限公司(以下簡(jiǎn)稱(chēng)“捷通華聲”)董事長(cháng)張連毅。
環(huán)保需要經(jīng)濟支撐
當前,語(yǔ)音合成、語(yǔ)音識別和手寫(xiě)識別、OCR已經(jīng)成為成熟的智能人機交互核心技術(shù),正在悄悄地影響和改變著(zhù)人們的生活。其中,語(yǔ)音合成技術(shù)可以讓各種設備“開(kāi)口講話(huà)”,把各種文本信息以語(yǔ)音的方式播報;語(yǔ)音識別技術(shù)可以讓各種設備“聽(tīng)懂”我們的話(huà);手寫(xiě)識別、OCR技術(shù)可以幫助人們從各種設備繁瑣的按鍵操作中解脫出來(lái),輕松輸入文字。
而在張連毅看來(lái),隨著(zhù)移動(dòng)互聯(lián)網(wǎng)、智能終端、云計算、大數據等產(chǎn)業(yè)的飛速發(fā)展,智能人機交互技術(shù)也迎來(lái)了大爆發(fā)的時(shí)代。他認為,“智能人機交互技術(shù)是各大技術(shù)產(chǎn)業(yè)變革的畫(huà)龍點(diǎn)睛之作,也是我國由‘中國制造’向‘中國創(chuàng )造’轉型的巨大機遇,中國在智能人機交互技術(shù)領(lǐng)域的發(fā)展絕不輸于外國企業(yè)”。
回到20多年前,這樣的豪言對于一個(gè)剛從高中走出來(lái)的孩子來(lái)說(shuō),簡(jiǎn)直不敢想象。那時(shí),他的夢(mèng)想只是想讓祖國的天更藍、水更綠。在填報高考志愿的時(shí)候,張連毅的專(zhuān)業(yè)選擇只有一個(gè)——環(huán)境工程。
1989年,張連毅在清華大學(xué)環(huán)境工程系畢業(yè)。“我一直都有著(zhù)一個(gè)夢(mèng)想,走遍祖國,任何一條河流都是清澈的,任何一片天空都是蔚藍的。”張連毅告訴北京商報記者,“環(huán)境問(wèn)題,不是一個(gè)單獨的事情,涉及很多的方面,而經(jīng)濟無(wú)疑會(huì )成為其中重要的基礎。”就這樣,張連毅畢業(yè)后選擇了一條不同的道路,進(jìn)入清華紫光從事經(jīng)濟類(lèi)的工作。
1992年,一次偶然的機會(huì ),他與清華大學(xué)教授吳佑壽、丁曉清合作,推進(jìn)漢字印刷體識別系統商品化進(jìn)程,這是他與HCI技術(shù)的初識。
六年HCI技術(shù)情緣
1992年底,張連毅登上了去美國的飛機。“想做更多的事情,但是能力并不足以支撐自己的理想,我需要出去學(xué)習、開(kāi)闊視野。” 張連毅告訴北京商報記者,“我登機的時(shí)候,就在考慮什么時(shí)間可以回來(lái)。因為,我一直認為國內才是實(shí)現自己夢(mèng)想最好的地方。”就這樣,他開(kāi)始了長(cháng)達六年的留美生活,為自己充電成為他生活中惟一的主題。
1998年,張連毅帶著(zhù)夢(mèng)想回到國內,他要創(chuàng )辦一家屬于自己的企業(yè),而且這家企業(yè)一定要有自己的技術(shù)與產(chǎn)品!帶著(zhù)這個(gè)想法,他與清華大學(xué)博士陳明一拍即合,將目光瞄向了漢字錄入行業(yè)。1998年8月,捷通軟件在中關(guān)村成立,這也讓他在六年后再次和念念不忘的HCI技術(shù)再續前緣。
1998年當年,一款名為“錄易”的漢字錄入產(chǎn)品正式進(jìn)入市場(chǎng),它將手寫(xiě)、掃描、拼音、五筆等多種漢字輸入法融聚一身。在北京商報記者眼中,這是一款在當時(shí)擁有著(zhù)超前理念的顛覆性產(chǎn)品,它的出現讓漢字輸入法不再局限于某一種方式,可以滿(mǎn)足各種人的各種需求。張連毅表示,“在我看來(lái)各種各樣的漢字輸入法其實(shí)就是一個(gè)工具,實(shí)現漢字錄入的一個(gè)工具。我們把各種方式整合,讓工具用起來(lái)更方便,這樣可以滿(mǎn)足更多人的需求”。
“為什么選擇中關(guān)村?中關(guān)村的優(yōu)勢在哪里?在我看來(lái)中關(guān)村有著(zhù)得天獨厚的優(yōu)勢,清華、北大、中科院這些科研院所里面可全都是人才!”有過(guò)大學(xué)校企工作經(jīng)驗的張連毅對大學(xué)的優(yōu)質(zhì)科研資源念念不忘,2000年他先后聘請我國知名語(yǔ)音專(zhuān)家呂士楠教授和北京大學(xué)顧小鳳教授出任首席科學(xué)家,共同創(chuàng )建北京捷通華聲語(yǔ)音技術(shù)有限公司,借助兩位科學(xué)家在相關(guān)領(lǐng)域深厚的科研經(jīng)驗,捷通華聲開(kāi)始逐漸成為國內中文信息技術(shù)領(lǐng)域不可忽視的力量。
全球首個(gè)HCI感知云
從“中國制造”到“中國創(chuàng )造”的改變,需要中國企業(yè)技術(shù)的不斷創(chuàng )新。HCI技術(shù)在中國有著(zhù)超過(guò)30年的發(fā)展歷史,前20年大多都是在實(shí)驗室研究階段,近十年來(lái)才開(kāi)始廣泛應用到人們生活的各個(gè)領(lǐng)域,但其推動(dòng)產(chǎn)業(yè)發(fā)展的巨大能量遠未顯現。
“一個(gè)全新時(shí)代的大幕才剛剛拉開(kāi),云計算、移動(dòng)互聯(lián)網(wǎng)、大數據、HCI這些技術(shù)蓬勃發(fā)展,新的商業(yè)模式也初現曙光。當我們把所有用戶(hù)的行為和需求匯集到一塊去的時(shí)候,整個(gè)社會(huì )都將被技術(shù)的發(fā)展所重構。”張連毅引用百度大數據首席架構師林仕鼎的話(huà)來(lái)展開(kāi)他的觀(guān)點(diǎn)與想法。在他眼中,云計算勢如破竹地撞擊著(zhù)傳統產(chǎn)業(yè),移動(dòng)互聯(lián)網(wǎng)改變著(zhù)人們生活工作的方式,大數據讓整個(gè)世界變得更加有規律可循,而HCI技術(shù)雖然沒(méi)那么轟轟烈烈,但它卻悄然地在人們的生活、工作中助力著(zhù)這幾大板塊的應用。
在北京商報記者眼中,“十年磨一劍”正是張連毅和捷通華聲的真實(shí)寫(xiě)照。張連毅認為,產(chǎn)業(yè)化、服務(wù)化是推動(dòng)HCI技術(shù)發(fā)展的動(dòng)力,HCI技術(shù)的不斷創(chuàng )新應用則是推動(dòng)整個(gè)信息產(chǎn)業(yè)不斷發(fā)展的動(dòng)力引擎之一。捷通華聲憑借十多年來(lái)在智能人機交互技術(shù)、移動(dòng)互聯(lián)網(wǎng)領(lǐng)域的雄厚積累,于2011年推出了全球第一個(gè)全方位智能人機交互感知云——靈云平臺(www.hcicloud.com),為從“中國制造”向“中國創(chuàng )造”的全面升級提供了一個(gè)強大的“發(fā)動(dòng)機”引擎。
當盲人無(wú)法看到手機短信,卻可以聽(tīng)取這些信息;當老年人看不清手機按鍵,卻可以通過(guò)說(shuō)來(lái)對手機下達“命令”;當司機在駕駛過(guò)程中為保證安全,通過(guò)收聽(tīng)語(yǔ)音播報獲得叫車(chē)信息……云計算、大數據、移動(dòng)互聯(lián)網(wǎng)、HCI技術(shù)的快速發(fā)展、彼此交融,正悄然地改變著(zhù)人們的生活方式。
構建HCI技術(shù)生態(tài)圈
數據顯示,捷通華聲所擁有的自主知識產(chǎn)權中文語(yǔ)音合成、語(yǔ)音識別技術(shù)在國內語(yǔ)音交互技術(shù)市場(chǎng)占有率達到50%,手寫(xiě)識別、掃描識別技術(shù)達到35%的市場(chǎng)占有率,成為國內第一家倡導并實(shí)現同時(shí)提供語(yǔ)音合成、語(yǔ)音識別、手寫(xiě)識別、OCR、機器翻譯等全系列HCI核心技術(shù)的企業(yè)。
雖然,捷通華聲在智能人機交互技術(shù)領(lǐng)域已經(jīng)成為領(lǐng)先廠(chǎng)商,但捷通華聲在該領(lǐng)域的耕耘遠不止于此。張連毅介紹說(shuō),“雖然智能人機交互技術(shù)已經(jīng)取得了非常廣泛的應用,但其技術(shù)本身還存在一些不完善的地方,例如語(yǔ)音識別率還不能做到百分之百,語(yǔ)音合成雖然已經(jīng)可以流利地學(xué)習人講話(huà),但講話(huà)的語(yǔ)氣及感情色彩相比真人還有一定差距。因此,業(yè)界還需要去不斷學(xué)習、了解、應用、完善好這些智能人機交互技術(shù),這需要整個(gè)產(chǎn)業(yè)來(lái)推動(dòng)其發(fā)展”。
日前,捷通華聲的靈云開(kāi)發(fā)者社區正式向整個(gè)社會(huì )全方位開(kāi)放各項能力,所有的企業(yè)和個(gè)人開(kāi)發(fā)者都可以免費加入到靈云開(kāi)發(fā)者社區。在靈云開(kāi)發(fā)者社區,企業(yè)和個(gè)人開(kāi)發(fā)者均可直接下載語(yǔ)音合成(TTS)、語(yǔ)音識別(ASR)、手寫(xiě)識別(HWR)、光學(xué)字符識別(OCR)等多項HCI核心技術(shù)。與此同時(shí),捷通華聲還將加強技術(shù)指導,幫助開(kāi)發(fā)者把不同的智能人機交互技術(shù)應用到產(chǎn)品上,與企業(yè)和個(gè)人開(kāi)發(fā)者共同了解、學(xué)習、切磋、完善各種智能人機交互技術(shù)。
張連毅表示,“HCI技術(shù)是一項可能永遠也無(wú)法達到完美、完善的技術(shù),不斷的創(chuàng )新會(huì )讓技術(shù)無(wú)限接近盡善盡美,但可能永遠不會(huì )達到終點(diǎn),這就是HCI技術(shù)的魅力所在,也是其擁有巨大市場(chǎng)發(fā)展空間的魅力所在。你可以做到在一個(gè)階段領(lǐng)先,能夠對市場(chǎng)起到強勢的領(lǐng)導地位,但可能也會(huì )瞬間被甩到后面。我喜歡這樣的挑戰,還有更多的路需要去探索與發(fā)現”。