近年來(lái),智能人機交互(以下簡(jiǎn)稱(chēng)“HCI”)技術(shù)已成為全世界學(xué)術(shù)界、產(chǎn)業(yè)界最活躍的領(lǐng)域之一,智能語(yǔ)音交互、智能圖像識別、自然語(yǔ)義理解、生物特征識別等HCI技術(shù)的進(jìn)步,也在影響并改變著(zhù)更多產(chǎn)業(yè)的發(fā)展進(jìn)程。它像是潤物細無(wú)聲的春雨一樣,正默默地改變著(zhù)人們的工作與生活方式。
在中關(guān)村,HCI技術(shù)的發(fā)展不僅能夠保持與世界同步,并且在一些領(lǐng)域保持著(zhù)領(lǐng)先地位。今天讓我們跟隨張連毅走進(jìn)這個(gè)在很多人眼中神秘的領(lǐng)域,體驗它的魅力。
26年前,張連毅于清華大學(xué)畢業(yè)。2013年,他以另外一個(gè)身份再次回到清華大學(xué)。人的一生有多少個(gè)25年?“HCI技術(shù)是一項可能永遠也無(wú)法達到完美、完善的技術(shù),不斷地創(chuàng )新會(huì )讓技術(shù)無(wú)限接近盡善盡美,但可能永遠不會(huì )達到終點(diǎn),這就是HCI技術(shù)的魅力所在。而我和清華大學(xué)的緣分也將沒(méi)有終點(diǎn)地持續下去。”他用這樣一段話(huà)來(lái)解釋自己和清華大學(xué)的不解之緣。
北京商報:智能人機交互技術(shù)是什么?
張連毅:人與機器的交流像人與人交流一樣簡(jiǎn)單自然,如果要實(shí)現這一夢(mèng)想,就必須讓機器具備更多像人一樣的能力。伴隨著(zhù)技術(shù)的進(jìn)步,這一夢(mèng)想正逐步得以實(shí)現,而這就是智能人機交互技術(shù),也稱(chēng)HCI(Human-Computer Interaction)技術(shù)。從最早的OCR,讓電腦像人一樣擁有了眼睛;到手寫(xiě)識別,讓電腦像人一樣擁有了手;從語(yǔ)音合成,讓電腦像人一樣說(shuō)話(huà),就像擁有了人的嘴;到語(yǔ)音識別,讓電腦能夠聽(tīng)懂人的語(yǔ)言,就像擁有了人的耳朵;再到自然語(yǔ)言理解,電腦正逐漸學(xué)會(huì )像人一樣思考;現在的生物特征識別技術(shù),如人臉識別、掌紋識別等技術(shù),不僅使電腦變得越來(lái)越像人,而且已經(jīng)開(kāi)始展現超越人的能力。
北京商報:HCI會(huì )為我們的生活帶來(lái)怎樣的改變?
張連毅:縱觀(guān)國內外信息產(chǎn)業(yè)發(fā)展趨勢,HCI產(chǎn)業(yè)作為一個(gè)新興的產(chǎn)業(yè)集群正在迅速崛起,智能語(yǔ)音交互、智能圖像識別、自然語(yǔ)義理解、生物特征識別等HCI技術(shù)的進(jìn)步,也在影響并改變著(zhù)更多產(chǎn)業(yè)的發(fā)展進(jìn)程。從百度導航、導航犬這樣的導航軟件,到嘀嘀、快的這樣的叫車(chē)軟件,從辦公室內的文件掃描識別,到手機中的天行輸入法,從天行聽(tīng)書(shū)這樣的隨身聽(tīng)書(shū)軟件,到谷歌眼鏡的圖像識別技術(shù),從智能手機到可穿戴設備,這里面濃縮著(zhù)眾多HCI技術(shù)的成果。它像是潤物細無(wú)聲的春雨一樣,正默默地改變著(zhù)人們的工作與生活方式。
北京商報:中國的HCI技術(shù)在國際上處于什么地位?
張連毅:近年來(lái),HCI技術(shù)已成為全世界學(xué)術(shù)界、產(chǎn)業(yè)界最活躍的領(lǐng)域之一,而中國HCI技術(shù)的發(fā)展不僅能夠保持與世界同步,并且在一些領(lǐng)域保持著(zhù)領(lǐng)先地位。
北京商報:什么原因讓中國的HCI技術(shù)獲得了今日的成功?
張連毅:在我看來(lái),除了很多企業(yè)所做出的貢獻,也離不開(kāi)清華大學(xué)、北京大學(xué)等高等院校、科研院所幾十年來(lái)所做出的杰出貢獻。自上世紀80年代起,清華大學(xué)率先在國內開(kāi)展智能圖像識別、智能語(yǔ)音交互等HCI技術(shù)研究,一直是國內HCI領(lǐng)域最重要的研究力量,保持并擁有在學(xué)術(shù)、科研、產(chǎn)業(yè)化應用的領(lǐng)導地位,并不斷為中國乃至世界學(xué)術(shù)界、產(chǎn)業(yè)界培養、輸送大批優(yōu)秀人才。
北京商報:去年底,捷通華聲和清華大學(xué)開(kāi)始了新一輪的戰略合作,并在語(yǔ)音識別技術(shù)上取得優(yōu)異成績(jì),業(yè)界有人評價(jià)這次合作將重新改寫(xiě)中國語(yǔ)音產(chǎn)業(yè),甚至改變HCI產(chǎn)業(yè)的市場(chǎng)格局,您怎么看?
張連毅:捷通華聲的語(yǔ)音識別技術(shù)在清華大學(xué)的支持下已達到國內外最高水平,確實(shí)在產(chǎn)業(yè)內引起不小的影響,也很快就改變了國內現有智能語(yǔ)音技術(shù)領(lǐng)域的競爭格局。但捷通華聲與清華大學(xué)合作,不僅局限在智能語(yǔ)音技術(shù)領(lǐng)域,我們也將在HCI技術(shù)領(lǐng)域展開(kāi)全方位的合作。
捷通華聲自1998年就開(kāi)始專(zhuān)注于語(yǔ)音、手寫(xiě)等多種HCI技術(shù)的研究與應用,2011年,捷通華聲在國內推出了第一個(gè)全方位智能人機交互技術(shù)云服務(wù)平臺——靈云,靈云提供包括語(yǔ)音合成、語(yǔ)音識別、手寫(xiě)識別、OCR、自然語(yǔ)言理解等多種HCI技術(shù)能力,并向社會(huì )、產(chǎn)業(yè)全面開(kāi)放。靈云平臺自推出以來(lái),展現出越來(lái)越強勁的市場(chǎng)需求,僅在智能手機領(lǐng)域,目前就有數千開(kāi)發(fā)者應用靈云各項HCI技術(shù)開(kāi)發(fā)了上千款智能手機應用。
在發(fā)展靈云的過(guò)程中,我們意識到面對這樣一個(gè)寬廣的技術(shù)領(lǐng)域與巨大的市場(chǎng),捷通華聲不能完全僅憑自己的力量發(fā)展HCI技術(shù),而在HCI技術(shù)領(lǐng)域,清華大學(xué)的科技力量一直是全國最強大的,捷通華聲管理團隊都是畢業(yè)于清華大學(xué),因此我們就想到與清華大學(xué)合作,通過(guò)靈云平臺幫助清華大學(xué)將HCI領(lǐng)域的研究成果與廣大的市場(chǎng)需求對接,促進(jìn)科技成果轉化;同時(shí),清華大學(xué)也在探索產(chǎn)、學(xué)、研一體化創(chuàng )新體制,學(xué)校鼓勵清華實(shí)驗室與教授們將自身的科技成果轉化為真正的生產(chǎn)力,服務(wù)產(chǎn)業(yè)、服務(wù)社會(huì )大眾,因此我們的想法得到了清華大學(xué)HCI相關(guān)技術(shù)實(shí)驗室與教授們的支持與鼓勵,雙方很快就在智能語(yǔ)音、智能圖像等多個(gè)HCI技術(shù)領(lǐng)域展開(kāi)了技術(shù)合作,雙方合作得非常順利與自然。
與清華大學(xué)的合作是捷通華聲發(fā)展中一個(gè)里程碑式的事件,雖然我們已經(jīng)在語(yǔ)音識別技術(shù)上取得了豐碩的成果,但也應看到,智能語(yǔ)音產(chǎn)業(yè)是HCI產(chǎn)業(yè)集群的組成部分。未來(lái)發(fā)展中,我們將依托清華大學(xué)在HCI技術(shù)領(lǐng)域中的雄厚研究力量,全面推動(dòng)中國HCI技術(shù)的發(fā)展進(jìn)步,共同構建產(chǎn)學(xué)研一體化的創(chuàng )新發(fā)展新模式,推動(dòng)實(shí)現“靈云科技 源自清華 服務(wù)全球”的戰略規劃。這樣,不僅將幫助捷通華聲,也必將幫助一大批中國企業(yè)提升企業(yè)核心競爭力,促進(jìn)中國HCI產(chǎn)業(yè)新格局的誕生,提升中國HCI產(chǎn)業(yè)在世界范圍內的核心競爭力。
北京商報:捷通華聲如何達到服務(wù)全球的目標?
張連毅:目前,靈云多語(yǔ)種語(yǔ)音合成技術(shù)已全面支持中文普通話(huà)、粵語(yǔ)、英語(yǔ)、法語(yǔ)、俄語(yǔ)、西班牙語(yǔ)、意大利語(yǔ)、德語(yǔ)、葡萄牙語(yǔ)、日語(yǔ)、韓語(yǔ)等13種語(yǔ)言,覆蓋全球90%以上的國家和地區,與我們覆蓋92種語(yǔ)言手寫(xiě)識別技術(shù)可謂“珠聯(lián)璧合”。這在另一個(gè)方面也說(shuō)明,靈云平臺已開(kāi)始具備服務(wù)全球的基本能力,如今,有了清華大學(xué)的支持,我們在多語(yǔ)言HCI技術(shù)能力上也將越來(lái)越強。靈云的發(fā)展一定會(huì )為中國企業(yè)進(jìn)軍國際市場(chǎng)、全面參與國際競爭提供更多的HCI技術(shù)能力支撐。
北京商報:您對捷通華聲的未來(lái)有什么樣的規劃?
張連毅:未來(lái),捷通華聲將在與清華大學(xué)合作的基礎上堅定推動(dòng)“靈云科技 源自清華 服務(wù)全球”的戰略發(fā)展規劃,同時(shí)也將不斷與國內外學(xué)術(shù)界、產(chǎn)業(yè)界,包括國際跨國企業(yè)進(jìn)行合作,力爭通過(guò)全球范圍的合作,為世界各國用戶(hù)提供更多、更好、更全面的HCI技術(shù)能力,將靈云平臺打造成國際品牌,也將合作共贏(yíng)的理念通過(guò)靈云HCI技術(shù)能力融入中國、融入世界。
“歡迎北京商報的記者來(lái)公司交流溝通,我們一起聊聊智能人機交互技術(shù)在現代生活工作中的應用。”伴隨著(zhù)捷通華聲董事長(cháng)張連毅的一條語(yǔ)音短信,北京商報記者開(kāi)始了這次專(zhuān)訪(fǎng)。
“免費打車(chē)”的幕后英雄
“今天怎么打車(chē)”是前一段時(shí)間最為熱門(mén)的話(huà)題之一。用手機軟件打車(chē)的新習慣正在北京、上海、杭州等地的年輕人群中逐漸養成。花上不多的流量用手機軟件預約出租車(chē),即便在上下班高峰時(shí)間段,也有可能在中心城區獲得不一般的“禮遇”——一輛出租車(chē)專(zhuān)門(mén)為你而來(lái)。
這一話(huà)題源自今年1月,嘀嘀打車(chē)和快的打車(chē)兩大“打車(chē)神器”先后推出軟件叫車(chē)的優(yōu)惠服務(wù)。記者在采訪(fǎng)中了解到,“打車(chē)神器”不僅改變了叫車(chē)方式,甚至改變了不少出租車(chē)司機的運營(yíng)習慣,還有司機師傅專(zhuān)門(mén)購買(mǎi)了新手機“搶單”。
除了可以享受“免費打車(chē)”,軟件使用的便捷無(wú)疑是引爆這一話(huà)題的重要因素。如果您是一名乘客,只需要打開(kāi)軟件像發(fā)送微信一樣發(fā)送一段語(yǔ)音信息,就可以坐享便利的打車(chē)服務(wù)。如果您是一名的士司機,您只需要聆聽(tīng)手機中傳來(lái)的叫車(chē)信息,就可以便捷接單。
但是很多人卻不知道,在這兩款“打車(chē)神器”中,捷通華聲“靈云”平臺起到了不可忽視的作用。當用戶(hù)發(fā)送語(yǔ)音需求后,語(yǔ)音信息將通過(guò)靈云的語(yǔ)音識別將其轉化為文字傳送到服務(wù)器,服務(wù)器再根據打車(chē)地點(diǎn)分配到附近的司機客戶(hù)端。而如果您發(fā)送的是一條文字信息,那文字信息將直接發(fā)送到服務(wù)器,服務(wù)器同樣根據打車(chē)地點(diǎn)分配到附近的司機客戶(hù)端,再通過(guò)靈云語(yǔ)音合成將其轉化為語(yǔ)音播放給司機。
這看似簡(jiǎn)單的一聽(tīng)、一說(shuō)之間,匯聚的是捷通華聲十多年的默默耕耘。