21年前,通過(guò)一條64K的國際專(zhuān)線(xiàn),中國全功能接入國際互聯(lián)網(wǎng),中國互聯(lián)網(wǎng)時(shí)代從此開(kāi)啟。近年來(lái),云計算、物聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)的廣泛應用,把人類(lèi)社會(huì )帶入大數據時(shí)代,而來(lái)自全球的海量數據為人工智能的發(fā)展提供了良好的條件,以深度學(xué)習為代表的算法發(fā)展,也使得機器有能力處理如此龐大的數據。人工智能技術(shù)實(shí)現跨越式進(jìn)步,智能語(yǔ)音交互、智能語(yǔ)義理解、生物特征技術(shù)被廣泛應用。一個(gè)更加自然,更人性化的人機交互體系將成為未來(lái)發(fā)展的主流,人工智能時(shí)代開(kāi)啟發(fā)展新篇章。
人工智能是對人的意識、思維的信息過(guò)程的模擬。人工智能技術(shù)發(fā)展的前景是無(wú)限的,反映了人類(lèi)探索自然同時(shí)也是探索自我的過(guò)程,在探索的漫漫長(cháng)路上會(huì )遇到很多困難,所以越是對人工智能應該抱有客觀(guān)的態(tài)度,對產(chǎn)業(yè)和技術(shù)的發(fā)展越有好處。人工智能作為當下最炙手可熱的熱門(mén)領(lǐng)域之一,應該少一點(diǎn)浮躁,多幾分穩健。
人工智能創(chuàng )新發(fā)展需要以堅實(shí)的理論研究、強大的技術(shù)能力以及雄厚的產(chǎn)業(yè)基礎作為支撐,作為國內最早從事人工智能技術(shù)研究的大學(xué),清華大學(xué)在人工智能領(lǐng)域聚集了最多的高端科技人才力量,清華大學(xué)不僅始終堅持基礎理論研究、同時(shí)展開(kāi)應用理論研究和應用技術(shù)開(kāi)發(fā)。秉承“自強不息,厚德載物”的校訓,清華人的穩重和務(wù)實(shí)對人工智能產(chǎn)業(yè)是非常有幫助的,有了清華力量,中國的人工智能產(chǎn)業(yè)才能穩定堅固地向前發(fā)展。
(圖為:清華大學(xué)語(yǔ)音技術(shù)專(zhuān)家、清華靈云人工智能研究中心首席科學(xué)家王東老師)
日前,CTI論壇記者獨家專(zhuān)訪(fǎng)了清華大學(xué)語(yǔ)音技術(shù)專(zhuān)家、清華靈云人工智能研究中心首席科學(xué)家王東老師,王東老師具有清華人的典型特點(diǎn):為人穩重、低調、務(wù)實(shí),學(xué)識豐富。王東老師表示:“服務(wù)國民經(jīng)濟主戰場(chǎng),服務(wù)國家創(chuàng )新驅動(dòng)發(fā)展戰略,這是清華的報國之路。清華和捷通華聲合作,可以將清華在人工智能領(lǐng)域的最新科研成果快速轉化為產(chǎn)業(yè)力量,服務(wù)國民經(jīng)濟,同時(shí)為高科技企業(yè)提供持續發(fā)展的動(dòng)力。到目前為止,捷通華聲與清華的合作誕生了靈云平臺的一系列重要能力,包括語(yǔ)音識別、說(shuō)話(huà)人識別、自然語(yǔ)言問(wèn)答、機器翻譯、人臉識別、指紋識別等已經(jīng)形成產(chǎn)業(yè)化力量。因此”靈云科技、源自清華“絕不只是一個(gè)口號,而是眾所周知的事實(shí)。”
CTI論壇記者:人工智能是在未來(lái)二十年大行其道的科技,也是有史以來(lái)最難的科學(xué)之一。請介紹清華大學(xué)在人工智能領(lǐng)域的研究?jì)?yōu)勢。
王東:清華大學(xué)在人工智能領(lǐng)域具有長(cháng)期技術(shù)積累與研究歷史。1958年6月清華成立自動(dòng)控制系,即計算機系的前身,包括計算機和自動(dòng)控制兩個(gè)方向,從事自動(dòng)控制理論方面的研究。自控系后分成計算機和自動(dòng)化兩個(gè)系,這兩個(gè)系早年從事關(guān)于人工智能技術(shù)的研究。1987年7月,智能技術(shù)與系統國家重點(diǎn)實(shí)驗室開(kāi)始籌建,1990年2月通過(guò)國家驗收,并正式對外開(kāi)放運行。從2004年開(kāi)始,實(shí)驗室參與籌建清華信息科學(xué)與技術(shù)國家實(shí)驗室。清華語(yǔ)音語(yǔ)言中心即是這個(gè)實(shí)驗室的一部分。
當前,清華的人工智能技術(shù)在自動(dòng)化、計算機、電子、信息技術(shù)研究院、軟件學(xué)院等院系都有深入研究,研究?jì)热莞采w智能控制、模式識別,自然語(yǔ)言處理、數據挖掘等眾多方向。個(gè)人感覺(jué)清華大學(xué)在人工智能領(lǐng)域的研究?jì)?yōu)勢主要包括(1)積累豐厚,人才眾多(2)理工結合,重視實(shí)踐 (3)點(diǎn)面結合,學(xué)科齊全。
CTI論壇記者:請介紹捷通華聲與清華大學(xué)在人工智能領(lǐng)域的深入合作及靈云平臺的發(fā)展情況。如何更深入地理解“靈云科技、源自清華”?
王東:捷通華聲公司與清華大學(xué)有長(cháng)期合作傳統。公司幾位創(chuàng )始人本身即清華畢業(yè)生,其早期的語(yǔ)音合成、OCR、手寫(xiě)識別技術(shù)即與清華有很深的淵源。
2013年以來(lái),捷通和清華若干院系展開(kāi)全面合作,在語(yǔ)音信號處理、自然語(yǔ)言處理、圖象處理等多個(gè)領(lǐng)域與清華教師建立合作項目,取得豐碩成果,這些成果是今在靈云智能平臺的基礎。一方面,靈云平臺為清華技術(shù)提供了用武之地,另一方面,清華技術(shù)也為靈云平臺提供了堅實(shí)有力的支撐。
2014年,捷通華聲與北京清華工業(yè)研究院成立“靈云人工智能研究中心”,將前期合作項目進(jìn)行整合,集中力量發(fā)展人工智能技術(shù)并推進(jìn)產(chǎn)業(yè)化應用。
到目前為止,捷通華聲與清華的合作誕生了靈云平臺的一系列重要能力,包括語(yǔ)音識別、說(shuō)話(huà)人識別、自然語(yǔ)言問(wèn)答、機器翻譯、人臉識別、指紋識別等已經(jīng)形成產(chǎn)業(yè)化力量。這些技術(shù)單靠捷通華聲一個(gè)公司是無(wú)論如何無(wú)法完成的,因此“靈云科技、源自清華”絕不只是一個(gè)口號,而是眾所周知的事實(shí)。
CTI論壇記者:清華大學(xué)在語(yǔ)音識別、語(yǔ)音合成、聲紋識別等智能語(yǔ)音領(lǐng)域可以說(shuō)擁有國內很強的研究力量,但在最近幾年,很少聽(tīng)到清華大學(xué)在語(yǔ)音研究領(lǐng)域中的所取得的成果,尤其是在產(chǎn)業(yè)界,相比國內其他研究機構,清華大學(xué)的影響力似乎有些小。請您介紹一下,清華大學(xué)在智能語(yǔ)音領(lǐng)域的研究水平、研究方向和如何增強清華大學(xué)在智能語(yǔ)音產(chǎn)業(yè)中的影響力。
王東:清華大學(xué)在智能語(yǔ)音領(lǐng)域里的實(shí)力一直以來(lái)都是相當強大的,擁有一大批優(yōu)秀的實(shí)驗室和專(zhuān)家學(xué)者,培養出大量?jì)?yōu)秀學(xué)生,產(chǎn)生了很多優(yōu)秀的科研成果。然而,也確實(shí)存在一定問(wèn)題,比如學(xué)生數量不足,信息共享不充分,導致集群優(yōu)勢不明顯。清華大學(xué)校風(fēng)也更加注重務(wù)實(shí),確實(shí)在產(chǎn)業(yè)界,過(guò)去很難聽(tīng)到清華的聲音,當然這里面也有多方面原因,比如學(xué)生選擇方向比較豐富,留在語(yǔ)音處理行業(yè)的人較少,創(chuàng )業(yè)氛圍有待加強等。增強清華大學(xué)在智能語(yǔ)音產(chǎn)業(yè)中的影響力恐怕還是需要培養更多這一領(lǐng)域的專(zhuān)業(yè)人才。目前這一局面正在得到改變,尤其在與捷通華聲合作,共同發(fā)展靈云平臺以來(lái),“靈云科技 源自清華”逐漸為產(chǎn)業(yè)界所理解和支持,同時(shí)也擴大了清華大學(xué)語(yǔ)音技術(shù)在產(chǎn)業(yè)界中的影響力。
CTI論壇記者:請介紹清華大學(xué),包括清華信息技術(shù)研究院在語(yǔ)音語(yǔ)義識別、深度學(xué)習、建模及應用的傳統技術(shù)和最新研究進(jìn)展。
王東:清華大學(xué)在語(yǔ)音識別、自然語(yǔ)言理解等方面取得一系列重要進(jìn)展,這有發(fā)表在IEEE TASLP, AAAI, ICASSP, ACL等一系列國際頂級期刊會(huì )議上的論文為證。如和捷通華聲直接合作的馬少平老師、孫茂松老師、李涓子老師等都是這些領(lǐng)域里聲名赫赫的專(zhuān)家。就我所在的信息技術(shù)研究院語(yǔ)音語(yǔ)言技術(shù)中心而言,我們最近的研究包括深度遞歸神經(jīng)網(wǎng)絡(luò )在語(yǔ)音建模方面的優(yōu)化,利用遞歸網(wǎng)絡(luò )進(jìn)行語(yǔ)義計算等,這些已經(jīng)或者很快會(huì )應用到靈云平臺中,形成新一代語(yǔ)音識別和自然語(yǔ)言理解引擎的基礎。
CTI論壇記者:每個(gè)成功的客服機器人背后,都有個(gè)靠譜的人工智能。靈云客服機器人的“能說(shuō)會(huì )聽(tīng),能寫(xiě)會(huì )看、能思考會(huì )判斷”源自于國內首個(gè)全方位人工智能開(kāi)放平臺-靈云平臺強大的全方位人工智能技術(shù)能力,請問(wèn)其核心技術(shù)有哪些?
王東:靈云平臺當前的技術(shù)能力包括語(yǔ)音識別、語(yǔ)音合成、聲紋識別、人臉識別、指紋識別、自然語(yǔ)言理解、機器翻譯等,幾乎每種技術(shù)都可以用到靈云客服機器人中。
CTI論壇記者:機器人和“智能機器人”的區別是什么?請介紹智能機器人的發(fā)展和歷程。新一代智能機器人所需要解決的新技術(shù)有哪些?
王東:機器人通常是指可自動(dòng)完成某一動(dòng)作的人形機械裝置,更廣泛意義上的機器人則形態(tài)各異,如古代傳說(shuō)魯班造的機械鳥(niǎo)和諸葛亮造的用以運糧的木牛流馬等。當然現代機器人主要是指電器時(shí)代的自動(dòng)行為機器,如機械臂,深海探測器等。
智能機器人則是有頭腦的機器人,主要是依靠現代計算機技術(shù)實(shí)現能聽(tīng)會(huì )說(shuō),能寫(xiě)會(huì )看、會(huì )思會(huì )想的擬人化機器人,代表的如谷歌的自動(dòng)駕駛汽車(chē),日本的服務(wù)機器人等。新一代智能機器人已經(jīng)在很多特定場(chǎng)合大顯身手,但在智能化方面還有待提高,特別是對抗境噪聲、應對突發(fā)事件、自主推理、自主學(xué)習等方面還有很多問(wèn)題需要研究。
CTI論壇記者:新一代智能機器人如何解決自然語(yǔ)言的理解?如何解決從QA的模板變成語(yǔ)義的表達式?如何解決傳統的模式識別,轉變?yōu)榈纳疃壬窠?jīng)網(wǎng)絡(luò )技術(shù),具有機器學(xué)習的能力,和人一樣進(jìn)行能夠進(jìn)行自學(xué)習和思考?
王東:新一代機器人可能需要依賴(lài)大數據技術(shù)和深度學(xué)習技術(shù)來(lái)解決自然語(yǔ)言理解中的多樣性問(wèn)題,這一問(wèn)題也直接關(guān)系到QA任務(wù)中對人為設計模板的依賴(lài)。
簡(jiǎn)單地說(shuō),傳統QA需要人為設計一些問(wèn)法模板來(lái)處理自然語(yǔ)言的多樣性,這一方法繁瑣而且很難覆蓋全面。自動(dòng)模板抽取可以部分解決問(wèn)題,但大量的模板會(huì )對系統運行效率產(chǎn)生壓力。深度學(xué)習成為主流研究方法之后,研究者們意識到這種語(yǔ)言上的多樣性可以用神度神經(jīng)網(wǎng)絡(luò )來(lái)解決,利用大量數據對神經(jīng)網(wǎng)絡(luò )訓練,機器可以學(xué)得哪些詞比較重要,哪些詞順序可以顛倒等信息,這些信息對所有任務(wù)都是通用的,因此可以移植到各個(gè)領(lǐng)域上來(lái)。同時(shí),神經(jīng)網(wǎng)絡(luò )可以隨著(zhù)數據量的增加自動(dòng)學(xué)習新詞和新的說(shuō)法,實(shí)現自主學(xué)習。自主思考到目前為止還處在研究階段,目前也許我們只能依靠大量數據實(shí)現“類(lèi)思考”。
CTI論壇記者:機器人和人一樣,也是分職業(yè)、分行業(yè),對于新一代的智能機器人而言,如何解決渠道入口、業(yè)務(wù)服務(wù)、大數據分析等一體化的解決方案,實(shí)現對于整個(gè)數字和新媒體渠道方面的管理?
王東:這一問(wèn)題主要涉及應用場(chǎng)景的通用性和特異性,也是智能機器人在實(shí)際應用中需要解決的問(wèn)題,特別重要的是如何將人類(lèi)已有的格式化知識和神經(jīng)網(wǎng)絡(luò )學(xué)習相結合,實(shí)現知識和數據的雙重驅動(dòng)。這方面研究領(lǐng)域已經(jīng)有一些重要的成果出現,但還需要更多探索。
CTI論壇記者:伴隨人工智能產(chǎn)業(yè)的崛起,捷通華聲和清華大學(xué)已建立起穩固的戰略合作關(guān)系,在合作基礎上,2014年又共同創(chuàng )建了清華靈云人工智能研究中心,捷通華聲和清華大學(xué)人工智能研究力量,包括在智能語(yǔ)音、智能圖像、智能語(yǔ)義理解等領(lǐng)域合作,取得了豐碩的成果,請分享并展望未來(lái)的發(fā)展前景。
王東:靈云人工智能中心助推清華大學(xué)產(chǎn)學(xué)研一體化,能夠把清華大學(xué)最新的人工智能科研成果轉換成產(chǎn)品或生產(chǎn)力以此實(shí)現實(shí)用化,同時(shí)把市場(chǎng)的信息通過(guò)研究中心傳遞給各個(gè)研究部門(mén),了解市場(chǎng)和產(chǎn)業(yè)發(fā)展的動(dòng)態(tài),起到窗口和橋梁的作用。窗口是對外展示清華人工智能的科技實(shí)力,橋梁則是架起產(chǎn)學(xué)研一體化進(jìn)行轉換的橋梁。
個(gè)人覺(jué)得研究機構和企業(yè)需求結合是個(gè)非常重要的創(chuàng )新模式,清華靈云人工智能研究中心的創(chuàng )立在這一方面做了有益的探索。通過(guò)和企業(yè)合作,研究更加有的放矢,同時(shí)可以快速將研究成果形成生產(chǎn)力,為研究機構提供更多資金支持,而企業(yè)則在這一過(guò)程中得到持續發(fā)展的源動(dòng)力。未來(lái)我們可能會(huì )在分工合作方面更加精細化,使清華力量和捷通華聲力量得到充分互補,形成更強大的合力。
結語(yǔ):現階段,人工智能正進(jìn)入新一輪創(chuàng )新發(fā)展高峰,有望引領(lǐng)信息通信產(chǎn)業(yè)的革命性突破。人工智能技術(shù)的應用對中國是產(chǎn)業(yè)機遇,值得驕傲的是,在為數不多的領(lǐng)域里,中國在人工智能的技術(shù)研究上并不落后于世界。作為新興產(chǎn)業(yè)升級換代的關(guān)鍵技術(shù),人工智能的發(fā)展對中國的產(chǎn)業(yè)升級至關(guān)重要,無(wú)論“+智能”還是“智能+”都將促使各個(gè)產(chǎn)業(yè)或產(chǎn)品形態(tài)發(fā)生“智”的變化。
秉持“清華大學(xué)人工智能必須在中國的人工智能產(chǎn)業(yè)中有所作為”的理想,凝聚清華力量,清華和捷通華聲結盟,共同實(shí)現“靈云科技 源自清華 服務(wù)全球”的發(fā)展戰略,共同開(kāi)創(chuàng )中國人工智能領(lǐng)域的全新局面,更希望人工智能產(chǎn)業(yè)能夠幫助中國在世界級的產(chǎn)業(yè)化升級中不為人后,面對產(chǎn)業(yè)機遇清華與靈云當仁不讓?zhuān)?/p>
被采訪(fǎng)人簡(jiǎn)介:王東,清華大學(xué)學(xué)士、碩士,英國愛(ài)丁堡大學(xué)博士,歷任Oracle 中國軟件工程師,IBM中國高級軟件工程師,英國愛(ài)丁堡大學(xué)Marie Curie 研究員,法國EURECOM博士后研究員,美國Nuance公司高級研究科學(xué)家,現任清華大學(xué)語(yǔ)音語(yǔ)言中心助理教授,中心副主任。曾獲歐盟瑪麗-居里青年研究學(xué)者獎(2006-2009)。
王東博士的主要研究方向包括機器學(xué)習,信號處理,語(yǔ)音識別,自然語(yǔ)言理解,信息提取等,在信號稀疏性分析,深度神經(jīng)網(wǎng)絡(luò )學(xué)習等機器學(xué)習方面取得顯著(zhù)成績(jì),在IEEE trans。 on Signal processing 等國際一流期刊和會(huì )議發(fā)表多篇論文,其中SCI期刊論文10余篇,EI/ISTP論文50余篇,是IEEE transactions on Audio,Speech and Language, NeuraComputin,ICASSP、Interspeech、SLT等國際語(yǔ)音信號處理領(lǐng)域主要期刊和會(huì )議的審稿人。王東博士是全國人機語(yǔ)音通訊會(huì )議常設機構委員、秘書(shū)長(cháng),是亞太信號信息處理聯(lián)盟(APASIPA)語(yǔ)音專(zhuān)委會(huì )委員、秘書(shū),是國際標準與語(yǔ)音數據資源委員會(huì )(COCOSDA)大陸區代表之一。
王東博士是歐盟ALIAS項目主要研究科學(xué)家,法國ACAV項目主要研究科學(xué)家,法國外交部M4SVR項目負責人,主要研究科學(xué)家。目前主持一項國家自然科學(xué)基金項目,一項國家教育部博士點(diǎn)基金項目。
聲明:CTI論壇(CTiforum)版權作品,未經(jīng)CTiforum書(shū)面授權,嚴禁轉載,違者將被追究法律責任。