2020年1月13至17日,在韓國釜山舉行的ISO/IEC JTC 1/SC 35全會(huì )上,由科大訊飛主導、聯(lián)合中國電子技術(shù)標準化研究院和中科院自動(dòng)化所,提出的全雙工語(yǔ)音交互國際標準正式獲批立項(ISO/IEC 24661 Information technology - User interfaces - Full duplex speech interaction)。該標準也成為在人機交互領(lǐng)域中,首個(gè)由中國牽頭制定的智能語(yǔ)音交互國際標準。
人機交互,是當前A.I.核心技術(shù)與應用的重要領(lǐng)域。語(yǔ)音作為最自然便捷的交流方式,一直是人機交互最重要的研究領(lǐng)域之一。隨著(zhù)以深度學(xué)習、強化學(xué)習為代表的新一代A.I.技術(shù)發(fā)展,越來(lái)越多的語(yǔ)音交互產(chǎn)品和服務(wù),正走入生產(chǎn)生活的方方面面,以更智能的方式服務(wù)于千家萬(wàn)戶(hù)。近年來(lái),以智能語(yǔ)音交互技術(shù)為核心的智能助理、智能家居、智能辦公等諸多A.I.應用,已形成了一個(gè)巨大且成熟的市場(chǎng)。在此背景下,持續高質(zhì)量發(fā)展的全球智能語(yǔ)音產(chǎn)業(yè)技術(shù)和貿易,亟需通過(guò)標準的制定和應用來(lái)凝聚共識。 據悉,此次立項的全雙工語(yǔ)音交互國際標準為ISO/IEC國際標準。國際標準組織(ISO)和國際電工委員會(huì )(IEC)是全球標準化領(lǐng)域的兩大權威組織,組織各國專(zhuān)家共同制定作用于全球范圍的技術(shù)標準。ISO/IEC JTC 1 是ISO和IEC共同成立的負責信息技術(shù)領(lǐng)域國際標準制定的技術(shù)委員會(huì ),下設多個(gè)分技術(shù)委員會(huì ),是全球信息技術(shù)領(lǐng)域最大、成員國最多的國際標準化組織。其中,人機交互界面標準技術(shù)委員會(huì )(ISO/IEC JTC 1/SC 35)負責組織基于ICT技術(shù)的人機交互相關(guān)的國際標準制定,包括語(yǔ)音交互相關(guān)的語(yǔ)音命令、語(yǔ)音機器翻譯、同傳機器翻譯等。 作為國家新一代人工智能開(kāi)放創(chuàng )新平臺、認知智能?chē)抑攸c(diǎn)實(shí)驗室和語(yǔ)音及語(yǔ)言信息處理國家工程實(shí)驗室,科大訊飛憑借多年的技術(shù)積累,研發(fā)了覆蓋智能語(yǔ)音交互全鏈路的自主創(chuàng )新技術(shù),實(shí)現讓人通過(guò)自然語(yǔ)音方式與機器進(jìn)行雙向交流。
相較于傳統語(yǔ)音交互技術(shù),全雙工語(yǔ)音交技術(shù)能夠實(shí)現單次喚醒、連續對話(huà)、隨時(shí)打斷的自然流暢的人機對話(huà)體驗,并具有更好的上下文語(yǔ)義理解和智能對話(huà)能力。
在國際上,谷歌、微軟、蘋(píng)果等紛紛切入到這一領(lǐng)域。例如谷歌在2018年的開(kāi)發(fā)者大會(huì )上所展示的人工智能(DUPLEX AI)技術(shù),正是全雙工語(yǔ)音交互的典型案例。而在國內,科大訊飛在2015年就率先發(fā)布了全雙工語(yǔ)音交互技術(shù),并以此為基礎打造了AIUI人機交互開(kāi)放平臺。通過(guò)自主研發(fā)全球領(lǐng)先的語(yǔ)音識別、自然語(yǔ)言理解和語(yǔ)音合成等技術(shù),科大訊飛正在用人工智能為萬(wàn)物互聯(lián)時(shí)代的多模態(tài)交互賦能,從而實(shí)現人機交流無(wú)障礙,使人與機器之間可以通過(guò)語(yǔ)音、圖像、手勢等自然交互方式,進(jìn)行持續、雙向、自然地溝通。
目前,科大訊飛已將此項技術(shù)應用在A(yíng).I.+城市、A.I.+醫療、A.I.+教育等領(lǐng)域,以科技賦能,推動(dòng)行業(yè)發(fā)展。
現階段新型冠狀肺炎疫情防控工作十分嚴峻。基于全雙工語(yǔ)音交互技術(shù)的訊飛智醫助理外呼平臺在安徽、北京、浙江、吉林、湖北等18個(gè)地區,正在幫助各級衛健委、基層醫生,開(kāi)展新冠肺炎相關(guān)的防控宣傳和重點(diǎn)人群隨訪(fǎng)等工作。1月21日至2月1日,外呼平臺針對新型冠狀肺炎疫情累計服務(wù)已超過(guò)625萬(wàn)人次。
作為全球人工智能產(chǎn)業(yè)中的一員,科大訊飛始終以頂天立地的技術(shù)應用創(chuàng )新,持續參與全球技術(shù)標準制定。
作為全雙工語(yǔ)音交互國際標準制定的主導者,科大訊飛將緊密聯(lián)合中國電子技術(shù)標準化研究院、中科院自動(dòng)化所等國內產(chǎn)學(xué)研用單位,組織和整合世界各國專(zhuān)家的技術(shù)力量,針對全雙工語(yǔ)音交互系統架構、特性方法、能力單元和技術(shù)要求等方面制定國際規范,推動(dòng)中國自主創(chuàng )新技術(shù)走向國際,為打造全球人工智能+人機交互開(kāi)放共贏(yíng)的產(chǎn)業(yè)生態(tài)提供助力。