靈云科技4月11日消息:8日,捷通華聲受邀出席慈星股份和阿優(yōu)文化聯(lián)合舉辦的“智童道合”服務(wù)機器人發(fā)布會(huì ),公司總經(jīng)理武衛東代表公司與慈星股份和阿優(yōu)文化合資創(chuàng )建的開(kāi)心果機器人簽訂了戰略合作協(xié)議。

此次發(fā)布的阿U兔智兒童機器人(以下簡(jiǎn)稱(chēng)兔智機器人),是一款能陪孩子學(xué)習和玩耍的家庭服務(wù)機器人。捷通華聲為該款兔智機器人提供了靈云環(huán)形麥克風(fēng)陣列和靈云智能語(yǔ)音技術(shù),讓兔智機器人不僅能準確識別主人話(huà)語(yǔ),還能說(shuō)出可愛(ài)的童聲,讓孩子與兔智機器人的語(yǔ)音交互更加流暢、自然。
語(yǔ)音交互作為該產(chǎn)品的一大亮點(diǎn)技術(shù),是孩子與兔智機器人溝通的主要方式。由于兔智機器人所在的家庭環(huán)境,經(jīng)常會(huì )有家用電器、室內娛樂(lè )等環(huán)境噪音,孩子也可能離兔智機器人忽遠忽近,所以對語(yǔ)音識別技術(shù)的抗噪能力和遠場(chǎng)識別能力有較高要求。對此,捷通華聲為兔智機器人提供了靈云環(huán)形麥克風(fēng)陣列,能定向獲取孩子的聲音,并通過(guò)降噪、語(yǔ)音增強、回聲消除等系列技術(shù),準確識別遠處孩子的話(huà)語(yǔ)。同時(shí),靈云語(yǔ)音合成技術(shù)的采用,讓兔智機器人不但能說(shuō)出可愛(ài)的童聲,還能用童聲唱出清明透亮、悅耳動(dòng)聽(tīng)的歌聲,讓兔智機器人“能說(shuō)會(huì )唱”,極大地提升了孩子與兔智機器人的互動(dòng)體驗。
靈云環(huán)形麥克風(fēng)陣列 讓機器人準確識別主人話(huà)語(yǔ)
為了讓兔智機器人準確獲取來(lái)自家庭范圍內各個(gè)方向的語(yǔ)音,捷通華聲專(zhuān)門(mén)推出了靈云環(huán)形麥克風(fēng)陣列。與車(chē)載麥克風(fēng)陣列不同,因為車(chē)載設備只需拾取設備對面180°范圍內的乘車(chē)人話(huà)語(yǔ),采用線(xiàn)性麥克風(fēng)陣列即可滿(mǎn)足需求,而家庭范圍較為開(kāi)放,說(shuō)話(huà)人會(huì )移動(dòng),聲源可能在各個(gè)方位,需要用環(huán)形麥克風(fēng)陣列來(lái)定位和獲取360°范圍內的語(yǔ)音信息。

靈云環(huán)形麥克風(fēng)陣列能根據聲音到達的時(shí)間差,準確計算出聲源與陣列模塊之間的角度和距離,實(shí)現對目標聲源的定位,并利用麥克風(fēng)陣列的空域濾波特性,在目標說(shuō)話(huà)人方向形成拾音波束,僅拾取波束的信號,抑制波束之外的噪聲和混響(反射聲)。
由于聲音能量會(huì )隨著(zhù)傳播距離的變遠而衰減,陣列模塊通過(guò)將多個(gè)麥克風(fēng)拾取的聲音信號進(jìn)行有機疊加,增強整體拾取的語(yǔ)音波束能量。同時(shí),利用回聲消除技術(shù),過(guò)濾掉機器自身音頻設備發(fā)出的聲音,為語(yǔ)音識別引擎輸入更為清晰、純凈的聲音。
由于在麥克風(fēng)陣列模塊的拾音過(guò)程中,會(huì )不可避免的拾取部分環(huán)境噪音,對此,捷通華聲針對環(huán)境噪音進(jìn)行建模,并用大量真實(shí)噪音數據進(jìn)行訓練,優(yōu)化語(yǔ)音識別算法,推出了具備極強抗噪能力的靈云語(yǔ)音識別技術(shù),能輕松應對常見(jiàn)環(huán)境噪音。同時(shí),該技術(shù)采用的深度神經(jīng)網(wǎng)絡(luò )(DNN)算法,可在用戶(hù)使用過(guò)程中,用積累的語(yǔ)音數據訓練、優(yōu)化算法,不斷提升的抗噪能力,讓機器人準確識別主人話(huà)語(yǔ)。
靈云語(yǔ)音合成 讓機器人“能說(shuō)會(huì )唱”
除了采用靈云環(huán)形麥克風(fēng)陣列和語(yǔ)音識別技術(shù),兔智機器人還采用了捷通華聲的靈云語(yǔ)音合成技術(shù),可以說(shuō)出可愛(ài)稚嫩、流暢自然的話(huà)語(yǔ),讓人感覺(jué)是在和一個(gè)六七歲的小孩說(shuō)話(huà)。捷通華聲作為國內最早從事語(yǔ)音合成技術(shù)研究與應用的企業(yè),早在2001年就推出了代表行業(yè)頂尖水平的靈云語(yǔ)音合成技術(shù),經(jīng)過(guò)十多年的技術(shù)積累,以及在成千上萬(wàn)家企業(yè)的應用實(shí)踐和磨合,捷通華聲不斷優(yōu)化文本分析模型、完善韻律規劃,讓靈云語(yǔ)音合成技術(shù)的合成效果真實(shí)飽滿(mǎn)、抑揚頓挫,MOS值已高達4.6,可懂度、自然度、流暢度達到行業(yè)頂尖水平。
靈云語(yǔ)音合成技術(shù)已全面支持中文普通話(huà)、英語(yǔ)、粵語(yǔ)、維吾爾語(yǔ)、日、韓、俄、德、法等21種語(yǔ)言,覆蓋了全球90%以上的國家和地區,中英混讀、粵英混讀自然流暢,全面適應目前的多語(yǔ)種語(yǔ)音合成要求,讓機器人“說(shuō)”出流暢、自然的話(huà)語(yǔ)。
近期,捷通華聲依靠在語(yǔ)音合成領(lǐng)域數十年的深厚積累,推出了靈云歌唱合成技術(shù)。該技術(shù)可根據歌譜信息,讓機器人唱出甜美可愛(ài)、清明透亮、悅耳動(dòng)聽(tīng),如真人般歌唱的歌聲,成功實(shí)現機器從“開(kāi)口說(shuō)話(huà)”到“放聲歌唱”的跨越式進(jìn)步,讓機器人“能說(shuō)會(huì )唱”。讓機器人學(xué)會(huì )唱歌,不僅提升了機器人服務(wù)的趣味性,更意味著(zhù)機器人在擬人度和服務(wù)體驗方面跨出了一大步。
靈云平臺面向機器人產(chǎn)業(yè)全面開(kāi)放
捷通華聲作為中國人工智能產(chǎn)業(yè)的領(lǐng)軍企業(yè),在2011年推出了國內外第一個(gè)全方位人工智能開(kāi)放平臺-靈云(www.hcicloud.com)。靈云平臺面向產(chǎn)業(yè)全面開(kāi)放,并以“云 + 端”方式,為產(chǎn)業(yè)界提供語(yǔ)音合成、語(yǔ)音識別、OCR、手寫(xiě)識別、人臉識別、聲紋識別、指紋識別、語(yǔ)義理解、機器翻譯等全方位人工智能能力。
捷通華聲自2015年初就宣布靈云平臺對中國機器人產(chǎn)業(yè)全面開(kāi)放,并相繼為開(kāi)心果、中智物聯(lián)、新松、兆緯、科沃斯、阿凡達、奇諾軟通、NAO等數百家國內外機器人廠(chǎng)商提供了全方位靈云人工智能能力服務(wù),傾全力支持中國機器人產(chǎn)業(yè)打造真正的“能聽(tīng)會(huì )說(shuō)、能寫(xiě)會(huì )看、能思考、會(huì )判斷”的機器人。大量使用了靈云能力的機器人,有的已實(shí)現批量上市,更多的在金融、電信、能源政府、商業(yè)機構營(yíng)業(yè)廳、商場(chǎng)等場(chǎng)所展開(kāi)大規模測試,得到了產(chǎn)業(yè)界與廣大用戶(hù)的廣泛關(guān)注與贊譽(yù)。

近年來(lái),伴隨人工智能產(chǎn)業(yè)的爆發(fā)性增長(cháng),捷通華聲憑借人工智能技術(shù)深厚功底與對機器人產(chǎn)業(yè)發(fā)展的準確預見(jiàn),憑借合作共贏(yíng)的理念,不與機器人廠(chǎng)商爭利,更不會(huì )與機器人廠(chǎng)商爭市場(chǎng)的合作意識,贏(yíng)得了國內機器人廠(chǎng)商的廣泛支持,目前已與絕大多數國內主要機器人廠(chǎng)商建立了穩固的合作伙伴關(guān)系,靈云人工智能已在中國機器人產(chǎn)業(yè)已獨樹(shù)一幟,幾乎無(wú)處不在!
未來(lái)發(fā)展,捷通華聲將繼續以清華大學(xué)人工智能研究力量為依托,全面響應并支持國家創(chuàng )新發(fā)展戰略,全面促進(jìn)靈云平臺與中國機器人產(chǎn)業(yè)界的全面對接,與中國所有機器人廠(chǎng)商一起精誠合作,共同打造屬于中國機器人產(chǎn)業(yè)的輝煌。
靈云平臺更多信息請訪(fǎng)問(wèn):www.hcicloud.com
了解靈云產(chǎn)品與捷通華聲,請致電問(wèn)詢(xún)靈云客服機器人:010-82826886-8898