也談語音識別技術在玩具領域的低成本應用
趙大有 2003/01/06
據香港玩具廠商會最近完成的一項有關香港玩具業(yè)前景的調查報告分析,大部分玩具商認為電子和創(chuàng)新科技玩具將是未來三年的主流訂購貨品。為此,經香港立法局討論通過,香港政府不久將成立"香港玩具創(chuàng)新設計中心",以幫助和推動玩具業(yè)的創(chuàng)新、高科技應用和設計師的水平。 所謂的高科技對一般人而言,是那么的神秘莫測。有人說成本是產品銷售的關鍵,在玩具上應用高科技是否符合玩具生產的低成本要求呢?在此,我要告訴大家的是,首先科技是為生產服務的,只有真正能推動生產力發(fā)展的科學技術,才會有生命力;再者,基于半導體技術的不斷發(fā)展,高科技不僅能應用到玩具生產上,而且有許多暢銷正是因為它們集成了多種高科技,才會變得更智能、更有趣,從而成為包括兒童和成人在內的各種人群的寵愛。
玩具產品中的科技運用,離不開聲、光、電三方面,語音(包括發(fā)聲、說話、唱歌)、接觸感覺、互動感應(包括觸摸感應、光感應、熱感應、語音感應)、動作控制(包括內部程序控制和外部線控、紅外、射頻、聲控、語音控制)等。從技術看,低級到高級,簡單到復雜都存在,從語音IC、智能IC、中央處理器,應用呈現出不同的臺階,既不會高不可攀也不存在高門檻,多層次的分布也為企業(yè)在產品中的運用提供了很大的空間。
在國外,特別是在日本,玩具設計師往往會把科學家在智能機器人研究方面發(fā)明、創(chuàng)造的高新技術,從中選取一種應用到智能玩具的設計開發(fā),或用來對傳統(tǒng)玩具進行創(chuàng)新改造上。這些技術包括機械機構優(yōu)化設計、語音識別技術、圖像識別技術、路徑規(guī)劃、自主避障、電池電量檢測、微電腦技術、物體跟蹤技術、軌跡跟蹤技術等等,以后我會為大家一一進行詳盡的介紹;在此我挑選一種使用成本低、功能實用性強、易操作的技術推薦給大家——語音識別、語音合成技術。為什么呢?
例如,當我們看到一名兒童與另一個天真爛漫的娃娃在進行著有趣的對話,那娃娃一會兒娓娓而談,一會兒又唱又笑,她們之間的親密程度已使人沒有注意到其中有一個是玩具娃娃,這就是在傳統(tǒng)的公仔玩具里植入了一顆語音識別芯片后,獲得了生命力的高智能仿生娃娃。而當我們看到一個活潑可愛的寵物跟著它的主人撒歡,并隨著主人的指令作者各種不同的動作,甚至還開口說話、唱歌了,你們不要奇怪,這就是利用語音識別技術設計出來的智能寵物玩具。這些有"靈感"能"思維",有聽覺,能講話的玩具的出現將打破自公仔玩具問世以來的長期聾啞感,并將給人們帶來更多的能與之進行交流,甚至幫助孩子們學習成長的智能玩具。要達到上述這些類似人類特征的要求,唯一的條件是要使得娃娃聽懂人們的問話,并經過"思考",能善解人意地答復問題。
充分利用語音識別技術,就能做到上述要求。在20世紀六七十年代以來,語音識別的研究人員一直致力于語音識別專用芯片的研究,但是,大多數的語音識別專用芯片識別性能差,不具備實用的要求。直到近十年以來,隨著語音識別算法的深入研究和集成電路技術的發(fā)展,才出現了一些具有實用價值和市場前景的語音識別專用芯片。其中,較為成功的芯片是由美國Sensory
Integrated Circuit公司開發(fā)的RSC系列語音識別芯片,是一顆為消費類電子產品應用的低價位的語音識別專用芯片。
依據專家的說法,語音識別技術現在正處于高速增長的狀況,因為硅片價格和寄存器成本不斷下滑,算法更復雜、完善,半導體技術也好過以前很多,應用前景非常廣闊。
確實,有好幾家玩具公司正在使用SENSORY語音識別系列芯片并取得了輝煌的成績,美國MGA公司的語音控制智能機器人玩具Commandobot,美國TIGER公司的機器寵物小鳥Chirpy-chi,日本SONY公司的智能機器狗Aibo等世界知名的流行玩具,無不是采用了美國Sensory公司的語音識別技術。
Sensory的推廣機構遍布全球,歐洲、美洲、在亞洲還有它專門的技術開發(fā)合作伙伴,深圳市捷通語音技術開發(fā)有限公司(WWW.SZJTVOICE.COM)負責中國玩具廠商的開發(fā)設計需要。
同時,國內一些專家學者、科研機構、技術公司一直在研究開發(fā)中國人自己的語音識別技術。清華大學與華錄集團合作,成功地研究開發(fā)了國內的第一個具有自主知識產權的語音識別專用芯片。該芯片以8位MCU為核心,采用嵌入式芯片設計方法。芯片中包括了8位MCU核、低通濾波器、A/D、D/A、預放、功放、RAM、ROM、PWM等模塊,并載入了語音識別、語音壓縮編碼、語音合成算法,構成一個完整的高集成度語音識別片上系統(tǒng)。該芯片能夠識別約20~30條特定人語音命令,同時具有語音合成(提示)與語音編解碼(回放)功能。語音識別率達到98%以上,性能達到國際先進水平。由于華錄是優(yōu)先考慮了語音識別技術在玩具業(yè)的應用,與國際上同類芯片相比,華錄的語音識別芯片在基于漢語的SI(不依靠說話者語音)技術的應用方面有明顯的優(yōu)勢,同時它還增加了其他同類芯片沒有的自帶LCD驅動功能,更吸引人的是它比其他的芯片的功耗低一至二倍。
語音識別芯片的基本結構框圖
目前他們正在研發(fā)新一代基于16位定點DSP的語音識別專用芯片,其性能將更加強大。該芯片將能夠識別特定人、非特定人語音命令和漢語數碼,識別的語音命令可以達到200條以上。此外,系統(tǒng)中還包括:高質量低速率語音編解碼、
語音合成、說話人識別、回聲抵消、噪聲相消等其他功能。其中,非特定人漢語數碼語音識別率達到98%以上,人名呼叫撥號識別率達到99.5%,達到國際先進水平。該芯片可以用于汽車電子系統(tǒng),實現語音控制和語音撥號,語音PDA,高檔語音智能玩具,語音監(jiān)錄器,智能語音遙控器,高檔電話伴侶等。
華錄潤聲公司負責人說,隨著研究的進一步深入和半導體工藝的完善,相信我們自己的語音識別芯片,無論在性能和價格上,都將大大優(yōu)于國外的同類芯片,真正為中國玩具也實現高科技的低成本應用提供物質保證,從而帶動國內傳統(tǒng)玩具實現低成本改造,提高國產玩具的檔次和國際競爭力。
深圳捷通公司供稿 CTI論壇編輯
捷通82語音識別模塊產品說明書 2003-06-09 |
語音合成芯片情況介紹和產品設想 2003-05-06 |
數字可視復讀機方案 2003-04-09 |
語音識別控制電話機方案 2003-04-04 |
智能早教機方案 2003-04-03 |