• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
     首頁 > 新聞 > 專家觀點(diǎn) >

    基于STM32的嵌入式語音識別模塊設(shè)計(jì)和實(shí)現(xiàn)

    2011-03-24 00:00:00   作者:   來源:   評論:0  點(diǎn)擊:



      摘要:介紹了一種以ARM為核心的嵌入式語音識別模塊的設(shè)計(jì)與實(shí)現(xiàn)。模塊的核心處理單元選用ST公司的基于ARM Cortex-M3內(nèi)核的32位處理器STM32F103C8T6。本模塊以對話管理單元為中心,通過以LD3320芯片為核心的硬件單元實(shí)現(xiàn)語音識別功能,采用嵌入式操作系統(tǒng)μC/OS-II來實(shí)現(xiàn)統(tǒng)一的任務(wù)調(diào)度和外圍設(shè)備管理。經(jīng)過大量的實(shí)驗(yàn)數(shù)據(jù)驗(yàn)證,本文設(shè)計(jì)的語音識別模塊具有高實(shí)時(shí)性、高識別率、高穩(wěn)定性的優(yōu)點(diǎn)。
      關(guān)鍵詞:ARM;語音識別;對話管理;LD3320;μC/OS-II
      引言
      服務(wù)機(jī)器人以服務(wù)為目的,因此人們需要一種更方便、更自然、更加人性化的方式與機(jī)器人交互,而不再滿足于復(fù)雜的鍵盤和按鈕操作。基于聽覺的人機(jī)交互是該領(lǐng)域的一個重要發(fā)展方向。目前主流的語音識別技術(shù)是基于統(tǒng)計(jì)模式。然而,由于統(tǒng)計(jì)模型訓(xùn)練算法復(fù)雜,運(yùn)算量大,一般由工控機(jī)、PC機(jī)或筆記本來完成,這無疑限制了它的運(yùn)用。嵌入式語音交互已成為目前研究的熱門課題。
      嵌入式語音識別系統(tǒng)和PC機(jī)的語音識別系統(tǒng)相比,雖然其運(yùn)算速度和內(nèi)存容量有一定限制,但它具有體積小、功耗低、可靠性高、投入小、安裝靈活等優(yōu)點(diǎn),特別適用于智能家居、機(jī)器人及消費(fèi)電子等領(lǐng)域。
      1 模塊整體方案及架構(gòu)
      語音識別的基本原理如圖1所示。語音識別包括兩個階段:訓(xùn)練和識別。不管是訓(xùn)練還是識別,都必須對輸入語音預(yù)處理和特征提取。訓(xùn)練階段所做的具體工作是通過用戶輸入若干次訓(xùn)練語音,經(jīng)過預(yù)處理和特征提取后得到特征矢量參數(shù),最后通過特征建模達(dá)到建立訓(xùn)練語音的參考模型庫的目的。而識別階段所做的主要工作是將輸入語音的特征矢量參數(shù)和參考模型庫中的參考模型進(jìn)行相似性度量比較,然后把相似性最高的輸入特征矢量作為識別結(jié)果輸出。這樣,最終就達(dá)到了語音識別的目的。
      
    '></center><br />
  現(xiàn)有的語音識別技術(shù)按照識別對象可以分為特定人識別和非特定人識別。特定人識別是指識別對象為專門的人,非特定人識別是指識別對象是針對大多數(shù)用戶,一般需要采集多個人的語音進(jìn)行錄音和訓(xùn)練,經(jīng)過學(xué)習(xí),達(dá)到較高的識別率。<br />
  基于現(xiàn)有技術(shù)開發(fā)嵌入式語音交互系統(tǒng),目前主要有兩種方式:一種是直接在嵌入式處理器中調(diào)用語音開發(fā)包;另一種是嵌入式處理器外圍擴(kuò)展語音芯片。第一種方法程序量大,計(jì)算復(fù)雜,需要占用大量的處理器資源,開發(fā)周期長;第二種方法相對簡單,只需要關(guān)注語音芯片的接口部分與微處理器相連,結(jié)構(gòu)簡單,搭建方便,微處理器的計(jì)算負(fù)擔(dān)大大降低,增強(qiáng)了可靠性,縮短了開發(fā)周期。<br />
  語音識別技術(shù)在國內(nèi)外的發(fā)展十分迅速。目前國內(nèi)在PC應(yīng)用領(lǐng)域,具有代表性的有:科大訊飛的InterReco2.0、中科模式識別的Pattek ASR3.0、捷通華聲的jASRv5.5;在嵌入式應(yīng)用領(lǐng)域,具有代表性的有:凌陽的SPCE061A、ICRoute的LD332X、上海華鎮(zhèn)電子的WS-117。<br />
  本文的語音識別方案是以嵌入式微處理器為核心,外圍加非特定人語音識別芯片及相關(guān)電路構(gòu)成。語音識別芯片選用ICRoute公司的LD33 20芯片。<br />
  <b>2 硬件電路設(shè)計(jì)</b><br />
  如圖2所示,硬件電路主要包括主控核心部分和語音識別部分。語音進(jìn)入語音識別部分后,將處理過的數(shù)據(jù)并行傳輸?shù)街骺刂破鳎骺刂破鹘?jīng)過處理后,發(fā)送命令數(shù)據(jù)到USART,USART可用于擴(kuò)展外圍串行設(shè)備,如語音合成模塊等。<br />
  <center><img src=單片機(jī)與嵌入式系統(tǒng)

    相關(guān)閱讀:

    分享到: 收藏

    專題

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 湖南省| 巴彦县| 芦溪县| 金溪县| 南丰县| 崇信县| 荥阳市| 永宁县| 固镇县| 梓潼县| 伊金霍洛旗| 锡林浩特市| 麻城市| 富宁县| 辽阳市| 岳阳市| 民乐县| 阿勒泰市| 盱眙县| 定远县| 临洮县| 宁化县| 万盛区| 白玉县| 富顺县| 新野县| 商丘市| 永安市| 浑源县| 伊宁县| 师宗县| 南雄市| 邹城市| 闸北区| 本溪| 武隆县| 齐齐哈尔市| 田阳县| 阜新市| 万载县| 山阳县| http://444 http://444 http://444 http://444 http://444 http://444