• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
     首頁 > 技術 > 技術文摘 > 讓視頻會議多一些人工智能

    讓視頻會議多一些人工智能

    2008-05-28 00:00:00   作者:   來源:   評論:0 點擊:



      說話人的聲音不能被清楚地收音,會議雙方聽不到對方的聲音,產(chǎn)生回音或者斷續(xù)音現(xiàn)象從而使與會雙方無法互相理解……即使現(xiàn)在使用視頻會議系統(tǒng)時,我們?nèi)猿S龅竭@樣的問題。如何盡可能逼真地遠程再現(xiàn)會議環(huán)境的聲音和圖像,給人以身臨其境之感,一直是聲音處理領域的頭等課題。
      在視頻會議產(chǎn)品領域,中國產(chǎn)品重視視頻編解碼與聲音處理技術,歐美產(chǎn)品更著重軟硬件設備、管理套件以及與統(tǒng)一通信架構融合的研究,而日本的產(chǎn)品則堅持其一貫的技術分工精細的主張:索尼在顯示器領域深耕,雅馬哈則在音頻處理領域細作。
      日前,日本雅馬哈在中國推動PJP(Projectphone)網(wǎng)絡會議系列產(chǎn)品巡展,試圖為該領域引入另一種完全不同的技術解決思路。通過本報記者對日本雅馬哈株式會社Sound Network事業(yè)部長田丸卓也、雅馬哈中國網(wǎng)絡會議系列產(chǎn)品技術總監(jiān)谷田的專訪,以下問題將得到解答:雅馬哈會采用哪些技術解決目前聲音傳輸?shù)蔫Υ茫⑤o助視頻功能?視頻會議中惱人的回聲與吞字現(xiàn)象如何得到解決?會議中重要的錄音功能,該如何設計?如何以人工智能的思路來設計網(wǎng)絡與視頻會議產(chǎn)品,最終使這一計算機科技成果貼近自然、符合人類習慣?
      讓機器學會尋聲辨人
      據(jù)谷田介紹,如何將新型視頻會議系統(tǒng)擬人化,以貼近人工智能需求,是雅馬哈PJP系列倡導的最新網(wǎng)絡會議技術理念。這些理念將通過瞬間呈現(xiàn)技術、聲音非增幅音響設計、內(nèi)置適應型回聲消除器等一系列技術得以體現(xiàn)。
      假如甲地和乙地一起舉行遠程視頻會議,甲地人員如何清楚確定乙地哪位與會者正在發(fā)言(視頻追蹤)十分重要。在處理這一問題上,思科、北電—寶利通采取的措施霸氣十足:打造一個30萬美元以上的網(wǎng)真會議室,租用超寬帶寬傳輸聲音和圖像,用超大電視墻1∶1地還原場景和參會者;而蘇州科達等國內(nèi)企業(yè)的做法相對經(jīng)濟實惠:用甲地員工手中的遙控器去控制乙地會議室攝像頭的轉(zhuǎn)動和焦距調(diào)節(jié),尋找小顯示屏幕一次裝不下的參會者或給出特寫鏡頭。總體來說,這兩種做法都使用的是“尋聲辨人”的方式,但用的是人眼搜索。
      雅馬哈給這一問題增加了一條技術解決路徑,那就是使攝像頭學會尋聲辨人。谷田向記者介紹道:“不要忽略人類都是‘尋聲望去’這一聽覺的天性,在視頻會議系統(tǒng)中,視頻顯示與聲音的處理技術其實是密不可分的。以PJP-300V這款攝像頭、麥克風、揚聲器一體機為例,它可以實現(xiàn)說話人瞬間顯示的功能。即使使用普通液晶屏幕,會議發(fā)言人的特寫和聲音也能瞬間呈現(xiàn)。”這項技術的實現(xiàn),依靠的是在PJP-300V上面配列16個麥克風陣列,可以自動判別說話人的位置;通過說話人的位置信息和3個攝像機的切換、聯(lián)動,使說話人可以瞬間在屏幕上顯示出來。這項技術不需要攝像頭的切換動作,保證了會議順暢進行。同時這項瞬間呈現(xiàn)技術,在桌面型VoIP電話中也可以應用,使音頻會議呈現(xiàn)立體感,實現(xiàn)與語話者座位的匹配。
      回聲與吞字現(xiàn)象的消除
      聲音從會議系統(tǒng)的揚聲器中播放,又回到麥克風的時候,容易產(chǎn)生回音。會議過程中,異地雙方進行激烈的快語速交談時,往往會出現(xiàn)“吞字”的現(xiàn)象,即首句的末字與后句的首字會發(fā)生重疊和消音。當會議變成多地、多人同時發(fā)言的時候,這種情況將更糟。
      針對這些問題,谷田介紹了雅馬哈成功應用于產(chǎn)品中的基于參照人類講話方式設計的兩種技術。第一,使用適應型回聲消除器消除回音。什么是適應型回聲消除器?谷田解釋道,就是系統(tǒng)可以自動學習周圍音場環(huán)境和旋繞余音,并算出濾波系數(shù),從而使用戶不必依房間類型選擇不同的產(chǎn)品,節(jié)省了重復購置產(chǎn)品的成本。第二,據(jù)點語音分隔模式可以幫助我們解決吞字的難題。雅馬哈PJP-100H形狀窄長,具有12個揚聲器和16個麥克風,沒有MCU時,最多可以連接8個據(jù)點的音頻會議。“在使用它進行多地點會議的時候,讓各地點的聲音從揚聲器的不同方向傳送至與會者,聲音不會混雜,不但能清楚地收聽,而且能簡單地識別出是哪個連接地點的發(fā)言。”
      只收錄需要的聲音
      谷田表示,如何讓機器學會只錄取特定人和特定聲音是視頻會議音頻處理技術的重要研究方向,也是雅馬哈人工智能理念的體現(xiàn)。
      首先,在網(wǎng)絡或視頻會議進行的過程中,如果在開放空間或者有來自投影儀等雜音源的場所,如何識別音源的位置是對視頻會議產(chǎn)品與技術的一個挑戰(zhàn)。
      面對這個挑戰(zhàn),雅馬哈采取的對策是,使會議用傳聲揚聲器可以根據(jù)場面的不同而采取不同的收音模式。該揚聲器中的麥克風陣列可以識別音源的位置,只收錄說話人的聲音,并清楚地傳達給對方。具體到具備了這樣功能的PJP-100H上,它擁有三種特定模式:第一,區(qū)域模式:最適合在安靜環(huán)境下的會議,在場所有人的聲音都可被錄入;第二,點式模式:可收錄特定方向上的聲音;第三:追蹤模式,設備可以自動追蹤發(fā)言人的聲音。
      其次,視頻會議系統(tǒng)通常會面臨出差員工從外地接入,參加會議這樣的情況,臨時會議錄音功能非常重要。市場上現(xiàn)有的產(chǎn)品一般的解決思路是靠一臺筆記本電腦、軟件外加耳麥,組成臨時的視頻會議端點。但是,長時間使用耳麥容易造成疲勞,也不利于兩位以上的出差員工同時參與。因此,雅馬哈研制了一系列輕巧、便于攜帶的Web會議用傳聲揚聲器,采用USB供電的方式,供連接筆記本電腦使用。
      針對此類產(chǎn)品,谷田如此描述他們的技術設計思路:這類小型揚聲器具備和個人電腦、音樂播放器連接,以增強其使用率;但更重要的是,不能忽略其傳聲和會議錄音的功能,只錄最需要的聲音。在一次對此類產(chǎn)品PJP-25UR的體驗中,記者一邊利用揚聲器大聲播放電腦中的音樂,同時利用揚聲器錄音現(xiàn)場的對話。最后播放錄音,里面只能聽到記者說話的聲音,完全沒有音樂等雜聲。田丸卓也表示,這是通過對揚聲器和軟件的設定實現(xiàn)的。
      多終端自由接入會議
      在企業(yè)辦公自動化朝統(tǒng)一通信發(fā)展的大趨勢下,視頻會議應該要考慮到“無處不在”的接入特性。谷田告訴記者,多種多樣的連接終端可以使與會者成功應對各種場面,雅馬哈的設計理念是在產(chǎn)品中配置3個端口:LAN連接、模擬電話線、與PC連接的AUDIO(IN/OUT)。這一理念使得手機、固定電話、PC、筆記本電腦都可穩(wěn)定用聲音加入IP音頻會議、Web會議或者視頻會議系統(tǒng)。
      日本雅馬哈株式會社Sound Network事業(yè)部長田丸卓也:“寶利通在中國市場會出現(xiàn)一個新的競爭者——雅馬哈。”
      雅馬哈中國網(wǎng)絡會議系列產(chǎn)品技術總監(jiān)谷田:“使會議系統(tǒng)更逼真地滿足人工智能需求,是網(wǎng)絡會議技術未來的發(fā)展方向。”
      VoIP技術支持模塊
      為了在IP網(wǎng)絡中實現(xiàn)語音傳輸并保證一定的服務質(zhì)量,基于IP的語音傳輸系統(tǒng)中通常包含有以下的技術支持模塊。
      信令模塊
      信令是順利實現(xiàn)電話呼叫和保證話音質(zhì)量的重要技術前提,目前被廣泛接受的IP語音傳輸控制信令體系包括ITU-T的H.323系列和IETF的會話初始化協(xié)議SIP。
      編碼模塊
      話音壓縮編碼技術是IP語音傳輸技術的一個重要組成部分。目前,主要的編碼技術有ITU-T定義的G.729、G.723(G.723.1)等。
      QoS保障模塊
      IP語音傳輸業(yè)務的QoS保障技術是當前業(yè)界探討最多的話題,IETF建議了數(shù)種支持QoS的技術解決方案,主要有:綜合服務(Int-serv)/資源預留協(xié)議(RSVP)、區(qū)分服務(DiffServ)、多協(xié)議標簽交換(MPLS)、業(yè)務流量工程(Traffic Engineering)等。

    中計報(www.ccidnet.com)

    相關閱讀:

    分享到: 收藏

    專題

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 贵南县| 吉首市| 江西省| 伊吾县| 肥东县| 佛山市| 皮山县| 石棉县| 泸定县| 桂平市| 内黄县| 寿宁县| 镶黄旗| 吴忠市| 靖西县| 上杭县| 万全县| 靖远县| 都江堰市| 青海省| 双柏县| 江源县| 防城港市| 伊金霍洛旗| 桂林市| 环江| 苍南县| 雅安市| 琼中| 贺兰县| 姚安县| 博罗县| 旺苍县| 南木林县| 朝阳区| 开鲁县| 华安县| 郁南县| 方正县| 稷山县| 安塞县| http://444 http://444 http://444 http://444 http://444 http://444