將音頻標準提高到新的水平
引言
要實(shí)現高質(zhì)量的視頻會(huì )議,產(chǎn)品的哪個(gè)方面的特性最重要?
多數人大概都會(huì )說(shuō)答案很簡(jiǎn)單-- 一流的視頻,然而情況并非如此。目前對于視頻會(huì )議的直觀(guān)效果來(lái)講,一流的音頻是最重要的,因為與會(huì )者之間重要信息的交流通常是通過(guò)對話(huà)和討論實(shí)現的。具備好的視頻和出色的音頻的系統比具備出色的視頻和好的音頻的系統要有用得多。幸運的是,寶利通
能向業(yè)界提供具備一流的音頻和視頻的產(chǎn)品,使客戶(hù)在購買(mǎi)視頻會(huì )議產(chǎn)品時(shí)可以輕松地作出選擇。難怪寶利通擁有一半以上的視頻會(huì )議產(chǎn)品市場(chǎng)。
寶利通 和所有視頻會(huì )議廠(chǎng)商面臨的一個(gè)挑戰是:如何實(shí)現一種音頻質(zhì)量,獲得如同與遠端與會(huì )者同在一個(gè)房間的效果。從最低要求上講,廠(chǎng)商都在盡量提供相當于傳統電話(huà)的話(huà)音質(zhì)量。只有寶利通的音頻質(zhì)量,能夠達到使遠端參與者如處一室的效果。而其他廠(chǎng)商提供的質(zhì)量要差得多,以至于沒(méi)人會(huì )相信他們與遠端處于同一地點(diǎn)。實(shí)際上,寶利通的許多競爭者提供的音頻質(zhì)量甚至還不如普通電話(huà)的質(zhì)量。如果口型與聲音的同步對用戶(hù)不是非常重要的話(huà),這些廠(chǎng)商的客戶(hù)最好關(guān)掉系統的音頻,拿起電話(huà)。
寶利通還利用它特有的音頻技術(shù)開(kāi)發(fā)了LimeLight。這是一種具有音頻自動(dòng)跟蹤功能的攝像裝置,可以自動(dòng)對準說(shuō)話(huà)人。這樣,當一個(gè)人開(kāi)始發(fā)言時(shí),不再需要手動(dòng)調整攝像機去對準他,從而減少了開(kāi)會(huì )時(shí)的麻煩。
為什么寶利通 能提供具有這樣高質(zhì)量音頻的產(chǎn)品,使它的競爭者黯然失色呢?我們將在下面幾個(gè)部分中找到答案。
音頻規范
確定人們處于同一房間里的音頻質(zhì)量的規范標準是什么?首先,人耳通常可以聽(tīng)見(jiàn)20Hz到20000Hz之間的頻率。語(yǔ)音信息一般包含在100~7000Hz的范圍內。音樂(lè )和其他聲音則通常涵蓋更寬的頻率范圍。舉例如下:
為了達到人耳的全部聽(tīng)力范圍,從而模擬正常環(huán)境中的聲音,視頻會(huì )議系統應該具有能再現20~20000Hz
范圍的能力。系統必須至少能處理到7kHz頻率,以提供出色的語(yǔ)音質(zhì)量,有時(shí)也稱(chēng)為FM質(zhì)量語(yǔ)音。要想達到電話(huà)的傳音質(zhì)量,系統必須能夠支持至少3.4kHz。
面對面會(huì )議的音頻還應具有流暢自然的特點(diǎn)。與會(huì )者不必擔心插話(huà)是否會(huì )引起回聲或聲音的中斷,以及自己所選擇的座位是否會(huì )影響聲音的收聽(tīng)效果。
為使會(huì )議可以有效地進(jìn)行,視頻會(huì )議系統同樣必須提供這種級別的交互性。全雙工技術(shù)允許自然的插話(huà),智能的麥克風(fēng)和自動(dòng)增益控制(AGC)技術(shù)使用戶(hù)可以隨處落座,并且講話(huà)又能被聽(tīng)見(jiàn)。
寶利通創(chuàng )新的、業(yè)界領(lǐng)先的方案
音頻壓縮和傳輸算法
為了提供最高質(zhì)量的音頻,寶利通的所有產(chǎn)品都可以在標準的、以及自己專(zhuān)有的技術(shù)下,提供7kHz、3.4kHz兩種音頻模式。這些算法是:
G.711 3.4kHz音頻標準,占用網(wǎng)絡(luò )56~64kbit/s
G.728 3.4kHz音頻標準,占用網(wǎng)絡(luò )16kbit/s
G.722 7kHz音頻標準,占用網(wǎng)絡(luò )48~64 kbit/s
PT724 寶利通 專(zhuān)有算法,可以提供7kHz 音頻,占用網(wǎng)絡(luò )24
kbit/s
PT716plus 寶利通 專(zhuān)有算法,可以提供7kHz
音頻,占用網(wǎng)絡(luò )16、24或32kbit/s
PT724使寶利通的客戶(hù)在與寶利通的其他客戶(hù)通信時(shí),可以在最多占用工業(yè)標準一半帶寬的情況下獲得7kHz的音頻。這樣,它在提供一流的音頻質(zhì)量的同時(shí),至少能將額外的24kbit/s分配給數據傳輸或用于改善視頻質(zhì)量。與使用48kbit/s提供7kHz音頻質(zhì)量的G.722(除寶利通以外的所有視頻會(huì )議廠(chǎng)商就是采用這種方法)相比,PT724具有以下優(yōu)勢:
省出的比特非常寶貴,它使數據的傳輸速度更快,或使寶利通領(lǐng)先業(yè)界的視頻質(zhì)量更好。
所有寶利通產(chǎn)品都包含PT724。PT724 應用于SG4 通信,以及寶利通設備之間的
H.320標準的通信(通常被稱(chēng)為H.320plus)。工業(yè)標準的音頻算法通常只應用于與非寶利通設備之間的操作。一些愿意犧牲保真度的客戶(hù)也可能選擇G.728,因為他們需要額外的8kbit/s
以滿(mǎn)足數據或視頻的高要求。
寶利通一直在不斷改進(jìn)語(yǔ)音壓縮技術(shù),發(fā)展了PT716plus。PT716plus只用16kbit/s
即可給出7kHz的音頻帶寬,從而可以再省下一個(gè)8kbit/s(與PT724相比)以用于改善視頻質(zhì)量。測試顯示PT716plus的音頻質(zhì)量與需用48kbit/s的ITU標準--G.722的質(zhì)量相同。
1999年9月,ITU最新推出的G.722.1標準,即是源自寶利通的PT716算法。G.722.1,能夠在24或32kbps速率下提供7kHz的音頻帶寬,是普通電話(huà)呼叫質(zhì)量的兩倍多,所用速率僅為先前標準的一半。
寶利通的競爭對手無(wú)一擁有專(zhuān)有的音頻算法。因此,他們的產(chǎn)品要么犧牲音頻質(zhì)量,要么需要更大的頻道帶寬。
拾音技術(shù)
寶利通以其真正創(chuàng )新的麥克風(fēng)拾音技術(shù)領(lǐng)導視頻會(huì )議業(yè)界。寶利通音頻研究組開(kāi)發(fā)的麥克風(fēng)技術(shù)將使寶利通產(chǎn)品在未來(lái)的許多年里一直處于音頻技術(shù)的前沿。該技術(shù)有助于在SG3、SG4、H.320或標準的聲音呼叫(例如,在Concord
上使用Voice Call 選項)時(shí),提供盡可能最佳的音頻質(zhì)量。
定向麥克風(fēng)
寶利通競爭對手提供的大多數視頻會(huì )議系統使用的是簡(jiǎn)易定向麥克風(fēng)。通常這些麥克風(fēng)的拾音范圍是+/-45度(從麥克風(fēng)前端的軸線(xiàn)測量)。這些麥克風(fēng)可以在7英尺(2.1米)的范圍內拾音。由于麥克風(fēng)的拾音范圍固定,所以任何拾音范圍之外的聲音都不會(huì )被聽(tīng)見(jiàn),而拾音范圍內的任何噪音源包括麥克上方的通氣孔都會(huì )被傳送到遠端。
對于那些小型會(huì )議,只要與會(huì )者位于拾音的有限范圍內,而噪音源又不在主要的拾音路徑上,那么用這種麥克風(fēng)技術(shù)也是可以的。但當這類(lèi)技術(shù)用于大型會(huì )議時(shí),與會(huì )者必須注意坐在麥克風(fēng)周?chē)囟ǖ奈恢茫谕ㄔ?huà)時(shí)移動(dòng)麥克風(fēng),或在房間內串聯(lián)上多個(gè)麥克風(fēng)。但是,如果系統不使用特殊的智能,串聯(lián)麥克風(fēng)將會(huì )導致雜音和回聲,而寶利通大多數競爭者沒(méi)有這樣的功能。
寶利通 的某些產(chǎn)品使用簡(jiǎn)易定向麥克風(fēng)。寶利通的桌面系統使用這種技術(shù),因為其成本低廉,而且多數用戶(hù)都位于桌面系統的7英尺和+/-45度的范圍內。
超級定向麥克風(fēng)陣列
超級定向麥克風(fēng)陣列是 SwiftSite產(chǎn)品的標準配置,安裝于系統內部。SwiftSite放置在電視監視器的頂部。超級定向麥克風(fēng)陣列由三個(gè)排成一條線(xiàn)的麥克風(fēng)組成,來(lái)自每個(gè)麥克風(fēng)的信號經(jīng)過(guò)處理和組合后,拾音以及降噪能力要遠遠好于單個(gè)定向麥克風(fēng)。使用這種陣列,再結合寶利通音頻研究組發(fā)明的一些非常復雜的處理手段,超級定向麥克風(fēng)陣列的拾音范圍可以達到10英尺(3米)內的+/-45度。該麥克風(fēng)技術(shù)還能在保持對說(shuō)話(huà)者最佳拾音效果的同時(shí),使噪音源方向的信號失效。因此,電扇和通風(fēng)口的背景噪音大大降低,而人們的說(shuō)話(huà)聲則既清晰又響亮。
超級定向麥克風(fēng)陣列是寶利通開(kāi)發(fā)的一項獨一無(wú)二的技術(shù),它使SwiftSite產(chǎn)品成為高集成的單一頂置盒裝置。在小房間里,即使桌子上沒(méi)有外接麥克風(fēng),也能達到高質(zhì)量的音頻效果。SwiftSite設備里超級定向麥克風(fēng)陣列的拾音范圍極其優(yōu)越,提供的拾音效果要比標準的定向麥克風(fēng)優(yōu)良得多。當然,如果房間比較大,SwiftSite的客戶(hù)可以選購PowerMic以獲得更好的拾音效果。
PowerMic
一種更為復雜的、名叫PowerMic的麥克風(fēng)是Venue Model 50和Concorde/System
4000ZX產(chǎn)品的標準配置。Venue Model 30 和SwiftSite 產(chǎn)品線(xiàn)也可以選擇配置它。
PowerMic是音頻領(lǐng)域的革命性成果。該技術(shù)的拾音范圍覆蓋7英尺內的360度,可以獲得麥克風(fēng)周?chē)乃新曇簟owerMic內置有4個(gè)麥克風(fēng),PowerMic通過(guò)對它們信號的合成,能提供可控制的拾音范圍。當有人開(kāi)始發(fā)言時(shí),麥克風(fēng)能夠智能地將拾音方向轉向前當發(fā)言者,在拾音布局方位發(fā)生變化時(shí)不會(huì )造成任何中斷。在大房間里,可以串聯(lián)多個(gè)PowerMic以提供更大的拾音范圍。由于寶利通音頻系統內有智能算法,串聯(lián)多個(gè)PowerMic不會(huì )像串聯(lián)一般定位麥克風(fēng)那樣帶來(lái)不良效果。
PowerMic的另一個(gè)主要優(yōu)點(diǎn)是它的拾音布局中有朝向天花板的靜音裝置。這有利于將空調通風(fēng)口的噪音從音頻拾音路徑中消除掉。一般的定位麥克風(fēng)沒(méi)有這種非常有用的性能。
因此, 使用PowerMic時(shí),人們可以在房間中隨處落座,而不必擔心自己的聲音會(huì )不會(huì )被漏掉。此外,它還有從音頻信號中消除雜音的好處,沒(méi)有任何競爭對手音頻拾音裝置可與它媲美。
音頻增強算法
除了能提供業(yè)界領(lǐng)先的音頻拾音技術(shù)外,寶利通還引入了幾種音頻增強算法,它們將有助于增強與遠端處于同一房間的真實(shí)感。這些算法包括:
IDEC 集成的動(dòng)態(tài)回聲消除器(以提供真正的全雙工音頻)
ANS 自動(dòng)噪音抑制(消除房間噪音)
AGC 自動(dòng)增益控制(使說(shuō)話(huà)的音量正常)
* IDEC
IDEC是寶利通音頻研究組目前最卓著(zhù)的成果。回聲是視頻會(huì )議和喇叭擴音器應用中最難解決的音頻問(wèn)題。如果遠端的聲音通過(guò)揚聲器進(jìn)入房間,然后被麥克風(fēng)接收,聲音將會(huì )傳回遠端。如果不采取任何措施,將會(huì )導致不小的回聲問(wèn)題。使用簡(jiǎn)單的回聲消除設備時(shí),在當遠端說(shuō)話(huà)的時(shí)候,近端的麥克風(fēng)被關(guān)掉。在有人插話(huà)或兩個(gè)人同時(shí)講話(huà)時(shí),這種半雙工方式會(huì )導致在某些系統中常會(huì )聽(tīng)到的中斷。這樣一來(lái),聲音不是自然的,不能再現面對面交談的聲音質(zhì)量,甚至還不如通過(guò)電話(huà)交談的聲音效果。
有了IDEC,真正的全雙工音頻得以實(shí)現,因此,插話(huà)和兩個(gè)人的同時(shí)講話(huà)不會(huì )造成普通揚聲器和視頻會(huì )議產(chǎn)品里的回聲和中斷。其他試圖靠粗劣模仿IDEC來(lái)取得全雙工音頻效果的揚聲器和視頻會(huì )議系統存在大量的中斷和回聲問(wèn)題,它們常常被叫做3/4雙工。
IDEC 為何這樣特別呢?簡(jiǎn)單地說(shuō),對于揚聲器、房間和本地麥克風(fēng)對從來(lái)自遠端的音頻信號的所有影響,IDEC都加以分析。隨后,IDEC建立一個(gè)極其復雜的房間模型,用它來(lái)預測本地麥克風(fēng)如何接收未來(lái)發(fā)自遠端的音頻信號。然后,從本地音頻里減去這些被預測到的信號,回聲就不會(huì )被傳送,從而實(shí)現沒(méi)有中斷的全雙工音頻。回聲因此被消除,本地的語(yǔ)音可以清晰而響亮地到達遠端。
IDEC不斷更新房間環(huán)境的模型,因此如果麥克風(fēng)移動(dòng)了或房間變樣,IDEC會(huì )迅速(在幾秒鐘內)進(jìn)行調整并繼續提供全雙工音頻。對于沒(méi)有調整能力、特別是那些在通信開(kāi)始需要靠傳送幾秒雜音進(jìn)行人工設置的同類(lèi)產(chǎn)品來(lái)說(shuō),IDEC
具備顯著(zhù)的優(yōu)勢。如果采用那些系統,移動(dòng)麥克風(fēng)、人們走動(dòng)或房間稍稍變樣都會(huì )大大影響回聲消除器的消音效果。
* ANS
ANS(自動(dòng)噪音抑制)是寶利通開(kāi)發(fā)的一種技術(shù),它可以降低聲音頻道里的噪音。ANS
算法能夠識別真正的聲音信號(例如語(yǔ)音)和由通風(fēng)口、風(fēng)扇等引起的背景噪音之間的不同。ANS借助它建立的噪音源模型,甚至可以在有說(shuō)話(huà)聲的情況下消除雜音。ANS能大大改善簡(jiǎn)易定位麥克風(fēng)的主觀(guān)質(zhì)量,在與PowerMic或超級定位麥克風(fēng)陣列共同用于大多數會(huì )議環(huán)境時(shí),幾乎沒(méi)有雜音。
寶利通許多競爭對手的系統沒(méi)有噪聲抑制,在背景音里總能聽(tīng)到嘶嘶聲。一些廠(chǎng)商試圖使用噪聲門(mén)限消除雜音,但當本地的音量低于設定的門(mén)限值時(shí),這種做法也把麥克風(fēng)關(guān)閉了。他們總是按噪音低于門(mén)限值而所有真正的聲音信號高于門(mén)限值來(lái)考慮,這種處理會(huì )導致一個(gè)人講話(huà)時(shí),如果有人輕敲桌子、關(guān)門(mén)或噪音量高于門(mén)限值時(shí),產(chǎn)生時(shí)強時(shí)弱的嘶嘶聲,其結果令人非常惱火。
* AGC
AGC(自動(dòng)增益控制)是另一種算法,它極大地改進(jìn)了寶利通產(chǎn)品的音頻拾音系統。AGC能智能地調節音量,使離麥克風(fēng)較遠的人的聲音聽(tīng)起來(lái)和離麥克風(fēng)較近的人的聲音一樣。AGC
借助尖端智能使耳語(yǔ)的音量低到不會(huì )被遠端的人聽(tīng)見(jiàn),使人們的大聲喊叫一如他們期望的那樣能夠有力地表達出自己的觀(guān)點(diǎn)。
AGC 可以放大離麥克風(fēng)12英尺(3.7米)內的說(shuō)話(huà)音量,有效地增加PowerMic、SwiftSite超級定向麥克風(fēng)和任何定向麥克風(fēng)的拾音半徑。
寶利通 競爭對手的AGC實(shí)現不像寶利通算法那樣完善。它們增加音量的能力有限,并且不知道具體該增加多少音量。
聲音的定位(LimeLight)
現在,大多數視頻會(huì )議進(jìn)行時(shí)都將可移動(dòng)的攝像機設置在固定位置。開(kāi)會(huì )者要么不愿或擔心要學(xué)習如何控制攝像系統,要么寧愿把注意力投向會(huì )議的主題。這種會(huì )議的畫(huà)面實(shí)際上是廣角鏡頭,喪失了視頻會(huì )議本應具有的面對面時(shí)的直接性和人際交流。最糟的時(shí)候,一些發(fā)言積極的與會(huì )者也許根本進(jìn)不到畫(huà)面中去。
LimeLight 是一種智能的自動(dòng)攝像機定位機械裝置。它通過(guò)使用麥克風(fēng)陣列和聲音信號處理來(lái)確定發(fā)言者的方位,然后參考一系列的內部規則決定向何處和如何移動(dòng)鏡頭;它控制主攝像機進(jìn)行搖、拉、推,將發(fā)言者收入畫(huà)面。采用LimeLight的會(huì )議不需要開(kāi)會(huì )者調整攝像機,相反,攝像機將在兩到三秒的采樣間隔后對準說(shuō)話(huà)人。以L(fǎng)imeLight為媒介的會(huì )議參加者反映當前發(fā)言者能夠被顯示,使會(huì )議體驗更加豐富。裝上LimeLight后,
不僅增加了顯示內容,還免去了大量人工控制攝像機的操作,從而使我們向自動(dòng)控制會(huì )議的目標邁進(jìn)了一步。
事實(shí)上,所有的視頻會(huì )議都能從LimeLight技術(shù)中受益,但受益最大的是那些包括兩個(gè)或兩個(gè)以上的參加者以及在大中型房間里進(jìn)行的會(huì )議。
LimeLight 的設計思想是按照人工操縱的方式移動(dòng)攝像機。基本設想是攝像機應該以適合會(huì )議發(fā)言活動(dòng)的方式進(jìn)行移動(dòng)。為達到這種效果,LimeLight系統能夠迅速、可靠并準確地確定房間里的說(shuō)話(huà)者位置,并根據這些信息決定否移動(dòng)攝像機、向何處以及如何移動(dòng)攝像機。LimeLight的所有此類(lèi)活動(dòng)進(jìn)行時(shí)不需要開(kāi)會(huì )者的介入。
LimeLight 的另一個(gè)特點(diǎn)是其攝像機的自動(dòng)定位模式與人工攝像控制模式結合得十分完美。使用者不管出于什么原因都可以要求打開(kāi)相應的人工攝像控制,或暫停、關(guān)閉和打開(kāi)LimeLight的自動(dòng)攝像定位功能。LimeLight
系統提供給用戶(hù)反饋,并清晰表明"自動(dòng)到手動(dòng)"對準模式的操作特性的改變。
具備LimeLight的寶利通系統比傳統的寶利通
手動(dòng)控制系統要容易使用,因此,LimeLight既能適用于該領(lǐng)域里業(yè)已使用的機動(dòng)攝像裝置系統,也能適合目前手動(dòng)控制的寶利通 VCS平臺。
拾音技術(shù)
寶利通以其真正創(chuàng )新的麥克風(fēng)拾音技術(shù)領(lǐng)導視頻會(huì )議業(yè)界。寶利通音頻研究組開(kāi)發(fā)的麥克風(fēng)技術(shù)將使寶利通產(chǎn)品在未來(lái)的許多年里一直處于音頻技術(shù)的前沿。該技術(shù)有助于在SG3、SG4、H.320或標準的聲音呼叫(例如,在Concord
上使用Voice Call 選項)時(shí),提供盡可能最佳的音頻質(zhì)量。
聲音再現
多年以來(lái),寶利通的集團視頻會(huì )議系統在再現聲音時(shí)用的都是電視監視器的揚聲器。但這些揚聲器通常再現語(yǔ)音的效果不是很好,而語(yǔ)音在視頻會(huì )議應用中是最常被傳送
的音頻信號。電視揚聲器一般用來(lái)進(jìn)行適當且低廉的全帶寬音頻再現,因此多數揚聲器常常聽(tīng)起來(lái)象廉價(jià)的內置式揚聲器。在視頻會(huì )議中,揚聲器最重要的要求是話(huà)音清晰。
就象家庭影院的廠(chǎng)商為節目和電影中的語(yǔ)音提供優(yōu)越的中央通道揚聲器,同樣,寶利通推出了能實(shí)現視頻會(huì )議最佳質(zhì)量語(yǔ)音再現的定制的高保真揚聲器。這種揚聲器由BOSE
和寶利通共同開(kāi)發(fā)而成,可以非常逼真地再現語(yǔ)音,忠實(shí)地再現深沉嗓音的低頻和改善語(yǔ)音清晰度及易懂度的高頻。該揚聲器尺寸雖小,但對80Hz(大多數人最低的聲音頻率)的響應曲線(xiàn)與對1kHz的響應曲線(xiàn)相差最多2dB。該揚聲器還可以與WorldCart
和SystemCart2000完美地結合。它是Venue Model 50和Concorde 的標準配置,其他產(chǎn)品可選用。
寶利通的完整解決方案
有了這些一流的音頻技術(shù),不難理解寶利通 為何會(huì )技壓群雄。沒(méi)有哪個(gè)廠(chǎng)商能夠提供與寶利通可堪媲美的音頻質(zhì)量--
一種與遠端如處一室的質(zhì)量。
視頻會(huì )議系統中的音頻測試指南
音頻測試最重要的規則是埋怨另一邊!如果你聽(tīng)見(jiàn)自己的揚聲器里傳出了回聲、雜音或失真,很可能你聽(tīng)到的是來(lái)自另一端的噪音,而不是來(lái)自你的房間里。下面是測試步驟:
(1)在視頻通信時(shí),在近端和遠端同時(shí)安置測試人員(非公司演示向導)。
(2)確保遠端和近端的房間沒(méi)有被墊上襯墊或經(jīng)過(guò)特殊處理,而是具備有硬質(zhì)墻面和空調等物的一般房間環(huán)境。
(3)讓遠端的人從麥克風(fēng)處后退幾步并輕聲說(shuō)話(huà),再讓遠端的人走到麥克風(fēng)后并輕聲說(shuō)話(huà)。仔細聽(tīng)話(huà)音的開(kāi)始或結束。仔細聽(tīng)消失又出現的背景雜音。測試時(shí)音頻聽(tīng)起來(lái)應十分自然。
(4)確保遠端和近端揚聲器的音量適當。讓遠端的人不斷地讀些東西。當遠端的人在閱讀時(shí),你自己也讀點(diǎn)東西。在該次雙重談話(huà)測試中,
兩邊的人都仔細聽(tīng)被中斷或失真的詞。優(yōu)良的回聲消除器在測試期間只會(huì )有微弱的失真。
(5)當你對著(zhù)遠端閱讀時(shí),讓遠端的人移動(dòng)麥克風(fēng)。看一看麥克風(fēng)移動(dòng)后,你的聲音的回聲要多久才能消失(回聲消除器的收斂時(shí)間)。優(yōu)良的回聲消除器只需幾秒即可進(jìn)行再次收斂。