mSwitch系統(tǒng)VoIP語音質量測量方法研究
2007/07/19
首先介紹了mSwitch系統(tǒng)當前對VoIP語音質量的監(jiān)控情況;然后就語音質量的衡量標準MOS進行了簡要描述;同時對現有的語音質量測量方法PSQM/PSQM+,PESQ,PAMS,E-Model的發(fā)展作了相關闡述;其中對E-Model方法進行了較為詳細的介紹;最后對mSwitch系統(tǒng)對VoIP語音質量的監(jiān)控提出了幾點展望。
1、mSwitch對VoIP語音質量的監(jiān)控現狀
在當前mSwitch系統(tǒng)中,對整個軟交換架構中的VoIP的語音質量的監(jiān)控,沒有采取任何的監(jiān)控手段和措施,僅僅做的就是在釋放每個同VoIP相關的呼叫后,要求媒體網關(MG)或者綜合接入設備(IAD)上報本次呼叫中如下統(tǒng)計信息:終結點呼叫連接的時長統(tǒng)計(nt/dur)、終結點呼叫連接發(fā)送的字節(jié)數統(tǒng)計(nt/os)、終結點呼叫連接接受的字節(jié)數統(tǒng)計(nt/or)、終結點呼叫連接發(fā)送的數據包統(tǒng)計(rtp/ps)、終結點呼叫連接中接受的數據包統(tǒng)計(rtp/pr)、終結點呼叫連接中的所丟失的數據包的統(tǒng)計(rtp/pl)、終結點呼叫連接中的抖動統(tǒng)計(rtp/jit)以及終結點呼叫連接中時延的統(tǒng)計(rtp/delay)。但是這些統(tǒng)計信息上報到CS-P之后,沒有作任何的分析和處理,也沒有保存。
因此,當前的整個軟交換的VoIP的語音質量對我們來說就是一個未知數;雖然在部署NGN網絡時,可以通過一些第三方公司的專業(yè)VoIP工具對整個軟交換的VoIP的語音質量進行評測,但是無法彌補mSwitch系統(tǒng)在對VoIP語音質量控制方面的缺陷,那就是當mSwitch系統(tǒng)監(jiān)測到整個系統(tǒng)的VoIP語音質量在明顯下降,并且下降到某個程度時,有必要采取適當地控制措施來盡力改善VoIP的通話語音質量。
下面就VoIP的語音質量的測量方法和實施進行介紹。
2、語音質量的度量標準——MOS
在介紹語音質量的測量方法之前,首先將對語音質量的度量標準MOS進行簡要介紹;VoIP呼叫質量會受噪聲、畸變、信號幅度過高或過低、回聲、通話間隙和許多其他問題的影響。在測量呼叫質量時,需要研究三類基本的服務質量:
(1)收聽質量——指用戶對呼叫過程中所聽到的聲音質量的評價。
(2)會話質量——指用戶在整個通話過程中基于收聽質量和會話能力而對呼叫作出的評價,包括回音和延遲等可能影響通話的相關問題。
(3)傳輸質量——指用于承載話音信號的網絡連接的質量。傳輸質量測量是與細節(jié)呼叫質量測量相對的一種網絡服務質量測量。
呼叫質量測量的目的是通過主觀或客觀的測量方法,即通過人為的測量項目或基于計算機的測量工具,對一種或多種以上的呼叫質量類別給出一個可信的估計。
主觀測量是一種久經考驗的話音質量測量方法,但這種方法成本太高,費時也太長。有一種更廣為人知的主觀類測量方法,叫做絕對種類定級(Absolute
Category Rating,ACR)測量。
在ACR測量中,收聽者按照從1~5的5級損傷指標對一系列音頻文件進行分級(見表1)。
在取得了每個收聽者給出的得分之后,計算所有音頻文件的一般或平均意見得分(Mean Opinion Score, MOS)。為了使ACR測量得到可信的測量結果,接受測量的人數至少應在16個以上,而且測量應該在一個安靜的環(huán)境下,在可控的條件下完成。這種測量方法定義在ITU-T
P.800當中,該MOS值就是語音質量的度量尺寸,顯然是MOS越大,語音質量越好。
3、語音質量測量方法的發(fā)展
上述IUT-T P.800中所定義的方法得到的MOS值是一種主觀的測量方法,并且該方法成本太高,費時太長;因此,在后來的研究和探索中,先后出現了如下幾種客觀測量方法:
- PSQM /PSQM+:Perceptual Speed Quality Measure,感知通話質量測量[2],定義在ITU-T
P.861當中;
- PESQ:Perceptual Evaluation of Speed Quality,感知評估通話質量測量[3],定義在ITU-T
P.862當中;
- PAMS:Perceptual Analysis Measurement System,感知分析測量,英國電信定義;
- E-Model:本文將重點介紹的測量方法,該方法定義在ITU-T G.107當中。
PSQM和PAMS測量方法都需要發(fā)送一個語音參考信號通過電話網絡,在網絡的另一端采用數字信號處理的方式比較樣本信號和接收到的信號,進而估算出網絡的語音質量。PESQ結合了PSQM和PAMS的優(yōu)勢,并針對MOS和MOS-LQ(Listening
Quality)計算方法做了修改。最開始這些方法被用于測量編碼算法和在實驗室分析設備問題,如分析電話機的語音質量;并且都是基于PSTN網絡,因此并不適合應用到VoIP網絡系統(tǒng)的語音測量。這些方法主要缺點體現在:
- 不是基于IP網絡的方法,不能反應IP網絡的衰減問題,如網絡傳輸中的Delay和Jitter和Packet Loss等問題;
- 不能說明End-to-End的網絡延遲,而其他過多的延遲因素影響到了MOS值;
- 只能輸出在任何時間內的某一方向的語音質量,不是真實通話中的雙向結果;
- 無法模擬多個或成百上千個重復同步的通話。
而在ITU-T G.107中定義的E-Model方法則很好地克服了上述問題,因此非常適合VoIP語音質量的測量。E-Model模型是歐洲電信標準協會(ETSI)開發(fā)的,本來用作電信網絡的傳輸規(guī)劃工具,但該模型也在VoIP服務質量測量中廣泛使用,在下面的章節(jié)中將對該模型進行詳細的介紹。
此外,有必要指出,平均主觀值MOS是廣泛認同的語音質量標準。因此,無論采用何種方法,所有測量方法所得到的結果都必須對應到最終的平均主觀值MOS。
4、VoIP語音質量測量方法——E-Model
E-Model是基于如下通話連接模型進行測量的(見圖1),其最終的測量結果就是得到R值(R Factor),被稱為全面的網絡傳輸等級要素,也就是說,確定包含話音通道的“由口至耳”特性的“R”因素。R因素的取值范圍為0~120,窄帶電話上R因素通常取50~94,而寬帶電話上R取值在50~110。R因素的值可以轉換為會話和收聽質量MOS得分(MOSCQ
and MOSLQ)的估計值。R值的計算從沒有網絡和設備的損傷影響開始,此時語音質量是最好的,R=R0。R0是無網絡延時和設備損傷因素的基本信號與收發(fā)噪聲以及電流、背景噪聲之比,即基本信噪比。但是因為網絡和設備損傷因素的存在,減少了通過網絡的語音質量,R值的基本計算公式如下:R=R0-Is-Id-Ie-eff+A。
其中,Is:與語音信號傳輸同步的損傷;Id:語音信號傳輸延時后的損傷;Ie-eff:由設備引入的損傷,例如編碼器損傷;A:優(yōu)勢因素,致力于考慮呼叫者的期望因素,在大部分情況下,一般設置為0,但是對于移動用戶,因為移動的便利而能容忍低質量的語音質量,所以該值可以大于0。在G.107中,就基本公式中的各個值的計算(A除外)都提供了復雜的計算公式,并且涉及到20個參數值,具體的計算公式這里就不一一介紹了,具體可以參考ITU-T
G.107。
通過對涉及參數和通話連接模型的對照,可以發(fā)現大部分參數都是對通話設備(話機)和通話環(huán)境的要求,如參數Ds、Dr是對發(fā)話端和收話端的話機噪音值的評估因子;SLR,RLR,STMR,LSTR是對發(fā)話端和收話端聲音響度相關的評估;TELR,WEPL是對通話中的回聲相關進行評估的因子;Nc是對通話中的電路噪音進行評估的因子;Nfor是對收話端的噪音背景的評估;Ps和Pr是對發(fā)話端和收話端的空間噪音的考慮因素;而這些因素對于評估測量VoIP的語音質量是沒有太大的意義,因為這些因素同IP連接和傳輸沒有直接的聯系,并且這些參數在每次的VoIP通話當中也無法直接獲取,而同VoIP相關的幾個參數(T,Tr,Ta,qdu,Ie,Bpl,Ppl)是同如下幾個因素有著直接的聯系,下面就這幾個因素進行介紹。
(1)Codec:通話中采用的編解碼方式,這是以硬件或者軟件的方式采樣模擬語音,決定了語音數據包的傳輸速率。在ITU的標準中,G.711u/G.711a是一種高質量的無壓縮的編解碼方式,但是占用相當大的帶寬;而其他的低速率的編解碼方式,如G.726/G.729等系統(tǒng),占用的帶寬比較小,但是使用了容易損失的壓縮算法,削弱了語音的傳輸質量;而在實際的應用中,低速率的Codec能夠在相同的帶寬下接入更多的呼叫連接,但是又導致了更大的網絡延遲(對參數T,Ta,qdu存在著間接的影響),并且對網絡丟包更加敏感。Codec的選擇對E-Model中的R值有著明顯的影響,直接反應是對在Ie參數上,在ITU-T的標準中,有G.113的Appendix
I就Codec和Ie的關系作了推薦,可以作為計算R值的參考。
(2)網絡延遲:網絡延遲將引起語音會話過程的空白,帶來語音的變形和會話的中斷。E-Model關注的是End-to-End的網絡延遲。在實際應用中,一般是如下幾個方面而導致了網絡延遲:傳播延時:取決于傳播的介質和距離;傳輸延時:傳輸過程中在網絡設備上所用時間;打包解包延時:用采用的Codec進行數模轉換的時間,不同的Codec所導致的延時是不一樣的,但是對于同一種Codec,其延時基本是固定的;抖動緩沖延時:在作用在接受端,為保持住一個或多個接收的數據包,克服網絡抖動的影響。網絡延遲將直接反應在參數T,Tr,Ta上面。
(3)網絡抖動:網絡抖動就是網絡延時的變化,當網絡抖動值大于50ms時,MOS值將急劇下降;但是在ITU-T G.107中,是這樣說的:“抖動對語音傳輸質量的影響還在作進一步的研究,目前沒有包含在E-Model的算法中”。但是通過在接收端增加抖動緩沖的量,則可以有效地降低抖動的影響,但是卻增加了網絡延時。
(4)網絡丟包:網絡丟包是影響語音質量和MOS值的關鍵因素,存在兩種類型的丟包:隨機丟包(Random Loss):這是隨機產生的丟包,如果量小,對語音質量影響小;連續(xù)丟包(Burst
Loss):這是指連續(xù)一個以上的數據包的丟失,這對語音質量的影響是明顯的。因此對丟包作有效的監(jiān)測是非常有必要的,并且在ITU-T的標準中,其G.113的Appendix
I中就Codec的選擇所導致的Bpl作了映射,可以作為計算R值的參考。當某種Codec采用適當的丟包補償技術也能夠降低丟包對VoIP語音質量的影響,并優(yōu)化了語音質量。
最終通過E-Model得到的R值,通過ITU-T G.107中的Appendix B的計算公式,可以得到如下的一種關系表(見圖2)。其中:GoB(Good
or Bad),PoW(Poor or Worse)。
如果平均主觀值MOS為4或更高,被認為是比較好的語音質量,而若平均主觀值MOS低于3.6,則大部分接聽者不能滿意這個語音質量了。因此,當軟交換系統(tǒng)系統(tǒng)監(jiān)測到VoIP的通話語音質量的R值處于70以下的時候,則需要采取一些適當的措施來改善語音質量了。
5、運用E-Model在mSwitch系統(tǒng)中對VoIP語音質量測量的研究
在當前的軟交換架構mSwitch系統(tǒng)中,可以稱之為VoIP的呼叫可以劃分為如下兩類:
(1)第一類是需要向軟交換系統(tǒng)的媒體網關(MG)申請IP資源的呼叫。這類呼叫有如下幾種情況:終端都是IP,但是需要媒體網關作IP Relay,SIP到SIP,MGCP到MGCP,H323到H323,中間需要媒體網關作IP中繼;一側終端是IP,一側是非IP終端,如SIP到V5電話、MGCP到PHS等;通話雙方都是非IP終端,但是通話連接跨媒體網關了,如MG1上的PHS用戶同MG2上的PHS用戶通話等。
(2)第二類就是不需要向軟交換系統(tǒng)的媒體網關申請IP資源的呼叫。這類情況如IP終端到IP終端的End-to-End連接模式。
對于第二類情況,語音質量需要的相關參數有各種協議處理方式不一樣,如MGCP協議可以獲取,SIP和H323則沒有獲取,這里就不作討論。
針對第一類的連接通話情況,可以用建立如下的通話連接模型,如圖3所示。該圖是整個軟交換系統(tǒng)的簡化圖,具體的細節(jié)沒有描述。
基于該連接模型,對于每次的VoIP通話,CS-P可以從MG獲取如下的相關信息:終結點呼叫連接采用的Codec(忽略了Codec動態(tài)改變的情況),呼叫連接的時長統(tǒng)計(nt/dur)、呼叫連接發(fā)送的字節(jié)數統(tǒng)計(nt/os)、呼叫連接接受的字節(jié)數統(tǒng)計(nt/or)、呼叫連接發(fā)送的數據包統(tǒng)計(rtp/ps)、呼叫連接中接受的數據包統(tǒng)計(rtp/pr)、呼叫連接中的所丟失的數據包的統(tǒng)計(rtp/pl)、呼叫連接中的抖動統(tǒng)計(rtp/jit)以及呼叫連接中時延的統(tǒng)計(rtp/delay)。從這些信息中,可以獲取到計算R值所需要的參數(見表2)。
而對于其他的參數,由于CS-P系統(tǒng)來計算每次VoIP的通話質量時,要獲取各種真正的通話現場環(huán)境參數和話機相關的參數是不現實的,因此,這些參數值可以采用參考ITU-T
G.107中Table 2中的參考值。
因此,在mSwitch系統(tǒng)中,可以使用E-Model通過如下的步驟來獲取每次VoIP通話的語音質量的R值和MOS值,具體計算公式參考ITU-T
G.107。
第一步:確定相關參數,計算基本信噪比R0(使用的都是ITU-T G.107中Table 2中的參考值);第二步:確定相關參數,計算語音同步損傷因子Is(使用的都是ITU-T
G.107中Table 2中的參考值);第三步:確定相關參數,計算語音延時損傷因子Id(qdu使用的都是ITU-T G.107中Table 2中的參考值);第四步:確定相關參數,算計語音設備損傷因子Ie-eff(根據Codec對照ITU-T
G.113 Appendix I,找到合適的Ie和Bpl值);第五步:根據終端類型,確定A值;第六步:計算R值,根據R和MOS的對照關系表,得到MOS值。
使用E-Model測量VoIP的語音質量,可以準確地建立包丟失分布和最終用戶感覺模型,將包丟失分布與編碼器和時延等建立關系,以便給出一個單一的得分,該方法在數據網絡中進行語音質量評估具有相當的準確度。
6、結束語
但是,需要看到的是:正如ITU-T G.107規(guī)范開頭所述“這樣的評估僅用于傳輸設計的目的,并非為了實際用戶評價預測(因為還沒有ITU-T建議的統(tǒng)一的模型)。”E-Model相當大數量的可能輸入參數的組合情況還未經過足夠的界內驗證和充分的實驗室測量。許多對于傳輸設計具有高重要度的參數組合情況,E-Model已經可以被確信應用,但是對于其它的一些研究未涉及或不成熟的參數組合情況,E-Model的估測仍處在置疑和研究的階段。
對于軟交換設備mSwitch系在VoIP方面的理想情況,應該做到如下幾種情況:
- CS-P能收集每個同IP相關的呼叫的相關統(tǒng)計值,如抖動時間、延遲時間、丟報率等,并進行統(tǒng)計和計算,得出相關的R值和MOS值,作為整個CS-P的VoIP的語音質量參考依據;
- CS-P能提供丟報率的告警提示以及語音質量下降的告警提示;
- CS-P能根據計算出來的MOS值,對相應的VoIP呼叫進行相關的調整和控制,如控制媒體網關選擇合適的語音壓縮算法,或者提供語音包緩存區(qū)的大小以減少抖動對語音質量帶來的影響。
電信網技術
相關鏈接:
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩
工布江达县|
天气|
咸宁市|
大庆市|
海安县|
贡山|
睢宁县|
巴南区|
金山区|
红原县|
石狮市|
株洲县|
吉首市|
潢川县|
当涂县|
神农架林区|
蓬莱市|
盐亭县|
惠东县|
阿巴嘎旗|
井冈山市|
呼玛县|
三江|
双柏县|
金门县|
潞西市|
宁津县|
沈阳市|
荥经县|
林西县|
沙湾县|
东台市|
高台县|
云浮市|
沧州市|
永安市|
东平县|
浠水县|
绥阳县|
随州市|
明水县|
http://444
http://444
http://444
http://444
http://444
http://444