一、視頻編碼MPEG4、H263和H264
1. MPEG4與MPEG1、MPEG2的比較
MPEG 系列標準的基本參數 | ||||
標準 |
幅面 |
幀率 |
帶寬 |
應用領域 |
MPEG-1 |
352x24 或 320x240 |
24-30 fps |
1.5 Mbps |
Video CD, CD-ROM |
MPEG-2 |
720x24 或 640x480 |
24-30 fps |
4-8 Mbps |
DTV,HDTV,DVD-Video |
MPEG-4 |
34x48 ~ 4096x4096 |
1-30+fps |
10Kbps~10Mbps |
互聯網及無線傳輸,交互式電視 |
從上表可以看出,MPEG1和MPEG2主要應用于固定媒體,比如 VCD 和 DVD ,而對于網絡傳輸,MPEG4具有無可比擬的優勢。
2. H.263、H.264系列標準介紹
H.263是國際電聯ITU-T的一個標準草案,是為低碼流通信而設計的。但實際上這個標準可用在很寬的碼流范圍,而非只用于低碼流應用,它在許多應用中可以認為被用于取代H.261。H.263的編碼算法與H.261一樣,但做了一些改善和改變,以提高性能和糾錯能力。H.263標準在低碼率下能夠提供比H.261更好的圖像效果,兩者的區別有:(1)H.263的運動補償使用半象素精度,而H.261則用全象素精度和循環濾波;(2)數據流層次結構的某些部分在H.263中是可選的,使得編解碼可以配置成更低的數據率或更好的糾錯能力;(3)H.263 包含四個可協商的選項以改善性能;(4)H.263采用無限制的運動向量以及基于語法的算術編碼;(5)采用事先預測和與MPEG中的P-B幀一樣的幀預測方法;(6)H.263支持5種分辨率,即除了支持H.261中所支持的QCIF和CIF外,還支持SQCIF、4CIF和16CIF,SQCIF相當于QCIF一半的分辨率,而4CIF和16CIF分別為CIF的4倍和16倍。H.263已經基本上取代了H.261。
H.264是ITU-T的VCEG(視頻編碼專家組)和ISO/IEC的MPEG(活動圖像編碼專家組)的聯合視頻組(JVT:joint video team)開發的一個新的數字視頻編碼標準,它既是ITU-T的H.264,又是ISO/IEC的MPEG-4的第10 部分。
H.264和以前的標準一樣,也是DPCM加變換編碼的混合編碼模式。但它采用“回歸基本”的簡潔設計,不用眾多的選項,獲得比H.263++好得多的壓縮性能;加強了對各種信道的適應能力,采用“網絡友好”的結構和語法,有利于對誤碼和丟包的處理;應用目標范圍較寬,以滿足不同速率、不同解析度以及不同傳輸(存儲)場合的需求。
在技術上,H.264標準中有多個閃光之處,如統一的VLC符號編碼,高精度、多模式的位移估計,基于4×4塊的整數變換、分層的編碼語法等。這些措施使得H.264算法具有很的高編碼效率,在相同的重建圖像質量下,能夠比H.263節約50%左右的碼率。H.264的碼流結構網絡適應性強,增加了差錯恢復能力,能夠很好地適應IP和無線網絡的應用。
3.為什么使用 H264標準用作視頻壓縮
分層設計
視頻編碼層具有高效的視頻內容表示功能;
網絡提取層將網絡中所需要的數據進行打包和傳送;
高精度、多模式運動設計
支持1/4或1/8像素精度的運動矢量;
多模式的靈活和細致的劃分,大提高了運動估計的精確程度;
幀內預測功能
在空間域進行預測編碼算法,以便取得更有效的壓縮:
4×4塊的整數變換
由于用二變換塊的尺寸縮小,運動物體的劃分更精確,這樣,不但變換計算量比較小,而且在運動物體邊緣處的銜接誤疾差也大為減小:
為了提高碼率控制的能力,量化步長的變化的幅度控制在125%左右,而不是以不變的增幅變化。為了強調彩色的逼真性,對色度系數采用了較小量化步長;
統一的VLC
為快速再同步而經過優化的,可以有效防止誤碼。
4.視頻壓縮算法的發展方向
隨著網絡技術的不斷發展,MPEG4的應用也越來越普遍,H264已經無可爭議地成為了視頻產品壓縮算法的發展方向。
二、音頻編碼G.723.1
1.國際電信聯盟G系列典型語音壓縮標準的參數比較
算法 |
類型 |
碼率(kbit/s) |
算法延時(ms) |
G.711 |
A-Law / μ -Law |
64 |
0 |
G.722 |
SB-ADPCM |
64/56/48 |
0 |
G.723.1 |
MP-MLQ/ACELP |
6.3/5.3 |
37.5 |
G.726 |
ADPCM |
16/24/32/40 |
0 |
G.727 |
Embedded ADPCM |
16/24/32/40 |
0 |
G.728 |
LD-CELP |
16 |
< 2 |
G.729 |
CS-ACELP |
8 |
15 |
2. G.723.1 壓縮后的語音質量
在國際標準中,統一使用 MOS(Mean Opinion Score)方法評價語音壓縮后的質量。在MOS方法中,電話語音質量的標準定為4分。也就是說,如果一種算法將語音壓縮后,MOS 值能達到4分,即說明其語音質量和電話質量等同,用戶無法分辨出其中的區別。
對于DX4000系統,G.723.1壓縮后語音質量的MOS評測值是3.98(Source: DSP Group Inc., http://www.dspg.com ),即非常接近電話質量。
3.為什么使用G.723.1標準用作音頻壓縮
壓縮率高:G.723.1算法將語音壓縮到6.3Kbps,在同類壓縮算法中壓縮率是最高的。
語音質量好:G.723.1算法壓縮后的語音質量MOS值為3.98分,對于一般沒有受過專門訓練的耳朵,已經無法區分出語音是否經過壓縮。這樣的語音質量完全可以滿足網絡視頻會議的需求。