体数据压缩编码标准.ppt-得力文库

资源描述

《体数据压缩编码标准.ppt》由会员分享，可在线阅读，更多相关《体数据压缩编码标准.ppt（123页珍藏版）》请在得力文库 - 分享文档赚钱的网站上搜索。

1、第4讲多媒体数据压缩编码标准14.1静态图像压缩标准JPEG 24.1.1JPEG标准的主要内容 nISO/IEC10918号标准“多灰度连续色调静态图像压缩编码”即JPEG标准，选定ADCT作为静态图像压缩的标准化算法。n该标准为保证通用性，包含以下两种方式：n空间方式可逆编码空间方式对于基本系统和扩展系统来说，被称为独立功能。nDCT方式非可逆编码，包含基本系统(必须保证的功能)和扩展系统(扩充功能)3 n基本系统是实现DCT编码与解码所需的最小功能集，大多数的应用系统只要用此标准，就能基本上满足要求。n扩展系统是为了满足更为广阔领域的应用要求而设置的。44.1.2JPEG静态图像压缩算

2、法 1.基于DPCM的无失真编码预测器熵编码器表说明无失真编码器源图像数据压缩图像数据图1无失真编码简化框图5n基于DPCM的无失真编码优点是硬件易实现，重建图像质量好。n缺点是压缩比太低，大约为2：1。6n工作原理是对X的预测值X，将X-X进行无失真熵编码。对X的求法见图给出的预测方式。cbax选择值选择值预测预测选择值选择值预测预测 0 1 2 3非预测 a b c 4 5 6 7a+b-ca+(b-c)/2b+(a-c)/2(a+b)/2(a)X邻域(b)预测方式图2预测器72.基于DCT的有失真压缩编码 n离散余弦变换n量化处理nDC系数的编码和AC系数的行程编码n熵编码8图3基于D

3、CT编码过程FDCT熵编码器表说明无失真编码器源图像数据压缩图像数据量化器表说明88块（YUV每个分量）9图4解码过程熵解码器IDCT表说明解码器逆量化器表说明88块压缩图像数据恢复的图像数据10离散余弦变换(1)首先把原始图像顺序分割成88子块；(2)采样精度为P位(二进制)，把0，2P-1范围的无符号数变换成-2P-1，2P-1范围的有符号数，作为离散余弦正变换(FDCT)的输入；(3)在输出端经离散余弦逆变换(IDCT)后又得到一系列88子块，需将数值范围-2P-1，2P-1变换回0，2P-1来重构图像。11n这里用的88FDCT的数学定义为：F(u，v)=(1/4)C(u)C(v)x=

4、07y=07 f(x，y)cos(2x+1)u/16)cos(2y+1)v/16)n88IDCT的数学定义为：f(x，y)=(1/4)u=07v=07C(u)C(v)F(u，v)cos(2x+1)u/16)cos(2y+1)v/16)其中：C(u)，C(v)=1/2 当u，v=0 C(u)，C(v)=1 其他n下面的编码针对FDCT输出的64个基信号的幅值(F(0，0)，F(7，7)称作DCT系数)来进行 12量化处理 n量化是一个“多到一”的过程，失真原因n关键是找最小量化失真的量化器，JPEG采用线性均匀量化器，定义为对64个DCT系数除以量化步长，然后四舍五入取整：FQ(u，v)=Int

5、egerRoundF(u，v)/Q(u，v)nQ(u，v)是量化器步长，它是量化表的元素。量化表元素随DCT系数的位置和彩色分量不同有不同的值，量化表尺寸为88与64个变换系数一一对应。n这个量化表应由用户规定(JPEG给出参考值-见后面表格)，并作为编码器的一个输入。131611101624405161121214192658605514131624405769561417222951878062182237566810910377243555648110411392496478871031211201017292959811210010399表1亮度量化表14 17182447999999

6、991821266699999999242656999999999947669999999999999999999999999999999999999999999999999999999999999999999999999999表2色度量化表15 n量化的作用是在一定主观保真度图像质量前提下，丢掉那些对视觉影响不大的信息，通过量化可调节数据压缩比。16 DC系数的编码 n64个变换系数经量化后，坐标u=v=0的F(0，0)称DC系数(直流分量)，它即64个空域图像采样值的平均值。n相邻88块之间DC系数有强相关性。JPEG对量化后的DC系数采用DPCM编码，即对DIFF=DCi-DCi-1编码

7、。blocki-1blockiDCi-1DCiDC系数差分编码17AC系数的行程编码 n其余63个交流系数(AC)采用行程编码。n从左上方AC0，1开始沿对角线方向“Z”字形扫描直到AC7，7扫描结束，这样可增加行程中连续0的个数。nAC系数编码的码字用两个字节表示，如图所示：图5 Z字形扫描18图6AC系数行程编码码字两个非0值间连续0的个数表示下一个非0值需要的bit数下一个非0实际值7430字节1字节2例子例子：对“，3，0，0，0，0，0，12，0，0，”编码，(5，4)，(12)，.19熵编码 n为了进一步压缩数据，需对DC码和AC行程编码的码字再做基于统计特性的熵编码。nJPE

8、G建议的熵编码是Huffman编码和自适应二进制算术编码。n熵编码可分成两步进行：n把DC码和AC行程码转换为中间符号序列n给这些符号赋以变长码字变长码字20AC系数熵编码的中间格式 n熵编码的中间格式由两个符号组成：n符号1：(行程，尺寸)n符号2：(幅值)n第一个信息参数“行程”表示前后两个非0的AC系数之间连续0的个数。n第二个信息参数“尺寸”是后一个非0的AC系数幅值编码所需比特数。21n行程取值范围为115，超过15时用扩展符号1(15，0)来扩充，63个AC系数最多增加3个扩展符号1。编码结束时用(0，0)表示。n“尺寸”取值范围为010。n“幅值”用以表示非0的AC系数的值，范围

9、为-210，210-1(最长10bit)，结构形式如下表所示。221-1，12-3.-2，2.33-7.-4，4.74-15.-8，8.156789-511.-256，25651110-1023.-512，5121023表3符号2结构23DC系数的熵编码n对于直流分量DC也有类似于AC系数的编码格式n符号1：(尺寸)n符号2：(幅值)n“尺寸”表示DC差值的幅值编码所需的比特数，而“幅值”表示DC差值的幅值，范围为-211，211-1。可在表3中多加一级，幅值尺寸以1到11比特表示。n将63个AC系数表示成为符号1和符号2序列，其中连续0的长度超过15时，有多个符号1；块结束(EOB)时仅有一

10、个符号1(0，0)。24“4，0，0，0，0，0，0，0，0，3，0”.4，3之间有31个0.(15，0)，(15，0)，(1，0)，(3)n可变长度熵编码就是对上述序列进行变长编码。n对DC系数、AC系数中的符号1采用Huffman表中的变长码编码(VLC)，这里Huffman变长码表必须作为JPEG编码器输入。n符号2用码字长度在表3中给出的变长整数VLI码编码。VLI是变长码，但不是Huffman码。VLI的长度存放在VLC中，JPEG提供VLI码字表供用户使用25nJPEG提供2套Huffman码表：亮度和色度。每套又有DC表和AC表各1个。共有4个表。n表定义（亮度DC系数码表）16

11、B说明码字长度：X00 01 05 01 01 01 01 01 01 00 00 00 00 00 00 00 第i个(1-16)元素值表示长度为i的Huffman码个数。紧跟一组值说明亮度表分类：X00 01 02 03 04 05 06 07 08 09 0A 0B26表表4 亮度亮度DC系数表系数表分类分类码长码长码字码字分类分类码长码长码字码字020064111013010751111023011861111103310097111111043101108111111105311011911111111027表表5 色度色度DC系数表系数表分类分类码长码长码字码字分类分类

12、码长码长码字码字020066111110120177111111022108811111110331109911111111044111010101111111110551111011111111111111028表表6 JPEG压缩效果评价压缩效果评价压缩效果压缩效果(比特比特/像素像素)质质量量0.250.50中好0.500.75好很好0.751.5极好1.22.0与原始图像分不出来293.基于基于DCT的累进操作方式编码的累进操作方式编码 n顺序方式：顺序方式：每个图像分量的编码一次扫描完成的每个图像分量的编码一次扫描完成的；累进方式：累进方式：图像分量编码要经过多次扫描才完成图像

13、分量编码要经过多次扫描才完成。n累进方式累进方式第一次扫描只进行一次粗糙图像的扫描压缩，第一次扫描只进行一次粗糙图像的扫描压缩，以以相对于总的传输时间快得多的时间传输粗糙图像，相对于总的传输时间快得多的时间传输粗糙图像，并重建一帧质量较低的可识别图像；并重建一帧质量较低的可识别图像；在随后的扫在随后的扫描中再对图像作较细的压缩，描中再对图像作较细的压缩，这时只传递增加的这时只传递增加的信息，可重建一幅质量提高一些的图像。这样不信息，可重建一幅质量提高一些的图像。这样不断累进，断累进，直到满意的图像为止。直到满意的图像为止。30n需在量化器的输出与熵编码的输入之间，增加一个足以存储量化后DCT

14、系数的缓冲区，对缓冲区中存储的DCT系数多次扫描，分批编码。n有以下两种累进方式：n频谱选择法扫描中只对64个DCT变换系数中某些频带的系数进行编码、传送，随后对其他频带编码、传送，直到全部系数传送完毕为止。n按位逼近法沿着DCT量化系数有效位(表示系数精度的位数)方向分段累进编码。如第一次扫描只取最高有效位的n位编码、传送，然后对其余位进行编码、传送。314.基于基于DCT的分层操作方式的分层操作方式 n分层方式是对一幅原始图像的空间分辨率，分成多个分辨率进行“锥形”的编码方法，水平(垂直)方向分辨率的下降以2的倍数因子改变。图7分层操作方式32分层操作方式的过程分层操作方式的过程(1)把原

15、始图像空间分辨率降低。(2)对已降低分辨率的图像采用基于DCT的顺序方式、累进方式或无失真预测编码中的任何一种编码方法进行编码。(3)对低分辨率的图像解码，重建图像，使用插值滤波器，对它插值，恢复图像的水平和垂直分辨率。(4)把分辨率已升高的图像作为原始图像的预测值，对它们的差值采用基于DCT的顺序方式、累进方式或用无失真方式进行编码。(5)重复(3)、(4)直到图像达到完整的分辨率编码。334.1.2JPEG2000简介n基于Internet网络的多媒体应用，给图像编码提出了新的要求.2000年12月公布的新的JPEG2000标准(ISO15444)，其目标是在高压缩率的情况下，如何保证图像

16、传输的质量。nJPEG中采用DCT变换考察整个时域过程的频域特征或整个频域过程的时域特征。JPEG2000采用以小波变换为主的多分辨率编码方式。nJPEG2000统一了面向静态图像和二值图像的编码方式，是既支持低比率压缩又支持高比率压缩的通用编码方式。34n该算法主要特点如下：(1)高压缩率。与JPEG相比，可修复约30的速率失真特性。JPEG和JPEG2000在压缩率相同时，JPEG2000的信噪比将提高30左右；(2)无损压缩。预测编码作为对图像进行无损编码的成熟方法被集成在JPEG2000中；(3)渐进传输。JPEG2000可实现以空间清晰度和信噪比为首的各种可调节性，从而实现渐进传输，

17、即具有“渐现”特性.(4)感兴趣区域压缩。JPEG2000支持所谓的“感兴趣区域”。354.2 运动图像压缩标准运动图像压缩标准MPEG364.2.1 MPEG标准简介标准简介nMPEG标准是面向运动图像压缩的一个系列标准。标准是面向运动图像压缩的一个系列标准。n最初最初MPEG专家组的工作项目是专家组的工作项目是3个，即在个，即在1.5Mbps，10Mbps，40Mbps传输速率下对图像编码，传输速率下对图像编码，分别分别命名为命名为MPEG-1，MPEG-2，MPEG-3。MPEG-3后被取消后被取消.n为了满足不同的应用要求，为了满足不同的应用要求，MPEG又将陆续增加其又将陆续增加其他

18、一些标准他一些标准MPEG-4，MPEG-7，MPEG-21。37 nMPEG算法编码过程和解码过程是一种非镜象算法编码过程和解码过程是一种非镜象对称算法对称算法(不对称不对称)，解码过程要比编码过程相解码过程要比编码过程相对简单些。对简单些。nMPEG-1和和MPEG-2只规定了解码的方案，只规定了解码的方案，重重点将解码算法标准化。因而用硬件实现点将解码算法标准化。因而用硬件实现MPEG算法时，算法时，人们首先实现人们首先实现MPEG的解码器，如的解码器，如C-Cube公司公司CL450解码器系列。解码器系列。n最近几年，随着最近几年，随着MPC性能的提高，软件解压功性能的提高，软件解压功

19、能也逐渐得到支持。能也逐渐得到支持。384.2.2 MPEG-1系统系统n“用于数字存储媒体运动图像及其伴音速率为用于数字存储媒体运动图像及其伴音速率为1.5Mbps的压缩编码的压缩编码”简称简称MPEG-1，作为作为ISO/IEC 11172号建号建议于议于1992年通过。年通过。n主要用于在主要用于在CD-ROM存储运动视频图像，存储运动视频图像，它针对标准它针对标准分辨率分辨率(NTSC制为制为352240；PAL制为制为352288)的图像的图像进行压缩，进行压缩，每秒每秒30帧画面，帧画面，具备具备CD音质。音质。n它还用于数字电话网络上的视频传输，它还用于数字电话网络上的视频传输，

20、如非对称数字如非对称数字用户线路用户线路(ADSL)、视频点播视频点播、教育网络等。教育网络等。n使用使用MPEG-1的压缩算法，的压缩算法，可将一部可将一部120分钟长的电影分钟长的电影压缩到压缩到1.2GB左右。因此，左右。因此，它被广泛地应用于它被广泛地应用于VCD制制作。作。39MPEG-1分为分为5个部分个部分(1)MPEG系统系统(11172-1)，定义音频、视频及有关定义音频、视频及有关数据的同步；数据的同步；(2)MPEG视频视频(11172-2)，定义视频数据的编码和定义视频数据的编码和重建图像所需的解码过程，亮度信号分辨率为重建图像所需的解码过程，亮度信号分辨率为36024

21、0，色度信号分辨率为色度信号分辨率为180120；(3)MPEG音频音频(11172-3)，定义音频数据的编码和定义音频数据的编码和解码；解码；(4)一致性测试一致性测试(11172-4)；(5)软件模拟软件模拟(11172-5)。40图2.15 MPEG-1解码器原型41MPEG-1编解码器原型：编解码器原型：n多路复合而成的码流假设以介质特定格式存储在数多路复合而成的码流假设以介质特定格式存储在数字存储介质字存储介质(DSM)或网络上，或网络上，标准不规定介质特定标准不规定介质特定格式。格式。n系统解码器从输入多路复合流中抽取定时信息，并系统解码器从输入多路复合流中抽取定时信息，并对输入流

22、进行分流处理，对输入流进行分流处理，输出两个基本流分别给输出两个基本流分别给视频和音频解码器。视频和音频解码器。n视频和音频解码器分别解码输出视频和声音信号。视频和音频解码器分别解码输出视频和声音信号。42 n系统、视频、音频和介质系统、视频、音频和介质4个解码器之间用定个解码器之间用定时信息进行同步。时信息进行同步。n多路复合流构造为多路复合流构造为2层：层：系统层和压缩层。系系统层和压缩层。系统解码输入的是系统层；统解码输入的是系统层；而视频、音频解码器而视频、音频解码器输入的是压缩层输入的是压缩层。43 n系统解码器执行两类操作系统解码器执行两类操作：n一类是作用在整个多路复合流上的操作

23、，称为复合流操作一类是作用在整个多路复合流上的操作，称为复合流操作；n另一类是作用在单个基本流上的操作，称为特定流操作。另一类是作用在单个基本流上的操作，称为特定流操作。n系统层分为两个子层系统层分为两个子层：n一个子层称为包一个子层称为包(pack)，是复合流操作对象是复合流操作对象；n另一个子层称为组另一个子层称为组(packet)，它用于特定流操作它用于特定流操作。44 MPEG音频标准的特点：音频标准的特点：n音频信号采样率可以是音频信号采样率可以是32kHz，44.1kHz或或48kHz。n压缩后的比特流可以按以下压缩后的比特流可以按以下4种模式之一支持单声种模式之一支持单声道或双声

24、道道或双声道：n提供给单音频通道的单声道模式；提供给单音频通道的单声道模式；n提供给两个独立的单音频通道的双提供给两个独立的单音频通道的双-单声道模式；单声道模式；n提供给立体声通道的立体声模式；提供给立体声通道的立体声模式；n联合立体声模式，利用立体声通道之间的关联或通道之联合立体声模式，利用立体声通道之间的关联或通道之间相位差的无关性，或者对两者同时利用。间相位差的无关性，或者对两者同时利用。45 nMPEG音频音频标准提供标准提供3 3个独立的压缩层次，用户可个独立的压缩层次，用户可在复杂性和压缩质量之间权衡选择。在复杂性和压缩质量之间权衡选择。n层层1最简单，使用比特率最简单，使用比特

25、率384kbps，主要用于主要用于DCC；n层层2的复杂度中等，使用比特率的复杂度中等，使用比特率192kbps左右，左右，主要应用主要应用于数字广播的音频编码、于数字广播的音频编码、CD-ROM上的音频信号以及上的音频信号以及CD-I和和VCD。n层层3最为复杂，使用比特率最为复杂，使用比特率64kbps，尤其适用于尤其适用于ISDN上上的音频传输，有损压缩但音质保持逼真效果。的音频传输，有损压缩但音质保持逼真效果。MP3MP3音乐音乐是利用是利用 MPEG Audio Layer 3 MPEG Audio Layer 3 的技术，的技术，声音采声音采用用 1 1：10 10 甚至甚至 1

26、 1：12 12 的压缩率的压缩率 46 n压缩后的比特流具有预定义的比特率之一。压缩后的比特流具有预定义的比特率之一。MPEG音频标准也支持用户使用预定义的比特率之外的比音频标准也支持用户使用预定义的比特率之外的比特率。特率。n编码后的比特流支持循环冗余校验编码后的比特流支持循环冗余校验(CRC)。nMPEG音频标准还支持在比特流中载带附加信息。音频标准还支持在比特流中载带附加信息。47 MPEG视频数据流的结构视频数据流的结构图2.16MPEG-1数据体系结构运动图像序列运动图像序列图片组图片组图片图片图片切片图片切片宏块宏块块块8像像素素48 n运动序列运动序列 n图像组图像组 n图像信

27、号分图像信号分3个部分：个部分：一个亮度信号一个亮度信号Y和两个色度信号和两个色度信号U、V。49图图2.17 色度和亮度的位置关系色度和亮度的位置关系 4：2：0采样结构采样结构n亮度信号亮度信号Y由偶数个行和偶数个列组成，由偶数个行和偶数个列组成，色度信号色度信号U、V分别取分别取Y信号在水平、垂直方向的信号在水平、垂直方向的1/2。如图所示，。如图所示，黑点代表色度黑点代表色度U、V位置位置，亮度亮度Y位置用白圈表示。位置用白圈表示。504：2：2采样结构采样结构514：2：4采样结构采样结构52 n块块：一个块由一个块由n一个一个88的亮度信息或色度信息组成。的亮度信息或色度信息组成。

28、n宏块一个宏块由四个宏块一个宏块由四个Y块，一个块，一个Cb色差块和一个色差块和一个Cr色差块色差块组成，组成，如图所示。如图所示。图图2.18 宏块的组成宏块的组成n图像切片图像切片由一个或多个连续的宏块构成由一个或多个连续的宏块构成。YUV8X88X801234553 n块块：一个块由一个块由n一个一个88的亮度信息或色度信息组成。的亮度信息或色度信息组成。n宏块一个宏块由四个宏块一个宏块由四个Y块，两个块，两个Cb色差块和两个色差块和两个Cr色差块色差块组成，组成，如图所示。如图所示。YUV012345674：2：2宏块结构54 YUV0123n块块：一个块由一个块由n一个一个88的亮

29、度信息或色度信息组成。的亮度信息或色度信息组成。n宏块一个宏块由四个宏块一个宏块由四个Y块，两个块，两个Cb色差块和两个色差块和两个Cr色差块色差块组成，组成，如图所示。如图所示。48610597114：4：4宏块结构55 4.2.4 MPEG-1视频视频编码技术编码技术 n主要问题：主要问题：一方面无法达到很高的压缩比，一方面无法达到很高的压缩比，另一方面用单一的静止帧内编码方法能最好另一方面用单一的静止帧内编码方法能最好地满足随机存取的要求。地满足随机存取的要求。n解决方法：对这两个方面做了折衷考虑。即解决方法：对这两个方面做了折衷考虑。即为了减少时间上冗余性的基于块的运动补偿为了减少时间

30、上冗余性的基于块的运动补偿技术和基于技术和基于DCT变换的减少空间上冗余性的变换的减少空间上冗余性的ADCT技术技术 56n在在MPEG中将图像分为中将图像分为3种类型：种类型：nI图像图像利用图像自身的相关性压缩，利用图像自身的相关性压缩，提供压缩提供压缩数据流中的随机存取的点。数据流中的随机存取的点。nP图像图像用最近的前一个用最近的前一个I图像图像(或或P图像图像)预测编预测编码得到码得到(前向预测前向预测)。nB图像图像 B图像在预测时，图像在预测时，既可使用前一个图像既可使用前一个图像作参照作参照，也可使用下一个图像做参照或同时使也可使用下一个图像做参照或同时使用前后两个图像作为

31、参照用前后两个图像作为参照图像图像(双向预测双向预测)。57图图2.19 帧间预测帧间预测1I2B3B4B5P6B7B8B1I前向预测前向预测双向预测双向预测58运动序列流的组成运动序列流的组成图图2.20 典型的图像类型的显示次序典型的图像类型的显示次序1秒参照帧间有参照帧间有2个个B图像图像每每0.5秒秒1帧帧I图像图像 I B B P B B P B B P B B P B B I B B P B B P B B P B B P B B59传输顺序传输顺序nMPEG编码器需对上述图像重新排序，编码器需对上述图像重新排序，以便解码以便解码器高效工作，器高效工作，因为参照图像必须先于因为参

32、照图像必须先于B图像恢复图像恢复之前恢复。上述之前恢复。上述17帧图像重排后图像组次序为：帧图像重排后图像组次序为：4213756IPBBPBB60运动补偿技术运动补偿技术n运动补偿技术主要用于消除运动补偿技术主要用于消除P图像和图像和B图像在时间上的图像在时间上的冗余性提高压缩效率。在冗余性提高压缩效率。在MPEG方案中，运动补偿技方案中，运动补偿技术工作在宏块一级。术工作在宏块一级。nB图像宏块有图像宏块有4种类型种类型帧内宏块帧内宏块，简称简称I块；块；前向预测宏块前向预测宏块，简称简称F块；块；后向预测宏块后向预测宏块，简称简称B块；块；平均宏块平均宏块，简称简称A块。块。n对于对于

33、P图像，图像，其宏块只有其宏块只有I块和块和F块两种块两种。61n无论无论B图像和图像和P图像图像，I块处理技术都与块处理技术都与I图像中采用技术一图像中采用技术一致即致即ADCT技术。技术。n对于对于F块、块、B块和块和A块块，MPEG都采用基于块的运动补偿技都采用基于块的运动补偿技术。术。nF块预测时其参照为前一个块预测时其参照为前一个I图像或图像或P图像图像nB块预测时其参照为后一个块预测时其参照为后一个I图像或图像或P图像图像n对于对于A块预测其参照为前后两个块预测其参照为前后两个I图像或图像或P图像图像62基于块的运动补偿技术基于块的运动补偿技术n基基于于块块的的运运动动补补偿偿技技

34、术术，就就是是在在其其参参照照帧帧中中寻寻找找符符合合一一定条件，当前被预测块的最佳匹配块。定条件，当前被预测块的最佳匹配块。n找到匹配块后，有两种处理方法：找到匹配块后，有两种处理方法：n一是在恢复被预测块时，用匹配块代替；一是在恢复被预测块时，用匹配块代替；n二二是是对对预预测测的的误误差差采采用用ADCT技技术术编编码码，在在恢恢复复被被预预测块时，用匹配块加上预测误差。测块时，用匹配块加上预测误差。63表表2.8 宏块的预测方式宏块的预测方式宏块类型宏块类型预测器预测器预测误差预测误差I块I1(X)=128I1(X)-I1(X)F块I1(X)=I0(X+mv01)I1(X)-I1(X)

35、B块I1(X)=I2(X+mv21)I1(X)-I1(X)A块I1(X)=(I0(X+mv01)+I2(X+mv21)/2I1(X)-I1(X)644.MPEG-1视频系统图2.21简化的视频编码框图65图2.22基本的视频解码器框图664.2.5MPEG-2标准nMPEG-2(ISO/IEC13818)标准制定于1994年。它利用网络提供的3100Mbps的数据传输率来支持具有更高分辨率图像的压缩和更高的图像质量。nMPEG-2可支持交迭图像序列，支持可调节性编码，多种运动估计方式，提供一个较广的范围改变压缩比，以适应不同画面质量、存储容量和带宽的要求。n它与MPEG-1兼容的基础上实现了低

36、码率和多声道扩展：MPEG-2可以将一部120分钟长的电影压缩到48GB(DVD质量)，其音频编码可提供左右中及两个环绕声道、一个加重低音声道和多达7个伴音声道。67 n除了作为DVD的指定标准外，MPEG-2还可用于为广播、有线电视网、电缆网络等提供广播级的数字视频。不过对普通用户来说，由于现在电视机分辨率的限制，MPEG-2所带来的高清晰度画面质量(如DVD画面)在电视上效果并不明显，倒是其音频特性(如加重低音、多伴音声道等)得到了广泛的应用。nMPEG-2Video定义了不同的功能档次(Profiles)n每个档次又分为几个等级(Levels)，一个等级为N的解码器能够对最高为该等级的数

37、码流解码。685个档次简单型（Simple）基本型（Main）信噪比可调型（SNRScalable）空间可调型（SpatialScalable）增强型（High）694个等级低级（Low）35228830，它面向VCR并与MPEG-1兼容；基本级（Main）72046030或72057625，它面向视频广播信号；高1440级（High-1440）1440108030或1440115225，它面向HDTV；高级（High）1920108030或1920115225，它面向HDTV。7011种规范高级的基本型MPHL高级的增强型HPHL高-1440级的基本型MPH1440高-1440级的空间可调型

38、SSPH1440高-1440级的的增强型HPH1440基本级的简单型SPML基本级基本型MPML基本级的信噪比可调型SNPML基本级的增强型HPML低级的基本型MPLL低级的信噪比可调型SNPLL71MPEG-2音频音频n基本特性之一是向后与MPEG-1音频兼容。n可以是5.1也可以是7.1通道的环绕立体声。n5.1也称为“3/2-立体声加LFE”，其含义是播音现场前面可有3个喇叭通道(左、中、右)，后面可有2个环绕声喇叭通道。LFE是低频音效的加强通道。n7.1通道环绕立体声与5.1类似，它另有中左、中右2个喇叭通道。72MPEG-2编码方法编码方法 nMPEG-2的编码方法和MPEG-1区

39、别主要是在隔行扫描制式下，DCT变换是在场内还是在帧内进行由用户自行选择，亦可自适应选择。n一般情况下，对细节多、运动部分少的图像在帧内进行DCT，而细节少、运动分量多的图像在场内进行DCT。nMPEG-2采用可调型和非可调型两种编码结构。还可以使用一个基本层加上多个增强型的多层编码结构，这由用户按质量和压缩比要求选择使用.73n图2.23MPEG-2亮度宏块结构744.2.6MPEG-4标准n国际标准MPEG-4“甚低速率视听编码”于1998年11月公布，它针对低速率下的视频、音频编码，更加注重多媒体系统的交互性和灵活性。nMPEG-4引入了AV对象(AVO)，使得更多的交互操作成为可能：“

40、AV对象”可以是一个孤立的人，也可以是这个人的语音或一段背景音乐等。nMPEG-4对AV对象的操作主要有：采用AV对象来表示听觉、视觉或者视听组合内容；组合已有AV对象来生成复合的AV对象，并生成AV场景；对AV对象的数据灵活地多路合成与同步，以便选择合适的网络来传输这些AV对象数据；允许接收端用户在AV场景中对AV对象进行交互操作等。75nMPEG-4标准主要构成部分：(1)传输多媒体集成框架(DMIF)。主要用于解决交互网络中、广播环境下以及光盘应用中多媒体应用的操作问题。它是MPEG-4制订的会话协议，用来管理多媒体数据流。通过传输多路合成比特信息来建立客户端和服务器端的连接与传输。(2

41、)场景描述。场景声音视频对象间的关系的描述体现在两个层次：BIFS描述场景中对象的空间时间安排，观察者可以有与这些对象交互的可能性；在较低的层次上，对象描述子定义针对每个对象的基本流的关系，并提供诸如访问基本流需要的URL地址、译码器的特性、知识产权等其他信息。76MPEG-4具备与Web3DX3D和W3CSMIL的互操作性。XMT格式可在SMIL播放器、VRML和MPEG-4播放器间互换。(3)音频编码。MPEG-4不仅支持自然声音，而且支持合成声音。MPEG-4的音频部分将音频的合成编码和自然声音的编码相结合，并支持音频的对象特征。支持MIDI和TTS.(4)视频编码。MPEG-4也支持对

42、自然和合成的视觉对象的编码。合成的视觉对象包括2D、3D动画和人面部表情动画等。(5)缓冲区管理和实时解码。MPEG-4定义了一个系统解码模式(SDM)，该解码模式描述了一种理想的处理比特流句法语义的解码装置，它要求特殊的缓冲区和实时模式。通过有效地管理，可以更好地利用有限的缓冲区空间。77n与MPEG-1和2相比，MPEG-4更适于交互AV服务以及远程监控，其设计目标使它具有更广的适应性和可扩展性：MPEG-4传输速率可在4.8-64kbps之间，分辨率为176144，可以利用很窄的带宽通过帧重建技术压缩和传输数据。n它将应用在数字电视、动态图像、互联网、实时多媒体监控、移动多媒体通信、In

43、ternet/Intranet上的视频流与可视游戏、DVD上的交互多媒体等方面。nMPEG-4用MPEG-4压缩算法的ASF（高级流格式）可以将120分钟的电影压缩为300MB左右的视频流；采用MPEG-4压缩算法的DIVX（Digital Video Express）编码技术可以将120分钟的电影压缩600MB左右，也可以将一部DVD影片压缩到2张CD-ROM上.78nMPEG-4属于一种高比率有损压缩算法，其图像质量始终无法和DVD的MPEG-2相比，毕竟DVD的存储容量较大。n要想保证高速运动的图像画面不失真，必须有足够的码率，目前MPEG-4的码率虽然可以调到和DVD差不多，但总体效果

44、还有不小的差距。因此，对图像质量要求较高的专业视频领域暂时还不能采用。79图2.25MPEG-4视频编码器的算法方框图80图2.26MPEG-4终端的构成(接收端)81n背景全景图+视频对象(VO)=合成图像图2.27MPEG-4应用实例824.3 视听通信编码解码标准H.26X 834.3.1H.261方案nITU推荐的H.261方案标题“64kbps视声服务用视象编码方式”，又称为P64kbps视频编码标准。视频编码标准。nP取值范围为1-30。P=1或2时，仅能支持QCIF(QuarterCommonIntermediateFormat)(176144)分辨率格式，每秒帧数较低的可视电话

45、；当P6时，则可支持图像分辨率格式为CIF(CommonIntermediateFormat)(352288)的电视会议。844.3.2P64kbps视频压缩编码算法nP64kbps压缩算法采用基于DCT的变换编码和带有运动预测的DPCM预测编码的混合方法。nP64kbps标准的压缩算法与MPEG-1标准有许多共同之处，只是传输速率P64kbps覆盖较宽的信道频带，而MPEG-1是基于较窄的频带上传输。85图2.28H.261编码器86图2.29利用CIF的优点874.3.3视频层次数据结构 nP64kbps标准采用层次块的视频数据结构形式，使高压缩视频编码算法得以实现。nP64kbps标准的

46、视频编码定义一个视频数据结构CIF保证解码器对接收到的比特流进行没有二义性的正确解码。n利用CIF格式，可使不同制式的各国电视信号变换为统一的中间格式，然后输入给编码器，从而使编码器本身不必意识信号是来自哪种制式的。nH.261标准适合各种各样实时视觉应用，如位率不同(P不同)，运动效果和图像质量不同，位率提高、画面质量改善。88图2.30视频数据结构图图像头QCIF帧图块组1块组2块组3块组1头宏块1宏块2宏块33宏块1头亮度块1亮度块4色度块1色度块2DCT系数DCT系数块结束89图2.31图像数据层次结构123456789101112135帧QCIF1234567891011121314

47、15161718192021222324252627282930313233块组123456宏块8CIF块890 n为了适应B-ISDN的ATM传输需要，ITU与MPEG联合发布ISO/IEC13818，分别称为H.262和MPEG-2标准，它与H.261和MPEG-1兼容。nH.263是ITU-T制定的适合于低速视频信号的压缩标准。大多数用户相当一段时间内最方便的是公用电话线，以V.34为标准的调制解调器支持在电话线中传输速率可达28.8kbps或33.6kbps，甚至56kbps。nH.263是在H.261基础上扩展形成的，支持的图像格式包括Sub-QCIF(12896)，QCIF，CIF

48、，4CIF，16CIF(14081152)等。其中主要采用的改进技术有：视听业务视频压缩标准发展91 (1)半像素精度的运动补偿在H.261中，运动矢量的精度为1个像素，H.263运动矢量的估值精度达到半个像素。精度的提高使运动补偿后的帧间误差减少，从而降低了码率。(2)不受限的运动矢量当运动跨越图像边界时，由运动矢量所确定的宏块位置可能有一部分落在边界之外，此时可以用边界上的像素值表示界外的像素值，从而降低预测误差。(3)用基于句法的算术编码代替Huffman编码(可选项)这是一种效率较高的自适应算术编码。92 (4)先进的预测模式(可选项)对宏块中的4个亮度块分别进行运动估值获得4个运动矢

49、量。虽然此时传输运动矢量的比特数增加一些，但由于预测误差的大幅度降低，仍然使总码率降低。(5)PB帧模式(可选项)虽然使用双向预测的B帧可以降低码率，但是却要引入附加的编码延时和解码延时。为了降低延时，H.263采用了P帧和B帧作为一个单元来处理的方式，即将P帧和由该帧与上一个P帧所共同预测的B帧一起进行编码。934.4 H.264视频编码标准nH.264是由ITU-T的视频编码专家组（VCEG）与ISO/IEC的MPEG组成的联合视频工作组（JVT）共同制定的新一代视频压缩编码标准。n该标准于2003年3月正式获得批准。944.4 H.264视频编码标准n视频的各种应用必须通过各种网络传送，

50、这要求一个好的视频方案能处理各种应用和网络接口。H.264为了解决这个问题，提供了很多灵活性和客户定制化特性。H.264的设计方案包含两个层次：视频编码层（VCL）和网络抽象层（NAL）。n视频编码层主要致力于有效地表示视频内容，包括VCL编码器与VCL解码器，主要功能是视频数据压缩编码和解码。VCL的设计和以前的标准一样，也是采用运动补偿预测、变换编码、量化、熵编码的混合编码模式。但它采用了“回归基本”的简洁设计，不用众多的选项，获得了比H.263好得多的性能。95H.264主要有以下特点主要有以下特点n编码效率高。在相同的重建图像质量下，H.264与H.263+、MPEG-4基本“档次”相

展开阅读全文