第3章多媒体数据压缩技术.ppt-得力文库

资源描述

《第3章多媒体数据压缩技术.ppt》由会员分享，可在线阅读，更多相关《第3章多媒体数据压缩技术.ppt（101页珍藏版）》请在得力文库 - 分享文档赚钱的网站上搜索。

1、多多媒媒体体技技术术第第3 3章章1第第3章章多媒体数据多媒体数据压缩编码技术压缩编码技术n3.1 概述n3.2 数据压缩的基本方法n3.3 静态图像压缩编码国际标准JPEGn3.4 运动图像压缩编码国际标准MPEGn3.5 音频数字化与压缩编码技术2第第3章章多媒体数据多媒体数据压缩编码技术压缩编码技术n多媒体数据压缩编码的重要性u数据冗余类型u数据压缩技术的分类3第第3章章多媒体数据多媒体数据压缩编码技术压缩编码技术n媒体数据压缩编码的重要性u 信息时代的重要特征是信息的数字化。u 早期的计算机系统采用模拟方式表示信息，但存在着明显的缺点：u 经常会产生噪音和信号丢失，并且在

2、复制过程中逐步积累噪音和误差。u 模拟信号不适合数字计算机加工处理。4媒体数据压缩媒体数据压缩编码的重要性编码的重要性n 数字化后未经压缩的视频和音频等媒体信息的数据量是非常大的 1.图像数据量的大小可用下面的公式来计算：图像数据量图像的总像素色彩深度8 （单位为 Byte，简写为 B）例如，一幅640480、24位（bit）真彩色的图像，其文件大小为：64048024 8 921.6KB5媒体数据压缩媒体数据压缩编码的重要性编码的重要性n 2.双通道立体声激光唱盘，采用脉冲码调制采样，采样频率为44.1KHz，采样精度16位，其一秒钟时间内的采样数据量为：44.110

3、001628 176.4 KB 一个650MB的CDROM，大约可存1小时的音乐。6媒体数据压缩媒体数据压缩编码的重要性编码的重要性n 3.对动态图形和视频图像。例如对于彩色电视信号，设代表光强Y的带宽为4.2MHz、色彩I为1.5MHz和色饱和度Q为0.5MHz，采样频率2倍原始信号频率，各分量均被数字量化为8位，从而1秒钟电视信号的数据量为：（4.21.50.5）281000000812.4 MB7媒体数据压缩媒体数据压缩编码的重要性编码的重要性u 容量为650MB的CDROM仅能存1分钟的原始电视数据。若为高清晰度电视（HDTV）其1秒钟数据量约为150MB（1.2Gbps8），一张CD

4、ROM还存不下5秒钟的HDTV图像。n 巨大数字化信息的数据量对计算机存储资源和网络带宽有很高的要求，解决的办法就是要对视、音频的数据进行大量的压缩。播放时，传输少量被压缩的数据，接收后再对数据进行解压缩并复原。8数据冗余类型数据冗余类型u 1.空间冗余u 基于离散像素采样来表示物体颜色的方式通常没有利用景物表面颜色的这种空间相关性，这些相关性的光成像结构在数字化图像中就表现为空间冗余。我们可以通过改变物体表面颜色的像素存储方式来利用空间相关性，达到减少数据量的目的。9数据冗余类型数据冗余类型u 2.时间冗余u 时间冗余反映在图像序列中的相邻帧图像（电视图像、动画）之间有较大的相关性，一组连续

5、画面中的相邻帧往往包含相同的背景和移动物体，只不过移动物体所在的空间位置略有不同，把一帧图像中的某物体或场景可以由其他帧图像中的物体或场景进行处理后重构出来，可以大大减少时间冗余。10数据冗余类型数据冗余类型u 3.结构冗余u 有些图像具有较强的相似性的纹理结构，例如布纹图像和草席图像，方格状的地板图案等，我们称此为结构冗余。u 4.知识冗余u 有许多图像的理解与某些基础知识有相当大的相关性，这类规律性的结构可由先验知识和背景知识得到，我们称此类冗余为知识冗余。根据已有的知识，我们可以构造图像物体的基本模型，并创建图像库。11数据冗余类型数据冗余类型u 5.视觉冗余u 人的接收系统如视觉系统和

6、听觉系统是有一定限度的，人眼并不能察觉图像场的所有变化，如人类视觉系统分辨能力约为64灰度等级，而一般图像量化采用256灰度等级，这类冗余我们称为视觉冗余。u 6.听觉冗余u 人耳的敏感性不能察觉所有频率的变化，存在听觉冗余。12数据压缩技术数据压缩技术的分类的分类n 根据多媒体数据冗余类型的不同，解码后数据与原始数据是否完全一致、质量有无损失来进行分类，压缩方法可被分为有失真编码和无失真编码两大类。u 无失真压缩法也称无损压缩，无失真压缩的特点是压缩比较小，大约在2l至5l之间，主要用于文本数据、程序代码和某些要求严格不丢失信息的环境中，常用的无失真压缩编码有如哈夫曼编码等。13数据压缩技

7、术数据压缩技术的分类的分类u 有失真压缩法也称有损压缩，有失真压缩法的冗余压缩取决于初始信号的类型、前后的相关性、信号的语义内容等，压缩比可以从几到几百倍，常用的有失真压缩编码技术有预测编码、变换编码、模型编码、混合编码方法等。主要用于压缩图像、声音等信息。14n 常用的图像和视频压缩方法如图3-1所示：图像和视频压缩方法图像和视频压缩方法哈夫曼编码哈夫曼编码行程编码行程编码算术编码算术编码LZW编码编码DCT编码编码小波变换小波变换子带编码子带编码无失真压缩无失真压缩有失真压缩有失真压缩预测编码预测编码变换编码变换编码模型编码模型编码运动补偿运动补偿混合编码混合编码分形编码分形编码JPEG

8、MPEGH.261数据压缩技术数据压缩技术的分类的分类15行程（游程）行程（游程）RLE 编码技术编码技术n 行程编码主要思路是用编码器不断比较信息源符号相邻元素值的变化幅度，一旦发现有明显的变化，就开始一个行程。编码器检测每一个行程起点位置开始的多次重复的比特或者字符序列，然后将一个相同值的连续串出现次数作为行程长度，并将行程长度转换成代码，再取用信息源符号的一个代表值作为代码，这种编码称为行程编码，或称游程编码，常用RLE表示。16对一幅两维图像对一幅两维图像F F（i i，j j）作水平作水平扫描后得到的部分像素的像素值扫描后得到的部分像素的像素值17行程（游程）行程（游程）RLE 编

9、码技术编码技术n 用RLE对这一行数据编码后得到的码字表：n RLE编码压缩编码技术尤其适用于：计算机生成的图形图像和黑白二值图像的编码，解压缩速度很快。RLE的压缩率的大小取决于图像本身的特点，可以得到较大的压缩比。对复杂的图像不适宜用RLE进行编码。18哈夫曼编码技术哈夫曼编码技术n 假设一个信息源能产生的事件序列中的事件取自一个有限事件集，事件集S中的任一事件Si发生的概率为P(Si)都相等，即P(Si)1/S，则其所能携带的信息量 I(Si)定义为:I(Si)log2 1/S log2 P(Si)（33）这里P(Si)是信息源产生的事件为S

10、i的概率。等式右边加一负号的目的是保证I(Si）的数值不为负值。定义中用2为底的对数，并规定信息量I(Si)的计量单位为比特（bit）。19哈夫曼编码技术哈夫曼编码技术n 哈夫曼编码属于一种变字长码，把信息源事件按概率大小顺序排列，对出现概率大的信息源事件赋予短码字，而对于概率小的信息源事件赋予长码，只要码字长度按照信息出现的概率大小逆顺序排列，可通过数学证明这一结论：平均码字长度一定小于其它任何事件顺序的排列方式。20哈夫曼编码技术哈夫曼编码技术n 哈夫曼编码一般过程如下：u 1.把事件（消息）按出现的概率由大到小排成一个序列。如P(1)P(2)P(3)P(Sm-1)P(Sm)，即将信息源事

11、件按概率递减顺序排列。u 2.把其中两个最小的概率P(Sm-1)，P(Sm)挑出来，且将事件“1”赋给其中最小的，即P(Sm)1；事件“0”赋给另一稍大的即P(Sm-1)0。21哈夫曼编码技术哈夫曼编码技术u 3.把两个最小概率相加作为新事件的概率，即求出 P(Sm-1)，P(Sm)之和 P(Si):P(Si)=P(Sm-1)十P(Sm)设P(Si)是对应于一个新的消息的概率。u 4.将P(Si)与上面未处理的（m2）个消息P(Sm-2）的概率重新由大到小再排列，构成一个新的概率序列。u 5.重复步骤2），3），4），在每次合并信息源时，将被合并的信源分别赋“0”和“1”直到所有m个事件

12、的概率均已全部合并处理为止。22哈夫曼编码技术哈夫曼编码技术u 6.寻找从每一个信息源事件到概率总和为1处的路径，对每一信息源事件写出“1”、“0”序列（从树根到信息源事件节点）作为码字。Huffman编码的平均码字长度可以用下列公式求出：这里的ni，为第i个消息事件的码字长度，P(Si)为第i个消息出现的概率。举一例子来说明这一编码过程。23哈夫曼编码技术哈夫曼编码技术图3-5 哈夫曼编码全过程：F24哈夫曼编码技术哈夫曼编码技术n 根据哈夫曼的编码规则，我们得到如表3-2所示：由于8个消息事件A，B，C，H的每个概率为已知，则哈夫曼码的平均长度L可按公式（3-6)

13、计算为：L10.4十3（0.180.10）4（0.10十0.06十0.07）十 5（0.05十 0.04）2.61比特25哈夫曼编码技术哈夫曼编码技术n 图像的熵H（S）可按公式（3-5)计算为：定义编码效率为熵值H（S）与平均码长L的比值，即：编码效率（3-7）=2.55/2.61=2.55/2.61 97.8 97.8%哈夫曼编码有它的不足之处：必须先得到信息源码元（消息）的统计概率，才能进行编码。折中的方法是根据经验值人为地给出Huffman码表，但这样的编码无法达到最佳。26LZW编码编码nLZWLZW编编码码是是由由LempleLemple和和ZivZiv提

14、提出出并并经经WelchWelch扩扩充充而形成的无损压缩专利技术。而形成的无损压缩专利技术。n它它采采用用了了一一种种先先进进的的串串表表压压缩缩，将将每每个个第第一一次次出出现现的的串串放放在在一一个个串串表表中中，用用一一个个数数字字来来表表示示串串，压压缩缩文文件件只只存存贮贮数数字字，则则不不存存贮贮串串，从从而而使使图图象象文文件件的的压压缩缩效效率率得得到到较较大大的的提提高高。奇奇妙妙的的是是，不不管管是是在在压压缩缩还还是是在在解解压压缩缩的的过过程程中中都都能能正正确确的的建建立立这这个个串串表表，压压缩缩或或解解压压缩缩完完成成后后，这个串表又被丢弃。这个串表又被丢弃。2

15、7LZW编码示例编码示例n例例如如：现现有有来来源源于于二二色色系系统统的的图图像像数数据据源源（假假设设数数据据以以字字符符串串表表示示）：aabbbaabbaabbbaabb，试试对对其其进行进行LZWLZW编码及解码编码及解码。n根根据据图图像像中中使使用用的的颜颜色色数数初初始始化化一一个个字字符符串串表表，字字符符串串表表中中的的每每个个颜颜色色对对应应一一个个索索引引。在在初初始始字字符符串串表表的的LZW_CLEARLZW_CLEAR和和LZW_EOILZW_EOI分分别别为为字字符符表表初始化标志和编码结束标志。初始化标志和编码结束标志。28n设置字符串变量设置字符串变量S1S

16、1、S2S2并初始化为空。并初始化为空。最后的编码结果为：3001646329LZW编码编码nLZWLZW算算法法的的适适用用范范围围是是原原始始数数据据串串最最好好是是有有大大量量的的子子串串多多次次重重复复出出现现，重重复复的的越越多多，压压缩缩效效果果越越好好。反反之之则则越越差差，可可能能真的不减反增了真的不减反增了 30图像压缩预处理技术图像压缩预处理技术n图图像像数数据据压压缩缩的的任任务务是是在在不不影影响响或或少少影影响响图图像像质质量量的的前前提提下下，尽尽量量减减少少图图像像的的数据量。数据量。n图像预处理技术：图像预处理技术：二次抽样二次抽样人人的的视视觉觉对对图图像像

17、亮亮度度分分量量的的敏敏感感程程度度高于色差分量。高于色差分量。31图像压缩预处理技术图像压缩预处理技术滤波器滤波器能有选择地删除、衰减或放大信息能有选择地删除、衰减或放大信息量化量化用用整整数数码码代代替替采采样样值值，真真实实值值和和量量化化值值间的误差是分辨率和噪声的混合间的误差是分辨率和噪声的混合预测编码预测编码统统计计冗冗余余改改进进压压缩缩。对对预预测测值值和和真真实实值值之间的误差进行编码之间的误差进行编码32图像压缩预处理技术图像压缩预处理技术运动补偿运动补偿用用二二维维图图像像位位移移矢矢量量来来预预测测邻邻域域图图像像的的位移值位移值变长码变长码根据出现概率高低决

18、定码字长度根据出现概率高低决定码字长度图像内插法图像内插法允允许许产产生生中中间间图图像像，因因此此临临近近的的图图像像可可以产生中间像，减少数据传输和存储量。以产生中间像，减少数据传输和存储量。33采采样样n香香农农定定理理对对于于一一个个包包含含最最高高频频率率f0f0的的模模拟拟信信号号，但但选选择择的的采采样样频频率率f f 满满足足 f=f=2f02f0时时，经经过过取取样样后后的的离离散散信信号号能能够够包包含含原原模模拟拟信信号号的的全全部部信信息息，并并且且，经经过过反反变变换换和和低低通通滤滤波波，可可以以不不失失真真地地恢恢复复出出原始信号。原始信号。34量量化化n量

19、量化化是是在在幅幅度度轴轴上上把把连连续续值值的的模模拟拟信信号号变变成成为为离离散散值值的的数数字字信信号号，在在时时间间轴轴上上已已变变为为离离散散的的样样值值脉脉冲冲，在在幅幅度度轴轴上上仍仍会会在在动动态态范范围围内内有有连连续续值值，可可能能出出现现任任意意幅幅度度，即即在在幅幅度度轴轴上上仍仍是是模模拟拟信信号号的的性性质质，故故还还必必须须用用有有限限电电平平等等级级来来代代替替实际量值实际量值 35n量量化化级级通通常常用用二二进进制制的的位位数数n n表表示示,例例如如,对对于于 8 8 位位 (bit)(bit)量量化化,相相应应的的十十进进制制量量化等级化等级M M为为

20、:M=2:M=28 8=256.=256.n量量化化的的过过程程是是把把取取样样后后信信号号的的电电平平归归并并到到有有限限个个电电平平等等级级上上,并并以以一一个个相相应应的的数数据来表示。据来表示。36n将将图图象象用用较较少少的的灰灰度度级级别别来来表表示示是是最最简简单单的的减减小数据量的方法，这种方法就是标量量化方法。小数据量的方法，这种方法就是标量量化方法。n更更一一般般的的情情况况是是，针针对对连连续续量量的的采采样样过过程程，量量化化是是用用有有限限个个状状态态来来表表示示连连续续值值。标标量量量量化化器器Q(.)Q(.)是是一一个个函函数数，用用有有限限个个判判决决层层d d

21、i i和和重重构构层层r ri i定义而成：定义而成：n37n当采样值当采样值s在在(di,di-1)范围内时，量化器的输出就是重构层范围内时，量化器的输出就是重构层ri。38n矢矢量量量量化化可可定定义义成成用用有有限限个个矢矢量量状状态态表表示示一一组组矢矢量量，每每个个矢矢量量是是一一些些连连续续值值的的采采样样。在在图图象象压压缩缩中中，标标量量量量化化和和矢矢量量化通常用于变换域内的图象表示。量量化通常用于变换域内的图象表示。39数据压缩算法的评价数据压缩算法的评价n压缩倍数压缩倍数1 1）压缩前和压缩后的总的数据量之比）压缩前和压缩后的总的数据量之比2 2）平均比特数（）平均比特数

22、（bpdpbpdp)表示表示n图像质量图像质量重重建建图图像像质质量量信信噪噪比比SNR(SignalSNR(Signal Noise Noise Ration),Ration),即即信信号号与与噪噪声声的的方方差差之之比比。首首先先计计算算图图象象所所有有象象素素的的局局部部方方差差，将将局局部部方方差差的的最最大大值值认认为为是是信信号号方方差差，最最小小值是噪声方差，求出它们的比值值是噪声方差，求出它们的比值.40数据压缩算法的评价数据压缩算法的评价n压缩和解压缩的速度压缩和解压缩的速度对称压缩对称压缩非对称压缩非对称压缩压缩的计算量压缩的计算量41有损压缩编码技术有损压缩编码技术n预

23、测编码技术预测编码技术nJPEGJPEGnMPEGMPEG42预测编码技术预测编码技术n 根据离散信号之间存在着一定的相关性的特点，利用图像像素的以往样本值（前面一个或几个点的数据）对于新样本值（下一个点的数据）进行预测，然后将样本的实际值与其预测值相减得到一个误差值(较小)，这样可以用比较少的数码进行编码得到较大的数据压缩结果，达到压缩数据的目的，因此预测编码技术是一种有失真编码方法。43n 最常用的是差值脉冲编码调制法，简称为DPCM。传传输输信信道道输入输入预测器预测器量化器量化器编码器编码器解码器解码器预测器预测器XnenXnen输出输出XnXnenXn预测编码技术预测编码技术44预测

24、编码技术预测编码技术u 设xn为tn时刻的亮度取样值，预测器根据tn时刻之前的样本值x1，x2，xn-1对xn作预测，得到预测值xn，xn 与xn之间的误差为：enxnxnu 接收端恢复的输出信号为xn是xn的近似值，两者的误差是：xnxnxnxn十en（xn十en）enen 45预测编码技术预测编码技术n 在预测编码中，量化器的量化对像是预测误差 enen分布在零值附近，正负两边的分布一般是对称的，图3-3 预测误差分布特性示意图。概率概率预测误差预测误差图图3-3 3-3 预测误差分布示意图预测误差分布示意图46量化输出输入电平非均匀量化间隔非均匀量化器非均匀量化器47预测编码技术预测编码

25、技术n 非均匀量化器对于具有相同的输入信号动态范围、相同的图像主观评价质量下，输出的比特数较低。n 预测编码系统的缺点：u 预测误差的量化是造成图像质量下降的主要原因，比如在图像边界斜率过载，表现为图像轮廓变模糊；因最小量化电平不够小（量化位数不够高），使图像灰度缓变区产生颗粒噪声。48静态图像压缩编码静态图像压缩编码的国际标准的国际标准-JPEGn 静态图像压缩编码JPEG概况nJPEG压缩编码的基本系统u（1）数据块准备u（2）离散余弦正变换DCTu（3）量化u（4）DCT系数Z形扫描u（5）DC系数编码u（6）AC系数编码nJPEG压缩编码的扩展系统49静态图像压缩编码的国际静态图像压缩

26、编码的国际标准标准-JPEGn JPEG是国际上彩色、灰度、静止图像的第一个国际标准。用来在低分辨率到高分辨率的较宽范围内支持较高的图像分辨率和量化精度。它不仅适用于黑白、彩色照片和印刷图片等静止图像的压缩，而且扩大到了彩色传真、电话会议、新闻图片的传送上，以及电视图像序列的帧内图像的压缩编码也常采用JPEG压缩标准。50静态图像压缩编码静态图像压缩编码的国际标准的国际标准-JPEGn 变换编码的基本思路：u 1编码时略去某些能量很小的高频分量以降低码率。u 2变换编码还可以根据人眼对不同频率分量的敏感程度而对不同系数采用不同的量化台阶，以进一步提高压缩比。n JPEG开发的压缩编码算法有三种

27、工作方式：u 1基本系统（单次扫描）。u 2扩展系统（常采用累进编码或分层编码方式）。u 3无损压缩编码。51JPEG 压缩编码的基本系压缩编码的基本系统统n 下面我们讨论一个基于离散余弦正变换DCT的有失真JPEG编解码的工作原理，图3-7是基于DCT的JPEG编码的过程框图。521.数据块准备数据块准备u 块准备将一帧（幅）图像分成88的数据块。对于彩色图像，可以看作多分量（Y亮度信号分量和U和V色度信号分量）进行压缩处理。u 假设图像的大小为480行，每一行有640个像素。并假设按4ll取样格式，即四个亮度分量，一个色差分量U，一个色差分量V，则亮度分量就是一个640480的数值矩阵，色

28、差分量是一个320240的数值矩阵。u 块准备必须划分出4800个（6404808）亮度块和两份1200个（3202408）色差块，共计7200个数据块。同时将原始图象的无符号整数变为有符号整数532.离散余弦正变换离散余弦正变换 DCTDCTu2.离散余弦正变换DCTu DCTDCT变变换换是是一一种种正正交交变变化化，主主要要是是把把时时域域变变换换为为频频域域，变变换换本本身身并并不不进进行行数数据据压压缩缩。它它只只是是把把信信号号映映射射到到另另一一个个域域上上，使使信信号号在在变变换换域域里里容容易易进进行行压压缩缩，变变换换后后的的样样值值更更加加独立和有序独立和有序543.量化

29、量化u 量化是一种不可逆的、有失真的过程，在基于DCT的编码器中，量化是引起信息丢失的主要原因。u 对DCT系数进行量化有两个作用：u 降低系数的幅值。u 增加系数中值为0的项数。554.4.DCT 系数系数Z Z形扫描形扫描图3-10 Z形扫描顺序其一维数组元素的位置顺序如图3-10。ZZ（0）C（0，0），ZZ（1）C（0，l），ZZ（2）C（l，0），ZZ（63）C（7，7）。编码顺序依据 ZZ的序号。0 1 5 6 14 15 27 28 2 4 7 13 16 26 29 42 3 8 12 17 25 30 41 43 9 11 18 24 31 40 44 53 10 19 2

30、3 32 39 45 52 54 20 22 33 38 46 51 55 60 21 34 37 47 50 56 59 61 35 36 48 49 57 58 62 63565.DC 系数编码系数编码u 对相邻块之间的DC系数的差值DIFFDiDi1进行编码。u Blocki1Blocki图图 3-11 DC3-11 DC系数的差值系数的差值DIFFDIFFD Di iD Di i1 1DiDi1576.AC 系数的编码系数的编码 n Z形扫描将二维量化系数矩阵转换成一维数组ZZ中的“零游程/非零值”。u 若最后一个“零游程/非零值”中只有零游程（ZRL），则直接传块结束码字“EOB”结

31、束本块。58JPEG 压缩编码压缩编码的基本系统的基本系统n 对于中等复杂程度的彩色图像，其压缩比与恢复图像的质量大致如表3-10所示。表3-10压缩效果与恢复图像质量的关系59JPEG 压缩编码压缩编码的基本系统的基本系统n 顺序编码运行方式60JPEG 压缩编码压缩编码的扩展系统的扩展系统n 1.基于DCT的累进编码运行方式累进编码方式要扫描多次。61JPEG 压缩编码压缩编码的扩展系统的扩展系统n2.分层编码运行方式u 水平方向和垂直方向分辨率以2的倍数因子下降（降低原始图像的空间分辨率），导出若干低分辨率的原图像，分层后再采用JPEG的压缩编码方法进行编码，随后以上重复步骤，直到图像达

32、到完整的分辨率编码为止。62JPEG 压缩编码压缩编码的扩展系统的扩展系统n 3.无损压缩预测编码运行方式源图像源图像数据数据表说明表说明预测器预测器熵编码器熵编码器压缩后压缩后图像数据图像数据63无损压缩预测编码无损压缩预测编码运行方式运行方式 DPCM编码简单，易于用硬件实现。由于是无失真编码，解码后的图像质量很高。Px64运动图像压缩编码的国际运动图像压缩编码的国际标准标准MPEGn 运动图像压缩编码MPEG概况nMPEG 标准简介n帧间编码技术n运动补偿技术nMPEG视频压缩数据流结构nMPEG音频65运动图像压缩编码的国际运动图像压缩编码的国际标准标准MPEGn MPEG专家组工作将

33、整个过程分为三步：u 要求u 提出要求有双重的目的：目标,竞争的原则。u 竟争u 提出了14个不同的方案。u 集中u 测试和评价，并综合出一个最佳方案。66MPEG 标准简介标准简介n 1.MPEG1标准u MPEG1的标准名称为“动态图像和伴音的编码”用于速率小于每秒约1.5Mbps的数字存储媒体。u MPEG1的最大压缩比可达约1200。u MPEG1标准有3个部分组成：u MPEG1视频（Video）u MPEG1音频（Audio）u MPEG1系统（System）671.MPEG1 标准标准n 设计目标是把每秒30帧、亮度信号的分辨率为360240，色度信号分辨率

34、为180120，传送压缩成数据率为1.2Mbps的编码图像。n MPEG1电视图像的压缩算法采用两种基本压缩技术：u 为减少时间冗余度，采用1616个像素组成的图像块的运动补偿技术。u 为了减少空间冗余度，采用88图像化的DCT变换技术。681.MPEG1 标准标准n 声音压缩编码技术支持高压缩的音频数据流，其采样率为48，44.l或22KHz，量化精度为16位的声音压缩。n 支持两个声道，可设置成单声道（mono）、双声道（dual）或立体声（stereo）。采用MPEG1算法可以把位速率降到 0.192 Mbps。n MPEG1系统采用多路复合技术，把数字电视图像和声音复合成单一数据位流，

35、MPEG1的数据位流分成内外两层，外层为系统层，内层为压缩层。69 2.MPEG2 标准标准n MPEG2标准称为“活动图像及有关声音信息的通用编码”标准。n 设计目标是把以10Mbps速度传送每秒30帧、分辨率为720572高分辨率的广播级视频图像，压缩后的传送数据率为315Mbps。n MPEG2标准是HDTV、DVD以及新型数字式交互有线网所采用的数字视频压缩标准。n MPEG2标准是MPEG1标准的扩充、丰富和完善，并与MPEG1标准相兼容。702.MPEG2 标准标准 MPEG2标准主要分为四部分：u 第一部分：系统。第二部分：视频。u 第三部分：音频。第四部分：一致性测试。u MP

36、EG2标准使计算机处理全彩色、全屏幕、全动态的视频图像，同时也能使有线、无线、CDROM等传输和存储介质有效地传送视频图像，并且具有CD的音质，使多媒体技术与通信和广播等技术结合起来。713.MPEG4 标准标准n 用来支持低比特率下的多媒体通信，还支持用于通信、访问和数字视听数据处理的新方法。注重多媒体系统的交互性和灵活性，以最少量的数据、极低的音频/视频压缩码率来显示建立精确的画面，达到具有高效编码、高效存储与传播以及可交互操作的特性。724.MPEG7 标准标准n 正式名称为多媒体内容描述接口。n MPEG7标准只规定信息内容描述格式，而不规定如何从原始的多媒体资料中抽取内容描述和查询、

37、检索方法。MPEG7标准不针对特定的应用领域，而是尽可能支持广泛的应用领域。n 主要用途：在数字图书馆、多媒体目录服务、图像分析、音乐词典、教育、多媒体编辑、多媒体业务引导等多个领域。734.MPEG7 标准标准n 视频压缩算法用到了三项基本技术:u 帧间编码技术和基于块的运动补偿技术。u 空间压缩（也称为帧内压缩）技术。u 熵编码，使用Huffman编码技术。n MPEG标准所用的编码模型与JPEG的编码模型类似，分为5个阶段：u 帧间编码和运动补偿、变换编码、量化、直流分量DC及交流分量AC的编码和熵编码。74帧间编码技术帧间编码技术n 利用的时间相关性可进一步消除视频其相邻帧之间具有冗余

38、信息，提高压缩比。n 将图像分成三种类型：u 1.参考帧（I）以自身图像的相关性进行压缩处理，必须要传送。u 2.预测帧（P）用前面的参考帧或预测帧作为参照图像信息进行预测编码，并可作为下一个预测帧（B帧图像或P帧图像）的参照图像信息。但因此可能引起预测误差。75帧间编码技术帧间编码技术u 3.双向预测帧（B）u 又称插补帧，在预测时，既可以使用前面或后面的视频帧（I参考帧，P预测帧）进行双向预测，也可以同时使用前后两个视频帧进行预测编码，但本身不能作为下一个预测帧的参照图像信息。n在编码时，先对参考帧进行变换编码，然后对预测帧进行编码，再对两者之间的双向预测帧进行编码，这个过程对随后的下一个

39、预测帧和双向预测帧重复，直到完成所有帧的编码为止。76帧间编码技术帧间编码技术n 采用下述四种预测技术：n 帧内编码前向预测n 后向预测双向预测 u 图3-12显示一个典型的视频图像序列次序。I B B P B B P B B P B B P B B I B B 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 I I帧和帧和P P帧间有两个帧间有两个B B帧帧每十五帧有一幅每十五帧有一幅I I帧图像（帧图像（0.50.5秒）秒）77运动补偿技术运动补偿技术n 讨论预测器计算表达式，设前一参照帧为I0，后一参照帧为I2，当前帧为I1的示意图。78运动

40、补偿技术运动补偿技术n 表3-13给出了I帧内块、F前向预测块、B后向预测块和A平均值块的预测器的计算表达式。79 MPEG2 视频数据流的视频数据流的六层结构图六层结构图图像序列头图像序列头图像组图像组图像组图像组序列尾序列尾图像组图像组图像图像组头组头图象图象I、P、B图象图象I、P、B图像头图像头宏块片宏块片宏块片宏块片宏块宏块片头片头宏块宏块宏块宏块18828838848858868888视频序列层视频序列层图像组层图像组层宏块片层宏块片层宏块层宏块层YCb Cr图像层图像层块层块层80视频数据流之间视频数据流之间的关系图的关系图图像组层图像组层宏块层宏块层88像素像素块层块层

41、宏块片层宏块片层视频序列层视频序列层图像层图像层81MPEG视频压缩视频压缩数据流结构数据流结构n 1.视频序列层：u 图像序列头包含了图像宽度、高度、像素长宽比、帧率、位率、缓冲区尺寸、量化矩阵等信息。n 2.图像组层：u 图像组头包含时间代码等信息，图像组中的第一个图像总是I图像帧。n 3.图像层：u 由图像头及多个宏块片构成的。图像头包含该图像的编码类型及码表选择等信息。82MPEG视频压缩视频压缩数据流结构数据流结构n 4.宏块片层：u 宏块片由宏块片头和多个连续的宏块以及附加数据组成。n 5.宏块层：u MPEG算法中的基本编码单元。它是图像帧内的一个1616像素的亮度信息和两个8

42、8像素色差信号块组成，附加数据包括宏块的编号、宏块的编码类型、量化参数、运动矢量等信息。83宏块结构有三种格式宏块结构有三种格式n 411411格式：格式：422422格式：格式：54460123570123 Y Cb Cr Y Cb Cr84宏块结构有三种格式宏块结构有三种格式n 444格式：0 1 2 3 4 8 6 10 5 9 7 11 Y Cb Cr856.块块层层n MPEG算法中最小的编码单元，它包含88像素，有三类图像信息之一，亮度信号（Y）、色差信号（U/V）。Y U V 1 2 3 4 5 6 88 88 86MPEG 音频音频n MPEG音频标准有以下特点：u 1.音频

43、信号采样率可以是22KHz，44.1 KHz或48KHz。u 2.压缩后的比特流可以按以下3种模式之一支持单声道或双声道：u（1）提供给单音频通道的单声道模式。u（2）提供给两个独立的单音频通道的双单声道模式。u（3）提供给立体声通道的立体声模式。87MPEG 音频音频u 3.3个独立的压缩层次：u（1）层1最简单，使用比特率384Kbps。u（2）层2的复杂度中等，使用比特率192Kbps左右，主要应用于数字广播的音频编码。u（3）层3最复杂，使用比特率64Kbps，音质好，适用于ISDN上的音频传输。u 4.编码后的比特流支持循环冗余校验CRC。u 5.还支持在比特流中携带附加信息。88帧

44、间编码技术帧间编码技术n 编码器的输出视频图像序列排列顺序。1 4 2 3 7 5 6 10 8I P B B P B B P B9 13 11 12 16 14 15 B P B B I B Bn 发送端编码器的输出到接收端解码器的输入端，经解码器的输出，又恢复为图3-12编码器输入顺序显示。89运动补偿技术运动补偿技术n 运动矢量选择二维1616像素块作为一个的运动矢量处理。n 运动矢量又称为宏块，它有不同的类型：u 可以是I帧内型，F前向预测型、B后向预测型A平均值(双向预测）型。n 概念：当前图像可看作是前一帧图像位移后的结果，其位移的内容包括运动方向和运动幅度。运动补偿方法是跟踪画面

45、内的运动情况并对其加以补偿后，与当前的图像宏块值相减得到预测误差，再进行编码、传送。90运动补偿技术运动补偿技术n 讨论预测器计算表达式，设前一参照帧为I0，后一参照帧为I2，当前帧为I1的示意图。91运动补偿技术运动补偿技术n 表3-13给出了I帧内块、F前向预测块、B后向预测块和A平均值块的预测器的计算表达式。92 MPEG2 视频数据流的视频数据流的六层结构图六层结构图图像序列头图像序列头图像组图像组图像组图像组序列尾序列尾图像组图像组图像图像组头组头图象图象I、P、B图象图象I、P、B图像头图像头宏块片宏块片宏块片宏块片宏块宏块片头片头宏块宏块宏块宏块18828838848858

46、868888视频序列层视频序列层图像组层图像组层宏块片层宏块片层宏块层宏块层YCb Cr图像层图像层块层块层93视频数据流之间视频数据流之间的关系图的关系图图像组层图像组层宏块层宏块层88像素像素块层块层宏块片层宏块片层视频序列层视频序列层图像层图像层94MPEG视频压缩视频压缩数据流结构数据流结构n 1.视频序列层：u 图像序列头包含了图像宽度、高度、像素长宽比、帧率、位率、缓冲区尺寸、量化矩阵等信息。n 2.图像组层：u 图像组头包含时间代码等信息，图像组中的第一个图像总是I图像帧。n 3.图像层：u 由图像头及多个宏块片构成的。图像头包含该图像的编码类型及码表选择等信息。95MPEG

47、视频压缩视频压缩数据流结构数据流结构n 4.宏块片层：u 宏块片由宏块片头和多个连续的宏块以及附加数据组成。n 5.宏块层：u MPEG算法中的基本编码单元。它是图像帧内的一个1616像素的亮度信息和两个88像素色差信号块组成，附加数据包括宏块的编号、宏块的编码类型、量化参数、运动矢量等信息。96宏块结构有三种格式宏块结构有三种格式n 411411格式：格式：422422格式：格式：54460123570123 Y Cb Cr Y Cb Cr97宏块结构有三种格式宏块结构有三种格式n 444格式：0 1 2 3 4 8 6 10 5 9 7 11 Y Cb Cr986.块块层层n MPEG算

48、法中最小的编码单元，它包含88像素，有三类图像信息之一，亮度信号（Y）、色差信号（U/V）。Y U V 1 2 3 4 5 6 88 88 99MPEG 音频音频n MPEG音频标准有以下特点：u 1.音频信号采样率可以是22KHz，44.1 KHz或48KHz。u 2.压缩后的比特流可以按以下3种模式之一支持单声道或双声道：u（1）提供给单音频通道的单声道模式。u（2）提供给两个独立的单音频通道的双单声道模式。u（3）提供给立体声通道的立体声模式。100MPEG 音频音频u 3.3个独立的压缩层次：u（1）层1最简单，使用比特率384Kbps。u（2）层2的复杂度中等，使用比特率192Kbps左右，主要应用于数字广播的音频编码。u（3）层3最复杂，使用比特率64Kbps，音质好，适用于ISDN上的音频传输。u 4.编码后的比特流支持循环冗余校验CRC。u 5.还支持在比特流中携带附加信息。101

展开阅读全文