第2章多媒体数据压缩编码技术PPT讲稿.ppt-得力文库

资源描述

《第2章多媒体数据压缩编码技术PPT讲稿.ppt》由会员分享，可在线阅读，更多相关《第2章多媒体数据压缩编码技术PPT讲稿.ppt（53页珍藏版）》请在得力文库 - 分享文档赚钱的网站上搜索。

1、第2章多媒体数据压缩编码技术第1页，共53页，编辑于2022年，星期一2.1多媒体数据数据压缩是通过减少计算机中所存储数据或者通信传播中数据的冗余度，达到增大数据密度，最终使数据的存储空间减少的技术。压缩编码的重要性和分类压缩编码的重要性和分类第2页，共53页，编辑于2022年，星期一2.1.1数据压缩编码的必要性多媒体数据，其惊人的数据量为媒体的存储、传输及处理带来了巨大的压力。为解决这一问题，单纯用扩大存储容量、增加传输线路带宽的办法是不现实的。因此，在多媒体的应用系统中，一定要对声音、图像等多媒体信号进行压缩。第3页，共53页，编辑于2022年，星期一2.1.2 数据压缩的可能性多

2、媒体数据表示中存在着大量的冗余,以图像数据压缩为例，图像信息冗余通常有以下几种情况：（1）空间冗余。在很多图像数据中，像素间在行、列方向上都有很大的相关性，相邻像素的值比较接近，或者完全相同，这种数据冗余叫做空间冗余。（2）时间冗余。在视频图像序列中，相邻两帧图像数据有许多共同的地方，这种共同性称为时间冗余，可采用运动补偿算法来去掉冗余信息.第4页，共53页，编辑于2022年，星期一2.1.2 数据压缩的可能性（3）视觉冗余。视觉冗余度是相对于人眼的视觉特性而言的，人类视觉系统对图像的敏感性是非均匀和非线性的，并不是图像中的所有变化人眼都

3、能观察到。（4）信息熵冗余。信息熵是指一组数据所携带的信息量，信息熵冗余指数据所携带的信息量少于数据本身而反映出来的数据冗余。（5）结构冗余。在有些图像的纹理区，图像的像素值存在着明显的分布模式。（6）知识冗余。有许多图像的理解与某些先验知识有相当大的相关性。这类规律性的结构可由先验知识和背景知识得到，称此类冗余为知识冗余。第5页，共53页，编辑于2022年，星期一2.1.3 数据压缩方法的分类图图2-1 2-1 常用压缩编码方法的分类常用压缩编码方法的分类第6页，共53页，编辑于2022年，星期一2.2 多媒体数据压缩编码基础数据压缩是通过消除输入数据序列（原始数据序列）中的冗余性，将它变

4、换成较短的输出数据序列（压缩数据序列）的技术。如果将压缩数据序列与原始数据序列长度之比定义为压缩比，尽量减小数据压缩的压缩比则是进行数据压缩的根本目的。第7页，共53页，编辑于2022年，星期一2.2.1 量化量化操作实质上是将连续的模拟信号采样得到的瞬时幅度值映射成离散的数字信号，即用一组规定的电平，把瞬时抽样值用最接近的电平值来表示。第8页，共53页，编辑于2022年，星期一2.2.1 量化 1.量化位数量化位数量化位数是每个采样点能够表示的数据范围，常用的有8位、12位和16位。量化过程是，先将整个幅值划分为有限个小幅度（量化阶距）的集合，把落入某个阶距内的样值归为一类，并赋予相同的

5、量化值，如图2-2所示，其中虚线箭头表示采样值量化后的电平值。第9页，共53页，编辑于2022年，星期一2.2.1 量化图图2-2 模拟信号的采样和量化模拟信号的采样和量化第10页，共53页，编辑于2022年，星期一2.2.1 量化2.均匀量化均匀量化采用相等的量化间隔对采样得到的信号做量化就是均匀量化,也称为线性量化。量化后的样本值Y和实际值X的差E=Y-X称为量化误差或量化噪声。第11页，共53页，编辑于2022年，星期一2.2.1 量化3.非均匀量化非均匀量化非均匀量化的基本思想是，对输入信号进行量化时，大的输入信号采用大的量化间隔，小的输入信号采用小的量化间隔，这样就可以在满足精度

6、要求的情况下用较少的位数来表示。声音数据还原时，采用相同的规则。第12页，共53页，编辑于2022年，星期一2.2.2莫尔斯码莫尔斯码即电报码，它采用“”和“-”来表示26个英文字母。采用常出现的字母用短码表示（如E用“”表示，T用“-”表示），不常出现的字母用长码表示（如Q用“-”表示，X用“-”表示）的变长编码方式以减少码率。第13页，共53页，编辑于2022年，星期一2.2.3哈夫曼编码该算法基于一种称为编码树的技术，其步骤如下：（1）将待编码的N个信源符号按照出现的概率由大到小排列，给排在最后的两个符号各分配一位二进制码元，对其中概率大的符号分配0，概率小的符号分配1（反之亦可）。

7、（2）把概率最小的两个符号概率相加，求出的和作为一个新符号的概率，将新的概率值与剩下的N-2个概率值一起重新进行排序，再重复步骤（1）的编码过程。（3）重复步骤（2）直到只剩一个概率值为止，其值为1。（4）分配码字，对于各种信源符号，基于步骤（1）分配的数字，从编码树的根部开始回溯读出，并将它作为该符号对应分配的码字。第14页，共53页，编辑于2022年，星期一2.2.3哈夫曼编码例设有离散无记忆信源，符号a1、a2、a3、a4、a5、a6的出现概率分别为0.12、0.08、0.4、0.1、0.25、0.05，其哈夫曼编码过程如下：第15页，共53页，编辑于2022年，星期一2.2.3哈夫曼

8、编码平均码长为：平均码长为：信源熵为：信源熵为：编码效率为：编码效率为：第16页，共53页，编辑于2022年，星期一2.2.3哈夫曼编码采用哈夫曼编码时有两个问题值得注意：采用哈夫曼编码时有两个问题值得注意：（1）哈夫曼编码没有错误保护功能。在译码时，如果某些位出现错误，会引起一连串的错误，造成错误传播（ErrorPropagation）。计算机对这种错误也无能为力，说不出错在哪里，更谈不上去纠正它。（2）哈夫曼编码是可变长度码，因此很难随意查找或调用压缩文件中的内容，然后再译码，这就需要在存储代码之前加以考虑。尽管如此，哈夫曼编码还是得到了广泛的应用。第17页，共53页，编辑于2022

9、年，星期一2.2.4行程长度编码行程长度编码（Run-LengthEncoding，RLE）也称游程编码，是一种非常简单的数据压缩编码形式。它基于简单的编码数据原则，即重复的数据值序列（或称为流）用一个重复次数和单个数据值来代替。这里，重复的次数称为“游程”。控制符重复次数被重复字符图图2-3 32-3 3字节码字格式字节码字格式第18页，共53页，编辑于2022年，星期一2.2.5预测编码1.差值脉冲编码调制（差值脉冲编码调制（DPCM）设二维图像上空间坐标为（i，j）的像素的实际样本值为f（i，j），f（i，j）是根据已传输的相邻像素的样本值对该像素估算得到的预测值。实际值和预测值之间的

10、差值即预测误差，用下式来表示：e（i，j）=f（i，j）-f（i，j）由于图像像素之间有极强的相关性，所以这个预测误差是很小的。编码时，是对预测误差e（i，j）进行量化、编码、发送，由此而得名为差值脉冲编码调制法（DPCM）。第19页，共53页，编辑于2022年，星期一2.2.5预测编码图图2-4 DPCM编、解码原理图编、解码原理图第20页，共53页，编辑于2022年，星期一2.2.5预测编码2.自适应差值脉冲编码调制（自适应差值脉冲编码调制（ADPCM）其基本思想是：利用自适应的思想改变量化阶的大小，即使用小的量化阶(step-size)去编码小的差值，使用大的量化阶去编码大的差值；使用过

11、去的样本值估算下一个输入样本的预测值，使实际样本值和预测值之间的差值总是最小。其简化的编码框图如图2-5所示。第21页，共53页，编辑于2022年，星期一2.2.5预测编码图图2-5 ADPCM简化的编码框图简化的编码框图第22页，共53页，编辑于2022年，星期一2.2.5预测编码3.帧间预测编码帧间预测编码采用预测编码方法消除序列图像在时间上的相关性，传送前后两帧的对应像素之间的差值，这称为帧间预测。图图2-6 具有运动补偿的帧间预测具有运动补偿的帧间预测第23页，共53页，编辑于2022年，星期一2.2.6矢量量化在矢量量化编码中，是把输入数据几个一组地分成许多组，成组地量化编码，即

12、将这些数看成一个k维矢量，然后以矢量为单位逐个矢量进行量化。矢量量化一般是限失真编码。输入矢量X是一个待编码的k维矢量，该矢量原则上既可以是原始图像，也可以是图像的预测误差或变换矩阵系数的分块（或称分组）。码本C是一个具有N个k维矢量的集合，C=Yi，i=1，2，N，第24页，共53页，编辑于2022年，星期一2.2.6矢量量化矢量编码的过程就是在码本C中搜索一个与输入矢量最接近的码字Yi的过程。在码本中寻找到与输入矢量完全一致的码字的概率很小，但只要二者之间误差最小时，便可用该码字Yi代表输入矢量。传输时并不传送码字Yi本身，只传送其下标“i”。当码本长度为N，为传送下标所需要的比特数为l

13、og2N。传送一个像素所需要的平均比特数为log2N。第25页，共53页，编辑于2022年，星期一2.2.6矢量量化图图2-7 矢量量化编码解码框图矢量量化编码解码框图第26页，共53页，编辑于2022年，星期一2.2.7变换编码变换编码也是去除冗余的一种最基本的编码方法。不同的是变换编码首先要把压缩的数据变换到某个变换域中（如频域），然后再进行编码。变化域中表现为能量集中在某个区域，可以利用这一特点在不同区域间有效地分配量化比特数，或者去掉那些能量很小的区域，从而达到数据压缩的目的。例如声音信号，从时域变换到频域以后，可以清楚的看到能量集中在哪些频率范围内，从而根据频率范围分布有效地分配不

14、同的量化位数。第27页，共53页，编辑于2022年，星期一2.3静态图像压缩标准JPEG JPEG（JointPhotographicExpertsGroup）是联合图像专家小组的英文缩写，这个专家组是由国际电报电话咨询委员会（CCITI）和国际标准化协会（ISO）于1986年联合组成负责制定静态的数字图像数据压缩编码方法，这个专家组开发的算法称为JPEG算法，并于1991年正式成为国际标准，编号为ISO/IEC10918，现常称为JPEG标准。JPEG是一个使用范围很广的静态图像数据压缩标准，既可用于灰度图像又可用于彩色图像。第28页，共53页，编辑于2022年，星期一2.3.1JPEG压缩

15、算法简介JPEG的目的是为了给出一个连续色调图像的压缩方法使之满足以下要求：(1)压缩比可控:能覆盖一个较宽的图像质量等级范围，能达到“很好”到“极好”的评估，与原始图像相比，人的视觉难以区分。(2)不受限制:适用于所有的连续色调图像，不应对图像的尺寸、彩色空间和像素纵横比等特性进行限制，也不应对图像的场景内容(如复杂性、彩色范围或统计特性)有任何限制。(3)适中的计算复杂性:压缩算法既可用软件实现，也可用硬件实现，并具有较好的性能。(4)具有顺序编码、累进编码、无失真编码和层次编码4种操作模式。第29页，共53页，编辑于2022年，星期一2.3.2JPEG压缩基本处理算法1.分块采样分块采样

16、 JPEG压缩首先要对连续彩色图像的每一帧中的亮度信号（Y）和色差（CR、CB）信号进行单独采样。采样时，首先将图像分割成许多1616个采样点构成的宏区块，将宏区块再分成4部分，每一部分为88个采样点组成的像块，像块是基于DCT压缩编码处理的最小单位，DCT变换就是以像块为单位的。第30页，共53页，编辑于2022年，星期一2.3.2JPEG压缩基本处理算法第31页，共53页，编辑于2022年，星期一2.3.2JPEG压缩基本处理算法2.DCT变换变换 DCT是英文DiscreteCosineTransform的缩写，意思是离散余弦变换。它是一种傅立叶变换，任何连续的实对称函数采用傅立叶变换后

17、，只含余弦项。在空间域中的样值矩阵，经DCT变换后，成了频率域中88DCT系数矩阵。频域中的右下角对应高频部分，而在左上角对应低频部分，其中左上角（0，0）位置的系数反映图像子块的平均样本值，对应直流分量，称为DC系数。其其他他63个个对对应应交交流流分分量量的的系系数，称为数，称为AC系数。系数。第32页，共53页，编辑于2022年，星期一2.3.2JPEG压缩基本处理算法DCT变换公式为：变换公式为：正变换：正变换：逆变换：逆变换：其中：其中：DC系数：系数：第33页，共53页，编辑于2022年，星期一2.3.2JPEG压缩基本处理算法3.DCT系数量化系数量化经过DCT变换后，DCT系

18、数间的相关性已经显现出来，即左上角的系数值大，而右下角的系数值小，为数据压缩创造了必要条件。但这种相关性还不是十分明显，要最终实现数据压缩，还需要进一步降低非零系数的幅值，增加零值系数的数量，从而进一步提高F矩阵的相关性。为此还要对变换后的DCT系数进行量化，来减少表示每个DCT系数所使用的位数，另外可以增加零值系数，提高压缩比。第34页，共53页，编辑于2022年，星期一2.3.2JPEG压缩基本处理算法表表2-1 亮度量化表亮度量化表表表2-2 色度量化表色度量化表第35页，共53页，编辑于2022年，星期一2.3.2JPEG压缩基本处理算法对DCT系数的量化是基于限失真编码理论进行

19、的，量化是造成图像质量下降的最主要的原因。其作用是在一定的主观保真度图像质量的前提下，丢掉那些对视觉效果影响不大的信息，失真度在人的视觉所能接受的容限之内。第36页，共53页，编辑于2022年，星期一2.3.2JPEG压缩基本处理算法4.DC系数差值编码和系数差值编码和AC系数的行程编码系数的行程编码量化后的64个DCT系数仍然是二维系数矩阵，坐标（0，0）处的系数是直流分量，相邻两个88像块之间的DC系数有强相关性，JPEG中对DC系数采用DPCM编码，即对相邻块之间的DC系数差值DIFF=DCi-DCi-1进行编码。其余63个交流系数采用行程编码，使用Z字形扫描方式可以增加连续零系数的个

20、数，也就是增加零值的游程长度。图2-9为Z字形扫描轨迹图。从左上方AC01开始，沿对角线方向，直到AC77扫描结束。63个AC系数行程编码的码字，可用2个字节来表示，如图2-10所示。第37页，共53页，编辑于2022年，星期一2.3.2JPEG压缩基本处理算法图图2-9 Z字形扫描字形扫描第38页，共53页，编辑于2022年，星期一2.3.2JPEG压缩基本处理算法图图2-10 AC系数行程编码的码字系数行程编码的码字第39页，共53页，编辑于2022年，星期一2.3.2JPEG压缩基本处理算法 5.熵编码熵编码为了进一步压缩数据，对DPCM编码后的直流系数DC和RLE编码后的交流系数A

21、C采用熵编码。在JPEG有损压缩算法中，使用哈夫曼编码器的理由是可以使用很简单的查表方法进行编码。压缩数据符号时，哈夫曼编码器对出现频率比较高的符号分配比较短的代码，而对出现频率低的符号分配比较长的代码。这种可变长度的哈夫曼编码表可以事先进行定义。为了实现正确解码，发送端和接收端必须采用相同的哈夫曼编码表。第40页，共53页，编辑于2022年，星期一2.4运动图像压缩标准MPEG MPEG（MovingPictureExpertGroup，活动图像专家组）是在 1988年由ISO（InternationalOrganizationforStandardization，国际标准化组织

22、）和IEC（InternationalElectrotechnicalCommission，国际电工委员会）联合成立的专家组，其任务是负责制订适用于数字存储媒介、电视广播和通信等应用场合的视频和音频数据的压缩编码标准。这个专家组开发的标准称为MPEG标准。第41页，共53页，编辑于2022年，星期一2.4.1运动图图像压缩编码的基本方法 MPEG运动图像压缩编码算法基于运动补偿和DCT算法。其基本思想和方法可以归纳为两点：在空间方向上，图像数据压缩采用JPEG压缩算法来去掉冗余信息。在时间方向上，图像数据压缩采用运动补偿算法来去掉冗余信息。第42页，共53页，编辑于2022年，星期一2.4.1

23、运动图图像压缩编码的基本方法为了保证图像质量基本不降低而又能够获得高的压缩比，在MPEG中将图像分为3种类型：帧内图像I（Intra Picture）、预测图像P（PredictedPicture）和双向预测图像B（BidirectionalPicture）。第43页，共53页，编辑于2022年，星期一2.4.1运动图图像压缩编码的基本方法帧内图像I不参考任何过去的或者是将来的其他图像帧，压缩编码采用类似JPEG压缩算法。I帧图像的压缩比相对较低。I帧图像提供了随机存取的插入点，另外I帧图像可作为B帧和P帧图像的预测参考帧。I帧图像是周期性出现在视频序列中的，出现频率可由编码器选择。第44

24、页，共53页，编辑于2022年，星期一2.4.1运动图图像压缩编码的基本方法预测图像P利用相邻帧的一般统计信息进行预测。也就是说,它考虑运动特性,提供帧间编码。P帧预测当前帧与前面最近的I帧或P帧的差别，在预测中使用了运动补偿算法，所以P帧图像的压缩比相对较高。第45页，共53页，编辑于2022年，星期一2.4.1运动图图像压缩编码的基本方法图像B是双向预测内插帧，它既用已传输的在视频序列中处于该帧前的I帧或P帧作预测参考帧，进行前向运动补偿预测；又用后面的P帧作预测参考帧，进行后向运动补偿预测。但B帧不能用来作为对其他帧进行运动补偿预测的参考帧。第46页，共53页，编辑于2022年，星期

25、一2.4.1运动图图像压缩编码的基本方法一个典型的MPEG图像排列如图2-11所示。图图2-11 典型的典型的MPEG图像帧排列图像帧排列第47页，共53页，编辑于2022年，星期一2.4.2MPEG系列标准1.MPEG-1标准标准MPEG-1的标准名称为“信息技术用于数据速率高达大约1.5Mbit/s的数字存储媒体的电视图像和伴音编码”，由如下五个部分组成：（1）MPEG-1系统（2）MPEG-1视频（3）MPEG-1声音（4）MPEG-1一致性测试（5）MPEG-1软件模拟第48页，共53页，编辑于2022年，星期一2.4.2MPEG系列标准2.MPEG-2数字电视标准数字电视标准 MPE

26、G-2标准是针对标准数字电视和高清晰度电视在各种应用下的压缩方案和系统层的详细规定，标准的正式规范在ISO/IEC13818中，标准名称为“信息技术电视图像和伴音信息的通用编码”。MPEG-2不是MPEG-1的简单升级，MPEG-2在系统和传送方面作了更加详细的规定和进一步的完善，克服并解决了MPEG-1不能满足日益增长的多媒体技术、数字电视技术对分辨率和传输率等方面的技术要求缺陷。第49页，共53页，编辑于2022年，星期一2.4.2MPEG系列标准与MPEG-1、MPEG-2相比，MPEG-4具有如下独特的优点：（1）基于内容的交互性（2）高效的压缩性（3）通用的访问性MPEG-4的主要

27、应用领域有：因特网多媒体应用、广播电视、交互式视频游戏、实时可视通信、交互式存储媒体应用、演播室技术及电视后期制作、远程视频监控、通过ATM网络等进行的远程数据库业务等。第50页，共53页，编辑于2022年，星期一2.4.2MPEG系列标准4.MPEG-7多媒体内容描述接口标准多媒体内容描述接口标准 MPEG-7的工作于1996年启动，名称叫做多媒体内容描述接口(Multimedia Content DescriptionInterface)，目的是制定一套描述符标准，用来描述各种类型的多媒体信息及它们之间的关系，以便实现快速有效地检索信息。这些媒体材料可包括静态图像、图形、3D模型、声音、话

28、音、电视以及在多媒体演示中它们之间的组合关系。在某些情况下，数据类型还可包括面部特性和个人特性的表达。第51页，共53页，编辑于2022年，星期一2.4.2MPEG系列标准5.MPEG-21多媒体框架标准多媒体框架标准制定MPEG-21标准的目的是建立一个规范且开放的多媒体传输平台，让所有的多媒体播放装置都能透过此平台接收多媒体资料，使用者可以利用各种装置、透过各种网络环境去获得多媒体内容，而无须知道多媒体资料的压缩方式及使用的网络环境。同样地，多媒体内容提供者或服务业者也不会受限于使用者的装置及网络环境，针对多种不同压缩方法来提供多媒体内容。第52页，共53页，编辑于2022年，星期一谢谢第53页，共53页，编辑于2022年，星期一

展开阅读全文

第2章 多媒体数据压缩编码技术PPT讲稿.ppt

第2章多媒体数据压缩编码技术PPT讲稿.ppt