第3章多媒体信息编码优秀课件.ppt-得力文库

资源描述

《第3章多媒体信息编码优秀课件.ppt》由会员分享，可在线阅读，更多相关《第3章多媒体信息编码优秀课件.ppt（128页珍藏版）》请在得力文库 - 分享文档赚钱的网站上搜索。

1、第3章多媒体信息编码1 1第1页，本讲稿共128页第3章多媒体信息编码 3.1 引言引言 3.23.2无损数据压缩无损数据压缩无损数据压缩无损数据压缩3.3 3.3 有损压缩编码有损压缩编码2 2第2页，本讲稿共128页一、什么是数据压缩数据压缩就是在一定的精度损失条件下，以最少的数码表示信源所发出的信号.数据压缩处理一般由两个过程组成:一是编码过程,即对原始数据进行编码压缩,以便存储和传输;二是解码过程,即对压缩的数据进行解压,恢复成可用的数据。信源编码信道编码信道信道译码信源译码信源信宿3.1 引言3 3第3页，本讲稿共128页压缩/解压的过程EncoderDecoderInputMes

2、sageOutputMessageCompressedMessageaaaaaaaaaaaaaaaaaaaa20aaaaaaaaaaaaaaaaaaaaaCODEC4 4第4页，本讲稿共128页二、多媒体数据压缩编码的必要性压缩编码的必要性和重要性压缩编码的必要性和重要性1.1.多媒体系统技术多媒体系统技术多媒体系统技术多媒体系统技术:面向三维图形、立体声、彩色全屏幕运动画面的面向三维图形、立体声、彩色全屏幕运动画面的面向三维图形、立体声、彩色全屏幕运动画面的面向三维图形、立体声、彩色全屏幕运动画面的处理技术；处理技术；处理技术；处理技术；多种媒体承载的由模拟量转化成数字量信息的获取、表示、

3、多种媒体承载的由模拟量转化成数字量信息的获取、表示、多种媒体承载的由模拟量转化成数字量信息的获取、表示、多种媒体承载的由模拟量转化成数字量信息的获取、表示、存储、传输、表现。存储、传输、表现。存储、传输、表现。存储、传输、表现。2.2.未压缩的数字化信息量未压缩的数字化信息量未压缩的数字化信息量未压缩的数字化信息量 1 1页页页页B5B5文件数据量约为文件数据量约为文件数据量约为文件数据量约为6.61MB/P6.61MB/P180255mm180255mm2 212122 2像素像素像素像素/mm/mm2 28bit1B/8bit=6.61MB/P8bit1B/8bit=6.61MB/P650

4、MB650MB的的的的CDROMCDROM存放存放存放存放98Pages98Pages5 5第5页，本讲稿共128页二、多媒体数据压缩编码的必要性 CD-ACD-A激光唱盘每秒采样位为激光唱盘每秒采样位为激光唱盘每秒采样位为激光唱盘每秒采样位为1.41Mbps1.41Mbps44kHz16bit/Hz44kHz16bit/Hz 样本样本样本样本2(2(声道声道声道声道)1.41Mbps1.41Mbps650MB650MB的的的的CDROMCDROM存放存放存放存放1 1小时音乐小时音乐小时音乐小时音乐数字音频磁带数字音频磁带数字音频磁带数字音频磁带(DAT)(DAT)每秒采样位为每秒采样位为

5、每秒采样位为每秒采样位为768kbps768kbps48kHz16bit/Hz48kHz16bit/Hz 样本样本样本样本=768kbps=768kbps650MB650MB的的的的CDROMCDROM存放存放存放存放2 2小时节目小时节目小时节目小时节目数字电视图像数字电视图像数字电视图像数字电视图像 SIF(Source input format)SIF(Source input format)格式、格式、格式、格式、NFSCNFSC制、彩色、制、彩色、制、彩色、制、彩色、4:4:44:4:4采样采样采样采样每帧每帧每帧每帧:3522403B=253KB:3522403B=253KB每秒

6、每秒每秒每秒:253KB30=7.603MBps:253KB30=7.603MBps每片每片每片每片CDROM:650MB253kB=2569CDROM:650MB253kB=2569帧帧帧帧/片片片片 (650MB7.603MB)60=1.42(650MB7.603MB)60=1.42分分分分/片片片片6 6第6页，本讲稿共128页二、多媒体数据压缩编码的必要性2.2.未压缩的数字化信息量未压缩的数字化信息量未压缩的数字化信息量未压缩的数字化信息量数字电视图像数字电视图像数字电视图像数字电视图像 ICCR(International Consultative Committee for I

7、CCR(International Consultative Committee for Radio)Radio)格式、格式、格式、格式、PALPAL制、制、制、制、4:4:44:4:4采样采样采样采样每帧每帧每帧每帧:7205763B=1.24MB:7205763B=1.24MB每秒每秒每秒每秒:1.24MB25=31.1MBps:1.24MB25=31.1MBps每片每片每片每片CDROM:650MB1.24MB=524CDROM:650MB1.24MB=524帧帧帧帧/片片片片 650MB31.1MB=20.9650MB31.1MB=20.9秒秒秒秒/片片片片陆地卫星陆地卫星陆地卫星陆

8、地卫星(LandSat-3)(LandSat-3)分辨率分辨率分辨率分辨率2340324023403240、4 4波段、波段、波段、波段、7 7位采样精度位采样精度位采样精度位采样精度每幅每幅每幅每幅:2340324074=212Mb:2340324074=212Mb每天每天每天每天:212Mb30=6.36Gbit:212Mb30=6.36Gbit每年每年每年每年:6.36Gbit365=2321.4Gbit=290GB:6.36Gbit365=2321.4Gbit=290GB7 7第7页，本讲稿共128页三、多媒体数据压缩的可能性多媒体数据压缩的可能性（1 1）图像数据表示中大量冗余）图

9、像数据表示中大量冗余（2 2）图像数据压缩技术）图像数据压缩技术:利用图像数据冗余性减少数据量方法利用图像数据冗余性减少数据量方法1.1.空间冗余空间冗余空间冗余空间冗余静态图像存在的主要冗余静态图像存在的主要冗余静态图像存在的主要冗余静态图像存在的主要冗余;采样点颜色之间的空间连贯性采样点颜色之间的空间连贯性采样点颜色之间的空间连贯性采样点颜色之间的空间连贯性:区域中各点光强、色彩、饱和度同区域中各点光强、色彩、饱和度同区域中各点光强、色彩、饱和度同区域中各点光强、色彩、饱和度同;离散像素采样表示颜色没有利用这种空间连贯性离散像素采样表示颜色没有利用这种空间连贯性离散像素采样表示颜色没有利

10、用这种空间连贯性离散像素采样表示颜色没有利用这种空间连贯性;改变颜色的像素存储方式改变颜色的像素存储方式改变颜色的像素存储方式改变颜色的像素存储方式,利用空间连贯性利用空间连贯性利用空间连贯性利用空间连贯性,减少数据量减少数据量减少数据量减少数据量.8 8第8页，本讲稿共128页图图BitmapBitmap颜色相同的块颜色相同的块帧内压缩帧内压缩帧内压缩例如，在静态图像中有一块表面颜色均匀的区域，在此区域中所有点的光强和色彩以及饱和度都是相同的，因此数据有很大的空间冗余。9 9第9页，本讲稿共128页2.2.时间冗余时间冗余时间冗余时间冗余序列图像序列图像序列图像序列图像(电视、运动图像电视、

11、运动图像电视、运动图像电视、运动图像)表示常包含的冗余表示常包含的冗余表示常包含的冗余表示常包含的冗余;相邻帧记录了相邻时刻的同一场景画面相邻帧记录了相邻时刻的同一场景画面相邻帧记录了相邻时刻的同一场景画面相邻帧记录了相邻时刻的同一场景画面,移动物移动物移动物移动物位置稍不同位置稍不同位置稍不同位置稍不同.运动图像一般为位于一时间轴区间的一组运动图像一般为位于一时间轴区间的一组连续画面，其中的相邻帧往往包含相同的背景和连续画面，其中的相邻帧往往包含相同的背景和移动物体，只不过移动物体所在的空间位置略有移动物体，只不过移动物体所在的空间位置略有不同，所以后一帧的数据与前一帧的数据有许多不同，所以

12、后一帧的数据与前一帧的数据有许多共同的地方，这种共同性是由于相邻帧记录了相共同的地方，这种共同性是由于相邻帧记录了相邻时刻的同一场景画面，所以称为邻时刻的同一场景画面，所以称为时间冗余。时间冗余。同理，语音数据中也存在着时间冗余。同理，语音数据中也存在着时间冗余。1010第10页，本讲稿共128页时间冗余1111第11页，本讲稿共128页3.3.视觉冗余视觉冗余视觉冗余视觉冗余人类的视觉系统由于受生理特性的限制，对于图像场的注意是非均人类的视觉系统由于受生理特性的限制，对于图像场的注意是非均人类的视觉系统由于受生理特性的限制，对于图像场的注意是非均人类的视觉系统由于受生理特性的限制，对于图像场

13、的注意是非均匀的，人对细微的颜色差异感觉不明显。匀的，人对细微的颜色差异感觉不明显。匀的，人对细微的颜色差异感觉不明显。匀的，人对细微的颜色差异感觉不明显。例如，人类视觉的一般分辨能力为例如，人类视觉的一般分辨能力为例如，人类视觉的一般分辨能力为例如，人类视觉的一般分辨能力为2626灰度等级，而一般的图像的灰度等级，而一般的图像的灰度等级，而一般的图像的灰度等级，而一般的图像的量化采用的是量化采用的是量化采用的是量化采用的是2828灰度等级，即存在视觉冗余。灰度等级，即存在视觉冗余。灰度等级，即存在视觉冗余。灰度等级，即存在视觉冗余。人类的听觉对某些信号反映不太敏感，使得压缩后再还原有允人类的

14、听觉对某些信号反映不太敏感，使得压缩后再还原有允人类的听觉对某些信号反映不太敏感，使得压缩后再还原有允人类的听觉对某些信号反映不太敏感，使得压缩后再还原有允许范围的变化，人也感觉不出来。许范围的变化，人也感觉不出来。许范围的变化，人也感觉不出来。许范围的变化，人也感觉不出来。(1).(1).人类视觉系统对图像场的敏感性是非均匀的和非线性的人类视觉系统对图像场的敏感性是非均匀的和非线性的人类视觉系统对图像场的敏感性是非均匀的和非线性的人类视觉系统对图像场的敏感性是非均匀的和非线性的;(2).(2).记录图像时假定视觉系统是均匀和线性的记录图像时假定视觉系统是均匀和线性的记录图像时假定视觉系统是均

15、匀和线性的记录图像时假定视觉系统是均匀和线性的,对不同敏感区同样对待对不同敏感区同样对待对不同敏感区同样对待对不同敏感区同样对待,产生了视觉产生了视觉产生了视觉产生了视觉冗余冗余冗余冗余.应对不同敏感部分分开编码应对不同敏感部分分开编码应对不同敏感部分分开编码应对不同敏感部分分开编码;1212第12页，本讲稿共128页(3).(3).视觉的非均匀性视觉的非均匀性视觉的非均匀性视觉的非均匀性.视觉系统对图像的亮度和色彩度的敏感性相差很大，视觉系统对图像的亮度和色彩度的敏感性相差很大，视觉系统对图像的亮度和色彩度的敏感性相差很大，视觉系统对图像的亮度和色彩度的敏感性相差很大，RGBRGBNTSCN

16、TSC的的的的YIQYIQ后发现后发现后发现后发现,视觉系统的亮度视觉系统的亮度视觉系统的亮度视觉系统的亮度y y的敏感度远高于色度的敏感度远高于色度的敏感度远高于色度的敏感度远高于色度(I,Q)(I,Q)的敏感度的敏感度的敏感度的敏感度可对可对可对可对IQIQ允允允允许误差大于许误差大于许误差大于许误差大于y y的允许误差的允许误差的允许误差的允许误差;亮度增加时亮度增加时亮度增加时亮度增加时,视觉系统对量化误差的敏感度降低视觉系统对量化误差的敏感度降低视觉系统对量化误差的敏感度降低视觉系统对量化误差的敏感度降低,人眼辨别能力与物体周围人眼辨别能力与物体周围人眼辨别能力与物体周围人眼辨别能力

17、与物体周围的背景亮度成反比的背景亮度成反比的背景亮度成反比的背景亮度成反比.在高亮度区在高亮度区在高亮度区在高亮度区,灰度值的量化可粗糙一些灰度值的量化可粗糙一些灰度值的量化可粗糙一些灰度值的量化可粗糙一些;人眼的视觉系统能把图像的边缘和非边缘区域分开处理人眼的视觉系统能把图像的边缘和非边缘区域分开处理人眼的视觉系统能把图像的边缘和非边缘区域分开处理人眼的视觉系统能把图像的边缘和非边缘区域分开处理边缘区和非边缘区边缘区和非边缘区边缘区和非边缘区边缘区和非边缘区分别编码的依据分别编码的依据分别编码的依据分别编码的依据;人眼的视觉系统是把视网膜上的图像分解成若干个空间有向的视频通道后人眼的视觉系统

18、是把视网膜上的图像分解成若干个空间有向的视频通道后人眼的视觉系统是把视网膜上的图像分解成若干个空间有向的视频通道后人眼的视觉系统是把视网膜上的图像分解成若干个空间有向的视频通道后再进行处理再进行处理再进行处理再进行处理编码时把图像分解成符合这一规律编码时把图像分解成符合这一规律编码时把图像分解成符合这一规律编码时把图像分解成符合这一规律(视觉内在特性视觉内在特性视觉内在特性视觉内在特性)的频率通道的频率通道的频率通道的频率通道,可获大的压缩比可获大的压缩比可获大的压缩比可获大的压缩比;小波编码的特性小波编码的特性小波编码的特性小波编码的特性.1313第13页，本讲稿共128页4.4.结构冗余结

19、构冗余结构冗余结构冗余图像纹理区的像素值存在着分布模式图像纹理区的像素值存在着分布模式图像纹理区的像素值存在着分布模式图像纹理区的像素值存在着分布模式:如方格状地板图案如方格状地板图案如方格状地板图案如方格状地板图案;已知分布模式已知分布模式已知分布模式已知分布模式,可通过某一过程生成图像可通过某一过程生成图像可通过某一过程生成图像可通过某一过程生成图像.5.5.知识冗余知识冗余知识冗余知识冗余有些图像的理解与某些知识有相当大的相关性有些图像的理解与某些知识有相当大的相关性有些图像的理解与某些知识有相当大的相关性有些图像的理解与某些知识有相当大的相关性,如人脸的图像有固定结构如人脸的图像有固

20、定结构如人脸的图像有固定结构如人脸的图像有固定结构;规律性结构可由先验知识和背景知识获得规律性结构可由先验知识和背景知识获得规律性结构可由先验知识和背景知识获得规律性结构可由先验知识和背景知识获得知识冗余知识冗余知识冗余知识冗余;由已有知识由已有知识由已有知识由已有知识,对图像中物体构造其基本模型对图像中物体构造其基本模型对图像中物体构造其基本模型对图像中物体构造其基本模型,创建对应各种特征的图像库创建对应各种特征的图像库创建对应各种特征的图像库创建对应各种特征的图像库:存存存存储时只需保存图像的一些特征参数储时只需保存图像的一些特征参数储时只需保存图像的一些特征参数储时只需保存图像的一些特征

21、参数;知识冗余是模型编码主要利用的特征知识冗余是模型编码主要利用的特征知识冗余是模型编码主要利用的特征知识冗余是模型编码主要利用的特征.6.6.图像区域的相同性冗余图像区域的相同性冗余图像区域的相同性冗余图像区域的相同性冗余图像中多个区域所对应的像素值相同或者相近图像中多个区域所对应的像素值相同或者相近图像中多个区域所对应的像素值相同或者相近图像中多个区域所对应的像素值相同或者相近,产生重复产生重复产生重复产生重复性存储性存储性存储性存储;向量量化向量量化向量量化向量量化(Vector quantization)(Vector quantization)是针对这种冗余的压缩是针对这种冗余的压缩

22、是针对这种冗余的压缩是针对这种冗余的压缩编码方法编码方法编码方法编码方法.1414第14页，本讲稿共128页时间域压缩迅速传输媒体信源频率域压缩并行开通更多业务空间域压缩降低存储费用能量域压缩降低发射功率四、数据压缩的好处多媒体数据压缩的必要性数据存储传输带宽1515第15页，本讲稿共128页五、压缩编码算法的性能评价指标数据压缩编码算法的评估指标包括：1.压缩比压缩比2.保真度保真度3.算法复杂性算法复杂性4.时延时延一个好的算法还要考虑：多媒体系统的软、硬件适应能力。多媒体系统的软、硬件适应能力。应用环境应用环境技术标准技术标准1616第16页，本讲稿共128页压缩编码算法的性能评价指

23、标压缩比：压缩比压缩前数据量压缩比压缩前数据量/压缩后数据量压缩后数据量理论上讲，在保证压缩后图像质量的前提下，压理论上讲，在保证压缩后图像质量的前提下，压缩比越高越好。缩比越高越好。保真性：保真是一个对压缩质量进行评价的参数，分为主观保真度保真是一个对压缩质量进行评价的参数，分为主观保真度和客观保真度。和客观保真度。客观保真度用重建信号质量与原信号之间的均方误客观保真度用重建信号质量与原信号之间的均方误差来衡量：差来衡量：x xi i和和和和x xi i 分别对应原信号和重建信号，分别对应原信号和重建信号，分别对应原信号和重建信号，分别对应原信号和重建信号，N N2 2为总信息数为总信息数为

24、总信息数为总信息数量。量。量。量。1717第17页，本讲稿共128页压缩编码算法的性能评价指标保真性：客观保真性：将均方误差作为由数据压缩而产生的噪声客观保真性：将均方误差作为由数据压缩而产生的噪声能量，定义压缩信噪比为能量，定义压缩信噪比为主观保真性：在规定的观测条件（图像尺寸、对主观保真性：在规定的观测条件（图像尺寸、对主观保真性：在规定的观测条件（图像尺寸、对主观保真性：在规定的观测条件（图像尺寸、对比度、亮度、观测距离等）下，对一组标准图像比度、亮度、观测距离等）下，对一组标准图像比度、亮度、观测距离等）下，对一组标准图像比度、亮度、观测距离等）下，对一组标准图像压缩前后的质量进行对比

25、的主观评定标准。具体压缩前后的质量进行对比的主观评定标准。具体压缩前后的质量进行对比的主观评定标准。具体压缩前后的质量进行对比的主观评定标准。具体做法是对重建信号的特性进行按等级评分，然后做法是对重建信号的特性进行按等级评分，然后做法是对重建信号的特性进行按等级评分，然后做法是对重建信号的特性进行按等级评分，然后根据下式计算平均分根据下式计算平均分根据下式计算平均分根据下式计算平均分MOSMOS：其中，其中，其中，其中，k k为级别数，为级别数，为级别数，为级别数，n ni i为该类别的人数，为该类别的人数，为该类别的人数，为该类别的人数，c ci i为分数。为分数。为分数。为分数。1818第

26、18页，本讲稿共128页六、压缩分类（1）1、按照压缩方法是否产生失真分类(1)无失真压缩无失真压缩要求解压以后的数据和原始数据完全一致。解压后得到的数据是原数据的复制，是一种可逆压缩。无失真压缩法去掉或减少数据中的冗余，恢复时再重新插到数据中，因此是可逆过程根根据据目目前前的的技技术术水水平平，无无损损压压缩缩算算法法一一般般可可以以把把普普通通文文件件的的数数据据压压缩缩到到原原来来的的1/21/21/41/4。一一些些常常用用的的无无损损压压缩缩算算法法有有赫赫夫夫曼曼(Huffman)(Huffman)算算法法和和LZW(Lenpel-Ziv&Welch)LZW(Lenpel-Ziv

27、&Welch)压缩算法压缩算法1919第19页，本讲稿共128页(2)有失真压缩解压以后的数据和原始数据不完全一致，是不可逆压缩方式。有失真压缩还原后，不影响信息的表达。例如，图像、视频、音频数据的压缩就可以采用有损压缩方法，因为其中包含的数据往往多于我们的视觉系统和听觉系统所能接收的信息，丢掉一些数据而不至于对声音或者图像所表达的意思产生误解，但可大大提高压缩比。图像、视频、音频数据的压缩比可高达100:1，但人的主观感受仍不会对原始信息产生误解。2020第20页，本讲稿共128页多媒体信息编码技术主要侧重于有损压缩编码的研究。经过多年的研究与开发,已经出台了一系列有关的国际标准。其中,最

28、著名的是国际标准组织（ISO）制定的JPEG和MPEG。JPEG是静止图像的压缩标准,其压缩比可达401。MPEG（MPEG-1、MPEG-2及MPEG-4）是动态图像的压缩标准,采用MPEG-2标准对NTSC质量视频进行压缩后,网络带宽需求可降低到3.36 Mb/s。其它的标准还有国际电信联合会（ITU）制定的用于可视电话、会议电视的H.261和H.263;用于音频的G.711、G.721、G.728等。2121第21页，本讲稿共128页六、压缩分类（2）根据码词长度是否相等分类定定长码长码（fixed-length codefixed-length code）采用相同的位数（采用相同的位数

29、（bitbit）对对数据数据进进行行编码编码大多数存大多数存储储数字信息的数字信息的编码编码系系统统都采用定都采用定长码长码变长码变长码（variable-length codevariable-length code）采用不相同的位数（采用不相同的位数（bitbit）对对数据数据进进行行编码编码，以，以节节省省存存储储空空间间示例：示例：赫夫曼赫夫曼编码编码2222第22页，本讲稿共128页六、压缩分类（3）按照压缩方法的原理分类预测编码：基本思想是利用已被编码的点的数据值，预测邻近的一个像素点的数据值变换编码:基本思想是将图像的光强矩阵变换到系数空间上，然后对系数进行编码压缩统计编码：根据

30、信息出现概率的分布特性而进行的压缩编码*无失真编码*分析合成编码：基元和特征参数混合编码：混合压缩是利用了各种单一压缩的长处，以求在压缩比、压缩效率及保真度之间取得最佳折衷2323第23页，本讲稿共128页多媒体数据压缩编码方法PCM固定自适应自适应预测编码固定DPCMMADPCM运动补偿变换编码傅立叶(DFT)离散余弦(DIT)离散正弦(DST)沃尔什-哈达马哈尔斜变换卡胡南-苏夫(KL)小波变换子带编码统计编码(熵编码)(无损)哈夫曼算术编码费诺香农游程(RLC)LZW静图像编码方块逐渐浮现逐层内插位平面抖动电视图像编码帧内预测帧间编码运动估计运动补偿条件补充内插帧间预测基于重

31、要性矢量量化滤波子采样模型编码分形编码混合编码H.261JPEGMPEG图3-1 多媒体数据压缩编码方法2424第24页，本讲稿共128页3.2无损数据压缩无损数据压缩数据压缩的理论基础为数据压缩的理论基础为ShannonShannon信息论。它一方面信息论。它一方面给出了数据压缩的理论极限，另一方面又指明了数据给出了数据压缩的理论极限，另一方面又指明了数据压缩的技术途径。压缩的技术途径。香农香农-范诺范诺霍夫曼编码霍夫曼编码算术编码算术编码 RLERLE编码编码词典编码词典编码统计编码统计编码统计编码统计编码2525第25页，本讲稿共128页3.2.1信息熵及基本概念 1信息量与信

32、息熵信息量信息量式中，P(xj)是信源X发出xj的概率。I(xj)的含义是，信源X发出xj这个消息（随机事件）后，接收端收到信息量的量度。2626第26页，本讲稿共128页l信源信源X的的“熵熵”：信源X发出的xj（j=1,2,n）共n个随机事件的自信息统计平均，即等概率事件的熵最大：当P(x1)1时，P(x2)P(x3)P(xj)0，此时熵为由上可得熵的范围为：2727第27页，本讲稿共128页平均码长与熵如果信源如果信源X输出为一个随机变量序列aj j，对aj j的编码长度为Lj j，则，则X X的平均码长为：对信源编码的最小平均码长为该信源的熵，为：P Pj j 表示符号表示符号

33、a aj j 在在X X中出现的概率中出现的概率2828第28页，本讲稿共128页在编码中用熵值来衡量是否为最佳编码。若以在编码中用熵值来衡量是否为最佳编码。若以LcLc表表示编码器输出码字的平均码长，则当示编码器输出码字的平均码长，则当LcH(X)LcH(X)有冗余，不是最佳。有冗余，不是最佳。LcLcH(X)H(X)不可能。不可能。LcLcH(X)H(X)最佳编码（最佳编码（LcLc稍大于稍大于H(X)H(X)）。）。熵值为平均码长熵值为平均码长LcLc的下限。的下限。平均码长Lc的计算公式为：（j=1,2,n）其中：P(xj)是信源X发出xj的概率，L(xj)为xj的编码长。2929第2

34、9页，本讲稿共128页Entropy Example【例1】【例2】一幅用256级灰度表示的图像，如果每一个象素点灰度的概率均为Pi=1/256，编码每一个象素点就需要编码每一个象素点就需要8 8位。位。3030第30页，本讲稿共128页【例例3 3】有一幅有一幅4040个象素组成的灰度图像，灰度共有个象素组成的灰度图像，灰度共有5 5级，级，4040个象素中出现灰度个象素中出现灰度A A、B B、C C、D D、E E的象素数的象素数如表所示。如果用如表所示。如果用3 3个位表示个位表示5 5个等级的灰度值，也就个等级的灰度值，也就是每个象素用是每个象素用3 3位表示，编码这幅图像总共需要位

35、表示，编码这幅图像总共需要120120位。位。H H(S S)=(15/40)log)=(15/40)log2 2(40/15)+(7/40)log(40/15)+(7/40)log2 2(40/7)+(5/40)log(40/7)+(5/40)log2 2(40/5)=2.196(40/5)=2.196，每每个个符符号号用用2.1962.196位位表示，表示，4040个象素需用个象素需用87.8487.84位。位。符符号号b bA AB BC CD DE E出出现现次数次数15157 77 76 65 53131第31页，本讲稿共128页2冗余度、编码效率与压缩比冗余度、编码效率与压缩比

36、设设原原图图像像的的平平均均码码长长为为L L，熵熵为为H(X)H(X)，压压缩缩后后图图像像的的平平均均码长为码长为LcLc，则定义冗余度为，则定义冗余度为：编码效率：编码效率：压缩比：压缩比：在数字图像通信系统中，冗余度、编码效率与压缩比是衡量信源特性以及编解码设备性能的重要指标。3232第32页，本讲稿共128页统计编码的基本思想：其宗旨在于找到一种编码使得平均码长到达熵极限，其宗旨在于找到一种编码使得平均码长到达熵极限，基本思想就是基本思想就是对于无记忆的信源，根据码字出现的对于无记忆的信源，根据码字出现的概率分布特性寻找概率与码字长度间的最优化匹配。概率分布特性寻找概率与码字长度间的

37、最优化匹配。对出现概率较大的符号取较短的码长，而对出现概率对出现概率较大的符号取较短的码长，而对出现概率较小的符号取较大的码长较小的符号取较大的码长，据此对信息进行压缩，据此对信息进行压缩。3.2.2统计编码(信息熵编码)信息信息熵编码熵编码也称也称为统计编码为统计编码，是利用信息源出，是利用信息源出现现的概的概率来率来进进行行编码编码，常，常见见的信息的信息熵编码熵编码包括哈夫曼包括哈夫曼编码编码、香、香农农-范范诺编码诺编码、行程、行程编码编码和算和算术统计编码术统计编码等。等。3333第33页，本讲稿共128页统计编码统计编码是一种无损编码，常用于图像、文档等要求无损失的压缩中。实现原理

38、：有些媒体（如图像，文档）数据中各样点值的出现概率在编码前可以统计出，结合其出现概率进行的编码可以充分降低数据量，同时又保证了媒体的质量。由于在编码过程中仅仅将这些媒体数据看成是一串数据，没有深入到其物理意义中去研究，所以压缩比率并不高。3434第34页，本讲稿共128页1、仙农-范诺(Shannon-Fano)编码最早阐述和实现这种编码的是Shannon(1948年)和Fano(1949年)，采用从上到下的方法进行编码。按照符号出现的频度或概率排序使用递归方法分成两个部分，每一部分具有近似相同的次数，0分在上，1分在下3535第35页，本讲稿共128页例子1例如，A，B，C，D和E符号符号出

39、出现现的次数的次数(P(Pi i)loglog2 2(1/P(1/Pi i)分配的代分配的代码码需要的位数需要的位数A A15(0.375)15(0.375)1.41501.415000003030B B7(0.175)7(0.175)2.51452.514501011414C C7(0.175)7(0.175)2.51452.514510101414D D6(0.150)6(0.150)2.73692.73691101101818E E5(0.125)5(0.125)3.00003.00001111111515ABCDE00111103636第36页，本讲稿共128页例子2SymbolCou

40、ntCodeA1500B701D5110C610E5111Firstdivision2nddivision3rddivision4thdivision3737第37页，本讲稿共128页符号符号频率频率信息量信息量总信息量总信息量A A15151.381.3820.6820.68B B7 72.482.4817.3517.35C C6 62.702.7016.2016.20D D6 62.702.7016.2016.20E E5 52.962.9614.8214.82编码编码码长码长BitBit数数00002 2303001012 2141410102 212121101103 31818111

41、1113 31515Total85.25bitsTotal89bits3838第38页，本讲稿共128页2.霍夫曼编码基本思想：对于出现概率较大的符号取较短的码长，而对于出现概率较大的符号取较短的码长，而对概率较小的符号则取较长的码长。对概率较小的符号则取较长的码长。霍夫曼编码（Huffman Encoding）又称变长度编码，或最优编码，即遵照霍夫曼编码原则的结果一定是平均码长最短。霍夫曼编码的特点：只适用于有限个离散信源；且实现起来相当复杂。3939第39页，本讲稿共128页具体的编码步骤如下：具体的编码步骤如下：（1 1）将信源符号出现的概率按由大到小的顺序排序。）将信源符号出现的概率按

42、由大到小的顺序排序。）将信源符号出现的概率按由大到小的顺序排序。）将信源符号出现的概率按由大到小的顺序排序。（2 2）将两处最小的概率进行组合相加，形成一个新的概率。）将两处最小的概率进行组合相加，形成一个新的概率。）将两处最小的概率进行组合相加，形成一个新的概率。）将两处最小的概率进行组合相加，形成一个新的概率。（3 3）将新出现的概率与未编码的字符一起重新排序。）将新出现的概率与未编码的字符一起重新排序。）将新出现的概率与未编码的字符一起重新排序。）将新出现的概率与未编码的字符一起重新排序。（4 4）重复步骤（）重复步骤（）重复步骤（）重复步骤（2 2）、（）、（）、（）、（3 3），直到

43、出现的概率和为），直到出现的概率和为），直到出现的概率和为），直到出现的概率和为1 1。（5 5）分配代码。代码分配从最后一步开始反向进行，对最后两个概）分配代码。代码分配从最后一步开始反向进行，对最后两个概）分配代码。代码分配从最后一步开始反向进行，对最后两个概）分配代码。代码分配从最后一步开始反向进行，对最后两个概率一个赋予率一个赋予率一个赋予率一个赋予0 0代码，一个赋予代码，一个赋予代码，一个赋予代码，一个赋予1 1代码。如此反向进行到开始的概率排代码。如此反向进行到开始的概率排代码。如此反向进行到开始的概率排代码。如此反向进行到开始的概率排列。在此过程中，若概率不变则采用原代码。列。

44、在此过程中，若概率不变则采用原代码。列。在此过程中，若概率不变则采用原代码。列。在此过程中，若概率不变则采用原代码。4040第40页，本讲稿共128页例例4 4：设输入图像的灰度级设输入图像的灰度级a1,a2,a3,a4,a5,a6a1,a2,a3,a4,a5,a6出现出现的概率分别是的概率分别是0.40.4、0.20.2、0.120.12、0.150.15、0.10.1、0.030.03。试。试进行哈夫曼编码，并计算编码效率、压缩比、冗余度。进行哈夫曼编码，并计算编码效率、压缩比、冗余度。编码步骤：编码步骤：（1 1）初始化，根据符号概率的大小按由大到小顺序对符号进行）初始化，根据符号概率的

45、大小按由大到小顺序对符号进行排序，如图排序，如图4-24-2所示。所示。（2 2）把概率小的两个符号组成一个节点，如图）把概率小的两个符号组成一个节点，如图4-24-2中的中的a5a5、a6a6组成节点组成节点P1P1。（3 3）重复步骤）重复步骤2 2，得到节点，得到节点P2P2、P3P3、P4P4、P5P5，形成一棵，形成一棵“树树”，其中，其中P5P5为根节点。为根节点。（4 4）从根节点）从根节点P5P5开始到相应于每个符号的开始到相应于每个符号的“树叶树叶”，从上，从上到下标上到下标上1 1（上枝）或者（上枝）或者0 0（下枝），至于哪个为（下枝），至于哪个为1 1哪个为哪个为0 0

46、则则无关紧要，最后的结果仅仅是分配的代码不同，而代码的平均长度无关紧要，最后的结果仅仅是分配的代码不同，而代码的平均长度是相同的。是相同的。最终编码结果为：a1=1,a2=000,a3=011,a4=001,a5=0100,a6=0101 4141第41页，本讲稿共128页由公式（由公式（4-64-6）可求得图像信源熵是：）可求得图像信源熵是：H(X)=H(X)=-=-（0.40.4 loglog2 20.4+0.20.4+0.2 loglog2 20.2+0.120.2+0.12 loglog2 20.12+0.12+0.150.15 loglog2 20.15+0.10.15+0.1 lo

47、glog2 20.1+0.030.1+0.03 loglog2 20.030.03）=2.25 bit=2.25 bit 根据哈夫曼编码过程图给出的结果，可求出它的平均码字长度：Lc=0.41+0.23+0.153+0.123+0.14+0.034=2.33编码效率为：压缩之前8个符号需要3个比特量化，经过压缩之后的平均码字长度为2.33，其压缩比为：冗余度为：r=1-=3.4%4242第42页，本讲稿共128页Huffman Coding的问题错错错错误误误误传传传传播播播播(error(errorpropagation)propagation)：霍霍夫夫曼曼码码没没有有错错误误保保护护功功

48、能能。在在译译码码时时，如如果果码码串串中中没没有有错错误误，就就能能一一个个接接一一个个地地正正确确译译出出代代码码。但但如如果果码码串串中中发发生生错错误误，不不但但这这个个码码本身译错，更糟糕的是一错一大串。本身译错，更糟糕的是一错一大串。霍霍夫夫曼曼码码是是可可变变长长度度码码，因因此此很很难难随随意意查查找找或或调调用用压压缩缩文文件件中中间间的的内内容容，然然后后再再译译码码，这这就就需需要要在在存存储储代代码码之之前前加加以以考考虑虑(必必须须在在存存储储代代码码前前先先进进行行译译码码)。尽尽管管如如此此，霍霍夫夫曼曼码码还是得到广泛应用。还是得到广泛应用。由由于于一一个个节节

49、点点的的上上下下两两个个分分支支即即可可以以赋赋值值“0 0”，也也可可以以赋赋值值“1 1”，因因此此同同一一信信源源对对应应的的霍霍夫夫曼曼编编码码并并不不唯唯一一，但平均码长是相同的。但平均码长是相同的。4343第43页，本讲稿共128页霍夫曼编码霍夫曼编码为唯一可译码，即码的任意一串有限长的码符霍夫曼编码为唯一可译码，即码的任意一串有限长的码符号序列只能被唯一译成所对应的信源符号。号序列只能被唯一译成所对应的信源符号。霍夫曼对不同的信源，其编码效率是不同的。当信源概率霍夫曼对不同的信源，其编码效率是不同的。当信源概率分布很不均匀时，霍夫曼码会具有显著效果。分布很不均匀时，霍夫曼码会具有

50、显著效果。如果信源的实际概率模型与构码时所假设的概率模型有差异，如果信源的实际概率模型与构码时所假设的概率模型有差异，实际的平均码字将大于预期值，编码效率将下降。这种情况实际的平均码字将大于预期值，编码效率将下降。这种情况下，唯一的解决办法就是更换码表，使之与实际概率模型匹下，唯一的解决办法就是更换码表，使之与实际概率模型匹配。配。4444第44页，本讲稿共128页Huffman与Shannon-Fano特点霍夫曼编码与仙农-范诺编码这两种方法都自含同步码，即在编码之后的码串中都不需要另外添加标记符号，即在译码时分割符号的特殊代码。霍夫曼编码方法的编码效率比仙农-范诺编码效率高一些。Theor

展开阅读全文