数字图像处理与图像通信 Part3.3.ppt

上传人:s****8 文档编号:67292087 上传时间:2022-12-24 格式:PPT 页数:132 大小:1.47MB
返回 下载 相关 举报
数字图像处理与图像通信 Part3.3.ppt_第1页
第1页 / 共132页
数字图像处理与图像通信 Part3.3.ppt_第2页
第2页 / 共132页
点击查看更多>>
资源描述

《数字图像处理与图像通信 Part3.3.ppt》由会员分享,可在线阅读,更多相关《数字图像处理与图像通信 Part3.3.ppt(132页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、2.主观准则下的量化器设计主观准则下的量化器设计 依据主观评价准则来进行最佳量化器的设计。其基本原理是根据人眼的视觉掩盖特性,对视觉敏感区域细划分,而对不敏感区域粗划分,并且使量化误差总低于人的视觉可见度阈值,这样设计的量化器,量化误差尽管较大也不易察觉,可以达到在最小量化分层的条件下最佳的主观特性质量。在进行主观准则下最佳量化器的设计时,第一步就是通过实验测量确定预测误差与可见度阈值的关系曲线。图9.18中的上下两个座标中的曲线都是一条实测出来的可见度阈值函数曲线,这条曲线的意义是:某个像素的量化误差,若被同一像素位置的图像信号的预测误差的绝对值所掩盖(观察不出)时,其数值的上限等于可见度阈

2、值。这条实验曲线的趋势表明,当预测误差的绝对值增大时,主观视觉尚觉察不出的量化误差绝对值也随着增大。BUPT Press图9.18 主观准则下最佳量化器的设计 BUPT Press 有了可见度阈值曲线后,就可以用图解的方法来确 定最佳量化器的各量化电 平和判决电平。图9.18(a)所示量化分层总数K为奇数 时的设计方法;图9.18(b)为 K为偶数的情况。图9.19是 两种实际二维预测方案的 可见度阈值曲线。图9.19 两种二维预测方案的可见度阈值曲线 BUPT Press3.DPCM系统的量化信噪比系统的量化信噪比 DPCM系统的量化信噪比为:对于电视信号:这就是DPCM应用于电视信号时的量

3、化信噪比公式。从该式中可以看出,数字视频信号的精度,直接决定了信噪比的大小,每增加1比特精度,信噪比就大约增加6 dB。BUPT Press9.4.2 矢量量化矢量量化1.矢量量化的基本原理矢量量化的基本原理 矢量量化(VQ)就是把图像的样值每n个作为一组,这n个样值可以看成一个n维空间。任何一组的n个样值都可以看成n维空间的一个点,或者说是n维空间的矢量。矢量量化的过程如图9.20所示,可以分为量化和反量化两部分。图9.20 矢量量化过程示意图 BUPT Press2.码书的设计码书的设计 矢量量化中的一个关键问题就是码书的设计。码书的设计越适合待编码的图像的类型,矢量量化器的性能就越好。码

4、书是所有的输出码矢量的集合,设计码书就是在给定训练矢量集的基础上对矢量空间进行划分,并确定所有的码矢量,以使量化误差为最小。码书设计常用的算法是LGB (Linde-Guzo-Bray)算法,LGB算 法只能保证所设计出的码书是局部 最优的,但通常存在多个局部最优 点,有一些局部最优点的性能并不 好。因此,初始码书的选择非常重 要,好的初始码书通常能导致高性 能的矢量量化器。图9.21 二维矢量空间的划分 BUPT Press3.量化性能量化性能 矢量量化输出比特率的计算。设码书共有C 输出码字,矢量量化器输出为1,2,C序号,只需 个比特。输入矢量为n个(n 维),那么,每个抽样的输入所需的

5、比特数为 在满足一定失真条件下选定了量化级C 后,由上式可以看出,矢量量化可以减少所需的比特数。BUPT Press9.4.3 量化压缩机理量化压缩机理 当使用量化器来进行数据压缩时,不管是使用标量量化器还是矢量量化器,都可以把整个量化分别看成量化和反量化两个过程,由下式表示:量化实现数据压缩的根本原因在于传输中是以区间标号来取代原来的量值,而量化区间总数远远少于原量值的总数,由此就能用较少的比特将它们传输出去。量化过程是一个不可逆过程,用量化的方法来进行压缩编码是一种非信息保持型编码。在大部分应用场合,为了简化硬件或软件实现的复杂性,对量化区间标号(量化值)的编码仅采用简单的等长编码方法。在

6、一些要求较高的场合,也可采用可变字长编码来进一步改善编码效率,例如采用哈夫曼编码或算术编码等方法。BUPT Press10 静止图像编码静止图像编码10.1 方块编码方块编码(BTC)10.2 比特面编码比特面编码10.3 JPEG标准与标准与JPEG200010.4 二值图像编码方法简介二值图像编码方法简介 BUPT Press 静止图像是指从显示屏上观察到的内容不变的图像。从被摄对象来看,静止图像包括内容本身是静止的图像以及活动场景的某一时刻的“凝固”图像。如果从编码的角度来看,静止图像编码是指对单幅图像的编码。对于静止图像编码的要求主要有以下几点:(1)清晰度(2)逐渐浮现的显示方式(3

7、)抗干扰。静止图像编码传输系统一般的结构如图10.1所示。图10.1 静止图像数字传输系统一般的结构 BUPT Press10.1 方块编码方块编码(BTC)方块截断编码或简称为方块编码(Block Truncation Coding,简称 BTC)是把一幅图像分为大小为NN 的子像块(简称子块),由于小块内各相邻像素间具有亮度互相近似的相关性,于是只选用两个适当的亮度来近似代表小块内各像素原来的亮度,然后指明子块内的各像素分别属于哪个亮度。1.基本编码方法基本编码方法 设图像中的一个子块的大小为mNN个像素,子块中第i个像素为 ,其亮度值为 ,方块的两个代表性亮度为 ,称之为亮度级分量,用一

8、个二元码 指明像素 编码后属于 或 ,称为分辨力分量。设方块内的亮度阈值为 ,像素 编码后的电平值为 ,则基本编码方法可用下式表示:BUPT Press2.参数的选择参数的选择 m一定时,编码参数 及 的选择对恢复图像的质量有很大的影响。下面是两种较为典型的方式。(1)保持一阶矩、二阶矩的参数选择(方案1)取阈值 ,并记:,它为编码后亮度为 的像素 的个数。编码策略是保持子块的一阶矩和二阶矩不变,即:解此方程组可得:BUPT Press (2)均方误差最小的参数选择(方案2)取 ,编码策略是使均方误差最小,即:同样,记 ,则有 令 ,可以得出 BUPT Press3.进一步降低数码率的方法进一

9、步降低数码率的方法(1)选择合适的传输用的量度级分量,通过成组编码的方式降低其传输码率 对于方案1,可以用 和 取代 进行传输,收端则同样可以恢复编码图像。对于方案2,采用 或 作为传输亮度级,则根据下式同样可以恢复编码图像。即图10.2 两种不同参数组合的分布 BUPT Press(2)通过比特面的再划分,降低传输数码率图10.3 比特面的划分与编码 BUPT Press10.2 比特面编码比特面编码 比特面编码(Bit Plane Coding)是一种非常简单的编码方法,它把灰度图像的编码转换为对各比特面的二值编码。1.次最佳方块编码次最佳方块编码 次最佳方块编码方案如下:全“0”子块:码

10、字为“0”全“1”子块:码字为“11”其它情况:码字为“10”“xxxx”“xxxx”为将子块的比特内容直接输出,故又称为直接编码。这种编码方案的平均码长L:BUPT Press2.用格雷码表示像素亮度用格雷码表示像素亮度 由于格雷码的特点是码距为1,使得比特面上取值相同的面积增大,即P(0;n,m)和P(1;n,m)增大,因而增大了压缩比。3.视觉心理编码视觉心理编码 采用视觉心理编码是指,允许恢复图像有一定的失真,只要视觉感觉不出,或可以容忍。4.方块尺寸的选择方块尺寸的选择 在压缩比 的表示式中,它与 n,m的关系是复杂的。实验表明,取n=m=4较为合适。5.逐渐浮现的编码传输逐渐浮现的

11、编码传输 将图像从最高位到最低位的次序依次传送比特面,接收端将各比特面累加可以得到由粗到细的显示图像,这种编码传输方式是一种简单的逐渐浮现编码方式。如果对每一个比特面采用前述的比特面编码方法,还可以提高传输速率。BUPT Press10.3 JPEG标准与标准与JPEG200010.3.1 JPEG基本系统基本系统 JPEG是ISO/IEC和ITU-T的联合图片专家小组(Joint Photographic Experts Group)的缩称。JPEG以ADCT为基础,于 1990年3月提出一个建议标准草案,并于1991年3月正式通过,成为ISO/IEC 10918号标准,现常称为JPEG 建

12、议。图 10.4为 JPEG 基本系统的编码器的结构框图。图10.4 JPEG基本系统的编码器的结构框图 BUPT Press10.3.2 JPEG2000标准标准 JPEG2000是JPEG工作组制定的最新的静止图像压缩编码的国际标准,标准号为ISO/IEC 15444(ITUT T.800),并于2000年底陆续公布。JPEG2000主要由6个部分组成,其中,第一部分为编码的核心部分,第二至第六部分包括编码扩展(第二部分),Motion JPEG2000(MJP2,第三部分),一致性测试(第四部分),参考软件(第五部分),混合图像文件格式(第六部分)。图10.5是JPEG2000的基本模块

13、组成,其中包括预处理、DWT、量化、自适应算术编码以及码流组织等5个模块。图10.5 JPEG2000基本编码模块组成 BUPT Press1.输入输入 输入图像可以包含多个分量。通常的彩色图像包含3个分量(RGB或Y、Cb、Cr),但为了适应多谱图像的压缩,JPEG2000允许一个输入图像最高有16384个分量。每个分量的采样值可以是无符号数或有符号数,比特深度为138。每个分量的分辨率、采样值符号以及比特深度可以不同。2.处理处理 在预处理中,首先是把图像分成大小相同、互不重叠的矩形叠块(tile)。第二步是对每个分量进行采样值的位移,使值的范围关于0电平对称。第三步是进行采样点分量间的变

14、换,以便除去彩色分量之间的相关性,要求是分量的尺寸、比特深度相同。JPEG2000的第一部分中有两种变换可供选择:一种是不可逆彩色变换ICT,另一种是可逆彩色变换RCT。BUPT Press3.离散小波变换离散小波变换DWT 在JPEG基本系统中使用的基于子块的DCT被全帧DWT取代。如果图像被分为小的叠块,则是对各叠块进行DWT。图10.6为一维双子带DWT 分析综合滤波器组框图。图10.6 一维双子带小波分析和综合滤波器组 BUPT Press 对图像进行二维DWT是用一维DWT以可分离的方式进行的,每一次分解中先用一维分析滤波器组对图像进行水平(行)方向的滤波,然后对得到的每个输出再用同

15、样的滤波器组进行垂直(列)方向的滤波。图10.7是3次小波分解后的子带标记。图10.7 二维3次小波分解 BUPT Press4.量化量化 JPEG2000第一部分采用中央有“死区”的均匀量化器,其区间宽度是量化步长的两倍。将子带b的小波系数量化为量化系数:量化步长表示为5.熵编码熵编码 为了达到抗干扰和任意水平的逐渐显示,JPEG2000对小波变换系数的量化值按不同的子带分别进行编码。它把子带分成小的矩形块编码块(Codeblock),每个编码块单独进行编码。编码块的大小由编码器设定,它必须是2的整数幂,高不小于4,总数不大于4096。BUPT Press10.4 二值图像编码方法简介二值图

16、像编码方法简介 二值图像是一类非常特殊的图像,它只有两个灰度等级,一般取为“黑”、“白”两个亮度值。所以采集时每像素用一个比特表示,用“1”代表“黑”,“0”代表“白”,通常称之为直接编码。二值图像的质量一般用分辨率来表示,它是单位长度所包含的像素数。二值图像传输的最典型的应用场合是传真,因此,二值图像往往指的是传真中的二值文件图像。10.4.1 二值图像的方块编码二值图像的方块编码 WBS 的具体方法是:对全为白的子块用 1比特码字“0”表示,这是因为它出现的概率大,因而分配最短的码字;对至少有一个黑色像素块用N+1比特的码字表示,其中的第 1 个比特为前缀码“1”,其余N个比特采用直接编码

17、(白为0,黑为1)。可见,WBS是一种双字长编码,当然也是非续长码。BUPT Press10.4.2 游程长度编码游程长度编码RLC 在传真的二值图像中,每一扫描行总是由若干段连着的黑像素和连着的白像素组成,它们分别称为“黑游程”和“白游程”,且是交替出现的。如果对于不同的游程长度根据其概率分布分配相应的码字,可以得到较好的压缩,这种方法称为游程长度编码。游程长度编码的信息符号集由长度为 1,2,N 等各种游程长度组成。这里N是一条扫描线上的像素总数。如果不区分黑、白游长进行统一游长编码,并设 其长度为i的游长的概率,则游长的熵H和平均游长L分别为:于是游程长度的符号熵(即平均每个像素的熵)为

18、:BUPT Press10.4.3 JBIG标准标准 JBIG是ISO/IEC和ITU-T的联合二值图像专家组(Joint Bilevel Image expert Group)于1993年制定的二值图像压缩编码的国际标准,其国际标准号为ISO/IEC 11544,也是ITU-T T.82建议。从技术上来看,JBIG具有以下几方面特征:(1)高压缩性能 (2)逐渐显示编码模式 (3)适应灰度和彩色图像的无失真编码1.编码模式编码模式 JBIG标准定义了3种编码模式:渐进的编码模式(Progressive coding),兼容的渐进顺序编码模式(Compatible progressive se

19、quential coding),单层编码模式(Single layer coding)。BUPT Press2.编解码基本原理框图编解码基本原理框图 图10.11(a)是JBIG编码功能模块图,它是由D个差分层编码器和一个底层编码器组成的。其中 表示第D层图像数据,表示第D层第S条带的编码数据。图10.11(b)是JBIG解码功能模块图。图10.11 JBIG编码(a)和解码(b)功能模块图 BUPT Press 图10.12是JBIG采用的自适应算术编码器的MAC (Model_Adapter_Coder)结构。由于各差分层编码执行完全相同的处理,只是输入输出的数据不同,因而在实现时只需要

20、对一个编码模块循环调用即可。图10.12 MAC(Model-Adapter-Coder)结构框图 BUPT Press11 活动图像编码活动图像编码11.1 帧间预测编码帧间预测编码11.2 运动估计与运动补偿预测运动估计与运动补偿预测11.3 混合编码混合编码11.4 有关国际标准简介有关国际标准简介11.5 传输差错与处理传输差错与处理 BUPT Press 所谓活动图像信号,就是通常所说的电视信号或视频信号,经过数字化以后即数字视频信号,也称为数字序列图像。对于活动图像的编码有两个基本的要求,即实时性和高效性。如图11.1所示为活动图像编码传输系统的基本框图。比较它与静态图像系统的框图

21、就可以发现,两者之间的主要差别就在于活动图像的编码传输系统中必须要有一个传输缓冲存储器。图11.1 活动图像编码传输系统的基本框图 BUPT Press 图11.2为缓存控制作用的示意图。根据不同应用场合对图像质量要求的不同选择相应的压缩编码方法,是数字图像通信中采取的一项重要策略。对图像质量的要求一方面意味着系统实现的复杂性,另一方面也意味着对图像内容先验知识可利用的程度。图11.2 缓存控制作用的示意图 BUPT Press 根据目前的情况,可以把图像编码分为下面几个应用层次:(1)标准数字电视 (2)会议电视 (3)数字影碟机等 (4)可视电话 (5)高清晰度电视 对于彩色视频信号进行压

22、缩编码,总体上说有两种不同的编解码方案。一种是复合编码,它直接对复合视频信号进行取样和编码传输;另一种是分量编码,它首先把复合视频中的亮度和色度信号分离出来,然后分别进行数字化和编码传输。图11.3 分量编码系统的基本框图 BUPT Press11.1 帧间预测编码帧间预测编码11.1.1 帧间预测的依据帧间预测的依据 帧间预测是目前数字视频压缩编码采用的标志性技术。对活动图像序列进行帧间编码主要有两方面的依据。首先,从信源的角度看,自然景物大多都处于相对不变或缓变状态(这里不考虑类似于分子热运动的图像),这是帧间相关性存在的前提条件。帧间预测考虑的几种典型的情况由图11.4的可视电话图像概括

23、。图11.4 图像区域分类示意 BUPT Press 假定人的位置在第K帧与第K-1帧相比有一定的位移,可以将画面分为3个各具特点的区域:(1)背景区(2)运动物体区(3)暴露区。以上三类区域的帧间相关性虽然是最理想的情况,但却是帧间压缩编码的重要依据。除了上述的摄像机不变的情况外,对一些摄像机运动的场合也有类似的结论。图11.5是飞行器航拍地面的图像示意图。图11.5 飞行器航拍地面的“扫视”图像示意图 BUPT Press 其次,在活动图像编码中,还可以利用人的视觉(信宿)特性根据景物的活动性适当调整码率,这即所谓空间分辨率与时间分辨率的交换。对传输序列图像而言,可适当降低时间轴(Temp

24、oral)的分辨率。另一方面,人类视觉对于序列图像中的运动物体的分辨率将随着物体运动速率的增大而显著降低,而且摄像器件和电路灵敏度的积分式灵敏度也会造成运动部分的灵敏度下降。此外,电视监视器中的显示器件也有一定的积分模糊效应。这样在传输序列图像中的运动物体时,可以降低这部分图像的清晰度,且物体的运动速度愈高,就可用更低的清晰度进行传输。综上所述,如果根据图像的内容在清晰度和活动性(帧频)之间进行调整,可以使重建图像在视觉上保持一致的主观效果,这种方法就叫做空间分辨率和时间分辨率的交换。BUPT Press11.1.2 基本方法基本方法 对于序列图像中大量存在的静止或缓变区域,可以简单地采用下面

25、一些方法:(1)场(帧)重复工作形式 对于图像中的景物变化缓慢的场合,可以少传一些帧,通常也把这种方式称为抽帧或跳帧。(2)条件修补法(Conditional Frame Replenishment)将第一帧图像存于参考帧存中,并将其发送到对方,之后:第k帧图像位于z=(x,y)的像素采样值 的预测值 为第k-1帧图像的同一位置像素的复原值 。帧间差 为:在目前H.261等视频编码中采用的简单的帧间编码模式是对这种方法的改进。BUPT Press11.1.3 帧内、帧间编码的模式选择帧内、帧间编码的模式选择 帧内编码和帧间编码都是与图像序列的某些特性相对应的编码方法。分析表明,对于变化缓慢的序

26、列图像,其帧间相关性强,宜采用帧间预测;当景物的运动增大时,帧间相关性减弱,而由于摄像机的“积分效应”,图像的高频成分减弱,帧内相关性反而有所增加,因此就应采用帧内编码(帧内预测或变换编码)。总之,为了能适应不同类型的图像,就应该使编码器处于自适应的帧内、帧间编码的工作状态,这在目前的实际活动图像编码中是必须考虑的因素。为了有效地进行帧内帧间自适应编码,通常根据一定的判决准则计算帧内、帧间的活动性,以此决定编码器选择何种工作模式。BUPT Press11.2 运动估计与运动补偿预测运动估计与运动补偿预测11.2.1 运动补偿帧间预测运动补偿帧间预测 对于运动的物体,如果能估计出物体在相邻帧内的

27、相对位移,那么用上一帧中物体的对应区域对当前帧物体进行预测,编码传输预测的误差部分,就可以压缩这部分区域的码率。这种预测方式就称为运动补偿预测编码。可见,帧间预测是运动补偿预测在运动矢量为零时的特殊情况。原理上说,运动补偿帧间预测编码包括以下4个部分:(1)物体的划分,划分静止区域和运动区域;(2)运动估计,对每一个运动物体进行位移估计;(3)运动补偿,由位移的估值建立同一运动物体在不同帧的空间位置对应关系,从而建立了预测关系;(4)补偿后的预测信息编码,对运动物体的补偿后的位移帧差信号),以及运动矢量等进行编码传输。BUPT Press11.2.2 基于块的运动补偿预测基于块的运动补偿预测

28、目前广泛应用的是块匹配运动补偿预测,图11.7是基于块的运动补偿预测示意图。这种方法把一幅图像分为互不重叠的NN个像素的子块,然后对每个子块估计所谓位移矢量或运动矢量D(dx,dy),并将它编码传送到接收端。利用该运动矢量可以在收、发端利用所谓运动补偿预测,用上一帧图像 在z-D处的亮度值对子块内z(x,y)处的亮度值进行估计,即:预测误差为:称为位移帧差信号(Displacement Frame Difference,DFD)。对预测误差信号进行量化处理后进行编码传输。在接收端经过解码后,结合上一帧的恢复图像就可以得出当前帧的解码图像。BUPT Press 在基于块的运动估计和运动补偿中有一

29、个基本的假设,即块内所有像素具有同样的平移运动,因此子块的运动矢量就是子块内所有像素的运动矢量。对于其它类型的运动,例如缩放、旋转,以及背景区的暴露或遮盖等,则没有考虑。图11.7 基于块的运动补偿预测的示意图 BUPT Press11.2.3 运动估计算法运动估计算法 运动矢量的估计主要有像素递归法和块匹配算法,目前使用最多的是块匹配算法,即 BMA(Block Matching Algorithm)算法。1.块匹配算法块匹配算法BMA (1)基本方法(全搜索算法)用块匹配估计算法估计一个像素的位移(运动)时,取以该像素为中心的一个子块,然后在前一帧图像中所有可能的位置寻找一个与之最匹配(相

30、关最大)的子块,该子块中心与当前像素的位移即为估计的位移(运动)矢量。这种搜索称为全搜索算法,也可称为穷尽法或遍历法。如图11.8所示,设A为当前帧中的一个待处理的NN像素的子块,假定水平和垂直方向的最大位移均为 ,块匹配算法就是在其前一帧以A为中心的搜索区SR:内寻找一个与A相关性最大(最相似)的同样大小的子块B,它与A的坐标偏移量即为估计的子块A的运动矢量。BUPT Press 通常采用均方误差或绝对误差作为判决准则。设i,j为子块相对于A的位移,则 均方误差(MSE):平均绝对误差(MAD):在搜索区SR内进行匹配时,在全搜索条 件下,i,j 的变化范围为 ,总共需 要 次误差计算。图1

31、1.8 块匹配法的搜索区 BUPT Press 设在某一个位置偏移(i,j)下有最小的误差,则进行以下判决:,说明运动量适中,在一定误差范围内达到匹配,运动矢量为dx=i,dy=j。,说明运动剧烈,在搜索范围内不能匹配。这时不能得到合适的运动补偿预测,应该对这种子块直接进行帧内编码。在全搜索条件下,块匹配算法达到全局最优,但缺点是运算量大。在一些实际应用场合需要采用性能略低于全搜索算法,但运算量大为减少的快速算法。(2)三步搜索算法(TSS)三步搜索算法(Three Step Search)是目前应用很广泛的一种次最优 的运动矢量搜索算法。BUPT Press具体分为以下三步:以当前子块为中心

32、,以4为步幅,将如图11.9中的9个位置为中心的子块与当前子块进行匹配,求出最佳匹配的子块中心位置。以中求出的最佳子块为中心,以2为步幅,将如图11.9中的9个 位置为中心的子块与当前子块进 行匹配,求出最佳匹配的子块中 心位置。以中求出的最佳子块为中心,以1为步幅,将如图11.9中的9个 位置为中心的子块与当前子块进 行匹配,求出最佳匹配的子块中 心位置,它与当前子块中心的位置偏移量即为估计的位移量。图11.9 三步搜索算法的搜索步骤标志 BUPT Press(3)分层运动估计算法 为了在大运动下准确的 地估计位移矢量,就必 须在搜索时采用大的子 块。由此,这样就能降 低在搜索区内偶尔出现

33、多个图像内容与子块内 容相匹配的可能性。然 而另一方面,采用大的 子块有这样的缺陷,即 要求位移矢量必须在大的区域里是一个常量。为了克服这一缺点,可以使用分层次的位移估计方法。这种方法在第一步使用最大的子块尺寸,在以后各步中子块的尺寸递减。图11.10 一个三层位移估计的原理示意图 BUPT Press2.像素递归估计算法像素递归估计算法 像素递归(迭代)位移矢量估计方法使用由平移运动引起的在时间和空间图像信号变化进行位移矢量的估计。图11.11是在一维运动D=dx条件下,图像信号在时间上的变化量FD(x,y),空间上的变化量 ,以及位移矢量D(z)的关系示意图。图11.11 位移dx,帧差F

34、D以及梯度的关系示意图 BUPT Press 一个位移的简单估计值为:在第i次迭代计算得到的位移矢量 将在第i+1次迭代中由修正量 改善,即 这种迭代计算将对一个运动物体的所有像素进行。为了确定修正量,需要对第k帧和第k-1帧图像进行补偿,即构造所谓位移帧间差DFD:BUPT Press 将它取平方作为估计算法的代价函数。在达到真实的位移而且准确的补偿时,DFD为零。在实际情况下代价函数将达到最小值,如图11.12所示。图11.12 迭代估计过程示意图 BUPT Press11.3 混合编码混合编码11.3.1 混合编码器结构混合编码器结构 变换编码和预测编码是两类不同的压缩编码方法,如果将这

35、两种方法组合在一起,就构成新的一类所谓混合编码。通常使用DCT等变换进行空间冗余度的压缩,用帧间预测或运动补偿预测进行时间冗余度的压缩,以达到对活动图像的更高的压缩效率。混合编码器有两类不同的结构,如图11.13所示,分别表示空/时压缩和时/空压缩两种不同的方案。图11.3 混合编码器结构 BUPT Press 图11.14是这两种方案的结构框图。其中,T、IT代表正、反变换,Q、IQ代表正、反量化。图11.14 混合编码器结构框图 BUPT Press11.3.2 H.261混合编码方案混合编码方案 H.261是最早采用混合编码方法进行活动图像压缩的国际标准建议。图11.15是H.261建议

36、中使用的视频编码器框图。该编码器根据需要可以工作在不同的模式。图11.15 H.261建议的混合编码器结构 BUPT Press11.3.3 帧内、帧间编码模式帧内、帧间编码模式 为了使解码器能正确地解码,编码器的工作状态必须即时通知解码端,为此每个编码模式和控制参数等辅助信息也要进行编码传输。表11.2是各种编码模式及其码字。对量化后的系数以及各种辅助信息的VLC编码即由图中的视频多路模块完成。1.二维二维DCT变换变换 图11.15中,T、IT为88子块的正反DCT变换。变换式为:式中:BUPT Press表表11.2 各种编码模式及其码字各种编码模式及其码字预测模式预测模式量化步长量化步

37、长运动矢量运动矢量宏块地址宏块地址DCT系数系数变长码字变长码字intra(帧内)0001intra0000 001inter(帧间)1Inter0000 1inter+MC0000 0000 1inter+MC0000 0001inter+MC0000 0000 01inter+MC+FIL001inter+MC+FIL01inter+MC+FIL0000 01注:“”表示本项为模式中的一个参量。“MC”表示运动补偿。“FIL”表示环路滤波。BUPT Press2.变长编码变长编码 DCT变换后,变换系数按图11.16的“Z”字形(Zig-Zag)扫描输出次序一边读出,一边进行均匀量化和变字

38、长编码VLC。图11.16 DCT系数Zig-Zag扫描顺序 BUPT Press3.编码控制方法编码控制方法 在混合编码中,编码器性能的优劣在很大程度上取决于编码控制方法,它包括编码器的工作模式的选择,以及各种编码参数的选择。可以用一种简单的缓存剩余容量反馈控制方法进行量化器(量化步长)的选择,如图11.17所示。图11.17 一种简单的缓存剩余容量反馈控制方法 BUPT Press11.4 有关国际标准简介有关国际标准简介 自20世纪80年代末以来,国际电信联盟ITU和国际标准化组织ISO先后颁发了一系列有关静止和活动图像编码的国际标准建议,对图像与多媒体通信的研究、发展和产业化起了巨大的

39、推动作用。11.4.1 H.261建议建议 ITU-T(原CCITT)于1990年7月通过H.261建议,图11.18为视频编解码器框图。图11.18 H.261视频编解码器框图 BUPT Press 1.信源编码器信源编码器(1)图像信源格式 信源编码对非交织图像进行编码,帧频为30000/1001(约29.97),每幅图像包括亮度分量Y和两个色差分量Cb、Cr,图像扫描格式有两种。第一种格式为CIF格式。亮度信号按每行352个像素,每幅288行进行正交抽样;两个色差信号按每行176个像素,每幅144行进行正交抽样。图11.19为抽样位置图。图11.19 抽样位置图 BUPT Press(2

40、)编码方法 编码器框图参见图11.15,主要处理单元包括预测、子块DCT变换以及量化。(3)帧间预测与运动补偿 预测在帧间进行,并且可以通过运动补偿和一个空间滤波器增强。(4)DCT变换与变换系数的量化 对于DCT变换系数需要进行线性量化。用于帧内模式的直流分量有一个量化器,它的量化步长为8,并且无“死区”。(5)VLC编码 为了提高编码效率,建议对宏块地址、宏块类型、运动矢量预测差值、子块编码样板以及DCT变换系数使用VLC编码,并且规定了编码码字表格。BUPT Press2.视频数据层次结构与码流的多路复用视频数据层次结构与码流的多路复用 H.261把视频数据分为4层:图像层、宏块组层、宏

41、块层和子块层。图11.20为CIF格式下图像的层次结构。3.信道编码信道编码 建议规定传输比特流中包括一个BCH(511,493)前向纠错码。其中信息比特为493位,校验比特为18位。接收端使用它进行纠错是选择项。4.传输缓冲存储与编码控制传输缓冲存储与编码控制 建议没有规定缓存和编码控制的具体实现,这部分内容是开放的。但是要求输出的码率满足一个假设的参考解码器的要求,以便编码时缓存既不会溢出也不会下溢,即可以解码得到连续的输出图像。BUPT Press图11.20 CIF格式下图像的层次结构 BUPT Press图11.21 码流复用语法框图 BUPT Press11.4.2 H.263建议

42、建议 ITU于1995年4月公布了用于低码率的视频编码建议草案,即H.263 建议。该建议中仍采用H.261 建议的混合编码器,如图11.15,但去掉了信道编码部分。在信源编码器中,DCT、量化器的种类,以及对DCT的量化系数的Z字形扫描和二维VLC等处理与H.261建议是一致的,但为了适应极低码率的传输要求,在以下几方面作了改进:(1)更丰富的图像格式 (2)两种运动估值块 (3)半像素运动估计精度 (4)更高效的运动矢量编码 (5)内插半精度像素 总之,除了半像素精度进行运动估计以外,H.263 的基本编码方法与 H.261 是相同的,均为混合编码方法。H.263增加了4个编码的高级选项,

43、包括:无限制的运动矢量模式,基于语法的算术编码,高级预测模式,以及PB-帧模式。BUPT Press11.4.3 MPEG-1标准标准 MPEG是ISO的活动图像专家组的英文缩略形式,它的正式名称是ISO/IEC JTC 1/SC 29/WG 11,其工作是开发满足各种应用的活动图像及其伴音的压缩、解压缩以及编码描述的国际标准。1.图像格式与约束参数图像格式与约束参数2.算法概述算法概述 MPEG编码技术的选择是基于高质量的连续活动图像、高压缩比以及对编码比特流的随机操作需求之间的平衡。为此定义了3种图类型。3.编码编码 MPEG-1没有规定编码过程,而仅规定了比特流的语法和语义以及解码器中的

44、信号处理。和H.261建议类似,编码时的基本单元是宏块,它包括6个88的子块,其中4个是亮度块,剩下的一个是Cr,一个是Cb。BUPT Press4.解码解码 解码是编码的逆操作,比编码简单得多,图11.25是MPEG-1的基本视频解码框图。5.编码视频流的层次结构和组成编码视频流的层次结构和组成 MPEG-1规定了编码视频比特流的语法。该语法分为6层,每层支持一个信号处理或一个系统功能,并且设定了一定的参数。图11.25 MPEG-1基本视频解码框图 BUPT Press11.4.4 MPEG-2标准标准 MPEG-2标准是MPEG工作组制定的第二个国际标准,标准号是ISO/IEC 1381

45、8,题目是:通用的活动图像及其伴音的编码。它主要包括以下部分:第一部分:系统(1994年)第二部分:视频(1994年)第三部分:音频(1994年)第四部分:一致性(1995年)第五部分:参考软件(1996年)第六部分:数字存储媒体的命令与控制 第七部分:高级音频编码 第八部分:10 bit视频编码 第九部分:实时接口 BUPT Press11.4.5 MPEG-4标准标准 MPEG-4是一个适应各种多媒体应用的“音频视觉对象编码”标准,国际标准号是ISO/IEC 14496,包括两个标准组,以下是版本1的组成部分:第一部分:系统 第二部分:视觉信息 第三部分:音频 第四部分:一致性 第五部分:

46、参考软件 第六部分:多媒体传送集成框架 第七部分:MPEG-4工具(视频)优化软件 简单地说,MPEG-4规定了各种音频视觉对象的编码,除了包括自然的音频视频对象以外,还包括图像、文字、2D和3D图形以及合成话音和音乐等。BUPT Press11.5 传输差错与处理传输差错与处理11.5.1 简单传输模型简单传输模型 为了分析传输误码对编码方案的影响,首先考虑一种简单的传输模型,如图11.29所示。图11.29 传输模型输出为:在分析传输误码对图像的影响时,可以只分析上式中的“误码图案”,即:BUPT Press11.5.2 编码系统中的抗误码措施编码系统中的抗误码措施 实践中为了降低误码图案

47、的效果,在早期的编码系统中采用一些简单的辅助措施减轻误码带来的影响。为了达到高效率的图像传输,目前的编码系统都采用了复杂的编码方案,帧间编码和VLC被广为使用。随着数字通信技术的发展,使用移动网和IP网将成为多媒体通信的趋势,在突发误码环境下提供视频的可靠编码传输变得日益重要,为此在MPEG-4标准制定中专门提出了许多有效的方法,下面将简要介绍其中的几种。1.再同步再同步(Resynchronization)2.数据恢复数据恢复(Data Recovery)3.差错掩盖差错掩盖(Error Concealment)4.其它其它 BUPT Press11.5.3 信道编码信道编码 降低差错影响的

48、另一项重要的措施就是采用信道编码技术,基本思想是通过对信息序列作某种变换,使原来相互独立、相关性小的信息码元产生某种相关性,利用这种相关性检查和纠正传输造成的差错。1.差错控制方式差错控制方式 目前在数据传输中,主要有3种差错控制方式,如图11.31所示。(1)自动请求重发(ARQ):发端发出能够发现错误的码,收端根据编码规则对收到的信码进行判决,若有错,则控制重发指令,通过反馈信道通知发端将有错部分重发,直到正确接收为止。(2)前向纠错编码(FEC):发端发送能纠错的码,收端在收到的信码中可以发现甚至校正错误。(3)混合纠错方式(HEC):它是以上两种方法的结合。BUPT Press图11.

49、31 差错控制的3种基本方式 BUPT Press2.级联编码技术级联编码技术 在卫星、数字电视地面广播等场合,由于传送条件复杂,要求FEC有很高的性能,同时又要求解码不过于复杂,这时就宜于使用级联编码,它通常由内编码和外编码组成,如图11.32所示。为了抵抗较强的突发干扰,在内、外编码之间还可加入码交织处理。图11.32 一个级联编码系统框图 BUPT Press3.码交织技术码交织技术 码交织技术是抵御突发差错的非常强有力的方法,其原理可用图11.33来说明。mn个数据为一组,按每行n比特,共m行方式读入寄存器,然后以列的方式读出用于传输,接收端把数据按列的方式写入寄存器后再以行方式读出,

50、得到与输入码流次序一致的输出,由此实现了交织/解交织。当在传输过程中出现突发差错时,差错比特在解交织寄存器中被分散到各行比特流中,从而易于被外层的FEC纠正。图11.33 码交织技术纠正突发误码示意图 BUPT Press12 图像编码新方法图像编码新方法12.1 小波变换与图像编码小波变换与图像编码 12.2 模型基编码模型基编码 12.3 分形图像编码分形图像编码 BUPT Press12.1 小波变换与图像编码小波变换与图像编码12.1.1 连续小波变换连续小波变换1.连续小波基函数连续小波基函数 所谓小波(Wavelet),即存在于一个较小区域的波。小波函数的数学定义是:设 为一平方可

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 生活常识

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com