H视频压缩标准.pptx

上传人:一*** 文档编号:71818813 上传时间:2023-02-06 格式:PPTX 页数:72 大小:1.19MB
返回 下载 相关 举报
H视频压缩标准.pptx_第1页
第1页 / 共72页
H视频压缩标准.pptx_第2页
第2页 / 共72页
点击查看更多>>
资源描述

《H视频压缩标准.pptx》由会员分享,可在线阅读,更多相关《H视频压缩标准.pptx(72页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、会计学1H视频压缩标准视频压缩标准(biozhn)PPT课件课件第一页,共72页。H.264/AVCH.264/AVC编解码器H.264/AVC的结构帧内预测(yc)帧间预测(yc)变换与量化第1页/共72页第二页,共72页。H.264/AVCH.264/AVC编解码器编解码器H.264编解码器特点 H.264并不明确(mngqu)地规定一个编解码器如何实现,而是规定了一个编码的视频比特流的句法,和该比特流的解码方法,各个厂商的编码器和解码器在此框架下应能够互通,在实现上具有较大灵活性,而且有利于相互竞争。第2页/共72页第三页,共72页。H.264/AVCH.264/AVC编解码器编解码器H

2、.264编码器 编码器采用的仍是变换和预测的混合编码法。输入的帧或场Fn以宏块为单位被编码器处理。首先,按帧内或帧间预测编码的方法进行处理。如果(rgu)采用帧内预测编码,其预测值PRED(图中用P表示)是由当前片中前面已编码的参考图像经运动补偿(MC)后得出,其中参考图像用Fn-1表示。为了提高预测精度,从而提高压缩比,实际的参考图像可在过去或未来(指显示次序上)已编码解码重建和滤波的帧中进行选择。预测值PRED和当前块相减后,产生一个残差块Dn,经块变换、量化后产生一组量化后的变换系数X,再经熵编码,与解码所需的一些边信息(如预测模式量化参数、运动矢量等)一起组成一个压缩后的码流。正如上述

3、,为了提供进一步预测用的参考图像,编码器必须有重建图像的功能。因此必须使残差图像经反量化、反变换后得到的Dn与预测值P相加,得到uFn(未经滤波的帧)。为了去除编码解码环路中产生的噪声,为了提高参考帧的图像质量,从而提高压缩图像性能,设置了一个环路滤波器,滤波后的输出Fn即重建图像可用作参考图像。第3页/共72页第四页,共72页。H.264/AVCH.264/AVC编解码器编解码器H.264解码器 由图1可知,由编码器的NAL输出一个压缩后的H.264压缩比特流。由图2,经熵解码得到量化后的一组变换系数X,再经反量化、反变换,得到残差Dn。利用(lyng)从该比特流中解码出的头信息,解码器就产

4、生一个预测块PRED,它和编码器中的原始PRED是相同的。当该解码器产生的PRED与残差Dn相加后,就产生uFu,再经滤波后,最后就得到滤波后的Fn,这个Fn就是最后的解码输出图像。第4页/共72页第五页,共72页。H.264/AVCH.264/AVC编解码器编解码器图1 H.264编码器第5页/共72页第六页,共72页。H.264/AVCH.264/AVC编解码器编解码器图2 H.264解码器第6页/共72页第七页,共72页。H.264/AVCH.264/AVC编解码器H.264/AVC的结构帧内预测(yc)帧间预测(yc)变换与量化第7页/共72页第八页,共72页。H.264/AVCH.2

5、64/AVC的结构的结构(jigu)(jigu)名词解释场和帧 视频的一场或一帧可用来产生一个编码(bin m)图像。在电视中,为减少大面积闪烁现象,把一帧分成两个隔行的场。第8页/共72页第九页,共72页。H.264/AVCH.264/AVC的结构的结构(jigu)(jigu)名词解释宏块、片:一个编码图像通常划分成若干宏块组成,一个宏块由一个1616亮度像素和附加的一个88 Cb和一个88 Cr彩色像素块组成。每个图象中,若干宏块被排列成片的形式。I片只包含I宏块,P片可包含P和I宏块,而B片可包含B和I宏块。I宏块利用从当前片中已解码的像素作为参考进行帧内预测。P宏块利用前面已编码图象作

6、为参考图象进行帧内预测,一个帧内编码的宏块可进一步作宏块的分割:即1616、168、816或88亮度像素块(以及附带的彩色像素);如果(rgu)选了88的子宏块,则可再分成各种子宏块的分割,其尺寸为88、84、48或44亮度像素块(以及附带的彩色像素)。B宏块则利用双向的参考图象(当前和未来的已编码图象帧)进行帧内预测。第9页/共72页第十页,共72页。H.264/AVCH.264/AVC的结构的结构(jigu)(jigu)档次和级 H.264规定了三种档次,每个档次支持一组特定的编码功能,并支持一类特定的应用。1)基本(jbn)档次:利用I片和P片支持帧内和帧间编码,支持利用基于上下文的自适

7、应的变长编码进行的熵编码(CAVLC)。主要用于可视电话、会议电视、无线通信等实时视频通信;2)主要档次:支持隔行视频,采用B片的帧间编码和采用加权预测的帧内编码;支持利用基于上下文的自适应的算术编码(CABAC)。主要用于数字广播电视与数字视频存储;3)扩展档次:支持码流之间有效的切换(SP和SI片)、改进误码性能(数据分割),但不支持隔行视频和CABAC。主要用于网络的视频流,如视频点播图3为H.264各个档次具有的不同功能,可见扩展档次包括了基本(jbn)档次的所有功能,而不能包括主要档次的。每一档次设置不同参数(如取样速率、图像尺寸、编码比特率等),得到编解码器性能不同的级。第10页/

8、共72页第十一页,共72页。H.264/AVCH.264/AVC的结构的结构(jigu)(jigu)图3 H.264档次(dn c)第11页/共72页第十二页,共72页。H.264/AVCH.264/AVC的结构的结构(jigu)(jigu)编码数据格式 H.264支持4:2:0的逐行或隔行(xn)视频的编码和解码。第12页/共72页第十三页,共72页。H.264/AVCH.264/AVC的结构的结构(jigu)(jigu)参考图像 可从一组前面或后面已编码图像中选出一个或两个与当前最匹配的图像作为帧间编码间的参数图像,H.264中最多可从15个参考图像中进行选择,选出最佳的匹配图像。对于(d

9、uy)P片中帧间编码宏块可从表“0”中选择参数图像;对于(duy)B片中的帧间编码宏块和宏块分割的预测,可从表“0”和“1”中选择参考图像。第13页/共72页第十四页,共72页。H.264/AVCH.264/AVC的结构的结构(jigu)(jigu)片和片组 片一个视频图像可编码成一个或更多个片,每片包含整数个宏块(MB),即每片至少一个MB,最多时每片包含整个图像的宏块。设片的目的是为了限制误码的扩散和传输,使编码片相互间是独立的。某片的预测不能以其它片中的宏块为参考图像,这样某一片中的预测误差才不会传播到其它片中去。编码片共有5种不同类型,I片、P片、B片外,还有SP片和SI片。其中(qz

10、hng)SP(切换P)是用于不同编码流之间的切换。第14页/共72页第十五页,共72页。H.264/AVCH.264/AVC的结构的结构(jigu)(jigu)图4 片的句法结构第15页/共72页第十六页,共72页。H.264/AVCH.264/AVC的结构的结构(jigu)(jigu)片和片组 片组 片组是一个编码图象中若干MB的一个子集,它可包含一个或若干个片。在一个片组中,每片的MB按光栅扫描次序被编码,如果每幅图象仅取一个片组,则该图象中所有(suyu)的MB均按光栅扫描次序被编码。还有一种片组,叫灵活宏块次序(FMO),它可用灵活的方法,把编码MB序列映射到解码图象中MB的分配用MB

11、到片组之间的映射来确定,它表示每一个MB属于哪个片组。表1 为MB到片组的各种映射类型。第16页/共72页第十七页,共72页。H.264/AVCH.264/AVC的结构的结构(jigu)(jigu)表1 MB到片组的映射(yngsh)类型名称描述0交错MB游程被依次分配给每一块组(图8)1散乱每一片组中的MB被分散在整个图象中(图9)2前景和背景例见图103Boxout从帧的中心开始,产生一个箱子,其MB属于片组0,其它MB属于片组(图11)4光栅扫描片组0包含按光栅扫描次序从顶左的所有MB,其余MB属片组1(图11)5手绢片组0包含从顶左垂直扫描次序的MB,其余MB属片组1(图11)6显式每

12、一Mbslice_group_id,用于指明它的片组(即MB映射完全是用户定义的)第17页/共72页第十八页,共72页。H.264/AVCH.264/AVC的结构的结构(jigu)(jigu)图5 交错(jiocu)型片组 图6 散乱型片组图7 前景(qinjng)和背景型片组第18页/共72页第十九页,共72页。H.264/AVCH.264/AVC的结构的结构(jigu)(jigu)图8 片组第19页/共72页第二十页,共72页。H.264/AVCH.264/AVC编解码器H.264/AVC的结构帧内预测(yc)帧间预测(yc)变换与量化 第20页/共72页第二十一页,共72页。帧内预测帧内

13、预测(yc)(yc)在帧内预测模式中,预测块P是基于已编码重建块和当前块形成的。对亮度像素而言,P块用于44子块或者1616宏块的相关操作。44亮度子块有9种可选预测模式,独立预测每一个44亮度子块,适用于带有大量细节的图像编码;1616亮度块有4种预测模式,预测整个1616亮度块,适用于平坦区域(qy)图像编码;色度块也有4种预测模式,类似于1616亮度块预测模式。编码器通常选择使P块和编码块之间差异最小的预测模式。第21页/共72页第二十二页,共72页。帧内预测帧内预测(yc)(yc)44亮度预测模式 如图6.14所示,44亮度块的上方和左方像素AM为已编码和重构像素,用作编解码器中的预测

14、参考像素。ap为待预测像素,利用AM值和9种模式实现。其中模式2(DC预测)根据AM中已编码像素预测,而其余模式只有在所需预测像素全部提供才能使用。图6.15箭头表明(biomng)了每种模式预测方向。对模式38,预测像素由AM加权平均而得。例如,模式4中,d=round(B/4+C/2+D/4)。第22页/共72页第二十三页,共72页。帧内预测帧内预测(yc)(yc)图1第23页/共72页第二十四页,共72页。帧内预测帧内预测(yc)(yc)a)b)图2 a)利用像素(xin s)A-M对方块中a-p像素(xin s)进行帧内44预测b)帧内44 预测的8个预测方向第24页/共72页第二十五

15、页,共72页。帧内预测帧内预测(yc)(yc)图3 44亮度(lingd)块预测模式第25页/共72页第二十六页,共72页。帧内预测帧内预测(yc)(yc)Example:Example:4x4 4x4 块块,9,9种预测模式种预测模式(0-8)(0-8)对于对于(duy)(duy)当前块的最佳模式是:模式当前块的最佳模式是:模式 7(vertical-right)7(vertical-right)第26页/共72页第二十七页,共72页。帧内预测帧内预测(yc)(yc)图4 第27页/共72页第二十八页,共72页。帧内预测帧内预测(yc)(yc)1616亮度预测模式 宏块的全部1616亮度成分

16、(chng fn)可以整体预测,有4种预测模式,如表2和图5所示。图5 1616预测(yc)模式第28页/共72页第二十九页,共72页。帧内预测帧内预测(yc)(yc)表2 1616预测(yc)模式模式描 述模式0(垂直)由上边像素推出相应像素值模式1(水平)由左边像素推出相应像素值模式2(DC)由上边和左边像素平均值推出相应像素值模式3(平面)利用线形“plane”函数及左、上像素推出相应像素值,适用于亮度变化平缓区域第29页/共72页第三十页,共72页。帧内预测帧内预测(yc)(yc)图6 1616 宏块图6.19 帧内 1616 预测(yc)块图7 帧内 1616 预测(yc)块举例:图

17、6给出了一个左上方像素已编码的亮度宏块。图7 给出了4种预测模式预测结果。其中模式 3最匹配原始宏块。帧内1616模式适用于图像平坦区域预测。第30页/共72页第三十一页,共72页。帧内预测帧内预测(yc)(yc)88色度(s d)块预测模式 每个帧内编码宏块的88色度(s d)成分由已编码左上方色度(s d)像素预测而得,两种色度(s d)成分常用同一种预测模式。4种预测模式类似于帧内1616预测的4种预测模式,只是模式编号不同。其中DC(模式0)、水平(模式1)、垂直(模式2)、平面(模式3)。第31页/共72页第三十二页,共72页。帧内预测帧内预测(yc)(yc)n n帧内预测模式帧内预

18、测模式编码帧内预测模式帧内预测模式编码n n例如例如(lr)(lr):如果:如果A A块和块和B B块的最优预测模式均是预测模式块的最优预测模式均是预测模式2 2,那么,最可能当前块那么,最可能当前块C C的最优预测模式是模式的最优预测模式是模式2 2图8 帧内预测模式(msh)编码第32页/共72页第三十三页,共72页。帧内预测帧内预测(yc)(yc)对于当前块对于当前块C,C,编解码器按照如下编解码器按照如下(rxi)(rxi)方法计算方法计算probable prediction modeprobable prediction mode minprediction mode of A,m

19、inprediction mode of A,prediction modes of Bprediction modes of B当当A(A(或者或者 B B)的预测模式不可用时,)的预测模式不可用时,prediction mode of A prediction mode of A 2.2.例如例如 A A 和和 B B块的预测模式分别为块的预测模式分别为 3 3 和和1 1 most probable mode for block C=1 most probable mode for block C=1第33页/共72页第三十四页,共72页。帧内预测帧内预测(yc)(yc)编码器为每个编码

20、器为每个4x4 4x4 块发送一个标记块发送一个标记(bioj)flag,(bioj)flag,解码器按照解码器按照如下方式如下方式 解码解码If flag=1,prediction mode=most_probable_modeIf flag=1,prediction mode=most_probable_modeIf flag=0 If flag=0 If rem_intra44_pred_mode most_probable_mode If rem_intra44_pred_mode most_probable_mode prediction mode=rem_intra44_pred_

21、mode prediction mode=rem_intra44_pred_mode else else prediction mode=rem_intra44_pred_mode+1 prediction mode=rem_intra44_pred_mode+1 这样表示这样表示9 9中预测模式只需要中预测模式只需要8 8个值个值(0 (0 toto 7)7)第34页/共72页第三十五页,共72页。帧内预测帧内预测(yc)(yc)第35页/共72页第三十六页,共72页。H.264/AVCH.264/AVC编解码器H.264/AVC的结构帧内预测(yc)帧间预测(yc)变换与量化第36页/共7

22、2页第三十七页,共72页。帧间预测帧间预测(yc)(yc)树状结构运动补偿 每个宏块(1616像素)可以(ky)4种方式分割:一个1616,两个168,两个816,四个88。其运动补偿也相应有四种。而88分割还可以(ky)有四种方式的分割:一个88,两个48或两个84及4个44。这种分割下的运动补偿则称为树状结构运动补偿。第37页/共72页第三十八页,共72页。帧间预测帧间预测(yc)(yc)图1 宏块分割(fng)第38页/共72页第三十九页,共72页。帧间预测帧间预测(yc)(yc)树状结构运动补偿 每个分割或子宏块都有一个独立的运动补偿。每个MV必须被编码(bin m)、传输,分割的选择

23、也需编码(bin m)到压缩比特流中。对大的分割尺寸而言,MV选择和分割类型只需少量的比特,但运动补偿残差在多细节区域能量将非常高。小尺寸分割运动补偿残差能量低,但需要较多的比特表征MV和分割选择。分割尺寸的选择影响了压缩性能。整体而言,大的分割尺寸适合平坦区域,而小尺寸适合多细节区域。第39页/共72页第四十页,共72页。帧间预测帧间预测(yc)(yc)宏块的色度成分(Cr和Cb)则为相应亮度(lingd)的一半(水平和垂直各一半)。色度块采用和亮度(lingd)块同样的分割模式,只是尺寸减半(水平和垂直方向都减半)。例如,816的亮度(lingd)块相应色度块尺寸为48,84亮度(ling

24、d)块相应色度块尺寸为42等等。色度块的MV也是通过相应亮度(lingd)MV水平和垂直分量减半而得。举例:如图:一个残差帧(没有进行运动补偿)。H.264编码器为帧的每个部分选择了最佳分割尺寸,使传输信息量最小,并将选择的分割加到残差帧上。在帧变化小的区域(残差显示灰色),选择1616分割;多运动区域(残差显示黑色或白色),选择更有效的小的尺寸。第40页/共72页第四十一页,共72页。帧间预测帧间预测(yc)(yc)图2 残差帧第41页/共72页第四十二页,共72页。帧间预测帧间预测(yc)(yc)运动矢量帧间编码宏块的每个分割或者子宏块都是从参考图像某一相同(xin tn)尺寸区域预测而得

25、。两者之间的差异(MV)对亮度成分采用1/4像素精度,色度1/8像素精度。亚像素位置的亮度和色度像素并不存在于参考图像中,需利用邻近已编码点进行内插而得。图中,当前帧的44块通过邻近参考图像相应区域预测。如果MV的垂直和水平分量为整数,参考块相应像素实际存在(灰色点)。如果其中一个或两个为分数,预测像素(灰色点)通过参考帧中相应像素(白色点)内插获得。第42页/共72页第四十三页,共72页。帧间预测帧间预测(yc)(yc)图3 亮度(lingd)半像素位置内插第43页/共72页第四十四页,共72页。帧间预测帧间预测(yc)(yc)内插像素生成:生成参考(cnko)图像亮度成分半像素像素。半像素

26、点(如b,h,m)通过对相应整像素点进行6抽头滤波得出,权重为(1/32,-5/32,5/8,5/8,-5/32,1/32)。(6.1)类似的,h由A、C、G、M、R、T滤波得出。一旦邻近(垂直或水平方向)半素点的所有像素都计算出,剩余的半像素点便可以通过对6个垂直或水平方向的半像素点滤波而得。例如,j由cc,dd,h,m,ee,ff滤波得出。这里说明的是,6抽头滤器比较复杂,但可明显改善运动补偿性能。第44页/共72页第四十五页,共72页。帧间预测帧间预测(yc)(yc)图4 亮度(lingd)1/4像素内插半像素点计算出来以后,1/4像素点就可通过(tnggu)线性内插得出,如图4所示。1

27、/4像素点(如a,c,i,k,d,f,n,q)由邻近像素内插而得,如 剩余1/4像素点(p,r)由一对对角半像素点线性内插得出。如,e由b和h获得。第45页/共72页第四十六页,共72页。帧间预测帧间预测(yc)(yc)图5 色度(s d)1/8像素内插相应地,色度像素(xin s)需要1/8精度的MV,也同样通过整像素(xin s)地线性内插得出,如图5所示。(6.3)第46页/共72页第四十七页,共72页。帧间预测帧间预测(yc)(yc)MV预测(yc)每个分割MV的编码需要相当数目的比特,特别是使用小分割尺寸时。为减少传输比特数,可利用邻近分割的MV较强的相关性,MV可由邻近已编码分割的

28、MV预测(yc)而得。第47页/共72页第四十八页,共72页。帧间预测帧间预测(yc)(yc)B片预测 B片中的帧间编码宏块的每个子块都是由一个或两个参考图像预测而得。该参考图像在当前图像的前面(qin mian)或者后面。参考图像存储于编解码器中,其选择有多种方式。图6显示了三种方式:一个前向和一个后向的;两个前向;两个后向。第48页/共72页第四十九页,共72页。帧间预测帧间预测(yc)(yc)图6.预测(yc)第49页/共72页第五十页,共72页。帧间预测帧间预测(yc)(yc)参考(cnko)图像B片用到了两个已编码图像列表:list0和list1,第50页/共72页第五十一页,共72

29、页。帧间预测帧间预测(yc)(yc)举例:一个(y)H.264解码器存储了6幅短期参考图像。其POC分别为:123,125,126,128,129和130。当前图像为127。所有6幅短期参考图像在list0和list1中都标为“作用参考”,如表所示。表1第51页/共72页第五十二页,共72页。帧间预测帧间预测(yc)(yc)预测(yc)模式选择 B片的预测(yc)方式包括:宏块分割方式、双向选择方式、参考列表选择方式等等。具体说,B片中宏块分割可由多种预测(yc)方式中的一种实现,如直接模式、利用list0的运动补偿模式、利用list1的运动补偿模式或者利用list0和list1的双向运动补偿

30、模式。每个分割可选择各自的不同的预测(yc)模式(如表2所示)。如果88分割被使用,每个88分割所选则的模式适用于分割中的所有亚分割。图7给出了例子,左边的两个168分割分别使用List0和双向预测(yc)模式,而右边的4个88分割分别采用直接、list0、list1和双向预测(yc)四种模式。第52页/共72页第五十三页,共72页。帧间预测帧间预测(yc)(yc)表2 B片宏块预测(yc)选则分割选 择1616直接、list0、list1、双向168/816list0、list1、双向(每个分割独立选择)88直接、list0、list1、双向(每个分割独立选择)图7 B片中分割(fng)预测

31、模式举例第53页/共72页第五十四页,共72页。帧间预测帧间预测(yc)(yc)双向预测从list0和list1分别得出两个运动补偿参考(cnko)区域(需要两个MV),而预测块的像素取list0和list1相应像素的平均值。当不用加权预测时,用下列等式:第54页/共72页第五十五页,共72页。帧间预测帧间预测(yc)(yc)举例:一宏块用B_Bi_1616模式预测。图和图6.30分别给出了基于(jy)list0和list1参考图像的运动补偿参考区域。图6.31给出了根据者两个参考区域的双向预测。图8 参考(cnko)区域(list0)图9 参考(cnko)区域(list1)图10 双向预测(

32、无加权)图6.31 双向预测(无加权)第55页/共72页第五十六页,共72页。帧间预测帧间预测(yc)(yc)直接预测 直接预测模式编码(bin m)的B片宏块或宏块分割不传送MV。第56页/共72页第五十七页,共72页。帧间预测帧间预测(yc)(yc)加权预测 加权预测是一种用来修正P或B片中运动补偿预测像素方法。H.264中有3种加权预测类型:P片宏块“explicit”加权预测;B片宏块“explicit”加权预测;B片宏块“implicit”加权预测;每个预测像素pred0(i,j)和pred1(i,j)在运动补偿之前通过加权系数0和1修正。在“explicit”类型中,加权系数由编码

33、器决定并在片头中传输。在“implicit”类型中,系数0和1由相应(xingyng)list0和list1参考图像的时间位置推出。大的系数用于时间上接近当前图像的情况,小的则用于时间上远离当前图像的情况。第57页/共72页第五十八页,共72页。H.264/AVCH.264/AVC编解码器H.264/AVC的结构帧内预测(yc)帧间预测(yc)变换与量化第58页/共72页第五十九页,共72页。变换变换(binhun)(binhun)与量化与量化输入44的图像或残差块X对对X块进行块进行44整数离散余弦变换,得到W块块是色度块或帧内1616预测模式的亮度块?是对W中的直流分量进行中的直流分量进行

34、Hadamard变换,得到YD块对W块进行比例缩放及量化块进行比例缩放及量化对YD块进行比例缩放及量化否输出图1编码器中变换编码及量化过程(guchng)第59页/共72页第六十页,共72页。变换变换(binhun)(binhun)与量化与量化图2 Scanning order of residual blocks within a macroblock第60页/共72页第六十一页,共72页。变换变换(binhun)(binhun)与量化与量化n nH.264H.264对图像或预测残差采用了对图像或预测残差采用了4 44 4整数离散余弦变换整数离散余弦变换DCTDCT技术技术 n nH.264

35、H.264编码器中编码器中DCTDCT变换及量化过程如图所示。其中,如果输入块是色度块或变换及量化过程如图所示。其中,如果输入块是色度块或帧内帧内16161616预测模式预测模式(msh)(msh)的亮度块,则将宏块中各的亮度块,则将宏块中各4 44 4块的整数余弦变块的整数余弦变换的直流分量组合起来再进行换的直流分量组合起来再进行HadamardHadamard变换,进一步压缩码率变换,进一步压缩码率 第61页/共72页第六十二页,共72页。变换变换(binhun)(binhun)与量化与量化n n对实数的对实数的DCTDCT,由于在解码端的浮点运算精度问题,会造成解码后的数据的失配,由于在

36、解码端的浮点运算精度问题,会造成解码后的数据的失配,进而引起漂移。进而引起漂移。H.264H.264较其它图像编码使用了更多的预测过程,甚至内部编码模式较其它图像编码使用了更多的预测过程,甚至内部编码模式也依赖于空间预测。因此,也依赖于空间预测。因此,H.264H.264对预测漂移是十分敏感的。为此,对预测漂移是十分敏感的。为此,H.264H.264对对4 44DCT 4DCT 中的中的A A进行了改造,采用整数进行了改造,采用整数DCTDCT技术,有效地减少计算量,同时技术,有效地减少计算量,同时(tngsh)(tngsh)不损失图像准确度不损失图像准确度 第62页/共72页第六十三页,共7

37、2页。变换变换(binhun)(binhun)与量化与量化 n nH.264H.264对对4 44 4的图像块(亮度的图像块(亮度(lingd)(lingd)块或块或CrCr、CbCb色度块)进行操作,则相应的色度块)进行操作,则相应的44 DCT44 DCT为(变换矩阵为(变换矩阵A A):):n n其等价形式为:其等价形式为:其中,d=c/b(0.414)。符号“”表示(CXCT)结果中的每个元素乘以矩阵E中对应位置上的系数值的运算。为了简化(jinhu)计算,取d为 0.5。为了保持变换的正交性,对b进行修正,取第63页/共72页第六十四页,共72页。变换变换(binhun)(binhu

38、n)与量化与量化变换矩阵整数化处理(chl)H.264将DCT融合到后面的量化过程中实际的DCT输出为:W CXCT 第64页/共72页第六十五页,共72页。变换变换(binhun)(binhun)与量化与量化n n逆变换逆变换 第65页/共72页第六十六页,共72页。变换变换(binhun)(binhun)与与量化量化表 H.264中编解码器的量化步长QPQstepQPQstepQPQstepQPQstepQPQstep00.625122.5241036404816010.6875132.75251137444917620.8125143.25261338525020830.875153.5

39、2714395651224411642816406451.125174.52918417261.251853020428071.375195.53122438881.625206.532264410491.75217332845112102228343246128112.252393536471441)QP是量化参数,是量化步长Qstep的序号;2)当QP取最小值0时,代表最精细的量化,当QP取最大值51时,代表最粗糙(cco)的量化。3)QP每增加6,Qstep增加一倍。第66页/共72页第六十七页,共72页。变换变换(binhun)(binhun)与量化与量化n n 是矩阵是矩阵(j zh

40、n)W(j zhn)W中的转换系数,中的转换系数,是矩阵是矩阵(j(j zhn)zhn)中的元素,中的元素,n n利用量化步长随量化参数每增加利用量化步长随量化参数每增加6 6而增加一倍的性质,可而增加一倍的性质,可以进一步简化计算。设以进一步简化计算。设 n n qbits=15+floor(QP/6)qbits=15+floor(QP/6)第67页/共72页第六十八页,共72页。变换变换(binhun)(binhun)与量化与量化n nMFMF可以取整数,量化表只列出对应可以取整数,量化表只列出对应QPQP值为值为0 0到到5 5的的MFMF值。值。n n对于对于QPQP值大于值大于5 5

41、的情况,只是的情况,只是qbitsqbits值随值随QPQP值每增加值每增加6 6而增加而增加1 1,而对应的,而对应的MFMF值不变。值不变。n n量化过程则为整数运算,并且可以避免使用除法,并且确保用量化过程则为整数运算,并且可以避免使用除法,并且确保用1616位算法来处理数据,在基位算法来处理数据,在基本保持本保持(boch)PSNR(boch)PSNR性能的情况下,实现最小的运算复杂度。性能的情况下,实现最小的运算复杂度。第68页/共72页第六十九页,共72页。变换变换(binhun)(binhun)与量化与量化第69页/共72页第七十页,共72页。变换变换(binhun)(binhu

42、n)与量化与量化对亮度(lingd)块WD的Hadamard变换为:DCT直流系数(xsh)的变换量化0001014025032103116127138209211323221211313010153332141616的图像宏块中有44个44图像亮度块,所以亮度块的WD为44矩阵,其组成元素为各图像块DCT的直流系数W00,这些W00在WD中的排列顺序为对应图像块在宏块的位置。第70页/共72页第七十一页,共72页。变换变换(binhun)(binhun)与量化与量化对各色(gs)度块WD的Hadamard变换为:0001012103111616的图像(t xin)宏块中包含图像(t xin)色度Cr及Cb块各22个,所以色度Cr或Cb块的WD为22矩阵,其组成元素为各对应图像(t xin)块色度信号DCT的直流系数W00,这些W00在WD中的排列顺序为对应图像块在宏块的位置 第71页/共72页第七十二页,共72页。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 管理文献 > 管理工具

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com