数字视频监控系统.pdf

上传人:asd****56 文档编号:70321962 上传时间:2023-01-19 格式:PDF 页数:59 大小:1.63MB
返回 下载 相关 举报
数字视频监控系统.pdf_第1页
第1页 / 共59页
数字视频监控系统.pdf_第2页
第2页 / 共59页
点击查看更多>>
资源描述

《数字视频监控系统.pdf》由会员分享,可在线阅读,更多相关《数字视频监控系统.pdf(59页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、分类号密缀九,、J,L 欲硕士学位论文M A S T E R。SD I S S E R l。A T I O N培养院系:疽:亟堇盔叠堂堂睦级学科:迸堂王狸二级学科:论文作者:指导教师:马超张延圻教授南开大学研究生院2 0 0 6 年5 月可新月募摘要摘要随着视频监控越来越多的应用于日常生活中,视频压缩编码成为视频监控领域研究的重点,视频压缩技术在较小的损失了图像质量的同时较大的减少了数据量,视频压缩标准包括I T U(国际电信联盟)的 L 2 6 L 系列和I S O(国际标准化组织)的M P E G 系列,本文用到的是I T u 的H 2 6 3 编码标准,其在网络中的低码率传输和视频信号的

2、压缩存储方面都有着广泛应用。本论文的出发点是在T I 公司的T M S 3 2 0 C 6 7 0 1D S P sE V M(评估模块)上实现视频信号的采集以及对视频信号进行H 2 6 3 压缩编码并存储,最终完成数字视频监控。为此论文展开了一下主要工作:在硬件方面完成了外围电路板的设计,用c M O s 图像传感器实现了视频信号的采集,同时由D 触发器实现了视频信号采集的时序控制,大大简化了电路结构,外围电路板和D S P 评估板连接起来构成硬件系统,对系统的功能不仅进行了软件的仿真,也进行了实际的测试,最后总结了P C B 制版的一些经验。在软件方面核心是完成H 2 6 3 的压缩编码,

3、本文对H 2 6 3 编码进行了改进,控制码流的有选择性输出。编码过程对一些关键函数的运算在D S P 中进行优化,充分发挥了D S P 的运算速度快和并行的流水结构的特点,最后总结出了D S P 优化的一些注意问题。最后,总结了整个研究工作,并指出了进一步研究探索的方向。关键词:数字视频监控,压缩存储,视频采集,H 2 6 3 编码,D S P sE v M,C M O S 图像传感器,优化A B S T R A C T B S T 髓C TB e c a I l s eo f 血ei n c r e a s i n gd e m a l l do fd i g i t a lv i d e

4、 os u r v e i l l a I l c ei no 街c e s,b u s i n e s sa n dd a i l yl i f e,d i g i t a IV i d e oc o m p r e s s i n gh a sb e c o m em o r ei m p o n a n ti nm ef i e l do fV i d e os u r v e i l l a I l c e 1 1 1 et e c l l I l i q u eo fc o m p r e s s i n gc n c o d i n gs 们v e st or e d u c ea

5、 sm u c ha sp o s s i b l et l l e 锄o u n to fd a t aw h i l er e t a i l l so r i g i n a lq u a l i t yo ft l l ei m a g e s T h ei n d u s t r yc r i t e r i o n so fc 哪n ti m a g ec o m p r e s s i n ge n c o d i l l gi I l c l u d eI T U(I n t e m a t i o n a l1 c l e c o m m u l l i c a t i o

6、nU I l i o n)sH 2 6 Ls e r i e sa n dI S 0(I n t e m a t i o n a lO r g a I l i z a t i o nf o rS t a n d a r d i z a t i o n)sM P E Gs 甜e s I nt h i sm e s i sW ea d l p tt 1 1 eH 2 6 3c r i t e r i o nw 1 1 i c hh a Sb e e n 砸d e l ya p p l i e di I ll o wb i t m t ec o m m u l l i c a t i o nv i

7、ai n t e m e ta n ds t o r a g eo f V i d e od a t a T h em e s i sa i l n sa ts 锄p l i n c o m p r e s s i I l g 锄dr c c o r dO ft t l ev i d e os i 印a l sl l S i n gH 2 6 3e n c o d i n go nc h i p so f T I sT M S 3 2 0 C 6 7 0 lD S P sE V M(E v a l u a t i o nM o d u l e),a n df m a l l yc o m p

8、l e t i n gad i g i t a lv i d e os u r v e i l l a n c es y s t e m T h ep r i m a r yw o r ki sa st l l ef o l l o w s:T h eh a r d w a r ei sc o m p o s e do faD S P sE V Ma I l di t sd a u g h t e fb o a r dw h i c hi sd e s i 印e di n d e p e n d e m ly AC M O Si m a g es e n s O ri su s e dt os

9、 锄p l i n gv i d e os i 印a l s,m e a I l w h i l eD 砸g g e r sa r el I s e dt oc o n 缸D lt l l es 椰p l i n gt i m i n gt os i m p l i 匆t 1 1 es m l c t I l r eo fm ec i r c l l i t s T h ew h o l es y s t e I n、a sn o t0 1 1 l ys i m u l a t e di nP C,b u ta l S ot e s t e de x p e r i m e n t a l l

10、 yF i I l a l l y,s o m ee x p e r i e n c e si 1 1P c Bd e s 咖a r es 眦瑚a r i z c d 1 1 1 ec o r eo ft l l es o 脚a r ei I lt l l i st 1 1 e s i si st h ei l l l p l e m e n t a t i o no fH 2 6 3e n c o d i n gi nw t l i c hs o m ei m p r o V e m e n t so nt l l ec h o i c eo f c o d es t r e 锄o u t

11、p u th a v eb e e nm a d et om e e tt l l en e e d so f a u t o-r e c o r do f t l l eV i d e os u e i l l a n c e D 谢n gm ee n c o d i n gp m c e s s,s o m ek c yf I l I l c t i o n sh a v eb e e n 叩t i f I l i z e di no r d e rt om a k eu s eo ft h ea d v a I l t a g e so fD S P sf 瓠to p e r a t i

12、 o ns p e e da n dp a r a l l e lp i p e l i n ea r c h“e c t I l r em o r ee 硒c i e m ly F i n a l l y,s o m ep m c t i c es k j l l so f 血eD S Po p t i I I l i z a t i o na r es 啪m 撕z e d T h eg e n e r a lw o r ko ft l l i st l l e s i si ss u m m a r i z e da I l ds o m e 如n l l e rw o r k si sp

13、 r o p o s e da tt l l ee n d y r d s:d i g i t a lV i d e os u r v e i l l 锄c e,c o m p r e s s i l l gr e c o r d,v i d e os i 驴a ls 锄p l i n g,H 2 6 3e n c o d i n g,D S P sE V M,C M O Si I I l a g es e n s o r o p t i I I l i z a t i o n 1 1第一章绪论第一章绪论1 1 引言随着信息科学技术的发展,具有智能化、网络化、数字化特征的各种高科技新技术不断涌

14、现。在社会生产和人们日常生活中的方方面面,这些技术得到了日益广泛的应用,降低了社会生产成本,提高了生产效率,节省了大量的人力物力,也给人们的生活带来了更多的便捷、舒适和享受。视频监控技术正是其中之一。它综合利用了现代视频图像处理、光电传感、计算机网络、自动控制和人工智能等高新技术,实现了现场语音视频信息实时再现、数据存储、自动检测报警、自动远程控制等功能,以其直观、方便、信息内容丰富的特点,日益受到人们的青睐,被广泛应用于安全防范、无人职守、信息获取和指挥调度等场合,如:银行柜台监控、交通违章和流量监控、边防监控、智能小区安全监控等等。在国内外市场上,主要推出的是数字控制的模拟视频监控和数字视

15、频监控两类产品。前者技术发展己经非常成熟、性能稳定,并在实际工程应用中得到广泛应用,特别是在大、中型视频监控工程中的应用尤为广泛;后者是新近崛起的以计算机技术及图像视频压缩为核心的新型视频监控系统,该系统解决了模拟系统的部分弊端而迅速崛起,但仍需进一步完善和发展。目前,视频监控系统正处在数控模拟系统与数字系统混合应用并将逐渐向数字系统过渡的阶段I”。数字监控系统有着一系列的优越性:省略了模拟信号的模数转换部分,同时更方便在互联网中进行传输,还有就是直接把视频信号存储在硬盘处理器,取消了视频录像带,提高了清晰度和检索速度,另外可靠性也得到了增强,所以开发智能的数字监控系统有着重要的意义1 2】。

16、数字视频监控系统通常分为两类:一类是基于P c 机组合的计算机多媒体工作方式;另一类是嵌入式视频监控系统,后者在实时处理方面应用更为广泛。下面我们来介绍一下嵌入式视频监控系统的现状。1 2 技术现状开发嵌入式视频监控系统,首先需要的就是选择合适的图像传感器和核心处理器。这两种器件的快速发展都为嵌入式视频监控系统的开发提供了必要的硬件条件。首先我们来看图像传感器。目前市场上的图像传感器主要包括两种:c M o s图像传感器和C c D 图像传感器。c M 0 s 图像传感器与c c D 相比,由于能将时序处理电路和图像信号的前端放大与数字化部分集成于一个芯片内,能直接产生第一章绪论数字视频信号,

17、而c c D 产生的则是模拟视频信号,送入数字系统之前必须要进行模数转换,因此,C M O S 的发展一直受到业界的高度重视。现在,随着技术与工艺的发展,c M O S 图像传感器不仅噪声性能得到了有效改善,而且分辨率也已得到了明显提高。一般的彩色C M O S 图像传感器都能达到1 0 0 万象素。好的c M O s 图像传感器甚至能达到3 0 0 万象素以上。因此,c M O s 图像传感器将以其低廉的价格、实用的图像质量、高集成度和相对较少的功耗,在视频监控领域得到更加广泛的应用l j J。D s P 芯片,也称数字信号处理器,是一种具有特殊结构的微处理器。D S P 芯片的内部采用程序

18、和数据分开的哈佛结构,具有专门的硬件乘法器,广泛采用流水线操作,提供特殊的D S P 指令,可以用来快速地实现各种数字信号处理算法。世界上第一个单片D s P 芯片是1 9 7 8 年A M I 公司宣布的S 2 8 1 l,从那时起,D S P芯片得到了突飞猛进的发展,在信号处理、通信、视频、音频等方面的应用越来越广泛。从运算速度来看,M A c(一次乘法和一次加法)时间已经从8 0 年代初的4 0 0 n s(如1 M S 3 2 0 1 0)降低到4 0 n s(如r I M S 3 2 C 4 0),处理能力提高了1 0 多倍。直到现在的T M S 3 2 0 C 6 0 0 0 系列

19、,M A C 时间达到几个n s,尤其适合实时的图像处理。因此,D S P 芯片也就成了嵌入式视频监控系统的首选核心处理器。嵌入式视频监控系统不仅包括硬件技术的成熟,也包括软件方面的日趋完善,各种压缩编码技术的不断出现为软件技术的发展提供了条件。1 3 本文主要工作本文中所设计的数字视频监控系统属于嵌入式视频自动监控系统,主要完成了视频图像的采集,同时把采集到的视频信号进行运动检测,当有运动的时候进行存储,无运动时不存储,存储时采用了H 2 6 3 压缩编码技术【4】。硬件方面主要包括T I 公司提供的D s P 评估板E v M c 6 7 0 1,还包括自行设计子板,子板上集成了C M O

20、 S 芯片(型号o v 7 6 4 0),F I F O 缓存(m s m5 1 8 2 2 l a)以及一些逻辑控制芯片,完成视频图像的采集并送入D S P 处理器。软件方面主要包括视频采集的控制,视频信号的H 2 6 3 压缩编码以及存储。运动检测部分体现在对H 2 6 3 编码算法的改进,从而实现了选择性存储。2第二章视频监控压缩算法及改进第二章视频监控压缩算法及改进视频编码压缩算法是监控系统的核心算法,由于未经压缩的视频图像的数据量是非常大的,例如V G A(6 4 0+4 8 0)格式一幅图像就是3 0 0 k B,当帧频为2 5 珧的时候,一秒钟数据量就是7 5 0 0 k B,一

21、分钟的数据量则达4 5 0 M B。这样大的视频信号量,要直接存储的话将要占用太大的硬盘空间。因此,视频监控系统必须要先把视频信号进行压缩处理。近年来对低码率视频压缩编码新技术的研究直非常活跃,1 T U 和I s O 也相应陆续发布了针对甚低码率视频压缩编码的新标准,如H 2 6 3,M P E G 4,H 2 6 L 以及最近提出的H 2 6 4 等。由于监控系统采取所用核心处理器为T I 公司的C 6 7 x 系列的D s P,分析此型号D s P 的处理能力和算法的复杂度,我们从中选择H 2 6 3 编码技术,作为数字视频监控系统的核心编码算法。H 2 6 3 是I T u T 于1

22、9 9 6 年制订的专门针对甚低码率视频通信应用的视频压缩标准。1 9 9 6 年3 月H 2 6 3 推出了第一版,有4 个高级模式【5】;1 9 9 8 年1 月推出了第二版,又称为H 2 6 3+,修正了一个高级模式,增加了1 0 个高级模式1 6 J;2 0 0 0年1 1 月推出了第三版,称为H 2 6 3+,再新增了3 个高级模式【。”。H 2 6 3 版本的升级对旧版本保持兼容,但功能有了增强,提高了视频压缩效率,增强了传输鲁棒性,扩大了适用范围。H 2 6 3 具有高压缩比、较强鲁棒性等特点,尤其适用于P S T N 及无线或I n t e m e t网络环境下的视频传输,己被

23、工业界广泛采用,如:可视电话标准I T U TH 3 2 4(P S T N),H 3 2 0(I S D N)和H 3 l O(B I S D N)等均采用了H 2 6 3 为视频部分的编码标准。I S O I E CM P E G 4 标准也大量借鉴了H 2 6 3 的视频压缩方案。最初H 2 6 3 确定的目标比特率低于6 4 k b p s,现在己无此限制,对4 c I F 1 6 c I F 的支持使得H 2 6 3可以与高比特率视频编码M P E G 系列标准相抗衡。而本视频监控系统中主要是用H 2 6 3 标准对视频信号进行压缩编码并存储,不涉及网络传输。下面详细介绍H 1 2

24、6 3 的编解码过程。第一节H 2 编解码原理的介绍嘲1 图像压缩的一般原理:由于图像数据之间存在着一定的冗余,所以使得数据的压缩成为可能。信息论的创始人S h 锄o n 提出把数据看作是信息和冗余度(r e d 岫d a I l c y)的组合。所谓冗余度,是由于一幅图像的各像素之间存在着很大的相关性,可利用一些编码的方法删去它们,从而达到减少冗余压缩数据的目的。为了去掉数据中的冗余,常常要考虑信源的统计特性,或建立信号源的统计模型。图像的冗余包括以下几种;(1)空间冗余:像素点之间的相关性。第二章视频监控压缩算法及改进(2)时间冗余:活动图像的两个连续帧之间的冗余。(3)信息熵冗余:单位信

25、息量大于其熵。(4)结构冗余:图像的区域上存在非常强的纹理结构。(5)知识冗余:有固定的结构,如人的头像。(6)视觉冗余:某些图像的失真是人眼小易觉察的。对数字图像进行压缩通常利用两个基本原理:(1)数字图像的相关性。在图像的同一行相邻像素之间、活动图像的相邻帧的对应像素之间往往存在很强的相关性,去除或减少这些相关性,也就去除或减少图像信息中的冗余度,即实现了对数字图像的压缩。(2)人的视觉心理特征。人的视觉对于边缘急剧变化小敏感(视觉掩盖效应),对颜色分辨力弱,利用这些特征可以在相应部分适当降低编码精度,而使人从视觉上并不感觉到图像质量的下降。数据压缩中所指的数据编码是通过选用有效的表示方法

26、,减少表示信息的数据量,从而达到数据压缩的目的。按照压缩还原效果是否存在失真,数据压缩分为无损压缩和有损压缩。H 2 6 3 编码属于有损压缩,主要用变换编码去除空间冗余,再用运动补偿预测技术去除时间冗余,具体的方法将在下文中介绍。变换编码中涉及到大量的乘法运算,由于现在D S P 处理器中专用的硬件乘法器的出现,使乘法运算变得简单,速度大大提高,以后章节会有相关介绍。2 H 2 6 3 编码原理图2 1 编解码器原理框图图2 1 是H 2 6 3 编解码原理的简要说明,关于编码器和解码器的原理在以下各节详细介绍。这里,对于编解码器的主要工作状态作以下的简要介绍:1 输入图像格式:编码器处理的

27、图像是基于c I F(c o 衄o ni n t e m e d i a c ef 0 瑚a t)格式的,输入输出的电视图像却可以是数字的或模拟的,从电视图像到c I F 格式图像的转换在此不作讨论。4第二章视频监控压缩算法及改进2 输入,输出数据格式:图像编码器输出的比特流可以与其他多种信息流结合(如H 2 2 3 所定义的信息流)。解码器则完成相反的操作。3 图像的采样频率:图像的采样频率应是视频行频的整数倍。而采样时钟与数字网时钟是异步的。4 源编码器的算法:信源编码器充分利用了时间冗余度和空间冗余度,相应采用帧间预测编码和变换编码,并有效的将两者相结合,取得了很好的压缩效果。解码器具有

28、运动补偿功能,使得编码器可以采用上述技术。运动补偿采用半像素精度,传输信号采用可变长编码。除了H 2 6 3 的核心算法,还可采用四种可选项:非限制性运动矢量模式,基于句法的算术编码模式,改进的预测模式以及P B 帧模式,所有这些模式可以同时使用,也可以分别采用其中一种或几种。5 比特率:传输时钟是由外部提供的。视频比特率可变,H 2 6 3 对此没有限制。对视频比特率的限制根据具体的终端和网络而定。6 缓存:编码器应控制其输出比特流以满足对假定的参考解码器的要求。图像数据应在每个有效的时钟周期内提供,这一点是由M c P B c 缓冲保证的。当采用前向纠错方式时,还要考虑前向纠错填充帧数。每

29、一帧图像编码产生的位数不应超过一个最大值,该值是由参数B P P x K b(单位为1 0 2 4 比特)规定的。B P P m a)(K b的最小值决定于比特流所建议采用的最大的源图像格式。7 传输的对称性:H 2 6 3 编码器可用于双向或单向视频通讯。8 差错处理:差错处理应由编码器外部提供。如果外部没有提供差错处理,可以采用可选的纠错编码方式。解码器可以通过译码参数控制以I N T R A 方式一次编码下一帧图像的一个或多个块组,以避免缓存溢出。也可以控制只传输非空的块组头。这些信息的传送方式也是由外部控制的。第二节编码器的工作原理2 2 1 源视频数据流格式共有五种标准的图像格式:s

30、 u B Q c I F、Q c I F、c I F、4 C I F 和1 6 c I F。对于每种图像格式,亮度采样是每行d)(象素,每帧d y 行。两个色差分量的采样是每行d x 2 象素,每帧d y,2 行。表2 1 是各种图像格式所对应的具体行数和象素数。图像的格式亮度信号亮度信号色度信号色度信号B P P m a x K b的列数目的行数目的行数目的行数目S U B C I F1 2 89 66 44 86 4Q C I F1 7 61 4 48 87 26 4C I F3 5 22 8 81 7 61 4 42 5 64 C I F7 0 45 7 63 5 22 8 85 1 2

31、表2-l 各种图像格式对应的行数和列数第二章视频监控压缩算法及改进对于每帧图像,色度块和亮度块的排列使得它们的边界相互镶嵌,如图2 2 所示。图像中每一帧的纵宽比是相同的,为(4 3)+(2 8 8 3 5 2)。所有的解码器必须能处理S U B Q C I F 和Q c I F 图像。某些解码器也能处理C I F,4 C I F 或1 6 C I F 图像。解码器能处理哪种图像是由外部确定的。2 2 2 编码器算法XXoooXoooXXXXXooox亮度采样点。色度采样点一宏块边缘图2 _ 2 亮度和色度信息的采样位置图2 _ 3 编码器的工作原理编码器的总体结构如图2 3 所示,模块主要包

32、括图像预测、块变换和量化。工作方式分为帧内压缩和帧间压缩。如图所示,源数据进入编码器,当采用帧内时,直接进行D c T(离散余弦变换,见公式2 1),量化后形成码流q,一路q 经反量化、反D C T 变换后形成恢复图像,直接存入帧存储器:当采用帧间方式时,原始图像先与经运动估计后的预测图像相减,产生差分图像,接着进行D c T 变换的量化,形成码流q。与帧内方式相对应,一路q 也经反量化、反D c T 变换后与预测图像相加形成恢复图像,送入帧存储器,用于下一步的运动估计。码流q、运行矢量v、帧内帧间标志p 和量化器信息q z 送入视频复用器,加入头信6第二章视频监控压缩算法及改进息后形成视频码

33、流。传输标志t 根据缓冲存储器状态和其它信息发送,用以控制视频复用器是否接入编码信息,起到调节码流速度的作用。经D c T 变换后的系数中,直流系数采用固定的量化器,交流系数采用可变长的量化器,所以其量化非常灵活。当缓冲存储器中数据过多时,便增长量化步长,提高压缩比;反之则减小量化步长,缩小压缩比,以期达到调节码流速度的作用。H 2 6 3 标准利用帧间预测来消除时间冗余度,利用D C T 变换来消除空间冗余度以及可变长编码来消除符号冗余度。D c T 变换的公式如式(2 1)77F(”,V)=l,4 a(甜)(v)厂(x,_),)c o s【万(2 x+1)甜,1 6】c o s【万(2 x

34、+1)V,1 6】(2 1)式中x,y 为空域坐标,u,v 为频域坐标。口(u),(v)为口(u)=(v)=l j口(u)=(v)=lu。v=0 时:u,v 为其他值时对于帧内压缩,H 2 6 3 标准采用D c T 和H u 硒a 1 1 编码。D C T 在性能上仅次于K L 变换,而在实现上比K L 变换方便得多,二维D c T 可方便地分解成两个一维D c T 来进行计算,具有性能优良实现简单的特点,是图像压缩中使用最广泛的算法,而且可以用快速F F T 算法来实现。变换后的系数中,非零值大量集中在变换域的左上角,经过子z i g z a g 型扫描(见表2-2)输出之后的D c T

35、系数中的连零更集中,更利于编码压缩。非均匀的量化将更多比特用于人眼敏感的低频分量,最后进行H 硼丘n a I l 编码以消除码字冗余度。帧内编码的过程参见图2 4,这里每个宏块涉及1 6 x 1 6 的Y(亮度信号)和空间相关的8x8 c b 和c r(色度信号)。12671 51 62 82 93581 41 72 73 04 3491 31 82 63 14 24 41 01 21 92 53 24 14 55 4l l2 02 43 34 04 65 35 52 l2 33 43 94 75 25 66 12 23 53 84 85 15 76 06 23 63 74 95 05 85

36、96 36 4表2 2量化变换系数之字形捧列图(蜀印g 变换)7第二章视频监控压缩算法及改进图2 4 帧内编码对于帧问编码,H 2 6 3 标准采用了帧间预测以及运动估计和运动补偿。帧间预测编码的基本依据是相邻两帧图像问的时问相关性,所以可以传输相邻两帧的差值,利用前一帧的数据来估计当前一帧。运动估计是计算运动物体从上一帧到当前帧位移的方向以及位移的象素数,求出运动矢量。运动估计和运动矢量的运算是求搜索范围内和目标图像最相似的参考图像,运动补偿是参照运动矢量,将上一帧作相应的位移,得到对当前图像的估计值。然后即可求出当前图像和当前图像估计值之间的差值,即预测误差送入量化器量化编码输出。帧间编码

37、的过程参见图2 5。卧旺最佳匹配-运动向量图2-5 帧间编码田BlD c T 变换+量化+可变长编码上霍夫曼码字1 0 1 1 0 0 n第二章视频监控压缩算法及改进帧间压缩使用的主要技术有以下几个方向。块组、宏块及块:每帧图像被划分为若干个块组。一个块组包含了k+1 6行,k 值由图像格式确定:对S U B Q C lF,Q C I F 和C I F,k=l;对4 C 1 F,k=2;对1 6 C I F,k=4。每帧I 訇像的块组数如下:S U B Q C I F:6;Q C I F:9;C I F,4 C I F和1 6 c I F:1 8。块组的编号采用垂直扫描方式:从最上方的编号为0

38、 的块组开始到最下方的块组结束。图2 6 给出了C I F 图像中块组的排列方式。块组的数据包括一个块组(可能是空的)加上后面的宏块数据。块组数据的传送是以序号递增的顺序进行的。l231 61 7图2 石c 腰图像中块组的排列方式每个块组又分为若干个宏块。一个宏块涉及1 6 x 1 6 的Y 和空间相关的8x8 C b和C r。一个宏块包含四个亮度块和两个空间相对应的色差块(如图2 7)。每个亮度块或色度块涉及8 x 8 Y,C b 或C r。对于S u B Q C I F,Q C I F 和C I F 格式的图像,一个块组包含一个宏块行;对于4 c I F 是两个宏块行;对于1 6 C I

39、F 是四个。宏块的编号是从左到右水平扫描宏块行得到的,从上方的宏块行开始到下方的宏块行结束。宏块数据的传输是以序号递增的顺序进行的,块数据的传输也是一样,序号如图2 7 所示。传送的块要进行变换,得到的变换系数要进行量化和平均编码。t234亮度块厂口图2-7 宏块中块的捧列B L u E 色度块R E D 色度块2 2 3 运动估计及运动补偿运动估计和运动补偿是视频压缩的精华所在,也是提高压缩比的关键。活动图像不仅在一帧内(空间上)存在的冗余度,更主要的是在帧与帧之间(时间上)9第二章视频监控压缩算法及改进存在冗余度。前者靠D C T 变换去除,后者主要靠块运动估计与运动补偿技术去除。运动估计

40、的方法有很多,由于块匹配法在实时性和估值精度方面能满足大多数应用的要求,是目前最常用的运动估值算法,并被H 2 6 3 建议所采用。块匹配法是在假设块内各象素只作相等的平移的前提下实现运动估值的。首先,它将当前帧划分为大小为M+N 的图像子块,在上一帧中开辟大小为(M+2 w。)+(N+2 w,)的一块搜索区,利用M+N 子块在该搜索区内寻求最优匹配来得到运动矢量的估值。最优匹配的搜索方法有很多种,如全搜索法及快速算法:对数法、对偶法、三步法等。快速算法都是以牺牲估值精度来换取搜索时间的缩短。全搜索法是最简单可靠的算法,它对搜索范围内每一点都计算s A D(帧间绝对差)值,最小的(i,j、即对

41、应着最优匹配。S A D 的计算公式如式2 2。唑&毗力=版(f,)一五一。(f,驯(2 2)l-l J-l选择一个最小的S A D,求出的x o,y 0 就是运动矢量。运动补偿是在得到运动矢量后,按照运动矢量将上一帧作相应的位移,得到对当前帧图像的估计值。解码器可以接收每个宏块一个矢量或每个宏块四个矢量(改进的预测模式)。P B 帧模式下,要传输对应于每个宏块的一个附加的增量矢量(该矢量是用来修正B 宏块的运动矢量的)。运动矢量的水平和竖直分量都有整数或半整数值。半整数值是由于运动矢量的半象素定位产生的。运动矢量的半象素定位是对图像重复采样,得到两倍大小的图像,在重复采样的八邻域中选择一个s

42、 A D 最小的点,并作为最后的运动矢量,该点对于原象素而言是半象素的精度。在缺省的预测模式下,这些值被限定在【1 6,1 5 5】内(这一点也适用于B 帧的前向和后向运动矢量分量)。非限制性运动矢量模式下,矢量分量的最大范围是【3 1 5,3 1 5】,且对每个运动矢量来说,如果预测量是在 一1 5 5,1 6】的范围内,则矢量分量只能取预测量周围 1 6 1 5 5】内的值。如果预测量不在-1 5 5,1 6】内,则可取 一3 1 5,3 1 5】内与预测量同符号的值(包括O)。2 2 4 帧内和帧间编码选择帧内和帧间编码的选择也可作为码率控制的一种策略。H 2 6 3 除了编码器进行自动

43、选择编码方式外,也可人为的强制进行帧内编码,以保证编码的质量。除了人为强制帧内编码外,为了控制反变换失配误差的累积,每传送1 3 2 次这个宏块的变换系数,P 帧中的宏块至少应该以帧内模式编码一次。这里仅介绍编码器自动进行选择的方式:式(2 3)为计算一个宏块的平均值。式(2 4)为计算一个宏块的均方差。如A s o u r c e f o n I l a t)c 嬲e(s U B C I F):谢d t l=1 2 8:h e i g h t=9 6:b r e a k:c 船e(Q C I F):w i d t h=1 7 6:h e i g h t=1 4 4;b r e a k c a

44、 s e(C I F):w i d t l l=3 5 2:h e i g h t=2 8 8;b r e a k:d e f a u l t:e x i t(一1);)其中把S u B-C I F、Q C I F、C I F 分别以宏的方式定义为O、1、2。当需要用到3 2 0+2 4 0 分辨率的时候,可以在增加c a s e 语句,多定义出一个丽d I h 和h e i g h t,同时在编码的时候可以规定P T 慢中的第3、4 比特为1 l(十进制为3)时,图像格式为Q V G A(3 2 0+2 4 0)格式。c a s e(C I F):w i d t h=3 2 0:h e i

45、g h t-2 4 0;第二章视频监控压缩算法及改进b r e a k:图像格式发生改动时候,随之改动的是每帧图像的G O B 和每G O B 的宏块数目,分别为1 5 和2 0,如果只须对3 2 0+2 4 0 分辨率的图像信号进行编码,可以省去s、v i t c h 语句,直接把相应的、v i d t l l,h e i g h t,n G O B(每帧图像的块组数),n M B(每块组的宏块数)即可。当编码过程改动了图像行与列的设置,解码的时候也要作相应的改动,才能够输出正确的码流。这种设置的改动同样可以适用于其他的分辨率,但必须遵循的一点就是图像的行数和列数应是1 6 的整数倍。2 4

46、 2 码流的选择性输出最初H 2 6 3 是针对视频会议以及可视电话在互联网中的传输受网络带宽限制提出的压缩编码技术,需要在所有时段进行实时的传输。本文中所提到的监控系统不涉及到网络的传输,只是把视频信号进行压缩存储,可应用于银行,住宅小区等地,但我们往往只是对运动存在的视频信号感兴趣,而实现对运动目标的快速识别也是智能视频监控系统的重要功能。我们根据H 2 6 3 本身的编码特点,把H 2 6 3 编码加入运动检测的部分,可以实现快速运动检测,当有运动存在时,输出码流;当没有运动存在,不输出码流,即不存储。这样既可以节省一部分存储空间,同时在检索录像过程时候也会比较方便。目前已有的运动检测算

47、法主要有三种:光流场法【9】,相邻帧差法和背景减法【1 0】【】。光流场法是计算场景中的二维速度分布,利用运动目标和背景的速度不同,将目标从背景中分割出来。该方法的优点是无需预先知道任何背景信息,但是光流场法计算量巨大,不利于实时应用。相邻帧差法是通过计算图像序列中相邻帧之间的差值达到运动检测的目的,该方法适合于动态变化的环境,但是不能完整地分割运动对象,不利于进一步的图像处理。背景减法是利用运动目标和背景间的差值来实现运动检测的,该方法在摄像机和背景相对固定的情况下具有比较好的效果,并且实现简单,适合视频监控系统中的应用。基于动态背景减法的运动目标检测算法流程如图2 1 l 所示:简单的帧间

48、预测(帧差F D)可以对于静止区域进行很好的预测,但对于图像序列中的活动物体则无能为力。对于运图2 n 背景相减算法流图第二章视频监控压缩算法及改进动的物体,如果能估计出物体在相邻帧内的相对位移,那么用上一帧中物体的对应区域对当前帧物体进行预测,编码传输预测的误差部分,就可以压缩这部分区域的码率。这种考虑了对应区域的位移或运动的预测方式就称为运动补偿预测编码。可见,帧间预测是运动补偿预测在运动矢量为零时的特殊情况。下面再来看一下H 2 6 3 帧问编码时候的过程,主要包括运动估计和运动补偿两部分:(1)运动估计,对每个运动物体进位移估计,H 2 6 3 主要采取块匹配(前边在编码器原理中已有介

49、绍),块匹配法中的搜索算法主要包括三种:全搜索法(F S)【1 2 1、钻石搜索法(D s)【1 3 J、三步搜索法(T s s)【1 4 1。我们这里用到是全搜索法;(2)运动补偿,按照运动矢量将上一帧作相应的位移,得到对当前帧图像的估计值,从而建立了预测关系,得到预测帧图像;(3)补偿后的预测信息编码,把当前帧图像与预测帧图像相减,编码传输预测的误差部分以及运动矢量。综上所述,运动目标检测的背景相减算法和H 2 6 3 中的运动补偿有着相似的地方。(3)中所提到的预测误差相当于当前图像与背景图像相减,只需加入一步判断阈值,然后把背景相减算法中的后续处理改为控制码流输出即可。这样既没有增加编

50、码的复杂度,同时还把码流进行了有选择性的输出,是一种切实可行的方法。1 9第三章D s P 原理简介第三章畸P 原理简介n 邬町在D s P 芯片出现之前,实时信号处理一般都在通用处理器(8 0 8 6 和8 0 2 8 6等)中完成的。随着集成电路制造工艺的不断提高,2 0 世纪7 0 年代末出现了专门的可编程数字信号处理器,简称D S P s。第一代D S P s 以A M D 2 9 0 0 N E C 7 2 2 0和T M S 3 2 0 1 0 为代表,其中T I 公司的T M S 3 2 0 1 0 第一次使用了哈佛总线结构和硬件乘法器。1 9 9 7 年,美国T I 公司发布了

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 技术资料 > 其他杂项

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com