音频数字水印技术精品文稿.ppt-得力文库

资源描述

《音频数字水印技术精品文稿.ppt》由会员分享，可在线阅读，更多相关《音频数字水印技术精品文稿.ppt（108页珍藏版）》请在得力文库 - 分享文档赚钱的网站上搜索。

1、音频数字水印技术音频数字水印技术第1页，本讲稿共108页6.1 概概述述 6.1.1音频信号的数字化音频信号的数字化是指对模拟的声音信号进行A/D转换，使其转化为数字信号。这个过程有两个重要的参数：量化精度和瞬态采样频率。第2页，本讲稿共108页对高质量音频的量化方式最流行的格式是16bit线性量化，如Windows可视音频格式(WAV)和音频交换文件格式(AIFF)。另一种较低质量音频的量化方式一般采用8bit律量化。这些量化方法会使信号产生一些畸变，在8bit律量化中显得更为明显。第3页，本讲稿共108页6.1.2音频信号传送环境在实践中，含有水印的音频信号从编码到解码之间有多种可能的传

2、播途径。这里，我们仅考虑最普通的四种情形。第一种情形是声音文件从一个机器拷贝到另一个机器，其中没有任何形式的改变。第二种情形是信号仍然保持数字的形式，但采样率发生变化。第4页，本讲稿共108页第三种情形是信号被转换为模拟形式，通过模拟线路进行传播，在终端被重新采样。第5页，本讲稿共108页6.1.3对音频数字水印的要求要想成功地在数字音频媒体中隐藏水印，必须注意以下几方面的要求。1.对数据变换处理操作的稳健性要求水印本身应能经受得住各种有意无意的攻击。典型的攻击有添加噪声、数据压缩、滤波、重采样、A/D-D/A转换、统计攻击等。第6页，本讲稿共108页2.听觉相似性数字水印是在音频载体对象中嵌

3、入一定数量的掩蔽信息，为使得第三方不易察觉这种嵌入信息，需谨慎选择嵌入方法，使嵌入信息前后不产生听觉可感知的变化。3.是否需要原始数据进行信息提取根据数据嵌入和提取方案的不同设计，有些方案可以不需要借助于原始数据进行信息提取，这一性能将影响方案的用途和性能。第7页，本讲稿共108页4.数据提取误码率数据提取误码率也是音频水印方案中的一个重要技术指标，因为一方面存在来自物理空间的干扰，另一方面信道中传输的信号会发生衰减和畸变，再加上人为的数据变换和攻击，都会使数据提取的误码率增加。5.嵌入数据量指标根据用途的不同，在有些应用场合中必须保证一定的嵌入数据量，如利用音频载体进行隐蔽通信。第8页，本讲

4、稿共108页6.1.4数字音频水印系统的典型应用随着音频素材在互联网上的指数级增加，数字音频水印技术有着广泛的应用前景：(1)为了便于对音频素材进行查找和检索，可以用水印技术实现元数据(描述数据的数据)的传输，就是用兼容的隐藏的带内方式传送描述性信息。第9页，本讲稿共108页(2)在广播领域中，可以用水印技术执行自动的任务，比如广播节目类型的标识、广告效果的统计分析、广播覆盖范围的分析研究等。其优点是不依赖于特定的频段。(3)用水印技术实现知识产权的保护，包括所有权的证明、访问控制、追踪非法拷贝等。这也是水印技术最初的出发点。第10页，本讲稿共108页6.2 人类听觉特性人类听觉特性频域掩蔽

5、算法的具体实现步骤如下：(1)计算频谱。对每16ms的信号s(n)，其采样点数N=512，用Hamming窗h(n)进行加窗处理(6-1)第11页，本讲稿共108页s(n)的功率谱由下式得到(6-2)第12页，本讲稿共108页(2)确定纯音和噪音成分。这样做是因为纯音和噪音的掩蔽模型不同。如果某个频谱成分的局部极大值(S(k)S(k+1)且S(k)S(k-1)，满足下式：S(k)-S(k+j)7dB j-2,+2,if2k63 j-3,-2,+2,+3,if63k127(6-3)j-6,-5,-2,+2,+5,+6,if127k250则该成分是纯音。(6-4)第13页，本讲稿共108页(3)去

6、除被掩蔽成分，分为以下两步：根据如图6-1所示的绝对听阈曲线，把在绝对听阈以下的纯音和噪音成分去除。对相互间隔小于0.5Bark的多个纯音成分只保留其中有最大值的那一个。第14页，本讲稿共108页图6-1绝对听阈曲线图第15页，本讲稿共108页(4)计算局部掩蔽阈值与整体掩蔽阈值。对原始的N/2(即256)个频域采样点(用k代表)，只有其中的一部分采样点(用i代表)被用来计算整体掩蔽阈值。层和层所用到的采样点不同。层：频带被划分为30个子带，最低频6个子带中所有采样点都用到，接下来的6个子带的采样点每2个用到1个，余下的18个子带的采样点每4个用到1个。第16页，本讲稿共108页层：频带被划分

7、为30个子带，最低频3个子带的所有采样点都用到，接下来的3个子带的采样点每2个用到1个，接下来的6个子带的采样点每4个用到1个，余下的18个子带的采样点每8个用到1个。共用到采样点132个。第17页，本讲稿共108页(5)掩蔽是可以叠加的，因而在z(i)处具有的总掩蔽阈值LTg(i)为z(i)处的安静时阈值LTq(i)和所有临(6-8)第18页，本讲稿共108页6.3 时域音频水印算法时域音频水印算法 6.3.1最不重要位方法最不重要位方法是一种最简单的水印嵌入方法。任何形式的水印都可以转换成一串二进制码流，而音频文件的每一个采样数据也是用二进制数来表示。这样，可以将每一个采样值的最不重要位(

8、多数情况下为最低位)用代表水印的二进制位替换，以达到在音频信号中嵌入水印的目的。第19页，本讲稿共108页6.3.2基于回声的水印算法利用回声嵌入水印的算法是一种经典的音频水印算法。它利用了人类听觉系统的另一特性：音频信号在时域的向后屏蔽作用，即弱信号在强信号消失之后变得无法听见。弱信号可以在强信号消失之后50200ms的作用而不被人耳察觉。第20页，本讲稿共108页设音频序列S=s(n),0nN，按下式即可得到含有回声的音频序列Y：y(n)=s(n),0nm s(n)+s(n-m),mnN(6-9)第21页，本讲稿共108页图6-2回声编码水印嵌入流程图第22页，本讲稿共108页在实际的应用

9、中，为了提高水印嵌入的效率，Gruhl采取的方法如下：(1)假设要嵌入的水印比特为“1011001”，先将整个音频信号分成如图6-3所示的7段。(2)分别使用式(6-9)，得到延时分别为m0和m1的两个含有回声的信号，如图6-4所示。(3)构造“1”混合信号和“0”混合信号，如图6-5所示。第23页，本讲稿共108页图6-3将原始信号分为小段以嵌入数据第24页，本讲稿共108页图6-4产生“1”和“0”回声信号(用虚线表示)第25页，本讲稿共108页图6-5构造混合信号第26页，本讲稿共108页(4)将延时为m0的信号和“0”混合信号相乘，延时为m1的信号和“1”混合信号相乘，最后将两个信号相

10、加得到含水印信号。第27页，本讲稿共108页图6-6回声编码水印提取流程图第28页，本讲稿共108页回声水印的嵌入过程也可以看作音频信号和一个回声内核进行卷积，回声内核如图6-7所示。图中m是回声延时，是回声的衰减系数。第29页，本讲稿共108页图6-7回声内核第30页，本讲稿共108页6.3.3其他的时域水印方法虽然最不重要位方法有一些局限性，但由于时域水印算法运算速度快，因此除了对回声算法进行研究外，一些学者对时域的其他算法进行了深入研究，提出了一些新的算法。第31页，本讲稿共108页Kim等认为将水印信号嵌入时域中每一个样点会使人耳产生感知，他们每间隔一定的距离(35个样点)，通过修改样

11、点的幅度值而嵌入水印。在水印检测时不需要原始音频信号，而是根据嵌入水印的样点附近的样点值估计该点的原始值，进而获得嵌入的水印。第32页，本讲稿共108页Lie等提出的方法与Kim的方法类似，不同处是将每个比特的水印信号嵌入到一段音频信号中。具体算法如下所述。水印嵌入算法：将音频信号f(x)分段，每段长度为L。将任意相连的三段分别记为sec_1、sec_2和sec_3。每段的能量定义为：(6-10)第33页，本讲稿共108页其中xi表示sec_1的起始样点。将三段的能量按从大到小进行排列，重新表示为Emax、Emid和Emin。计算它们的能量差：A=Emax-Emid B=Emid-Emin(6

12、-11)第34页，本讲稿共108页(1)当水印比特为1时，如果A-B=Emax-2Emid+Emin(Emax+2Emid+Emin)d，则不对信号修改；否则增加Emax或减小Emid，直至A-B(Emax+2Emid+Emin)d。(2)当水印比特为0时，如果B-A=2Emid-Emin-Emax(Emax+2Emid+Emin)d，则不对信号修改；否则增加Emid或减小Emin，直至B-A(Emax+2Emid+Emin)d。第35页，本讲稿共108页图6-8使用三个相邻的样点段以嵌入水印示意图第36页，本讲稿共108页图6-9段边界处的渐变加权曲线第37页，本讲稿共108页6.4 变换域

13、音频水印算法变换域音频水印算法 6.4.1相位水印算法相位水印算法利用人耳听觉系统对绝对相位不敏感以及对相对相位敏感的特性，使用代表水印数据的参考相位替换原始音频段的绝对相位，并对其他的音频段进行调整，以保持各段之间的相对相位不变。相位编码的具体步骤如下：第38页，本讲稿共108页(1)设原始音频序列为 S=s(i),0iL(6-13)将S分割成N个等长的小段 sn=sn(i),0nN,0iK(6-14)其中K=L/N。第39页，本讲稿共108页(2)对第n段sn(i)进行K点的离散傅里叶变换(DFT)。生成相位矩阵n(k)和幅度矩阵An(k)(0kK)。(3)计算并存储相邻段对应频点的相位差

14、n+1(k)=n+1(k)-n(k)(6-15)其中0nN-1,0kK。第40页，本讲稿共108页(4)设水印序列W=wk,0kK),wk0,1。用下式定义wk所代表的相位值ifwk=1ifwk=0(6-16)第41页，本讲稿共108页(5)对0nN,利用相位差重新产生相位矩阵：(6-17)第42页，本讲稿共108页(6)利用修改的相位矩阵n(k)和原始幅度矩阵An(k)(其中0nN,0kK)进行IDFT，生成含水印的音频信号。第43页，本讲稿共108页水印解码时，首先要获得含水印音频信号的同步信息，信号段的长度、DFT变换点数都应该为解码方所了解。具体说来，解码过程分以下三步：(1)在已知发

15、送方信号段长度的情况下，将接收到的音频信号分段。(2)提取出第一段，对它做DFT，计算相位值。(3)根据相应的阈值，对相位值进行检测，得到0或1值，构成水印序列。第44页，本讲稿共108页6.4.2扩频水印在通常的通信信道中，为保持有效的带宽和降低能量，总是需要把信息集中在尽可能窄的频谱范围内。另一方面，基本的频谱扩展技术是将编码数据分布到尽可能多的频谱中去，以便对信息流进行编码。第45页，本讲稿共108页使用DSSS方法的音频数字水印的例子，水印嵌入的步骤如下：(1)设水印序列为P，其长度为L：P=pi,0iL,pi-1,+1。(2)设切普速率(ChipRate，扩频倍数)为cr，使用cr=

16、C对P进行比特重复(过采样)，形成调制信号：ck=pi，其中(i-1)C+1kiC。第46页，本讲稿共108页(3)设有一个伪随机m序列，将m序列的元素由0,1映射为+1,-1，得到新的序列M=mk,0kLC,mk-1,+1，使用mk对调制信号ck扩频，生成扩频水印信号wk：wk=ckmk，其中0kLC。(4)设待嵌入水印的音频信号为S，其长度为LC：S=sk,0kLC，利用下式得到嵌入水印后的信号：第47页，本讲稿共108页6.4.3离散傅里叶变换域(DFT)方法Tilki和Beex提出了一种DFT变换域音频水印嵌入算法，这种变换的频谱范围是08kHz。首先对音频信息进行DFT，然后选择其中

17、频率范围为2.46.4kHz的DFT系数进行水印嵌入，并用表示水印序列的频谱分量来替换相应的DFT系数。第48页，本讲稿共108页6.4.4离散余弦变换域(DCT)方法YeWang14提出了在时域对信号进行序列变换，在频域加入水印的方法。他首先根据伪随机序列重新排列音频采样信号，然后对序列进行修正离散余弦变换(MDCT,Modified Discrete Cosine Transform)，通过对MDCT的系数进行改变以嵌入水印，然后再进行逆变换得到嵌入水印后的音频序列。使用的MDCT公式为(6-18)第49页，本讲稿共108页逆变换为(6-19)第50页，本讲稿共108页1.线性移位寄存器如

18、图6-10所示的n级线性移位寄存器电路，每级寄存器可取0或1这两个状态之一，各级寄存器抽头，即乘法器系数ci=0或ci=1，但cn=1。设移位寄存器的初始状态为(an-1，an-2，a1，a0)，它对应的十进制数为s1，当加上一个移位脉冲时，每一级的内容右移给下一级，最末一级即第n级的内容a0就是输出，同时n个寄存器中的内容按图中的连线送至模2加法器中，运算后反馈到第一级中去，第51页，本讲稿共108页于是经过一次移位以后移位寄存器的内容变为(an，an-1，a2，a1)，它对应的十进制数为s2，其中an满足关系式(6-20)第52页，本讲稿共108页图6-10n级线性移位寄存器第53页，本讲

19、稿共108页2.水印的嵌入(1)对原始语音信号x(n)进行DCT变换。设每帧语音信号长度为N，由下式得到DCT域的序列y(k)：(k=0,1,2,N-1)(6-21)第54页，本讲稿共108页(2)选取序列y(k)的前m个值(不包括y(0)作为添加水印的位置，同时应满足m=2n，其中n为整数。(3)利用伪随机序列发生器，产生一均值为0，方差为1的正态分布随机序列w(n),n=1,2,m。(4)将序列重置，还原成，用下式进行IDCT变换，得到时域中嵌入水印的音频信号，即n=0,1,2,，N-1(6-23)第55页，本讲稿共108页3.水印的检测对待检测信号(n)，重复上述步骤(1)、(2)得到D

20、CT域序列(sn)，利用原始信号的y(sn)，得到(n)，即(6-24)(6-25)第56页，本讲稿共108页4.仿真实验及结果采用一段长度1.024s，采样频率8kHz，量化为线性16bit，内容为“坐飞机去广州”的语音信号进行实验。进行DCT变换时，每帧信号长度取为2048个样点。水印是长度为512且具有正态分布N(0,1)的随机实数序列，将水印分别嵌入各帧语音信号中。原始语音波形和嵌入水印后的语音波形分别如图6-11、图6-12所示。第57页，本讲稿共108页图6-11原始语音信号波形第58页，本讲稿共108页图6-12嵌入水印后语音信号波形第59页，本讲稿共108页(1)低通滤波。采用

21、长度为6阶，截止频率为2kHz的巴特沃兹低通滤波器。检测结果见表6-1。表6-1信号经低通滤波后的检测结果第60页，本讲稿共108页(2)噪声干扰。对信号在时域中加入高斯白噪声。信噪比取为26dB。检测结果见表6-2。表6-2信号加入白噪声后的检测结果第61页，本讲稿共108页(3)重新采样。对信号进行一次插值和一次抽取处理，插值与抽取的倍数为3。检测结果见表6-3。表6-3信号重新采样后的检测结果第62页，本讲稿共108页(4)重新量化。先将信号从16bit量化成为8bit，再量化为16bit。检测结果见表6-4。表6-4信号重新量化后的检测结果第63页，本讲稿共108页(5)语音压缩编码。

22、对信号采用G.729进行编码和解码。检测结果见表6-5。表6-5信号压缩编码后的检测结果第64页，本讲稿共108页6.4.5离散小波变换域(DWT)方法对于水印的添加而言，小波变换的类型、水印的种类、水印添加的位置以及水印的强度，这四大要素决定了水印添加算法的类型。其中水印的类型一般是预先就确定的，狭义来说,决定算法类型的是水印添加的位置和水印的强度两大要素，同时它们也决定了算法的性能。而在水印的提取过程中，要求上述各要素与添加的过程保持一致，否则就无法将水印提取出来。在音频水印中，将水印嵌入到小波域系数中可以获得较好的稳健性。第65页，本讲稿共108页在图6-13中，(a)是原始水印图像，

23、(b)是信号未经处理直接提取的水印图像，(c)是信号经低通滤波后提取的水印图像，(d)是信号加入白噪声后提取的水印图像，(e)是信号改变采样率后提取的水印图像，(f)是对信号采用MP3编码标准，在80kb/s的比特率下进行编码，解码后水印检测结果。第66页，本讲稿共108页图6-13使用小波变换算法中的水印图像第67页，本讲稿共108页6.5 其他类型的水印算法其他类型的水印算法6.5.1比特流水印前面介绍的音频水印算法中，音频载体嵌入水印后得到的输出信号是未压缩的音频内容。比特流水印系统完全工作在比特流域，输入和输出信号都是经过压缩编码的音频信号。图6-14是基于比特流的水印嵌入方案框图。第

24、68页，本讲稿共108页图6-14基于比特流的水印嵌入方案框图第69页，本讲稿共108页6.5.2压缩水印压缩水印系统输入的是未压缩的音频信号，输出的是嵌入水印的音频比特流。图6-15是Siebenhaar等19提出的一种压缩水印系统方案框图。这一方案的优点是在压缩参数和水印参数之间可以实现最佳的匹配；可一步处理(同时实现音频压缩和水印嵌入)，联合优化；计算复杂度较低。第70页，本讲稿共108页图6-15压缩水印系统方案框图第71页，本讲稿共108页为了对嵌入的水印信号的能量进行更加精确的控制，可以采用分析合成法实现频域加权过程，充分考虑量化模块的影响。分析合成法在语音编码(比如CELP)和感

25、知音频编码(比如MP3和AAC)中有着广泛的应用。图6-16是求取水印权重的分析合成迭代循环的示意图。第72页，本讲稿共108页图6-16求取水印权重的分析合成迭代循环示意图第73页，本讲稿共108页6.5.3扰动调制水印1.量化索引调制扰动调制是量化索引调制(QIM)的一种具体实现。QIM是基于一组量化器工作的，每一个样值用哪种量化器进行量化取决于嵌入信息，换句话说就是用嵌入信息来调制量化器。量化索引调制的嵌入函数为：s(x;m)x,m (6-26)第74页，本讲稿共108页图6-17量化索引调制原理图第75页，本讲稿共108页图6-17是量化索引调制的原理图。假定每样点嵌入1比特信息，因此

26、m0,1，需要两种量化器，图中分别以实心和空心圆表示。第76页，本讲稿共108页量化单元的大小和形状决定了引入的量化误差大小，即失真程度。各量化器之间的最小距离dmin决定了该系统的稳健性。dmin定义为(6-27)第77页，本讲稿共108页2.扰动调制为了易于实现，以扰动量化器来实现QIM中的一组量化器。所谓扰动量化器，即先给宿主信号加上随机扰动信号，然后再进行线性量化。这种量化索引调制被称为扰动调制(DitherModulation)。扰动调制中的扰动量化器有两种结构可以选择，即非减(或有偏)扰动量化器：Qdm(x;m)=q x+d m(6-28)和减性(无偏)扰动量化器：Qdm(x;m)

27、=q x+d m-d m (6-29)第78页，本讲稿共108页图6-18两种扰动量化器结构图第79页，本讲稿共108页3.扰动调制在音频域中的实现不同于以往在空域中应用扰动调制对静止图像嵌入水印，这里结合人耳听觉特性给出在频域中进行扰动调制的数字音频水印方案。取出24kHz频段内的DFT系数，计算相应的幅度值序列A，设序列长度为N。为了便于进一步的处理，对序列A进行归一化处理，即将序列中每个元素都除以A中的最大值Amax。(6-30)第80页，本讲稿共108页1)水印嵌入的步骤第一步：将水印信息转化为长度为Nw的二进制码流。第二步：将宿主信号分为Nc个长度为L1/Rm的数据单元，每一数据单元

28、嵌入1比特信息(0或1)。2)水印提取的步骤本方案在水印提取时不需要用到原始音频信号，因此是一种公有水印方案。第81页，本讲稿共108页6.6 音频水印的评估标准和攻击音频水印的评估标准和攻击 6.6.1IFPI水印稳健性标准IFPI(国际留声机工业联盟)在1997年对音频水印技术提出的稳健性要求，可以看作为该技术的最早标准。IFPI提出这一要求的目的是寻求一种能够生成反盗版行为的证据，跟踪传播者和其他人对音频媒体的使用，以及控制音频记录复制的标记方案。它要求水印标记满足以下的要求：第82页，本讲稿共108页(1)水印标记不能影响唱片的声音品质。(2)使用任何方法都不能删除或改变嵌入的信息，除

29、非声音质量差到不能用的地步。(3)水印经过以下变换之后必须能够恢复：各种滤波和信号处理操作(包括两个连续的D/A和A/D转换)；稳态压缩或10%的时间扩张；压缩变换(比如图像MPEG的数据压缩和多频带非线性振幅压缩)；添加加性或乘性噪声；使用同一系统加入另一个标记信号；使低音和中高音频段产生群时延失真或高达15dB的频率响应失真；群时延失真和陷波滤波等。第83页，本讲稿共108页(4)如果提供20dB或更高的信噪比，嵌入标记的数据信道应能在纠错之后还有20b/s的带宽，且与信号的电平和类型(如古典音乐、流行乐或话音)无关。第84页，本讲稿共108页6.6.2StirMark标准音频水印攻击St

30、irMark不仅在图像水印攻击方面进行了研究，同样对音频水印技术的测试标准和攻击也进行了深入的研究。StirMark的目标是通过第三方获得对一种水印算法的评价；只有这样才可以提供对水印评估问题的客观解决。这也是构建下一代StirMark标准的目标。第85页，本讲稿共108页简单化：为便于测试被广泛地接受，对现有的水印库，该服务有简单的界面(用户只需提供三个必须的函数)。用户定制：对每一种水印算法，StirMark试图使用不同的评价描述，而不用对应用工具进行再编译。模块化和测试选择：在较大系统设计中使用水印算法以完成某项目的(如阻止非法拷贝和图像交易)。第86页，本讲稿共108页感知性：对由水印

31、算法本身引入的失真量进行定性估计。StirMark允许附加的或使用者自己定义的度量矩阵，广泛使用的最简单度量是PSNR。算法容量：可以隐藏的信息数量。在多数应用中，它是系统稳健性的约束，因而稳健性测试可以在随机给定有效载荷大小的情况下进行测试。稳健性：通过测定水印的检测概率或比特错误概率来进行评定。速度：它对应用的类型(软件应用或硬件应用)有很大依赖性。第87页，本讲稿共108页图6-19建立在一组音频模块之上的对CD信号播放的攻击(以有线传输为例)第88页，本讲稿共108页1.StirMark音频攻击分类为评估水印算法的弱点，StirMark建立了一组基于修改的攻击方法。根据攻击模式，可以进

32、行以下的攻击分类：动态改变：修改音频信号的响度级。增加或降低信号幅度是最基本的攻击。滤波：滤波器滤除或增加选定部分的频谱。第89页，本讲稿共108页回响：最普通的效果是延时和混响，根据延时和混响效果品质的不同，StirMark提供了许多参数。转换：音频信号经常受到格式变化的影响。第90页，本讲稿共108页2.StirMark音频攻击测试测试的主要目的有两个：找到可以破坏嵌入在音频信号中水印的方法；在各种攻击下音频信号的品质是否改变。根据测试目的，测试共包括三个阶段：(1)确定攻击方式：使用音频编辑软件和自己的攻击算法对音频数据进行修改。(2)水印攻击：根据步骤(1)中确定的攻击方式对不同的水印

33、算法进行攻击。第91页，本讲稿共108页(3)主观测试：使用双盲三刺激(doubleblindtriplestimulustest)方法对前两步中的最佳攻击进行多个对象的测试。第92页，本讲稿共108页使用以下6个不同性质的信号对攻击进行评估：“SerenadedesAbschieds”：高品质记录的一首诗的朗读。“Menuetto”：莫扎特的古典音乐，由小提琴演奏，十分平缓。“Imready”：流行音乐，含有观众噪声。“Timein”：爵士乐，吉它演奏。“Endorphinmachin”：非常响的摇滚乐。“City”：城市中的录音，含有卡车发动的声音。第93页，本讲稿共108页1)动态改变幅

34、度压缩：使用压缩算法可以降低音频信号中的信号强度范围，使信号的峰值限制在一定范围内，而不产生失真。使用如下设置：攻击时间为1ms，释放时间为500ms，输出增益为0dB，确定门限为-50dB，压缩比率为11.1。这是非常快而且几乎听不到的设置，对所有信号放大的改变大于门限值。第94页，本讲稿共108页2)滤波高通滤波：将选定门限之下的频率成分抹去，试验中设定为50Hz。低通滤波：将选定门限之上的频率成分抹去，试验中设定为1.5kHz。均衡：使用均衡器可以降低每个频带的能量，范围是48dB。左右声道分离：对立体声声道，一个声道的频率降低，相应另一个声道会增加。第95页，本讲稿共108页3)回响延

35、时：将原始信号的延时拷贝叠加到原始信号之上，用于对空旷空间的仿真。4)转换重采样：改变信号的采样率。典型的降低采样频率是在CD制作中从48kHz降到44.1kHz。5)添加噪声随机噪声：对信号添加随机噪声，通过与原始信号比较给出相应的随机噪声的大小。第96页，本讲稿共108页6)调制和声：使用不同的时延、调制强度和元音数量，对信号增加一个调制的回声信号。7)时域拉伸和音调变化音调变化：不改变信号速度而改变音调频率。8)样点置乱零插值(zerocrossinserts)：寻找值为0的样点，在该点前后增加20个0值样点，产生信号一个短的无声段。第97页，本讲稿共108页3.测试结果StirMark

36、对四种音频水印算法进行了评估，其中三种算法是由研究水印的公司提供的，第四种是由GMD设计的。实验中将四种算法分别称为A、B、C、D，其中D是GMD的算法。表6-6给出了各种攻击对不同算法产生的效果。表中“+”表示水印强度为“强”，“”表示水印信号未被破坏，数字表示攻击对几种类型的音频信号有效。第98页，本讲稿共108页表6-6StirMark对四种音频水印算法的攻击结果第99页，本讲稿共108页6.6.3针对回声音频水印算法的攻击对回声隐藏系统的一个直接攻击方法是通过简单地将卷积公式求逆，以检测出回声并删除它，但问题是在既不知道回声参数又不了解原始信号的情况下，这样做的难度较大。这在信号处理文

37、献中被称为“盲回声消除”，它被认为是一个普遍的难题。第100页，本讲稿共108页 Petitcolas等针对音频水印的回声隐藏算法，提出了一种倒谱分析与强制搜索相结合的方法对其进行攻击。假设已知一个音频信号y(t)包含一个简单的信号回声，即 y(t)=x(t)+x(t-)(6-35)第101页，本讲稿共108页其中x(t)表示原始信号，表示延时。用xx表示x(t)的功率谱，用yy表示y(t)的功率谱，则有 yy(f)=xx(f)1+cos(2f)+2(6-36)其对数形式可近似表示为logyy(f)logxx(f)+2 cos(2f)(6-37)第102页，本讲稿共108页图6-20音频信号的

38、倒谱第103页，本讲稿共108页图6-20音频信号的倒谱第104页，本讲稿共108页为了删除回声，需要找到一种方法来检测回声延迟。为达到这一目的，对倒谱方案进行如下的修改：(6-38)第105页，本讲稿共108页图6-21回声检测器的输出结果第106页，本讲稿共108页6.7 小小结结本章介绍了音频数字水印算法。首先给出了音频信号数字化过程中与水印算法有密切关系的两项内容：采样量化方法和瞬态采样频率对水印算法的影响。由于声音的掩蔽效应在一些水印算法中的使用，我们给出了它的详细计算过程。第107页，本讲稿共108页接下来对水印算法进行了分类描述，介绍了时域、频域以及较新出现的比特流水印、压缩水印和扰动调制水印算法。最后介绍了音频水印算法的测试标准和攻击手段，详细描述了一种针对回声隐藏算法的攻击方法。第108页，本讲稿共108页

展开阅读全文