数字电视原理与应用第09章.ppt-得力文库

资源描述

《数字电视原理与应用第09章.ppt》由会员分享，可在线阅读，更多相关《数字电视原理与应用第09章.ppt（36页珍藏版）》请在得力文库 - 分享文档赚钱的网站上搜索。

1、第第9章章数字声频压缩编数字声频压缩编码及应用码及应用9.1 人耳的听觉特性人耳的听觉特性9.2 声频数据压缩编码声频数据压缩编码9.3 声频压缩标准声频压缩标准9.1 人耳的听觉特性人耳的听觉特性9.1.1 心理声学心理声学有有关关人人听听觉觉的的研研究究包包含含人人耳耳的的生生理理结结构构，以以及及人人的的大大脑脑对对声声音音信信息息的的翻翻译译等等方方面面的的内内容容。心心理理声声学学研研究究的的是是人人对对所所听听到到的声音的主观反映。的声音的主观反映。人人耳耳对对声声音音频频率率的的响响应应是是对对数数的的，这这可以通过人耳对音程的感觉加以说明。可以通过人耳对音程的感觉加以说明。当

2、当频频率率相相近近的的两两个个声声音音同同时时发发声声时时会会产生拍频。产生拍频。9.1.2 人耳的生理结构和临界频带人耳的生理结构和临界频带1人耳的生理结构人耳的生理结构人人耳耳将将声声能能转转换换成成机机械械能能，并并最最终终将将电电脉脉冲冲传传送送至至大大脑脑，大大脑脑能能感感知知到到声声音音中中包包含含的的信信息息，图图9-2所所示示的的是是人人耳耳的的生生理理结结构解剖图。构解剖图。图图9-2 人耳的生理结构和构造剖示图人耳的生理结构和构造剖示图2临界频带临界频带对对基基底底膜膜的的研研究究表表明明：人人耳耳中中大大约约包包含含有有30，000个个沿沿着着基基底底膜膜排排列列的的多多

3、列列绒绒毛毛细细胞胞，每每列列大大约约32mm长长，这这就就是是所所说说的的螺螺旋器。旋器。Bark(以以德德国国的的物物理理学学家家 Geory Heinrich Barkhausen的的名名字字命命名名的的)是是感感知知频频率率的的单单位位。我我们们用用Bark来来度度量量临临界界频频带带的的比比值值，一一个个临临界界频频带带具具有有一一个个Bark的的宽宽度，度，1/100Bark相当于相当于1美。美。音音调调定定位位理理论论进进一一步步解解释释了了基基底底膜膜的的作用。作用。9.1.3 听觉阈和掩蔽听觉阈和掩蔽人人耳耳听听觉觉阈阈范范围围内内临临界界频频带带的的例例子子说

4、说明明了了随随着着绝绝对对频频率率的的增增高高，临临界界频频带带也也增增宽。宽。影影响响人人听听力力的的两两个个基基本本现现象象是是最最小小听听觉阈和掩蔽。觉阈和掩蔽。听听觉觉阈阈曲曲线线描描述述的的是是人人耳耳对对某某一一给给定定频率的音调音能够检测或听到的最低声级。频率的音调音能够检测或听到的最低声级。当某一音调音使其附近的频率区域的当某一音调音使其附近的频率区域的听觉阈的阈值曲线向上推移时，就说明产听觉阈的阈值曲线向上推移时，就说明产生了幅度掩蔽。生了幅度掩蔽。基底膜的机理可以解释掩蔽现象。基底膜的机理可以解释掩蔽现象。当声音发声在时间上很接近，但不是当声音发声在时间上很接近，但不是同时

5、的时候会发生瞬时掩蔽。一个信号可同时的时候会发生瞬时掩蔽。一个信号可以被在此之后发生的另一个信号以被在此之后发生的另一个信号(或噪声或噪声)所所掩蔽，这称为预掩蔽掩蔽，这称为预掩蔽(有时也称为后向掩蔽有时也称为后向掩蔽)。另外，在一个信号开始之前结束的另另外，在一个信号开始之前结束的另一个信号一个信号(或噪声或噪声)也可以掩蔽这个信号，这也可以掩蔽这个信号，这称为后掩蔽称为后掩蔽(有时也称为前向掩蔽有时也称为前向掩蔽)。瞬态掩蔽理论认为：大脑对一段时间瞬态掩蔽理论认为：大脑对一段时间内的声音进行积分处理，并且在听觉皮层内的声音进行积分处理，并且在听觉皮层上处理脉冲形式的信息；另外，大脑处理上处

6、理脉冲形式的信息；另外，大脑处理强的声音要快于弱的声音。强的声音要快于弱的声音。9.2 声频数据压缩编码声频数据压缩编码数据压缩编码器就是在量化误差最小数据压缩编码器就是在量化误差最小的同时，以压缩的数据率来表示声频信号。的同时，以压缩的数据率来表示声频信号。频域编码器有两种类型：子带和变换频域编码器有两种类型：子带和变换编码器。一般而言，子带编码器具有出色编码器。一般而言，子带编码器具有出色的时间分辨率，但频率分辨率差；而变换的时间分辨率，但频率分辨率差；而变换编码器有出色的频率分辨率，但时间分辨编码器有出色的频率分辨率，但时间分辨率差。率差。子带和变换编码都是针对一定的子带和变换编码都是针

7、对一定的采样块进行工作的。该采样块必须保采样块进行工作的。该采样块必须保持短一点，以使持短一点，以使其处在人耳的瞬态其处在人耳的瞬态分辨率之内分辨率之内。9.2.1 感知编码的原理感知编码的原理所所有有数数据据压压缩缩系系统统的的目目的的就就是是减减低低数数据据率率、采采样样频频率率和和字字长长，这这一一目目的的可可以以通通过过降降低低采采样样频频率率来来达达到到。但但是是，奈奈奎奎斯斯特特理理论论指指出出，采采样样频频率率的的降降低低相相应应地地也也会会减减小小声声频频带带宽宽的的高高端端频频率率。另另一一种种方方法法是是减减少少字字长长，但但是是这这会会造造成成声声频频信信号号动动态态范范

8、围围的的下下降降，每每减减少少一一比比特特，动动态态范范围围减减小小6dB，因此造成量化噪声的增加。因此造成量化噪声的增加。9.2.2 子带编码子带编码子带编码是由贝尔实验室于子带编码是由贝尔实验室于20世纪世纪80年代初首先提出的，并在此后的十年内欧年代初首先提出的，并在此后的十年内欧洲对此进行了不间断的研究工作。洲对此进行了不间断的研究工作。其中，图其中，图(a)所示的为高分辨率的窄所示的为高分辨率的窄带采样；图带采样；图(b)所示的为归一化和被比特率所示的为归一化和被比特率压缩的子带采样；图压缩的子带采样；图(c)所示的为重建的带所示的为重建的带有被掩蔽的本底噪声的采样。有被掩蔽的本底噪

9、声的采样。图图9-9 子带编码原理框图子带编码原理框图解解码码器器利利用用量量化化的的数数据据来来重重新新构构成成每每个个块块中中的的采采样样，利利用用一一个个反反向向合合成成滤滤波波器器组组将将子子带带信信号号相相加加来来重重建建宽宽带带的的输输出出信信号号。其其中中，图图(a)所所示示的的为为24个个频频带带的的子子带带滤滤波波器器的的输输出出；图图(b)所所示示的的为为计计算算每每个个子子带带的的平平均均电电平平；图图(c)所所示示的的为为计计算算每每个个子子带带的的掩掩蔽蔽级级；图图(d)所所示示的的为为闻闻阈阈之之下下的的子子带带不不进进行行编编码码，闻闻阈阈之之上上的的频频带带进进

10、行行编编码码；图图(e)所所示示的的为为根根据据掩掩蔽蔽阈阈之之上上的的峰峰值值电平情况进行比特分配。电平情况进行比特分配。图图9-10 子子带带编编码码示示意意图图9.2.3 变换编码变换编码在在变变换换编编码码中中，时时域域声声频频采采样样块块被被转转换换到到了了频频域域。编编码码器器可可以以采采用用诸诸如如离离散散傅傅立立叶叶变变换换(DFT)方方法法快快速速傅傅立立叶叶变变换换(FFT)来来进进行行变变换换，或或者者采采用用改改进进的的离离散散余余弦变换弦变换(MDCT)来进行变换。来进行变换。时时域域采采样样被被变变换换到到频频域域，会会产产生生谱谱系系数数。其其中中的的系系数数数数

11、目目有有时时被被称称为为频频率率箱箱(Bin)数目，数目，9.3 声频压缩标准声频压缩标准9.3.1 MP EG-1声频压缩标准声频压缩标准国国际际标标准准化化组组织织(ISO)和和国国际际电电工工委委员员会会(IEC)组组成成的的活活动动图图像像专专家家组组(MPEG)颁颁布布了了 ISO/IEC11172国国际际标标准准“对对以以1.5Mbits/s左左右右数数据据率率进进行行的的数数字字存存储储媒媒体体的的活活动动图图像像和和相相应应声声频频的的编编码码”，它它用用来来对对数数字字视视频频和和声声频频信信号号进进行行数数据据率率压压缩缩，它它于于1992年年11月月最最终终定定

12、稿稿，即即通通常常所所称称的的MPEG-1。MPEG-1标准是专门开发用来支持在标准是专门开发用来支持在1.41Mbit/s的的CD带宽上进行带宽上进行CD质量重放的质量重放的声频和视频编码的。声频和视频编码的。MUSICAM(掩蔽型通用子带综合编码掩蔽型通用子带综合编码和复用和复用)是早期开发的一种成功的感知编码是早期开发的一种成功的感知编码算法，它是由算法，它是由MASCAM(掩蔽型自适应子掩蔽型自适应子带编码和复用带编码和复用)派生出来的。派生出来的。MUSCAM将将输入的声频信号分成输入的声频信号分成32个子带，并利用最个子带，并利用最小听阈和掩蔽创建的编码模型来取得数据小听阈和掩蔽创

13、建的编码模型来取得数据压缩。压缩。在在复复杂杂性性和和编编码码延延时时方方面面，MUSICAM是相当不错的。是相当不错的。1MPEG-1层层层层可可以以说说是是MUSICAM标标准准的的简简化化版版本本，层层单单通通道道编编码码器器和和解解码码器器的的框框图图(也适用于层也适用于层)如图如图9-15所示。所示。图图9-15 MPEG-1层层或层或层的声频编码器和解码器的声频编码器和解码器2MPEG-1层层层层基基本本上上与与最最初初的的MUSICAM标标准准相相一一致致(帧帧的的字字头头不不同同)，所所以以与与层层相相类类似，但在设计上较层似，但在设计上较层更复杂精密一些。

14、更复杂精密一些。3MPEG-1层层层层结结合合了了与与MUSICAM和和ASPEC一一样样的的基基本本要要素素，并并且且较较层层和和层层更更加加复复杂杂。它它可可以以以以非非常常低低的的数数据据率率和和稍稍高高一一点点的的成成本本为为代代价价，来来得得到到适适度度保保真真度度的的音音质质。它的文件就是所说的它的文件就是所说的MP3文件。文件。分分配配控控制制算算法法采采用用了了动动态态量量化化，噪噪声声分分配配迭迭代代环环路路被被用用来来计计算算并并优优化化每每个个子子带带的的最最佳佳量量化化噪噪声声，这这称称之之为为噪噪声声分分配配，这这与比特分配相对应。与比特分配相对应。4心理声学模型心理

15、声学模型MPEG-1标标准准提提供供了了两两个个心心理理声声学学模模型型，它它们们决决定定了了不不可可闻闻的的最最低低掩掩蔽蔽阈阈。最最大大信信号号电电平平与与掩掩蔽蔽阈阈间间的的差差值值由由比比特特分分配配器利用来设定量化级。器利用来设定量化级。5MPEG-1的特性与性能的特性与性能MPEG-1各各层层支支持持采采用用强强度度编编码码的的立立体声结合编码。体声结合编码。MPEG-1声声频频数数据据是是成成帧帧传传送送的的，如如图图9-18所示。所示。图图9-18 MPEG-1声声频频层层，和和比比特特流流的的结结构构MPEG-Surround(MPEG-环绕声环绕声)是是MPEG标准的进一步

16、延伸，它利用了通道标准的进一步延伸，它利用了通道间冗余的特点，对间冗余的特点，对5.1声道进行编码。声道进行编码。MPEG-Surround(MPEG-环绕声环绕声)是是MPEG标准的进一步延伸，它利用了通道标准的进一步延伸，它利用了通道间冗余的特点，对间冗余的特点，对5.1声道进行编码。声道进行编码。9.3.2 MPEG-2声频标准声频标准MEPG-2的的声声频频标标准准(ISO/IEC DIS 13818-3)是是在在原原MEPG-1声声频频标标准准(ISO/IEC11172-3)的基础上发展起来的。的基础上发展起来的。MPEG-2的的成成功功之之处处就就在在于于它它在在低低比比特特率率情

17、情况况下下对对音音质质的的提提高高和和对对声声音音信信号号空空间间表表现现的的改改善善，这这其其中中包包括括多多声声道道立立体体声声(环绕声环绕声)和多语种节目。和多语种节目。1低采样频率算法低采样频率算法为为了了在在低低于于64kbit/s的的低低取取样样频频率率下下能能得得到到高高质质量量质质量量声声音音，相相对对于于MPEG-标标准准，采采用用了了三三个个新新取取样样频频率率：16kHz，22.05kHz和和24kHz。2多声道多声道/多语种算法多语种算法它它是是为为了了将将MPEG-标标准准与与三三声声道道以以上上的的多多声声道道声声频频及及多多语语种种声声频频相相对对应应而而引引入入

18、的的。它它的的一一个个特特点点是是与与MPEG-标标准准具具有兼容性。有兼容性。(1)多声道格式多声道格式多多声声道道输输入入声声频频信信号号如如表表9-4所所示示，共共有有9种，有种，有7种输出可与之对应。种输出可与之对应。(2)MPEG-的前向的前向/后向兼容性后向兼容性多多声声道道方方式式具具有有与与MPEG-的的后后向向兼兼容性，这是非常重要的。容性，这是非常重要的。9.3.3 AC-1，AC-2和和AC-3AC-1立立体体声声编编码码器器采采用用了了自自适适应应增增量量调调制制及及模模拟拟压压扩扩技技术术，它它并并不不是是感感知知编编码码器器。AC-1编编码码器器可可将将20kHz带

19、带宽宽的的立立体体声声声声频频信信号号编编码码为为512kbit/s的的比比特特流流(大大约约为为3 1的的压压缩缩)，它它应应用用于于电电视视的的卫卫星星中中继继、FM节目的卫星中继和有线广播业务。节目的卫星中继和有线广播业务。AC-2立立体体声声编编码码器器是是一一种种采采用用了了低低复复杂程度块变换的感知编码器。杂程度块变换的感知编码器。AC-2编码器可在编码器可在256kbit/s的数据率下的数据率下提供高质量的声音。提供高质量的声音。AC-3算法是算法是AC-2编码格式的一个分支，编码格式的一个分支，这种感知编码器可以对左、中、右、左环这种感知编码器可以对左、中、右、左环绕、右环绕和

20、一个重低音声道，即绕、右环绕和一个重低音声道，即5.1声道声道进行多声道环绕声格式的编码。进行多声道环绕声格式的编码。另外，另外，AC-3使用了对白电平控制，以使用了对白电平控制，以便使所有节目和声道的对白重放电平是一便使所有节目和声道的对白重放电平是一致的。致的。AC-3采用了混合型的后向采用了混合型的后向/前向自适应前向自适应性比特分配。性比特分配。在在AC-3编码器中，编码器中，512个采样的数据个采样的数据块被采集，并且通过块被采集，并且通过3Hz的高通滤波处理，的高通滤波处理，以消除直流偏置，并用带通滤波器进行分以消除直流偏置，并用带通滤波器进行分解以检测出瞬态。解以检测出瞬态。核心比特分配算法将解码的谱包络视核心比特分配算法将解码的谱包络视为信号的功率谱密度为信号的功率谱密度(Power Spectral Density，PSD)。一个一个AC-3帧包含有一个同步区、页头、帧包含有一个同步区、页头、被量化了频率系数的声频数据和被量化了频率系数的声频数据和CRCC误误码校验数据，码校验数据，48kHz采样频率的帧周期为采样频率的帧周期为32ms。在对电影进行编码时，在对电影进行编码时，AC-3称为杜比称为杜比立体声数字立体声数字(Dolby Stereo Digital)电影声音，电影声音，它具有它具有5.1声频声道。声频声道。

展开阅读全文