第十三讲语音编码课件.ppt

上传人:石*** 文档编号:87152796 上传时间:2023-04-16 格式:PPT 页数:69 大小:3.58MB
返回 下载 相关 举报
第十三讲语音编码课件.ppt_第1页
第1页 / 共69页
第十三讲语音编码课件.ppt_第2页
第2页 / 共69页
点击查看更多>>
资源描述

《第十三讲语音编码课件.ppt》由会员分享,可在线阅读,更多相关《第十三讲语音编码课件.ppt(69页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、第十三讲语音编码第1页,此课件共69页哦 但是以但是以8KHz8KHz抽样,并且每个样值用抽样,并且每个样值用8 8位二进位二进制代码表示时,即采用制代码表示时,即采用A A率率1313折线折线PCMPCM数字语音信数字语音信号时,信息速率为号时,信息速率为64Kbit/s64Kbit/s。利用二进制理想基带传输系统传输一利用二进制理想基带传输系统传输一路这样的数字语音信号。所占系统路这样的数字语音信号。所占系统的最小频带宽度为的最小频带宽度为32KHz32KHz。频带利用率频带利用率=传输速率传输速率/带宽带宽第2页,此课件共69页哦v二二.什么是语音压缩编码?什么是语音压缩编码?What

2、is the speech compression coding?把数码率低于把数码率低于64Kbit/s64Kbit/s的语的语音编码方法称为语音压缩编码技音编码方法称为语音压缩编码技术术第3页,此课件共69页哦三三.语音编码分类语音编码分类Speech coding classification根据编码器的实现机理,分成三大类根据编码器的实现机理,分成三大类波形编码波形编码参数编码参数编码混合编码混合编码第4页,此课件共69页哦1、波形编码、波形编码waveform coding 从语音信号的波形出发,对波形的抽样从语音信号的波形出发,对波形的抽样值、预测值、预测误差进行编码,它以重值、预

3、测值、预测误差进行编码,它以重建语音波形为目的,力图使重建波形接近建语音波形为目的,力图使重建波形接近原信号波形。原信号波形。特点:利用抽样定理,恢复原始信号的波形特点:利用抽样定理,恢复原始信号的波形第5页,此课件共69页哦 优点:优点:适应能力强,重建语音质量好适应能力强,重建语音质量好缺点:缺点:编码速率较高编码速率较高类型:类型:PCM,自适应增量调制自适应增量调制(ADM),),自适应差分编码调制(自适应差分编码调制(ADPCM),),自适应预测编码自适应预测编码APC速率通常在速率通常在16-64kbit/s范围范围第6页,此课件共69页哦v2.参数编码参数编码parametric

4、 coding 提取语音的一些特征信息进行编码,提取语音的一些特征信息进行编码,在收端利用这些特征参数合成语音。在收端利用这些特征参数合成语音。v优点:优点:编码速率低。编码速率低。v缺点:缺点:语音的音质和自然度较差,很难语音的音质和自然度较差,很难辨别说话人。(有一定的可懂度辨别说话人。(有一定的可懂度)v类型类型:LPC线性预测编码线性预测编码速率通常是在速率通常是在4.8kbit/s以下以下第7页,此课件共69页哦3.混合编码混合编码hybrid codingv介于波形编码和参数编码的一种编码。介于波形编码和参数编码的一种编码。即在参数编码的基础上引入了波形编即在参数编码的基础上引入了

5、波形编码的一些特征。码的一些特征。波形编码波形编码+参数编码参数编码Waveform coding+parameters of the code可在可在4-16kbit/s范围内达到良好的语音范围内达到良好的语音质量质量类型:类型:子带编码子带编码第8页,此课件共69页哦语音编码技术语音编码技术voice encoding techniquesvoice encoding techniquesvoice encoding techniquesvoice encoding techniques 普通编译码器的音质与数据率普通编译码器的音质与数据率普通编译码器的音质与数据率普通编译码器的音质与数据

6、率第9页,此课件共69页哦衡量话音编码器的参数the parameters of the fixed voice encoder数据输出速率延迟时间话音质量价格(实现代价)第10页,此课件共69页哦语音信号的冗余度Speech signal redundancy幅度非均匀分布样本之间的相关性周期之间的相关性基音之间的相关性静止系数(话音间隙)长期相关性(long term correlation)第11页,此课件共69页哦tnxa(nT)xa(t)2.采样:将时间连续信号变将时间连续信号变成时间离散信号。成时间离散信号。采样频率通常为采样频率通常为f fs s8kHz8kHz。第12页,此课件

7、共69页哦vIdeal sampling and real sampling第13页,此课件共69页哦 对离散时间信号进行量化,在每一时刻对对离散时间信号进行量化,在每一时刻对x xa a(nT)(nT)独立进独立进行量化,把给定的幅度连续的信号变成为有限多个幅度的集行量化,把给定的幅度连续的信号变成为有限多个幅度的集合中某个幅度值的过程。合中某个幅度值的过程。3.A/D转换 A|Dtransition采样采样量化量化x xa a(t)(t)x xa a(nT)(nT)x(n)x(n)x xa1a1x x1 1x xk kx xakakx xak+1ak+1x xk+1k+1x xL Lx x

8、aLaLx xaL+1aL+1x(n)=Qxx(n)=Qxa a(nT)(nT)第14页,此课件共69页哦000001010011111110101100 /2/2第15页,此课件共69页哦量化误差量化误差(噪声噪声)e(n)=x(n)-xe(n)=x(n)-xa a(nT)(nT)-/2/2 e(n)e(n)/2/22 m=00 其他其他(1 1)假设量化噪声是平稳的白噪声过程,有)假设量化噪声是平稳的白噪声过程,有 Ee(n)e(n+m)=Ee(n)e(n+m)=(2 2)假设量化噪声与输入信号不相关,有)假设量化噪声与输入信号不相关,有 Ee(n)x(n+m)=0 mEe(n)x(n+m

9、)=0 m为任意值为任意值(3 3)在每个量化间隔上,量化噪声均匀分布,有)在每个量化间隔上,量化噪声均匀分布,有 P Pe e(e(n)=(e(n)=1|e(n)|1|e(n)|/2/2 0 其他其他第16页,此课件共69页哦量化信噪比量化信噪比Quantitative SNR量化噪声的信噪比:量化噪声的信噪比:SNR=SNR=x x2 2/e e2 2 x x2 2语音信号序列的方差,语音信号序列的方差,e e2 2噪声序列的方差,噪声序列的方差,用分贝用分贝表示,表示,SNR=10log(SNR=10log(x x2 2/e e2 2)SNR=signals energy/noises

10、energy第17页,此课件共69页哦SNR=6.02B+4.77SNR=6.02B+4.7720log(X20log(Xmaxmax/x x)6.02B6.02B7.277.27 X Xmaxmax表示其峰值表示其峰值 B B为量化的比特数为量化的比特数当语音信号的幅度服从拉普拉斯分布时,当语音信号的幅度服从拉普拉斯分布时,X Xmaxmax4 4 x x 量化器每增加一个比特,量化器每增加一个比特,SNRSNR提高约提高约6dB6dB。当。当B=8,SNR=40dBB=8,SNR=40dB,满足一般通信系统的要求。当量化噪声,满足一般通信系统的要求。当量化噪声的信噪比达到的信噪比达到 60

11、6070dB70dB,才能保障有高水平通话质量,才能保障有高水平通话质量,这时要求量化为这时要求量化为 111113bits13bits。一般的音频。一般的音频A/DA/D、D/AD/A转换转换芯片,量化为芯片,量化为12bits12bits。第18页,此课件共69页哦脉冲编码调制pulse code modulation(PCM)Pulse Code Modulation第19页,此课件共69页哦PCM的量化方式Quantization Method均匀量化与非均匀量化第20页,此课件共69页哦非均匀量化non-uniform quantizing对小信号采用小的量化间隔,对大信号采用大的量

12、化间隔,这样可以用较少的位数编码。对大信号来说,虽然绝对量化误差较大,但是因为:(1)大信号出现的机会不多,(2)信噪比(相对误差)与小信号是一致的,所以对总的话音质量影响不大。非均匀量化也是一种压缩。第21页,此课件共69页哦律压扩与A律压扩 and a law pressure expansionm 律(m-Law)压扩(G.711)主要用在北美和日本等地区的数字电话通信中。x为x 为输入信号,规格化为1=x=1m 为确定压缩量的参数,它反映最大量化间隔和最小量化间隔之比,取100=m=500。第22页,此课件共69页哦律压扩与A律压扩 and a law pressure expansi

13、on0 0=|x x|=1/A 1/A1/A 1/A=|x x|=1 1A律(A-Law)压扩(G.711)主要用在欧洲和中国大陆等地区的数字电话通信中对于采样频率为8 kHz,样本精度为13位、14位或者16位的输入信号,使用m 律压扩编码或者使用A律压扩编码,经过PCM编码器之后每个样本的精度为8位,输出的数据率为64 kb/s。这个数据就是CCITT推荐的G.711标准。第23页,此课件共69页哦自适应差值脉冲编码调制原理自适应差值脉冲编码调制原理Adaptive difference pulse code modulation principle(ADPCM)v差值脉冲编码(差值脉冲编

14、码(DPCM)v1.编码思想编码思想提高通信质量提高通信质量必须必须减小量化误差减小量化误差减小量化级减小量化级当抽样值范围确定时当抽样值范围确定时增加编码增加编码位数位数N第24页,此课件共69页哦v增加编码位数可获得大的信噪比增加编码位数可获得大的信噪比Increase the coding can obtain the digits signal-to-noise ratio在编码位数固定时,减小抽样值的变化范围,在编码位数固定时,减小抽样值的变化范围,也同样可以提高信噪比也同样可以提高信噪比即:若缩小抽样值(被编码信号)的变即:若缩小抽样值(被编码信号)的变化范围,就可以在保证信噪比不

15、变的情化范围,就可以在保证信噪比不变的情况下,减小编码的位数。这就是差值编况下,减小编码的位数。这就是差值编码的中心思想码的中心思想第25页,此课件共69页哦增量调制delta modulation(M)增量调制(delta modulation,DM)是一种预测编码技术,是对实际的采样信号与预测的采样信号之差的极性进行编码,将极性变成“0”和“1”这两种可能的取值之一。如果实际的采样信号与预测的采样信号之差的极性为“正”,则用“1”表示;相反则用“0”表示。DM编码系统又称为“1位系统”。第26页,此课件共69页哦 二、差值编码模型图二、差值编码模型图Poor value coding mo

16、del figurePoor value coding model figure在原来的抽样值中减去某一个值,然后对在原来的抽样值中减去某一个值,然后对两者之差进行编码。在接收端将解码值再两者之差进行编码。在接收端将解码值再加上发送端所减去的值便可恢复出原始值。加上发送端所减去的值便可恢复出原始值。第27页,此课件共69页哦 x(n)+d(n)c(n)d(n)x(n)-x(n)x(n)差值编码模型差值编码模型译码译码+编码编码+第28页,此课件共69页哦图中:图中:x(n)是原始样值(是原始样值(n时刻的抽样值)时刻的抽样值)x(n)为减去量为减去量d(n)=x(n)-x(n)为差值为差值可以

17、看出:可以看出:(1)、)、d(n)越小,在相同的编码位数时信越小,在相同的编码位数时信噪比越大噪比越大(2)、收发端必须有相同的减去量)、收发端必须有相同的减去量x(n)第29页,此课件共69页哦根据前些时刻的样值来预测现时刻的样值,根据前些时刻的样值来预测现时刻的样值,只要传递预测值和实际值之差,而不需要每只要传递预测值和实际值之差,而不需要每个样值的编码都传。这种方法就称为个样值的编码都传。这种方法就称为DPCM编码。编码。v三、三、DPCM系统系统system1、DPCM系统的概念:系统的概念:第30页,此课件共69页哦v举例来说举例来说,设以设以1/Ts1/Ts的速率对信号的速率对信

18、号S S(t t)抽样)抽样,在在 时刻前可得到时刻前可得到 ,等一组样值等一组样值.以前面以前面N N个样值作为基础对个样值作为基础对 的预测值是的预测值是第31页,此课件共69页哦不同时刻样值的加权系数不同时刻样值的加权系数:根据相关性情况,可设根据相关性情况,可设 为常量或变量为常量或变量第32页,此课件共69页哦2、实现预测的横向滤波器(、实现预测的横向滤波器(N阶预测器)阶预测器)Realize the forecast transverse filter(N order predictor)第33页,此课件共69页哦在每个抽样时刻到来时,滤波器输出将会给在每个抽样时刻到来时,滤波器

19、输出将会给出下一个样值的预测值。出下一个样值的预测值。一般来说,在抽样时刻一般来说,在抽样时刻 t=nTs 时所得的预测值时所得的预测值 与真正的样值与真正的样值 并不相同。并不相同。N阶预测器输出阶预测器输出N order predictor output:第34页,此课件共69页哦差差值值脉脉冲冲编编码码就就是是对对真真正正的的样样值值 与与过过去去的的样样值值为为基基础础得得到到的的估估值值 之之间间的的差差值进行量化和编码。值进行量化和编码。第35页,此课件共69页哦3、DPCM系统模型框图系统模型框图system model framework chart下张第36页,此课件共69页

20、哦图中:图中:x(n)为抽样信号的实际值为抽样信号的实际值第37页,此课件共69页哦vd(n)=x(n)-x(n)图x(n)=x(n)+d(n)该系统的量化误差可以表示为:该系统的量化误差可以表示为:e(n)=x(n)-x(n)=d(n)+x(n)-x(n)+d(n)=d(n)-d(n)v上式表明:系统的传输误差就上式表明:系统的传输误差就是差值()的量化误差是差值()的量化误差4、DPCM系统的抗噪声性能分析系统的抗噪声性能分析DPCM system of noise performance of the analysis第38页,此课件共69页哦系统信噪比定义为:系统信噪比定义为:v=预测

21、器增益预测器增益量化器的量化量化器的量化信噪比信噪比GP1预测器有预测器有增益增益加预测器后反加预测器后反而不利而不利第39页,此课件共69页哦GP:DPCM系统相对于系统相对于PCM系统而言的信系统而言的信噪比增益噪比增益DPCM system relative to PCM system in the signal-to-noise ratio of the gain。量化器产生的信噪比量化器产生的信噪比即非预测的即非预测的PCM系统的量化信噪比系统的量化信噪比第40页,此课件共69页哦提高系统信噪比采取的措施提高系统信噪比采取的措施Improve the system signal-to

22、-noise ratio measuresv减小减小 第41页,此课件共69页哦x(n)精确精确d(n)d(n)=x(n)-x(n)最佳预测最佳预测量化误差量化误差最佳量化最佳量化第42页,此课件共69页哦小结小结v一一.压缩编码的原因压缩编码的原因v二二.什么是语音压缩编码什么是语音压缩编码v三三.语音编码分类语音编码分类vADPCM系统系统vDPCMv一一.差值编码思想差值编码思想v二二.差值编码系统模型图差值编码系统模型图v三三.DPCM系统系统v1.概念概念2.预测器模型图预测器模型图3.DPCM系统模型系统模型4.DPCM系统的抗噪声性能分析系统的抗噪声性能分析第43页,此课件共69

23、页哦自适应差值脉冲编码调制自适应差值脉冲编码调制Adaptive difference pulse code modulation(ADPCM)1、实质:、实质:DPCM+自适应量化和自适应预测自适应量化和自适应预测固定预测固定预测 固定量化固定量化2、定义、定义能够实现自适应预测功能,或者自能够实现自适应预测功能,或者自适应量化功能或者同时实现两种自适应量化功能或者同时实现两种自适应功能的适应功能的DPCM系统称为系统称为ADPCM系统。系统。第44页,此课件共69页哦3.设计的目的设计的目的Design purposevADPCM充分利用了语音波形的统计特征和充分利用了语音波形的统计特征和

24、人耳听觉特性人耳听觉特性,其设计思路主要瞄准了两个其设计思路主要瞄准了两个目标目标:a:尽可能去掉语音信号中的冗余信号尽可能去掉语音信号中的冗余信号b:以有效的方式将可用比特分配给语音信以有效的方式将可用比特分配给语音信号号对消除冗余后的信号对消除冗余后的信号,从自适应角度进从自适应角度进行最佳编码行最佳编码第45页,此课件共69页哦1.1预测的自适应预测的自适应Prediction of the adaptive(1).极点预测器极点预测器1.预测器的结构预测器的结构 structure of predictor(用重建信号用重建信号x(n)进行的预测)进行的预测)+量化器量化器预测器预测器

25、+X(n)X(n)d(n)d(n)编码编码X(n)P(Z)X(n)a:极点预测器的方框图极点预测器的方框图第46页,此课件共69页哦b:预测器传递函数预测器传递函数P(z)N阶预测器公式:阶预测器公式:X(n)=第47页,此课件共69页哦进行进行Z变换后得:变换后得:则预测器的传递函数为:则预测器的传递函数为:为预测系数为预测系数第48页,此课件共69页哦第49页,此课件共69页哦c:重建滤波器重建滤波器Reconstruction Filter+预测器预测器x(n)x(n)X(n)d(n)H(Z)重建滤波器重建滤波器第50页,此课件共69页哦=E x(n)+Ex(n-1)-2Ex(n)x(n

26、-1)22=2E x(n)-2Ex(n)x(n-1)2分析:分析:=第51页,此课件共69页哦()一阶()一阶最佳最佳线性预测线性预测First order the best linear prediction求最佳预测系数求最佳预测系数h1N=1时;时;X(n)=h1x(n-1)则差值信号为:则差值信号为:d(n)=x(n)-h1x(n-1)+Ed(n)=2=Ex(n)-h1x(n-1)2=E x(n)+h1Ex(n-1)-2h1Ex(n)x(n-1)22=2-=2求使求使最小的最小的h1的值的值2第52页,此课件共69页哦令令得最佳预测系数得最佳预测系数h1opt=p1当当N=1时的最大预

27、测增益为:时的最大预测增益为:第53页,此课件共69页哦b.二阶线性预测二阶线性预测Second order linear forecast(N=2)d(n)=x(n)-h1x(n-1)-h2x(n-2)=Ed(n)2=Ex(n)-h1x(n-1)-h2(n-2)2令令得最佳得最佳h1,h2第54页,此课件共69页哦大于或者大于或者等于零等于零故二阶预测器总是优于一阶预测器故二阶预测器总是优于一阶预测器第55页,此课件共69页哦C:N阶最佳线性预测阶最佳线性预测N order the best linear prediction求偏微分,并令为零求偏微分,并令为零=Ed(k)2第56页,此课件

28、共69页哦所以得到一组线性方程所以得到一组线性方程第57页,此课件共69页哦差值信号在差值信号在预测系数取最佳值时预测系数取最佳值时最小最小第58页,此课件共69页哦最佳预测增益最佳预测增益Best predict gain第59页,此课件共69页哦2.自适应预测自适应预测adaptive predictionl1)前向自适应预测算法前向自适应预测算法Prior to the adaptive prediction algorithm根据短时间的相关特性根据短时间的相关特性R(i),求短时的最佳预测系求短时的最佳预测系数数特点特点:运算量大,延迟时间大,不能用于高速系运算量大,延迟时间大,不能

29、用于高速系统。统。第60页,此课件共69页哦采用不断修正预测系数采用不断修正预测系数hi(n)的方法来减小瞬时平方差的方法来减小瞬时平方差Ed(n),使使hi(n)逐步的接近逐步的接近hiopt(n).2)后向序贯自适应预测算法)后向序贯自适应预测算法The sequential adaptive prediction algorithm2第61页,此课件共69页哦LMS算法算法arithmetic(最小均方算法)(最小均方算法)(minimum mean square algorithm)(minimum mean square algorithm)梯度系数,它决定了预测系数自适应速率梯度系

30、数,它决定了预测系数自适应速率第62页,此课件共69页哦梯度符号算法梯度符号算法Gradient sign algorithmGradient sign algorithm极点预测器极点预测器零点预测器零点预测器衰减因子衰减因子(抗误码因子抗误码因子)第63页,此课件共69页哦1.2量化的自适应量化的自适应Quantitative adaptive1、最佳量化、最佳量化Best quantitation分层电平为相邻量化电平的中点分层电平为相邻量化电平的中点量化电平是该量化间隔内经常出现的瞬时电量化电平是该量化间隔内经常出现的瞬时电平值平值固定量化器固定量化器+可变可变增益放大器增益放大器第6

31、4页,此课件共69页哦2、自适应量化的基本思想、自适应量化的基本思想The basic idea of the adaptive quantizationv自适应量化的基本思想是使量化器的量化级自适应量化的基本思想是使量化器的量化级(阶距)能够随着输入信号(阶距)能够随着输入信号d(n)瞬时值得变瞬时值得变化作自适应调整,从而使量化误差的均方值化作自适应调整,从而使量化误差的均方值最小。最小。即即:自适应量化指量化台阶随信号变化而变化,自适应量化指量化台阶随信号变化而变化,使量化误差减小使量化误差减小第65页,此课件共69页哦3、实现方法、实现方法implementation methods前

32、向自适应量化前向自适应量化Prior to the adaptive quantization(AQF)优点:优点:量化误差小,信噪比大量化误差小,信噪比大缺点:缺点:量阶的信息要与话音信号一起送到收端译量阶的信息要与话音信号一起送到收端译码器,否则,收端无法知道该时刻的量阶值码器,否则,收端无法知道该时刻的量阶值第66页,此课件共69页哦v优点:优点:接收端不需要量阶的信息,因为量阶接收端不需要量阶的信息,因为量阶的信息可以从接收码中提取,码速率低,实的信息可以从接收码中提取,码速率低,实现容易。现容易。后向自适应量化后向自适应量化(AQB)Prior to the adaptive qua

33、ntization缺点:缺点:因为量化误差影响量化值得准确度,即信因为量化误差影响量化值得准确度,即信噪比下降,但影响较小。噪比下降,但影响较小。第67页,此课件共69页哦32kb/sADPCM编译码系统编译码系统Decoding systemCcittg.721建议提出了能和已有的建议提出了能和已有的PCM数字电话数字电话网兼容的网兼容的32kb/sADPCM算法。该算法主要技算法。该算法主要技术指标如下:术指标如下:(1)语音信号经过)语音信号经过ADPCM编码后,客观测量编码后,客观测量SNR应完全符合应完全符合PCM系统的指标要求,主观听系统的指标要求,主观听觉测试性能非常接近于觉测试性能非常接近于PCM质量。质量。(2)经过四次音频转接后,主观语音测试质量)经过四次音频转接后,主观语音测试质量良好,主观平均分(良好,主观平均分(MOS)大于)大于3.5以上。以上。(3)在信道误码低于)在信道误码低于0.001的情况下能稳定工作的情况下能稳定工作第68页,此课件共69页哦矢量量化Vector Quantizationv矢量量化(VQ)Vector Quantization第69页,此课件共69页哦

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com