第5章数据音频技术PPT讲稿.ppt-得力文库

资源描述

《第5章数据音频技术PPT讲稿.ppt》由会员分享，可在线阅读，更多相关《第5章数据音频技术PPT讲稿.ppt（59页珍藏版）》请在得力文库 - 分享文档赚钱的网站上搜索。

1、第5章数据音频技术第1页，共59页，编辑于2022年，星期一第第5章章数据音频技术数据音频技术声音是多媒体技术研究中的一个重要内容。声音的种类繁多，如声音是多媒体技术研究中的一个重要内容。声音的种类繁多，如声音是多媒体技术研究中的一个重要内容。声音的种类繁多，如声音是多媒体技术研究中的一个重要内容。声音的种类繁多，如人的话音、乐器的声响、动物的叫声、机器产生的声音以及自然人的话音、乐器的声响、动物的叫声、机器产生的声音以及自然人的话音、乐器的声响、动物的叫声、机器产生的声音以及自然人的话音、乐器的声响、动物的叫声、机器产生的声音以及自然界的雷声、风声、雨声、闪电声等。在用计算机处理这些声

2、音时，界的雷声、风声、雨声、闪电声等。在用计算机处理这些声音时，界的雷声、风声、雨声、闪电声等。在用计算机处理这些声音时，界的雷声、风声、雨声、闪电声等。在用计算机处理这些声音时，既要考虑它们的共性，又要利用它们各自的特性。既要考虑它们的共性，又要利用它们各自的特性。既要考虑它们的共性，又要利用它们各自的特性。既要考虑它们的共性，又要利用它们各自的特性。自从自从自从自从19691969年年年年BellBell实验室开始数字语音的研究以来，计算机产生音实验室开始数字语音的研究以来，计算机产生音实验室开始数字语音的研究以来，计算机产生音实验室开始数字语音的研究以来，计算机产生音乐以及语音识别、语音

3、合成技术得到了越来越广泛的研究和应用。乐以及语音识别、语音合成技术得到了越来越广泛的研究和应用。乐以及语音识别、语音合成技术得到了越来越广泛的研究和应用。乐以及语音识别、语音合成技术得到了越来越广泛的研究和应用。多媒体数字音频处理技术在音频数字化、语音处理、合成及识别多媒体数字音频处理技术在音频数字化、语音处理、合成及识别多媒体数字音频处理技术在音频数字化、语音处理、合成及识别多媒体数字音频处理技术在音频数字化、语音处理、合成及识别等各个方面都有着很好的发展。等各个方面都有着很好的发展。等各个方面都有着很好的发展。等各个方面都有着很好的发展。第2页，共59页，编辑于2022年，星期一5.1 声

4、音与声音信号数字化声音与声音信号数字化作为一种模拟信号，声音在时间和振幅上都是连续的，即它的振幅作为一种模拟信号，声音在时间和振幅上都是连续的，即它的振幅作为一种模拟信号，声音在时间和振幅上都是连续的，即它的振幅作为一种模拟信号，声音在时间和振幅上都是连续的，即它的振幅能以任意精度并在任何一个时刻进行测量。与之不同的是，数字信能以任意精度并在任何一个时刻进行测量。与之不同的是，数字信能以任意精度并在任何一个时刻进行测量。与之不同的是，数字信能以任意精度并在任何一个时刻进行测量。与之不同的是，数字信号只能在确定的时刻才有意义，其数值也只能取有限的量。号只能在确定的时刻才有意义，其数值也只能取有

5、限的量。号只能在确定的时刻才有意义，其数值也只能取有限的量。号只能在确定的时刻才有意义，其数值也只能取有限的量。第3页，共59页，编辑于2022年，星期一5.1.1 声音与听觉器官声音与听觉器官声音的强弱表现在声波压力的大小上，音调的高低表现在声音的频声音的强弱表现在声波压力的大小上，音调的高低表现在声音的频声音的强弱表现在声波压力的大小上，音调的高低表现在声音的频声音的强弱表现在声波压力的大小上，音调的高低表现在声音的频率上。当声音用电信号表示时，在时间和幅度上都是连续的模拟信率上。当声音用电信号表示时，在时间和幅度上都是连续的模拟信率上。当声音用电信号表示时，在时间和幅度上都是连续的模拟

6、信率上。当声音用电信号表示时，在时间和幅度上都是连续的模拟信号。对声音信号的分析表明，声音信号由许多频率不同的信号组成，号。对声音信号的分析表明，声音信号由许多频率不同的信号组成，号。对声音信号的分析表明，声音信号由许多频率不同的信号组成，号。对声音信号的分析表明，声音信号由许多频率不同的信号组成，这类信号称为复合信号，而单一频率的信号称为分量信号。声音信这类信号称为复合信号，而单一频率的信号称为分量信号。声音信这类信号称为复合信号，而单一频率的信号称为分量信号。声音信这类信号称为复合信号，而单一频率的信号称为分量信号。声音信号的一个重要参数就是带宽，用来描述组成复合信号的频率范围，号的一个重

7、要参数就是带宽，用来描述组成复合信号的频率范围，号的一个重要参数就是带宽，用来描述组成复合信号的频率范围，号的一个重要参数就是带宽，用来描述组成复合信号的频率范围，如高保真声音的频率范围为如高保真声音的频率范围为如高保真声音的频率范围为如高保真声音的频率范围为1020000Hz1020000Hz，带宽约为，带宽约为，带宽约为，带宽约为20kHz20kHz，而视，而视，而视，而视频信号的带宽是频信号的带宽是频信号的带宽是频信号的带宽是6MHz6MHz。第4页，共59页，编辑于2022年，星期一5.1.1 声音与听觉器官声音与听觉器官声音信号的两个基本参数是频率和幅度。信号的频率是指信号每秒声音

8、信号的两个基本参数是频率和幅度。信号的频率是指信号每秒声音信号的两个基本参数是频率和幅度。信号的频率是指信号每秒声音信号的两个基本参数是频率和幅度。信号的频率是指信号每秒钟变化的次数，用钟变化的次数，用钟变化的次数，用钟变化的次数，用HzHz表示。频率小于表示。频率小于表示。频率小于表示。频率小于20Hz20Hz的信号称为亚音信号，的信号称为亚音信号，的信号称为亚音信号，的信号称为亚音信号，或称为次音信号；频率范围为或称为次音信号；频率范围为或称为次音信号；频率范围为或称为次音信号；频率范围为20Hz20kHz20Hz20kHz的信号称为音频的信号称为音频的信号称为音频的信号称为音频（Audi

9、oAudio）信号。虽然人的发音器官发出的声音频率大约是）信号。虽然人的发音器官发出的声音频率大约是）信号。虽然人的发音器官发出的声音频率大约是）信号。虽然人的发音器官发出的声音频率大约是803400Hz803400Hz，但人说话的信号频率通常为，但人说话的信号频率通常为，但人说话的信号频率通常为，但人说话的信号频率通常为3003000Hz3003000Hz，在这种频率，在这种频率，在这种频率，在这种频率范围的信号称为话音信号；高于范围的信号称为话音信号；高于范围的信号称为话音信号；高于范围的信号称为话音信号；高于20kHz20kHz的信号称为超音频信号，或的信号称为超音频信号，或的信号称为超

10、音频信号，或的信号称为超音频信号，或称超声波信号。一般来说，人的听觉器官能感知的声音频率大约在称超声波信号。一般来说，人的听觉器官能感知的声音频率大约在称超声波信号。一般来说，人的听觉器官能感知的声音频率大约在称超声波信号。一般来说，人的听觉器官能感知的声音频率大约在2020000Hz2020000Hz之间，在这种频率范围里感知的声音幅度大约在之间，在这种频率范围里感知的声音幅度大约在之间，在这种频率范围里感知的声音幅度大约在之间，在这种频率范围里感知的声音幅度大约在0120db0120db之间。多媒体技术中处理的主要是音频信号，包括音乐、语音和音效之间。多媒体技术中处理的主要是音频信号，包括

11、音乐、语音和音效之间。多媒体技术中处理的主要是音频信号，包括音乐、语音和音效之间。多媒体技术中处理的主要是音频信号，包括音乐、语音和音效（风雨声、鸟叫声、机器声）等。（风雨声、鸟叫声、机器声）等。（风雨声、鸟叫声、机器声）等。（风雨声、鸟叫声、机器声）等。第5页，共59页，编辑于2022年，星期一5.1.2 模拟信号与数字信号模拟信号与数字信号大多数电信号（模拟信号）过去一直是用模拟元部件（如晶体管、变压大多数电信号（模拟信号）过去一直是用模拟元部件（如晶体管、变压大多数电信号（模拟信号）过去一直是用模拟元部件（如晶体管、变压大多数电信号（模拟信号）过去一直是用模拟元部件（如晶体管、变压器、

12、电阻、电容等）进行处理的。但是，开发一个具有相当精度、且几器、电阻、电容等）进行处理的。但是，开发一个具有相当精度、且几器、电阻、电容等）进行处理的。但是，开发一个具有相当精度、且几器、电阻、电容等）进行处理的。但是，开发一个具有相当精度、且几乎不受环境变化影响的模拟信号处理元部件相当困难，成本也很高。乎不受环境变化影响的模拟信号处理元部件相当困难，成本也很高。乎不受环境变化影响的模拟信号处理元部件相当困难，成本也很高。乎不受环境变化影响的模拟信号处理元部件相当困难，成本也很高。话音信号是典型的连续信号，不仅在时间上，而且在幅度上也是连续的。话音信号是典型的连续信号，不仅在时间上，而且在幅度上

13、也是连续的。话音信号是典型的连续信号，不仅在时间上，而且在幅度上也是连续的。话音信号是典型的连续信号，不仅在时间上，而且在幅度上也是连续的。时间上时间上时间上时间上“连续连续连续连续”是指在一个指定的时间范围内声音信号的幅值有无穷多是指在一个指定的时间范围内声音信号的幅值有无穷多是指在一个指定的时间范围内声音信号的幅值有无穷多是指在一个指定的时间范围内声音信号的幅值有无穷多个，在幅度上个，在幅度上个，在幅度上个，在幅度上“连续连续连续连续”是指幅度的数值有无穷多个。我们把在时间和幅是指幅度的数值有无穷多个。我们把在时间和幅是指幅度的数值有无穷多个。我们把在时间和幅是指幅度的数值有无穷多个。我们

14、把在时间和幅度上都是连续的信号称为模拟信号。度上都是连续的信号称为模拟信号。度上都是连续的信号称为模拟信号。度上都是连续的信号称为模拟信号。第6页，共59页，编辑于2022年，星期一5.1.2 模拟信号与数字信号模拟信号与数字信号如果把模拟信号转变成数字信号，用数字来表示模拟量和对数如果把模拟信号转变成数字信号，用数字来表示模拟量和对数如果把模拟信号转变成数字信号，用数字来表示模拟量和对数如果把模拟信号转变成数字信号，用数字来表示模拟量和对数字信号做计算，那么开发模拟运算部件的问题就转变成了开发字信号做计算，那么开发模拟运算部件的问题就转变成了开发字信号做计算，那么开发模拟运算部件的问题就转

15、变成了开发字信号做计算，那么开发模拟运算部件的问题就转变成了开发数字运算部件的问题，这就出现了数字信号处理器（数字运算部件的问题，这就出现了数字信号处理器（数字运算部件的问题，这就出现了数字信号处理器（数字运算部件的问题，这就出现了数字信号处理器（digital digital signal processorsignal processor，DSPDSP）。）。）。）。DSPDSP与通用微处理器相比，除了结构与通用微处理器相比，除了结构与通用微处理器相比，除了结构与通用微处理器相比，除了结构不同外，它们的基本差别是，不同外，它们的基本差别是，不同外，它们的基本差别是，不同外，它们的基本差别是

16、，DSPDSP有能力响应和处理采样模拟有能力响应和处理采样模拟有能力响应和处理采样模拟有能力响应和处理采样模拟信号得到的数据流，如做乘法和累加求和运算等。信号得到的数据流，如做乘法和累加求和运算等。信号得到的数据流，如做乘法和累加求和运算等。信号得到的数据流，如做乘法和累加求和运算等。第7页，共59页，编辑于2022年，星期一5.1.2 模拟信号与数字信号模拟信号与数字信号在数字环境进行信号处理的主要优点是：首先，数字信号计算是一在数字环境进行信号处理的主要优点是：首先，数字信号计算是一在数字环境进行信号处理的主要优点是：首先，数字信号计算是一在数字环境进行信号处理的主要优点是：首先，数字信

17、号计算是一种精确的运算方法，它不受时间和环境变化的影响；其次，表示部种精确的运算方法，它不受时间和环境变化的影响；其次，表示部种精确的运算方法，它不受时间和环境变化的影响；其次，表示部种精确的运算方法，它不受时间和环境变化的影响；其次，表示部件功能的数学运算不是物理上实现的功能部件，而仅仅是用数学运件功能的数学运算不是物理上实现的功能部件，而仅仅是用数学运件功能的数学运算不是物理上实现的功能部件，而仅仅是用数学运件功能的数学运算不是物理上实现的功能部件，而仅仅是用数学运算来模拟，相对容易实现；此外，可以对数字运算部件进行编程，算来模拟，相对容易实现；此外，可以对数字运算部件进行编程，算来模拟，

18、相对容易实现；此外，可以对数字运算部件进行编程，算来模拟，相对容易实现；此外，可以对数字运算部件进行编程，如欲改变算法或改变某些功能，还可对数字部件进行再编程。如欲改变算法或改变某些功能，还可对数字部件进行再编程。如欲改变算法或改变某些功能，还可对数字部件进行再编程。如欲改变算法或改变某些功能，还可对数字部件进行再编程。第8页，共59页，编辑于2022年，星期一5.1.3 声音信号数字化声音信号数字化计算机要处理或合成声音，就必须把模拟的（连续的）声音波计算机要处理或合成声音，就必须把模拟的（连续的）声音波计算机要处理或合成声音，就必须把模拟的（连续的）声音波计算机要处理或合成声音，就必须把

19、模拟的（连续的）声音波形转换成数字（离散化），这个过程称为声音采样（图形转换成数字（离散化），这个过程称为声音采样（图形转换成数字（离散化），这个过程称为声音采样（图形转换成数字（离散化），这个过程称为声音采样（图5-15-1），），），），它是把连续的声波信号通过一种称为模数（它是把连续的声波信号通过一种称为模数（它是把连续的声波信号通过一种称为模数（它是把连续的声波信号通过一种称为模数（A/DA/D）转换器的部件转换成）转换器的部件转换成）转换器的部件转换成）转换器的部件转换成数字信号，供计算机处理，如果需要的话，这种转换后的数字信号又可数字信号，供计算机处理，如果需要的话，这种转换后的数

20、字信号又可数字信号，供计算机处理，如果需要的话，这种转换后的数字信号又可数字信号，供计算机处理，如果需要的话，这种转换后的数字信号又可以通过数模转换（以通过数模转换（以通过数模转换（以通过数模转换（D/AD/A）器，经过放大输出，变成人耳能够听到）器，经过放大输出，变成人耳能够听到）器，经过放大输出，变成人耳能够听到）器，经过放大输出，变成人耳能够听到的声音。的声音。的声音。的声音。第9页，共59页，编辑于2022年，星期一图图图图5-1 5-1 声音信号数字化的过程声音信号数字化的过程声音信号数字化的过程声音信号数字化的过程第10页，共59页，编辑于2022年，星期一5.1.3 声音信号数字

21、化声音信号数字化连续时间的离散化通过采样来实现，就是每隔相等的一小段时连续时间的离散化通过采样来实现，就是每隔相等的一小段时连续时间的离散化通过采样来实现，就是每隔相等的一小段时连续时间的离散化通过采样来实现，就是每隔相等的一小段时间采样一次，这种采样称为均匀采样；连续幅度的离散化通过间采样一次，这种采样称为均匀采样；连续幅度的离散化通过间采样一次，这种采样称为均匀采样；连续幅度的离散化通过间采样一次，这种采样称为均匀采样；连续幅度的离散化通过量化来实现，就是把信号的强度划分成一小段一小段，如果幅量化来实现，就是把信号的强度划分成一小段一小段，如果幅量化来实现，就是把信号的强度划分成一小段一

22、小段，如果幅量化来实现，就是把信号的强度划分成一小段一小段，如果幅度的划分是等间隔的，就称为线性量化，否则就称为非线性量度的划分是等间隔的，就称为线性量化，否则就称为非线性量度的划分是等间隔的，就称为线性量化，否则就称为非线性量度的划分是等间隔的，就称为线性量化，否则就称为非线性量化。图化。图化。图化。图5-25-2表示了声音数字化的概念。表示了声音数字化的概念。表示了声音数字化的概念。表示了声音数字化的概念。第11页，共59页，编辑于2022年，星期一图图图图5-2 5-2 声音的采样和量化声音的采样和量化声音的采样和量化声音的采样和量化第12页，共59页，编辑于2022年，星期一5.1.3

23、声音信号数字化声音信号数字化我们把时间和幅度都用离散的数字表示的信号称为数字信号。声我们把时间和幅度都用离散的数字表示的信号称为数字信号。声我们把时间和幅度都用离散的数字表示的信号称为数字信号。声我们把时间和幅度都用离散的数字表示的信号称为数字信号。声音数字化需要回答两个问题：音数字化需要回答两个问题：音数字化需要回答两个问题：音数字化需要回答两个问题：每秒钟采集多少个声音样本，也每秒钟采集多少个声音样本，也每秒钟采集多少个声音样本，也每秒钟采集多少个声音样本，也就是采样频率是多少；就是采样频率是多少；就是采样频率是多少；就是采样频率是多少；每个声音样本的位数（每个声音样本的位数（每个声音

24、样本的位数（每个声音样本的位数（bit per samplebit per sample，bpsbps）应该是多少，也就是量化精度。）应该是多少，也就是量化精度。）应该是多少，也就是量化精度。）应该是多少，也就是量化精度。采样的速度决定了录制声音的准确性，而采样值的精度则决定了采样的速度决定了录制声音的准确性，而采样值的精度则决定了采样的速度决定了录制声音的准确性，而采样值的精度则决定了采样的速度决定了录制声音的准确性，而采样值的精度则决定了录制声音的精确性。实践证明，采样速度越快，采样值越准确，录制声音的精确性。实践证明，采样速度越快，采样值越准确，录制声音的精确性。实践证明，采样速度越快，

25、采样值越准确，录制声音的精确性。实践证明，采样速度越快，采样值越准确，声音特征复原得就会越好。声音特征复原得就会越好。声音特征复原得就会越好。声音特征复原得就会越好。第13页，共59页，编辑于2022年，星期一5.1.3 声音信号数字化声音信号数字化常用的几种音频信号数字化的采样率标准是：常用的几种音频信号数字化的采样率标准是：常用的几种音频信号数字化的采样率标准是：常用的几种音频信号数字化的采样率标准是：44.2kHz44.2kHz（CDCD音音音音质）、质）、质）、质）、22.05kHz22.05kHz（FMFM音质）、音质）、音质）、音质）、11.025kHz11.025kHz（AMA

26、M音质）等。为了追音质）等。为了追音质）等。为了追音质）等。为了追求音响品质的完美，减少噪声的干扰，达到理想的传播声音的环境，求音响品质的完美，减少噪声的干扰，达到理想的传播声音的环境，求音响品质的完美，减少噪声的干扰，达到理想的传播声音的环境，求音响品质的完美，减少噪声的干扰，达到理想的传播声音的环境，国际上制定了一系列判断音质的标准，图国际上制定了一系列判断音质的标准，图国际上制定了一系列判断音质的标准，图国际上制定了一系列判断音质的标准，图5-35-3给出了几种数字声音质给出了几种数字声音质给出了几种数字声音质给出了几种数字声音质量等级的国际标准所对应的频率范围。量等级的国际标准所对应的

27、频率范围。量等级的国际标准所对应的频率范围。量等级的国际标准所对应的频率范围。第14页，共59页，编辑于2022年，星期一图图图图5-3 5-3 数字声音质量等级对应的频率范围数字声音质量等级对应的频率范围数字声音质量等级对应的频率范围数字声音质量等级对应的频率范围第15页，共59页，编辑于2022年，星期一5.1.3 声音信号数字化声音信号数字化样本大小是用每个声音样本的位数（样本大小是用每个声音样本的位数（样本大小是用每个声音样本的位数（样本大小是用每个声音样本的位数（bit/sbit/s或或或或b/sb/s）表示的，它反映度）表示的，它反映度）表示的，它反映度）表示的，它反映度量声音波

28、形幅度的精度。例如，每个声音样本用量声音波形幅度的精度。例如，每个声音样本用量声音波形幅度的精度。例如，每个声音样本用量声音波形幅度的精度。例如，每个声音样本用1616位（位（位（位（2 2字节）表字节）表字节）表字节）表示，测得的声音样本值是在示，测得的声音样本值是在示，测得的声音样本值是在示，测得的声音样本值是在065 536065 536的范围里，它的精度就是输入的范围里，它的精度就是输入的范围里，它的精度就是输入的范围里，它的精度就是输入信号的信号的信号的信号的1/655361/65536。样本位数的大小影响到声音的质量，位数越多，声。样本位数的大小影响到声音的质量，位数越多，声。样本

29、位数的大小影响到声音的质量，位数越多，声。样本位数的大小影响到声音的质量，位数越多，声音的质量越高，而需要的存储空间也越多；位数越少，声音的质量音的质量越高，而需要的存储空间也越多；位数越少，声音的质量音的质量越高，而需要的存储空间也越多；位数越少，声音的质量音的质量越高，而需要的存储空间也越多；位数越少，声音的质量越低，需要的存储空间越少。越低，需要的存储空间越少。越低，需要的存储空间越少。越低，需要的存储空间越少。采样精度的另一种表示方法是信号噪声比。采样精度的另一种表示方法是信号噪声比。采样精度的另一种表示方法是信号噪声比。采样精度的另一种表示方法是信号噪声比。第16页，共59页，编辑于

30、2022年，星期一5.1.3 声音信号数字化声音信号数字化原始的音频数据一般需进行编辑加工才能使用。通过编辑可以实现各种原始的音频数据一般需进行编辑加工才能使用。通过编辑可以实现各种原始的音频数据一般需进行编辑加工才能使用。通过编辑可以实现各种原始的音频数据一般需进行编辑加工才能使用。通过编辑可以实现各种声音混合以及消除或降低声音中的畸变等。一般的音频编辑软件都具有声音混合以及消除或降低声音中的畸变等。一般的音频编辑软件都具有声音混合以及消除或降低声音中的畸变等。一般的音频编辑软件都具有声音混合以及消除或降低声音中的畸变等。一般的音频编辑软件都具有设置音量、渐强渐弱处理及多通道混合等常用功能

31、。音频处理主要集中设置音量、渐强渐弱处理及多通道混合等常用功能。音频处理主要集中设置音量、渐强渐弱处理及多通道混合等常用功能。音频处理主要集中设置音量、渐强渐弱处理及多通道混合等常用功能。音频处理主要集中在音频压缩上，最新的语音压缩算法可将原始声音数据压缩在音频压缩上，最新的语音压缩算法可将原始声音数据压缩在音频压缩上，最新的语音压缩算法可将原始声音数据压缩在音频压缩上，最新的语音压缩算法可将原始声音数据压缩6 86 8倍以倍以倍以倍以上。上。上。上。第17页，共59页，编辑于2022年，星期一5.1.4 声音质量与数据率声音质量与数据率数字化音频的质量取决于采样频率和量化位数这两个重要参数

32、，数字化音频的质量取决于采样频率和量化位数这两个重要参数，数字化音频的质量取决于采样频率和量化位数这两个重要参数，数字化音频的质量取决于采样频率和量化位数这两个重要参数，反映音频数字化质量的另一个因素是通道（或声道）个数。记录反映音频数字化质量的另一个因素是通道（或声道）个数。记录反映音频数字化质量的另一个因素是通道（或声道）个数。记录反映音频数字化质量的另一个因素是通道（或声道）个数。记录声音时，如果每次生成一个声波数据，称为单声道；每次生成二声音时，如果每次生成一个声波数据，称为单声道；每次生成二声音时，如果每次生成一个声波数据，称为单声道；每次生成二声音时，如果每次生成一个声波数据，称为

33、单声道；每次生成二个声波数据，称为立体声（双声道），立体声更能反映人的听觉个声波数据，称为立体声（双声道），立体声更能反映人的听觉个声波数据，称为立体声（双声道），立体声更能反映人的听觉个声波数据，称为立体声（双声道），立体声更能反映人的听觉感受。音频数字化的采样频率和量化级越高，结果越接近原始声感受。音频数字化的采样频率和量化级越高，结果越接近原始声感受。音频数字化的采样频率和量化级越高，结果越接近原始声感受。音频数字化的采样频率和量化级越高，结果越接近原始声音，除此之外，数字化音频的质量还受其他一些因素（如扬声器音，除此之外，数字化音频的质量还受其他一些因素（如扬声器音，除此之外，数字化音

34、频的质量还受其他一些因素（如扬声器音，除此之外，数字化音频的质量还受其他一些因素（如扬声器的质量等）的影响。的质量等）的影响。的质量等）的影响。的质量等）的影响。根据声音的频带，通常把声音的质量分成根据声音的频带，通常把声音的质量分成根据声音的频带，通常把声音的质量分成根据声音的频带，通常把声音的质量分成5 5个等级，由低到高分个等级，由低到高分个等级，由低到高分个等级，由低到高分别是电话、调幅广播（别是电话、调幅广播（别是电话、调幅广播（别是电话、调幅广播（AMAM）、调频广播（）、调频广播（）、调频广播（）、调频广播（FMFM）、光盘（）、光盘（）、光盘（）、光盘（CDCD）和数字录音带（

35、和数字录音带（和数字录音带（和数字录音带（digital audio tapedigital audio tape，DATDAT）的声音。在这）的声音。在这）的声音。在这）的声音。在这 5 5个等个等个等个等级中，使用的采样频率、样本精度、通道数和数据率见表级中，使用的采样频率、样本精度、通道数和数据率见表级中，使用的采样频率、样本精度、通道数和数据率见表级中，使用的采样频率、样本精度、通道数和数据率见表5-15-1。第18页，共59页，编辑于2022年，星期一表表表表5-1 5-1 声音质量和数据率声音质量和数据率声音质量和数据率声音质量和数据率第19页，共59页，编辑于2022年，星期一5

36、.2 音乐合成和音乐合成和MIDI 多媒体音频数据的一个重要来源是多媒体音频数据的一个重要来源是多媒体音频数据的一个重要来源是多媒体音频数据的一个重要来源是MIDIMIDI（乐器数字接口）。从（乐器数字接口）。从（乐器数字接口）。从（乐器数字接口）。从2020世纪世纪世纪世纪8080年代初期开始，年代初期开始，年代初期开始，年代初期开始，MIDIMIDI逐步为音乐界广泛接受和使用。逐步为音乐界广泛接受和使用。逐步为音乐界广泛接受和使用。逐步为音乐界广泛接受和使用。MIDIMIDI是乐器和计算机使用的标准语言，是一套指令（即命令）是乐器和计算机使用的标准语言，是一套指令（即命令）是乐器和计算机使

37、用的标准语言，是一套指令（即命令）是乐器和计算机使用的标准语言，是一套指令（即命令）的约定，它指示乐器（即的约定，它指示乐器（即的约定，它指示乐器（即的约定，它指示乐器（即MIDIMIDI设备）要做什么，怎么做，如设备）要做什么，怎么做，如设备）要做什么，怎么做，如设备）要做什么，怎么做，如演奏音符、加大音量、生成音响效果等。演奏音符、加大音量、生成音响效果等。演奏音符、加大音量、生成音响效果等。演奏音符、加大音量、生成音响效果等。MIDIMIDI不是声音信号，不是声音信号，不是声音信号，不是声音信号，它传送的是发给它传送的是发给它传送的是发给它传送的是发给MIDIMIDI设备或其他装置让其产

38、生声音或执行某个动作设备或其他装置让其产生声音或执行某个动作设备或其他装置让其产生声音或执行某个动作设备或其他装置让其产生声音或执行某个动作的指令。的指令。的指令。的指令。第20页，共59页，编辑于2022年，星期一5.2 音乐合成和音乐合成和MIDI 作为数字音乐的一个国际标准，作为数字音乐的一个国际标准，作为数字音乐的一个国际标准，作为数字音乐的一个国际标准，MIDIMIDI标准规定了电子乐器与计算标准规定了电子乐器与计算标准规定了电子乐器与计算标准规定了电子乐器与计算机之间传送数据的通信协议等规范。机之间传送数据的通信协议等规范。机之间传送数据的通信协议等规范。机之间传送数据的通信协议等

39、规范。MIDIMIDI标准使不同厂家生产的标准使不同厂家生产的标准使不同厂家生产的标准使不同厂家生产的电子合成乐器可以互相发送和接收音乐数据。随着电子合成乐器可以互相发送和接收音乐数据。随着电子合成乐器可以互相发送和接收音乐数据。随着电子合成乐器可以互相发送和接收音乐数据。随着MIDIMIDI标准的标准的标准的标准的施行，计算机成为电子合成乐器间的控制环节，出现了大量可施行，计算机成为电子合成乐器间的控制环节，出现了大量可施行，计算机成为电子合成乐器间的控制环节，出现了大量可施行，计算机成为电子合成乐器间的控制环节，出现了大量可进行记录、存储、编辑和播放乐谱（音符表或音符序列）的计进行记录、存

40、储、编辑和播放乐谱（音符表或音符序列）的计进行记录、存储、编辑和播放乐谱（音符表或音符序列）的计进行记录、存储、编辑和播放乐谱（音符表或音符序列）的计算机软件。算机软件。算机软件。算机软件。MIDIMIDI音频的处理过程如图音频的处理过程如图音频的处理过程如图音频的处理过程如图5-45-4所示，其主要优点是：所示，其主要优点是：所示，其主要优点是：所示，其主要优点是：1 1）生成的文件比较小。由于）生成的文件比较小。由于）生成的文件比较小。由于）生成的文件比较小。由于MIDIMIDI文件存储的是命令，而不是声音本身，文件存储的是命令，而不是声音本身，文件存储的是命令，而不是声音本身，文件存储的

41、是命令，而不是声音本身，因此它比较节省空间。例如，同样半小时的立体声音乐，因此它比较节省空间。例如，同样半小时的立体声音乐，因此它比较节省空间。例如，同样半小时的立体声音乐，因此它比较节省空间。例如，同样半小时的立体声音乐，MIDIMIDI文件只有文件只有文件只有文件只有200KB200KB左右，而波形文件（左右，而波形文件（左右，而波形文件（左右，而波形文件（WAVWAV）则要差不多）则要差不多）则要差不多）则要差不多300MB300MB。第21页，共59页，编辑于2022年，星期一图图图图5-4 MIDI5-4 MIDI音频的处理过程音频的处理过程音频的处理过程音频的处理过程第22页，共5

42、9页，编辑于2022年，星期一5.2 音乐合成和音乐合成和MIDI 2 2）容易编辑。因为编辑命令比编辑声音波形要容易得多。）容易编辑。因为编辑命令比编辑声音波形要容易得多。）容易编辑。因为编辑命令比编辑声音波形要容易得多。）容易编辑。因为编辑命令比编辑声音波形要容易得多。3 3）可以作为背景音乐。）可以作为背景音乐。）可以作为背景音乐。）可以作为背景音乐。MIDIMIDI音乐可以和其他的媒体，如数字电视、图形、动画、音乐可以和其他的媒体，如数字电视、图形、动画、音乐可以和其他的媒体，如数字电视、图形、动画、音乐可以和其他的媒体，如数字电视、图形、动画、话音等一起播放，这样可以加强演示效果。话

43、音等一起播放，这样可以加强演示效果。话音等一起播放，这样可以加强演示效果。话音等一起播放，这样可以加强演示效果。产产产产生生生生MIDIMIDI乐乐乐乐音的方法很多，主要有两种：一种是音的方法很多，主要有两种：一种是音的方法很多，主要有两种：一种是音的方法很多，主要有两种：一种是频频频频率率率率调调调调制制制制（frequency modulationfrequency modulation，FMFM）合成法，另一种是）合成法，另一种是）合成法，另一种是）合成法，另一种是乐乐乐乐音音音音样样样样本合成本合成本合成本合成法，也称法，也称法，也称法，也称为为为为波形表（波形表（波形表（波形表（wa

44、ve tablewave table）合成法。）合成法。）合成法。）合成法。第23页，共59页，编辑于2022年，星期一5.3 数码音乐数码音乐MP3 MP3MP3的全称是的全称是的全称是的全称是MPEG-1 Layer3MPEG-1 Layer3音频文件。音频文件。音频文件。音频文件。MPEG-1MPEG-1是活动影音压缩是活动影音压缩是活动影音压缩是活动影音压缩标准，其中的声音部分称为标准，其中的声音部分称为标准，其中的声音部分称为标准，其中的声音部分称为MPEG-1MPEG-1音频层，它根据压缩质量和编音频层，它根据压缩质量和编音频层，它根据压缩质量和编音频层，它根据压缩质量和编码复杂度

45、划分为三层，即码复杂度划分为三层，即码复杂度划分为三层，即码复杂度划分为三层，即Layer1Layer1、Layer2Layer2和和和和Layer3Layer3，分别对应，分别对应，分别对应，分别对应MP1MP1、MP2MP2和和和和MP3MP3这这这这3 3种声音文件，并根据不同的用途，使用不同种声音文件，并根据不同的用途，使用不同种声音文件，并根据不同的用途，使用不同种声音文件，并根据不同的用途，使用不同层次的编码。层次的编码。层次的编码。层次的编码。MPEGMPEG音频编码的层次越高，对应的编码器越复杂，音频编码的层次越高，对应的编码器越复杂，音频编码的层次越高，对应的编码器越复杂，音

46、频编码的层次越高，对应的编码器越复杂，压缩率也越高，压缩率也越高，压缩率也越高，压缩率也越高，MP1MP1和和和和MP2MP2的压缩率分别为的压缩率分别为的压缩率分别为的压缩率分别为4:14:1和和和和6:1 8:16:1 8:1，而，而，而，而MP3MP3的压缩率则高达的压缩率则高达的压缩率则高达的压缩率则高达10:1 12:110:1 12:1。也就是说，。也就是说，。也就是说，。也就是说，分钟分钟分钟分钟CDCD音质的音乐，音质的音乐，音质的音乐，音质的音乐，未经压缩需要未经压缩需要未经压缩需要未经压缩需要10MB10MB的存储空间，而经过的存储空间，而经过的存储空间，而经过的存储空间，

47、而经过MP3MP3压缩编码后只有压缩编码后只有压缩编码后只有压缩编码后只有1MB1MB左右。左右。左右。左右。第24页，共59页，编辑于2022年，星期一5.3 数码音乐数码音乐MP3 不过不过不过不过MP3MP3对音频信号采用的是有损压缩方式，为了降低失真度，对音频信号采用的是有损压缩方式，为了降低失真度，对音频信号采用的是有损压缩方式，为了降低失真度，对音频信号采用的是有损压缩方式，为了降低失真度，MP3MP3采取了采取了采取了采取了“感官编码技术感官编码技术感官编码技术感官编码技术”，即编码时先对音频文件进行频谱，即编码时先对音频文件进行频谱，即编码时先对音频文件进行频谱，即编码时先对音

48、频文件进行频谱分析，然后用过滤器滤掉噪音电平，再通过量化的方式将剩下的分析，然后用过滤器滤掉噪音电平，再通过量化的方式将剩下的分析，然后用过滤器滤掉噪音电平，再通过量化的方式将剩下的分析，然后用过滤器滤掉噪音电平，再通过量化的方式将剩下的每一位打散排列，最后形成具有较高压缩比的每一位打散排列，最后形成具有较高压缩比的每一位打散排列，最后形成具有较高压缩比的每一位打散排列，最后形成具有较高压缩比的MP3MP3文件，使压缩文件，使压缩文件，使压缩文件，使压缩后的文件在回放时能达到比较接近原音源的声音效果。虽然它是一种有后的文件在回放时能达到比较接近原音源的声音效果。虽然它是一种有后的文件在回放时能

49、达到比较接近原音源的声音效果。虽然它是一种有后的文件在回放时能达到比较接近原音源的声音效果。虽然它是一种有损压缩方式，但它以极小的声音失真换取了较高的压缩比，使得损压缩方式，但它以极小的声音失真换取了较高的压缩比，使得损压缩方式，但它以极小的声音失真换取了较高的压缩比，使得损压缩方式，但它以极小的声音失真换取了较高的压缩比，使得MP3MP3能够在因特网上广泛传播。能够在因特网上广泛传播。能够在因特网上广泛传播。能够在因特网上广泛传播。第25页，共59页，编辑于2022年，星期一5.3 数码音乐数码音乐MP3 MP3MP3这种压缩比非常高的数字音频文件不仅能在网上传播，而且还能容这种压缩比非常高

50、的数字音频文件不仅能在网上传播，而且还能容这种压缩比非常高的数字音频文件不仅能在网上传播，而且还能容这种压缩比非常高的数字音频文件不仅能在网上传播，而且还能容易地下载到便携式数字音频设备（易地下载到便携式数字音频设备（易地下载到便携式数字音频设备（易地下载到便携式数字音频设备（MP3MP3随身听）中。随身听）中。随身听）中。随身听）中。MP3MP3随身听基于随身听基于随身听基于随身听基于DSPDSP（数字信号处理器），无需计算机支持便可以实现（数字信号处理器），无需计算机支持便可以实现（数字信号处理器），无需计算机支持便可以实现（数字信号处理器），无需计算机支持便可以实现MP3MP3文件的存文

展开阅读全文