音频信息及处理.ppt

上传人:s****8 文档编号:67304973 上传时间:2022-12-24 格式:PPT 页数:35 大小:2.42MB
返回 下载 相关 举报
音频信息及处理.ppt_第1页
第1页 / 共35页
音频信息及处理.ppt_第2页
第2页 / 共35页
点击查看更多>>
资源描述

《音频信息及处理.ppt》由会员分享,可在线阅读,更多相关《音频信息及处理.ppt(35页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、7 数字音频和合成音乐陈乐 声音也许是世界上中最动人心弦的元素。声音也许是世界上中最动人心弦的元素。任何的语言都离不开声音;尤其是那些悦任何的语言都离不开声音;尤其是那些悦耳的音乐,能深深触动人们内心的情感,耳的音乐,能深深触动人们内心的情感,带来美妙的感受。带来美妙的感受。能否利用好声音,是一件多媒体作品成败能否利用好声音,是一件多媒体作品成败与否的重要因素,本章中我们就来学习一与否的重要因素,本章中我们就来学习一下数字化的声音。下数字化的声音。春江花月夜一、数字音频基础什么是声音、声音信号的特征声音信号的数字化、音频文件的格式二、电子合成音乐(MIDI)MIDI和WAVE的比较、MIDI演

2、奏、WAVE转MIDI三、数字音频的编辑和处理如何压缩和转换声音格式如何在电脑上录音、如何编辑声音四、语言合成和语音识别技术第七章 数字音频和合成音乐7.1.1 什么是声音?声音:当空气中某物体通过前后位移产生振动,它将引起压力波,当它到达人耳时,我们会感受达到这种压力的变化(振动),这就是声音。一、数字音频基础音频音频是一种连续变化的模拟信号,可用一条连续的曲线来表示,称为声波声波。因声波是在时间和幅度上都连续变化的量,我们称之为模拟量模拟量。下面用声音录制软件记录的英文单词“Hello”的语音波形 一、数字音频基础 模拟音频信号有两个重要参数:频率和幅度频率和幅度。声音的频率体现音调的高低

3、,声波幅度的大小体现声音的强弱。一个声源每秒钟可产生成百上千个波,我们把每秒钟波峰每秒钟波峰所发生的数目称之为信号的频率所发生的数目称之为信号的频率,单位用赫兹(Hz)或千赫兹(kHz)表示。信号的幅度是从信号的基线到当前波峰的距离信号的幅度是从信号的基线到当前波峰的距离。幅度决定了信号音量的强弱程度。幅度越大,声音越强。对音频信号,声音的强度用分贝声音的强度用分贝(dB)(dB)表示表示,分贝的幅度就是音量。幅度限周期 基线模拟音频信号的两个重要参数一、数字音频基础7.1.2 声音的频率和幅度多媒体技术处理的声音主要是人耳可听到的2020kHz的音频信号。言语(speech)/语音:人说话的

4、声音,其频率范围约为3003400Hz全频带声音:音乐声、风雨声、汽车声等其他声音,其带宽可达到2020kHzdB例子例子20声音工作室40夜晚的居民区60大型百货公司100高速公路上的汽车13075人管弦乐队最强音一、数字音频基础n声音信号的数字化:将模拟声音信号转换成数字编码形式以便于计算机进行处理的过程n声音信号数字化的过程:取样量化编码7.1.3 声音信号的数字化一、数字音频基础声音信号的数字化(动画)模拟声音信号取 样量 化编 码数字声音011010011101声音信号的数字化一、数字音频基础1.取样频率:44.1kHz2.量化位数:16Bit3.声道数目:Stereo或Mono4.

5、数码率(bit rate):指的是每秒钟的数据量,也称比特率、码率波形声音的主要参数一、数字音频基础码率采样频率码率采样频率量化位数量化位数声道数声道数 单位:bit(位)/秒 1Byte8bit课堂习题:例:已知数字激光唱盘(CD Audio)的标准采样频率为44.1 kHz,量化位数为16 位,立体声。请问一分钟 CD-DA 音乐所需的存储空间为多少?码率采样频率量化位数声道数时间(单位)44.1kHz 16 b260 s 84672 kb 10584 kB 10.3 MB一、数字音频基础做一做,想一想n一个256M的MP3播放器能够储存采样频率为44.1KHz、16位、立体声的WAV音乐

6、多长时间?n一张650M的CD光盘一般有几首歌?一个512M的MP3可以储存几首MP3音乐?一、数字音频基础几种常见数字声音的主要参数一、数字音频基础采样率采样率(kHz)(kHz)量化位量化位(bit)(bit)声声道道编码算法编码算法容量容量(MB/min(MB/min)等效等效音质音质11.02511.0258 8单单PCMPCM0.660.66语音语音22.0522.051616双双PCMPCM5.2925.292FMFM广播广播44.144.11616双双PCMPCM10.58410.584CDCD唱盘唱盘7.1.4 音频格式介绍音频格式介绍1nCDA 是CD Audio的缩写。音乐

7、光碟片里面的音乐格式,是音乐CD片最常用的档案格式nWAV波形声音文件,是最早的数字音频格式,可以精确记录各种声音但WAV格式对存储空间需求太大,不便于交流和传播一、数字音频基础7.1.4 音频格式介绍音频格式介绍2nMP3 由WAV文件经压缩而来,音质略低于CD和WAV格式,但这种差异用耳朵难以分辨。压缩比1:10nWMA 音质可以与MP3相比,而大小只有MP3格式的一半,也适用于网络,音质要好于RA格式。nRA 适用于网络的“流式文件”,可一边下载一边播放,压缩比达 1:96,文件比MP3格式小,只是音质较差。一、数字音频基础7.1.4 音频格式介绍音频格式介绍3nMIDI 存储的不是声音

8、信号,而是各种乐器的发音命令,播放时系统根据这些命令合成乐曲,midi文件的优点是非常小。一、数字音频基础走进MIDI的世界7.2 电子合成音乐MIDI1.MIDI和WAVE的比较2.电子合成音乐(MIDI)的原理3.MIDI与WAVE的相互转换7.2.1 MIDI和WAVE的比较MIDIMIDIWAVE(MP3)WAVE(MP3)文件文件内容内容音乐伴奏音乐伴奏歌曲和演唱歌曲和演唱音音 源源MIDIMIDI乐器乐器MicMic,磁带,磁带,CDCD唱盘,音响唱盘,音响容容 量量小小与音质成正比与音质成正比音音 质质与声卡质量有关与声卡质量有关 与编码指标有关与编码指标有关适用性适用性易编辑,

9、声源受限,易编辑,声源受限,数据量很小数据量很小不易编辑,声源不限,不易编辑,声源不限,数据量大数据量大 长度:3分30秒 长度:长度:3分分30秒秒二、电子合成音乐MIDI实例实例7.2.2 电子合成音乐(MIDI)的原理二、电子合成音乐MIDI MIDI(Musical Instrument Digital Interface)采用音乐符号记录和解释乐谱,并合成相采用音乐符号记录和解释乐谱,并合成相 应的音乐。应的音乐。MIDI不是把音乐的波形进行数字化采样和不是把音乐的波形进行数字化采样和 编码,而是将数字式电子乐器的弹奏过程记录编码,而是将数字式电子乐器的弹奏过程记录 下来,如按键、力

10、度、时间多度等等。当需要下来,如按键、力度、时间多度等等。当需要 播放这首乐曲时,根据记录的乐谱指令,通过播放这首乐曲时,根据记录的乐谱指令,通过 音乐合成器生成音乐声波,经放大后由扬声器音乐合成器生成音乐声波,经放大后由扬声器 播出。播出。7.2.2 电子合成音乐(MIDI)的原理二、电子合成音乐MIDIl FM(Frequency Modulation)合成合成 通过硬件产生正弦信号,再经处理合成音乐。通过硬件产生正弦信号,再经处理合成音乐。一般声卡采用的方式,音色与硬件有关,音一般声卡采用的方式,音色与硬件有关,音 色较单薄色较单薄 l 波形表(波形表(Wavetable)合成合成 专业

11、声卡采用的方式。在声卡的专业声卡采用的方式。在声卡的ROM中预中预 存各种实际乐器的声音采样,通过调用相应的存各种实际乐器的声音采样,通过调用相应的 实际声音数据合成乐音。实际声音数据合成乐音。ROMROM存储器的容量越存储器的容量越 大,合成的效果越好。大,合成的效果越好。7.3 数字音频的编辑和处理1.如何转换音频文件的格式StreamBox Ripper MP3工具包(toolkit)2.如何在电脑上录音电脑Mic的使用Windows录音机3.专业音频处理软件Cooledit5.7.1.如何使用StreamBox Ripper转换文件格式三、数字音频的编辑和处理5.7.2 如何使用Mic

12、录音三、数字音频的编辑和处理5.7.3 专业音频处理软件nGoldWavenCoolEditnAdobe Audition三、数字音频的编辑和处理n基本编辑操作声音的剪辑(删除、移动或复制一段声音,插入空白等)声音音量调节(提高或降低音量,淡入、淡出处理等)声音的反转、消除噪音n声音的效果处理包括混响、回声、和声效果、动态效果、升降调、颤音等n格式转换功能声音编辑软件的功能三、数字音频的编辑和处理Cooledit软件功能及界面简介软件功能及界面简介 多轨音频编辑软件,最多可支持多轨音频编辑软件,最多可支持128个音轨,能高质量个音轨,能高质量地完成录音、编辑、合成等多种任务地完成录音、编辑、合

13、成等多种任务三、数字音频的编辑和处理CoolEdit音频处理实验音频处理实验1、安装CoolEdit2.0 Pro2、从网上下载一首歌曲和配乐(MP3格式)。3、将歌曲和配乐插入的音轨14、在音轨2中录下自己的声音5、单独编辑音轨2,去除噪音(效果噪音消除降噪器)。6、通过“效果变调/变速变速器”试听自已的声音升高和降低音调以后的效果。7、返回多轨界面,校正音轨2使其与音轨1同步。8、对前后进行剪切后,将前2轨混缩到第3轨,将第3轨另存为码率为64kbps的MP3,改文件名后提交。三、数字音频的编辑和处理作业范例5.4.1 语音合成n语音合成(Speech synthesis):根据语言学和自

14、然语言理解的知识,使计算机模仿人的发声,自动生成语音的过程。目前主要是按照文本(书面语言)进行语音合成,这个过程称为文语转换(Text-To-Speech,简称TTS)。n文语转换过程文本分析韵律分析语音生成语音合成n文语转换过程文本文本文本分析文本分析韵律处理韵律处理语音合成语音合成合成语音合成语音词典,发音规则词典,发音规则韵律规则库韵律规则库语音库语音库n对计算机合成的语音希望能达到的要求:发音清晰可懂语气语调自然说话人可选择语速可变化等语音合成n计算机合成语音的应用:股票交易、航班动态查询、电话报税等业务有声E-mail服务CAI课件或游戏解说词的自动配音文稿校对、语言学习、语音秘书、自动报警、残疾人服务等语音合成5.4.2语音合成技术演示n中文(科大讯飞)http:/ http:/ ViaVoice(中文)nScansoft Drangon Naturally Speaking音效库(推荐)nhttp:/ 44.1kHz16bit2n 1411kb/s (176.4kB/s)n文件大小码率 时间长度n 176.4*(3*60+41)kBn =37.9 MB

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 生活常识

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com