多媒体信息处理基础.ppt

上传人:豆**** 文档编号:56691704 上传时间:2022-11-03 格式:PPT 页数:105 大小:5.38MB
返回 下载 相关 举报
多媒体信息处理基础.ppt_第1页
第1页 / 共105页
多媒体信息处理基础.ppt_第2页
第2页 / 共105页
点击查看更多>>
资源描述

《多媒体信息处理基础.ppt》由会员分享,可在线阅读,更多相关《多媒体信息处理基础.ppt(105页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、多媒体信息处理基础多媒体信息处理基础n1.1 多媒体的基本概念多媒体的基本概念n1.2 音频信息处理基础音频信息处理基础n1.3 图像信息处理基础图像信息处理基础n1.4 视频信号的数字化视频信号的数字化n1.5 MATALAB在图像处理中的应用在图像处理中的应用第第1章章 多媒体信息处理基础多媒体信息处理基础 n熟悉多媒体及多媒体技术的基本概念及特征。熟悉多媒体及多媒体技术的基本概念及特征。n了解声音的基本特性及主观感觉。了解声音的基本特性及主观感觉。n熟悉音频、图像、视频信号数字化的过程,掌握均熟悉音频、图像、视频信号数字化的过程,掌握均匀量化的原理。匀量化的原理。n掌握彩色三要素、三基色

2、原理及混色方法等色度学掌握彩色三要素、三基色原理及混色方法等色度学基本知识。基本知识。n理解理解RGB、YUV、YIQ、YCbCr、HSI/HSV等颜色等颜色空间的表示及转换。空间的表示及转换。n熟悉熟悉ITU-R BT.601建议的主要内容。建议的主要内容。n了解了解MATLAB在图像处理和分析领域的应用。在图像处理和分析领域的应用。本章学习目标本章学习目标n1.1.1 媒体的概念媒体的概念n1.1.2 多媒体与多媒体技术多媒体与多媒体技术1.1 多媒体的基本概念多媒体的基本概念n1.媒体(媒体(medium)n按传统的说法,媒体指的是信息的载体,如:按传统的说法,媒体指的是信息的载体,如:

3、n报纸、杂志、电视、广播、因特网报纸、杂志、电视、广播、因特网n在计算机领域有两种含义:在计算机领域有两种含义:n信息的存储实体,如磁盘、光盘、磁带、半导体存储信息的存储实体,如磁盘、光盘、磁带、半导体存储器等,中文常译为器等,中文常译为媒质媒质或或媒介媒介;n传递信息的基本元素,如文字、声音、图形、动画和传递信息的基本元素,如文字、声音、图形、动画和图像等。图像等。1.1.1 媒体的概念媒体的概念2.媒体的分类媒体的分类国际电话电报咨询委员会(国际电话电报咨询委员会(CCITT)把媒体分成如下)把媒体分成如下5类。类。(1)感知媒体()感知媒体(Perception Medium)感知媒体就

4、是指能直接作用于人的感觉器官,使人直接产感知媒体就是指能直接作用于人的感觉器官,使人直接产生感觉(视、听、嗅、味、触觉)的一类媒体,如语言、音乐、生感觉(视、听、嗅、味、触觉)的一类媒体,如语言、音乐、图形、动画、数据、文字、文件等都是感知媒体。图形、动画、数据、文字、文件等都是感知媒体。(2)表示媒体()表示媒体(Representation Medium)表示媒体是为了更有效地加工、处理和传输感知媒体而人表示媒体是为了更有效地加工、处理和传输感知媒体而人为研究和构造出来的一种媒体。它包括上述感知媒体的各种编为研究和构造出来的一种媒体。它包括上述感知媒体的各种编码,诸如语言编码、静止和活动图

5、像编码,以及文本编码等。码,诸如语言编码、静止和活动图像编码,以及文本编码等。(3)呈现媒体()呈现媒体(Presentation Medium)呈现媒体是感知媒体与用于通信的电信号之间在转换中用呈现媒体是感知媒体与用于通信的电信号之间在转换中用于信息输入和输出的媒体。可分为输入呈现媒体(如键盘、摄于信息输入和输出的媒体。可分为输入呈现媒体(如键盘、摄像机、话筒、扫描仪等)和输出呈现媒体(如显示器、扬声器、像机、话筒、扫描仪等)和输出呈现媒体(如显示器、扬声器、打印机等)两种。打印机等)两种。(4)存储媒体()存储媒体(Storage Medium)存储媒体用于存储表示媒体,即存放感知媒体数字

6、化后的存储媒体用于存储表示媒体,即存放感知媒体数字化后的代码的媒体称为存储媒体,如磁盘、光盘、磁带、半导体存储代码的媒体称为存储媒体,如磁盘、光盘、磁带、半导体存储器等。器等。(5)传输媒体()传输媒体(Transmission Medium)传输媒体是指用来将表示媒体从一处传递到另一处的物理传输媒体是指用来将表示媒体从一处传递到另一处的物理传输介质,如同轴电缆、双绞线、光纤及其他通信信道。传输介质,如同轴电缆、双绞线、光纤及其他通信信道。在多媒体技术中所说的媒体一般指在多媒体技术中所说的媒体一般指感知媒体感知媒体。常见的感知媒。常见的感知媒体包括:体包括:(1)视觉媒体:视觉媒体:图像、图形

7、、符号、视频、动画等。图像、图形、符号、视频、动画等。(2)听觉媒体:听觉媒体:声音、语音、音乐和音响。声音、语音、音乐和音响。(3)触觉媒体:触觉媒体:通过直接或间接与人体接触,使人能感觉到通过直接或间接与人体接触,使人能感觉到对象的位置、大小、方向、方位、质地等性质。对象的位置、大小、方向、方位、质地等性质。图像 图像图像(ImageImage):):是指由输入设备捕捉的是指由输入设备捕捉的实际场景画面,或以数字化形式存储的任意实际场景画面,或以数字化形式存储的任意画面。画面。静止的图像可用一个矩阵来表示,矩静止的图像可用一个矩阵来表示,矩阵列中的各个元素用来描述构成图像的各个阵列中的各个

8、元素用来描述构成图像的各个点(称为像素点(称为像素 pixel pixel)的强度与颜色等信息。)的强度与颜色等信息。这种图像也称为这种图像也称为位图位图(Bitmap Bitmap)。)。图像由像素组成图像由像素组成n位图位图(bitmap,bit-mapped image)n对位图进行操作时,只能对图中的像素进行操作,而不对位图进行操作时,只能对图中的像素进行操作,而不能把位图中的物体作为独立实体进行操作。能把位图中的物体作为独立实体进行操作。n画位图或编辑位图的软件称为画图程序;存放位图的格画位图或编辑位图的软件称为画图程序;存放位图的格式称为位图格式;存储的内容是描述像素的数值。式称为

9、位图格式;存储的内容是描述像素的数值。n位图的获取通常用扫描仪、数码相机和相关的数字化设位图的获取通常用扫描仪、数码相机和相关的数字化设备。备。n位图文件占据的存储空间比较大,影响位图文件大小的位图文件占据的存储空间比较大,影响位图文件大小的因素因素n图像分辨率:图像分辨率:分辨率越高,表示组成一幅图的像分辨率越高,表示组成一幅图的像素就越多,图像文件就越大素就越多,图像文件就越大n像素深度:像素深度:像素深度越深,表达单个像素的颜色像素深度越深,表达单个像素的颜色和亮度的位数越多,图像文件就越大和亮度的位数越多,图像文件就越大 n灰度图像灰度图像(gray-scale image或或inte

10、nsity image):只有明暗不只有明暗不同的像素而没有彩色像素组成的图像。按灰度级的数目来划同的像素而没有彩色像素组成的图像。按灰度级的数目来划分:分:n单色图像(二值图像):单色图像(二值图像):只有黑白两种颜色的图像。只有黑白两种颜色的图像。n每个像素的像素值用每个像素的像素值用1bit1bit存储,其值是存储,其值是“0”“0”或或“1”“1”n灰度图像:灰度图像:如果每个像素的像素值用一个字节表示,灰度值级数就如果每个像素的像素值用一个字节表示,灰度值级数就等于等于256级,每个像素可以是级,每个像素可以是0255之间的任何一个值。之间的任何一个值。单色图像灰度图像n彩色图像彩色

11、图像(color image)n每个像素包含颜色信息的图像。每个像素包含颜色信息的图像。n可按照颜色的数目划分:可按照颜色的数目划分:n256256色图像:色图像:每个像素的每个像素的R、G和和B值用一个字节来表示,一幅值用一个字节来表示,一幅640480的彩色图像需要的彩色图像需要300 KB的存储空间的存储空间n真彩色图像:真彩色图像:每个像素的每个像素的R、G、B分量分别用一个字节表示,一分量分别用一个字节表示,一幅幅640480的真彩色图像需要的真彩色图像需要900 KB的存储空间的存储空间256色图像 24位真彩色图像 视频视频视频(VideoVideo):):是动态的图像序列,由一

12、系列是动态的图像序列,由一系列连续的画面序列(帧)组成连续的画面序列(帧)组成,这些画面以一定的速,这些画面以一定的速率(帧频)连续地投射在屏幕上,使观察者具有图像率(帧频)连续地投射在屏幕上,使观察者具有图像连续运动的感觉。连续运动的感觉。一一帧帧电电视视画画面面xytF(u,v)k-1帧k+1帧帧k帧帧k-1帧帧图形 图形图形(GraphicGraphic):):是一种抽象化的图像,一般指用计算是一种抽象化的图像,一般指用计算机绘制(机绘制(drawdraw)的几何图)的几何图(包含彩色图包含彩色图),如直线、圆、圆,如直线、圆、圆弧、矩形、任意曲线和图表等。弧、矩形、任意曲线和图表等。在

13、几何学中,图形一般使用矢量表示,因此也称在几何学中,图形一般使用矢量表示,因此也称矢量图矢量图(Vector GraphicsVector Graphics)。矢量图矢量图是用一组指令集合来描述图形的是用一组指令集合来描述图形的内容,这些指令用来描述构成该图形的所有直线、圆、圆内容,这些指令用来描述构成该图形的所有直线、圆、圆弧、矩形、曲线等图元的位置、维数和形状等。弧、矩形、曲线等图元的位置、维数和形状等。在计算机屏幕上显示矢量图形要有专门的软件,如在计算机屏幕上显示矢量图形要有专门的软件,如AutoCADAutoCAD、Corel DrawCorel Draw、Adobe Illustra

14、torAdobe Illustrator等,这些软件等,这些软件将描述图形的指令转换成在屏幕上显示的形状和颜色,也将描述图形的指令转换成在屏幕上显示的形状和颜色,也可产生和操作矢量图形的各成分,并对矢量图形进行移动、可产生和操作矢量图形的各成分,并对矢量图形进行移动、缩放、旋转和扭曲等变换。缩放、旋转和扭曲等变换。动画动画(AnimationAnimation):):是动态图像的一是动态图像的一种,与视频不同之处在于,动画中的图像种,与视频不同之处在于,动画中的图像采用的是计算机产生出来或人工绘制的图采用的是计算机产生出来或人工绘制的图像或图形,而视频中的图像则是真实的图像或图形,而视频中的图

15、像则是真实的图像。也就是说,动画是活动的画面,实质像。也就是说,动画是活动的画面,实质是一幅幅静态图形的连续播放。是一幅幅静态图形的连续播放。动画 计算机设计动画有两种:计算机设计动画有两种:帧动画:帧动画:是由一幅幅位图组成的连续是由一幅幅位图组成的连续的画面,就如电影胶片或视频画面一样要的画面,就如电影胶片或视频画面一样要分别设计每屏幕显示的画面。分别设计每屏幕显示的画面。造型动画:造型动画:是对每一个运动的物体分是对每一个运动的物体分别进行设计,赋予每个动元一些特征,然别进行设计,赋予每个动元一些特征,然后用这些动元构成完整的帧画面。动元的后用这些动元构成完整的帧画面。动元的表演和行为是

16、由制作表组成的脚本来控制。表演和行为是由制作表组成的脚本来控制。n帧动画帧动画 文本文本文本(TextText):):分为非格式化文本文分为非格式化文本文件和格式化文本文件。件和格式化文本文件。非格式化文本文件:非格式化文本文件:只有文本信息没只有文本信息没有其他任何有关格式信息的文件,又称为有其他任何有关格式信息的文件,又称为纯文本文件。如纯文本文件。如“.TXT”“.TXT”文件。文件。格式化文本文件:格式化文本文件:带有各种文本排版带有各种文本排版信息等格式信息的文本文件。如信息等格式信息的文本文件。如“.DOC”“.DOC”文件。文件。音频音频(AudioAudio)可分为可分为波形声

17、音波形声音、语音语音和和音乐音乐。n波形声音波形声音n包含了所有的声音形式包含了所有的声音形式n自然界中的各种声音,包括人的说话声、音乐、天空的惊自然界中的各种声音,包括人的说话声、音乐、天空的惊雷等,可以用一种模拟的连续波形表示。雷等,可以用一种模拟的连续波形表示。音频n语音:语音:不仅是一种波形声音,而且还具有内在的语言、不仅是一种波形声音,而且还具有内在的语言、语音学内涵,可以经由特殊的方法而提取。波形声音也语音学内涵,可以经由特殊的方法而提取。波形声音也可以表现和记录语音,但常把语音作为一种特殊的听觉可以表现和记录语音,但常把语音作为一种特殊的听觉媒体。媒体。音频n音乐:音乐:符号化了

18、的声音。这种符号就是符号化了的声音。这种符号就是乐谱。音乐与语音相比,形式更为规范。乐谱。音乐与语音相比,形式更为规范。在多媒体计算机中,在多媒体计算机中,MIDI就是一种乐谱就是一种乐谱数字化描述的规范。数字化描述的规范。h1 1多媒体多媒体关于多媒体(关于多媒体(MultimediumMultimedium)的定义或说法多种多样,从)的定义或说法多种多样,从不同的角度出发对多媒体给出了不同的描述,目前仍没有统不同的角度出发对多媒体给出了不同的描述,目前仍没有统一的标准。通常所说的多媒体就是各种媒体的综合,也就是一的标准。通常所说的多媒体就是各种媒体的综合,也就是声音、图像、动画、视频、文本

19、等各种媒体的综合声音、图像、动画、视频、文本等各种媒体的综合。“多媒多媒体体”常被当作常被当作“多媒体技术多媒体技术”的同义词。的同义词。2 2多媒体技术多媒体技术多媒体技术就是利用计算机技术把文本、图像、图形、动多媒体技术就是利用计算机技术把文本、图像、图形、动画、音频及视频等多种媒体有机地集成起来,使人们能以更画、音频及视频等多种媒体有机地集成起来,使人们能以更加自然的方式使用信息,并与计算机进行交互,且使表现的加自然的方式使用信息,并与计算机进行交互,且使表现的信息图、文、声并茂。简言之,信息图、文、声并茂。简言之,多媒体技术就是计算机综合多媒体技术就是计算机综合处理声、文、图信息的技术

20、,具有集成性、实时性和交互性。处理声、文、图信息的技术,具有集成性、实时性和交互性。1.1.2 多媒体与多媒体技术多媒体与多媒体技术n1.1 多媒体的基本概念多媒体的基本概念n1.2 音频信息处理基础音频信息处理基础n1.3 图像信息处理基础图像信息处理基础n1.4 视频信号的数字化视频信号的数字化n1.5 MATALAB在图像处理中的应用在图像处理中的应用第第1章章 多媒体信息处理基础多媒体信息处理基础n1.2.1 声音的基本特性声音的基本特性n1.2.2 声音的主观感觉声音的主观感觉n1.2.3 音频信号的数字化音频信号的数字化 1.2 音频信息处理基础音频信息处理基础h声音是机械振动或气

21、流振动引起周围传播媒质(气体、液体、固体等)声音是机械振动或气流振动引起周围传播媒质(气体、液体、固体等)发生波动的现象,通常将产生声音的发声体称为声源。当声源产生振动时,发生波动的现象,通常将产生声音的发声体称为声源。当声源产生振动时,引起邻近空气的振动。这样空气就随着声源体所振动幅度的不同,而产生引起邻近空气的振动。这样空气就随着声源体所振动幅度的不同,而产生密或稀的振动,空气的这种振动被称为声波。声波可以用一条连续的曲线密或稀的振动,空气的这种振动被称为声波。声波可以用一条连续的曲线来表示,它可以分解成一系列正弦波的线性叠加来表示,它可以分解成一系列正弦波的线性叠加。1.2.1 声音的基

22、本特性声音的基本特性h1.1.频率频率单位时间内信号振动的次数,单位是赫兹(单位时间内信号振动的次数,单位是赫兹(Hz)。)。声音的声音的音调由音调由频率频率决定。决定。n声音尖细表示频率高,声音尖细表示频率高,n声音低粗表示频率低。声音低粗表示频率低。1.2.1 声音的基本特性声音的基本特性次声波次声波音频信号音频信号超声波超声波20 000Hz声音信号按频率划分:声音信号按频率划分:h2.2.频谱频谱 声音信号按频率成分组成来分,可分为:声音信号按频率成分组成来分,可分为:n纯音:纯音:频率单一、振幅随时间按正弦函数规律变化的声音频率单一、振幅随时间按正弦函数规律变化的声音n复音:复音:由

23、不同频率和不同振幅的声波组合而成的声音由不同频率和不同振幅的声波组合而成的声音n基音:基音:复音中频率最低的成分(分音)复音中频率最低的成分(分音)n谐音:谐音:复音中频率与基音成整数倍的分音复音中频率与基音成整数倍的分音 声音的频谱结构是用基音、谐音数目、各谐音振幅大小声音的频谱结构是用基音、谐音数目、各谐音振幅大小及相位关系来描述的。声音的音色就是由其频谱成分决定的。及相位关系来描述的。声音的音色就是由其频谱成分决定的。1.2.1 声音的基本特性声音的基本特性声压声压n由声波引起的交变压强称为声压,一般用由声波引起的交变压强称为声压,一般用P表示,单位是帕(表示,单位是帕(Pa)。)。n声

24、压的大小反映了声音振动的强弱,同时也决定了声波的幅度大小。声压的大小反映了声音振动的强弱,同时也决定了声波的幅度大小。声压级声压级 用声压的相对大小(称声压级或声强)来表示声压的强弱。声压级用声压的相对大小(称声压级或声强)来表示声压的强弱。声压级用符号用符号SPL 表示,单位是分贝(表示,单位是分贝(dB):式中,式中,P为声压有效值;为声压有效值;Pref为参考声压,一般取为参考声压,一般取 Pa,这个数,这个数值是人耳所能听到的值是人耳所能听到的1kHz声音的最低声压,低于这一声压,人耳就无声音的最低声压,低于这一声压,人耳就无法觉察出声波的存在了。法觉察出声波的存在了。h3.3.声压及

25、声压级声压及声压级 1.2.1 声音的基本特性声音的基本特性 人对声音的感知有人对声音的感知有响度响度、音调音调和和音色音色三个主观听感要素。三个主观听感要素。n响度响度:与声波振动的幅度有关与声波振动的幅度有关n音调:音调:取决于声波的基音频率取决于声波的基音频率n音色:音色:由声波的的频谱成分决定由声波的的频谱成分决定1.2.2 声音的主观感觉声音的主观感觉h1.1.响度:响度:是人耳对声音强弱的主观感觉程度。是人耳对声音强弱的主观感觉程度。在客观的度量中,声音的强弱是由声波的振幅(声压)决在客观的度量中,声音的强弱是由声波的振幅(声压)决定的。但响度与声波的振幅并不完全一致。响度不仅取决

26、定的。但响度与声波的振幅并不完全一致。响度不仅取决于振幅的大小,还取决于频率的高低。于振幅的大小,还取决于频率的高低。响度用符号响度用符号N表示,单位是宋表示,单位是宋(sone)。国际上规定,频率为。国际上规定,频率为1kHz的纯音在声压级为的纯音在声压级为40dB时的响度为时的响度为1宋(宋(sone)。)。另外,响度的大小与距声源的距离有关,同一声音离另外,响度的大小与距声源的距离有关,同一声音离声源越近,响度越大。声源越近,响度越大。1.2.2 声音的主观感觉声音的主观感觉h2.2.响度级:响度级:人耳对声音强弱的主观感觉还可以用响人耳对声音强弱的主观感觉还可以用响度级来表示。响度级的

27、单位为方(度级来表示。响度级的单位为方(phon)。规定)。规定1kHz纯音纯音声压级的分贝数定义为响度级的数值。声压级的分贝数定义为响度级的数值。响度响度sone1248163264128256声压级声压级dB405060708090100110120响度级响度级phon405060708090100110120表表1-1 1-1 声压级与响度、响度级的关系声压级与响度、响度级的关系1.2.2 声音的主观感觉声音的主观感觉h3.3.等响度曲线等响度曲线1.2.2 声音的主观感觉声音的主观感觉h4.4.听阈与痛阈听阈与痛阈听阈:听阈:当声音减弱到人耳刚刚可以听见时,此时的声音当声音减弱到人耳刚

28、刚可以听见时,此时的声音强度称为最小可听阈值,简称为强度称为最小可听阈值,简称为“听阈听阈”或或“闻阈闻阈”。一般以。一般以1kHz纯音为准进行测量,人耳刚能听到的声压级为纯音为准进行测量,人耳刚能听到的声压级为0dB(通常大于(通常大于0.3dB即有感受)。即有感受)。痛阈:痛阈:当声音增强到使人耳感到疼痛时,这个听觉阈值当声音增强到使人耳感到疼痛时,这个听觉阈值称为称为“痛阈痛阈”。仍以。仍以1kHz纯音为准来进行测量,使人耳感到纯音为准来进行测量,使人耳感到疼痛时的声压级约达到疼痛时的声压级约达到130140dB左右。左右。1.2.2 声音的主观感觉声音的主观感觉h5.5.音调音调音调也

29、称音调也称音高音高,表示人耳对声音调子高低的主观感受。声,表示人耳对声音调子高低的主观感受。声音越低沉,音调越低;声音越尖细,音调越高。音越低沉,音调越低;声音越尖细,音调越高。音调的高低是由发声体振动的频率决定的,频率越高,音音调的高低是由发声体振动的频率决定的,频率越高,音调越高;频率越低,音调越低。调越高;频率越低,音调越低。物体的振动频率与发声体的结构有关,一般而言,大而长物体的振动频率与发声体的结构有关,一般而言,大而长的物体振动频率低,小而短的物体振动频率高;物体绷的物体振动频率低,小而短的物体振动频率高;物体绷得越紧,振动频率越高;物体越薄、越细,振动频率越得越紧,振动频率越高;

30、物体越薄、越细,振动频率越高。高。音调单位是音调单位是“美(美(MelMel)”。频率为。频率为1kHz1kHz、声压级为、声压级为40 40 dBdB的纯音所产生的音调就定义为的纯音所产生的音调就定义为1 Mel1 Mel。音调大体上与频率的对数成正比。音调大体上与频率的对数成正比。1.2.2 声音的主观感觉声音的主观感觉h5.5.音色音色音调也称音调也称音高音高,表示人耳对声音调子高低的主观感受。声,表示人耳对声音调子高低的主观感受。声音越低沉,音调越低;声音越尖细,音调越高。音越低沉,音调越低;声音越尖细,音调越高。音调的高低是由发声体振动的频率决定的,频率越高,音音调的高低是由发声体振

31、动的频率决定的,频率越高,音调越高;频率越低,音调越低。调越高;频率越低,音调越低。物体的振动频率与发声体的结构有关,一般而言,大而长物体的振动频率与发声体的结构有关,一般而言,大而长的物体振动频率低,小而短的物体振动频率高;物体绷的物体振动频率低,小而短的物体振动频率高;物体绷得越紧,振动频率越高;物体越薄、越细,振动频率越得越紧,振动频率越高;物体越薄、越细,振动频率越高。高。音调单位是音调单位是“美(美(MelMel)”。频率为。频率为1kHz1kHz、声压级为、声压级为40 40 dBdB的纯音所产生的音调就定义为的纯音所产生的音调就定义为1 Mel1 Mel。音调大体上与频率的对数成

32、正比。音调大体上与频率的对数成正比。1.2.2 声音的主观感觉声音的主观感觉1.2.3 音频信号的数字化音频信号的数字化声源声源声波声波传声器传声器模拟电信号模拟电信号数字声音数字声音模模/数转换数转换n声音信号是典型的连续信号,不仅在声音信号是典型的连续信号,不仅在时间上是连续的时间上是连续的,而且在而且在幅度上也是连续的幅度上也是连续的。n数字化实际上就是对模拟信号进行数字化实际上就是对模拟信号进行采样采样、量化量化和和编码。编码。模模/数转换数转换11011100 11001101把声音把声音(模拟量模拟量)按照固定时间间隔,转换成有限个数字表示的离散序列按照固定时间间隔,转换成有限个数

33、字表示的离散序列1.2.3 音频信号的数字化音频信号的数字化n采样(采样(Sampling):):每隔一定的时间间隔,抽取信号每隔一定的时间间隔,抽取信号的一个瞬时幅度值(样本值),即在时间上将模拟的一个瞬时幅度值(样本值),即在时间上将模拟信号进行离散化。采样后所得到的一系列在时间上信号进行离散化。采样后所得到的一系列在时间上离散的样本值称为样值序列。离散的样本值称为样值序列。n奈奎斯特(奈奎斯特(Nyquist)采样定理:)采样定理:只要采样频率只要采样频率大于大于或等于声音信号最高频率的两倍(或等于声音信号最高频率的两倍(fs2fmax),),就就可以通过理想低通滤波器,从样值序列中无失

34、真地可以通过理想低通滤波器,从样值序列中无失真地恢复原始模拟信号。也就是说,在满足奈奎斯特采恢复原始模拟信号。也就是说,在满足奈奎斯特采样定理的条件下,在时间上离散的样值序列包含有样定理的条件下,在时间上离散的样值序列包含有采样前模拟信号的全部信息。采样前模拟信号的全部信息。n常用音频采样频率常用音频采样频率:8kHz、11.025kHz、22.05kHz、32kHz、44.1kHz、48kHz、96kHz1.2.3 音频信号的数字化音频信号的数字化n量化(量化(Quantization):):对每个样值的连续幅度进行对每个样值的连续幅度进行离散化,即用有限个幅度值近似原来连续变化的幅离散化,

35、即用有限个幅度值近似原来连续变化的幅度值,把模拟信号的连续幅度变为有限数量、有一度值,把模拟信号的连续幅度变为有限数量、有一定间隔的离散值。定间隔的离散值。n均匀量化(线性量化):均匀量化(线性量化):量化器的每个量化间隔都相等,量化器的每个量化间隔都相等,量化电平取各量化区间的中间值。量化电平取各量化区间的中间值。n非均匀量化(非线性量化):非均匀量化(非线性量化):量化器的各个量化间隔是量化器的各个量化间隔是不相等的。不相等的。1.2.3 音频信号的数字化音频信号的数字化n编码(编码(Encoding):):采样、量化后的信号还不是数字信号,需采样、量化后的信号还不是数字信号,需要把它转换

36、成数字编码脉冲,这一过程称为编码。最简单的编要把它转换成数字编码脉冲,这一过程称为编码。最简单的编码方式是二进制编码。具体说来,就是用码方式是二进制编码。具体说来,就是用n比特二进制码来表比特二进制码来表示已经量化了的样值,每个二进制数对应一个量化电平,然后示已经量化了的样值,每个二进制数对应一个量化电平,然后把它们排列,得到由二值脉冲组成的数字信息流。把它们排列,得到由二值脉冲组成的数字信息流。1.2.3 音频信号的数字化音频信号的数字化模模/数转换数转换11011100 11001101把声音把声音(模拟量模拟量)按照固定时间间隔,转换成有限个数字表示的离散序列按照固定时间间隔,转换成有限

37、个数字表示的离散序列质量质量等级等级采样频率采样频率/kHz量化精度量化精度/bit声道数声道数数码率数码率/kbit/s频带频带/Hz电话电话话音话音88单声道单声道642003400AM11.0258单声道单声道88.2507000FM22.0516双声道双声道705.62015000CD44.116双声道双声道1411.2 2020000DAT4816双声道双声道15362020000n声音质量与数码率的关系声音质量与数码率的关系1.2.3 音频信号的数字化音频信号的数字化n1.1 多媒体的基本概念多媒体的基本概念n1.2 音频信息处理基础音频信息处理基础n1.3 图像信息处理基础图像信

38、息处理基础n1.4 视频信号的数字化视频信号的数字化n1.5 MATALAB在图像处理中的应用在图像处理中的应用第第1章章 多媒体信息处理基础多媒体信息处理基础n1.3.1 光的颜色与彩色三要素光的颜色与彩色三要素n1.3.2 三基色原理三基色原理n1.3.3 典型的颜色空间模型及转换关系典型的颜色空间模型及转换关系n1.3.4 图像信号的数字化图像信号的数字化 1.3 图像信息处理基础图像信息处理基础 光是一种电磁波。光是一种电磁波。电电磁磁辐辐射射的的波波长长范范围围很很宽宽,按按波波长长从从长长到到短短的的顺顺序序排排列列,依依次次是是无无线线电电波波、红红外外线、可见光、紫外线、线、可

39、见光、紫外线、X X射线和宇宙射线等。射线和宇宙射线等。图图1-31-3是按波长的顺序排列的电磁波谱。是按波长的顺序排列的电磁波谱。1.3.1 光的颜色与彩色三要素光的颜色与彩色三要素图图1-3 1-3 电磁波谱电磁波谱n波长在波长在380380780nm780nm范围内的电磁波能够使人眼产生颜色感觉,范围内的电磁波能够使人眼产生颜色感觉,称为称为可见光可见光。可见光在整个电磁波谱中只占极小的一段。可见光在整个电磁波谱中只占极小的一段。1.3.1 光的颜色与彩色三要素光的颜色与彩色三要素描描述述一一种种色色彩彩需需要要用用亮亮度度、色色调调和和色色饱饱和和度度三三个个基基本本参参量量,这三个参

40、量称为这三个参量称为彩色三要素彩色三要素。亮亮度度反反映映光光的的明明亮亮程程度度。彩彩色色光光辐辐射射的的功功率率越越大大,亮亮度度越越高高,反反之之亮亮度度越越低低。不不发发光光物物体体的的亮亮度度取取决决于于它它反反射射光光功功率率的的大大小小。若若照照射射物物体体的的光光强强度度不不变变,物物体体的的反反射射性性能能越越好好,物物体体越越明明亮亮,反反之之越越暗暗。对对于于一一定定的的物物体体,照照射射光光越越强,强,物体越明亮,反之越暗。物体越明亮,反之越暗。1.3.1 光的颜色与彩色三要素光的颜色与彩色三要素 色调色调反映彩色的类别,反映彩色的类别,例如例如红红、橙橙、黄黄、绿绿、

41、青青、蓝蓝、紫紫等不同颜色。等不同颜色。发光物体的色调由光的发光物体的色调由光的波长决定,不同波长的波长决定,不同波长的光呈现不同的色调;不光呈现不同的色调;不发光物体的色调由照明发光物体的色调由照明光源和该物体的吸收、光源和该物体的吸收、反射或透射特性共同决反射或透射特性共同决定。定。色饱和度色饱和度反映彩色光的深浅程度。同一色调的反映彩色光的深浅程度。同一色调的彩色光,会给人以深浅不同的感觉,彩色光,会给人以深浅不同的感觉,深红、深红、粉粉红红是两种不同饱和度的红色,是两种不同饱和度的红色,深红色饱和度高深红色饱和度高,粉红色饱和度低。粉红色饱和度低。1.3.1 光的颜色与彩色三要素光的颜

42、色与彩色三要素1.3.2 三基色原理三基色原理n根据人眼的视觉特性,在电视机中重现图像时并不要求完根据人眼的视觉特性,在电视机中重现图像时并不要求完全重现原景物反射或透射光的光谱成分,而应获得与原景全重现原景物反射或透射光的光谱成分,而应获得与原景物相同的彩色感觉。物相同的彩色感觉。n因此仿效人眼三种锥状细胞,可以选择三种基色,将它们因此仿效人眼三种锥状细胞,可以选择三种基色,将它们按不同比例进行组合,可得到自然界中绝大多数的彩色。按不同比例进行组合,可得到自然界中绝大多数的彩色。这三种基色必须是相互独立的,即任一种基色都不能由其这三种基色必须是相互独立的,即任一种基色都不能由其他两种基色混合

43、得到。他两种基色混合得到。n自然界中绝大多数的彩色可以分解为三基色,三基色按一自然界中绝大多数的彩色可以分解为三基色,三基色按一定比例混合,可得到自然界中绝大多数彩色。定比例混合,可得到自然界中绝大多数彩色。n混合色的色调和饱和度由三基色的混合比例决定,混合色混合色的色调和饱和度由三基色的混合比例决定,混合色的亮度等于三种基色亮度之和。的亮度等于三种基色亮度之和。n因为人眼的三种锥状细胞对因为人眼的三种锥状细胞对红光红光、绿光绿光和和蓝光蓝光最敏感,所以在最敏感,所以在红色红色、绿色绿色和和蓝色蓝色光谱区中选光谱区中选择三个基色按适当比例混色可得到较多的彩色。择三个基色按适当比例混色可得到较多

44、的彩色。在彩色电视中,选用了在彩色电视中,选用了红红、绿绿、蓝蓝作为三基作为三基色,分别用色,分别用R、G、B来表示。来表示。波长为波长为700 nm的红光为红基色的红光为红基色R(红红)波长为波长为546.1nm的绿光为绿基色的绿光为绿基色G(绿绿)波长为波长为435.8nm的蓝光为蓝基色的蓝光为蓝基色B(蓝蓝)1.RGB颜色空间模型颜色空间模型n在在RGB模型中,颜色空间里所有的颜色都是由模型中,颜色空间里所有的颜色都是由R、G、B(红、绿、蓝红、绿、蓝)三种光依不同的比例相加而三种光依不同的比例相加而成。成。nRGB的每一色光,含有亮度成分,例如的每一色光,含有亮度成分,例如R的成分的成

45、分越多,表示越红越亮。各色光混合后,会比原来越多,表示越红越亮。各色光混合后,会比原来单独的色光还亮,称为单独的色光还亮,称为相加混色相加混色;n适合在以主动光源显示影像的场合使用,如电视、适合在以主动光源显示影像的场合使用,如电视、电脑、投影等。电脑、投影等。绿绿(0,1,0)(0,1,0)青青(0,1,1)(0,1,1)黄黄(1,1,0)(1,1,0)黑黑(0,0,0)(0,0,0)蓝蓝(0,0,1)(0,0,1)品红品红(1,0,1)(1,0,1)白白(1,1,1)(1,1,1)红红(1,0,0(1,0,0)相加混色相加混色RGB颜色颜色000黑黑001蓝蓝010绿绿011青青100红红

46、101品红品红110黄黄111白白2.CMY/CMYK颜色空间模型颜色空间模型n在彩色印刷、彩色胶片和绘画中的混色采用相减混色。在彩色印刷、彩色胶片和绘画中的混色采用相减混色。n彩色印刷或彩色打印的纸张是不能发射光线的,因而印刷彩色印刷或彩色打印的纸张是不能发射光线的,因而印刷机或彩色打印机就只能使用一些能够吸收特定的光波而反机或彩色打印机就只能使用一些能够吸收特定的光波而反射其他光波的油墨或颜料。射其他光波的油墨或颜料。n任何一种由颜料呈现的颜色都可以用任何一种由颜料呈现的颜色都可以用青(青(Cyan)、品红)、品红(Magenta)和黄()和黄(Yellow)这三种基色按不同的比例混合这三

47、种基色按不同的比例混合而成,我们称这种颜色空间为而成,我们称这种颜色空间为CMY颜色空间。颜色空间。n由于彩色墨水和颜料的化学特性,用等量的由于彩色墨水和颜料的化学特性,用等量的CMY三基色三基色得到的黑色不是真正的黑色,因此在印刷术中常加一种真得到的黑色不是真正的黑色,因此在印刷术中常加一种真正的黑色墨水(正的黑色墨水(Black Ink),于是),于是CMY颜色空间也称为颜色空间也称为CMYK颜色空间。颜色空间。C CY YMMR RG GB B相减混色相减混色C(青色青色)M(品红品红)Y(黄色黄色)颜色颜色000白白001黄黄010品红品红011红红100青青101绿绿110蓝蓝111

48、黑黑n RGB CMYRGB和和CMY值都归一到值都归一到0,1nYUV是是PAL(Phase Alternating Line,逐行倒相)制彩色,逐行倒相)制彩色电视系统所采用的一种颜色空间模型,其中电视系统所采用的一种颜色空间模型,其中Y表示亮度,表示亮度,U表示蓝色色差(即表示蓝色色差(即B-Y),),V代表红色色差(代表红色色差(R-Y)。)。n采用采用YUV色彩空间的重要性:色彩空间的重要性:n亮度信号亮度信号Y和色度信号和色度信号U、V是分离的,解决彩色电视是分离的,解决彩色电视和黑白电视兼容的问题。和黑白电视兼容的问题。n可以利用人眼对彩色的敏感度低于对亮度的敏感度的可以利用人眼

49、对彩色的敏感度低于对亮度的敏感度的视觉特性,用较窄的频带传送视觉特性,用较窄的频带传送U、V信号,优化彩色电信号,优化彩色电视信号的传输。视信号的传输。3.YUV颜色空间模型颜色空间模型n RGB YUVn YIQ颜色空间是由颜色空间是由YUV推导而来,是推导而来,是NTSC 制彩色电视系统制彩色电视系统所采用的一种颜色空间模型;所采用的一种颜色空间模型;n I代表代表“同相同相”,Q代表代表“正交正交”,它们指的是用于发射颜色信息,它们指的是用于发射颜色信息的调制方法;的调制方法;n I、Q是通过将是通过将U、V轴逆时针旋转轴逆时针旋转33度获得的。度获得的。n优点:优点:由人眼彩色视觉的特

50、性表明,人眼分辨红、黄之间颜由人眼彩色视觉的特性表明,人眼分辨红、黄之间颜色变化的能力最强,而分辨蓝、紫之间颜色变化的能力最弱。色变化的能力最强,而分辨蓝、紫之间颜色变化的能力最弱。通过一定的变化,通过一定的变化,I对应于人眼最敏感的色度,而对应于人眼最敏感的色度,而Q对应于人对应于人眼最不敏感的色度。这样,传送眼最不敏感的色度。这样,传送Q可以用较窄的频带,而传可以用较窄的频带,而传送分辨率较强的送分辨率较强的I信号时,可以用较宽的频带。信号时,可以用较宽的频带。4.YIQ颜色空间模型颜色空间模型n RGB YIQn由由YUV颜色空间派生的一种颜色空间模型。颜色空间派生的一种颜色空间模型。n

展开阅读全文
相关资源
相关搜索

当前位置:首页 > pptx模板 > 企业培训

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com