2022语音识别技术调研报告_语音识别技术文献综述.docx

上传人:l*** 文档编号:7174406 上传时间:2022-02-20 格式:DOCX 页数:8 大小:34.43KB
返回 下载 相关 举报
2022语音识别技术调研报告_语音识别技术文献综述.docx_第1页
第1页 / 共8页
2022语音识别技术调研报告_语音识别技术文献综述.docx_第2页
第2页 / 共8页
点击查看更多>>
资源描述

《2022语音识别技术调研报告_语音识别技术文献综述.docx》由会员分享,可在线阅读,更多相关《2022语音识别技术调研报告_语音识别技术文献综述.docx(8页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、2022语音识别技术调研报告_语音识别技术文献综述 语音识别技术调研报告由我整理,希望给你工作、学习、生活带来便利,猜你可能喜爱“语音识别技术文献综述”。 语音识别技术的原理和应用 语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或吩咐的高技术。其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。 在语音识别的特征提取过程中,主要有语音信息量大,语音的模糊性,重音、音调、音量和音速的改变,环境噪声和干扰等难点。导致语音识别在互联网和传媒行业始终没有得到广泛的应用。但是近

2、几年来,借助机器学习领域深度学习探讨的发展,以及大数据语料的积累,硬件的性能的提升和算法的改进,语音识别技术得到突飞猛进的发展。例如音频指纹技术和音频二维码技术等。下面本文详细探讨这两种技术。 音频二维码 音频二维码技术 二维码技术经过多年的发展,已成为大家耳熟能详的名词了。二维码取代传统的键盘树盘输入技术的部分功能,成为互联网行业的其次大入口方式。但是一般的二维码技术只是将文本信息进行加码和解码。这导致二维码只能传输一般的文本信息。假如将音频技术和二维码的概念相结合,利用声音实现终端之间的近距离信息传输,那么毫无疑问音频信息将成为互联网行业的第三大入口方式。 音频二维码技术采纳仿生学技术,利

3、用声音实现文件的快速传输。采纳跨平台的技术,实现手机、电脑、智能机顶盒等智能设备间的图片、文字、链接的传输。音频二维码技术能在肯定程度上取代图像二维码、近磁场传输和蓝牙等技术。 2022年底蛐蛐儿创始人朱连兴开发了一套音频二维码的引擎,名字叫蛐蛐儿SDK。在朱连兴推出了蛐蛐儿SDK之后,音频二维码的开发也变的比以前更加快速和简洁。蛐蛐儿通过声音传输的不是文件,而是在发送端生成一个四位的二进制数。这四位二进制数是待发送文件的ID。发送端向接收端发送的其实只是上述生成的ID。发送端在向客户端发送ID的同时向云端发送ID和数据。在接收端接收到ID后,通过该ID向云端获得对应的数据。 音频二维码应用

4、音频二维码的应用特别广泛。音频二维码通过声音传递信息。广播和电视也通过声音传递信息。假如结合音频二维码技术和广播电视技术,将使二者相得益彰。音频二维码可以使广播电视用户不再是单一的受众,也是参加者。通过音频二维码可以让用户的手机等终端设备接入电视屏幕或者广播。用户在观赏电视节目或者收听广播节目的同时,也可以通过手持终端参加节目互动环节。这会在给用户带来更好体验的同时,拉动广播电视行业的收视率和收听率。 例如在非诚勿扰的节目播放结束时,孟非不须要说那么长的一串话让观众知道如何来报名参与非诚勿扰,只须要说“欢迎在听到嘀声后报名参与非诚勿扰”就可以了。观众的终端在听到嘀声后解析相应的内容,获得到报名

5、所须要的电话号码和电子邮箱。观众可以任选一种进行报名。这样观众再也不须要拿笔和纸去记录这些信息了。 观众在观看好享购频道的时候,在一个节目结束的时候插入一个声音。观众的手机在听到这个声音后自动解析购买此商品的号码,用户按拨号键就可以干脆购买自己想要的商品。运用了音频二维码技术,用户便从对着电视屏幕记录购买号码中解脱出来了。 不像电视技术同时通过声音和画面来传递信息,广播技术只能通过声音来传递信息。所以在广播行业中,尤其须要其它的手段让听众接收信息。在这个需求下,音频二维码技术变得尤为重要。 通过音频二维码技术,广播和电视可以向用户推送广告,例如团购消息、好享购商品信息以及商场打折券等等;可以向

6、用户推送增值服务,例如天气预报、银行还款等等;可以向用户发起投票活动;还可以允许用户共享这些内容到各大社交论坛,吸引物联网用户的眼球。 缺点 蛐蛐儿SDK采纳的是人耳可以听到的四千到一万伏的频段。这导致特别简单被四周环境中的噪声干扰。经过测试,该SDK在咖啡店和火锅店等公共场所中,在两米以内的传输率能达到百分之百,距离越远,传输率越低。 蛐蛐儿SDK采纳的是人耳听觉范围内的音频,这对于广播电视行业来说是个缺点。因为在原本纯内容的声音信息中加入了其它的对人耳来说无用的声音,可能会让观众无法接受。这个问题可以通过采纳超声波或者次声波来代替可听波来解决。但是假如采纳超声波,会显著增加功耗,并且不能绕

7、过障碍物。在电视前站一个人将把全部信息拒之门外。并且某些频率的次声波对人体产生的危害特别大。所以确定音频的频率是一个特别重要的探讨。 音频指纹 音频指纹技术 音频指纹技术是一种通用音频处理技术。它能依据音频对象的特征精确识别该对象的信息。音频指纹是音频对象简短的摘要。音频指纹技术在音频对象和指纹之间建立一种映射关系。通过这种机制,不须要通过比较较大的音频对象本身,而是通过比较相关的指纹,就可以确定音频之间知觉同等的关系。 音频技术的探讨起步较早,现在已发展的特别成熟。音频指纹的探讨主要有两个方向。一是基于水印嵌入的指纹方法。周鸿飞提出了一种基于混沌和系数均指统计特性的音频指纹方案。首先运用用户

8、信息生成混沌映射初值,然后应用混沌方法把混沌映射初值生成用户指纹,再依据小波系数统计恒定特性将指纹嵌入到每帧中。这种方法具有肯定的鲁棒性,但是须要嵌入多余的数据。另一种是基于内容的指纹方法。Haitsma J.提出了一种鲁棒的音频哈希指纹方法,对相邻2帧提取频域能量的差异作为哈希指纹。 音频指纹应用 音频指纹起步较早,应用也特别广泛。目前应用最广的领域是音乐播放软件中。依据音乐的旋律能够精确识别歌名歌手等信息。飞利浦公司研制了一款手机软件。只要把手机贴近正在播放歌曲的收音机,不出三秒钟的时间就能登记这首歌曲的音频指纹。然后手机可以通过该音频指纹去音频指纹数据库找寻匹配的歌曲。酷我音乐也采纳了这

9、种技术实现了类似的功能。 音频指纹也可以应用到电视媒体中。例如可以运用音频指纹对电视广告进行检测。商业公司可以检测电视台的广告是否按合同规定播出。媒体探讨机构和广告策略公司可以统计广告的信息,对其进行整理和数据挖掘。 音频指纹还可以用于版权限制。版权全部者可以对广播和电视进行音频指纹采集,然后依据音频指纹对比音视频数据库,找到该音视频,进而挖掘传播者是否具有该音视频的版权。 音频指纹也可以用于向电视和广播用户的终端推送服务,增加与用户的互动。例如用户的手机接收到特定的音频指纹后就打开web阅读器,转到一个URL。该URL可以是与用户互动的投票系统,也可以是广告,或者是一些增值服务。 音频指纹同

10、样也可以用于物联网行业。当用户上传或者下载音频的时候,首先传递该音频的指纹。假如发觉已存在该音频,将干脆完成此次下载任务。达到秒级的用户体验。 总结 随着技术的迭代更新,语音识别技术也会越来越完善和先进。其应用背景特别广泛,其商机也无限大。可以预料在近五到十年内,语音识别系统的应用将更加广泛。各种各样的语音识别系统产品将出现在市场上。人们也将调整自己的说话方式以适应各种各样的识别系统。 语音信号处理与识别 信号系统课程设计报告欧阳光亮2022029020025 语音信号处理与识别目的:理解时域和频域尺度变换基本概念,驾驭信号时频域分析方法,正确理解采样定理,精确理解滤波器的概念。 内容:. 图

11、像识别技术报告(举荐) 图像识别技术课程老师:桑爱军老师报告组成员:五里雾一、图像识别简介图像识别是指图形刺激作用于感觉器官,人们分辨出它是阅历过的某一图形的过程,也叫图像再认。在图像识别中,. 智能语音识别机器人文献翻译 改进型智能机器人的语音识别方法2、语音识别概述最近,由于其重大的理论意义和好用价值,语音识别已经受到越来越多的关注。到现在为止,多数的语音识别是基于传统的线性系统理论,. 人脸识别调研报告(精选6篇) 第1篇:人脸识别小结人脸识别总结一、概述生物特征识别技术包括人脸识别、指纹识别、语音识别、表情分析及理解、虹膜识别等 人脸识别的实质就是借助计算机工具来分析人脸面部. 人脸识别技术解读 人脸识别,特指利用分析比较的计算机技术。人脸识别是一项热门的计算机技术探讨领域,人脸追踪侦测,自动调整影像放大,夜间红外侦测,自动调整曝光强度;它属于生物特征识别技术,是对生. 本文来源:网络收集与整理,如有侵权,请联系作者删除,谢谢!第8页 共8页第 8 页 共 8 页第 8 页 共 8 页第 8 页 共 8 页第 8 页 共 8 页第 8 页 共 8 页第 8 页 共 8 页第 8 页 共 8 页第 8 页 共 8 页第 8 页 共 8 页第 8 页 共 8 页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 党政司法

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com