流形学习的研究.docx

上传人:教**** 文档编号:83065467 上传时间:2023-03-28 格式:DOCX 页数:4 大小:38.58KB
返回 下载 相关 举报
流形学习的研究.docx_第1页
第1页 / 共4页
流形学习的研究.docx_第2页
第2页 / 共4页
点击查看更多>>
资源描述

《流形学习的研究.docx》由会员分享,可在线阅读,更多相关《流形学习的研究.docx(4页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、流形学习的研究摘要:文章介绍了流形学习基本思想、目前的最新研究成果,同时,简要叙述了流形学习算法的概念。流形学习作为一种新兴的降维手段,其目的是发现嵌入在高维欧氏空间中的低维光滑流形数据结构,并给出有效的低维表示。目前,随着计算机信息网络的飞速发展,流形学习已成为模式识别、机器学习和数据挖掘等领域的热点研究项目。关键词:流形学习;模式识别;维数降维;机器学习人类社会已经迈入了信息时代,信息量,信息传播的速度,信息处理的速度以及应用信息的程度等都以几何级数的方式在增长,在信息时代的科学研究过程中,不可避免的会遇到大量的高维数据,为了从海量的高维数据中获取低维流形结构数据,即找到高维空间中的低维流

2、形,以实现维数的约简化或者数据的可视化。假设采样的数据是均匀位于一个高维欧氏空间中的低维流形,而我们所研究的流形学习就是发现嵌入在高维数据空间中的低维流形结构,并给出一个有效低维表示。利用这种方法不但能够较好地处理由于海量高维数据所产生的“维数灾难”问题,而且可以从观测到的数据现象中去寻找事物的本质,解决信息资源巨大浪费与知识匮乏之间的矛盾,从而能够进一步得到产生数据的内在规律。1流形学习研究对数据降维的作用及意义随着科学技术的进步,尤其是现代信息产业的发展,把我们带入了一个崭新的信息时代。为了从海量的高维数据中获取低维流形结构数据,找到高维空间中的低维流形结构,以实现维数的约简化或者数据的可

3、视化。在实际的应用中,从高维数据中采集的观测点可以通过相应映射模拟成可能带有噪音的低维非线性流形上的样本点或者逼近这些样本点的数据。因此,数据降维尤其是非线性降维已经成为了数据挖掘的一个较为重要的手段,而其中进行降维的目的是为了从高维空间中寻找出隐藏在其中的低维结构。在近几年的研究中,非线性降维在机器学习、数据挖掘、计算机视觉和图像分析等许多研究领域都吸引了研究人员们的广泛关注。目前,在流形学习的研究中已经发展出了一些有效的算法来进行非线性降维。假设采样的数据是均匀位于一个高维欧氏空间中的低维流形,而我们所研究的流形学习就是发现嵌入在高维数据空间中的低维流形结构,并给出一个有效低维表示。利用这

4、种方法不但能够较好地处理由于海量高维数据所产生的“维数灾难”问题,而且可以从观测到的数据现象中去寻找事物的本质,解决信息资源巨大浪费与知识匮乏之间的矛盾,从而能够进一步得到产生数据的内在规律。流形学习方法是模式识别中的基本方法,分为线性流形学习算法和非线性流形学习算法,线性方法就是传统的线性判别分析(LDA)和方法如主成分分析(PCA),非线行流形学习算法包括等距映射(Iomap)和拉普拉斯特征映射(LE)等。如何从大量的数据库中排除种种繁杂冗余的信息,从中提取有价值的信息,并且进一步提高信息的利用率和使用率,发现数据中存在的关系和规则,掌握现有数据预测未来发展趋势的能力。从几何学角度来看,这

5、种嵌入在高维数据中的低维线性或非线性流行的维数约简,很好的保留了原始数据的基本几何性,就是说在高维空间中相邻的点在嵌入空间中也相邻。在目前的维数简约算法中,利用独立分量分析、主成分分析(PCA)等方法可以很好的处理高维数据集中具有线性结构和高斯分布的数据集,例如,主成分分析将方差的大小作为衡量信息量多少的标准,当方差越大时,提供的信息越多,方差越小时,提供的信息越小。在处理图像上,傅里叶变换将数据集变换到频域進行约简,小波变换增加时域信息。但是,当数据集在高维空间呈现高度扭曲,用以上方法处理高维非线性数据集并不能找到其真正的分布结构。而就现实中的实验数据来说,一般都是非线性数据,并且一般都是分

6、布在高维空间中,所以流形学习提供了一种新的研究途径,一种非线性降维技术,目的是寻找嵌入在高维数据中的低维流形结构,这种嵌入方法保留了原始实验数据的几何特性,即在高维空间中临近的点在嵌入空间中也相邻。低维空间中的特定的流形结构减少了数据空间变化的自由度,这是是数据规律性的发现,由此可以实现高维数据降维的目的。2流形学习的算法2.1流形学习的定义流形学习基本思想为:是一种新的机器学习方法,我们可以把高维观测空间中的点看作是由少数的、具有独立变量的、共同作用在观测样本空间的一个流形,为了把该数据集进行降维,需要通过某种算法,得到观测空间卷曲的流形或发现其内在的主要变量。2.2基于流形学习的方法局部线

7、性嵌入LLE(locallylinearembedding)局部线性嵌入LLE算法的基本思想:局部线性嵌入算法是一种依赖于局部线性的流形算法,假定观测数据集位于一个高维空间的低维嵌入流形上,并且嵌入空间与内在低维空间对应的局部邻域中数据点保持相同的局部近邻关系。2.3基于流形学习的方法ISOMAP首先提出多维尺度变换(MDS)这个概念。MDS是一种非监督的维数约简方法,MDS的基本思想:约简后低维空间中任意两点间的距离应该与它们在原始空间中的距离相同。2.4拉普拉斯特征映射(LaplacianEigenmap)基本思想:在高维空间中离得很近的点投影到低维空间中的象也应该离得很近,通过使用两点间的加权距离作为损失函数,可求得相应的降维结果。3结语

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com