最新LDA算法详解.docx

上传人:1595****071 文档编号:35275418 上传时间:2022-08-21 格式:DOCX 页数:26 大小:231.27KB
返回 下载 相关 举报
最新LDA算法详解.docx_第1页
第1页 / 共26页
最新LDA算法详解.docx_第2页
第2页 / 共26页
点击查看更多>>
资源描述

《最新LDA算法详解.docx》由会员分享,可在线阅读,更多相关《最新LDA算法详解.docx(26页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、Four short words sum up what has lifted most successful individuals above the crowd: a little bit more.-author-dateLDA算法详解LDA算法详解线性鉴别分析法线性鉴别分析(Linear Discriminant Analysis, LDA),有时也称Fisher线性判别(Fisher Linear Discriminant ,FLD), 这种算法是Ronald Fisher 于 1936年发明的,是模式识别的经典算法 TTT。在1996年由Belhumeur引入模式识别和人工智能领

2、域的。性鉴别分析的基本思想是将高维的模式样本投影到最佳鉴别矢量空间,以达到抽取分类信息和压缩特征空间维数的效果,投影后保证模式样本在新的子空间有最大的类间距离和最小的类内距离,即模式在该空间中有最佳的可分离性。因此,它是一种有效的特征抽取方法。使用这种方法能够使投影后模式样本的类间散布矩阵最大,并且同时类内散布矩阵最小。就是说,它能够保证投影后模式样本在新的空间中有最小的类内距离和最大的类间距离,即模式在该空间中有最佳的可分离性。3.2.1 Fisher线性判别准则假设有一组属于两个类的n个d维样本,其中前个样本属于类 ,后面个样本属于类,均服从同协方差矩阵的高斯分布。各类样本均值向量(i=1

3、,2)如式(3-15):= i=1,2 (3-15)样本类内离散度矩阵和总的类内离散度矩阵如式(3-16)、式(3-17): i=1,2 (3-16)=+ (3-17)t样本类间离散度矩阵如式(3-18): (3-18)现寻找一最佳超平面将两类分开,则只需将所有样本投影到此超平面的法线方向上,|w|=1: i=1,n (3-19)得到n个标量,,R,这n个标量相应的属于集合和,并且和能很好的分开。为了能找到这样的能达到最好分类效果的投影方向w,Fisher规定了一个准则函数:要求选择的投影方向W能使降维后和两类具有最大的类间距离与类内距离比: (3-20)其中类间距离用两类均值和之间的距离表示

4、,类内距离用每类样本距其类均值距离的和表示,在式中为+。其中(i=1,2)为降维后各类样本均值:= i=1,2 (3-21)(i=1,2)为降维后每类样本类内离散度,+为总的类内离散度:, i=1,2 (3-22)=+ (3-23)类间离散度表示为。但式(3-20)Fisher准则函数并不是w的显示函数,无法根据此准则求解W,因此需要对Fisher准则函数形式进行修改:因 i=1,n ,则= i=1,2 (3-24)= (3-25)=同样(i=1,2)也可推出与w的关系:= (3-26)因此+ = (3-27)则最终可表示为: = (3-28)根据式(3-28)Fisher准则函数,要寻找一投

5、影向量W,使最大化,则需对按变量W求导并使之为零: (3-29)则需 ()()=0= (3-30)令,则 (3-31)这是一个广义特征值问题,若非奇异,则 (3-32)因此可以通过对进行特征值分解,将最大特征值对应的特征向量作为最佳投影方向W。以上Fisher准则只能用于解决两类分类问题,为了解决多类分类问题,Dudal提出了判别矢量集的概念,被称为经典的Fisher线性判别分析方法。Duda指出,对于c类问题,则需要c-1个上节的用于两类分类的Fisher线性判别函数,即需要由c-1个投影向量W组成一个投影矩阵W,将样本投影到此投影矩阵上,从而可以提取c-1维的特征矢量。针对c类问题,则样本

6、的统计特性需要推广到c类上。样本的总体均值向量: i=1,c (3-33)样本的类内离散度矩阵: (3-34)样本的类间离散度矩阵: (3-35)将样本空间投影到投影矩阵W上,得到C-1维的特征矢量y: (3-36)其中,y。投影后的样本统计特性也相应的推广到c类:投影后总样本均值向量: i=1,c (3-37)样本的类内离散度矩阵: (3-38)样本的类间离散度矩阵: (3-39)Fisher准则也推广到c类问题: (3-40)为使Fisher准则取得最大值,类似两类分类问题,W需满足: (3-41)若非奇异,则,则W的每一列为的前c-1个较大特征值对应的特征向量。3.2.2 基于LDA的人

7、脸特征提取线性判别式分析 RRR(Linear Discriminant Analysis, LDA),也叫做Fisher线性判别(Fisher Linear Discriminant ,FLD),是模式识别的经典算法,它是在1996年由Belhumeur引入模式识别和人工智能领域的。性鉴别分析的基本思想是将高维的模式样本投影到最佳鉴别矢量空间,以达到抽取分类信息和压缩特征空间维数的效果,投影后保证模式样本在新的子空间有最大的类间距离和最小的类内距离,即模式在该空间中有最佳的可分离性。因此,它是一种有效的特征抽取方法。使用这种方法能够使投影后模式样本的类间散布矩阵最大,并且同时类内散布矩阵最小

8、。就是说,它能够保证投影后模式样本在新的空间中有最小的类内距离和最大的类间距离,即模式在该空间中有最佳的可分离性。LDA算法的思想如下:假设对于一个空间有m个样本分别为 即每个是一个n行的矩阵,其中表示属于i类的样本个数,假设有一个有c个类,则。是类间离散度矩阵,是类内离散度矩阵,是属于i类的样本个数,是第i个样本,是所有样本的均值,是类i的样本均值。那么类i的样本均值为 (3-42)同理我们也可以得到总体样本均值为 (3-43)根据类间离散度矩阵和类内离散度矩阵定义,可以得到如下式子 (3-44) (3-45)当然还有另一种类间类内的离散度矩阵表达方式 (3-46)(3-47)其中是指i类样

9、本的先验概率,即样本中属于i类的概率( )。LDA作为一个分类的算法,我们当然希望它所分的类之间耦合度低,类内的聚合度高,即类内离散度矩阵的中的数值要小,而类间离散度矩阵中的数值要大,这样的分类的效果才好。这里我们引入Fisher鉴别准则表达式: (3-48)通过最优化下面的准则函数找到有一组最优鉴别矢量构成的投影矩阵, (3-49)可以证明,当为非奇异(一般在实现LDA算法时,都会对样本做一次PCA算法的降维,消除样本的冗余度,从而保证是非奇异阵,当然即使为奇异阵也是可以解的,可以把或对角化,这里不做讨论,假设都是非奇异的情况)时,最佳投影矩阵的列向量恰为下来广义特征方程 (3-50)由(3

10、-50)式可以推导出 (3-51)又由于,再结合以上两式可以求出 (3-52)根据公式意义来看,要使得最大,则只要取即可,所以可得出结论:投影矩阵的列向量为个最大特征值所对应的特征向量,其中。3.3 Fisherface人脸识别方法Fisherface方法也称为Fisher线性判别分析(Fisher Linear DiscriminantAnalysis,FLDA),是由P.NBelhumeur等人在1997年提出的。研究者注意到特征值大的特征向量(即特征脸)并不一定是分类性能最好的方向, Fisherface方法的目的就是要从高维特征空间里提取出最具有判别能力的低维特征,这些特征能帮助将同一

11、个类别的所有样本聚集在一起,而不同类别的样本尽量的分开,也就是说,它选择使得样本类间离散度和样本类内离散度的比值最大的特征。Fisherface方法的实现是在PCA数据重构的基础上完成的,首先利用PCA将高维数据投影到低维特征脸子空间,然后再在这个低维特征脸子空间上用LDA特征提取方法得到相关特征参数 YUUYU。程序中使用参数寻优的方法来寻找最佳投影维数,以达到比较理想的识别效果。Fisherface采用PCA 和LDA 相结合的方法,实验证明此方法识别率比较高。由于PCA 方法存在着缺陷,图像中所有的像素都被赋予了同等的地位,角度、光照、尺寸及表情等会导致识别率下降。LDA 的计算过程要反

12、复做矩阵操作,计算量非常的大,而且计算复杂,容易引起累计误差,影响计算的精度,并且由于在正常的情况下人脸识别问题总是一个小样本问题,训练样本数比图像向量的维数要小很多,所以类内散布矩阵总为奇异阵而使此方法的求解变得很困难。因此,我们采用将PCA 和LDA 算法相结合的Fisherface人脸识别方法 TTTT。对于上节介绍的Fisher准则,当非奇异,可以通过对进行特征值分解,从而求出最佳投影方向W。但是当LDA用于人脸特征提取时,因图像转换为列向量维数太大,往往远大于样本数,造成奇异,则很难根据求解最佳投影方向,即小样本问题。如一幅168192的人脸图像,转换为列向量变为168192=32256维,则为3225632256的矩阵,但是因由样本计算而来,秩最大为(N为总样本数,C为类别数),因c-1,则的秩最大为c-1。取的前c-1个较大特征值对应的特征向量组成投影矩阵。(6)将作为最终投影矩阵(7)将所有样本中心化后,经投影变换全部投影到W上,从而为每个样本提取了c-1个特征得到: (3-55)(8)将测试图像经中心化,同样投影到W上,提取到c-1个特征得: (3-56)(9)选择合适的分类器,利用提取的特征对测试图像进行分类。-

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 成人自考

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com