Fisher线性判别

2024-05-14 02:11

1. Fisher线性判别

答:
  
 (1)考虑把d维空间的样本投影到一条直线上,形成一维空间,即把维数压缩到一维。
  
 (2)然而,即使样本在d维空间里形成若干紧凑的互相分得开的集群,当把它们投影到一条直线上时,也可能会是几类样本混在一起而变得无法识别。
  
 (3)但是,在一般情况下,总可以找到某个方向,使在这个方向的直线上,样本的投影能分得开。
  
 假设有一集合包含  个  维样本  ,若对  的分量做线性组合可得标量:
     
   这样便得到  个一维样本  组成的集合。实际上,  的值是无关紧要的,它仅是  乘上一个比例因子,重要的是选择w的方向。  的方向不同,将使样本投影后的可分离程度不同,从而直接影响的分类效果。
   因此,上述寻找最佳投影方向的问题,在数学上就是寻找最好的变换向量  的问题
  
   
   其中  是类间离散度矩阵,  为类内离散度矩阵。
   解:
     
   其中:  和  为两类的均值。
   附:
  
   维  空间
  
 (1)样本均值:
     
   (2)类内离散度矩阵:
     
     
   (3)类间离散度矩阵:
     
   1维  空间
   (1)样本均值
     
   (2)类内离散度矩阵:
     
     
  
 定义:
     
   分子为均值之差,分母为样本在Y上类内离散度,应该使得分子尽可能大而分母尽可能小。
   则分子可以化为:
     
   同理,分母可以化为  
   则总体可以写为:
     
  
 使用拉格朗日乘子法,令分母等于非零常数:
     
   定义拉格朗日函数为:
     
   令偏导数为零:
     
   即:
     
   其中  就是  的极值解。因为  非奇异,将上式两边左乘  ,可得:
     
   上式为求一般矩阵  的特征值问题。利用  的定义,将上式左边的  写成:
     
   其中  为一标量,所以  总在向量  的方向上。因此  可以写成:
     
   从而可得:
     
   因为目的是选择最佳投影方向,因此比例因子无影响,忽略比例因子  ,得到:

Fisher线性判别

2. fisher线性判别的基本思想

Fisher线性判别分析的基本思想:选择一个投影方向(线性变换,线性组合),将高维问题降低到一维问题来解决,同时变换后的一维数据满足每一类内部的样本尽可能聚集在一起,不同类的样本相隔尽可能地远。
Fisher线性判别分析,就是通过给定的训练数据,确定投影方向W和阈值w0, 即确定线性判别函数,然后根据这个线性判别函数,对测试数据进行测试,得到测试数据的类别。
Fisher判别分析是要实现有最大的类间距离,以及最小的类内距离。

性判别函数的一般形式可表示成
g ( X ) = W T X + w 0 g(X)=W^TX+w_{0}
g(X)=W 
T X+w 0其中
Fisher选择投影方向W的原则,即使原样本向量在该方向上的投影能兼顾类间分布尽可能分开,类内样本投影尽可能密集的要求。
(1)、W的确定
各类样本均值向量mi
、Fisher线性判别的决策规则
1.投影后,各类样本内部尽可能密集,即总类内离散度越小越好。2.投影后,各类样本尽可能离得远,即样本类间离散度越大越好。根据这两个性质,可求出。

3. 判别分析(Fisher判别方法)

 20210308 未完更新中   
   为了克服“维数灾难”,人们将高维数据投影到低维空间上来,并保持必要的特征,这样,一方面数据点变得比较密集一些,另一方面,可以在低维空间上进行研究。
    Fisher判别分析的基本思想 :选取适当的投影方向,将样本数据进行投影,使得投影后各样本点尽可能分离开来,即:使得投影后各样本 类内 离差平方和尽可能小,而使各样本 类间 的离差平方和尽可能大。
                                           ①设已知有两个类  和  ,在已知的数据中,  类有  个个体,  类有  个个体,即:            
   注意:个体  为列向量,列向量的元素为不同特征的具体数值。如,小明身高180,体重70,可以设小明这个个体为     ②计算两个类的 均值 :               ③计算两个类的 类内离差平方和 矩阵:           总的离差阵为     类间离差阵为     ④设需要找的投影向量为  ,将所有的个体  投影到  方向上,则可以得到投影后的结果为  ,即:   第一类个体在  方向上的投影结果为:  ;   第二类个体在  方向上的投影结果为:  ;   ⑤计算投影后两类的均值与类内离差平方和矩阵     
     
     
     
   总离差:     
   类间方差:     
   ⑥要使得在新的(投影后)数据空间中,数据的分离性能最好,即要使得两个类的类内距离最小,类间距离最大,建立目标函数  ,希望找到合适的投影向量  ,使得目标函数  达到最大。
   采用Lagrange乘数法求解。令分母等于非零常数,即:     
   定义lagrange函数为     
   对  求偏导得     
   又矩阵  与  是对称矩阵,因此,上式可化简为     
   令  ,有     
   记上式得解为  ,则        继续化简有:     
   两边同时左乘  得:     
   因此,  即为矩阵  的最大特征值对应的特征向量
   又     
   故     
     
   又  为一标量,因此   记     
   则     
   而标量  并不会影响  的投影方向。   综上所述,  的解为     

判别分析(Fisher判别方法)

最新文章
热门文章
推荐阅读