实际意义

判别分析于聚类分析的功能差不多,区别在于,聚类分析之前,没有人知道具体的是怎么分的类,分了哪几大类。而判别分析是已经把类别给分好,要做的是把没有分好类的数据观测,按照之前分好的类再进行分类。这里不同于生活中常见的分类先有具体的分类逻辑(这里叫做判别函数)。所以判别分的难点在于先由分好类的数据观测找到一个或者多个判别函数,然后对未进行分类的观测按照该判别公式进行分类。

进行判别分析需要满足的条件是:

①每一个判别变量都不能是其他判别变量的线性组合

②各个判别变量之间具有多元正态分布,即控制N-1个变量为固定值时,第N个变量满足正态分布

③满足②条件时,使用参数法计算判别函数,否则使用非参数法计算判别函数。

判别分析方法

距离判别法:D2(X)=(X-μ)22

马氏距离(广义平方距离):W(X)=DB2(X)-DA2(X