主成分分析,主成份是原始变量的线性组合,在考虑所有主成份的情况下主成份和原始变量间是可以逆转的。即“简化变量”,将变量以不同的系数合起来,得到好几个复合变量,然后在从中挑几个能表示整体的复合变量就是主成份,然后计算得分。

因子分析,公共因子和原始变量的关系是不可逆转的,但是可以通过回归得到。是将变量拆开,分成公共因子和特殊因子。过程是:因子载荷计算,因子旋转,因子得分。

主成份分析

主成份分析需要知道两变量之间的相关性,生成协方差举证和相关新矩阵,对应的生成的新向量矩阵Y还有特征值λi,对应是第I个新向量对总体信息的贡献率为λi/(λ1+λ2+...+λn),对应的还有一个累积贡献率。

确定主成份的个数的方法有:特征值大于1(要求原始数据的每一个变量至少能贡献1各单位的变异)、陡坡检验法(陡坡图中开始平坦的点之前的点的个数)、累积解释变异比例法(即(λ1+...+λi)/(λ1+λ2+...+λn)>70%)。

同时也可以知道主成分分析对应的几个难点①是使用协方差矩阵还是相关系数矩阵②如何确定主成份的个数。当数据中不同变量的度量单位不同并且数值相差较大就用标准化后的相关系数矩阵,当数值相差不大并且指标的权重不一样时,考虑用协方差矩阵。对于个数的确定就是我们一些边界问题是否1左右的也可以囊括进主成份中,是否难以确定开始变平坦的是那个点,是否70%不够。等几个问题。

主成分分析可以用两个过程步完成PROC FACTORS 、PROC PRINCOMP。后者能处理的数据量大一些,效率高一些,,前者输出的内容丰富些,还可以做旋转因子。

延伸阅读

学习是年轻人改变自己的最好方式-Java培训,做最负责任的教育,学习改变命运,软件学习,再就业,大学生如何就业,帮大学生找到好工作,lphotoshop培训,电脑培训,电脑维修培训,移动软件开发培训,网站设计培训,网站建设培训学习是年轻人改变自己的最好方式