220 likes | 460 Views
因子分析与主成分分析. 电子工业出版社. 提 纲. 1. 基本原理 2. 因子分析 3. 主成分分析 4. 本章小结. 基本原理. 主成分分析( Primary Component Analysis )主要是通过降维过程,将多个相关联的数值指标转化为少数几个互不相关的综合指标的统计方法,即用较少的指标来代替和综合反映原来较多的信息,这些综合后的指标就是原来多指标的主要成分。 主成分分析作为一种探索性的技术,是在分析者进行多元数据分析之前用来分析数据,让自己对数据有一个大致的了解,这对于实际应用是非常重要的。. 基本原理.
E N D
因子分析与主成分分析 电子工业出版社
提 纲 1. 基本原理 2.因子分析 3.主成分分析 4.本章小结
基本原理 • 主成分分析(Primary Component Analysis)主要是通过降维过程,将多个相关联的数值指标转化为少数几个互不相关的综合指标的统计方法,即用较少的指标来代替和综合反映原来较多的信息,这些综合后的指标就是原来多指标的主要成分。 • 主成分分析作为一种探索性的技术,是在分析者进行多元数据分析之前用来分析数据,让自己对数据有一个大致的了解,这对于实际应用是非常重要的。
基本原理 • 主成分分析只是一种中间手段,其背景是研究中经常会遇到多指标的问题,这些指标间往往存在一定的相关,直接纳入分析不仅复杂,使变量之间难以取舍,而且可能因多元线性而无法得出正确结论。主成分分析的目的就是运用线性变换,将原来的多个指标组合成相互独立的少数几个能充分反映母体信息的指标,从而在不丢掉主要信息的前提下,避开了变量之间共线性的问题,便于进一步分析。主成分分析不能被看作是研究的结果,而应继续采用其他多元统计方法以解决实际问题。
基本原理 • 因子分析(Factor Analysis)是主成分分析的推广和发展,也是利用降维方法进行统计分析的一种多元统计方法。因子分析研究相关矩阵或协方差的内部依赖关系,由于它将多个变量综合为少数几个因子,以再现原始变量与因子之间的相互关系,故得到了广泛的应用。
基本原理 • 因子分析的目的是分解原始变量,从中归纳出潜在的“类别”,相关性较强的指标归为一类,不同类间变量的相关性则降低。每一类变量代表了一个“共同因子”,即一种内在结构、因子分析就是要寻找该结构。 • 因子分析一般要求提取出的公因子有实际含义,如果分析中各因子难以找到合适的意义,则可以运用适当的旋转,以改变信息量在不同因子上的分析,最终方便对结果的解释。
基本原理 • 主成分分析和因子分析的标准步骤如下: (1)根据具体问题,判断是否需要进行因子分析,并采用KMO检验及Bartlett’s球形检验来判断数据是否符合分析要求; (2)进行分析,按一定标准确定提取的因子数目; (3)如果进行的是主成分分析,则将主成分存在的新变量用于继续分析,步骤到此结束; (4)如果进行的是因子分析,则考察因子的可解释性,并在必要时进行因子旋转,以寻求最佳解释方式; (5)如有必要,可计算出因子得分等中间指标供进一步分析使用。
因子分析 • 因子分析是多元统计分析的一个重要分支。其主要目的是运用对诸多变量的相关性研究,即可以用假设的少数几个变量来表示原来变量的主要信息,以便浓缩数据(Data Reduction)。
因子分析 • 在理论分析和具体SPSS操作方面,因子分析过程需经过如下几个重要步骤。 (1)因子提取。 (2)因子旋转。 (3)计算因子得分。
因子分析 • 依次单击菜单“分析→降维→因子分析”命令,打开 “因子分析”主对话框
因子分析 • 因子分析:描述
因子分析 • 因子分析:抽取
因子分析 • 因子分析:旋转
因子分析 • 因子分析:因子得分
主成分分析 • 主成分分析的主要目的是希望用较少的变量去解释原来资料中的大部分变异,将我们手中许多相关性很高的变量转化成彼此相互独立或不相关的变量。通常是选出比原始变量个数少、能解释大部分资料中的变异的几个新变量,即所谓主成分,并用以解释资料的综合性指标。由此可见,主成分分析实际上是一种降维方法。
主成分分析 • 在理论分析和具体SPSS操作方面,主成分分析过程需经过如下几个重要步骤: (1)将原始数据标准化,以消除量纲的影响; (2)建立变量之间的相关系数矩阵R; (3)求R的特征值和特征向量; (4)写出主成分并进行分析。
主成分分析 • 依次单击菜单“分析→降维→因子分析”命令,打开“主成分分析”对话框。
主成分分析 • 因子分析:描述统计
主成分分析 • 因子分析:抽取
主成分分析 • 因子分析:得分
本章小结 • 本章对因子分析和主成分分析的基本概念、基本原理和分析步骤进行了简单的概述,重点讲述了SPSS因子分析和主成分分析的基本过程和操作步骤。SPSS因子分析和主成分分析的操作设置对话框较多,输出结果较为复杂,重点是理解共同度表、负荷矩阵表、总方差解释表和因子碎石图的基本含义。