310 likes | 532 Views
因素分析方法的整合. ---- 结构效度的一种计算方法. 传统的因素分析是探索性的因素分析( Exploratory Factor Analysis ,以下简 称 EFA ), 现代统计方法增加了验证性的因素分 析( Confirmatory Factor Analysis, 以 下简称 CFA )。. 一、探索性因素分析( EFA ). (一) EFA 实施过程中的方法问题
E N D
因素分析方法的整合 ---- 结构效度的一种计算方法
传统的因素分析是探索性的因素分析(Exploratory Factor Analysis,以下简 • 称EFA), • 现代统计方法增加了验证性的因素分 • 析(Confirmatory Factor Analysis,以 • 下简称CFA)。
一、探索性因素分析(EFA) • (一) EFA实施过程中的方法问题 • 因素分析既是一种重要的数学方法,又是一种理论,它是以心理原子论或机能论为基础的。同时,因素分析也是一种多元分析的方法,即通过对一组测验进行分析,进而发现隐藏在其中的潜在因素。 • 与其它的统计方法不同,EFA的实施过程中需要研究者作出一系列重要的决策。具体而言,至少有以下6个方面的问题需要考虑。
1.研究设计问题 • (1)对于EFA而言,最重要的设计问题是测量变量的选择问题。公共因素必须包括在测量变量中,且测量变量一定要与研究领域紧密相关。如果测量中包括的变量不充分,公共因素将不具有代表性。更进一步,如果测量的变量与研究目的不相关,将导致假的公共因素的出现。 • 统计学家建议,测量变量的数目至少应该是公共因素数的3—5倍。因此,研究者首先应该考虑期望抽取多少公共因素,从而决定设置多少测量变量。
(2)第二个重要的设计问题是样本的选择。研究者必须决定样本的容量大小以及如何抽取样本。统计学家建议,根据测量的变量数决定样本的容量(变量的数目越多,需要的样本容量越大)。关于这一点,也有不同意见。例如,Gorsuch建议,应达到一个测量项目对应5个被试的标准,且样本容量不得少于100。Nunnally和Everitt建议,此比例要达到10∶1。而近期的研究则认为,以上建议是不充分的。主要是因为,样本容量并非测量变量的函数。当公共因素确定过多时,公共贡献率必然提高。因此,即使测量特性好的,被试数也至少要达到200以上。据Comrey 和Lee(1992)研究,在因素分析中,样本容量达到500为非常好,1000或更多则极好。
但样本容量并非影响参数估计的唯一标准。研究者还应该考虑样本的特性。研究者往往根据方便性选取样本,这通常不会出现问题。然而,如果样本过于一致,可能会限制测量的范围,从而导致变量间相关的改变。这种改变会导致因素负荷估计的失真。另外,选择偏差对单个变量而言也会产生项目质量分析的偏差最终出现失真结果。因此,研究者应该选择差异大一些的被试,并使其在测量变量上的方差达到最大。但样本容量并非影响参数估计的唯一标准。研究者还应该考虑样本的特性。研究者往往根据方便性选取样本,这通常不会出现问题。然而,如果样本过于一致,可能会限制测量的范围,从而导致变量间相关的改变。这种改变会导致因素负荷估计的失真。另外,选择偏差对单个变量而言也会产生项目质量分析的偏差最终出现失真结果。因此,研究者应该选择差异大一些的被试,并使其在测量变量上的方差达到最大。
2.决定EFA是否为合适的研究方法 • EFA的目的是以一组更少的公共因素来代表和解释更多的测量变量。也就是说,当研究者希望验证一组测量变量中的潜在变量时,才能使用EFA。 • 在作出这一决定时,重要的是区别验证潜在结构与数据的归类是不同的。数据归类是用更少的一组组合数据来代替更多的测量变量,而尽量保持原来变量的信息,它并不希望构建原有变量相关系数的结构模型。这一区别是重要的,因为要达到这两个目标需要采取不同的方法。如果目标是寻找简单结构,EFA是合适的;如果目标是数据归类,主成分分析(Principal Components Analysis,以下简称PCA)更加合适。
EFA是建立在公共因素模型之上的,这一模型假定,一系列测量变量之中的每一变量都是一个或多个公共因素和一个唯一性变量的线性函数。公共因素是不能观察的潜在变量,但它会影响多个测量变量并解释它们之间的相关,唯一性因素是那些仅仅影响一个测量变量的潜在变量。通常假定唯一性因素含有两个成分:一个特定的因素成分和测量误差成分。
3.选择适合模型的程序 • 假如EFA是最合适的方法,接下来就是选择提取因素的程序。应用最广泛的方法有极大似然估计法(Maximum Likelihood,简称ML)、主因素法等等。ML的主要优势在于,它允许计算模型拟合程度指数的更宽的范围。其局限性主要是要服从多元正态分布。否则,结果会出现偏差。
4.确定抽取公共因子的数目 • 在进行EFA时,研究者必须决定模式中包含的因素数。一般认为,抽取因素太少比抽取因素过多会产生更为严重的误差(Cattell,1978;Thurstone,1947)。经验上的研究支持了这一说法。但不管是多估或是少估因素数,都是不好的。
关于如何确定因素数,其中最著名的是Kaiser 的计算特征值的标准。此法是先计算相关矩阵的特征根,以1为标准,有多少特征值大于1,就有多少个公共因素(Gorsuch,1983)。这一方法具有简单性和客观性。但也存在明显问题:首先,它通常得到误用。很多情况下,用缩减的相关矩阵的特征根代替了非缩减的相关矩阵的特征根。其次,此标准带有机械性。如特征根为1.01就能成为公共素而0.99的则不是。最后,它可能导致过多估计偶尔又会过少估计因素数。另外,采用这种方法时,样本容量也会影响因素数。
另一著名的确定因子数的方法是“碎石检验”(“scree test”)。在这一程序中,先计算相关矩阵的特征值后按照递减的顺序画图,然后检查图形中的“拐点”,处于“拐点”以下的特征根的数目即为因素数。这一程序通常用于非递减的相关矩阵。但这一方法的主观性太强。首先是关于拐点的概念没有明确的定义; • 其次,当“碎石图”比较模糊时,没有清晰的拐点,此时难以判断何处是拐点;另外,此法缺少数量上的标准。
第三个确定因子数的方法是“平行分析”。即将来自样本数据的特征值与来自完全随机的模拟数据(当然,样本容量与变量数同真正的样本)的特征值进行比较。在取出相同公共因素的前提下,如果来自样本的公共因素的特征值大于来自随机性数据的特征值,则结果是较为理想的。第三个确定因子数的方法是“平行分析”。即将来自样本数据的特征值与来自完全随机的模拟数据(当然,样本容量与变量数同真正的样本)的特征值进行比较。在取出相同公共因素的前提下,如果来自样本的公共因素的特征值大于来自随机性数据的特征值,则结果是较为理想的。 • 另外,还可采用对再生矩阵进行检验的方法;也有人提出,因素数的确定以所有因素的贡献率之和达到总方差的75%至80%为好;还有人认为,因素数应在n/5至n/3之间(n为测量变量的数目)。而且不断有新的方法问世。
5.因素的旋转问题 • 多于一个因素的EFA模型不存在唯一解,研究者必须从众多恒等的合适解中选择一个单一解。在EFA中最常用的选择标准是塞斯顿(Turstone,1947)提出的“简单结构”(simple structure),他提出了符合简单结构准则的五个条件。他还认为,对于数学上恒等的解集,带有最好的“简单结构”的解应该是最容易解释的、最充满心理意义的和可复制的。
为了获得“简单结构”,对因素进行旋转是必要的。实际上,旋转就是转换因素轴,在转换的过程中,各变量的相对位置没有发生变化,只是参照点改变了,前后的变化仿佛是从不同角度观察同一事物似的。通过转轴使因素负荷都成为正的了,特别是使因素负荷发生了变化。由于值为零的因素负荷数目的增多,形成了简单的结构,这就使得因素更容易辨认、说明与命名。为了获得“简单结构”,对因素进行旋转是必要的。实际上,旋转就是转换因素轴,在转换的过程中,各变量的相对位置没有发生变化,只是参照点改变了,前后的变化仿佛是从不同角度观察同一事物似的。通过转轴使因素负荷都成为正的了,特别是使因素负荷发生了变化。由于值为零的因素负荷数目的增多,形成了简单的结构,这就使得因素更容易辨认、说明与命名。
旋转有正交旋转与斜交旋转的区别。正交旋转,在理论上是假定被分析出来的因素是相互独立的。一些研究者认为正交旋转具有简单性和概念清晰性,但实际并非如此。首先,在心理学研究的建构中(如心理能力、个性倾向、态度),不管是从理论上还是经验中都认为这些建构之间存在相关。其次,因为正交旋转需要因素旋转900,正交旋转可能对于那些存在相关的因素产生较差的简单结构。最后,斜交旋转比正交旋转能提供更多的信息。斜交旋转能提供因素间相关的估计。这对解释公共因素的概念特性是有用的。旋转有正交旋转与斜交旋转的区别。正交旋转,在理论上是假定被分析出来的因素是相互独立的。一些研究者认为正交旋转具有简单性和概念清晰性,但实际并非如此。首先,在心理学研究的建构中(如心理能力、个性倾向、态度),不管是从理论上还是经验中都认为这些建构之间存在相关。其次,因为正交旋转需要因素旋转900,正交旋转可能对于那些存在相关的因素产生较差的简单结构。最后,斜交旋转比正交旋转能提供更多的信息。斜交旋转能提供因素间相关的估计。这对解释公共因素的概念特性是有用的。
为克服上述理论上的缺陷,取得良好的旋转效果,要采用斜交旋转的方法。斜交旋转比正交旋转更常用,因为它不强制因素必须是独立的。斜交旋转产生两个矩阵,模式矩阵和结构矩阵。模式矩阵是一个简单的结构排列,是决定哪一因子代表哪些变量的基础。模式矩阵中包含的因子负荷量通常在研究报告中会给出,“它……反映了因素到变量之间的清楚的关系,这种关系在统计上是独立于任何其它因素的。”(Gorsuch, 1983)。结构矩阵是变量与因素之间的相关系数的矩阵。Gorsuch(1983)相信,两个矩阵对解释因素结构都是必要的。
应当注意的是,斜交旋转允许因素间存在相关,但并不强求因素间一定相关。一种错误的概念是斜交旋转要求因素间相关,实际上并非如此。假如带有最好的简单结构的特定解包含正交因素,那么一个成功的斜交旋转将提供因素间相关接近于0的估计,并产生一组非常类似于正交旋转的解。然而,如果最好的简单结构是带有相关因素的,斜交旋转能提供带有相关因素的解。因此,在心理学研究中采用斜交旋转应该更适合研究对象的特点。应当注意的是,斜交旋转允许因素间存在相关,但并不强求因素间一定相关。一种错误的概念是斜交旋转要求因素间相关,实际上并非如此。假如带有最好的简单结构的特定解包含正交因素,那么一个成功的斜交旋转将提供因素间相关接近于0的估计,并产生一组非常类似于正交旋转的解。然而,如果最好的简单结构是带有相关因素的,斜交旋转能提供带有相关因素的解。因此,在心理学研究中采用斜交旋转应该更适合研究对象的特点。
6.因素的命名问题 • 因素的数目确定以后,接下来的问题就是给所抽取的因素进行命名。实际上,这一问题已超出EFA的范畴,而成为所研究领域的一个专业问题,这是统计学家所无能为力的。 • 多数研究者是根据自己对在某因素上有高负荷的分测验的心理过程的主观推测来解释该因素。由于用于进行因素分析的分测验的心理意义一般不明显,因而研究者的主观推断往往会带有较大的随意性,不同的研究者对同一测验的心理过程的看法会相距甚远,由此导致对因素解释的任意性。
当然,上述的六个问题并非因素分析本身所固有的,如量表的质量问题、因素的命名问题以及正交或斜交旋转的问题等,关键原因在于研究变量的不同特点。由于教育、心理研究中研究变量的特殊性,教育与心理研究中的数据具有与自然科学研究变量非常不同的特点,因此我们在进行研究时要注意研究方法的适用性。当然,上述的六个问题并非因素分析本身所固有的,如量表的质量问题、因素的命名问题以及正交或斜交旋转的问题等,关键原因在于研究变量的不同特点。由于教育、心理研究中研究变量的特殊性,教育与心理研究中的数据具有与自然科学研究变量非常不同的特点,因此我们在进行研究时要注意研究方法的适用性。
二、CFA的特点与实施步骤 • (一)CFA的特点 • CFA的基本思想是:研究者首先根据先前的理论和已有的知识,经过推论和假设,形成一个关于一组变量之间相互关系的模型。 • 由于在社会和行为研究中,许多变量都是不可直接观察的或只是研究者的理论构思,因此模型中多数变量可能属于潜变量。为了使潜变量能有效、可靠地得到表现,就应该对每个潜变量选用多种指标变量进行测量。经抽样测查后,获得一组观测变量的数据和基于此数据而形成的协方差矩阵,这个协方差矩阵是进行验证性分析的基础。
在CFA中,研究者首先要根据已有的经验或其它有关信息判定公共因素数的值,同时还需针对问题的实际情况将模型中的某些参数设定为某一定值。模型一经界定就可根据观测数据的协方差矩阵估计出各个参数,并进行模型对观测数据的拟合性检验。如模型不能被接受,则需要对设定的模型进行修正(王权,2000)。在CFA中,研究者首先要根据已有的经验或其它有关信息判定公共因素数的值,同时还需针对问题的实际情况将模型中的某些参数设定为某一定值。模型一经界定就可根据观测数据的协方差矩阵估计出各个参数,并进行模型对观测数据的拟合性检验。如模型不能被接受,则需要对设定的模型进行修正(王权,2000)。 • 因此,与EFA不同,CFA的目的是利用变量的实测数据来验证假设模型的有效性。如果经过检验,初始假设模型不能接受时,若要进一步确认问题的真实结构,可对初始模型作出修正,然后用实测数据再加以验证。
(二)实施CFA的基本步骤 • 在实施CFA的过程中,有如下基本步骤: • 1.建模 • 实施CFA,首先要针对问题选定公共因素数和设定模型中的固定参数和自由参数,决定一个确定性模型。 • 2.估计自由参数 • 估计自由参数最常用的方法是“极大似然估计”(ML),其它估计自由参数的方法有“未加权最小平方法”(ULS)、“一般最小平方法”(GLS)和“一般加权最小平方法”(WLS)。
3.检验模型的拟合度 • 模型对观察数据的拟合程度,用拟合度指标来表示。通常把拟合指数分为三类。一类是“拟合优指数”(Goodness of fit index)。另一类拟合优指数称为“增值拟合指数”(Incremental fit index)。第三类拟合指数叫“失拟指数”(Lack of fit index)。每类指标都有相应的评价标准,实际分析时,应该根据各个指数的量值综合考虑而作出判断。
4.修正模型 • 在CFA的输出结果中,还报告了“修正指数”(MI)和“期望改变量”(CH)。模型中的每个固定参数或约束参数(指限定在某一区间内的参数)均相应地有一对MI和CH。可以根据有关标准对模型作出修正。 • 总之,CFA目前已成为心理学和社会、行为科学各领域最强有力的研究手段之一,它是理论发展的重要工具,能促使研究者细致、认真地考虑研究的理论构思与变量结构,使研究更为严密并富有理论与实际意义。
三、EAF与CFA的整合 • 实际上,CFA与EFA是研究过程的两个阶段,不能截然分开,两者结合运用能够相得益彰,使研究更有深度。Anderson(1990)建议,在发展理论的过程中,先通过探索型分析建立模型,再用验证型分析去检验和修正模型。例如,在一个样本中先用EFA找出变量的因素结构,再在另一个样本中用CFA验证和修改,这个程序称为交叉证实(cross-validation)。其实,二者的关系是既有联系又有区别,是一个事物对立统一的两个方面。
就二者的联系而言。首先,EFA与CFA都是建立在公共因素模型上的,且都是寻找测量变量之间相关结构的代表,并通过一组潜在变量来表示。就二者的联系而言。首先,EFA与CFA都是建立在公共因素模型上的,且都是寻找测量变量之间相关结构的代表,并通过一组潜在变量来表示。 • EFA是长期建立起来的统计方法,它提供了发现模型以验证假设的概念和计算工具,其提供的结果为CFA建立假设提供了重要的基础和保证。缺乏了EFA和CFA中的任一个,因素分析都是不完整的(John,1997)。
从二者的区别来看。EFA 主要是一种“数据—驱使”(data-driven)的方法。事先没有特定的公共因素数以及较少公共因素与潜在变量间的限制。EFA主要提供来自于数据的程序以决定合适的因素数以及因素负荷的模型。相反,CFA需要研究者给出一些假设,比如特定的因素数,因素负荷的模型,且这些假设可能是不同的。在提出假设的过程中,EFA提供了非常重要的前提基础。CFA的主要目的是验证这些假设成立与否。
通常需要将EFA和CFA结合起来使用。EFA可以为CFA提供假设模型的基础。如果样本容量足够大的话,可以将之随机分成两半,先对一部分进行EFA,为另一部分做CFA提供基础和假设,而另一部分数据则用来验证哪种假设模型拟合程度更好一些(Leandre,1999)。通常需要将EFA和CFA结合起来使用。EFA可以为CFA提供假设模型的基础。如果样本容量足够大的话,可以将之随机分成两半,先对一部分进行EFA,为另一部分做CFA提供基础和假设,而另一部分数据则用来验证哪种假设模型拟合程度更好一些(Leandre,1999)。 • 总而言之,EFA与CFA是因素分析(FA)的两个不可分割的重要组成部分,其整合本身只不过是还其本来归属,尤其对教育与心理研究是非常必要的。
四、结构效度的一种估计 • 关于量表的结构效度问题,王权教授认为,假设我们从一测验中抽取了若干公共因素,如果这些因素就是测验所要测量的行为属性,则各公共因素的“方差贡献”(variance contribution)的大小正好反映了这份测验所能测到该行为属性的程度。因此,在这种情况下,各因素的“方差贡献率”之和可作为该测验的效度指标,心理测量学称之为“结构效度”(construct validity)(王权,1993,P7。漆书青等,1998,P370-379)。