210 likes | 407 Views
Chapter 7. 因素分析. 因素分析的架構(1). 單一共同因子模型 p 個指標及一個共同因子 X 為指標 ξ 為共同因子 ( common factor) ε 則為獨特因子 ( unique factor) λ 為型態負荷 ( pattern loading). 因素分析的架構(2). 假設 X 、ξ 及 ε 的平均數都為 0 , X 與 ξ 的變異數均為1(即二者都是標準化後的變數),且 E(ξε)=0、E(ε i ε j )=0, 則 X 的變異數可以拆解成兩個部份,其中一部份是源自共同因子 ξ, 而另一部份則是來自獨特因子 ε
E N D
Chapter 7 因素分析
因素分析的架構(1) • 單一共同因子模型 • p個指標及一個共同因子 • X為指標 • ξ為共同因子(common factor) • ε則為獨特因子(unique factor) • λ為型態負荷(pattern loading) 多變量分析—管理上的應用
因素分析的架構(2) • 假設X、ξ及ε的平均數都為0,X與ξ的變異數均為1(即二者都是標準化後的變數),且E(ξε)=0、E(εiεj)=0,則X的變異數可以拆解成兩個部份,其中一部份是源自共同因子ξ,而另一部份則是來自獨特因子ε • 源自共同因子的部份恰等於型態負荷的平方,也稱為共通性(communality)。共通性通常可以用來檢視指標是否為該共同因子的一個可靠測量(measure),共通性愈大,則該指標愈具有代表性 • 指標Xi與共同因子ξ之間的相關係數為 • 指標與共同因子間的相關係數恰等於型態負荷,而此一相關係數一般也稱之為該指標的結構負荷(structure loading) • 任兩個指標Xi與Xj相關係數恰等於二者型態負荷之乘積 多變量分析—管理上的應用
因素分析的架構(3) • 多共同因子模型 • 假設有p個指標及q個共同因子 • 如果所有的q個共同因子相互之間沒有相關,稱為正交(orthogonal)模型,否則稱為斜交(oblique)模型 • λpq為第p個指標在第q個共同因子的型態負荷 • 矩陣的型式 • X是(p×1)的指標向量,Λ是( p×q)的型態負荷矩陣,ξ是(q×1)的共同因子向量,而ε則是( p×1)的獨特因子向量 多變量分析—管理上的應用
因素分析的架構(4) • 假設共同因子與獨特因子間是無關的,且指標、共同因子的平均數都為0、變異數均為1,則指標間的相關係數矩陣R為 • R等於共變異矩陣,Φ是共同因子的相關係數矩陣,Ψ是獨特因子變異數所組成的對角矩陣(diagonal matrix)。如果是正交模型,Φ為一單位矩陣(identity matrix),上式則可縮減為 • 指標與共同因子間的相關性(以共變異數表示)為 • 正交模型而言,因為Φ=I,因此A=Λ。其型態負荷矩陣(Λ)等於結構負荷矩陣(A) • R-Ψ=ΛΦΛ’矩陣中的對角線數值即為各指標的共通性 多變量分析—管理上的應用
因素分析求解的相關問題(1) • 兩個指標及兩個共同因子的情況 • 對X1而言,λ11、λ12及e1分別是向量X1在ξ1、ξ2及ε1軸上的投影,而向量X1、X2長度(端點至原點的距離)的平方為 • 上式中,λ112+λ122為指標X1的總共通性,λ212+λ222為指標X2的總共通性,而e1與e2則在共通性決定後便會跟著確定 多變量分析—管理上的應用
因素分析求解的相關問題(2) • 如果e1與e2已確定,則向量X1與X2可以用二度空間的座標來表示 • 圖7-3中的座標軸ξ1和ξ2如果整個依逆時鐘方向旋轉一個角度,則在向量X1與X2 的方向、長度不變下,其總共通性也不會改變,改變的只是X1與X2在新因子軸上的共通性 多變量分析—管理上的應用
實例與應用7-1 • 共通性 • 特徵值與解釋變異 多變量分析—管理上的應用
實例與應用7-1 • 因素負荷 旋轉後因素負荷 • 各個變數的共通性在旋轉前後並不會改變 多變量分析—管理上的應用
因素分析的目的 • 找出導致一組指標變數間具有關聯的潛在共同因子並加以適當的詮釋 • 經由因子轉軸、估計確認各指標之結構負荷、型態負荷、共通性及獨特性等 • 估算各觀測值針對各共同因子的因子分數(factor score),以利後續的分析(如將觀測值分群或分類) 多變量分析—管理上的應用
因素分析的估計方法 • 主成份法(principle components factoring,PCF) • 假設有五個變數,X1、X2、X3、X4及X5,則其最多可以組五個主成份--ξ1、ξ2、ξ3、ξ4、ξ5 • (a11 a12 a13 a14 a15)’是第一主成份ξ1對應的特徵向量,(a21 a22 a23 a24 a25)’是第二主成份ξ2所對應的特徵向量,以此類推 • 標準化後的主成份 多變量分析—管理上的應用
主成份法 • 各主成份的標準差等於特徵值開方 • 假設前面兩個主成份已解釋全部變數變異的一定比例以上,因此只要保留兩個主成份即可 多變量分析—管理上的應用
因素分析的估計方法 • 主因素軸法(principle axis factoring,PAF) • 主因素軸法是一種利用反覆計算以估計共通性及其解的方法 • 主因素軸法估計步驟 • 設定各指標的共通性初始值為1,以指標之相關係數矩陣及主成份法估計。決定了共同因子的個數後,計算結構及形態負荷,然後再計算各指標之共通性 • 計算各指標共通性與初始共通性之間的差,將其中最大者與事先設定的收斂範圍比較 • 如果步驟2的最大值比設定的收斂範圍大,則將指標間相關係數矩陣對角線的值(原來均為1)以步驟1所估計得到的共通性取代,並以此新的相關係數矩陣再應用主成份法估計,然後估計得到各指標新的共通性估計值 • 計算新的共通性估計值與之前步驟1所得估計值的差,然後取最大值與設定的收斂範圍比較,如果還是大於收斂範圍,則重覆步驟3,直到新的共通性估計值與前一次估計值間差的最大值小於收斂範圍為止 多變量分析—管理上的應用
共同因子個數的選取 • 設定總解釋變異比例需達某一水準 • 取到第m個因子,此因子的特徵值恰比所有特徵值的平均值相等或大一些;如果使用相關係數矩陣進行分析,則選取特徵值大於1的共同因素 • 利用特徵值繪製陡坡圖,假設自第m+1個特徵值開始,陡坡折線開始變得較為平坦,則m個共同因子即為所求的數目 • 利用平行法(parallel procedure) • 若資料屬於多變量常態分配,可利用最大概似法進行共同因子的選取;也可利用Akaike’s information criterion (AIC) 及Schwarz’s bayesian criterion (SBC),做為判斷指標;若選取到第m個共同因子時,其AIC值或是SBC值最小,則m為最適的共同因子個數 多變量分析—管理上的應用
因素分析結果與資料適合度之判定 • Kaiser-Meyer-Olkin Measure of Sampling Adequacy (KMO或是稱為MSA) • KMO愈高代表資料愈適合做因素分析,最好是能夠高於0.8,若KMO小於0.5,表示資料不適合做因素分析 • 平均殘差 • 平均殘差小於0.05,則表示此資料適合因素分析 • 相關係數矩陣 • 如果變數之間的相關性很低,表示彼此間的共同因子很少,不適合做因素分析 • 偏相關係數矩陣 • 如果發現偏相關係數值很大,則通常應考慮增加萃取因素的個數 多變量分析—管理上的應用
因素解非唯一的原因 • 共通性估計 • 共通性的估計和獨特因素的估計具有循環的關係,因此會造成共通性的估計問題 • 因素旋轉 • 將原來的因素負荷矩陣乘上一個正交矩陣T(TT’=I)後仍為因素解 • 因素旋轉方式 • 正交旋轉法(orthogonal rotation) • 將原來的因素負荷矩陣乘上一個正交矩陣,故因素間仍互相獨立 • 斜交旋轉法(oblique rotation) • 斜交轉軸後因素之間則不再為獨立關係 多變量分析—管理上的應用
變異最大旋轉法 • 假設未旋轉前的因素負荷矩陣如下 • 變異最大旋轉法的主要目的是希望將原始因素負荷矩陣乘上一個正交矩陣T後,能使每一變數僅在單一因素具有很高的負荷,而在其餘因素的負荷則趨近於0 • 因素經旋轉過後,其共通性並不會改變 • 變異最大旋轉法的公式 • m為共同因子個數 • Max 多變量分析—管理上的應用
四方最大旋轉法 • 希望將原始因素負荷矩陣乘上一個正交矩陣T後,能使每一列的因素負荷平方變異數達到最大 • 將每一列的變異數加總後可得 • Max 多變量分析—管理上的應用
直交轉軸與斜交轉軸 • 實例與應用7-2 多變量分析—管理上的應用