Modeling Evaluation and Modification 模型評鑑與修飾

結構方程模式 Structural Equation Modeling Modeling Evaluation and Modification模型評鑑與修飾

模型契合評估（model-fit evaluation） • SEM模型的評估與檢驗，以決定研究者所提出的假設模型是否能夠用以描述實際觀察到的變項關係 • 傳統上以不顯著的卡方值來反應理想的模型契合度 • 卡方考驗來進行統計決策有諸多限制，因此多配合其他指標來進行模型評鑑

模型評估的策略 • 策略一：模型設定的合理性 • SEM的模型與各項參數是否能被順利的辨識、收斂與估計 • 因為假設模型的檢驗是在完成參數估計之後才進行的工作，因此參數估計的順利完成是模型適切性的第一個指標 • 策略二：個別參數的檢視 • 檢查每一個參數的正負號、數值大小是否符合理論預期；或是檢查測量誤差的大小，分析這些殘差項當中是否透露某些變項的測量品質不佳的訊息 • 策略三：契合度指標（goodness-of-fit index）的運用 • 利用統計顯著性考驗檢驗假設模型與實際觀察資料的契合情形 • 策略四：模型修飾的運用 • 利用模型修飾的功能尋找更佳的替代模型

卡方考驗 • 最常用的模型評鑑檢定 • 卡方值由契合函數轉換而來，反應了假設模型的導出矩陣與觀察矩陣的差異程度 • 卡方自由度比（2/df） • 為校正卡方值受自由度大小（模型複雜度）的影響造成的膨脹效應 • 卡方自由度比越小，表示模型契合度越高，卡方自由度比小於2時，表示模型具有理想的契合度

卡方檢驗的相關議題 • 利用卡方分配來進行假設模型的統計檢驗，並無法推翻不良的模型以支持特定的模型，只能確認虛無假設是否成立 • 卡方分配受到自由度的影響，當自由度越大，卡方值越大，卡方值越不能夠用來反應理論模式是否能夠反應觀察資料的程度。 • 卡方分配受到樣本數的影響，當樣本越大，所累積的卡方值也就越大，大樣本雖然提高了觀察資料的穩定性，卻也造成卡方值擴大的效果

模型契合指標： GFI與AGFI • GFI為契合度指標（goodness-of-fit index）的縮寫，類似於迴歸分析當中的可解釋變異量（R2） • 分子是理論假設模型的共變數所導出加權變異數和 • 分母是樣本實際觀察所得到的共變數導出的加權變異數和 • W為加權矩陣 • GFI值越接近1，分子分母越接近，表示模型契合度越高 • AGFI（adjusted GFI）類似於迴歸分析當中的調整後可解釋變異量（adjusted R2），在計算GFI係數時，將自由度納入考慮之後所計算出來的模型契合度指數

模型契合指標： PGFI • PGFI指數考慮到了模型當中估計參數的多寡，可以用來反應SEM假設模型的簡約程度（degree of parsimony） • PGFI指數越接近1，顯示模型越簡單 • Mulaik等人（1989）指出，一個良好的模型，PGFI指數大約在.5以上都是可能的

模型契合指標： NFI與NNFI • 利用巢套模型的比較原理所計算出來的一種相對性指數，反應了假設模型與一個觀察變項間沒有任何共變假設的獨立模型的差異程度。 • 獨立模型（independent model）：觀察變項間設定為沒有任何共變情況的模型，契合狀況最不理想的模型，自由度最大 • 獨立模型導出的卡方值(2indep)是所有可能模型的卡方值之最大值，亦為參照模型(baseline model) • 研究者所提出的模型為比較模型，以2test表示，卡方值會較獨立模型的卡方值為低 • NNFI指數，考量了自由度的影響，類似於前述AGFI對GFI的調整，因此可以避免模型複雜度的影響，

模型契合指標：IFI指數 • Bollen（1989）提出了一個IFI指數（incremental fit index）來處理NNFI波動的問題以及樣本大小對於NFI指數的影響

替代指標 • 替代性指標不再關心虛無假設是否成立，而是去直接估計假設模型與由抽樣理論導出的卡方值的差異程度 • 替代指標直接估計被檢驗模型與理論分配的差異程度，因此可以在中央極限定理的基礎上，以區間估計的概念來進行顯著性考驗。 • 其原理是考慮抽樣誤差對於指數估計的影響，將所計算出來的指數轉換成特定信心水準下（如90%）真實指數出現的範圍。優點是可以反映抽樣誤差的影響。

替代指標：非集中性參數（NCP） • NCP原理類似於離散量數的測量，計算SEM模型估計得到的卡分統計量，距離理論預期的中央卡方分配的離散程度（discrepancy between  and ()） • 當模型越不理想，距離此一中央分配越遠，以幾個標準差（）來表示（即NCP數值）。 • NCP值越大代表模型越不理想，當NCP為0時，代表模型具有完美的契合度 • NCP在90%信心水準下的估計範圍若涵蓋了0，表示模型契合度具有完美的契合度

替代指標：RMSEA指標 • 平均概似平方誤根係數（root mean square error of approximation; RMSEA） • 比較理論模式與完美契合的飽和模式（saturated model）的差距程度。數值越大代表模型越不理想，數值越小代表模型契合度越理想 • RMSEA係數不受樣本數大小與模型複雜度的影響 • RMSEA指數在小樣本時有高估的現象，使契合模型會被視為不理想模型

替代指標：CFI指標 • CFI指標（comparative-fit index） • 反應了假設模型與無任何共變關係的獨立模型差異程度的量數，也考慮到被檢驗模型與中央卡方分配的離散性。 • 其計算原理是以非中央性改善比(the ratio of improvement in noncentrality; 假設模型距離中央卡方分配距離的移動情形)，得出一個非中央性參數(i, noncentrality parameter)，i越大，代表契合度越不理想，i=0時假設模型具有完美適切性

替代指標： ECVI與AIC • 期望交叉效度指標（expected cross-validation index; ECVI） • 反應了在相同的母體之下，不同樣本所重複獲得同一個假設模型的契合度的期望值 • 用來診斷模型的複核效化（cross-validation）的良好指標 • ECVI值越小表示模型契合度的波動性越小，該假設模型越好

替代指標： CN指標 • 關鍵樣本指標（Critical N; CN） • 用以說明樣本規模的適切性 • 其原理是估計若要產生一個適當的模型契合度（不顯著的卡方統計量），所需要的樣本數為多少 • Hoelter（1983）認為當CN指數大於200時，表示該模型可以適當的反應樣本的資料

殘差分析指標 • SEM分析提供兩種殘差的數據 • 非標準化殘差（un-standardized residuals）：假設模型與觀察資料之間差距的原始量數，也就是參數估計無法反應實際觀察資料的變異量（unexplained variance or covariance） • 優點：可以直接應用測量的原始量尺，來了解殘差數值大小的具體意義 • 缺點：不利於相互的比較 • 標準化殘差（standardized residuals）：標準化殘差將殘差量轉換為標準Z分數，因此殘差值將大約落於+3.5至-3.5的區間中

殘差指數：RMR與SRMR • 殘差均方根指數（root mean square residual; RMR）與標準化殘差均方根指數（standardized root mean square residual; SRMR）來反應理論假設模型的整體殘差 • RMR與SRMR越小代表模型越能契合觀察值

信度估計 • 多元相關平方（squared multiple correlation，SMC）數據，反應了個別測量變項受到潛在變項影響的程度 • 當SMC越高，表示真分數所佔的比重越高，相對的，當SMC越低，表示真分數所佔的比重越低，信度越低。 • 全量表的信度可以利用R2的概念來推導

模型修飾（model modification） • 理論模式與觀察資料的契合度不足時，研究者可以利用不同的程序與方法去修正模式，以提高模型的契合度 • 界定搜尋程序（Specification searches） • 檢查、確認並調整一個結構方程模型設定，來改善模型契合度的整個程序

界定搜尋程序的爭議 • 模型修飾使SEM分析失去了驗證性的特性，而帶有探索性的意味 • 透過界定搜尋程序所得到的SEM模型可以說是一個已經不同於原先所提出的模型的新模型 • 界定搜尋程序缺乏客觀的判準 • 何時應進行，何時應終止搜尋，並沒有清楚的界定與共識性作法。利用此一程序進行的調整往往造成過度契合（overfitting model）的情況。 • 技術上的不確定因素

卡方差異檢定 • 檢驗修飾後的模型的卡方值是否顯著的優於未修飾前的模型卡方值，也就是計算修飾前與修飾後的卡方值的差異量，進行顯著性考驗後來決定模型修飾的適當性 • 卡方差異檢定的先決條件是兩個模型必須為巢套模型（nested model），也就是某一個模型必須是另一個模型的簡約模型

概率比檢定（LR）檢定 • 利用巢套模型的概念來偵測模型修飾前後變動的比率是否有意義的檢定方法 • LR檢定為一種卡方差異檢定 • 模型修飾前的模型，稱為未受限模型（nonrestrictive model），模型修飾後的模型，稱為受限模型（restrictive model），兩者分別可以利用最大概率法（ML法）計算出一個概率估計值，分別為（未受限模型概率）、（受限模型概率）

遞增檢定（LM Test） • Lrangian Multiplier Test（LM test）遞增檢定 • 用來檢測個別參數逐次增加後對於模型契合度影響的檢定法 • 以巢套模式的概念來檢驗受限模型與非受限模型的顯著差異，作為判斷特定參數是否應該增加入模型的依據 • LM檢定的主要特色是僅需針對受限模式進行估計，而且每一次僅針對一個最顯著的參數進行估計，比較模型變動前後的差異。

遞減檢定（Walt Test） • 其原理是檢驗當某一個參數被設限之後，對於模型契合度降低的影響程度 • W檢定也是與LM檢定類似，利用最大概似法為基礎，檢測個別參數減少後對於模型契合度影響的檢定法。 • W檢定值大於3.84時，表示該參數自模型移除後對於模型契合度的影響具有意義。

LR、LM、W檢定的比較

Modeling Evaluation and Modification 模型評鑑與修飾