1 / 68

CH5 — Exploratory Factor Analysis

CH5 — Exploratory Factor Analysis. 5.1 前言. 接續前一章主成分分析,本章所討論的主題為探索性因素分析。 兩種方法的基本概念是類似的,其共同目的均為縮減構面,然而兩者的基本模型不同。探索性因素分析的模型稱為共同因素模型 (Common factor model) 。 共同因素模型是把每一個原始變數的變異數歸由一組共同因子 (common factors) 與一獨特因子 (a single specific factor) 分別解釋. Common Factor Model. Principal Components Model.

hina
Download Presentation

CH5 — Exploratory Factor Analysis

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. CH5—Exploratory Factor Analysis

  2. 5.1 前言 • 接續前一章主成分分析,本章所討論的主題為探索性因素分析。 • 兩種方法的基本概念是類似的,其共同目的均為縮減構面,然而兩者的基本模型不同。探索性因素分析的模型稱為共同因素模型(Common factor model)。 • 共同因素模型是把每一個原始變數的變異數歸由一組共同因子(common factors)與一獨特因子(a single specific factor)分別解釋

  3. Common Factor Model Principal Components Model

  4. 5.1 前言(續) • 探索性因素分析的目標是辨識共同因子,並解釋其與原始變數間的關係。 • 共同性因素模型提供了一個明確的架構,可使我們去評估原始資料的量測性質。 • The lower the error variance, the more reliable the measure • 另外,我們可運用轉軸(rotation)的方法來幫助因素分析結果的解釋

  5. 5.1.1 可能的應用 • 使用主成分分析的應用,大多可使用探索性因素分析。 • 以下有兩個應用探索性因子分析的例子。 • 第一個例子為:辨識”潛在特性”(Latent Traits )或”無法觀察之特性”(Unobservable Characteristics) • 第二個例子為:使用因子分數於相依分析

  6. 例(一):辨識”潛在特性”或”無法觀察之特性”例(一):辨識”潛在特性”或”無法觀察之特性” • 一般而言,實體特徵(例如,長度或重量….等)是可被明確衡量(measure),但是,有些潛伏特性或無法觀察之特性(例如,態度、信念、知覺、滿意度、忠誠度 …等)卻是無法直接衡量,故如何明確辨識此種潛伏特性便是一項重要的課題。 • Concept (or construct) • research variable, usually unobservable • Use several question items (observable variables) to measure indirectly

  7. 例(一):辨識”潛在特性”或”無法觀察之特性” (續) • 在行銷上,研究者可能有興趣在一些特性上(例如,顧客滿意度) ,並探討此種特性如何被企業的營運活動所影響。 • 僅僅使用單一問題項,去準確測量顧客滿意度是有很困難的,故研究者會設計一數個問題項,每一問題項都僅能捕捉顧客滿意度的部份特性。

  8. 例(一):辨識”潛在特性”或”無法觀察之特性” (續) • Aaker(1997)使用探索性因素分析去辨識不同人格特質(Personality traits)。 • Aaker要求受訪者回答114種人格特質(原始變數),使用五點尺度(Five-point scale) • 最後Aaker選了五個共同因子,且此五個共同因子的解釋能力超過90%。 • 經過轉軸後,其將這五各共同因子命名為:誠實(Sincerity),興奮(Excitement),能力(Competence),有教養(Sophistication) ,粗魯(Ruggedness),<參表5.1>。

  9. 表5.1

  10. 例(二):在相依分析中使用因子分數 • Roberts(1984)研究162個顧客關於購車時所考量的因素,可區分成九類:奢侈(luxury),外型(style),穩定度(reliability),耗油程度(fuel economy),安全性(safety), 維修(maintenance),品質(quality),耐用度(durable),性能(performance) 。 • 他的最終目的是為了建立一個顧客購車時考量因素之模型,然而, 受限於模型的自由度,因此,他決定採用因子分析去找出少數幾個共同因子。

  11. 例(二):在相依分析中使用因子分數 (續) • 最後Roberts(1984)選了二個共同因子,且此二個共同因子的解釋能力超過60%。 • 接著,利用轉軸,使因子的命名更為容易。這兩個因子命名為動人的(Appealing)與實用的(Sensible)。 • 原始變數與因子之間的相關系數,稱之為factor loadings,參表5.2, 高係數者標有底線。

  12. 表5.2

  13. 5.2 探索性因素分析之原理

  14. 5.2.1 直覺 • Holzinger and Swineford(1939)對一些學生進行智力測驗的研究,此測驗主要是對七、八年級的學生(n=145) ;此測驗包含成五個測驗項目: 文法理解(PARA),造句能力(SENT),字義了解(WORD),加法(ADD),算數(DOTS)。用變數X1到X5 來表示上述五個測驗項目。 • 相關係數矩陣在表5.3

  15. 表5.3

  16. 5.2.1 直覺 (續) • 利用因素分析,此處我們的假設是每一個所觀察到的測試分數(X1~X5 ),可分解為一組的共同因子與一個獨特因子。 • 首先假定學生的測驗分數中只有一個共同因子存在, 以符號ξ表示,此共同因子反映了每個學生的智能。 • 在單因子的模式中,第i個測驗的分數(Xi)是共同因子ξ與獨特因子 的函數 • 為每一項測驗(xi) 所獨特擁有的一個成份

  17. 圖5.2

  18. 如果以方程式來表達的話,為 • 在方程式中 表示X反映共同因子的程度 • 在此方程式中,假設Xi與 已經過標準化(平均數為0,變異數為1),故Xi的變異數可以表示為 (5.1)

  19. 因為變數已標準化,λi可解釋為相關係數。 λi2為共同因子ξ可解釋Xi變異的程度,我們稱之為Xi的共同性(communality) 。Xi的剩餘變異我們用獨特因子來解釋。 • 若我們使用 來表示獨特因子的變異數,因此Xi的共同性會等於 • 當Xi的共同性趨近於1,共同因子就可完全捕捉到 Xi。

  20. 二因子模型 • 學生的測驗成績也可能存在兩個共同因子,我們可用ξ1 和ξ2表示語言能力與數理能力。因此二因子模型可用下列式子表達:

  21. 二因子模型 • 在此模型中,每個測驗的共同性為所有factor loading的平方和,因此,共同性可表示為 • 在這個例子中,我們可能可以發現,某一個學生會有較好的數理能力(high ),與較差的語文能力(low )

  22. 解答過程 • 我們假設 ,因此,共同性會等於 , 所以特徵值為:λ1=2.187 λ2=1.022 λ3=(-0.135) λ4=(-0.089) λ5=0.015 • 在這個例子中,獨特因子的變異數為0.5+0.5+0.5+0.5+0.5=2.5,佔原來五個測驗分數總變異的50%(2.5/5.0) ,而共同因子可解釋的變異數也為2.5,亦為50%。

  23. 接下來我們要討論究竟需要幾個共同因子? 我們的目標是盡量使用最少的共同因子來解釋最多的變異數。 兩個因子的結果顯示在表5.4中

  24. 表5.4

  25. 如果我們沒有對於資料中的衡量誤差事前沒有充分認知,則我們應如何估計初步的共同性?如果我們沒有對於資料中的衡量誤差事前沒有充分認知,則我們應如何估計初步的共同性? • 一個被廣泛使用的方法為SMC (squared multiple correlation)。 • 此方法是一個變數可被其他變數解釋的能力。例如:我們希望使用SMC作為X1的初步共同性估計,則我們拿X1與其他剩餘的變數X2-X5作回歸,並使用R2當作共同性的值。(如表5.5所示)

  26. 表5.5

  27. 轉軸後的結果 • 一個有效的共同因素模型有無限多的解,每個解對於所觀察的共變異矩陣的解釋能力均相等。 • 故我們試圖藉由轉軸(rotation)簡化factor loadings矩陣,使能更清楚的解釋共同因素。 • 最受歡迎的轉軸是基於Thurstone(1947)簡單結構(simple structure)的原理

  28. 轉軸後的結果 • Thurstone(1947)相信此簡單結構(simple structure)的大部分內容可能影響許多潛伏或不可觀察之因子。 • 他也假設任何單一可觀察之變數將只與一個或少數不可觀察之因子相關;且任何單一因子將只與一些變數相關。 • 一般而言,我們希望共同因子有幾個相對較高的loadings(無論正或負) ,而大部分其他loadings則趨近於零

  29. 轉軸後的結果 • 一個描述簡單結構的假說例子可參考表5.6和圖5.4。 • 此例子是描述顧客在購買止疼藥時會考量的六種因素(屬性): • 1.不會產生胃痛 • 2.無不好的副作用 • 3.止疼 • 4.藥效迅速 • 5.保持清醒 • 6.提供有限的疼痛解除

  30. 轉軸後的結果 • 表5.6顯示轉軸前兩個共同因子的結果,對應圖5.4(a),不難發現loadings的解釋能力是差的。 • 而表5.6轉軸後的結果,對應圖5.4(b),則因為極大化與極小化loadings,而可清楚解釋兩個共同因子的屬性為何。

  31. 表5.6

  32. 5.2.2 Mechanics 主成份分析

  33. 5.2.2 Mechanics (續) 探索性因素分析

  34. 共同因素模型之假設

  35. 5.2.2 Mechanics (續)

  36. Rotational indeterminacy • In PCA, we choose each component in sequential fashion to account for the maximum possible amount of variation in our original data, subject to the constraint of being uncorrelated with all previously selected components. This ensures a unique solution. • With the common factor model, we impose no such constraint. Therefore, there are effectively an infinite number of solutions that are identical to the extent to which they are able to approximate the matrix

  37. Rotational indeterminacy Note: T is a orthogonal rotation matrix.

  38. 5.2.2 Mechanics (續)

  39. 5.2.2 Mechanics (續)

  40. 5.2.2 Mechanics (續)

  41. 5.3 SAMPLE PROBLEM

  42. 題目- Ready-to-eat cereals(穀類食品 EX:家樂事玉米片) • 研究顧客購買產品所考量之25個屬性 • 方法:採發問卷調查方式進行 • 評分方式:每位受訪者對每種屬性給予1~5之評分分數 • 樣本:116位受訪者評估12種品牌,每位受訪者評估兩到三種不同品牌之產品,共有235個觀察值

  43. 25個屬性

  44. 共同性(Communality):係指某一個變數可被潛伏因素解釋的部分。共同性(Communality):係指某一個變數可被潛伏因素解釋的部分。

  45. SMC (squared multiple correlation) • Which is the amount of variation in one variable explained by all other variables in the data set.

  46. 由SMC表可知,屬性的共同性數值範圍從0.23(Easy)到最高的0.75(Health)。由SMC表可知,屬性的共同性數值範圍從0.23(Easy)到最高的0.75(Health)。 • 25個行為變數(屬性變數)的共同性之總和為13.0,佔總變異的52%(13/25),故四個萃取出的因子之解釋能力超過一半,足以代表25個行為(屬性)變數。

  47. (轉軸前)

More Related