290 likes | 802 Views
第 17 章 集群分析. 本章的學習主題 1. 集群分析的概念 2. 相似性及最近距離的衡量 3. 階層分析法 4. 非階層分析法. 17.1 集群分析概念. 集群分析 (cluster analysis) 是一種將樣本觀察值進行分析,若具有某些共同特性者予以整合在一起,然後分配到特定的群體,最後形成許多不同集合集群的一種分析方法。
E N D
第17章 集群分析 本章的學習主題 1. 集群分析的概念 2. 相似性及最近距離的衡量 3. 階層分析法 4. 非階層分析法 企業研究方法 第 17 章
17.1 集群分析概念 集群分析 (cluster analysis) 是一種將樣本觀察值進行分析,若具有某些共同特性者予以整合在一起,然後分配到特定的群體,最後形成許多不同集合集群的一種分析方法。 集群分析與因素分析的概念大致相同,但前者係將不同的觀察值依相對距離的遠近加以分類成不同集群,然後對不同集群所具有的特性程度加以命名;而後者乃係將不同的變數依照相關程度加以萃取成少數的因素,然後對依各因素中所含變數來加以命名。 企業研究方法 第 17 章
表 17-1 商店業績統計表 圖 17-1 商店業績分群示意圖 企業研究方法 第 17 章
探索性 • 驗證性 界定研究問題 • 變數的共線性 • 極端值的剔除 • 資料的標準化 變數及資料篩選 • 衡量距離 • 歐式距離 • 馬式距離 • 街道距離 • 混合式距離 相似性衡量 • 集群數目之決定 • 觀察值集合順序表 • 垂直冰柱圖 • 樹狀圖 • 集群方法 • 層次集群方法 • 非層次集群方法 選則集群方法 及 決定集群數目 • 層次集群與非層次集群之比較 • 區別分析 解釋及驗證集群 17.2 界定研究問題 圖 17-2 集群分析步驟 企業研究方法 第 17 章
17.3 變數與資料的篩選 集群分析在變數與資料的篩選上須考量: 1.變數的共線性 2.極端值的剔除 3.資料的標準化 企業研究方法 第 17 章
17.4 相似性衡量 圖 17—3 集群分析歐氏距離計算方法 歐氏距離之公式為: 企業研究方法 第 17 章
表 17 – 2 歐氏距離計算表 企業研究方法 第 17 章
17.5 選擇集群方法及決定集群數目 集群分析的方法,可分為兩大類,五種方法: 1.層次集群方法(hierarchical methods) (1)單一連鎖法(single linkage) (2)完全連鎖法(complete linkage) (3)中心法(centroid method) (4)華德法(Ward’s methods) 2.非層次集群方法(non-hierarchical methods) (1)K平均數法(k-means methods) 企業研究方法 第 17 章
1.單一連結法又稱為最近法(nearest neighbor)。最近法對A、B兩群距離的定義是以A群內每一點到B群內每一點的距離之最小值,作為A、B兩群的距離。而最近法的概念表示如下: 圖 17-4 單一連結法 企業研究方法 第 17 章
2. 完全連結法 又稱為最遠法(farthest neighbor)。最遠距離法的計算是以A群內每一點到B群內每一點的距離中之最大值,作為A、B兩群的距離。而最遠法的概念可表示如下: 圖 17-5 完全連結法 企業研究方法 第 17 章
3.中心法中心法也稱平均連結法,是以計算A群的中心點到B群中心點的距離,作為A、B兩群的距離。中心法的概念可表示如下:3.中心法中心法也稱平均連結法,是以計算A群的中心點到B群中心點的距離,作為A、B兩群的距離。中心法的概念可表示如下: 圖 17-6 中心法 企業研究方法 第 17 章
4.華德法 又稱最小變異數法(minimum variance method)。華德法的分群方式是先將每一個個體視為一個集群,然後將各集群依序合併,合併之順序完全視合併後集群之組內總變異數之大小而定。 表 17 -3 華德法逐次集結係數表 企業研究方法 第 17 章
非層次集群方法: 非層次集群方法是在各階段分群過程中,將原有的集群予以打散,並重新形成新的集群。其主要的運用方法是:K平均數法(k-means methods)。 企業研究方法 第 17 章
表 17-4 非階層 ( k-means ) 集群之各組成員分析表 (1/2) 企業研究方法 第 17 章
表 17-5 非階層 ( k-means ) 集群之各組成員分析表 (2/2) 企業研究方法 第 17 章
集群數目的決定 在進行集群時,一個很重要的問題是要決定分為多少群才有意義,以下幾項準則可以用來作為參考: 1.集群之群數以在2~6群為宜,超過 6 群則其後續分析將 變得相當瑣碎,因此除非另有特殊的考量,集群之群數 以不超過 6 群為宜。 2.集群完成後,各群之觀察值應儘量接近,即各群之觀察 值不要相差太遠。 企業研究方法 第 17 章
3. 當集群數減少,集群內的同質性便會降低。研究者應權 衡集群數與同質性兩者,儘可能找到較少的集群,但仍 滿足同質性的必要水準。 4. 集群係數之增量太大則放棄集結,如表17─3所示,如 利用華德法進行分群,集結力太大,則代表分群之事實 相當明顯,應即停止集結。 5. 集群時,各集群變數在各群之分數應具有顯著性,即集 群變數應具有區分之效度,否則,該集群變數是否存在 對於分群即沒有顯著的作用。 6. 集群之後,實際分群與理論分群之比較結果,其命中率 應達顯著之水準。 企業研究方法 第 17 章
17.6 集群之解釋與命名 由表17-6可知,分群結果第三群在三種不同的智慧資本之集群變數中所得之分數偏低,故命名為低智慧資本群,第二群在三個集群變數中,所得之分數偏高,故命名為高智慧資本群,第一群在三個集群變數中表現比較中等,故命名為中智慧資本群。 表 17-6 分群平均值差異檢定 ***:P<0.001;**:P<0.01 企業研究方法 第 17 章
表 17-7 分群在其他構面之平均值差異檢定 企業研究方法 第 17 章
17.7 集群分析方法實際流程 為使集群之作業更為周延,通常我們以二階段法來進行集群 分析法。所謂二階段法係結合階層分群法與非階層分群法二 種方式,第一階段先以華德法做分群,決定群組個數,第二 階段再以K組平均法進行集群分類。 使用二階段法的目的在於利用第一階段華德法以層次集群分 析法進行分群,我們利用分群之準則決定群數以後,再利用 第二階段以K組平均法,屬於非層次分群法予以分群。 企業研究方法 第 17 章
排除樣本資料因為衡量尺度的不同, 所可能造成的影響 資料標準化 第一次階層分群 ( 華德法 ) 進行第一次階層分群的目的在於 判斷分群數 非階層分析法 ( K 組平均數法 ) 進行非階層分析法,探討分群變數 之分群效度 圖 17-8 集群分析法實際流程 企業研究方法 第 17 章