420 likes | 1.25k Views
第五章 卡方檢定. 5-1 卡方檢定 (X 2 test) 5-2 適配度檢定 (good-of-fit test) 5-3 獨立性檢定 (test of independence) 5-4 同質性檢定 (test of homogeneity). 5-1 卡方檢定 (X 2 test).
E N D
第五章 卡方檢定 • 5-1 卡方檢定 (X2 test) • 5-2 適配度檢定 (good-of-fit test) • 5-3 獨立性檢定 (test of independence) • 5-4 同質性檢定 (test of homogeneity)
5-1 卡方檢定(X2 test) • 卡方檢定適用於非連續變項(例如:類別或次序變數)之差異分析, 卡方分配可以協助我們利用樣本的變異數來推論母體變異數, 母體變異數代表著資料的分散程度。隨著應用的不同, 對於資料分散的程度也有不同的使用, 例如, 對於獲利程度而言, 值是較大較好, 但對於品管的變異數而言, 則是愈小愈好。卡方檢定則是利用卡方分配(卡方值)來進行檢定, 適用於分類變數的分析, 若是單一類別的變數, 可以得到次數的分配, 若是有兩個類別, 則可以使用交叉表(cross-tabulation)分析, 而且使用卡方(Chi-Square, X2)來作檢定。 卡方檢定常用的應用有三大類, 分別是適配度檢定(good-of-fit test), 獨立性檢定(test of independence)和同質性檢定(test of homogeneity), 我們分別介紹如後。
5-2 適配度檢定(good-of-fit test) • 當我們想了解某一個變數是否與某個理論或母體分配相符合時, 就可以使用卡方檢定的應用之一, 「適配度檢定」, 適配度檢定的內容是一個變數, 因此, 也稱為單因子分類(one-way classification) 檢定。 卡方的適配度檢定是取樣本的觀察值和母體的期望值作比較, 而卡方值愈大, 代表觀察值和期望值差異愈大, 當卡方值超過某一個臨界值時, 就會得到顯著的統計檢定結果。 • 研究問題的假設如下: • 虛無假設H0:母體符合某種分配或理論 • 對立假設H1:母體不符合某種分配或理論 • 若是適配度檢定的結果是顯著, 則會拒絶虛無假設H0,卡方統計量的定義如下: • X2= • Oi= 樣本的觀察值 • Ei= 理論推算的期望值
範例: • 某電腦公司在資訊展時, 分別售出筆記型電腦白色50台, 黑色40, 灰色30台, 該電腦公司想要知道, 消費者對筆記型電腦的顏色偏好是否有差異? • 我們整銷售的資料如下: • 虛無假設H0:消費者對筆記型電腦顏色的偏好是相同的 • 對立假設H1:消費者對筆記型電腦顏色的偏好是不相同的 • 期望值 = 總人數 *每種結果的機率 • = (50+40+30) * ( ) • = 40 • X2= = ++ • = 2.5+0+2.5 • = 5 • 自由度 = (3-1) = 2 • 查表: • 結果: • 我們計算卡方統計量為5, 小於卡方分配臨界值5.99, 因此, 我們接受虛無假設H0, 消費者對筆記型電腦顏色的偏好是相同的
實務操作: • 1. 開啟範例 expected.sav • 2. 按 Data Weight Cases • 3. 在Weight Cases 視窗,選取 Sale 選取 Weight cases by • 4. 按 > ,選取 Sale 到 Frequency Variable • 5. 按 OK,回到開啟資料視窗,按 Analyze Nonparametric • Tests Chi-Square • 6. 在Chi-Square Test 視窗,選取 Sale • 7. 在Chi-Square Test 視窗,按 > ,選取 Sale 到 Test Variable • List • 8. 按 Options ,選取 Descriptive • 9. 按 Continue,回到 Chi-Square Test 視窗 • 10. 按 OK,出現報表結果
報表分析結果如下: • NPar Tests • Descriptive Statistics • Chi-Square Test • Frequencies • Sale • Test Statistics • a 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 40.0. • 結果:從表中我們可以看到卡方統計量為5, P值0.082大於0.05, 因此, 我們接受虛無假設H0, 消費者對筆記型電腦顏色的偏好是相同的。
5-3 獨立性檢定 (test of independence) • 獨立性檢定是用在同一個樣本中, 兩個變數的關連性檢定, 也就是說, 在探討兩個類別變數之間, 是否互為獨立, 或則是有相依的關係存在, 獨立性檢定的結果, 若是達到顯著, 則需要查看二個變數的關連性強度, 我們整理如下: • 2×2 列連表:查看 (phi)相關係數 • 3×3 列連表:查看列聯係數(coefficient of contingency) • 注意:4×4, 5×5, 6×6:也是查看列聯係數 • 2×3列連表:查看Cramer’s V 係數 • 注意:(3×2, 2×4, 3×4…) :也是查看Cramer’s V 係數 • 註解:一般建議不超過16個個格, 也就是使用小於4×4或3×5的表格, 以免難於解釋結果, 另外, 一般也常用Lamda()係數來解釋兩個變數的關係, 係數是以一個變數可以解釋另一個變數時, 削減誤差比率(Proportioned Reduction in Error), 愈大代表兩個變數的關連性愈強。
電腦公司銷售筆記型電腦, 男性分別購買白色50, 黒色60, 灰色50, 女性分別購買白色70, 黒色30, 灰色40, 我們想要了解性別(男, 女)在購買筆記型電腦時, 對於顏色的選擇是否有差異? • 首先,我們整理男女購買筆記型電腦的觀察值如下: • 研究問題的假設如下: • 虛無假設H0:兩個變數相互獨立, 代表男女性別與購買筆記型電腦顏色無關 • 對立假設H1:兩個變數相互關連(相依), 代表男女性別與購買筆記型電腦顏色有關 • 理論的期望值 = * *總計 • 自由度 = (列的數目 - 1) (行的數目 - 1) • = (r-1)(j-1)
我們計算男女購買筆記型電腦的理論期望值如下:我們計算男女購買筆記型電腦的理論期望值如下: • 男性購買白色 = • 男性購買黑色 = • 男性購買灰色 = • 女性購買白色 = • 女性購買黑色 = • 女性購買灰色 = • 我們整理男女購買筆記型電腦的理論期望值如下:
我們整理觀察值和理論的期望值如下: • 註:(數字)代表理論的期望值 • 卡方檢定統計量: • X2= • O 為觀察次數, E為期望次數 • 若X2>X2(r-1)(c-1) 則拒絶虛無假設H0 • X2= • = 13.17 • 查表: • 結果: • 我們計算卡方統計量為13.17, 大於卡方分配臨界值5.99, 因此, 我們拒絶虛無假設H0, 消費者男女性別與購買筆記型電顏色有關 假設顯著水準 行為5%, 自由度 = (3-1)(2-1) = 2, 查卡方分配臨界值表X2=5.99
實務操作: • 1. 開啟範例 independence.sav • 2. 按 Data Weight Cases • 3. 在Weight Cases 視窗,選取 Sale 選取 Weight cases by • 4. 按 > ,選取 Sale 到 Frequency Variable • 5. 按 OK,回到開啟資料視窗,按 Descriptive Statistics Crosstabs • 6. 在 Crosstabs 視窗,選 Sex (性別) • 7. 在 Crosstabs 視窗,選 Sex (性別)到 Row(s) ,選 color (顏色) • 8. 在 Crosstabs 視窗,選 color (顏色)到 Column(s) • 9. 按 Statistics,選 Chi-square,Contingency coefficient,Phi and • Cramer’s V , Lambda • 10. 按 Continue, 回到 Crosstabs 視窗 • 11. 按 Cell,選取 Observed,Row,Column,Total • 12. 按 Continue, 回到 Crosstabs 視窗 • 13. 按 OK,出現報表結果
報表分析結果如下: • Crosstabs • Case Processing Summary
Chi-Square Tests • a 0 cells (.0%) have expected count less than 5. The minimum expected count is 42.00. • 結果: • 我們得到卡方統計量為13.17, P值 0.001小於臨界值0.05, 因此, 我們拒絶虛無 • 假設H0, 消費者男女性別與購買筆記型電顏色有關。
5-4 同質性檢定(test of homogeneity) • 同質性檢定是用在不同樣本(例如:二個樣本)中, 同一個變數是否為一致的檢定, 也就是說, 用來檢測不同母體在同一個變數的回應下, 是否有顯著差異。 • 同質性檢定的統計量如下: • X2= , 自由度df = (r-1)(c-1) • O為觀察次數, E為期望次數 • 若 X2> X2(r-1)(j-1), 則拒絕虛無假設H0 • 同質性檢定的統計量 為Pearson chi-square皮爾森卡方統計量, 另外, 也可以使用likelihood概以此卡方統計量來作檢定 • 注意: • 我們使用同質性檢定於細格大於2時, 只能檢定出是否有顯著差異, 至於是那二組有顯著差異, 則需要再進一步, 作事後比較, 才可以得知
範例: • 我們想瞭解大學生, 大學教師, 家長對於研究生購買筆記型電腦的意見是否一致? • 我們整理大學生, 大學教師, 家長對於研究生購買筆記型電腦的意見, 贊成或反對的觀察值如下: • 研究問題的假設如下: • 虛無假設H0:對於問題的反應是一致, 代表著大學生, 大學教師和家長, 對於研究生購買筆記型電腦的態度是一致的。 • 對立假設H1:對於問題的反應是不同的, 代表著大學生, 大學教師和家長, 對於研究生購買筆記型電腦的態度是不一致的 • 我們可以設定身份 ID:大學生 1 , 大學教師 2, 家長 3 • 意見 Opinion:贊成1, 反對2 • 贊成或反對的觀察值 number。
實務操作: • 1. 開啟範例 homogeneity.sav • 2. 按 Data Weight Cases • 3. 在Weight Cases 視窗,選取 number ,選取 Weight cases by • 4. 按 > ,選取 Sale 到 Frequency Variable • 5. 按 OK,回到開啟資料視窗,按 Descriptive Statistics Crosstabs • 6. 在 Crosstabs 視窗,選 ID (身份)到 Row(s) ,選 opinion (意見)到 • Column(s) • 7. 按 Statistics,選 Chi-square,Contingency coefficient,Phi and Cramer’s • V , Lambda • 8. 按 Continue, 回到 Crosstabs 視窗 • 9. 按 Cell,選取 Observed,Row,Column,Total • 10. 按 Continue, 回到 Crosstabs 視窗 • 11. 按 OK,出現報表結果
報表分析結果如下: • Chi-Square Tests • a 0 cells (.0%) have expected count less than 5. The minimum expected count is 42.00. • 結果: • 我們得到卡方統計量為13.17, P值 0.001小於臨界值0.05, 因此, 我們拒絶虛無假設H0,對於問題的反應是不同的, 代表著大學生, 大學教師和家長, 對於研究生購買筆記型電腦的態度是不一致的。