1 / 19

第五章 卡方檢定

第五章 卡方檢定. 5-1  卡方檢定 (X 2 test) 5-2  適配度檢定 (good-of-fit test) 5-3  獨立性檢定 (test of independence) 5-4  同質性檢定 (test of homogeneity). 5-1 卡方檢定 (X 2 test).

snow
Download Presentation

第五章 卡方檢定

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第五章 卡方檢定 • 5-1 卡方檢定 (X2 test) • 5-2 適配度檢定 (good-of-fit test) • 5-3 獨立性檢定 (test of independence) • 5-4 同質性檢定 (test of homogeneity)

  2. 5-1 卡方檢定(X2 test) •   卡方檢定適用於非連續變項(例如:類別或次序變數)之差異分析, 卡方分配可以協助我們利用樣本的變異數來推論母體變異數, 母體變異數代表著資料的分散程度。隨著應用的不同, 對於資料分散的程度也有不同的使用, 例如, 對於獲利程度而言, 值是較大較好, 但對於品管的變異數而言, 則是愈小愈好。卡方檢定則是利用卡方分配(卡方值)來進行檢定, 適用於分類變數的分析, 若是單一類別的變數, 可以得到次數的分配, 若是有兩個類別, 則可以使用交叉表(cross-tabulation)分析, 而且使用卡方(Chi-Square, X2)來作檢定。 卡方檢定常用的應用有三大類, 分別是適配度檢定(good-of-fit test), 獨立性檢定(test of independence)和同質性檢定(test of homogeneity), 我們分別介紹如後。

  3. 5-2 適配度檢定(good-of-fit test) •   當我們想了解某一個變數是否與某個理論或母體分配相符合時, 就可以使用卡方檢定的應用之一, 「適配度檢定」, 適配度檢定的內容是一個變數, 因此, 也稱為單因子分類(one-way classification) 檢定。 卡方的適配度檢定是取樣本的觀察值和母體的期望值作比較, 而卡方值愈大, 代表觀察值和期望值差異愈大, 當卡方值超過某一個臨界值時, 就會得到顯著的統計檢定結果。 • 研究問題的假設如下: • 虛無假設H0:母體符合某種分配或理論 • 對立假設H1:母體不符合某種分配或理論 • 若是適配度檢定的結果是顯著, 則會拒絶虛無假設H0,卡方統計量的定義如下: • X2= • Oi= 樣本的觀察值 • Ei= 理論推算的期望值

  4. 範例: • 某電腦公司在資訊展時, 分別售出筆記型電腦白色50台, 黑色40, 灰色30台, 該電腦公司想要知道, 消費者對筆記型電腦的顏色偏好是否有差異? • 我們整銷售的資料如下: • 虛無假設H0:消費者對筆記型電腦顏色的偏好是相同的 • 對立假設H1:消費者對筆記型電腦顏色的偏好是不相同的 • 期望值 = 總人數 *每種結果的機率 • = (50+40+30) * ( ) • = 40 • X2= = ++ • = 2.5+0+2.5 • = 5 • 自由度 = (3-1) = 2 • 查表: • 結果: • 我們計算卡方統計量為5, 小於卡方分配臨界值5.99, 因此, 我們接受虛無假設H0, 消費者對筆記型電腦顏色的偏好是相同的

  5. 實務操作: • 1. 開啟範例 expected.sav • 2. 按 Data Weight Cases • 3. 在Weight Cases 視窗,選取 Sale 選取 Weight cases by • 4. 按 > ,選取 Sale 到 Frequency Variable • 5. 按 OK,回到開啟資料視窗,按 Analyze  Nonparametric • Tests  Chi-Square • 6. 在Chi-Square Test 視窗,選取 Sale • 7. 在Chi-Square Test 視窗,按 > ,選取 Sale 到 Test Variable • List • 8. 按 Options ,選取 Descriptive • 9. 按 Continue,回到 Chi-Square Test 視窗 • 10. 按 OK,出現報表結果

  6. 報表分析結果如下: • NPar Tests • Descriptive Statistics • Chi-Square Test • Frequencies • Sale • Test Statistics • a 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 40.0. • 結果:從表中我們可以看到卡方統計量為5, P值0.082大於0.05, 因此, 我們接受虛無假設H0, 消費者對筆記型電腦顏色的偏好是相同的。

  7. 5-3 獨立性檢定 (test of independence) •   獨立性檢定是用在同一個樣本中, 兩個變數的關連性檢定, 也就是說, 在探討兩個類別變數之間, 是否互為獨立, 或則是有相依的關係存在, 獨立性檢定的結果, 若是達到顯著, 則需要查看二個變數的關連性強度, 我們整理如下: • 2×2 列連表:查看 (phi)相關係數 • 3×3 列連表:查看列聯係數(coefficient of contingency) • 注意:4×4, 5×5, 6×6:也是查看列聯係數 • 2×3列連表:查看Cramer’s V 係數 • 注意:(3×2, 2×4, 3×4…) :也是查看Cramer’s V 係數 • 註解:一般建議不超過16個個格, 也就是使用小於4×4或3×5的表格, 以免難於解釋結果, 另外, 一般也常用Lamda()係數來解釋兩個變數的關係,  係數是以一個變數可以解釋另一個變數時, 削減誤差比率(Proportioned Reduction in Error), 愈大代表兩個變數的關連性愈強。

  8. 電腦公司銷售筆記型電腦, 男性分別購買白色50, 黒色60, 灰色50, 女性分別購買白色70, 黒色30, 灰色40, 我們想要了解性別(男, 女)在購買筆記型電腦時, 對於顏色的選擇是否有差異? • 首先,我們整理男女購買筆記型電腦的觀察值如下: • 研究問題的假設如下: • 虛無假設H0:兩個變數相互獨立, 代表男女性別與購買筆記型電腦顏色無關 • 對立假設H1:兩個變數相互關連(相依), 代表男女性別與購買筆記型電腦顏色有關 • 理論的期望值 =     *    *總計 • 自由度 = (列的數目 - 1) (行的數目 - 1) • = (r-1)(j-1)

  9. 我們計算男女購買筆記型電腦的理論期望值如下:我們計算男女購買筆記型電腦的理論期望值如下: • 男性購買白色 = • 男性購買黑色 = • 男性購買灰色 = • 女性購買白色 = • 女性購買黑色 = • 女性購買灰色 = • 我們整理男女購買筆記型電腦的理論期望值如下:

  10. 我們整理觀察值和理論的期望值如下: • 註:(數字)代表理論的期望值 • 卡方檢定統計量: • X2= • O 為觀察次數, E為期望次數 • 若X2>X2(r-1)(c-1) 則拒絶虛無假設H0 • X2= • = 13.17 • 查表: • 結果: •   我們計算卡方統計量為13.17, 大於卡方分配臨界值5.99, 因此, 我們拒絶虛無假設H0, 消費者男女性別與購買筆記型電顏色有關 假設顯著水準 行為5%, 自由度 = (3-1)(2-1) = 2, 查卡方分配臨界值表X2=5.99

  11. 實務操作: • 1. 開啟範例 independence.sav • 2. 按 Data Weight Cases • 3. 在Weight Cases 視窗,選取 Sale 選取 Weight cases by • 4. 按 > ,選取 Sale 到 Frequency Variable • 5. 按 OK,回到開啟資料視窗,按 Descriptive Statistics  Crosstabs • 6. 在 Crosstabs 視窗,選 Sex (性別) • 7. 在 Crosstabs 視窗,選 Sex (性別)到 Row(s) ,選 color (顏色) • 8. 在 Crosstabs 視窗,選 color (顏色)到 Column(s) • 9. 按 Statistics,選 Chi-square,Contingency coefficient,Phi and • Cramer’s V , Lambda • 10. 按 Continue, 回到 Crosstabs 視窗 • 11. 按 Cell,選取 Observed,Row,Column,Total • 12. 按 Continue, 回到 Crosstabs 視窗 • 13. 按 OK,出現報表結果

  12. 報表分析結果如下: • Crosstabs • Case Processing Summary

  13. Sex * Color Crosstabulation

  14. Chi-Square Tests • a 0 cells (.0%) have expected count less than 5. The minimum expected count is 42.00. • 結果: • 我們得到卡方統計量為13.17, P值 0.001小於臨界值0.05, 因此, 我們拒絶虛無 • 假設H0, 消費者男女性別與購買筆記型電顏色有關。

  15. 5-4 同質性檢定(test of homogeneity) •   同質性檢定是用在不同樣本(例如:二個樣本)中, 同一個變數是否為一致的檢定, 也就是說, 用來檢測不同母體在同一個變數的回應下, 是否有顯著差異。 • 同質性檢定的統計量如下: • X2= , 自由度df = (r-1)(c-1) • O為觀察次數, E為期望次數 • 若 X2> X2(r-1)(j-1), 則拒絕虛無假設H0 •   同質性檢定的統計量              為Pearson chi-square皮爾森卡方統計量, 另外, 也可以使用likelihood概以此卡方統計量來作檢定 • 注意: •   我們使用同質性檢定於細格大於2時, 只能檢定出是否有顯著差異, 至於是那二組有顯著差異, 則需要再進一步, 作事後比較, 才可以得知

  16. 範例: •   我們想瞭解大學生, 大學教師, 家長對於研究生購買筆記型電腦的意見是否一致? •   我們整理大學生, 大學教師, 家長對於研究生購買筆記型電腦的意見, 贊成或反對的觀察值如下: • 研究問題的假設如下: • 虛無假設H0:對於問題的反應是一致, 代表著大學生, 大學教師和家長, 對於研究生購買筆記型電腦的態度是一致的。 • 對立假設H1:對於問題的反應是不同的, 代表著大學生, 大學教師和家長, 對於研究生購買筆記型電腦的態度是不一致的 • 我們可以設定身份 ID:大學生 1 , 大學教師 2, 家長 3 • 意見 Opinion:贊成1, 反對2 • 贊成或反對的觀察值 number。

  17. 輸入列聯表

  18. 實務操作: • 1. 開啟範例 homogeneity.sav • 2. 按 Data  Weight Cases • 3. 在Weight Cases 視窗,選取 number ,選取 Weight cases by • 4. 按 > ,選取 Sale 到 Frequency Variable • 5. 按 OK,回到開啟資料視窗,按 Descriptive Statistics  Crosstabs • 6. 在 Crosstabs 視窗,選 ID (身份)到 Row(s) ,選 opinion (意見)到 • Column(s) • 7. 按 Statistics,選 Chi-square,Contingency coefficient,Phi and Cramer’s • V , Lambda • 8. 按 Continue, 回到 Crosstabs 視窗 • 9. 按 Cell,選取 Observed,Row,Column,Total • 10. 按 Continue, 回到 Crosstabs 視窗 • 11. 按 OK,出現報表結果

  19. 報表分析結果如下: • Chi-Square Tests • a 0 cells (.0%) have expected count less than 5. The minimum expected count is 42.00. • 結果: •   我們得到卡方統計量為13.17, P值 0.001小於臨界值0.05, 因此, 我們拒絶虛無假設H0,對於問題的反應是不同的, 代表著大學生, 大學教師和家長, 對於研究生購買筆記型電腦的態度是不一致的。

More Related