330 likes | 574 Views
Chi Square. 謝寶煖 台灣大學圖書資訊學系 2007 年 10 月 13 日. X 2 - test. 自變數、依變數均屬 類別變數 時,運用 X 2 - test 來檢驗其差異顯著性. Outline. Overview Bivariate Tabular Analysis Generalizing from Samples to Populations Chi Square Requirements Collapsing Values Computing Chi Square
E N D
Chi Square 謝寶煖 台灣大學圖書資訊學系 2007年10月13日
X2- test 自變數、依變數均屬類別變數時,運用X2- test來檢驗其差異顯著性
Outline • Overview • Bivariate Tabular Analysis • Generalizing from Samples to Populations • Chi Square Requirements • Collapsing Values • Computing Chi Square • Interpreting the Chi Square Value • Measures of Association • SPSS procedure
Overview • Chi square是雙變項交叉表的無母數統計檢定方法。 • 適切地執行統計顯著性檢定,讓我們知道有多大的信心(degree of confidence)接受或拒絕(accepting or rejecting)一項假設(hypothesis)。 • 一般而言, chi square 的假設檢定(hypothesis test)是檢定兩個不同的樣本(人數、關鍵詞出現次數等)的特定屬性或面向的差異是否夠大到可以從樣本一般化到母群體。 • 無母數統計檢定, chi square,是一種粗估計,可以接受較不正確的資料做為input;相較於t-tests和ANOVA等的母數檢定
Chi square最常用來檢定雙變項交叉表(bivariate tables )的統計顯著性,通常在詮釋結果時,交叉表要與卡方檢定整合
雙變項交叉分析 • Bivariate Tabular Analysis • 雙變項交叉表是用來描述自變項和依變項之間是否存在任何關係 • 例如想要知道台大學生中,男生女生對手機的偏好是否有任何關係。 • 儘可能隨機地找50位男生和50位女生,問他們喜愛的手機 • 自變項是性別 • 依變項是手機品牌 • 自變項是可以經由抽樣控制的,是假設的特性或屬性用來預測或解釋其他的屬性或特性(依變項) • 控制自變項,衡量依變項,檢定假設,以知自變與依變項是否有關係存在
雙變項交叉分析 • 雙變項交叉分析可用以回答下列問題 • 兩個變項是否有某種關係(relationship)存在? • 由資料中顯示出兩變項的關係有多強(strong )? • 關係的方向(direction)或樣態(shape) 為何? • 該關係是否係其他變項所造成? • intervening variable(s)
B A
雙變項交叉分析表 • 自變項:Y軸,垂直軸(SPSS:列) • 依變項:X軸,水平軸(SPSS:直行) • 方便讀者閱讀,由自變項到結果(依變項) • 怎麼組織交叉分析表是取決於研究問題或研究假設 • 例如:自變項是由小到大排列,依變項的值是由左到右,由小到大,則將呈現由左到右的正相關(請注意:相關,並不等於因果關係)
資料呈現 • 交叉分析,不必要顯示所有的橫行百分比、直行百分比及總百分比;很多時候,可能僅需要顯示橫行百分比,和每一橫行之總次數,即可。
交叉分析 • 主要功能是探討多個變項的關聯分佈,並以表格的型式呈現 • 每一格可以顯示次數、期望次數、總百分比、列百分比等 • 由次數分佈狀況,可以知道某變數在其他變數內的分配狀況,可知變數間的關係。 • 卡方檢定,檢定變數間的獨立性
交叉分析 • 卡方統計量(Chi-square) • 當2X2表格內的觀察值數目少於20時,可以方格內的次數值計算Fisher的準確測量值 • 其他的2X2表格,則以Yates修正後的卡方檢定量計算 • 相關(correlations) • 計算Pearson相關係數 • 根據變數性質,選擇適當之統計量 • 名義:如果表格中的橫列和直行都含有名義變數 • 次序:如果表格中的橫列和直行都含有次序變數 • 名義對等距:當一個變數為類別,而另一個為等距數值時,請選取「Eta 值」 • Kappa 統計量數:如果表格中的直行類別與橫列相同時 (例如測量兩位評估者之間的一致性),請選取「Cohen Kappa值」。
Pearson卡方檢定統計量的值為14.027 ,P值小於0.007.在顯著水準為0.01時,(推翻兩變數為統計獨立之虛無假設)顯示性別與手機品牌偏好有關。 2=14.027, df=4, p<0.01
* p< .05 ** p< .01 ***p< .001 • 不太於0的數值,小數點前的零應省略。(APA Style)
卡方檢定 • 虛無假設H0:兩個變數X與Y是獨立的表示變數X與變數Y,沒有關聯 • 對立假設H1:兩個變數X與Y是不獨立的表示變數X與變數Y,有關聯
Pearson卡方檢定統計量的值為12.844 ,P值小於0.0001.在顯著水準為0.001時,(推翻兩變數為統計獨立之虛無假設)顯示性別與是否修課有關。 2=12.844, p<0.0001
檢視交又表可知,男生已選修或正在選修資訊素養課程之比例,明顯高於女生檢視交又表可知,男生已選修或正在選修資訊素養課程之比例,明顯高於女生
個案二 • 有沒有修過課是否會影響其對課程區隔因素之看法?
Pearson卡方檢定統計量的值為10.122,P值小於0.038,在顯著水準為0.05時,(推翻兩變數為統計獨立之虛無假設)顯示是否修過課對課程區隔因素之看法,達到統計上之顯著。Pearson卡方檢定統計量的值為10.122,P值小於0.038,在顯著水準為0.05時,(推翻兩變數為統計獨立之虛無假設)顯示是否修過課對課程區隔因素之看法,達到統計上之顯著。 經卡方檢定,在0.05下達到顯著(2(4)=10.122, p=0.038) 但是因為期望個數少於5的方格數超過10%,使得卡方檢定有不準確之虞,因此,前述顯著性之結論可能不成立。
Web Chi Square Calculator http://www.georgetown.edu/faculty/ballc/webtools/web_chi.html
用Word打公式 • 插入>功能變數>Eq > 方程式編輯器
Thank You! Q & A