420 likes | 580 Views
民意調查的分析 I. 蔡佳泓 政大選舉研究中心 副研究員. 課程大綱. 名目變數之描述性統計 連續變數之描述性統計 順序變數. 11%+89%=100%. 贊成意見與時間. 名目變數描述性統計. 類別資料例如性別、 居住地、贊成反對等皆可以用次數分配表示。 表示的重點在於指出那一個類別佔多數,即眾數。. 使用 SPSS 分析資料. 以 「 台灣的公民意識 」為例 檔案 - 讀取文字資料 分析 - 描述統計 - 次數分配表 統計圖 - 圓餅圖或線形圖. SPSS 介面. 名目變數 次數分配 1. 次數分配 2. 次數分配 3. 集中趨勢.
E N D
民意調查的分析I 蔡佳泓 政大選舉研究中心 副研究員
課程大綱 • 名目變數之描述性統計 • 連續變數之描述性統計 • 順序變數
名目變數描述性統計 • 類別資料例如性別、 居住地、贊成反對等皆可以用次數分配表示。 • 表示的重點在於指出那一個類別佔多數,即眾數。
使用SPSS分析資料 • 以「台灣的公民意識」為例 • 檔案-讀取文字資料 • 分析-描述統計-次數分配表 • 統計圖-圓餅圖或線形圖
集中趨勢 • 參考傳院課程
交叉列表的獨立性檢定 • 用Chi-square分布做獨立性檢定。 • 如果拒斥檢定假設表示兩者是相關的。 • 如果接受檢定假設表示兩者是獨立的。 也就是期待值跟觀察值非常相近。 • χ2=∑(期待值-觀察值)2/期待值 • Chi-square test
交叉列表 • E11/A1 = E12/A2 = B1/N • E21/A1 = E22/A2 = B2/N • 所以:E11= A1*B1/N ,每一格子數目由邊際機率決定
名目變數的相關性 • 名目尺度只有類別沒有順序或距離, 因此相關性的原理是用某個變數的眾數去猜另一個變數, 猜對減猜錯的比率就是相關性。 • PRE(proportional reduction of error):用依變數的全部減眾數為底, 分子為該數值與自變數猜錯之間的差。[(N-m)-(d1-m1)-(d2-m2)…]/ (N-m)
名目變數的相關性 • 以有沒有出去玩當依變數N=1124 • 眾數為627 • N-m=497 • 用年齡當做自變數時, 每個年齡對應的d-m為86, 122, 129, 75, 39(猜錯的) • 497-451/497=.093
名目變數相關係數: lambda • 可用在對稱性或有依變數之名目變數之關聯性計算 • 不對稱:lambda= (每個X變項下Y的眾值)-Y之眾值/N-Y之眾值 對稱:(每個X變項下Y的眾值)+(每個y變項下x的眾值)-Y之眾值-X眾值/2N-Y之眾值-X之眾值
順序尺度資料分析 • 以TVBS的「春節交通狀況民調 」為例。 • 順序尺度變數可以用中位數表示其中間趨勢。 中位數指的是將全部觀察值分成一半的觀察值。 • 例如:2,5,5,8,10,13,60,77,125,336,336,999,1021之中60為中位數。
順序尺度變數 • 重新歸類為比較好、 差不多、 比較差三類。 • 中位數為2—差不多, 因為累積次數過半。 • 眾數也是2 。
順序尺度變數相關性 • 如果有兩個順序尺度的變數,一般而言是用Gamma表示其相關程度。 • Gamma的觀念是比對觀察值在兩個變數上的順序,順序一致的比率越高,則兩者的相關性越高。 • 另外一種指標是Kendall’s tau-b ,可以幫助Gamma係數處理一些平手的配對。
Gamma: Ns-Nd/Ns+Nd • Tau-a:Ns-Nd/0.5*N(N-1) • Tau-b:Ns-Nd/sqrt(Ns+Nd+Tx) (Ns+Nd+Ty) • Sommer’s D: Ns-Nd/Ns+Nd+Ty • Ns: 同序的數目 Nd: 不同序的數目 • Tx:X變數下平手的格子
計算方式 • Ns=f11(f22+f23+f32+f33)+f12(f23+f33)+f21(f32+f33)+f22(f33) • Nd=f13(f22+f21+f32+f31)+f12(f21+f31)+f23(f32+f31)+f22(f31) • Ty=f11(f12+f13)+f12(f13)+f21(f22+f23)+f22(f23)+f31(f32+f33)+f32(f33)
檢驗假設 • 以上相關係數皆可用t分配檢驗 • Gamma標準化Z值的計算:G(sqrt[(Ns+Nd)/N(1-G2)])
小結 • Somer’s D 及Kendall’s Tau-b適合於不對稱的情形。 • Tau-b適合於兩個變數有同樣數目的變項