200 likes | 318 Views
信賴 區間與信心水準的解 讀. 一、常態分布. 為何成績單只要有個人成績加上 平均數 、 標準差 ,就足夠估計學生大約的名次? 例: A 生成績 ( 全班 40 人 ). 全班成績直方圖. 常態 曲線圖. 一種理想 的次數分配 呈 「鐘型」 中間最高為 算術平均數 標準差 為 S. 平均數、標準差決定常態分布曲線函數. A 生名次的約估. 大學聯考的統計資料. 已知 ≒ 54.63 S ≒ 13.73. 某生國文成績為 24.7 分 這個分數距離平均值 2 個 標準差: 利用常態分配表推知他的百分等級是 2.5% ,
E N D
一、常態分布 • 為何成績單只要有個人成績加上平均數、標準差,就足夠估計學生大約的名次? • 例:A生成績(全班40人)
常態曲線圖 一種理想的次數分配 呈「鐘型」 中間最高為算術平均數 標準差為S
大學聯考的統計資料 已知 ≒54.63 S≒13.73
某生國文成績為 24.7 分 • 這個分數距離平均值 2個標準差: • 利用常態分配表推知他的百分等級是 2.5%, 但由大考中心資料得知他實際的百分等級是 4%
二、信賴區間 • 92年7月19日,某報就『成年人對公立大學學費是否太貴』的議題進行調查,於20日報導:『成功訪問了871位成年人。在百分之九十五的信心水準下,有46%民眾認為學費太貴,抽樣誤差在正負3.3%之內』,而該調查是以台灣地區住宅電話為母體作尾數兩位隨機抽樣。 • 這代表信賴區間為(0.46-0.033,0.46+0.033) • 我們每次做抽樣調查時都可以做出一個區間估計,例如上例的區間為(0.427,0.499) ,而所謂百分之九十五的信心水準,即指每次做出的區間會涵蓋實際比例的機率為95%。 • 但是,這些區間與 95% 如何求出?
信賴區間的實驗 • 老師為全班每個同學各準備一籤筒,事先不讓學生知道籤筒裡放了幾支籤,內含若干有獎籤,然後做實驗:讓每個同學在籤筒內抽取一支籤,記錄是否為有獎籤後放回,連續抽取20次。(類似於民調中成功訪問了20人) • 如果抽出7支有獎籤,則推估有獎籤的比例為 ,你有多少信心支持自己的推估正確?
樣本比例的抽樣分布 • 每個同學的 雖然在變動,但中央極限定理告訴我們, 只要n夠大,這些 可以被常態分布描繪的相當接近
前面提到常態分配中:約有95%的資料會在期望值±2個標準差的範圍中,所以大約有95%的機會,我們每個人所求出的區間前面提到常態分配中:約有95%的資料會在期望值±2個標準差的範圍中,所以大約有95%的機會,我們每個人所求出的區間 會包含真正的有獎籤比例 p
信賴區間的計算 • 將每位同學的中獎比例代入下列公式:
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 信賴區間圖 • 右圖中,全班 40 個學生每個人都得到一個區間,如果老師事先知道 p = 0.6,那麼從圖中可知有36 個區間包含真實的 p值。 • 全班 40 個學生包含 p值區間個數的期望值為 40 0.95 = 38 個
區間比較圖 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 1 0.9 n =20 n = 40
n = 20 與 n = 40 的區間估計的差異 因區間半徑等於 , 所以較大的 n值具有較小的區間半徑,也意味著有較佳區間估計的效果。
信賴區間的解讀 • 全班依照這樣的區間公式求出的 40 個區間,由模擬的實驗結果,可以發現並非一定有 95% 的區間會涵蓋實際值 p。 • 每個學生一旦做出區間,就只可能有兩種情形:包含真實 p值,或不包含真實 p值。因此一旦做出區間後,並不能說「真實 p值在此區間的機率為 95%」
回顧抽樣調查的例子 • 92年7月19日,某報就『成年人對公立大學學費是否太貴』的議題進行調查,於20日報導:『成功訪問了871位成年人。在百分之九十五的信心水準下,有46%民眾認為學費太貴,抽樣誤差在正負3.3%之內』,而該調查是以台灣地區住宅電話為母體作尾數兩位隨機抽樣。 • 這是否代表「認為公立大學學費太貴的民眾比例在(0.427,0.493)這個區間範圍內」? • 所謂百分之九十五的信心水準下,你可以說明出其涵義嗎?
例題1 • A工廠生產的A飲料經隨機抽樣,得平均容量為330.04cc,在95% 的信心水準下,抽樣誤差為1.54cc;而B工廠生產的B飲料經隨機抽樣,得平均容量為329.56cc,在95% 的信心水準下,抽樣誤差為1.24cc,今隨機抽出一罐A飲料測量後告訴大家,再隨機抽出一罐B飲料,試問下列何者正確?(1)B飲料的容量必在[328.32,330.80](2)A飲料的容量有95%的機率在[328.50,331.58]中(3)A飲料的容量大於B飲料的容量(4)假若兩種飲料罐子皆標示容量330cc,則這兩 種飲料都不能說其標示不實 • Ans:(4)說明:A的信賴區間[328.50,331.58],B的信賴區間[328.32,330.80] 真正的容量是一個固定的數,非隨機的點,不可以用機率來解釋