540 likes | 693 Views
第八章.樣品均值比較問題 The Comparison Problem of Sample Mean. 學生氏 t 分布 單一樣品均值推論 兩樣品均值差之分布 兩樣品非成對 t 值 檢定 兩樣品成對 t 值 檢定 二項分佈均值差推論. 8.1 學生氏 t 分布. 於實際應用上,族群變方 通常都是未知的,因此以樣品資料求得樣品均方 來代替族群變方. 所得並非標準常態分布的標準化值 Z ,而是 t 值。. 學生氏 t 分布.
E N D
第八章.樣品均值比較問題 The Comparison Problem of Sample Mean 學生氏t分布 單一樣品均值推論 兩樣品均值差之分布 兩樣品非成對t值檢定 兩樣品成對t值檢定 二項分佈均值差推論
8.1 學生氏t分布 • 於實際應用上,族群變方 通常都是未知的,因此以樣品資料求得樣品均方 來代替族群變方 • 所得並非標準常態分布的標準化值Z,而是t值。
學生氏t分布 • 此t值之分佈為學生氏t分布(Student’s t-distribution),為高斯特(William Sealy Gosset)於1908年所推導得,並以其筆名Student來命名。 • t分布之機率密度函數為:
8.2 t分布之性質 • t分布是以均值0為中心的左右對稱分布,而不同的自由度 有不同的t分布。 • t分布不與橫軸相交,t分布曲線下的面積等於1。 • t分布決定於自由度 ,它是t分布唯一的參數。 • 若n趨近於無窮大時,t分布會趨近於標準常態分布(Z分布)。 • t分布曲線下的機率,如同標準常態分布,已有累計機率表可供查閱(附表五)。
t分布之性質 -3 -2 -1 0 1 2 3
8.3 單一樣品均值推論 • 如檢測一樣品是否來自於某族群,若族群變方 未知,而以樣品均方 來代替族群變方,則其假設檢定程序為: • 虛無假設(null hypothesis) • 對立假設(alternative hypothesis) • 定顯著水準 或 (雙尾) • 計算t值 若 ,則接受H0的假設,反之則拒絕H0的假設。(附表5列出右單尾機率及其t值,與附表4之Z值分佈表示法不同)
例子8.1假設消基會調查市面上某速食品所含防腐劑如下:3,4,5,4,2 ppm,試推論此速食品所含防腐劑是否符合國家訂定的標準值3ppm。 首先計算資料之平均值及均方
例子8.1假設消基會調查市面上某速食品所含防腐劑如下:3,4,5,4,2 ppm,試推論此速食品所含防腐劑是否符合國家訂定的標準值3ppm (2) (1) (3)設定顯著水準 (雙尾) (4)計算t值 ,故接受H0的假設,表示此速食品所含防腐劑符合國家標準值3ppm。
另外我們也可求 的 之信賴區間如下: • 例子8.1可得此速食品防腐劑含量之95%信賴區間為 由上式信賴區間中包括3ppm在內,故接受H0的假設。
8.4 二項族群樣品均值推論 • 二項族群檢測一樣品是否來自於某族群,其假設檢定程序為: • 虛無假設(null hypothesis) • 對立假設(alternative hypothesis) 3)定顯著水準(雙尾) 4)計算 若 ,則接受H0的假設,反之則拒絕H0的假設。(見附表4之Z值分布)
[例8.2a]一般患肺癌病人3年內之死亡率約90%,今有一新療法,試驗150位病人3年內有126位病人死亡,問新療法是否較佳[例8.2a]一般患肺癌病人3年內之死亡率約90%,今有一新療法,試驗150位病人3年內有126位病人死亡,問新療法是否較佳 • 故接受 ,新療法較佳
[例8.2b]設今有甲乙兩位市長候選人,在投票前做民調,從全市電話100萬號中隨機訪問1000人,結果有480人贊成甲候選人,520人贊成乙候選人,試推算兩位市長候選人之得票率有無差異[例8.2b]設今有甲乙兩位市長候選人,在投票前做民調,從全市電話100萬號中隨機訪問1000人,結果有480人贊成甲候選人,520人贊成乙候選人,試推算兩位市長候選人之得票率有無差異 • (1)得票率 • 甲: p1=480/1000=0.48 • 乙: p2=520/1000=0.52 • (2)得票率估計誤差值 • 為安全起見,在估算估計值(得票率p)之變方時,當取p=0.5,可得族群最大變方為 • V(p)=pq/n=0.5x0.5/1000=0.00025 • 其抽樣誤差(sampling error)為 • SE(p)=
在95%信賴水準下( ),估計誤差值(b)為 • b= • (3) 95%信賴區間 • 甲:(0.48-0.032,0.48+0.032) • (0.448,0.512) • 乙:(0.52-0.032,0.52+0.032) • (0.488,0.552)
結論 • 在乙候選人之95%信賴區間(48.8%,55.2%)中包括甲候選人之得票率估計值上限51.2%,因此推斷兩候選人之得票率沒有差別。 • 不過當調查人數(n)增加時,其結論就不一定相同了。
8.5 兩樣品均值差之推論Inference of The Difference of Two Sample Means • 一般從事試驗性研究,多會比較兩事物(兩族群)是否有差異,如A、B兩種藥品治療某疾病是否有差別,或是兩種土壤pH值是否一樣等問題。 • 而採用的方法是由兩事物中隨機抽取樣品,並以兩樣品均值之差,經假設檢定程序以推論兩事物是否有差異存在。 • 我們不能單憑比較兩樣品均值的大小而下結論。 • 關於如何進行假設檢定,我們先要瞭解兩樣品均值差之分佈型態。
8.5.2 兩樣品均值差之Z分佈 • 若兩樣品均值之分佈都為常態,則兩樣品均值差之分佈亦為常態,因此可求得標準常態化值Z為: • 若兩族群之變方 相等,則上式可改寫成:
8.5.2 兩樣品均值差之t分佈 • 由於族群變方通常未知,因此以樣品均方 來代替,即可得t值如下: • 若兩族群之變方相等時,兩樣品均方可求得一共同均方 ,則上式可改寫成:
8.5.3 兩樣品均值差成對t檢定(paired t test for two sample means) • 當欲比較之兩樣品來自相同環境時,如每個試驗單位可分前後期來比較,或者可分為兩個小單位,以隨機安排兩處理(treatment)。 • 則我們宜採用成對t檢定法。 • 例如比較同一株菸草,其上、下部葉片之尼古丁含量是否有差別,我們可將上半部菸草及下半部菸草當作兩個樣品,而且此兩樣品是成對的,兩族群變方也是相同的。
假設檢定程序 (1)虛無假設 (2)對立假設 (3)設定顯著水準 或 。 (4)計算t值,首先求成對樣品觀測值之差 而n對觀測值差之總和為 其均值為 平方和為 均方為 成對樣品均值差之均方為
假設檢定程序 故t值為 若實測|t|> 值,自由度為 ,顯著水準為 ,表示兩族群均值有差異,反之則否。
成對t值檢定(paired t test) 一. 自身配對: • 如下圖為A,B兩種病毒分別接種於一片菸葉的兩邊,以比較此菸草品種抗何種病毒。 • 同一試驗單位(如人、大型動物或植物)分成兩部位安排兩處理。 • 同一試驗單位在前後不同時間安排兩處理
例子8.3今欲比較洗腎病人透析前後之體重是否不同,6位病人腎臟透析前後體重如下表:例子8.3今欲比較洗腎病人透析前後之體重是否不同,6位病人腎臟透析前後體重如下表:
自身配對 • 透析前體重為一樣品,透析後之體重為另一樣品,兩樣品相對樣品點均來自同一人,故以成對t值檢定法先求兩樣品相對觀測值差之平方和為 t = 5.0097 >,表示一般洗腎病人透析後之體重會減輕。
成對t值檢定(paired t test) 二.同源配對-安排兩處理之兩個試驗單位 (動物或植物)要同性質,如種屬、同性別、同年齡與相近體重。
【例】今有A、B兩營養食品品質比較,每種食品重複四次,試驗材料為白老鼠,每兩隻為不同時期出生,隨機安排兩食品,飼養一段時間後之增重如下【例】今有A、B兩營養食品品質比較,每種食品重複四次,試驗材料為白老鼠,每兩隻為不同時期出生,隨機安排兩食品,飼養一段時間後之增重如下 出 生 時 期(週)
同源配對(paired t test) 兩食品間品質有差異,以B食品為優
8.5.4 非成對t檢定(unpaired t test) • 當兩樣品並非成對得來,而是獨立取得時,則宜採用非成對t檢定。 • 安排兩處理之試驗單位應全為同質,並將試驗單位完全隨機分成兩組。 試驗單位 n=20 隨機分配 A藥品 B藥品 第1組 (10) 第2組 (10) • 根據族群變方是否相等,而有不同的檢定式。
(1) 變方相等( ) 兩處理(藥品、食品、療法、技術)比較 非成對t值檢定(unpaired t test) (兩獨立處理比較) @ 安排兩處理之試驗單位全為同質,如下圖為8隻白老鼠同時出生,每處理重複4次,隨機安排兩處理,可得各處理有相同變方 (各處理隨機排列)
例子8.4假設有A、B兩種嬰兒奶粉,A奶粉試用9位初生男嬰,B奶粉試用10位男嬰,則一個月後兩組嬰兒增重情形如下,試比較兩種嬰兒奶粉的增重效果是否有差異?( )
(1) (2) (3)設定顯著水準 (雙尾) (4)計算t值,首先求兩獨立樣本之平方和 共同均方為 ,故拒絕H0的假設,表示A奶粉對嬰兒的增重效果較B奶粉佳。
例:痛風病人與正常人血中尿酸濃度之比較 資料 痛風病人: 8.2 16.7 7.5 14.6 6.3 9.2 11.9 5.6 12.8 4.9 正常人: 4.7 6.3 5.2 6.8 5.6 4.2 6.0 7.4 痛風病人 正常人
思考題 [案例]設今有A、B兩種藥品欲比較其對某種疾病之療效,有12位病患自願參與試驗,試問如何安排此試驗比較妥當? 1.每種藥品選擇兩位年齡體位相近的病人隨機安排A、B兩藥品,採用同源配對試驗。 2.將12位病患隨機分成兩組,每組6人,各安排A、B兩藥品,採用非成對t值試驗。 請問?你比較贊成那種試驗法,為什麼? @人為雜種動物,無法同源配對,故採用非成對t值測驗比較妥當。
8.6 樣品大小之決定 • 當兩族群變方已知,且兩樣品大小(n)相同,在顯著水準 , 檢定力為 條件下,樣品大小應多大,才能測出兩族群均值之差異,其n之求法為: • 當
當族群變方未知時,以樣品均方代替,則n之計算公式為當族群變方未知時,以樣品均方代替,則n之計算公式為
設今有A,B兩藥品各試驗10位病人,服藥後測定病人血液中之吸收總藥量如下:設今有A,B兩藥品各試驗10位病人,服藥後測定病人血液中之吸收總藥量如下: 藥品| --------|---------------------------------------------------------------------------------------------- A | 61.5 71.3 49.4 76.5 60.8 90.4 81.6 55.4 68.7 85.9 |701.5 B | 80.6 90.5 60.8 70.4 75.6 70.8 87.6 99.8 62.7 85.6 |784.4 ---------------------------------------------------------------------------------------------------------
若兩藥品被吸收總量之差的絕對值要達到B藥品的10%,即 ,而 , 則 ,設 • 故至少需要49人才有80%的檢定力以偵測出兩族群平均值有10%的差異
8.7 二項分佈兩樣品均值差推論 • 當取得的樣品夠大時,二項分佈可呈近似常態分佈,而二項分佈兩樣品均值差之分佈,亦為近似常態分佈 (1)虛無假設 (2)對立假設 (3)設定顯著水準 或 。 (4)計算Z值
二項分布兩樣品均值差推論 • 若 ,且H0的假設成立,則其p之估值為 虛無假設 對立假設 則Z值為
例子8.7某農藥商宣稱,其新的農藥產品比舊產品之殺蟲效果高出8%,今將此農藥施用於某昆蟲,其結果得如下記錄:例子8.7某農藥商宣稱,其新的農藥產品比舊產品之殺蟲效果高出8%,今將此農藥施用於某昆蟲,其結果得如下記錄:
(1)虛無假設 (2)對立假設 (3)設定顯著水準 。 (4)計算Z值 ,則拒絕H0的假設,表示新產品之殺蟲效果比舊產品高出8%。
假設我們只要知道新產品是否比舊產品之殺蟲效果好,而不一定要知道殺蟲率高多少。假設我們只要知道新產品是否比舊產品之殺蟲效果好,而不一定要知道殺蟲率高多少。 (1)虛無假設 (2)對立假設 (3)設定顯著水準 。 (4)計算Z值 ,則拒絕H0的假設,表示新產品之殺蟲效果比舊產品好。
卜瓦松分布兩樣品比較 • 根據卜瓦松分布原理 , • 當 , 之分布接近常態分布 • 卜瓦松分布兩樣品比較在相同條件下之公式為
卜瓦松分布兩樣品比較 • 根據卜瓦松分布原理 , • 當 , 之分布接近常態分布 • 卜瓦松分布兩樣品比較在不相同條件下之公式為 • 式中 為 之估值