640 likes | 830 Views
統計學. 郭信霖 許淑卿. 第九章 假 設 檢 定. ■ 9-1 基本概念 ■ 9-2 母體平均數 的檢定 ■ 9-3 母體比例 p 的檢定 ■ 9-4 母體變異數 2 的檢定 ■ 9-5 兩母體平均數差 1 - 2 的檢定 ■ 9-6 兩母體比例差 p 1 - p 2 的檢定 ■ 9-7 兩母體變異數比 1 2 / 2 2 的檢定 ■ 9-8 電腦範例 ■ 9-9 流程圖. 一、假設檢定的觀念
E N D
統計學 郭信霖 許淑卿
第九章 假 設 檢 定 ■ 9-1 基本概念 ■ 9-2 母體平均數的檢定 ■ 9-3 母體比例p的檢定 ■ 9-4 母體變異數2的檢定 ■ 9-5 兩母體平均數差1-2的檢定 ■ 9-6 兩母體比例差p1-p2的檢定 ■ 9-7 兩母體變異數比12/22的檢定 ■ 9-8 電腦範例 ■ 9-9 流程圖
一、假設檢定的觀念 所謂假設檢定,係指在尚未蒐集樣本資料、進行推論之前,就事先對母體的某種特徵性質作一合理的假設敘述,再利用隨機抽出的樣本及抽樣分配,配合機率原理,以判斷此項假設是否為真。 若抽出的樣本資料與所陳述的假設很不一致,檢定的結果必然認為這個假設不對,則否定或拒絕(reject)這個假設。
若抽出的樣本資料與所陳述的假設不會很不一致,檢定的結果就沒有充分理由斷定這個假設不對,但也不認為這個假設是對的,。若抽出的樣本資料與所陳述的假設不會很不一致,檢定的結果就沒有充分理由斷定這個假設不對,但也不認為這個假設是對的,。 假設檢定的主要精神在於尋找證據來拒絕H0而接受H1,所以假設檢定只能檢定H0是否顯著錯誤,而不能判斷其絕對正確,因此又稱為『顯著性檢定』(significant test)。
二、假設的類型 進行假設檢定時,必須建立兩種互斥且互補的假設。 虛無假設(null hypothesis):是希望被否定、放棄的假設,以H0表示。 對立假設(alternative hypothesis):是希望成立的假設,以H1表示。 若將估計量的可能數值,劃分為兩個互斥的子集合: 其一為C集合,通常稱為拒絕域、棄卻域、危險域(critical region,CR);另一為C的餘集合C ,通常稱為接受域(accept region,AR)。 臨界值(critical value):為兩個互斥區域C與C 的分界點,其圖形如下:
( b ) ( c ) 圖9-1 其中1,2為斜影部分(拒絕H0)與空白部分(接受H0)之分界點
至於母數可能數值的那一個集合應為H0或H1並無定論,一般皆依下面兩原則處理:至於母數可能數值的那一個集合應為H0或H1並無定論,一般皆依下面兩原則處理: 1. 樣本未獲得之前,將預期拒絕或很可能被拒絕的假設放置H0。例如,某人的宣稱或拒絕後其後果較嚴重者。 2. 樣本獲得之後,則依樣本統計量,將不可能存在的假設放置H0。
統計假設有三種型態:(其中與0分別表示某參數及其特定值)統計假設有三種型態:(其中與0分別表示某參數及其特定值) 1. 雙尾檢定(two sided test或two tailed test):如圖9 - 1之(a) H0:= 0 H1:0,即> 0或< 0若發現母數的值,有大於或小於0的跡象時,可建立雙尾檢定。
2. 右尾檢定(right sided test或right tailed test):如圖9 - 1之(b) H0:0 H1:> 0若發現母數 的值有大於特定值0的跡象,或預期> 0時,應建立右尾檢定。
3. 左尾檢定(left sided test或left tailed test):如圖9-1之(c)H0:0H1:< 0若發現母數 的值有小於特定值0的跡象,或預期< 0時,應建立左尾檢定。 簡單假設(simple hypothesis):假設中母體未知參數只有一個假設值。 複合假設(composite hypothesis):假設中母體未知參數的假設值不僅一個時。
三、型I誤差,型II誤差及關係 1. 型I誤差與型II誤差 表9-1 檢定結果以及所發生的機率
此兩種誤差所發生的機率如下: (1)型I誤差所發生的機率大小為P(type I error) = P(拒絕H0|當H0為真)顯著水準(significant level,): = max P(type I error) = max P(拒絕H0|當H0為真) (2) 型II誤差所發生的機率大小,一般皆以表示。= P(type II error) = P(接受H0|當H1為真) = P(拒絕H1|H1當為真)= 1 - P(拒絕H0|當H1為真)
檢定力(power of test,1 -):來衡量假設檢定的表現能力。 1 - =P(拒絕H0|當H0為假)= P(拒絕H0|當H1為真) 檢定力曲線(power curve):在H1下所對應的檢定力1 -之曲線。 作業曲線(operation characteristic curve O.C.曲線):由 之所有可能值建立的圖形,如圖9-4。
2. 和的關係 圖9-3 和的變化(以右尾檢定為例)
綜合以上的結論,可得到下列五個重要性質: (1) 和互有關聯,其中之一的機率變大(小),則另 一個機率就變小(大)。 (2) 若拒絕域的範圍愈小,則就愈小,值就愈大;反 之,拒絕域的範圍愈大,則就愈大,值就愈小。 (3) 增加樣本數n,就可以找出另外的拒絕域,使得和值將同時減少。 (4) 若H0不對,則H1中參數的真值愈接近H0的假設值 時,值就愈大;反之,真值和假設值之間的距離愈 大, 值就愈小。見圖9-5 (5) 顯著水準是參數的真值等於H0的假設值時的值。
四、如何建立拒絕H0的區域 最佳檢定: 的大小決定後,如何使Type II error所發生的機率 達到最小呢? (1)雙尾檢定: H0:= 0,H1:0 圖9-7 雙尾檢定的拒絕區域為CR = { > C2或 > C1}。
(2)右尾檢定: H0:0或H0:=0,H1:> 0 圖9-9 右尾檢定的拒絕區域為CR = { > C }。
(3)左尾檢定:H0:0或H0:=0,H1:<0(3)左尾檢定:H0:0或H0:=0,H1:<0 圖9-11 左尾檢定的拒絕區域為CR = { < C }。
五、假設檢定步驟 檢定的一般步驟,歸納如下: 1. 首先確定問題,以建立假設。 2. 決定合適的檢定統計量。 3. 選取顯著水準,並由檢定統計量的機率分 配,建立拒絕區域CR。 4. 由樣本資料,計算統計量的值。 5. 結論
六、檢定的方法 不論檢定母體的何種參數,有四種方法,敘述如下: 1. 古典法(classical method)又稱臨界值檢定法 (critical-value test)。 2. 信賴區間法。 3. 統計量檢定法。 4. p-值法(p-value method)。 (1)臨界值檢定法:
信賴區間: 表9-3 2已知,檢定的信賴區間法
檢定統計量: 表9-4 常態母體2已知,的檢定統計量法
p - 值(p-value)又稱為顯著性機率檢定法(Significance Probability of the test): p-值= P ( 新的拒絕區域|H0為真) 表9-5 常態母體2已知,檢定的p-值法
9-2 母體平均數 的檢定 一、種類 分別說明如下: 1. 2已知: 在常態母體下,不論n的大小,均採用常態分配處理。 ~ N 或 Z = ~ N(0, 1)
2. 2未知且n 30 依CLT,以S2 = 代替2,則以常態分配處理。 Z = ~N(0, 1) 請注意: (a) 上面所說明的母體都為無限母體(或 0.05時),因此所得到 的Var( ) = 。 (b)若母體為有限母體時,所得到的 Var( ) = 。
3. 2未知且n < 30:以t分配處理設從常態母體N(, 2),2未知,隨機抽出一組大小為n < 30的隨機樣本,此時 T = ~t(n - 1)
圖9-15 推論母體平均數 ,所選擇統計量分配的流程圖
9-3 母體比例p的檢定 二項試驗中,成功比例恰等於某特定數的假設檢定,即我們要檢定 H0:p = p0,H1:p p0或,H1:p > p0或H1:p < p0 當np0 5,且nq0 5,根據中央極限定理, 可知 = ~ N , 則Z = = ~N(0, 1)
表9-8 大樣本(np 5且n(1 - p) 5),母體比例p的檢定 在H0之下, Z0= 在H0之下, Z = =
9-4 母體變異數2的檢定 • 關於母體的一致性、齊一性的假設檢定,或比較兩母體齊一性的假設檢定。
表9-9 未知時,常態母體2的檢定 ~2(n) Note:當 已知時,2 =
9-5 兩母體平均數差1-2的檢定 一、基本概念 討論兩母體平均數差1 - 2等於某數d0的檢定問題,譬如: (1) 比較新、舊處方治療某種疾病的成效。 (2) 比較新、舊兩種教學法的成效。 (3) 比較甲、乙兩廠牌日光燈所使用的平均壽命。
諸如以上的檢定問題都是比較兩個母體的平均數大小,此時常用的1 - 2的統計量為-,而關於1 - 2的假設檢定有如下列三種: (1) H0:1 - 2 = d0,H1:1-2d0 (2) H0:1 - 2d0,H1:1-2 > d0 (3) H0:1 - 2d0,H1:1-2 < d0 若d0 = 0,所檢定者,就是為兩個母體平均數相等的虛無假設,H0:1 = 2,也就是純為比較1與2的大小而己。
二、獨立樣本時,1 - 2的檢定 設從兩常態母體N(1 , ),N(2 , )中,分別隨機抽出一組樣本大小為n1,n2的獨立樣本(X1 , X2 , …, )與(Y1 , Y2 , …, ),則1 - 2的統計量為 - ,而 - 的抽樣分配是否為常態分配,而檢定法則需依,已知與否以及n1,n2的大小而定,玆按下列三種情況討論:
I II 獨立 N(2, ) N(1, ) … … n1 n2 (X1, X2, …………,) (Y1, Y2, …………,) - ~N
1. 與 已知: 在常態母體下,不論n1,n2的大小,皆以常態分配處理。 - ~N 或 Z = ~N(0, 1)
當d0 = 0時,三種檢定類型,就為如下所示,其他步驟如上表。
與 未知且n1 30,n2 30 根據CLT,以 , 分別代替 , ,則以常態分配處理。
表9-11 未知且為大樣本(n1 30,n2 30)之1 - 2的檢定表
當d0 = 0時,三種檢定類型,就為如下所示,其他步驟如上表。
3. , 未知且n1 < 30,n2 < 30 A. = = 2(未知)且n1 < 30,n2 < 30時,則 T = ~t( v ) 其自由度v = n1 + n2 - 2,其中 =
※ B. 未知且n1 < 30,n2 < 30時,以t分配處理。 設從兩個獨立常態母體N(1 , ),N(2 , ), 未知,分別隨機抽出兩組樣本大小n1 < 30,n2 < 30的隨機樣本,則 T = ,其中v = 稱T的抽樣分配為近似於t分配,其自由度為v,而由上式計算出的v不一定為整數,則以四捨五入的方式表示。