390 likes | 696 Views
第十二章 單因子變異數分析. F 分配 FDIST(). FDIST(F, 分子的自由度 , 分母的自由度 ) FDIST(x,degrees_freedom1,degrees_freedom2) F 為用來求算此函數的 F 值。由於 F 值是兩個均方相除: 故其自由度有兩個,一為分子的自由度;另一個為分母的自由度。且因分子分母均為正值(均方),故其分配僅在 0 之右側而已。 本函數在求:於某兩個自由度下之 F 分配中,求自右尾累計到 F 值的總面積(機率)。即傳回 F 分配之右尾累計機率值(下圖之陰影部份):.
E N D
F分配FDIST() FDIST(F,分子的自由度,分母的自由度) FDIST(x,degrees_freedom1,degrees_freedom2) • F為用來求算此函數的F值。由於F值是兩個均方相除: • 故其自由度有兩個,一為分子的自由度;另一個為分母的自由度。且因分子分母均為正值(均方),故其分配僅在0之右側而已。 • 本函數在求:於某兩個自由度下之F分配中,求自右尾累計到F值的總面積(機率)。即傳回F分配之右尾累計機率值(下圖之陰影部份):
F分配之圖形及機率值,將隨自由度不同而略有不同。範例Ch12.xlsx『FDIST』工作表,為自由度(2,10)與(3,15)之情況下,不同F值所求得之右尾累計機率:F分配之圖形及機率值,將隨自由度不同而略有不同。範例Ch12.xlsx『FDIST』工作表,為自由度(2,10)與(3,15)之情況下,不同F值所求得之右尾累計機率:
F分配反函數FINV() FINV(左尾機率,分子的自由度,分母的自由度) FINV(probability,degrees_freedom1,degrees_freedom2) • 本函數用以於已知自由度之F分配中,求某累計機率所對應之F值。 • 由於F分配之圖形及機率值,將隨自由度不同而略有不同。範例Ch12.xlsx『FINV』工作表,是以自由度為(2,10)之情況下,所求得之結果:有了此函數,即可省去查『附錄五 F分配的臨界值』F分配表之麻煩。
馬上練習 • 查兩個自由度(d.f.)分別為1~10之情況下,單尾機率為5%之F值:(詳範例Ch12.xlsx『F分配的臨界值』工作表)
F檢定FTEST() • 變異數分析(Analysis-of-Variance簡稱ANOVA),為統計學家費雪(Fisher,R.A.)首創,最常被用來檢定兩常母體之變異數是否相等(即,變異數同質性的檢定)與檢定多組(大於兩組)母群平均數是否相等?(若為兩組則採用t檢定或z檢定) • 要使用變異數分析的基本假設為: • 各樣本之母群體為常態分配(normality) • 各樣本之母群體為獨立(independence) • 各組樣本之母群體變異數相同(homogeneity-of-variance)
兩常態母體之變異數檢定 FTEST(範圍1,範圍2) FTEST(array1,array2) • 可傳回兩組資料(樣本數允許不同),變異數是否存有顯著差異的F檢定之右尾機率值(P值)。判斷檢定結果時很簡單,只須看此P值之二分之一是否小於所指定顯著水準之α值。(按理,係雙尾檢定,但通常會將數字大者當分子,故只須看右尾之臨界值即可) • 本函數,可用來測試兩組樣本的變異數是否相同?即變異數同質性的檢定,其虛無假設與對立假設分別為: H0:σ12=σ22(兩變異數相等) H1:σ12≠σ22(兩變異數不等)
假定,要檢定甲乙兩班之母體變異數是否相同(α=0.05)?隨機抽得範例Ch12.xlsx『F-TEST1』工作表之資料,以=FTEST(B2:B10,C2:C11)/2求得其右尾機率(P值)並將其除以2,其值為0.043<α=0.05,故應棄卻兩變異數相等之虛無假設:假定,要檢定甲乙兩班之母體變異數是否相同(α=0.05)?隨機抽得範例Ch12.xlsx『F-TEST1』工作表之資料,以=FTEST(B2:B10,C2:C11)/2求得其右尾機率(P值)並將其除以2,其值為0.043<α=0.05,故應棄卻兩變異數相等之虛無假設:
同樣之例子,若使用『資料分析』增益集。其處理步驟為:(詳範例Ch12.xlsx『F-TEST2』工作表)同樣之例子,若使用『資料分析』增益集。其處理步驟為:(詳範例Ch12.xlsx『F-TEST2』工作表) • 切換到『資料』索引標籤, 點選『分析』群組『資料分析』鈕(#圖Ch12- DataAnalysis), 於『分析工具』處選選「F-檢定:兩個常態母體變異數的檢定」 • 續 鈕
於『變數1的範圍』與『變數2的範圍』處,設定兩組資料之範圍(B1:B10與C1:C11)於『變數1的範圍』與『變數2的範圍』處,設定兩組資料之範圍(B1:B10與C1:C11) • 點選「標記(L)」(因兩組資料均含『甲班』、『乙班』之字串標記) • α維持0.05 • 設定輸出範圍,本例安排於目前工作表之E2位置
依此結果:自由度為(8,9),F值3.4192>臨界值3.2296(F10處之P值0.0426<α=0.05,同於B15之值;E15處以FINV所算得之F值為3.419,同於F9之值),故可知甲乙班之變異數有顯著差異。(應棄卻兩變異數相等之虛無假設)依此結果:自由度為(8,9),F值3.4192>臨界值3.2296(F10處之P值0.0426<α=0.05,同於B15之值;E15處以FINV所算得之F值為3.419,同於F9之值),故可知甲乙班之變異數有顯著差異。(應棄卻兩變異數相等之虛無假設) • 按鈕結束,即可獲致檢定結果
FTEST()函數實際上是以 計算求得F值,再代入FDIS()以(n1-1,n2-1)為自由度,求得其右尾機率。如以前面例子n1=9、n2=10、、 • 此值恰等於詳範例Ch12.xlsx『F-TEST3』工作表中,B16以FINV()函數所計算之結果。將其代入FDIS()以(8,9)為自由度,求得其右尾機率為0.0426,恰等於B15以FTEST()函數所計算之結果(該值係將雙尾機率除以2):
先檢定變異數再進行均數檢定 • 當以t檢定,進行兩獨立樣本(小樣本)均數檢定時,將視其變異數相同或不同,而使用不同之計算方法。實務上,很多知名的統計套裝軟體(如:SPSS、SAS),就先以F檢定,判斷其變異數是否相同?然後再進行適當之t檢定。 • 如,要對範例Ch12.xlsx『F&T』工作表之資料,進行兩班抽樣成績之均數檢定:
以前,我們是假設變異數相等(或不等)後,才來進行t檢定。但這種假設合理否?誰都不知道!所以,就先以F檢定,判斷其變異數是否相同:以前,我們是假設變異數相等(或不等)後,才來進行t檢定。但這種假設合理否?誰都不知道!所以,就先以F檢定,判斷其變異數是否相同: • 由其F10處之P值為0.27>α=0.05,故無法棄卻兩變異數相等之虛無假設。
由於,F檢定之結果顯示甲乙兩班之變異數相等。故可使用『t檢定:兩個母體平均數差異檢定,假設變異數相等』之方法進行檢定。假定,要判斷在α=0.05之顯著水準下,乙班之平均成績是否高過甲班?由於是變異數相同,t檢定之類型為2。且虛無假設與對立假設分別為:H0:μ1≧μ2H1:μ1<μ2由於,F檢定之結果顯示甲乙兩班之變異數相等。故可使用『t檢定:兩個母體平均數差異檢定,假設變異數相等』之方法進行檢定。假定,要判斷在α=0.05之顯著水準下,乙班之平均成績是否高過甲班?由於是變異數相同,t檢定之類型為2。且虛無假設與對立假設分別為:H0:μ1≧μ2H1:μ1<μ2 • 故此類檢定為單尾檢定。所以,以=TTEST(C2:C11,B2:B10,1,2)或以『資料分析』之「t檢定:兩個母體平均數差異檢定,假設變異數相等」增益集:
均可進行檢定: • 無論由B16或F27之單尾P值來看,均顯示其值0.1856>α=0.05,故仍無法棄卻兩班之均數相等的虛無假設,所以並無法證明乙班之平均成績會高過甲班。
馬上練習 • 以範例Ch12.xlsx『F&T馬上練習』工作表,利用F檢定,判斷北區與南區給予剛畢業之大學生的薪資變異數是否相等(α=0.05)?續以適當之t檢定,判斷北區給剛畢業之大學生的平均薪資是否高過南區(α=0.05)?
由其G10處之P值為0.17>α=0.05,故無法棄卻兩變異數相等之虛無假設,故得使用兩個母體變異數相等之均數檢定:由其G10處之P值為0.17>α=0.05,故無法棄卻兩變異數相等之虛無假設,故得使用兩個母體變異數相等之均數檢定: 由G26之單尾P值0.003<α=0.05,故得棄卻兩區均數相等之虛無假設,所以北區給剛畢業之大學生的平均薪資高過南區。
單因子變異數分析(ANOVA) • 變異數分析的另一種用途,是用來檢定多組(>2)母群平均數是否相等?亦即,Z與t檢定是用於兩組資料比較平均數差異時;而比較二組以上的平均數是否相等時,就須使用到變異數分析。其虛無假設與對立假設為:H0:μ1=μ2=…=μk(每組之均數相等)H1:至少有兩個平均數不相等 • 假定,範例Ch12.xlsx『ANOVA』工作表資料,為調查各地區對政府施政的整體滿意程度(滿分為100分),試以α=0.01之顯著水準,檢定各地區之滿意程度是否存有顯著差異?
本例,以使用『資料分析』進行處理最為便捷。其步驟為:本例,以使用『資料分析』進行處理最為便捷。其步驟為: • 切換到『資料』索引標籤, 點選『分析』群組『資料分析』鈕, 於『分析工具』處選「單因子變異數分析」 • 續按鈕
於『輸入範圍』處,設定三組資料之範圍,選取可包括所有資料之最小範圍即可(本例為B2:D12,別管其內可能仍含有空白儲存格)於『輸入範圍』處,設定三組資料之範圍,選取可包括所有資料之最小範圍即可(本例為B2:D12,別管其內可能仍含有空白儲存格) • 將『分組方式』安排為「逐欄(C)」 • 點選「類別軸標記在第一列上(L)」(因各組資料均含標題之字串標記) • α設定為0.01 • 設定輸出範圍,本例安排於目前工作表之G2位置
按鈕結束,即可獲致單因子變異數分析之ANOVA表按鈕結束,即可獲致單因子變異數分析之ANOVA表 依此結果:自由度為(2,24),F值10.79886>臨界值5.61(L13處之P值0.00045<α=0.01),故可知三個地區之整體滿意度存有顯著差異。南區的滿意度86.5要比其餘兩區(66.30與79.89)來得高。
馬上練習 • 某公司於報紙上進行廣告,範例Ch12.xlsx『廣告ANOVA』工作表,為不同方式廣告當天所獲得之回應人數:試以α=0.05之顯著水準,檢定不同方式廣告之回應人數是否存有顯著差異?
答案:F=6.56,d.f.=3,19,P-值=0.00,不同方式廣告之回應人數間存有顯著差異。全版與半版廣告之回應人數(1173.5與1083.2)高於1/4版與小廣告(724.4與733.0)。
馬上練習 答案:F=0.46,d.f.=2,32,P-值=0.64,大學生每月刷卡金額並不會因其零用金來源不同而存有顯著差異。 • 依範例Ch12.xlsx『信用卡刷卡金額』工作表 試以α=0.05之顯著水準,檢定大學生每月刷卡金額是否隨零用金來源不同而存有顯著差異?
馬上練習 • 將範例Ch12.xlsx『手機平均月費』工作表之內容 將其整理成僅剩有手機者(刪除無手機者),並以居住狀況分組:
答案:F=6.887,d.f.=2,116,P-值=0.001<α=0.05,故大學生每月手機月費將隨其居住狀況不同而存有顯著差異,住家裡最高(572.36)、其次為住校外(447.59),最後為住學校宿舍(319.43)。這可能與住學校者較為節儉有關。 • 試以α=0.05之顯著水準,檢定大學生每月手機月費是否隨其居住狀況不同而存有顯著差異?
量表的檢定—多組 • 對於如: 等之評價量表,我們也經常得進行分組檢定。看對某一屬性之注重程度,是否會因組別不同而有顯著差異?
若僅分兩組,係以『資料分析』之「Z檢定:兩個母體平均數差異檢定」來進行檢定。若組數為兩組以上,則以『資料分析』之「單因子變異數分析」來進行檢定。若僅分兩組,係以『資料分析』之「Z檢定:兩個母體平均數差異檢定」來進行檢定。若組數為兩組以上,則以『資料分析』之「單因子變異數分析」來進行檢定。 • 以範例Ch12.xlsx『擁有手機時間長短X附屬功能多屬性』工作表,其內僅安排一個『附屬功能多』評價項目(非常重要-5、……、非常不重要-1)及擁有手機之時間長短資料(1.未滿六個月、2.六個月至一年、3.一年~一年半、4.一年半以上):
由於分組結果超過兩組,故得以『附屬功能多』之「單因子變異數分析」來進行檢定。先將其資料整理成:由於分組結果超過兩組,故得以『附屬功能多』之「單因子變異數分析」來進行檢定。先將其資料整理成:
然後,以『資料分析』之「單因子變異數分析」來進行檢定然後,以『資料分析』之「單因子變異數分析」來進行檢定
由於本例之虛無假設及對立假設為: H0:μ1=μ2=…=μk(每組之均數相等) H1:至少有兩個平均數不相等 α=0.05 依此結果:F=2.9767,d.f.=3,115,P-值=0.0345<α=0.05,故大學生對『附屬功能多』評價項目的注重程度,將隨其擁有手機時間長短而存有顯著差異。擁有手機時間一年~一年半者的注重程度(2.79),低於其他各組(3.45以上)。
馬上練習 • 依範例Ch12.xlsx『擁有手機時間長短X雙頻手機屬性』工作表內容將其資料整理成:
然後,以『資料分析』之「單因子變異數分析」來進行檢定大學生對『雙頻手機』評價項目的注重程度,是否隨其擁有手機時間長短而存有顯著差異?然後,以『資料分析』之「單因子變異數分析」來進行檢定大學生對『雙頻手機』評價項目的注重程度,是否隨其擁有手機時間長短而存有顯著差異? 依此結果:F=2.747,d.f.=3,115,P-值=0.046<α=0.05,故大學生對『雙頻手機』評價項目的注重程度,將隨其擁有手機時間長短而存有顯著差異。擁有手機時間一年半以上者的注重程度(4.2),高於其他各組。
於報告上量表檢定的寫法-多組 • 通常,我們問卷上的評價量表,絕不會是少數的幾個評價項目而已。以『資料分析』之「單因子變異數分析」來進行檢定,也是得一個一個進行檢定,其過程相當辛苦。這也是沒辦法的事,主要是Excel並不是專門的統計軟體,能做到這樣也算是不錯的了。 • 最後,將其彙總成下表:(詳範例Ch12.xlsx『手機屬性-ANOVA』工作表)
檢定結果顯著者,於其P值後加註"*"(表其<α=0.05),並於報告中對其詳將解釋;檢定結果不顯著者,則僅解釋其重要程度之排序即可。如:檢定結果顯著者,於其P值後加註"*"(表其<α=0.05),並於報告中對其詳將解釋;檢定結果不顯著者,則僅解釋其重要程度之排序即可。如: • 根據調查解果,受訪者較注重之手機屬性,依序為:『收訊狀況佳』、『電磁波的傷害』、『待機時間長』、『大小適中』與『重量輕巧』。 • 經逐一以F檢定,以擁有手機時間長短分組,對其注重程度進行檢定,發現有『附屬功能多』與『雙頻手機』等屬性之注重程度會隨擁有手機時間長短不同,而有顯著差異(P<α=0.05)。這些項目,均是『一年~一年半』組的著重程度較低,可能是剛開始有手機者,會較注重這些項目,隨時間增長,慢慢地發現其實這些項目也沒多大重要性;至於,『一年半以上』者,可能或真正發現沒這些功能的不便性,或許也開始考慮要換手機,故其注重程度又明顯的高於其他各組。