1.46k likes | 1.58k Views
第八章 集中趨勢. 均數. 均數或稱 算術均數 ,是指將總和除以個數。如果描述之資料是母體,我們通常以希臘字母來表示,如: μ 表母體均數。如果描述之資料是樣本,我們通常以英文字母來表示,如:以 或 表樣本均數。 於 Excel 中,係利用 AVERAGE() 與 AVERAGEA() 來求算其均數。其語法為: AVERAGE( 數值 1,[ 數值 2], ...) AVERAGE(value1,[value2],...) AVERAGEA( 數值 1,[ 數值 2], ...) AVERAGEA(value1,[value2],...)
E N D
均數 • 均數或稱算術均數,是指將總和除以個數。如果描述之資料是母體,我們通常以希臘字母來表示,如:μ表母體均數。如果描述之資料是樣本,我們通常以英文字母來表示,如:以或表樣本均數。 • 於Excel中,係利用AVERAGE()與AVERAGEA()來求算其均數。其語法為: AVERAGE(數值1,[數值2], ...) AVERAGE(value1,[value2],...) AVERAGEA(數值1,[數值2], ...) AVERAGEA(value1,[value2],...) • 數值1,[數值2], ...為要計算平均數之儲存格或範圍引數,最多可達255個。式中,方括號所包圍之內容,表該部份可省略。
C11與C12處,同樣以B2:B8為處理範圍 =AVERAGEA(B2:B8) =AVERAGE(B2:B8) 怎麼所求之均數會不同?這是因B4為"缺考"字串並非數值,故AVERAGE()函數會將其排除掉,也就是說其分母為6;而非AVERAGEA()函數的7。 • AVERAGE()係計算所有含數值資料的儲存格之均數;而AVERAGEA()則計算所有非空白的儲存格之均數。如,範例Ch08.xlsx『均數1』工作表:
所以,在此例中,以AVERAGE()函數所求之均數是較合理些,將缺考者亦納入來求均數,只會把全班的平均成績拉低。所以,在此例中,以AVERAGE()函數所求之均數是較合理些,將缺考者亦納入來求均數,只會把全班的平均成績拉低。 • 但應注意,B4若未曾輸入任何資料。則兩函數所求之結果是一樣,均會將B4捨棄,同樣以分母為6進行求均數。如此,在本例中是合理的:(詳範例Ch08.xlsx『均數2』工作表)
但若例子改為求學生平時作業之均數,其中,第一位學生廖晨帆並未繳交『作業2』,以AVERAGE()求算:(詳範例Ch08.xlsx『均數3』工作表)但若例子改為求學生平時作業之均數,其中,第一位學生廖晨帆並未繳交『作業2』,以AVERAGE()求算:(詳範例Ch08.xlsx『均數3』工作表) 或AVERAGEA()函數求算:(詳範例Ch08.xlsx『均數4』工作表) 均是第一筆廖晨帆只交兩次作業的平均(85.0),高過第二筆廖彗君三次全交之平均(79.3)。尤其是第四筆之劉荏蓉同學,只交一次作業,其平均也有75.0!這……這……,這還有天理嗎?
所以,若您是老師,應記得於未繳作業處輸入0。以避免前面之不合理情況:所以,若您是老師,應記得於未繳作業處輸入0。以避免前面之不合理情況:
要不,就於未繳作業處補個“缺”字,續利用AVERAGEA()來求算平均數,也可以獲得正確值:要不,就於未繳作業處補個“缺”字,續利用AVERAGEA()來求算平均數,也可以獲得正確值: • 但以"缺"字來代表未交作業時,千萬別還是以AVERAGE()來求算平均數,其值還是錯誤的:
平均數之優點 • 代表性容易被接受。 • 平均數永遠存在且只有一個;不像眾數,可能會有好幾個眾數或根本沒有眾數。 • 所有數值均被使用到,對代表性均有貢獻。不像眾數或中位數,忽略兩端之數字。 • 但它的缺點就是會受兩端之極端值影響,而減弱了代表性。如:6, 8, 10, 7, 6, 7, 5, 2000未將最高之極端值排除,其均數為256.125,實在有點高;若將最高之極端值2000排除,其均數為7,似乎更能代表實際之情況。
馬上練習 • 依範例Ch08.xlsx『運動時間均數』工作表內容,計算每次平均運動時間。
馬上練習 • 依範例Ch08.xlsx『手機平均月費均數』工作表內容,計算有手機者(B欄為1者)平均月費之均數。本例之作法是先將資料依『是否有手機』欄排序,將有手機者集中在一起,續求其手機平均月費之均數。
依條件算加總SUMIF() SUMIF(準則範圍,條件準則,[加總範圍]) SUMIF(range,criteria,[sum_range]) • 式中,方括號所包圍之內容,表該部份可省略。 • 準則範圍是條件準則用來進行條件比較的範圍。 • 條件準則可以是數字、比較式或文字。但除非使用數值,否則應以雙引號將其包圍。如:50000(找恰等於該數)、"門市"(找恰等於該文字)或">=800000"(找大於等於該數)。 • 加總範圍則用以標出要進行加總的儲存格範圍,如果省略,則計算準則範圍中的儲存格。僅適用於準則範圍為數值時,如:=SUMIF(C2:C9,">=30000")將加總C2:C9範圍內,大於或等於30000者。
如,擬於範例Ch08.xlsx『分組加總1』工作表中,分別求各部門之業績的總和:如,擬於範例Ch08.xlsx『分組加總1』工作表中,分別求各部門之業績的總和: • 其E3求『門市』部之業績合計的公式應為:=SUMIF(A2:A9,“門市”,C2:C9)表要在A2:A9之部門欄中,求算內容為“門市”之業績合計。同理,其E5求『業務』部之業績合計的公式則應為:=SUMIF(A2:A9,"業務",C2:C9) 而若擬將業績分成三萬及以上與三萬以下兩組,並分別求其業績總和,則可使用: =SUMIF(C2:C9,">=30000") =SUMIF(C2:C9,"<30000") 或 =SUMIF(C2:C9,">=30000",C2:C9) =SUMIF(C2:C9,"<30000",C2:C9) 因為,省略加總範圍,將加總準則範圍中的儲存格(C2:C9)內容。
若將相關文字及條件輸入於儲存格內,則求合計之各公式可改為:(詳範例Ch08.xlsx『分組加總2』工作表)=SUMIF($A$2:$A$9,E2,$C$2:$C$9)=SUMIF($A$2:$A$9,E3,$C$2:$C$9)=SUMIF($C$2:$C$9,E5)=SUMIF($C$2:$C$9,E6)若將相關文字及條件輸入於儲存格內,則求合計之各公式可改為:(詳範例Ch08.xlsx『分組加總2』工作表)=SUMIF($A$2:$A$9,E2,$C$2:$C$9)=SUMIF($A$2:$A$9,E3,$C$2:$C$9)=SUMIF($C$2:$C$9,E5)=SUMIF($C$2:$C$9,E6)
依條件求平均 • 事實上,Excel並無依條件求算均數之AVERAGEIF(),要依條件求算均數,可將SUMIF()除以COUNTIF()來求算。 • 如,先以COUNTIF()求筆數, 續將SUMIF()之合計除以COUNTIF()之筆數,來求算有條件之均數:
所以,前面『手機平均月費均數』之問卷實例(詳範例Ch08.xlsx『依條件求手機平均月費均數』工作表),則可以=SUMIF(B2:B192,1,C2:C192)求有手機者之月費加總,以=COUNTIF(B2:B192,1)求有手機者之筆數,續將兩者相除,求得均數=G2/G3所以,前面『手機平均月費均數』之問卷實例(詳範例Ch08.xlsx『依條件求手機平均月費均數』工作表),則可以=SUMIF(B2:B192,1,C2:C192)求有手機者之月費加總,以=COUNTIF(B2:B192,1)求有手機者之筆數,續將兩者相除,求得均數=G2/G3
馬上練習 • 依範例Ch08.xlsx『不同性別之運動時間均數』工作表內容,計算男女性每次平均運動時間。
依準則求均數DAVERAGE() DAVERAGE(資料庫表單,欄名或第幾欄,準則範圍) DAVERAGE(database,field,criteria) • 函數中,各引數之標定方式為: • 資料庫表單 為一資料庫表單之範圍(應含欄名列),如:所輸入含欄名之問卷資料 • 欄名或第幾欄 以由1起算之數值,標出欲處理之欄位為資料庫表單內的第幾欄。也可以是以雙引號包圍之欄位名稱,如:"薪資"、"運動時間"、"月費"、……。當然,也可引用已存有欄名之儲存格內容。 • 準則範圍 為一含欄名列與條件式的準則範圍(參見第五章『以進階篩選找出不合理之關聯題』處之說明)
以前文『馬上練習』求不同性別之運動時間均數的例子來說,我們可將其安排成:(詳範例Ch08.xlsx『男女性運動時間均數』工作表)以前文『馬上練習』求不同性別之運動時間均數的例子來說,我們可將其安排成:(詳範例Ch08.xlsx『男女性運動時間均數』工作表) • 其F3之內容:=DAVERAGE($A$1:$C$116,$C1,F2:F3)表示依$A$1:$C$116資料庫,以F2:F3為準則(『性別』欄為1,即男性),求$C1(每次運動時間/分)之均數。抄給G3就變成以G2:G3為準則(『性別』欄為2),將求算女性之每次運動時間均數;抄給H3就變成以H2:H3為準則(『全體』欄為空白,表無任何條件)。事實上,$A$1:$C$116資料庫根本也沒有一個『全體』欄,但因其下H3無條件,將求算所有人之每次運動時間均數。 F3之內容,也可以改為: =DAVERAGE($A$1:$C$116,"每次運動時間/分",F2:F3) =DAVERAGE($A$1:$C$116,3,F2:F3) 以字串標出欄名,或以數字標出第幾欄,其效果均同。
馬上練習 • 依範例Ch08.xlsx『一週飲料花費』工作表內容,計算不同居住狀況之受訪者,一週飲料花費的均數。
含『且』的準則 • 前文『手機平均月費均數』之問卷實例(詳範例Ch08.xlsx『依兩條件求手機平均月費均數』工作表),必須同時使用兩個條件。如,求男性手機平均月費均數的條件為:『是否有手機』為1且『性別』為1。其準則範圍應為: • 所使用之公式應為:=DAVERAGE($A$1:$D$192,$C1,F1:G2) • 求女性手機平均月費均數的條件為:『是否有手機』為1且『性別』為2。其準則範圍應為: • 所使用之公式應為:=DAVERAGE($A$1:$D$192,$C1,I1:J2)
求全體手機平均月費均數的條件為:『是否有手機』為1。其準則範圍應為:求全體手機平均月費均數的條件為:『是否有手機』為1。其準則範圍應為: • 所使用之公式應為:=DAVERAGE($A$1:$D$192,$C1,L1:L2)
於G7:I7,以 =DCOUNT($A$1:$D$192,$C1,F1:G2) =DCOUNT($A$1:$D$192,$C1,I1:J2) =DCOUNT($A$1:$D$192,$C1,L1:L2) 依相同之準則分別求男/女及全體人數,可使報表資料更完備一點:
交叉表求均數 • 對於必須同時使用兩個條件求均數;且還得一併求人數之情況,最便捷之處理方式為利用『樞紐分析表』來建立交叉表。 • 以範例Ch08.xlsx『性別交叉是否有手機求平均月費』工作表之資料為例,以『樞紐分析表』建立交叉表之步驟為: • 以滑鼠單按問卷資料之任一儲存格 • 切換到『插入』索引標籤,按『表格』群組『樞紐分析表』鈕,轉入『建立樞紐分析表』對話方塊 • 於上半部,選「選取表格或範圍(S)」,其內所顯示者恰為薪資資料之範圍 • 於下半部,選「已經存在的工作表(E)」項,續選按F3儲存格。表欲將樞紐分析表安排於目前工作表之F3處
按鈕,續利用捲動軸,轉到可以看見F3儲存格之位置,可發現已有一空白的樞紐分析表,且右側也有一個『樞紐分析表欄位清單』窗格按鈕,續利用捲動軸,轉到可以看見F3儲存格之位置,可發現已有一空白的樞紐分析表,且右側也有一個『樞紐分析表欄位清單』窗格
於右側『樞紐分析表欄位清單』窗格上方,『選擇要新增到報表的欄位:』處,以拖曳之方式,將『□ 性別』拉到『欄標籤』方塊;將『□ 是否有手機』項拉到『列標籤』方塊;將『□ 平均月費』拉到『Σ值』方塊,可求得初始樞紐分析表,表內所求算之統計量,其預設值為求算選取欄位(平均月費)之加總。
於『摘要值欄位方式(S)』處將其改為「平均值」,以求算平均月費之平均值;續於上方『自訂名稱(C)』處,將原內容改為『手機平均月費』於『摘要值欄位方式(S)』處將其改為「平均值」,以求算平均月費之平均值;續於上方『自訂名稱(C)』處,將原內容改為『手機平均月費』
按鈕,F3儲存格處之樞紐分析表已改為手機平均月費按鈕,F3儲存格處之樞紐分析表已改為手機平均月費 • 點按G3儲存格,將其『欄標籤』字串改為『性別』;點按F4儲存格,將其『列標籤』字串改為『是否有手機』,於G4:H4輸入各數字所對應之性別,於F5:F6輸入各數字所對應之有/無手機,以利閱讀
於右側『樞紐分析表欄位清單』窗格上方,『選擇要新增到報表的欄位』處,以滑鼠拖曳『□ 性別』欄位。將其拉到右下方之『Σ值』方塊內,『手機平均月費』項目之下。所增加之內容,目前係加於原各欄之右側
於『Σ值』方塊,單按『加總-性別』項右側之向下箭頭,續選「值欄位設定(N)…」,轉入『值欄位設定』對話方塊,於『摘要值欄位方式(S)』處將其改為「項目個數」,以求算出現次數(即記錄數);續於上方『自訂名稱(C)』處,將原內容改為『人數』於『Σ值』方塊,單按『加總-性別』項右側之向下箭頭,續選「值欄位設定(N)…」,轉入『值欄位設定』對話方塊,於『摘要值欄位方式(S)』處將其改為「項目個數」,以求算出現次數(即記錄數);續於上方『自訂名稱(C)』處,將原內容改為『人數』
以滑鼠拖曳『欄標籤』方塊內『Σ值』項目,將其拉到『列標籤』方塊內,『是否有手機』項目之下以滑鼠拖曳『欄標籤』方塊內『Σ值』項目,將其拉到『列標籤』方塊內,『是否有手機』項目之下 可查知有手機之人數,男性51人,女性68人;其月費均數分別為505.49與439.12。
按鈕後,樞紐分析表可改成僅保留「有」手機者之結果按鈕後,樞紐分析表可改成僅保留「有」手機者之結果
馬上練習 • 依範例Ch08.xlsx『性別交叉居住狀況求一週飲料花費』工作表內容,計算性別交叉居住狀況的一週飲料花費平均數及人數。
原分組資料轉組中點 • 問卷上很多有關所得、花費等數值,會因為牽涉個人隱私或為了方便受訪者填答,並不會要求受訪者直接填寫其數值,而改採勾填某一區間。如: • 因所勾填之數字,並非連續資料之數值,只是一種類別,故並不能直接用來進行數值運算。當要計算其相關統計量時,只好將其轉為組中點。這種替代方式,當然與原數值會有所差異,但這也是沒辦法的事!
其組中點之算法為: • 以勾填□2. 5至10萬元而言,其組中點之算法為7.5萬元: • 上題整個家庭月所得狀況的各答案,可轉為下示之組中點:
由於,各組之組距均為50000,故亦可將上示之IF()函數簡化成:=25000+(B2-1)*50000所求得之組中點及均數(87500)亦完全相同。(詳範例Ch08.xlsx『以組中點求毎月所得均數-計算』工作表)由於,各組之組距均為50000,故亦可將上示之IF()函數簡化成:=25000+(B2-1)*50000所求得之組中點及均數(87500)亦完全相同。(詳範例Ch08.xlsx『以組中點求毎月所得均數-計算』工作表)
馬上練習 • 依範例Ch08.xlsx『求每月零用金均數』工作表內容,計算每月零用金之均數。原問卷之內容為:
馬上練習 • 續上題,依範例Ch08.xlsx『性別交叉居住狀況求每月零用金均數』工作表內容 ,以樞紐分析表,求性別交叉居住狀況的每月零用金均數及人數:
直接以次數分配表求均數 • 另一種計算方式,是不必將原間斷之類別變數轉為組中點之數字;而直接以次數分配表求均數:(詳範例Ch08.xlsx『以組中點求毎月所得均數-次數分配』工作表)
於F欄係以COUNTIF()求次數分配表,F3之公式為:=COUNTIF($B$2:$B$93,D3)於G欄係以計算方式求得組中點,G3之公式為=25000+(D3-1)*50000於F欄係以COUNTIF()求次數分配表,F3之公式為:=COUNTIF($B$2:$B$93,D3)於G欄係以計算方式求得組中點,G3之公式為=25000+(D3-1)*50000 • 於H欄係以相乘方式計算樣本數×組中點 • H3之公式為:=F3*G3 • 最後,以SUM()求『樣本數』及『樣本數×組中點』之總計,並於F10計算兩者相除之結果,求得家庭月所得平均數87500,此一結果同於前文所舉之例。
量表求均數及排名 • 對於如: • 之評價量表,於問卷回收後,我們也是逐項地分別對其求算出均數,然後再依其均數之高低,排出等級順序,以判斷那幾個屬性較為受訪者所著重。
茲以範例Ch08.xlsx『數位相機注重屬性』工作表內容,說明計算均數及整理等級順序之相關技巧。其操作步驟為:茲以範例Ch08.xlsx『數位相機注重屬性』工作表內容,說明計算均數及整理等級順序之相關技巧。其操作步驟為: • 輸妥標題 • 回原問卷之Word文件(詳範例磁片之『數位相機問卷.docx』),按住Alt鍵,續以滑鼠拖曳拉出區塊,可僅選取各屬性之文字內容
切換到『常用』索引標籤,按『剪貼簿』群組之『複製』鈕,記下所選之屬性文字切換到『常用』索引標籤,按『剪貼簿』群組之『複製』鈕,記下所選之屬性文字 • 移回『數位相機注重屬性』工作表之R2 • 按『剪貼簿』群組之『貼上』鈕,複製出所記下之屬性文字
按Ctrl+Home、Ctrl+↓,移到所有資料的最底端 • 停於B101,輸入=AVERAGE(B2:B99)算出第1個屬性『價格』之平均注重程度: 公式與資料間,至少間隔一列以上,以免被誤認為是原始問卷資料的一部份。
將公式抄給B101:N101,計算出所有屬性(Q23_1~Q23_13)之注重程度均數將公式抄給B101:N101,計算出所有屬性(Q23_1~Q23_13)之注重程度均數 • 於B101:N101尚呈選取之狀態,按『剪貼簿』群組之『複製』鈕,記下所有屬性之注重程度均數之公式 • 按『剪貼簿』群組『貼上』鈕之向下箭頭,選「貼上值(V)」
將其等由公式轉為常數,這純是為了方便後續步驟之轉置。若無此過程,轉置後,將無法取得正確值!將其等由公式轉為常數,這純是為了方便後續步驟之轉置。若無此過程,轉置後,將無法取得正確值! • 於B101:N101尚呈選取之狀態,切換到『常用』索引標籤,按『剪貼簿』群組『複製』鈕,記下所有屬性之注重程度均數的常數 • 移到『注重程度均數』標題下之S2
按『剪貼簿』群組『貼上』鈕之向下箭頭,選「轉置(T)」按『剪貼簿』群組『貼上』鈕之向下箭頭,選「轉置(T)」 • 可將原以列方式排列之所有屬性的注重程度均數,轉置為以欄方式排列,複製到S2:S14,並按『格式』群組之『增加小數位數』鈕增加其小數位
於T1輸入=RANK(S2,$S$2:$S$14)複製到T2:T14,可依各屬性之注重程度排出等級順序於T1輸入=RANK(S2,$S$2:$S$14)複製到T2:T14,可依各屬性之注重程度排出等級順序 由此結果,可看出受訪者於選購數位相機時,所注重之屬性,前五名依序為:『畫素色彩是否清晰』、『操控性(穩定度、速度等)』、『內建記憶體容量及速度』、『與電腦配合執行的軟體』與『連接電腦網路之能力』。