第八章集中趨勢

第八章集中趨勢

均數 • 均數或稱算術均數，是指將總和除以個數。如果描述之資料是母體，我們通常以希臘字母來表示，如：μ表母體均數。如果描述之資料是樣本，我們通常以英文字母來表示，如：以或表樣本均數。 • 於Excel中，係利用AVERAGE()與AVERAGEA()來求算其均數。其語法為： AVERAGE(數值1,[數值2], ...) AVERAGE(value1,[value2],...) AVERAGEA(數值1,[數值2], ...) AVERAGEA(value1,[value2],...) • 數值1,[數值2], ...為要計算平均數之儲存格或範圍引數，最多可達255個。式中，方括號所包圍之內容，表該部份可省略。

C11與C12處，同樣以B2:B8為處理範圍 =AVERAGEA(B2:B8) =AVERAGE(B2:B8) 怎麼所求之均數會不同？這是因B4為"缺考"字串並非數值，故AVERAGE()函數會將其排除掉，也就是說其分母為6；而非AVERAGEA()函數的7。 • AVERAGE()係計算所有含數值資料的儲存格之均數；而AVERAGEA()則計算所有非空白的儲存格之均數。如，範例Ch08.xlsx『均數1』工作表：

所以，在此例中，以AVERAGE()函數所求之均數是較合理些，將缺考者亦納入來求均數，只會把全班的平均成績拉低。所以，在此例中，以AVERAGE()函數所求之均數是較合理些，將缺考者亦納入來求均數，只會把全班的平均成績拉低。 • 但應注意，B4若未曾輸入任何資料。則兩函數所求之結果是一樣，均會將B4捨棄，同樣以分母為6進行求均數。如此，在本例中是合理的：（詳範例Ch08.xlsx『均數2』工作表）

但若例子改為求學生平時作業之均數，其中，第一位學生廖晨帆並未繳交『作業2』，以AVERAGE()求算：（詳範例Ch08.xlsx『均數3』工作表）但若例子改為求學生平時作業之均數，其中，第一位學生廖晨帆並未繳交『作業2』，以AVERAGE()求算：（詳範例Ch08.xlsx『均數3』工作表）或AVERAGEA()函數求算：（詳範例Ch08.xlsx『均數4』工作表）均是第一筆廖晨帆只交兩次作業的平均（85.0），高過第二筆廖彗君三次全交之平均（79.3）。尤其是第四筆之劉荏蓉同學，只交一次作業，其平均也有75.0！這……這……，這還有天理嗎？

所以，若您是老師，應記得於未繳作業處輸入0。以避免前面之不合理情況：所以，若您是老師，應記得於未繳作業處輸入0。以避免前面之不合理情況：

要不，就於未繳作業處補個“缺”字，續利用AVERAGEA()來求算平均數，也可以獲得正確值：要不，就於未繳作業處補個“缺”字，續利用AVERAGEA()來求算平均數，也可以獲得正確值： • 但以"缺"字來代表未交作業時，千萬別還是以AVERAGE()來求算平均數，其值還是錯誤的：

平均數之優點 • 代表性容易被接受。 • 平均數永遠存在且只有一個；不像眾數，可能會有好幾個眾數或根本沒有眾數。 • 所有數值均被使用到，對代表性均有貢獻。不像眾數或中位數，忽略兩端之數字。 • 但它的缺點就是會受兩端之極端值影響，而減弱了代表性。如：6, 8, 10, 7, 6, 7, 5, 2000未將最高之極端值排除，其均數為256.125，實在有點高；若將最高之極端值2000排除，其均數為7，似乎更能代表實際之情況。

馬上練習 • 依範例Ch08.xlsx『運動時間均數』工作表內容，計算每次平均運動時間。

馬上練習 • 依範例Ch08.xlsx『手機平均月費均數』工作表內容，計算有手機者（B欄為1者）平均月費之均數。本例之作法是先將資料依『是否有手機』欄排序，將有手機者集中在一起，續求其手機平均月費之均數。

依條件算加總SUMIF() SUMIF(準則範圍,條件準則,[加總範圍]) SUMIF(range,criteria,[sum_range]) • 式中，方括號所包圍之內容，表該部份可省略。 • 準則範圍是條件準則用來進行條件比較的範圍。 • 條件準則可以是數字、比較式或文字。但除非使用數值，否則應以雙引號將其包圍。如：50000（找恰等於該數）、"門市"（找恰等於該文字）或">=800000"（找大於等於該數）。 • 加總範圍則用以標出要進行加總的儲存格範圍，如果省略，則計算準則範圍中的儲存格。僅適用於準則範圍為數值時，如：=SUMIF(C2:C9,">=30000")將加總C2:C9範圍內，大於或等於30000者。

如，擬於範例Ch08.xlsx『分組加總1』工作表中，分別求各部門之業績的總和：如，擬於範例Ch08.xlsx『分組加總1』工作表中，分別求各部門之業績的總和： • 其E3求『門市』部之業績合計的公式應為：=SUMIF(A2:A9,“門市”,C2:C9)表要在A2:A9之部門欄中，求算內容為“門市”之業績合計。同理，其E5求『業務』部之業績合計的公式則應為：=SUMIF(A2:A9,"業務",C2:C9) 而若擬將業績分成三萬及以上與三萬以下兩組，並分別求其業績總和，則可使用： =SUMIF(C2:C9,">=30000") =SUMIF(C2:C9,"<30000") 或 =SUMIF(C2:C9,">=30000",C2:C9) =SUMIF(C2:C9,"<30000",C2:C9) 因為，省略加總範圍，將加總準則範圍中的儲存格（C2:C9）內容。

若將相關文字及條件輸入於儲存格內，則求合計之各公式可改為：（詳範例Ch08.xlsx『分組加總2』工作表）=SUMIF($A$2:$A$9,E2,$C$2:$C$9)=SUMIF($A$2:$A$9,E3,$C$2:$C$9)=SUMIF($C$2:$C$9,E5)=SUMIF($C$2:$C$9,E6)若將相關文字及條件輸入於儲存格內，則求合計之各公式可改為：（詳範例Ch08.xlsx『分組加總2』工作表）=SUMIF($A$2:$A$9,E2,$C$2:$C$9)=SUMIF($A$2:$A$9,E3,$C$2:$C$9)=SUMIF($C$2:$C$9,E5)=SUMIF($C$2:$C$9,E6)

依條件求平均 • 事實上，Excel並無依條件求算均數之AVERAGEIF()，要依條件求算均數，可將SUMIF()除以COUNTIF()來求算。 • 如，先以COUNTIF()求筆數, 續將SUMIF()之合計除以COUNTIF()之筆數，來求算有條件之均數：

所以，前面『手機平均月費均數』之問卷實例（詳範例Ch08.xlsx『依條件求手機平均月費均數』工作表），則可以=SUMIF(B2:B192,1,C2:C192)求有手機者之月費加總，以=COUNTIF(B2:B192,1)求有手機者之筆數，續將兩者相除，求得均數=G2/G3所以，前面『手機平均月費均數』之問卷實例（詳範例Ch08.xlsx『依條件求手機平均月費均數』工作表），則可以=SUMIF(B2:B192,1,C2:C192)求有手機者之月費加總，以=COUNTIF(B2:B192,1)求有手機者之筆數，續將兩者相除，求得均數=G2/G3

馬上練習 • 依範例Ch08.xlsx『不同性別之運動時間均數』工作表內容，計算男女性每次平均運動時間。

依準則求均數DAVERAGE() DAVERAGE(資料庫表單,欄名或第幾欄,準則範圍) DAVERAGE(database,field,criteria) • 函數中，各引數之標定方式為： • 資料庫表單為一資料庫表單之範圍（應含欄名列），如：所輸入含欄名之問卷資料 • 欄名或第幾欄以由1起算之數值，標出欲處理之欄位為資料庫表單內的第幾欄。也可以是以雙引號包圍之欄位名稱，如："薪資"、"運動時間"、"月費"、……。當然，也可引用已存有欄名之儲存格內容。 • 準則範圍為一含欄名列與條件式的準則範圍（參見第五章『以進階篩選找出不合理之關聯題』處之說明）

以前文『馬上練習』求不同性別之運動時間均數的例子來說，我們可將其安排成：（詳範例Ch08.xlsx『男女性運動時間均數』工作表）以前文『馬上練習』求不同性別之運動時間均數的例子來說，我們可將其安排成：（詳範例Ch08.xlsx『男女性運動時間均數』工作表） • 其F3之內容：=DAVERAGE($A$1:$C$116,$C1,F2:F3)表示依$A$1:$C$116資料庫，以F2:F3為準則（『性別』欄為1，即男性），求$C1（每次運動時間/分）之均數。抄給G3就變成以G2:G3為準則（『性別』欄為2），將求算女性之每次運動時間均數；抄給H3就變成以H2:H3為準則（『全體』欄為空白，表無任何條件）。事實上，$A$1:$C$116資料庫根本也沒有一個『全體』欄，但因其下H3無條件，將求算所有人之每次運動時間均數。 F3之內容，也可以改為： =DAVERAGE($A$1:$C$116,"每次運動時間/分",F2:F3) =DAVERAGE($A$1:$C$116,3,F2:F3) 以字串標出欄名，或以數字標出第幾欄，其效果均同。

馬上練習 • 依範例Ch08.xlsx『一週飲料花費』工作表內容，計算不同居住狀況之受訪者，一週飲料花費的均數。

含『且』的準則 • 前文『手機平均月費均數』之問卷實例（詳範例Ch08.xlsx『依兩條件求手機平均月費均數』工作表），必須同時使用兩個條件。如，求男性手機平均月費均數的條件為：『是否有手機』為1且『性別』為1。其準則範圍應為： • 所使用之公式應為：=DAVERAGE($A$1:$D$192,$C1,F1:G2) • 求女性手機平均月費均數的條件為：『是否有手機』為1且『性別』為2。其準則範圍應為： • 所使用之公式應為：=DAVERAGE($A$1:$D$192,$C1,I1:J2)

求全體手機平均月費均數的條件為：『是否有手機』為1。其準則範圍應為：求全體手機平均月費均數的條件為：『是否有手機』為1。其準則範圍應為： • 所使用之公式應為：=DAVERAGE($A$1:$D$192,$C1,L1:L2)

於G7:I7，以 =DCOUNT($A$1:$D$192,$C1,F1:G2) =DCOUNT($A$1:$D$192,$C1,I1:J2) =DCOUNT($A$1:$D$192,$C1,L1:L2) 依相同之準則分別求男/女及全體人數，可使報表資料更完備一點：

交叉表求均數 • 對於必須同時使用兩個條件求均數；且還得一併求人數之情況，最便捷之處理方式為利用『樞紐分析表』來建立交叉表。 • 以範例Ch08.xlsx『性別交叉是否有手機求平均月費』工作表之資料為例，以『樞紐分析表』建立交叉表之步驟為： • 以滑鼠單按問卷資料之任一儲存格 • 切換到『插入』索引標籤，按『表格』群組『樞紐分析表』鈕，轉入『建立樞紐分析表』對話方塊 • 於上半部，選「選取表格或範圍(S)」，其內所顯示者恰為薪資資料之範圍 • 於下半部，選「已經存在的工作表(E)」項，續選按F3儲存格。表欲將樞紐分析表安排於目前工作表之F3處

按鈕，續利用捲動軸，轉到可以看見F3儲存格之位置，可發現已有一空白的樞紐分析表，且右側也有一個『樞紐分析表欄位清單』窗格按鈕，續利用捲動軸，轉到可以看見F3儲存格之位置，可發現已有一空白的樞紐分析表，且右側也有一個『樞紐分析表欄位清單』窗格

於右側『樞紐分析表欄位清單』窗格上方，『選擇要新增到報表的欄位：』處，以拖曳之方式，將『□ 性別』拉到『欄標籤』方塊；將『□ 是否有手機』項拉到『列標籤』方塊；將『□ 平均月費』拉到『Σ值』方塊，可求得初始樞紐分析表，表內所求算之統計量，其預設值為求算選取欄位（平均月費）之加總。

於『Σ值』方塊，單按『加總-平均月費』項右側之向下箭頭，續選「值欄位設定(N)…」，轉入『值欄位設定』對話方塊

於『摘要值欄位方式(S)』處將其改為「平均值」，以求算平均月費之平均值；續於上方『自訂名稱(C)』處，將原內容改為『手機平均月費』於『摘要值欄位方式(S)』處將其改為「平均值」，以求算平均月費之平均值；續於上方『自訂名稱(C)』處，將原內容改為『手機平均月費』

按鈕，F3儲存格處之樞紐分析表已改為手機平均月費按鈕，F3儲存格處之樞紐分析表已改為手機平均月費 • 點按G3儲存格，將其『欄標籤』字串改為『性別』；點按F4儲存格，將其『列標籤』字串改為『是否有手機』，於G4:H4輸入各數字所對應之性別，於F5:F6輸入各數字所對應之有/無手機，以利閱讀

於右側『樞紐分析表欄位清單』窗格上方，『選擇要新增到報表的欄位』處，以滑鼠拖曳『□ 性別』欄位。將其拉到右下方之『Σ值』方塊內，『手機平均月費』項目之下。所增加之內容，目前係加於原各欄之右側

於『Σ值』方塊，單按『加總-性別』項右側之向下箭頭，續選「值欄位設定(N)…」，轉入『值欄位設定』對話方塊，於『摘要值欄位方式(S)』處將其改為「項目個數」，以求算出現次數（即記錄數）；續於上方『自訂名稱(C)』處，將原內容改為『人數』於『Σ值』方塊，單按『加總-性別』項右側之向下箭頭，續選「值欄位設定(N)…」，轉入『值欄位設定』對話方塊，於『摘要值欄位方式(S)』處將其改為「項目個數」，以求算出現次數（即記錄數）；續於上方『自訂名稱(C)』處，將原內容改為『人數』

以滑鼠拖曳『欄標籤』方塊內『Σ值』項目，將其拉到『列標籤』方塊內，『是否有手機』項目之下以滑鼠拖曳『欄標籤』方塊內『Σ值』項目，將其拉到『列標籤』方塊內，『是否有手機』項目之下可查知有手機之人數，男性51人，女性68人；其月費均數分別為505.49與439.12。

按之向下箭頭，僅保留「有」手機者

按鈕後，樞紐分析表可改成僅保留「有」手機者之結果按鈕後，樞紐分析表可改成僅保留「有」手機者之結果

馬上練習 • 依範例Ch08.xlsx『性別交叉居住狀況求一週飲料花費』工作表內容，計算性別交叉居住狀況的一週飲料花費平均數及人數。

原分組資料轉組中點 • 問卷上很多有關所得、花費等數值，會因為牽涉個人隱私或為了方便受訪者填答，並不會要求受訪者直接填寫其數值，而改採勾填某一區間。如： • 因所勾填之數字，並非連續資料之數值，只是一種類別，故並不能直接用來進行數值運算。當要計算其相關統計量時，只好將其轉為組中點。這種替代方式，當然與原數值會有所差異，但這也是沒辦法的事！

其組中點之算法為： • 以勾填□2. 5至10萬元而言，其組中點之算法為7.5萬元： • 上題整個家庭月所得狀況的各答案，可轉為下示之組中點：

然後，以IF()函數：=IF(B2=1,25000,IF(B2=2,75000,IF(B2=3,125000,IF(B2=4,175000,225000))))將其代入到問卷資料中，續求算其平均值：（詳範例Ch08.xlsx『以組中點求毎月所得均數-IF』工作表）

由於，各組之組距均為50000，故亦可將上示之IF()函數簡化成：=25000+(B2-1)*50000所求得之組中點及均數（87500）亦完全相同。（詳範例Ch08.xlsx『以組中點求毎月所得均數-計算』工作表）由於，各組之組距均為50000，故亦可將上示之IF()函數簡化成：=25000+(B2-1)*50000所求得之組中點及均數（87500）亦完全相同。（詳範例Ch08.xlsx『以組中點求毎月所得均數-計算』工作表）

馬上練習 • 依範例Ch08.xlsx『求每月零用金均數』工作表內容，計算每月零用金之均數。原問卷之內容為：

馬上練習 • 續上題，依範例Ch08.xlsx『性別交叉居住狀況求每月零用金均數』工作表內容，以樞紐分析表，求性別交叉居住狀況的每月零用金均數及人數：

直接以次數分配表求均數 • 另一種計算方式，是不必將原間斷之類別變數轉為組中點之數字；而直接以次數分配表求均數：（詳範例Ch08.xlsx『以組中點求毎月所得均數-次數分配』工作表）

於F欄係以COUNTIF()求次數分配表，F3之公式為：=COUNTIF($B$2:$B$93,D3)於G欄係以計算方式求得組中點，G3之公式為=25000+(D3-1)*50000於F欄係以COUNTIF()求次數分配表，F3之公式為：=COUNTIF($B$2:$B$93,D3)於G欄係以計算方式求得組中點，G3之公式為=25000+(D3-1)*50000 • 於H欄係以相乘方式計算樣本數×組中點 • H3之公式為：=F3*G3 • 最後，以SUM()求『樣本數』及『樣本數×組中點』之總計，並於F10計算兩者相除之結果，求得家庭月所得平均數87500，此一結果同於前文所舉之例。

量表求均數及排名 • 對於如： • 之評價量表，於問卷回收後，我們也是逐項地分別對其求算出均數，然後再依其均數之高低，排出等級順序，以判斷那幾個屬性較為受訪者所著重。

茲以範例Ch08.xlsx『數位相機注重屬性』工作表內容，說明計算均數及整理等級順序之相關技巧。其操作步驟為：茲以範例Ch08.xlsx『數位相機注重屬性』工作表內容，說明計算均數及整理等級順序之相關技巧。其操作步驟為： • 輸妥標題 • 回原問卷之Word文件（詳範例磁片之『數位相機問卷.docx』），按住Alt鍵，續以滑鼠拖曳拉出區塊，可僅選取各屬性之文字內容

切換到『常用』索引標籤，按『剪貼簿』群組之『複製』鈕，記下所選之屬性文字切換到『常用』索引標籤，按『剪貼簿』群組之『複製』鈕，記下所選之屬性文字 • 移回『數位相機注重屬性』工作表之R2 • 按『剪貼簿』群組之『貼上』鈕，複製出所記下之屬性文字

按Ctrl+Home、Ctrl+↓，移到所有資料的最底端 • 停於B101，輸入=AVERAGE(B2:B99)算出第1個屬性『價格』之平均注重程度：公式與資料間，至少間隔一列以上，以免被誤認為是原始問卷資料的一部份。

將公式抄給B101:N101，計算出所有屬性（Q23_1～Q23_13）之注重程度均數將公式抄給B101:N101，計算出所有屬性（Q23_1～Q23_13）之注重程度均數 • 於B101:N101尚呈選取之狀態，按『剪貼簿』群組之『複製』鈕，記下所有屬性之注重程度均數之公式 • 按『剪貼簿』群組『貼上』鈕之向下箭頭，選「貼上值(V)」

將其等由公式轉為常數，這純是為了方便後續步驟之轉置。若無此過程，轉置後，將無法取得正確值！將其等由公式轉為常數，這純是為了方便後續步驟之轉置。若無此過程，轉置後，將無法取得正確值！ • 於B101:N101尚呈選取之狀態，切換到『常用』索引標籤，按『剪貼簿』群組『複製』鈕，記下所有屬性之注重程度均數的常數 • 移到『注重程度均數』標題下之S2

按『剪貼簿』群組『貼上』鈕之向下箭頭，選「轉置(T)」按『剪貼簿』群組『貼上』鈕之向下箭頭，選「轉置(T)」 • 可將原以列方式排列之所有屬性的注重程度均數，轉置為以欄方式排列，複製到S2:S14，並按『格式』群組之『增加小數位數』鈕增加其小數位

於T1輸入=RANK(S2,$S$2:$S$14)複製到T2:T14，可依各屬性之注重程度排出等級順序於T1輸入=RANK(S2,$S$2:$S$14)複製到T2:T14，可依各屬性之注重程度排出等級順序由此結果，可看出受訪者於選購數位相機時，所注重之屬性，前五名依序為：『畫素色彩是否清晰』、『操控性(穩定度、速度等)』、『內建記憶體容量及速度』、『與電腦配合執行的軟體』與『連接電腦網路之能力』。

第八章 集中趨勢