1 / 84

第 2 章

第 2 章. 圖表敘述法. 導論. 敘述統計 (descriptive statistics) 涉及安排、彙總與呈現一組 資料 ,以產生有用的 資訊 。 它的方法是使用圖表法與數值敘述量數 ( 如平均值 ) 來彙總與呈現資料。. 統計. 資料. 資訊. 第 2 章 圖表敘述法 第 15 頁. 母體 & 樣本. 在此呈現的圖示法 & 表格法可應用於描述整個母體 與 從母體中所抽出的樣本. 母體. 樣本. 子集合. 第 2 章 圖表敘述法. 定義.

pearl-brock
Download Presentation

第 2 章

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第2章 圖表敘述法

  2. 導論 敘述統計(descriptive statistics) 涉及安排、彙總與呈現一組資料,以產生有用的資訊。 它的方法是使用圖表法與數值敘述量數( 如平均值) 來彙總與呈現資料。 統計 資料 資訊 第2章 圖表敘述法第15頁

  3. 母體 & 樣本 在此呈現的圖示法 & 表格法可應用於描述整個母體與從母體中所抽出的樣本 母體 樣本 子集合 第2章 圖表敘述法

  4. 定義 • 變數(variable) 是指一個母體或樣本的某些特性。 例如:統計學考試的成績,通常使用大寫的英文字母如X、Y 和Z 來表達變數的名稱。 • 變數的值(values) 是變數可能的觀測值。 例如:統計學考試成績的數值是介於0 到100 之 間的整數。 • 資料(data)是觀測到的變數值。 例如,我們觀察10 個學生期中考的成績,得到 如下的資料:{67, 74, 71, 83, 93, 55, 48, 82, 68, 62} 第2章 圖表敘述法第15-16頁

  5. 資料和資訊的類型 資料的型態有三種: 區間資料 名目資料 順序資料 第2章 圖表敘述法第15-16頁

  6. 區間資料 區間資料 • 區間資料(interval data)是實際的數字,諸如身高、 體重、所得和距離之類。 • 我們也稱此類型的資料是屬量的(quantitative) 或數值的(numerical)。 第2章 圖表敘述法第15頁

  7. 名目資料 名目資料 • 名目(nominal) 資料的值是類別。例如,我們使用下列編碼(codes)來記錄婚姻狀態: 單身 = 1,已婚 = 2,離婚 = 3,鰥寡= 4 這些值並不是數字,而是描述類別的文字。 • 名目資料也被稱為是屬質的(qualitative) 或類別的 (categorical)。 第2章 圖表敘述法第15-16頁

  8. 順序資料 順序(ordinal) 資料 • 看起來像名目資料,但順序資料值的順序是有意義的。 例如,大多數的學院或大學在課程完成後, 學生會被要求為該課程填寫考評。 不好 = 1,普通 = 2,良好 = 3, 很好 = 4,非常好 = 5 • 代表順序資料的編碼,除了依照順序外,是任意指定的。 第2章 圖表敘述法I 第16頁

  9. 各種類型資料的計算 • 幾乎所有的計算都適用於區間資料。 • 因為名目資料的編碼是任意指定的,所以我們無法對這些編碼執行任何的計算。 • 順序資料最重要的一點就是資料值的順序。因此,唯一被許可的計算是涉及排序的處理過程。 • 資料類型的定義與層級整理如下。 第2章 圖表敘述法第17-18頁

  10. 資料的階層 區間 資料值是實際的數字。 所有的運算皆有效。 資料可以被視為順序或名目資料來處理。 順序 資料值必須呈現資料的順序。 立基於排序過程的運算是有效的。 資料可以被當成名目資料但不可以被當成區間資料來處理。 名目 資料值是代表類別的任意數字。 唯有立基於發生次數或百分比的計算才是有效的。 資料不能被當成順序資料或區間資料來處理。 第2章 圖表敘述法第19頁

  11. 描述名目資料的圖示法和表格法 • 唯一能夠對名目資料進行的運算是計算變數的每一個值所出現的次數或是計算其出現的百分比。 • 我們以一個表格來彙整資料呈現變數的類別與計數,稱為次數分配(frequency distribution)。 • 相對次數分配(relative frequency distribution)則是列出變數的類別以及它們會發生的比例。 第2章 圖表敘述法第21頁

  12. 範例2.1 2008 年GSS 的工作狀況調查 GSS2008* 在第1 章中,我們簡要地介紹了一般社會調查。在2008 年的調查中受訪者被問及下列的問題。 「上週你做的工作是全職、兼職、上學、家管,或是什麼?」回應如下: 1. 全職工作 5. 退休 2. 兼職工作 6. 上學 3. 暫時沒有上班 7. 家管 4. 失業,資遣 8. 其他 第2章 圖表敘述法第21頁

  13. 範例2.1 2008 年GSS 的工作狀況調查 回應分別使用編碼1, 2, 3, 4, 5, 6, 7 和8 記錄著。前150 個觀測值在此列出。變數名稱為WRKSTAT(Work Status),而且資料被儲存在第16 欄 (Excel 中的P 欄)。 對這些資料建構一個次數以及相對次數分配,並透過製作一個長條圖或圓形圖對資料做圖形的彙整。 第2章 圖表敘述法第21頁

  14. 範例2.1 2008 年GSS 的工作狀況調查 第2章 圖表敘述法第21頁

  15. 表2.1 範例2.1 的次數分配與相對次數分配 第2章 圖表敘述法第22頁 表2.1

  16. 範例2.1 的長條圖 • 長條圖(bar chart)通常被用來呈現次數。 第2章 圖表敘述法第23頁 圖2.1

  17. 範例2.1 的圓形圖 • 圓形圖(pie chart)用圖表示相對次數。 第2章 圖表敘述法第24頁 圖2.2

  18. 範例2.2 美國在2007年的能源消耗 Xm02-02 表2.3 列出2007 年美國使用的各種來源之能源消耗總量。 為了更容易了解細節,表中以萬億英熱單位(BTUs)表是熱能的測量值。 使用一個適當的圖示法說明這些數字。 第2章 圖表敘述法第25頁

  19. 表2.3  2007 年美國能源消耗量以來源種類計 第2章 圖表敘述法第25頁 表2.3

  20. 圖2.3 範例2.2 的圓形圖 第2章 圖表敘述法第26頁 圖2.3

  21. 描述順序資料 • 順序資料沒有特定的圖示法。 • 因此,當我們要描述一組順序資料時,我們將資 料視為名目資料,並且使用本節描述的方法。 • 唯一的準則是,長條圖中的長條應該要按照編碼 數值安排成遞增(或遞減) 的類別順序。 • 在圓形圖中,典型的方式是將圓形切片以順時鐘 方向排列成遞增或遞減的類別順序。 第2章 圖表敘述法第28頁 2.21

  22. 兩個名目變數間關係 • 在2.2 節,我們曾提出使用圖形與表格方法來彙總一組名目資料。 • 交叉分類表(cross-classification table)又稱為交叉表(cross-tabulation table),是用來描述兩個名目變數之間的關係。 • 一個交叉分類表列出兩個變數每一種數值組合的次數。 第2章 圖表敘述法第29頁

  23. 範例2.4 閱報讀者的意見調查 在一個主要的北美城市中,有四種相互競爭的報紙:《環球郵報》(Globe and Mail, G&M)、《郵報》(Post)、《星報》(Star),與《太陽報》(Sun)。 為了促進廣告活動的設計,報社的廣告部經理需要知道哪個報紙市場的區隔是該報的讀者。 所以,執行一項分析閱報讀者與職業之間關係的調查。 第2章 圖表敘述法第29頁

  24. 範例2.4 閱報讀者的意見調查 樣本中的每一位閱報讀者都被要求回答他們閱讀哪一家的報紙:《環球郵報》(1)、《郵報》(2)、《星報》(3)、《太陽報》(4),並且指出他們是否為藍領工作者(1)、白領工作者(2),或專業人士(3)。判斷兩個名目變數是否有關聯。 這些答覆使用編碼被儲存在Xm02-04裡。 第2章 圖表敘述法第29頁

  25. 範例2.4 閱報讀者的意見調查 以計算12 種組合中每一組出現的次數,產生了表2.5。 第2章 圖表敘述法第30頁 表2.5

  26. 範例2.4 閱報讀者的意見調查 如果職業與所閱讀的報紙是相關聯的,則各種職業間閱讀的報紙將存在著差異。一種簡單的方法是將每一列( 或行) 的次數轉換成每一列( 或行) 的相對次數。也就是,計算每一列( 或行) 的總數,並將各個次數除以該列( 或行) 的總數。 第2章 圖表敘述法第30頁

  27. 表2.6 範例2.4的列相對次數 第2章 圖表敘述法第30頁 表2.6

  28. 範例2.4 閱報讀者的意見調查 詮釋:注意到在第2 列與第3 列中的相對次數是相似的,而第1 列與第2 列和第3列之間則有很大的差異。 這告訴我們藍領工作者傾向於與白領工作者和專業人士閱讀不同的報紙,而白領工作者與專業人士在報紙的選擇上則比較相似。 不相似 相似 第2章 圖表敘述法第30頁 表2.6

  29. 範例2.4 閱報讀者的意見調查 第2章 圖表敘述法第31頁 2.29

  30. 描述一組區間資料的圖示法 我們介紹幾種用在區間資料的圖示法。 這些方法中最重要的一種是直方圖(histogram)。 直方圖不僅是一種用以彙整區間資料的有效繪圖方法,而且有助於解說一些機率的重要性質(見第8章)。 第2章 圖表敘述法第32頁

  31. 範例2.5 長途電話帳單的分析 Xm03-01 隨著電話服務解禁之後,數家新公司成立以投入長途電話服務商場的競爭。由於每一家提供的服務都相當類似,幾乎所有的公司都在價格上競爭。面對劇烈的競爭,要為一項服務或產品訂定價格是非常困難的。需要考慮的因素包括供給、需求、價格彈性,與競爭者的各種行動。長途電話費率的組合方式可能採分鐘計費、每月基本費率,或是兩種方式的某種組合。要決定適當的費率結構,需獲得顧客行為的資訊,特別是每月長途電話費多寡的資訊。 第2章 圖表敘述法第32-33頁 2.31

  32. 範例2.5 長途電話帳單的分析 做為一個大型研究的一部分,某長途電話公司想要獲得新客戶與公司簽約後第一個月的電話費資訊。這家公司的行銷經理對200 位新客戶作調查,記錄他們第一個月的帳單。這些資料如Xm03-01所示。這位經理計畫將他的發現報告給資深總裁。從這些資料中能抽取出什麼樣的資訊? 第2章 圖表敘述法第33頁 2.32

  33. 範例2.5 長途電話帳單的分析 在前面章節中,次數分配是以計算名目變數在每一個類別所發生的次數而建立的。對於區間資料的次數分配,我們則計算觀測值分別落在一系列區間內的次數,這些區間稱為類組(classes),它們涵蓋了觀測值完整的數值範圍。 我們稍後會討論如何決定類組的組數以及區間的上限(upper limits) 與下限(lower limits)。 第2章 圖表敘述法第33-34頁 2.33

  34. 範例2.5 長途電話帳單的分析 我們已選定了八個類組,它們是以每一個觀測值只落在一個且唯一的一個類組的原則下定義而成的。這些類組的定義如下: 類組 金額小於或等於15 金額大於15 但小於或等於30 金額大於30 但小於或等於45 金額大於45 但小於或等於60 金額大於60 但小於或等於75 金額大於75 但小於或等於90 金額大於90 但小於或等於105 金額大於105 但小於或等於120 第2章 圖表敘述法第34頁 2.34

  35. 圖2.5 範例2.5 的直方圖 第2章 圖表敘述法第35頁 圖2.5 2.35

  36. 詮釋 長途電話帳單 帳單 大約半數的每月帳單金額 是很小的 較多的長途電話帳單金額落 在高額區段 少數帳單金額是在中間區段 第2章 圖表敘述法第35頁 2.36

  37. 建立一個直方圖 獲得資料 建立一個次數分配表 決定類組的組數 表2.8: 這個表告訴我們使用7, 8, 9, 10個類組。 另一種取代表2.8準則的方法是使用史特基公式(Sturges’s formula):類組區間的組數=1+3.3 log (n) 第2章 圖表敘述法第35頁 表2.8 2.37

  38. 建立一個直方圖 獲得資料 建立一個次數分配表 a)決定類組的組數[8] b)區間的上限(upper limits) 與下限(lower limits) 範圍 = 最大觀測值 – 最小觀測值 範圍 = $119.63 – $0 = 119.63 類組寬度:範圍 ÷ (# 組數) = 119.63 ÷ 8 ≈ 15 第2章 圖表敘述法第35-36頁 2.38

  39. 建立一個直方圖 表2.7 範例2.5長途電話帳單的次數分配 第2章 圖表敘述法第34頁 表2.7 2.39

  40. 建立一個直方圖 第2章 圖表敘述法第34-35頁 表2.7&圖2.5 2.40

  41. 直方圖的形狀 對稱性 一個直方圖被稱為是對稱的(symmetric)。如果我們從直方圖的正中央向下畫一條垂直線,兩邊的形狀和大小剛好是相同的。 第2章 圖表敘述法第37頁 圖2.6 2.41

  42. 直方圖的形狀 偏斜 一個偏斜的直方圖是指一個有向右方或向左方延伸長尾的直方圖。 正偏 負偏 第2章 圖表敘述法第38頁 圖2.7 2.42

  43. 直方圖的形狀 眾數類組的個數 一個單峰直方圖(unimodal histogram) 具有一個高峰,雙峰直方圖(bimodal historgram) 則具有兩個高峰。 單峰 雙峰 眾數組(modal class) 是一個含有最多觀測值的類組 第2章 圖表敘述法第38頁 圖2.8&圖2.9 2.43

  44. 直方圖的形狀 鐘形 一種特別的對稱單峰直方圖是呈鐘形的。 次 數 變數 鐘形 第2章 圖表敘述法第38頁 2.44

  45. 範例2.6 比較兩種投資的報酬率 Xm03-02 假設你面臨一項投資決策,你有一筆小額財產, 那是暑期工作所得再扣除明年預計花費之後的餘 額。 一位朋友建議兩種投資,為了有助於做決定,你 取得每種投資的一些報酬率。 你想要知道你期待的報酬是什麼外加一些其他類 型的資訊,例如報酬率散佈的範圍是否很廣( 使得 投資具高風險),或是緊密地聚集在一起( 表示風險 相對地低)。 第2章 圖表敘述法第40頁 2.45

  46. 範例2.6 比較兩種投資的報酬率 這些資料是否告訴你可能做得極好而幾乎不會有 巨大的損失?你是否可能會虧損( 負的報酬率) ? 兩種投資的報酬率如Xm03-02所列。為每一組報酬 率畫出直方圖並報告你的發現。你將會選擇哪一 種投資,為什麼? 第2章 圖表敘述法第40頁 2.46

  47. 範例2.6 比較兩種投資的報酬率 第2章 圖表敘述法第40頁 2.47

  48. 範例2.7 商業統計學成績Xm03-03* 一位商業學程的學生目前正要修習他的第一門統 計學必修課。這位學生有一點擔憂,因為聽說這 是一門很困難的課。 為了緩和自己的焦慮,這位學生詢問教授這門課 程去年的成績。這位教授答應了學生的要求並提 供給他一份包含學期作業與期末考的最後總成績 資料。 根據Xm03-03的分數,畫一個直方圖並且描述其結 果。 第3章 圖表敘述法II第51頁 2.48

  49. 範例2.7 商業統計學成績 第2章 圖表敘述法第42頁 2.49

  50. 範例2.8 數理統計學的成績Xm03-04* 假設範例2.7 中的這位學生得到一份去年數理統計 課的成績清單。這門課強調公式的推導與理論的 證明。 使用Xm03-04的資料畫一個直方圖,並且將其與範 例 3.3所得到的圖相比較。這個直方圖告訴你什麼 訊息? 第2章 圖表敘述法第42頁 2.50

More Related