1 / 41

CHAPTER 3 如何描述數據

常用的統計量數 集中趨勢量數 平均數 (mean) 中位數 (median) 眾數 (mode). 離散趨勢量數 全距 (range) 變異數 (variance) 標準差 (standard deviation). CHAPTER 3 如何描述數據. 平均數. 設有 n 筆樣本資料 : X 1 , X 2 , … , X n 則其樣本平均數 設有 n 筆母體資料 : X 1 , X 2 , … , X N 則其母體平均數. 平均數是資料的平衡點 ( 重心 ) 平均數的優點是使用到所有資料訊息 平均數的缺點是易受極端值的影響

Download Presentation

CHAPTER 3 如何描述數據

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 常用的統計量數 集中趨勢量數 平均數 (mean) 中位數 (median) 眾數 (mode) 離散趨勢量數 全距 (range) 變異數 (variance) 標準差 (standard deviation) CHAPTER 3 如何描述數據

  2. 平均數 設有n筆樣本資料:X1 , X2 ,…, Xn則其樣本平均數 設有n筆母體資料:X1 , X2 ,…, XN則其母體平均數

  3. 平均數是資料的平衡點(重心) 平均數的優點是使用到所有資料訊息 平均數的缺點是易受極端值的影響 平均數可進行代數演算 平均數的性質

  4. 分組資料平均數的計算

  5. 範例

  6. 中位數 • n 是奇數, 中位數是位置在最中間的該筆資料的值 • n 是偶數, 中位數是位置在最中間的兩筆資料的平均

  7. 範例 • 某英國小鎮在最近五週內所發生的竊盜案件數分別為14、17、20、22,與17件。請找出這個小鎮這五週內竊盜案件數的中位數。 解: 將上列五個數依照大小排列依序為 14、17、17、20、22∵n=5 ∴

  8. 範例 • 12堂道安講習中,出席的違規駕駛人人數分別為37、32、28、40、35、38、40、24、30、37、32與40。請求出其中位數。 解: 將這些數據依照大小順序排列得24 28 30 32 32 35 37 37 38 40 40 40 ∵n=12 ∴

  9. 分組資料中位數的計算

  10. 步驟說明 • 計算次數總和n=Σf=110 • 中位數Md=x(55)(∵110的ㄧ半是55) • 增加一欄位累加次數F • 找出x(55)是落在第6組79.5~89.5內的第4個數據 (∵累積到第5組共51個數據) • 79.5~89.5內39個數據的間距是

  11. 中位數的特質 • 中位數只計算到數列中間位置的一二個數值 • 中位數的優點是不受極端值的影響 • 中位數的缺點是對數據的變化不敏感

  12. 眾數 出現次數大於一而且最多次的數值 • 22、24、23、24、27、25、24、20、24 Mo=24 • 22、24、23、24、22、25、24、20、22 Mo=22和24 • 22、24、23、26、27、25、28、30、34 Mo不存在

  13. 眾數的性質 • 眾數可能有多個或一個都沒有 • 眾數不受極端值影響 • 眾數對數據的變化不敏感 • 眾數適合用於類別資料

  14. 皮爾生經驗法則

  15. 全距 • 最簡單的離散量數就是全距(range) • 全距 R = 最大值 - 最小值 • 全距僅用到資料中的兩個值,因此深受極端值的影響

  16. 變異數與標準差 • 母體變異數 母體標準差 • 樣本變異數 樣本標準差

  17. 變異數與標準差的計算 • 6個樣本數據:80,60,70,60,50,50求算變異數與標準差

  18. 方法一

  19. 方法二

  20. 練習 • 6個樣本數據:3.58,3.59,3.49,3.48,3.55,3.53求其標準差 解: 數據減去3.53再乘上100倍 算出來的標準差 會是原來的100倍 ∴標準差為0.0455

  21. 分組資料變異數和標準差的計算

  22. 範例 • 求下列分組資料的變異數和標準差

  23. 加入組中點m及計算mf和m2f等3個欄位

  24. 簡化計算方式 數據減去23再除以5算出來的標準差 會是原來的1/5倍 標準差為1.682×5=8.41變異數為 2.829×25=70.725

  25. 分組資料求平均數中位數和標準差

  26. 作業 • 試計算下面諸數的標準差 • 計算下面己分組數據的標準差

  27. 平均數和標準差的應用 • 變異係數CV • 變異係數是變異性的相對衡量,它衡量標準差相對於平均值的大小。 • 一般而言,欲比較具有不同的標準差與平均數的資料之離散程度時,變異係數是一個有用的統計量。 母體資料: 樣本資料:

  28. 例:調查某大學150名學生得平均體重為 60公斤,標準差10公斤;另調查某幼稚園學生20名,得平均體重20公斤,標準差4公斤。試比較大學生與幼稚園學生之體重分配,何者差異性較大? 解:若直接利用標準差做比較,自然是大學生體重之差異較大,但此種比較法並不合理。因每位大學生的體重都大於幼稚園學生的體重,其體重標準差亦會大於幼稚園學生體重之標準差。因此,合理的比較法是採用比較體重之變異係數的大小。

  29. 例:調查某大學150名學生得平均體重為 60公斤,標準差10公斤;另調查某幼稚園學生20名,得平均體重20公斤,標準差4公斤。試比較大學生與幼稚園學生之體重分配,何者差異性較大? 大學生體重之變異係數 CV大學= 幼稚園學生體重之變異係數CV幼稚園= 因幼稚園學生體重之變異係數20%大於大學生 體重之變異係數16.67%,故幼稚園學生體重之差異性較大。

  30. 作業 • 本田車之平均價格為美金13,500元,標準差為700元。日產汽車的平均價格為12,500元,標準差為625元,兩者的變異係數CV是多少?那一種車之價格變化較大?

  31. 平均數和標準差的應用 2.Z分數 • 某個數據相對於一組數據的標準化值稱為Z分數 • Z分數代表某個數據在整組數據的相對位置 • 數據X的Z分數定義為: 其中 , S分別為樣本平均數和標準差。

  32. 設某一學生的數學成績為65分,而英文成績為72分。如果已知班上的數學平均60分,標準差20分,而英文平均78分,標準差12分,則該生兩科何者在班上的表現較佳?設某一學生的數學成績為65分,而英文成績為72分。如果已知班上的數學平均60分,標準差20分,而英文平均78分,標準差12分,則該生兩科何者在班上的表現較佳? 解:Z數學= Z英文=   ∴數學成績在班上的表現較佳

  33. 作業 • 甲同學的數學成績是65分,全班數學成績的平均數是78分,標準差是11分,他的英文成績是73分,英文平均分數是85分,標準差是12分,請他的那一門課的成績之排名較高? • 甲班的英文成績之平均數為70,標準差為8,張三之英文成績為80。乙班的英文成績之平均數為65,準差為9,李四英文成績為75,問甲班的張三或乙班的李四誰在相對的排名上比較高?

  34. 平均數和標準差的應用 3.柴比雪夫定理 • 在任何資料集合內至少有 (1 - 1/z2)百分比的觀察值與平均數的差距在z個標準差之內,此處z為任何大於 1之值。 • 對任何形態的資料,計算其平均數 及標準差 S 後,可得下列結果:對任意數 Z >1,則至少有 比例的資料落在 之間。

  35. 柴比雪夫定理 • 至少有0% 的觀察值,與平均數的差距在1個標準差之內。 • 至少有75% 的觀察值,與平均數的差距在2個標準差之內。 • 至少有89% 的觀察值,與平均數的差距在3個標準差之內。 • 至少有94% 的觀察值,與平均數的差距在4個標準差之內。

  36. 若某學院商用統計課程有100位學生修課,期中考成績之平均數為70,標準差為5。有多少學生的分數介於60與80之間?又有多少學生的分數介於58與82之間?若某學院商用統計課程有100位學生修課,期中考成績之平均數為70,標準差為5。有多少學生的分數介於60與80之間?又有多少學生的分數介於58與82之間? 解: (60,80)=70±10=70±2×5∴至少有75位學生 (58,82)=70±12=70±2.4×5∴至少有83位學生

  37. 平均數和標準差的應用 4.經驗法則 如果資料呈鐘形分配 • 約有68%的數據會包含在 範圍內 • 約有95%的數據會包含在 範圍內 • 約有99.7%的數據會包含在 範圍內

  38. 99.7% 95% 68% 經驗法則 34% 34% 0.15% 2.35% 2.35% 0.15% 13.5% 13.5% m –3s m m+ 3s m–1s m+ 1s m –2s m+2s

  39. 若某學院商用統計課程有100位學生修課,期中考成績之平均數為70,標準差為5,假設成績成鐘型分布。問有多少學生的分數介於60與80之間?若某學院商用統計課程有100位學生修課,期中考成績之平均數為70,標準差為5,假設成績成鐘型分布。問有多少學生的分數介於60與80之間? 解: (60,80)=70±10=70±2×5∴大約有95位學生

More Related