410 likes | 566 Views
常用的統計量數 集中趨勢量數 平均數 (mean) 中位數 (median) 眾數 (mode). 離散趨勢量數 全距 (range) 變異數 (variance) 標準差 (standard deviation). CHAPTER 3 如何描述數據. 平均數. 設有 n 筆樣本資料 : X 1 , X 2 , … , X n 則其樣本平均數 設有 n 筆母體資料 : X 1 , X 2 , … , X N 則其母體平均數. 平均數是資料的平衡點 ( 重心 ) 平均數的優點是使用到所有資料訊息 平均數的缺點是易受極端值的影響
E N D
常用的統計量數 集中趨勢量數 平均數 (mean) 中位數 (median) 眾數 (mode) 離散趨勢量數 全距 (range) 變異數 (variance) 標準差 (standard deviation) CHAPTER 3 如何描述數據
平均數 設有n筆樣本資料:X1 , X2 ,…, Xn則其樣本平均數 設有n筆母體資料:X1 , X2 ,…, XN則其母體平均數
平均數是資料的平衡點(重心) 平均數的優點是使用到所有資料訊息 平均數的缺點是易受極端值的影響 平均數可進行代數演算 平均數的性質
中位數 • n 是奇數, 中位數是位置在最中間的該筆資料的值 • n 是偶數, 中位數是位置在最中間的兩筆資料的平均
範例 • 某英國小鎮在最近五週內所發生的竊盜案件數分別為14、17、20、22,與17件。請找出這個小鎮這五週內竊盜案件數的中位數。 解: 將上列五個數依照大小排列依序為 14、17、17、20、22∵n=5 ∴
範例 • 12堂道安講習中,出席的違規駕駛人人數分別為37、32、28、40、35、38、40、24、30、37、32與40。請求出其中位數。 解: 將這些數據依照大小順序排列得24 28 30 32 32 35 37 37 38 40 40 40 ∵n=12 ∴
步驟說明 • 計算次數總和n=Σf=110 • 中位數Md=x(55)(∵110的ㄧ半是55) • 增加一欄位累加次數F • 找出x(55)是落在第6組79.5~89.5內的第4個數據 (∵累積到第5組共51個數據) • 79.5~89.5內39個數據的間距是
中位數的特質 • 中位數只計算到數列中間位置的一二個數值 • 中位數的優點是不受極端值的影響 • 中位數的缺點是對數據的變化不敏感
眾數 出現次數大於一而且最多次的數值 • 22、24、23、24、27、25、24、20、24 Mo=24 • 22、24、23、24、22、25、24、20、22 Mo=22和24 • 22、24、23、26、27、25、28、30、34 Mo不存在
眾數的性質 • 眾數可能有多個或一個都沒有 • 眾數不受極端值影響 • 眾數對數據的變化不敏感 • 眾數適合用於類別資料
全距 • 最簡單的離散量數就是全距(range) • 全距 R = 最大值 - 最小值 • 全距僅用到資料中的兩個值,因此深受極端值的影響
變異數與標準差 • 母體變異數 母體標準差 • 樣本變異數 樣本標準差
變異數與標準差的計算 • 6個樣本數據:80,60,70,60,50,50求算變異數與標準差
練習 • 6個樣本數據:3.58,3.59,3.49,3.48,3.55,3.53求其標準差 解: 數據減去3.53再乘上100倍 算出來的標準差 會是原來的100倍 ∴標準差為0.0455
範例 • 求下列分組資料的變異數和標準差
簡化計算方式 數據減去23再除以5算出來的標準差 會是原來的1/5倍 標準差為1.682×5=8.41變異數為 2.829×25=70.725
作業 • 試計算下面諸數的標準差 • 計算下面己分組數據的標準差
平均數和標準差的應用 • 變異係數CV • 變異係數是變異性的相對衡量,它衡量標準差相對於平均值的大小。 • 一般而言,欲比較具有不同的標準差與平均數的資料之離散程度時,變異係數是一個有用的統計量。 母體資料: 樣本資料:
例:調查某大學150名學生得平均體重為 60公斤,標準差10公斤;另調查某幼稚園學生20名,得平均體重20公斤,標準差4公斤。試比較大學生與幼稚園學生之體重分配,何者差異性較大? 解:若直接利用標準差做比較,自然是大學生體重之差異較大,但此種比較法並不合理。因每位大學生的體重都大於幼稚園學生的體重,其體重標準差亦會大於幼稚園學生體重之標準差。因此,合理的比較法是採用比較體重之變異係數的大小。
例:調查某大學150名學生得平均體重為 60公斤,標準差10公斤;另調查某幼稚園學生20名,得平均體重20公斤,標準差4公斤。試比較大學生與幼稚園學生之體重分配,何者差異性較大? 大學生體重之變異係數 CV大學= 幼稚園學生體重之變異係數CV幼稚園= 因幼稚園學生體重之變異係數20%大於大學生 體重之變異係數16.67%,故幼稚園學生體重之差異性較大。
作業 • 本田車之平均價格為美金13,500元,標準差為700元。日產汽車的平均價格為12,500元,標準差為625元,兩者的變異係數CV是多少?那一種車之價格變化較大?
平均數和標準差的應用 2.Z分數 • 某個數據相對於一組數據的標準化值稱為Z分數 • Z分數代表某個數據在整組數據的相對位置 • 數據X的Z分數定義為: 其中 , S分別為樣本平均數和標準差。
設某一學生的數學成績為65分,而英文成績為72分。如果已知班上的數學平均60分,標準差20分,而英文平均78分,標準差12分,則該生兩科何者在班上的表現較佳?設某一學生的數學成績為65分,而英文成績為72分。如果已知班上的數學平均60分,標準差20分,而英文平均78分,標準差12分,則該生兩科何者在班上的表現較佳? 解:Z數學= Z英文= ∴數學成績在班上的表現較佳
作業 • 甲同學的數學成績是65分,全班數學成績的平均數是78分,標準差是11分,他的英文成績是73分,英文平均分數是85分,標準差是12分,請他的那一門課的成績之排名較高? • 甲班的英文成績之平均數為70,標準差為8,張三之英文成績為80。乙班的英文成績之平均數為65,準差為9,李四英文成績為75,問甲班的張三或乙班的李四誰在相對的排名上比較高?
平均數和標準差的應用 3.柴比雪夫定理 • 在任何資料集合內至少有 (1 - 1/z2)百分比的觀察值與平均數的差距在z個標準差之內,此處z為任何大於 1之值。 • 對任何形態的資料,計算其平均數 及標準差 S 後,可得下列結果:對任意數 Z >1,則至少有 比例的資料落在 之間。
柴比雪夫定理 • 至少有0% 的觀察值,與平均數的差距在1個標準差之內。 • 至少有75% 的觀察值,與平均數的差距在2個標準差之內。 • 至少有89% 的觀察值,與平均數的差距在3個標準差之內。 • 至少有94% 的觀察值,與平均數的差距在4個標準差之內。
若某學院商用統計課程有100位學生修課,期中考成績之平均數為70,標準差為5。有多少學生的分數介於60與80之間?又有多少學生的分數介於58與82之間?若某學院商用統計課程有100位學生修課,期中考成績之平均數為70,標準差為5。有多少學生的分數介於60與80之間?又有多少學生的分數介於58與82之間? 解: (60,80)=70±10=70±2×5∴至少有75位學生 (58,82)=70±12=70±2.4×5∴至少有83位學生
平均數和標準差的應用 4.經驗法則 如果資料呈鐘形分配 • 約有68%的數據會包含在 範圍內 • 約有95%的數據會包含在 範圍內 • 約有99.7%的數據會包含在 範圍內
99.7% 95% 68% 經驗法則 34% 34% 0.15% 2.35% 2.35% 0.15% 13.5% 13.5% m –3s m m+ 3s m–1s m+ 1s m –2s m+2s
若某學院商用統計課程有100位學生修課,期中考成績之平均數為70,標準差為5,假設成績成鐘型分布。問有多少學生的分數介於60與80之間?若某學院商用統計課程有100位學生修課,期中考成績之平均數為70,標準差為5,假設成績成鐘型分布。問有多少學生的分數介於60與80之間? 解: (60,80)=70±10=70±2×5∴大約有95位學生