170 likes | 323 Views
樣本數決策 Hsiao-Li Yu. 抽樣分配 (sampling distribution). -σ. 2σ. -2σ. μ. σ. σ. μ. ……. 抽樣時, n 愈大 愈易分開兩族群 那 n 到底要多少 ?. (n=1000). (n=500). (n=200). 樣本數決定. 數理統計 1. confidence limits 2. degree of confidence 3. variance of population 4. data types. 現實因素 研究經費與調查成本的因素. Data levels.
E N D
抽樣分配(sampling distribution) -σ 2σ -2σ μ σ σ μ …….
抽樣時,n愈大愈易分開兩族群 • 那n到底要多少? (n=1000) (n=500) (n=200)
樣本數決定 數理統計 1. confidence limits 2. degree of confidence 3. variance of population 4. data types 現實因素 研究經費與調查成本的因素
Data levels • 名目尺度(Nominal measurements) • 量測值則不具大小的意義 • e.g. 男1、女2;北市1、高市2 • 順序尺度(Ordinal measurements) • 意義並非表現在其值而是在其順序之上 • e.g. 不痛0、痛1、很痛2、超痛3 • 等距尺度(Interval measurements) • 定義資料間的距離是相等的,但是零值並非絕對 • e.g. 溫度?(攝氏零度,不代表沒有熱量)智商?(IQ零,不代表…) • 等比尺度(Ratio measurements) • 擁有零值及資料間的距離是相等的
Variance of population • 母群變異數↑→樣本數↑ • 母群變異愈小,樣本數就可以少 服藥 未服藥 σ σ μo: 尿酸值 μa: 尿酸值
Degree of confidence 68.3% 95.5% 99.7% σ σ 2σ 2σ 3σ 3σ • 1-α,為主觀機率可自行決定 • 通用: 95%、 90% • (1-α)愈小,愈易落在拒絕域 ∞ μ -∞ = Md = Mo
Confidence limits 1-α α/2 α/2 • P ( | - | d ) 1 - ,其中d 稱為信賴界限 • d、1 信賴區間 (confidence Interval)
誤差類型 • 誤差: 型ㄧ誤差,Ho為真,卻推翻 • β誤差: 形二誤差,Ho錯誤,卻無法推翻 Distribution of Under Ho N (μo, σ2/n) Distribution of Under Ha N (μa, σ2/n) Area= α Area= 1-β Acceptance region Reject region μo μa
什麼狀況下,n可以小ㄧ點? • 母群變異數小 • (1-α)小 • d 大 • β小
為估計新竹市全家人都不規律運動住戶比例 p,於新竹市隨機訪問400戶家庭,結果其中有60戶家庭全家都不規律運動。 • 估計 p值。 • 求 p 的 95 % 信賴區間。 • 若希望 (a) 中估計的 95 % 的誤差界限為 0.03,求適當的訪問戶數。 • 若不以上述樣本為試查樣本,且已知 ,則希望 (a) 中估計的 95 % 誤差界限為0.03,求適當的訪問戶數。
舉例 • 已知μ為台灣成年男性的血膽固醇平均值,標準差為46mg/dL。若α=0.01,母群實際平均值為211mg/dL,希望僅有5%機會未能拒絕虛無假說(Ho: μ≦180mg/dL),在此情況下樣本數要多大? • 僅有5%機會未能拒絕Ho設定β=0.05,檢力為0.95 z= -1.645 • α=0.01要拒絕Ho z≧2.32 Area= α Area= β Acceptance region Reject region μo μa
α↓ β↓ Area= α Area= β Acceptance region Reject region μo μa
兩組或兩組以上統計推論流程圖 兩組或兩組以上統計推論流程圖 推論平均值(means) 推論變異數(variances) 一樣本vs.母群 樣本vs.樣本 一樣本vs.母群 樣本vs.樣本 σ2已知;大樣本 σ2已知;大樣本 σ2未知 σ2未知 σ2等同 σ2不同 z t Appro. t z t χ2 F
參考軟體 • G power • Sample Size Calculator
我也不知道要掰什麼了… • 有問題嗎?