560 likes | 841 Views
生物統計學. Office:1619-1 TEL:3210 OFFICE HOUR: see schedule/outline SOFTWARES: SPSS, EXCEL BOOKS: SPSS HELP and TUTORIALS are sufficient but you can choose your favorite Chinese textbooks GRADE: MID:30% FINAL:30% QUIZZES & PROJECTS:40%. 第 1 章. 統計是甚麼. 流程圖意義:
E N D
生物統計學 • Office:1619-1 • TEL:3210 • OFFICE HOUR: see schedule/outline • SOFTWARES: SPSS, EXCEL • BOOKS: SPSS HELP and TUTORIALS are sufficient but you can choose your favorite Chinese textbooks • GRADE: • MID:30% • FINAL:30% • QUIZZES & PROJECTS:40%
第 1 章 統計是甚麼
流程圖意義: 1. 由建立假設到建立資料檔的過程是與實驗 或問卷設計有關的範圍 2. 由資料檔到驗證假設的過程是屬於統計分 析的範圍。 • 學習目標:瞭解統計分析的完整流程。
統計學的定義: • 描述統計學(descriptive statistics)或敘述統計學:由資料檔到算出統計量,能夠完整顯示出樣本特性的過程或方法。 • 推論統計學(inferential statistics):推論母數並驗證研究假設的過程或方法。 • 統計學(statistics):將依據研究假設蒐集的資料分類、解釋和分析,得到客觀和合理結論的過程或方法。包含敘述統計學和推論統計學二大領域。
理論統計學(pure statistics):演繹或驗證統計學公式或原理。 • 應用統計學(applied statistics):將公式或原理拿來適當應用。 • 生物統計學(biostatistics 或biometry):用來解決有關生物各種問題的統計學,是屬於應用統計學的範疇。
結語: • 宇宙或世界是一個綜合性的大母體,「人」經常被迫在統計過程中扮演不同角色,可能是一位主導者(研究人員)、一粒棋子(樣本)、或使用統計結果的受益者(母體中的其他人員)。統計學不但能夠幫助你規劃人生,還能夠幫助你克服困難。
電腦的應用 1. 為初學者設計的Minitab。 2. 具有較完善功能的SAS(Statistical Analysis Systems)。 3. 具有多方功能的SPSS(Statistical Product and Service Solutions)。 4. 為生物醫學設計的BMDP(Biomedical Computer Programs)。 5. 最容易取得的Microsoft Excel,適合初學者以及小型研究者的運用。因此本書採用Microsoft Excel作為統計分析的輔助工具。 • 常用的軟體有下列數種:
第 2 章 如何界定母體與抽樣
學習目標:瞭解母體與樣本的關係以及抽樣方法的選擇原則。學習目標:瞭解母體與樣本的關係以及抽樣方法的選擇原則。 • 母體 (population) 或母群體:想知道群體現象答案的群體,可能是人、動物、植物、或物品。是由數量龐大的基本單元 (element) 組成的。 • 母數 (parameters) 或參數:用數量來表示的母體特性。必須先確定母體,才有可能得到母數。
2.1 普查與抽樣 • 有限母體 (finite population):基本單元固定和穩定,很容易計算出來的母體。 • 無限母體 (infinite population) :基本單元不確定,不容易計算出來的母體。 • 普查 (census):對母體裡所有個體直接蒐集資料得到母數的方法。得到的母數,是誤差最小的數據。 • 樣本 (sample):母體裡少數提供蒐集資料的個體,可能是人、條、尾、粒、個、戶、家族、班、部門、或生產線。 • 抽樣 (sampling):取得樣本的過程。 • 統計分析:由描述統計學得到樣本的共同特性,再經由推論統計學推論無限母體共同特性的過程。
2.2 目標母體與研究母體 • 目標母體 (target population):依據研究目的適當界定範圍的無限母體。 • 研究母體 (study population):實際用來抽樣的母體。 • 母體涵蓋不全 (population under-coverage):研究母體不能完全替代目標母體。統計上的第一個誤差會在這裡產生。
(2-1) 2.3 樣本數 • 決定樣本數(sample size)的簡單通則: 1. 樣本數是 n,研究母體抽樣名冊(sampling frame)數量是N,抽樣比 SF(sampling fraction) 不要超過 1%:
2. 樣本數分為大樣本和小樣本,會影響後續統計推論方法的選擇。2. 樣本數分為大樣本和小樣本,會影響後續統計推論方法的選擇。 3. 樣本數愈多,抽樣誤差愈小,花費時間和經費愈多,反之亦然。 4. 適當樣本數是依據實際情況和研究者的經驗來決定,而閱讀相關研究報告或文獻,是協助定出適當樣本數最有效方法。 5. 樣本有可能流失時,應依據預估樣本流失率,增加樣本預估數。
2.4抽樣方法 • 抽樣方法:隨機抽樣(random sampling)和非隨機抽樣(nonrandom sampling)。 • 隨機抽樣:每個樣本被抽到的機會有一定的機率。 • 非隨機抽樣:每個樣本被抽到的機會不能確定。 • 樣本涵蓋不全(sample under-coverage):樣本不能代表研究母體,產生抽樣偏差。
2.4.1 簡單隨機抽樣法 • 簡單隨機抽樣法(simple random sampling):將研究母體中的每個基本單元按順序編上一個識別號碼(代碼),被抽到的號碼就是樣本。通常用於將同質性的樣本隨機分組。
(2-2) 2.4.2 系統抽樣法 • 系統抽樣法(systematic sampling)或等距離抽樣法:將研究母體中的每個基本單元按順序編上一個識別號碼後,算出抽樣距離D(sampling interval),再由前面D個基本單元中,利用簡單隨機抽樣法抽出其中一個號碼A0當首項,用抽樣距離 D當公差,算出等差級數的樣本號碼依序是 A0、A0+D、A0+2D、A0+3D…等等。抽樣距離 D 的計算公式是: 如果不能整除,最好先捨成整數。
2.4.3 分層抽樣法 • 分層抽樣法(stratified sampling):先將研究母體依基本單元的屬性分為數層,再由各層中依基本單元數量比例分別抽出所需樣本數的方法。 2.4.4 整群抽樣法 • 整群抽樣法(cluster sampling)、集群抽樣法、集束抽樣法、叢集抽樣法、叢束抽樣法或部落抽樣法:當研究母體內部基本單元是群組織型態時,抽出其中一些群當樣本的方法。
2.4.5 便利抽樣法 • 便利抽樣法(convenience sampling)、方便抽樣法或偶遇抽樣法(accidental sampling):以最容易得到或遇到研究母體裡的基本單元當樣本。包含自發性回應樣本(voluntary response sample)和偶遇樣本(accidental sample)。 2.4.6 判斷抽樣法 • 判斷抽樣法(judgment sampling)、判定抽樣法、立意抽樣法(purpose sampling)或依意抽樣法:抽樣人員憑經驗和專業知識,主觀從研究母體選取適合研究所需的基本單元當樣本。
2.4.7 多段抽樣法 • 多段抽樣法(multi-stage sampling)或多期抽樣法(multi-phase sampling):將上述抽樣方法混合使用。為了降低抽樣誤差。
2.5抽樣工具 • 籤、卡片、搖獎機、隨機號碼表(random number table)或電腦。 2.5.1 基本觀念2.5.2 檔案抽樣法 • 檔案抽樣法:用電腦檔案直接抽樣。 2.5.3 隨機亂數抽樣法 • 隨機亂數抽樣法:沒有現成電腦資料檔,利用電腦產生的亂數抽樣。
2.6 抽樣誤差 • 機會誤差(chance error):自然現象,是產生隨機抽樣誤差(random sampling error)的主因。 • 抽樣偏差(sampling bias):樣本涵蓋不全,是產生非隨機抽樣誤差的主因。 • 標準誤差(standard error):將統計量與母數之間的差異定義為隨機抽樣誤差,通常用標準誤差表示。標準誤差會隨樣本數的增加而減少,是各種誤差中,唯一可以依據統計理論計算出來的誤差。
2.8 結語 • 理想情況: 1. 無限母體 2. 沒有母體和樣本涵蓋不全 3. 樣本具有十足代表性 4. 採用隨機抽樣 5. 大樣本
第 3 章 如何定義與蒐集資料
學習目標:瞭解資料的類型和蒐集方法。 3.1 組成資料的元素 • 資料(data):一堆雜亂無章文字或數字記載,又稱數據(data)。 • 變項(variable)、變量或變數:相同性質的資料。 • 種類(categories)或變數:變項的內容,文字或數字。 • 因子(factor)或因素:屬性相同的變項。
3.2資料的來源 • 初級資料(primary data)、原始資料或直接資料:由樣本直接蒐集得到,沒有經過整理的資料。分為:為了確定樣本背景的基本資料,以及為達到研究目的而蒐集的分析資料。 • 次級資料(secondary data)、現成資料、二手資料或間接資料:研究者引用他人整理分析結果的資料。
3.3 資料的類型3.3.1 按性質分類 • 質性資料(qualitative data)、定性資料或文字資料:用文字表示的資料。 • 量性資料(quantitative data)、定量資料或數值資料(numerical data):用數字表示的資料。 • 量化(quantity):將質性轉換成量性資料的過程。 • 量尺:將文字資料轉換成數字資料,或將數字資料轉換成文字資料,遵循的標準。
3.3.2 按量度尺度分類 • 量度(measurement):使用適當的工具或儀器,由樣本取得變項資料的過程。 • 量度層次(level)或尺度(scale):量度過程難易或繁簡的程度。 3.3.2.1 等比層次 • 等比尺度(ratio scale):有真正的零刻度當起點,可以算出樣本間的比例,屬於量性資料。是最高量度層次和最複雜的資料。
3.3.2.2 等距層次 • 等距尺度(ratio scale):沒有真正的零刻度當起點,只能算出樣本間的差距,屬於量性資料。是次高量度層次和次複雜的資料。 3.3.2.3 序位層次 • 序位尺度(ordinal scale):依據相對差異大小排出順序或等級的資料,屬於質性資料。是次低量度層次和次簡單的資料。
3.3.2.4 類別層次 • 類別尺度(nominal scale):依屬性(attribute)歸類的文字資料,屬於質性資料。是最低量度層次和最簡單的資料。 3.3.2.5 層次間的關係 1. 由繁而簡依序為:等比、等距、序位、類別。 2.由繁化簡易,由簡化繁難。
3.3.3 按數據分類3.3.3.1 連續變項 • 連續變項(continuous variable)或無限變項:量度值連續出現在某一段值域裡。 3.3.3.2 間斷變項 • 間斷變數(discontinuous variable或discrete variable)或有限變項:點計(counting或enumerating)的結果,二點計值間不再出現任何量度值。
3.3.4 按關係分類 • 反應變項(response variable)、應變項(dependent variable)、標準變項(criterion variable)、果(effect)或後測(posttest):不能由蒐集者或樣本控制的資料。 • 解釋變項(explanatory variable)、自變項(independent variable)、實驗變項(experimental variable)、因(cause)或處理(treatment):可以由蒐集者或樣本控制的資料。
3.4 原始資料的蒐集方法3.4.1 實驗法 • 實驗(experiment)法:控制某些因或處理,得到某些果或後測,以瞭解二者之間因果關係的方法。 • 臨床實驗(clinical trial):是一種嚴謹的實驗設計,通常將樣本 隨機分成二組,一組稱為處理組(treatment group)或治療組,另一組稱為控制組(control group)或對照組,是完全隨機實驗(completely randomized experiment)中的隨機比較實驗(randomized comparative experiment)法。又包含雙盲實驗(double-blind experiment)和單盲實驗(single-blind experiment)。
半實驗(quasi-experimental)法:由研究者依據經驗自行設定條件而不是隨機的方法。半實驗法在某些情況下也可以視為非實驗法。半實驗(quasi-experimental)法:由研究者依據經驗自行設定條件而不是隨機的方法。半實驗法在某些情況下也可以視為非實驗法。 實驗法得到固定結論的機率較高,調查法得到固定結論的機率較低,通常研究者會將二者混合使用。
3.4.2 非實驗法 • 非實驗(non-experiment)法:在最自然情況下,蒐集最真實原始資料的方法。使用系統性實證調查,又稱調查(survey)法。