統計應用軟體 Statistical Computations and Analysis

統計應用軟體Statistical Computations and Analysis Lecture 9: Experimental Designs (II)

常見試驗設計 • 單因子試驗設計: • 完全隨機設計 (CRD) • 隨機完全區集設計 (RCBD) • 拉丁方設計 (LSD) • 均衡不完全區集設計 (BIBD) • 複因子試驗設計: • 兩因子試驗設計 (two-factor factorial design) • 摺疊設計 (nested design) • 裂區設計 (split-plot design)

Summary: CRD 1. CRD 應用時機: 試驗單位同質 2. 各處理的樣本大小: 3. 如何分配試驗單位至不同處理: 隨機分配 4. 變方分析表:

Summary: RCBD 1. RCBD應用時機: 試驗單位不同質, 但能將試驗單位區分為幾組較同質的區集; 區集內試驗單位數等於處理數 → 缺值估計 2. 處理樣本大小 (區集數): 3. 如何分配試驗單位至不同處理: 在區集中隨機分配 4. 變方分析表:

拉丁方設計 • 前述隨機完全區集設計 (RCBD) 將試驗單位分為幾組較同質的區集以控制變異; 由於 RCBD 控制單一區集之變異, 又稱為單向區集設計。 • 若欲同時控制兩種不同區集, 則為兩向區集設計, 稱為拉丁方設計 (Latin Square Design, LSD)。

RCBD 例: 設今有 ABC 三種飼料, 利用 RCBD 進行養豬試驗, 每種飼料重複 3 次 [1] "C" "A" "B" sample(c("A","B","C")) [1] "A" "C" "B" sample(c("A","B","C")) [1] "B" "C" "A" sample(c("A","B","C"))

兩向區集 • Problem: 若同一胎的小豬體重仍差異很大, 則體重輕重形成另一個變異來源! 如上圖所示, 有偏袒飼料 C 忽視飼料 B 的嫌疑。需將體重設為第二向區集! 拉丁方設計

拉丁方設計 • LSD 使用時機: 試驗單位為異質, 且可明顯分為兩向區集 (稱為列區集與行區集)。 Note: 1. 區集內試驗單位數等於處理數, 亦即處理數 = 行區集數 = 列區集數 2. 行區集與列區集內各參試處理必需隨機排列, 且僅能出現一次。(前例並不符合此項條件!)

拉丁方設計 • 例: 設今有 ABC三種飼料, 利用 LSD進行養豬試驗: 處理數 = 行區集數 = 列區集數 = 3 Q: 如何在上述 3 x 3 的方格中隨機填入 ABC, 使得每一列、每一行的處理都不重複? 3x3 拉丁方

拉丁方設計 • LSD 處理隨機排列法: 欲排列 a x a之拉丁方 Step 1:列出 a x a 之所有標準方。 • Note: 標準方指第一行與第一列參試處理排列按英文字母先後順序, 其餘各行各列無此規定。 2 x 2: 3 x 3:

拉丁方設計 4 x 4:

拉丁方設計 處理數 = a 時, 所有可能標準方數: Note: 5 x 5 以上之標準方參考 Fisher and Yates (1963) 所著 Statistical Table for Biological Agricultural and Medical Research。

拉丁方設計 • LSD 處理隨機排列法: 欲排列 a x a之拉丁方 Step 1:列出 a x a 之所有標準方 Step 2:隨機選出一個標準方 Step 3:將選出的標準方之行列重新隨機排列 • 最後所得之拉丁方稱為應用方, 用以進行試驗

拉丁方設計 例: 4 X 4 拉丁方處理隨機排列 Step 1:列出 a x a 之所有標準方 Step 2:隨機選出一個標準方 > sample(1:4,1) [1] 3

拉丁方設計 Step 3:將選出的標準方之行列重新隨機排列 (a) “行”重新排列: sample(1:4) or sample(c("A","B","C","D")) (b) “列”重新排列: 同上

拉丁方設計 Step 2: > sample(1:4) [1] 3 Step 3 (a): > sample(c("A","B","C","D")) # 行排列 [1] "D" "B" "A" "C" Step 3 (b): > sample(c("A","B","C","D")) # 列排列 [1] "C" "B" "D" "A"

拉丁方設計 • 優點: 有效分離兩種區集產生之試驗誤差 • 缺點: (1) 限制處理數=行區集數=列區集數 (2) 處理數過大或過小時不適用: - a < 5: 誤差自由度太小 → 重複拉丁方 (RLSD) - a > 8: 某些試驗不易取得對應區集之樣本 → 均衡不完全區集設計 (BIBD)

LSD 變方分析

LSD 變方分析 例: ABCD四種飼料, 分為四胎小豬(列區集)與體重輕重(行區集)進行LSD試驗:

R: LSD 變方分析

LSD 缺值估算法 • LSD 與 RCBD 之限制相同, 不容許資料包含缺值; 缺值估算法與 RCBD 採用相同原理: 找到使 SSE 最小的估計值。 • 若只有單一缺值, 令其值為 y SSE(y) = SST(y) – SSt(y) – SSR(y) – SSC(y) 令解出y值。

LSD/RCBD 相對效率 • LSD 比 RCBD多了一項區集, 是否真的提高試驗效率?

LSD/RCBD 相對效率 • 列區集相對效率: • 行區集相對效率:

LSD/RCBD 相對效率 例: ABCD四種飼料, 分為四胎小豬(列區集)與體重輕重(行區集)進行LSD試驗 • 列區集RE: • 行區集RE: Note: a < 5!

Summary: LSD 1. LSD 應用時機: 試驗單位不同質, 且可明顯分為兩向區集; 處理數 = 行區集數 = 列區集數 2. 處理樣本大小: a2 3. 如何分配試驗單位至不同處理: 隨機排列標準方 4. 變方分析表:

補充資料: RLSD • 處理數不多 (2~4), 但試驗單位確有明顯兩向區集時需採用 LSD: 若 a = 2 dfE = (a-1)(a-2) = 0; a = 3, dfE = 2。 • 重複拉丁方設計 (RLSD) 應用在上述情況: 藉由重複 r次拉丁方來提高誤差自由度。 a = 3, r = 2:

RLSD 變方分析

RLSD 變方分析 例: Note: 特別注意兩次試驗的行列區集效應是涵蓋在兩次試驗各自的效應之下 (nested)!

R: RLSD 變方分析

均衡不完全區集設計 • 當試驗單位不同質, 可利用 RCBD 或 LSD 控制單向或雙向變異來源。但當處理數 (a) 過多時, 常無法在同一區集內找到足夠的試驗單位以容納全部參試處理。例: 採用 7 種飼料 (處理) 進行 RCBD 試驗, 重複 3 次, 須選取 3 胎小豬, 每胎 7 隻小豬。但每胎小豬數常不足 7 隻! 解決方法: 只安排部份處理於同一區集內 -- 改取 7胎, 每胎取 3 頭小豬, 隨機安排 3 種處理。

Balanced 均衡不完全區集設計 • 均衡不完全區集設計 (BIBD) 實例: BIBD 要求: (1) 各處理重複數相同 (2) 兩處理同時出現的次數相同試驗單位

均衡不完全區集設計 • 若 a = 處理數, r = 各處理重複數, b = 區集數, k = 各區集內試驗單位數, (1) ar = bk = N (2) 各處理重複數相同 = r = bk / a (3) 兩處理同時出現的次數相同: λ= r (k – 1) / (t – 1)

均衡不完全區集設計 • 如何得到一組 BIBD 符合所有條件? It is not easy! Method 1:查表Appendix 9A, Kuehl (2000) “Design of Experiments: Statistical Principles of Research Design and Analysis” Method 2: R function: find.BIB (crossdes) • 無論採用何種方法, 均能得到符合條件之基本設計, 將基本設計之區集與區集內的處理隨機排列以達到 Randomize 的要求。

R: Find Basic Design • Packages → install package(s) → crossdes • 安裝完成後: > library(crossdes) > find.BIB(a,b,k)

均衡不完全區集設計 例: a = 7, r = 3, b = 7, k = 3 基本設計: (1,2,4) (2,3,5) (3,4,6) (4,5,7) (1,5,6) (2,6,7) (1,3,7) Step1:隨機排列基本設計內區集的順序 (1,2,4) (2,3,5) (3,4,6) (4,5,7) (1,3,7) (1,5,6) (2,6,7) Step2:隨機排列各區集內處理順序 (1,2,4) (3,5,2) (6,3,4) (7,4,5) (1,7,3) (5,6,1) (6,2,7)

均衡不完全區集設計 • BIBD 適用時機: • 試驗單位異質, 但區集內試驗單位個數小於處理數。 • 試驗資料有缺失。 • 試驗時間或經費不足。

BIBD 變方分析

BIBD 變方分析 例: 設有 4 種飼料, 每胎小豬僅有三隻, 共選 4 胎進行 BIBD, 結果如下:

R: BIBD 變方分析

R: BIBD 變方分析 adjusted

Efficiency of BIBD • 結束BIBD分析後, 欲比較 BIBD 與 RCBD 的相對效率? • 無法計算 RE! 因為 RCBD 之誤差均方無法從 BIBD 提供的資訊求得。 • 若假設 BIBD 與 RCBD 的變方相同, 且有相同數目的處理與重複, 則

Summary: BIBD 1. BIBD應用時機: 試驗單位不同質, 可明顯分為區集, 但區集內試驗單位數不足以進行RCBD或LSD 2. 處理樣本大小 (區集個數): 3. 如何分配試驗單位至不同處理: 隨機排列基本設計 4. 變方分析表:

統計應用軟體 Statistical Computations and Analysis