220 likes | 402 Views
Fallstudie Biometrie III. Michael Klüken. Inhalt:. HENKE (1996): Zum Auftreten und zur Bekämpfung von Phytophthora- Fäule an Gesneriaceen: Experimente zur biol. Bekämpfung mit vers. Antagonisten - ²-Test - ²-Test mit -Adjustierung (HOLM)
E N D
Fallstudie Biometrie III Michael Klüken Inhalt: • HENKE (1996): Zum Auftreten und zur Bekämpfung von Phytophthora-Fäule an Gesneriaceen: Experimente zur biol. Bekämpfung mit vers. Antagonisten- ²-Test • - ²-Test mit -Adjustierung (HOLM) • geordnet-kategoriale Daten: KRUSKAL-WALLIS-Test I) mit -Adjustierung (HOLM) II) mit Abschlusstestprinzip • gemischt-kategoriale Daten: Verfahren nach GAUTAM
Boniturschema: Boniturnote Krankheitssymptome 0 symptomlos 12 3... Anzahl d. Blätter mit brauner Weichfäule Hk Herz krank X Herz abgestorben Antagonistenprüfung an 2 Saintpaulia ionantha-Sorten gegenüber dem Schaderreger Phytophthora nicotianae im Gewächshaus. • 7 Antagonisten, 1 Kontrolle (mit Phytophthora nicotianae behandelt) • Pro Behandlung: je 35 Versuchspflanzen, keine Wdh. Antagonisten:Ko = KontrolleT6 = Trichoderma virideT7 = T. koningiiT8 = T. harzianumG1 = Gliocladium roseumAo = Acremonium ochraceumBm =Bacillus mycoidesPr = Previcur
Boniturnoten: 1 2 Hk X Bonitur: Saintpaulia ionantha Sorten mit Befall durch den Schaderreger Phytophthora nicotianae :
Daten: ‚Loni‘
Daten: ‚Heidrun‘
Auswertung der Daten: HENKE: „Boniturnoten zu Gruppen zusammengefasst“ dichotome Daten: befallen vs. nicht befallen²-Test : (α=0,05; n=35)
Vergleich der p-Werte: Sorte: ‚Loni‘ Sorte: ‚Heidrun‘
² mit -Adjustierung (HOLM): Sorte: ‚Heidrun‘
geordnet-kategoriale Daten: • Verfahren: • Überführen der Daten in singly orderedRxC-Tables Ordnung: ohne Befall / nur Blätter befallen / Herz krank / Herz abgestorben Ordnung ist nicht trivial! • Behandlung nicht geordnet [nicht: doubled ordered RxC-Tables] (weil: keine Dosis abhängige Behandlung) • Festlegen der Scores: „Welcher Befall ist für Pflanzen nicht so schlimm?“ freie Auswahl! • Vergleich: KRUSKAL-WALLIS p-Werte I) mit -Adjustierung (HOLM) II) mit Abschlusstestprinzip
*KRUSKAL-WALLIS TEST, using MonteCarlo geordnet-kategoriale Daten: Sorte: ‚Heidrun‘
KRUSKAL-WALLIS mit Abschlusstestprinzip Sorte: ‚Heidrun‘ Globalhypothese: Ko T6 T7 T8 G1 Ao Bm Pr p=0,012 Ko T6 T7 T8 G1 Ao Bm p=0,011 Partitions-/ Schnitthypothesen: Ko T6 T7 T8 p=0,006 Ko T7 T8 p=0,037 Ko T6 T7 p= 0,001 Ko T6 T8 p= 0,03 Ko T6 p=0,001 Ko T7 p=0,001 Ko T8 p=0,102 Ko G1 Ko Ao Ko Bm Ko Pr Lokal- oder Elementarhypothesen
Boniturnote Krankheitssymptome 0 0 symptomlos 1 12 3... Anzahl d. Blätter mit brauner Weichfäule Hk Herz krank X Herz abgestorben Analyse gemischt-kategorialer Daten in einer 2 x K -Tafel S. GAUTAM (2002) Datensituation:- nominal: rot, grün, lebend, moribund,...- ordinal: Alter, Anzahl befallener Blätter, rangskaliert • Voraussetzungen: • nominale und ordinale Daten • 2xK-Tafel mit K 3, C 2 (ordinal), K – C = M (nominal)df = M + 1
Gemischt-Kategoriale Daten ‚Heidrun‘: Kovs.T6 K = 6 C 2 (ordinale Daten: 1-4) K – C = 2(nominale Daten: 5+6) K-C=M=2 df= M+1 = 3(²-Verteilung)
Gemischt-Kategoriale Daten • bisheriger Lösungswege:Verwerfen d. nominalen (COCHRAN-ARMITAGE) oderder ordinalen (²-Test) Kategorien: bereinigte Tafel, aber Informationen gehen verloren! • mögliche Verbesserung:Re-Klassifikation der ordinalen Kategorien in nominale Kategorie • bestes Verfahren:Analyse gemischt-kategorialer Daten nach GAUTAM:Vergabe von Scores, Errechnen der Korrelation zwischen Spalten u. Reihen, p-Werte mit spez. Teststatistik
Gemischt-Kategoriale Daten Annahme:Y = (Spaltenvariable): Y = 1 bzw. Y = 0 U = (Reihenvariable): U = 0, 1, 2, 3 (f. Reihen: 1-4)U = 0 (f. Reihen: 5 + 6) Z1, Z2 = Indikatorvariabeln f. Reihen: 5 + 6 Y = 0 + 1U + 1Z1 + 2Z2 Regressionsanalyse in SAS
Gemischt-Kategoriale Daten ‚Heidrun‘: Kovs.T62-seitige Fragestellung: „Gibt es einen Unterschied?“ • Gemischt-Kategoriale Daten: R²m = 0,1878,n++= 70Tm besitzt ²-Verteilung mit df = M + 1= 3 (M=K-C) • Tm, df=3, 1- = n++ * R²m = 70 (0,1878 )² = 2,47 • p-Wert (Programm Quantil): pm = 0,004 • COCHRAN-ARMITAGE-Test: p = 0,84(nur ordinale Daten: 0, 1+2, 3-6, >7) • 2-Test: pmid =0,001 (nur nominale Daten: ohne Befall, nur Blätter befallen, Hk, X)
Gemischt-Kategoriale Daten Teststatistik: Tm = n++ * R²m Vorteil:- exakte, trennscharfe Auswertung von ordinal und nominal kategorialen Daten- Hinweis, ob Unterschied durch nominal- oder ordinal kategorisierten Daten entsteht Nachteil:- Vergabe v. äquidistanten Scores ( realitätsbezogen)- nicht-parametrischer Test für n > 10- z. Z.: nur als asymptotische Variante
Gemischt-Kategoriale Daten SAS-Listing: data example;input wert col row z1 z2; cards;23 0 0 0 033 1 0 0 0 0 0 1 0 0 1 1 1 0 0 0 0 2 0 0 1 1 2 0 0 1 0 3 0 0 0 1 3 0 0 8 0 0 1 0 0 1 0 1 0 3 0 0 0 1 0 1 0 0 1run;data ex;set example;do i=1to wert;output;end; run;Procregdata=ex;model col = row z1 z2; run; procprint;run;
Fallstudie Biometrie III • Literatur: • CYTEL Software Corporation (1998): STATXACT 4 for Windows - user manual. Cambridge MA, USA. • GAUTAM, S. (2002): Analysis of mixed categorical data in2xK contingency tables. Statistics in medicine, 2002, 21:1471-1484. • HENKE, B. (1996): Zum Auftreten und zur Bekämpfung vonPhytophthora-Fäule an Gesneriaceen: Experimente zur biologischen Bekämpfung mit verschiedenen Antagonisten. • HOTHORN, L.A. (2002): Scriptum. • SAS 8e-Version: Online-Dokumentation (1999-2001) by SAS Institute Inc., Cary, NC, USA.
Gemischt-Kategoriale Daten The REG Procedure Model: MODEL1 Dependent Variable: col Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr > F Model 3 3.28608 1.09536 5.09 0.0031 Error 66 14.21392 0.21536 Corrected Total 69 17.50000 Root MSE 0.46407 R-Square 0.1878 Dependent Mean 0.50000 Adj R-Sq 0.1509 Coeff Var 92.81433 Parameter Estimates Parameter Standard Variable DF Estimate Error t Value Pr > |t| Intercept 1 0.59747 0.06178 9.67 <.0001 row 1 -0.04177 0.12682 -0.33 0.7429 z1 1 -0.59747 0.17532 -3.41 0.0011 z2 1 -0.59747 0.27496 -2.17 0.0334