200 likes | 338 Views
Multivariate Analysemethoden und Multivariates Testen. Trendtests in ANOVA und rm ANOVA. Günter Meinhardt Johannes Gutenberg Universität Mainz. Univariates Testen ANOVA & rm ANOVA. Trendtests in ANOVA und rm ANOVA. Allgemeines.
E N D
Multivariate Analysemethoden und Multivariates Testen Trendtests in ANOVA und rm ANOVA Günter Meinhardt Johannes Gutenberg Universität Mainz
Univariates Testen ANOVA & rm ANOVA Trendtests in ANOVA und rm ANOVA Allgemeines • Nach der Overall-Signifikanz die Ergebnisse der Wirkungsweise explorieren. • Trends sind definierbar, wenn die Stufen der UVs metrische Levels (Dosen, Zeiten, Anzahlen) repräsentieren, nicht jedoch bei kategorialen UVs. • Einfach zu interpretieren sind orthogonale Trendpolynome. • Jede Ordnung des Polynoms liefert eine orthogonale Trendkompo- nente, dessen Varianzanteil getrennt bestimmt und getest werden kann. • Ermöglicht Prognose des Erreichens von Kriterien. Voraussetzung • Signifikanz des Faktors, unter dem Trends vermutet werden. • In rm Designs die üblichen Voraussetzungen der rm ANOVA (paarweise homogene Varianz-Covarianzmatrizen (streng), bzw. Homogene Varianzen der Abweichungen von Zellen (Spherizität), Normalverteilung).
quadratisch linear Univariates Testen Trendtests Beispiel Mittelwerte mit Konfidenzintervallen 20 16 12 Anzahl Fahrfehler 8 4 0 0 pm 0.2 pm 0.4 pm 0.6 pm 0.8 pm 1.0 pm Alkohohl-Dosis PrototypischeDatensituation • Ein Dosierungsfaktor mit k- Stufen, k > 5 oder Messwiederholungen über mind. 5 Zeitpunkte • monoton steigender oder fallender Gesamtverlauf • Strategie: 1. Absichern des Trends 2. Mit gezielten Einzelvergleichen Effekt gegen Baseline absichern 3. Superposition der signifikanten Trendkomponenten zur Trendberechnung und Kriteriumsvorhersage verwenden
Univariates Testen Trendtests Trendpolynom für einen Dosisfaktor mit k- Stufen beschreibt die Daten perfekt, wenn alle Komponenten bis k-1 eingehen. Übliche Polynome • Lineares Polynom: Anpassungsgerade • Ein quadratisches Polynom beschreibt monotones nichtlineares Wachstum oder Abfallen der Werte • Ein kubisches Polynom kann auch Änderungen im Verlauf der Kurve beschreiben
Univariates Testen Trendtests Orthogonale Polynome Wird als Gleichung für die Mittelwerte der j Stufen geschätzt: mit usw. Für Linearkombinationen Ci werden Koeffizienten so gewählt, Daß die Trendkomponenten stets orthogonal sind: Bedingungen mit (Kontrastbedingung) (Orthogonalität der Ordnungen)
Univariates Testen Trendtests Orthogonale Polynome Die Koeffizienten cij liegen bis zu hohen Anzahlen für k in Tabellen vor.
Univariates Testen Trendtests Quadratsummen Mit diesen Koeffizienten gilt Die Treatmentquadratsumme zerlegt sich additiv in die Quadratsummen- Anteile der einzelnen orthogonalen Trendpolynome. Trend-QS: Test Jede Trendkomponente hat einen Freiheitsgrad (df = 1). Dann gilt der F- Test: Mit dfzähler = 1 und df Nenner = dferror. In komplexeren Designs oder rm Designs ist die die jeweilige Testvarianz des Faktors einzusetzen.
Univariates Testen Trendtests Komponenten Man teilt oft ein in lineare Komponenten und Restkomponenten, um den nichtlinearen Anteil abzuschätzen. Diese Komponente hat k-2 Freiheitsgrade (df = k-2). Dann gilt der F- Test: Nichtlinearer Trend-Test Mit dfzähler = k-2 und df Nenner = dferror. Linearer Trend Die Polynomkoeffizienten aller Trendkomponenten erhält man wie üblich über die Methode der Normalgleichungen. Für die lineare Komponente eines aufsteigend (1,2,3…) ganzzahlig gestuf-ten Dosisfaktor gibt es einfache Beziehungen aus den Quadratsummen: (Steigung) (falls Stufen aufsteigend Integer) (Schnittpunkt)
Univariates Testen Trendtests h2 Das Eta Quadrat kann aufgefasst werden als das Quadrat der Korrelation von den Daten mit der einem Polynom vom Grad k-1 Entsprechend kann man die einzelnen Trendanteile bewerten: Trendvarianz-Aufklärung Damit kann man die Zunahme der Varianzaufklärung durch Hinzunahme einzelner Trendkomponenten bewerten. Man kann eine Intraklassenkorrelation von Faktorstufen und Treatment berechnen: Intra-Class Correlation mit Sie gibt den korrelativen Zusammenhang der Treatmentstufen mit den Daten an.
Univariates Testen Trendtests Einzelvergleiche In der ANOVA prüft man Kontraste gewöhnlich über F- Tests. Wegen ist ein t- Test einem F- Test äquivalent. Es gilt Für den Standardfehler eines Vergleichs gilt F-Test Kontraste mit den Kontrastbedingungen (Kontrast über F-Test prüfen)
Univariates Testen Trendtests Paarvergleiche Für multiple Paarvergleiche muss das a- Niveau gegen multiples Testen adjustiert werden (Bonferroni), um konservativ sicher zu testen. Strategie • Teste Trends im Treatmentfaktor. Signifikanz des linearen Trends sichert bereits die monotone Folge der Stufen ab. Signifikanz des quadratischen Trends sichert den nichtlinearen Anstieg (Abfall). • Berechne das kritische Scheffe‘ Intervall. Bei grossen Effekten reicht die kritische Spannweite bereits aus. • Sichere den Unterschied der letzten Faktorstufen gegen den der ersten Faktorstufen mit wenigen Einzeltests ab. Damit ist zumeist der gesamte Gehalt der inhaltliche Hypothesen über Lernverlauf oder Sättigung statistisch geprüft. [Excel-Beispiel]
Univariates Testen rm ANOVA Trendtests in rm ANOVA Allgemeines • Trendanalyse ist ein häufig eingesetztes Verfahren in rm ANOVA Designs, da sie die Art der Wirkverlaufes einer Intervention beurteilen lässt. • Trends sind in rm Designs grundsätzlich definierbar, da die Stufen der UVs als Zeitpunkte oder Anzahlen der Wiederholung der Gabe eines Treatment grundsätzlich metrische Levels repräsentieren. • Trends sind ebenfalls in Mischdesigns mit Grouping-Faktoren und rm Faktoren definierbar. Für die Testung des Trends gilt, dass der Trend immer an der Prüfvarianz des Faktors geprüft wird. • Trendanalyse ermöglicht eine Prognose des Zeitpunktes, an dem ein Lern- oder Wirkkriterium voraussichtlich erreicht ist. Voraussetzung • Die Testung der Signifikanzdes rm Faktors, der mögliche Trends enthält, ist in der rm ANOVA an strenge Voraussetzungen gebunden. (Eigenschaften der Varianz-Covarianz Matrix). Bei Verletzungen führt der F- Test zu progressiven Entscheidungen. • Verletzungen der Voraussetzungen können mit geeigneten Verfahren (Box, Greenhouse-Geisser) korrigiert werden.
Voraussetzungen rm ANOVA Sind für insgesamt k Messzeitpunkte die Korrelationen zwischen allen Messzeitpunkten gleich und ebenfalls die Varianzen, so erhält man als Varianz-Covarianz-Matrix Verbundene Symmetrie (verbund-symmetrische Matrix). Diese strenge Forderung an dieStruktur der Daten für die rm-ANOVA ist aber nicht nötig. Statt dessen muss für die Gültigkeit der F-Statistik folgende Bedingung erfüllt sein: Homogenitäts- Voraussetzung der rm ANOVA Die Varianz der Differenz der Messwerte zweier beliebiger Messzeit-punkte j und j‘ muss dieselbe Konstante ergeben. Verletzungen dieser Voraussetzung führen zu progressiven Verfälschungen des F-Tests.
Voraussetzungen rm ANOVA Anders geschrieben: Matrix-Bedingung: Zirkularität Varianz-Covarianz Matrizen S, die diese Bedingung erfüllen, heissen zirkulär. Beispiel Man verifiziert ebenso, dass eine verbunden symmetrische Matrix ebenfalls die Eigenschaft der Zirkularität besitzt. [Excel-Beispiel]
Voraussetzungen rm ANOVA Sei A eine Matrix mit gleichen Zeilenelementen, so gilt Generische Regel ist zirkulär. Beispiel (k=3, l=5) Die Eigenschaft der Zirkularität der Varianz-Covarianz Matrix ist über statistische Tests prüfbar. Dazu bedient man sich einer aus der Zirkularität abgeleiteten Eigenschaft von S, der Spherizität. Test über Spherizität Sei M eine (k-1) x k Matrix mit orthogonalen Zeilen. Die (k-1) x (k-1) Matrix ist sphärisch, gdw SX zirkulär ist. [Excel-Beispiel]
Voraussetzungen rm ANOVA Man verwende als Matrix M eine Matrix der c-Koeffizienten, die einen vollständigen Satz orthogonaler Einzelvergleiche definiert. Die Vektoren normiere man zeilenweise (orthonormale Matrix M) Sphärische Matrix SY Beispiel (k=3) Diagonalmatrix SY Da A gleiche Zeilenelemente hat, und die Summe der Zeilenelemente von M Null ergibt, folgt Damit: Folgerung Wenn SX zirkulär ist, ist SY sphärisch (diagonal)
Voraussetzungen rm ANOVA Abweichung von Spherizität Man definiert ein Abweichungsmaß e für die Abweichung von der Spherizität: li die Eigenwerte von SY . Damit kann man den Range der möglichen Abweichungen bewerten (Beispiel: k=4): Range der möglichen Abweichung (perfekt) (max. Abweichung) Der Range der möglichen Abweichungen ist [(k-1)-1…1]
c2 -Test Voraussetzungen rm ANOVA Mauchley-Test Man teste die Nullhypothese über die Stichprobenmatrizen SX und SY . Test-Statistik: Mauchley’s W mit (tr die Spur der Matrix) W ist austabelliert (e.g. Winer, Anhang D). EntscheidungsRegel Lehne die Nullhypothese (Spherizitätshypothese) ab, wenn sonst behalte Spherizitätshypothese bei. a sollte nicht konservativ gewählt werden (e.g. a = 0.25) Aus W berechnet man die c2 verteilte Prüfstatistik (nur approx.) mit
Voraussetzungen rm ANOVA Mauchley-Test W-Tabelle
Mit der Box Formel lässt sich nach Verwendung von ein optimales Ergebnis erreichen. Voraussetzungen rm ANOVA Freiheitsgrad-korrektur Unabhängig vom Ergebnis des Mauchley-Tests kann der F-Test durch eine Adjustage der Freiheitsgrade konservativer gemacht werden. Box-Correction Nach Box ist die F- Statistik in rm Designs verteilt wie (#) Greenhouse-Geisser Correction Da die untere Grenze für e (maximale Verletzung) 1/(k-1) ist, folgt als konservativster F- Test, der jede Spherizitätsverletzung auffängt. Die Gültigkeit von (#) ist gut untersucht. Huynh und Feldt schlagen vor, korrigierte e in (#) zu verwenden: Huynh-Feldt-Correction aber kombiniert mit der Regel: (den Abweichungswert auf 1 setzen, falls größer wird)