Verschiedene Statistik-Programme - verschiedene Ergebnisse bei gleichen Analysen, kann das sein?

Verschiedene Statistik-Programme - verschiedene Ergebnisse bei gleichen Analysen, kann das sein? Autor: Patrick Arnold

Gliederung • 1. Einleitung • 2. Der Wilcoxon Mann Whitney Test • 3. Beispiel für WMW Test • 4. Spezieller WMW-Test • 5. Ergebnisse des speziellen WMW-Test’s mit verschiedenen Softwarepaketen • 6. Resümee • 7. Quellen

Verschiedene Statistik-Programme - verschiedene Ergebnisse bei gleichen Analysen, kann das sein ? Problem an Hand eines Beispieles erläutern Beispiel, an dem man dieses Problem beobachten kann ist ein statistischer Test Wilcoxon-Mann-Whitney Test Diesr Test ist aber noch nicht in der Statistikvorlesung behandelt worden 1.Einleitung

2. Der WMW Test • Wird auch U-Test genannt • nichtparametrisches statistisches Prüfverfahren zum Vergleich zweier unabhängiger Zufallsvariablen X und Y • Ausgangsdaten bestehen aus zwei voneinander unabhängigen Stichproben • U-Test benötigt man nur die Rangplätze

2. Der WMW Test • Beide Stichproben werden zusammengelegt • und dann der Grösse nach geordnet • jeder Wert einen Rang zugeordnet • der kleinste Wert bekommt den Rang 1 • Kommt ein Wert mehrfach vor, spricht man von Ties oder auf deutsch von Bindungen

2. Der WMW Test • dann erhalten die numerisch gleich grossen Einzelwerte die mittlere Rangzahl • Stichprobenumfang der ersten Stichprobe <= der der zweiten • der U-Test fest, ob die so genannte Dominanzwahrscheinlichkeit: pd:= P(X<=Y) gleich 0,5 ist oder nicht

Man unterscheidet beim U-Test noch zwischen der einseitige und der zweiseitige Fragestellung Bei zweiseitiger Fragestellung : Dominanzwahrscheinlichkeit pd ungleich 0,5 Bei der einseitigen Fragestellung : wird Alternativhypothese so gewählt das die Dominanzwahrscheinlich-keit entweder größer oder kleiner als 0,5 ist 2. Der WMW Test

2. Der WMW Test • U-Test ist besonders geeignet, Unterschiede in der zentralen Tendenz aufzufinden • brauchbare Alternative zum t-Test • kann auch eingesetzt werden, wenn die Daten nicht intervall- bzw. verhältnisskaliert sind

2. Der WMW Test Zusammenfassend: wir brauchen zwei voneinander unabhängige Stichproben mit ähnlicher bis gleicher Verteilungsform, die wir miteinander vergleichen und deren Rangfolge aufstellen!

3. Beispiel für WMW Test

Test in verschiedenen Statistikprogrammen durchführen Mit Spezialfall von so einen WMW Test Der so genannten ROTATROD Test Testet Verhalten von Ratten Rotarod Apparatur besteht aus einem rotierenden Zylinder Besteht aus vier möglichen Positionen 4. Spezieller WMW-Test

Zylinder rotiert mit 12 Umdrehungen pro Minute Ratten wurden einzeln auf den Zylinder gesetzt Zeit, wie lange sich so eine Ratte auf dem Zylinder aufhält wird gemessen Jedoch maximal Zeit die Ratten auf dem Zylinder sitzen 300s Sitzt Ratte länger wie 300s, trotzdem nur 300 s angerechnet 2 Gruppen von jeweils 12 Ratten getestet Die gemessenen Werte sind in der folgenden Tabelle zu sehen 4. Spezieller WMW-Test

4. Spezieller WMW-Test • Den Ratten aus Gruppe 1, der control group, wurde Saline verabreicht und den anderen Ratten aus der 2 Gruppe, der treatment group, wurde ein Muskel Präparat oral verabreicht.

5. Ergebnisse des speziellen WMW-Test’s mit verschiedenen Softwarepaketen • Die genauen, per Hand berechneten Werte sind: ohne Korrektur: z= 1.732 p = 0.0833 mit Korrektur für Normalverteilung: z = 1.703 p = 0.0885 mit Korrektur für Bindungen: z = 2.439 p = 0.0147 mit Korrektur für Bindungen und Normalverteilung: z = 2.398 p = 0.0165

Eingeben der gemessenen Werte in ein Statistikprogramm und den U-Test durchführen • falls er in der Software implementiert • Statistiksoftware liefert ein Ergebnis • Nimmt man sich nun ein anderes Statistikprogramm und gibt dieselben Werte wie eben ein, passiert es in der Regel, dass ein leicht unterschiedliches Ergebnis heraus kommt

SigmaStat : Mediane der beiden Stichproben werden angegeben und p = 0.85 SigmaStat liefert noch einen Satz indem steht das es keine signifikante Differenz in den beiden Stichproben gibt SYSSTAT: Rangsummen für jede Stichprobe angegeben, der kritische Wert U, hier ist U = 42 und die dementsprechende Wahrscheinlichkeit p = 0.01473 In Anleitung findet man nicht wie Programm rechnet, ob mit oder ohne Ties 5. Ergebnisse des speziellen WMW-Test’s mit verschiedenen Softwarepaketen

5. Ergebnisse des speziellen WMW-Test’s mit verschiedenen Softwarepaketen • S-Plus: am Anfang kann man auswählen wie der Test berechnet werden soll, ob mit „continuity correction“ oder „Use exact Ditibution“. „continuity correction“ ausgewählt, zeigt es in der Ausgabe z = 2.4389 und p = 0.0147 an, Ergebnis ohne die Korrekturen Mit Korrektur ist z = 2.3983 und p = 0.0165

5. Ergebnisse des speziellen WMW-Test’s mit verschiedenen Softwarepaketen • STATISTICA: das Programm anzeigt sind wieder z und p mit z = 1.732 und p =0.083274 ein „adjusted“ z wird angezeigt mit z = 2.4389 und p = 0.014737 wird noch ein „exact“ p ausgegeben mit p = 0.088734

5. Ergebnisse des speziellen WMW-Test’s mit verschiedenen Softwarepaketen • SPSS: hier werden wieder verschiedene z und p Werte ausgegeben Ergebnisse sind wieder ähnlich wie bei allen anderen Programmen es stimmen ein paar Werte mit den exakten überein

6. Resümee • Test zeigt dass man sich doch nicht immer 100% auf die Ergebnisse verlassen kann die ein solches Statistikprogramm ausgibt • Oft Ergebnisse nicht falsch, sondern nicht ausreichend beschrieben und es stehen dann zum Beispiel 3 verschiedene Werte für p oder z da und man weiss gar nicht welches jetzt für einen das richtige ist

6. Resümee • Wenn Zahlenwerte von einander abweichen, liegt das an Rundungsfehlern oder daran das sich jemand von den Programmierern gedacht hat das er die Formeln die dieser Test benötigt etwas „verbessern“ kann. Das Problem an der Sache ist dann bloß, das nirgends beschrieben wird mit welchen Formeln der Test berechnet wird • Quellcode ist nie frei zugänglich

7. Quellen • Hartung: Statistik 13.Auflage • Lothar Sachs: Angewandte Statistik • Zeitungsartikel aus „The American Statistican“ vom Februar 2000 • Internet (Homepage‘s andere Universitäten)

Verschiedene Statistik-Programme - verschiedene Ergebnisse bei gleichen Analysen, kann das sein?