380 likes | 570 Views
Wykład 10 Układ zrandomizowany blokowy. Staramy się kontrolować zróżnicowanie badanych obiektów poprzez zapewnienie ``jednorodności’’ obiektów w każdej grupie zabiegowej. Najpierw dzielimy obiekty na bloki. Co to są bloki ? Blok to jednorodna grupa obiektów
E N D
Wykład 10Układ zrandomizowany blokowy • Staramy się kontrolować zróżnicowanie badanych obiektów poprzez zapewnienie ``jednorodności’’ obiektów w każdej grupie zabiegowej. • Najpierw dzielimy obiekty na bloki. • Co to są bloki ? • Blok to jednorodna grupa obiektów • Chcemy aby obiekty w jednym bloku miały podobne wartości zmiennych ``zakłócających’’.
Przykłady bloków • Owocówki z jednej linii wsobnej • Pacjenci podobni pod względem wieku, płci, diagnozy i/lub historii choroby • Rośliny rosnące blisko siebie w cieplarni • Rośliny kukurydzy rosnące na tym samym fragmencie pola
Przyporządkowanie • Obiekty dzielimy na jednorodne bloki • Dokonujemy randomizacji (losowego przyporządkowania obiektów do poszczególnych zabiegów) w obrębie każdego z bloków • To zapewnia, że w każdej grupie zabiegowej mamy tę samą liczbę obiektów z każdego bloku • Tak więc ``wstępne’’ rozkłady badanej cechy w grupach zabiegowych są do siebie podobne.
Przykład • Porównujemy efekt działania nowego lekarstwa z placebo • Obiekty – ochotniczki, u których w ciągu ostatniego roku stwierdzono raka piersi • Niektóre miały lumpektomię, inne radykalną mastektomię (2) • Niektóre były poddane naświetlaniom, inne nie (2) • U niektórych zidentyfikowano ryzyko genetyczne BRCA1, BRCA2, u innych nie (3) • Te czynniki są znane ale nie kontrolowane w tym badaniu
Dzielimy pacjentki na 223=12 bloków, tzn. lumpektomia, naświetlania, BRCA1 lumpektomia, naświetlania, BRCA2, …. mastektomia, brak naświetlań, nie zidentyfikowano ryzyka genetycznego Potem w każdym bloku losowo wybrana połowa kobiet otrzymuje lekarstwo, a druga połowa placebo To zapewnia, że grupy kobiet biorących lekarstwo i placebo mają w przybliżeniu tą samą strukturę
Inne czynniki używane do blokowania: Laboratorium lub osoba dokonująca pomiarów Laboratorium lub osoba wykonująca zabieg Geografia Genetyka Czynniki socjo-ekonomiczne Blokujemy tylko względem tych czynników, które mogą mieć wpływ na odpowiedź.
Stratyfikacja • ``Blokowanie’’ względem zmiennej, której wartości można uporządkować (często ciągłej). Wtedy dzielimy na ``warstwy’’ a nie na bloki. • Przykłady • Niskie, średnie, wysokie dochody • Grupy wiekowe • Stopień rozwoju choroby • Randomizujemy w obrębie każdej warstwy. • Czasami definiujemy warstwy przed próbkowaniem, aby pobrać podobną liczbę obserwacji z każdej warstwy: próbkowanie warstwowe.
Powiązane pary • Obserwacje występują w parach • Takich jak: • Układ blokowy dwuzabiegowy, gdzie każdy blok składa się z dwu obiektów • Dwa pomiary na tym samym obiekcie (dwa dni, dwie strony, przed/po…) • Obserwujemy dwie grupy w czasie
Przykłady: • Obiekty naturalnie występują w parach, takich jak pary identycznych blizniaków • Obiekty łaczymy w pary o podobnym wieku, płci, zawodzie, stanie rozwoju choroby, etc • Ten sam obiekt mierzony przy dwu okazjach
Test Studenta dla powiązanych par • Do produkcji butów używamy dwóch różnych materiałów, A i B. • Obserwacje: zużycie podeszew w butach noszonych przez 10 chłopców. • Każdy chłopiec ma podeszwę w jednym bucie zrobioną z materiału A, a w drugim z materiału B • Randomizujemy (lewy albo prawy)
Hipoteza H0 : d = A - B=0 Ha : d≠ 0 Liczymy d= Y1- Y2, średnią(d), SD(d), SE(d) liczymy ts = średnia(d)/SE(d) = df = nd-1= P-wartość=
Co się stanie jeżeli wykorzystamy test Studenta dla prób niezależnych ? • Ta sama hipoteza =10.63, =11.04 • =1.11 • ts=(10.63-11.04)/1.11=-0.369 • P-wartość =
Skąd taka rozbieżność? • Bardzo różne SE • Test dla par : SE = 0.12 • Test dla dwóch niezależnych prób: SE=1.11 • Jeżeli jest duże zróżnicowanie między obiektami może ono ukryć wpływ zabiegu • To zróżnicowanie można zredukować łącząc obiekty w pary
Skąd wiadomo czy użyć testu dla par czy testu dla niezależnych prób ? Na ogół łatwo stwierdzić czy istnieją naturalne pary obiektów z jednej i drugiej grupy zabiegowej. Kiedy zaplanować eksperyment w oparciu o powiązane pary ? Trudniejsze: oczekujemy, że zmienne zakłócające mogą istotnie zwiększyć rozrzut wyników i staramy się utworzyć dwuelementowe bloki, jednorodne ze względu na zmienne zakłócające.
Założenie • Test Studenta dla par jest oparty na założeniu, że różnice mają w przybliżeniu rozkład normalny.
Test znaków • Co zrobić jeżeli obserwacje nie mają rozkładu normalnego ? • Dla dwóch niezależnych prób liczyliśmy test Wilcoxona-Manna-Whitneya. • Gdy występują sparowane obserwacje możemy zastosować test znaków. • Patrzymy na znak różnicy między każdą parą obserwacji. • Jeżeli zabiegi się nie różnią, liczba plusów powinna być w przybliżeniu równa liczba minusów lub inaczej p-stwo, że w dowolnej parze dostaniemy plus powinno być równe
= p-stwo, że w dowolnej ustalonej parze pierwszy zabieg daje lepszy wynik niż drugi. H0: = HA: Dla każdej pary obserwacji zapisujemy (+) gdy y1–y2jest dodatnielub (–) gdy jest ujemne Zliczamy liczbę + (= N+) i – (= N–) (nie liczymy zer)
Statystyka testowa Bs = max( N+, N–) (dla testu dwustronnego) Wartości krytyczne na kolejnym slajdzie. n = #par z niezerowymi wynikami. Tabela daje wartości krytyczne dla testu jedno i dwustronnego Odrzucamy H0gdy Bs wartości krytycznej Można także policzyć p-wartości korzystając ze wzorów na rozkład Bernoulliego.
CRITICAL VALUES FOR THE SIGN TEST, N = 5..44 | • Alpha | • 1 Sided 0.05 0.025 0.01 0.005 0.0025 0.001 | • 2 Sided (0.10) (0.05) (0.02) (0.01) (0.005) (0.002) | • ------+-------------------------------------------------+---- • N | • ----| • 5 | 5 . . . . . • 6 | 6 6 . . . . • 7 | 7 7 7 . . . • 8 | 7 8 8 8 . . • 9 | 8 8 9 9 9 . • | | • 10 | 9 9 10 10 10 10 • 11 | 9 10 10 11 11 11 • 12 | 10 10 11 11 12 12 • 13 | 10 11 12 12 12 13 • 14 | 11 12 12 13 13 13 • | | • 15 | 12 12 13 13 14 14 • 16 | 12 13 14 14 14 15 • 17 | 13 13 14 15 15 16 • 18 | 13 14 15 15 16 16 • 19 | 14 15 15 16 16 17 • | | • 20 | 15 15 16 17 17 18 • 21 | 15 16 17 17 18 18 • 22 | 16 17 17 18 18 19 • 23 | 16 17 18 19 19 20 • 24 | 17 18 19 19 20 20 • This public domain table was made by APL programs written by the author. • William Knight <http://www.math.unb.ca/~knight> Friday,
CRITICAL VALUES FOR THE SIGN TEST, N =25..44 | • Alpha | • 1 Sided 0.05 0.025 0.01 0.005 0.0025 0.001 | • 2 Sided (0.10) (0.05) (0.02) (0.01) (0.005) (0.002) | • 25 | 18 18 19 20 20 21 • 26 | 18 19 20 20 21 22 • 27 | 19 20 20 21 22 22 • 28 | 19 20 21 22 22 23 • 29 | 20 21 22 22 23 24 • | | • 30 | 20 21 22 23 24 24 • 31 | 21 22 23 24 24 25 • 32 | 22 23 24 24 25 26 • 33 | 22 23 24 25 25 26 • 34 | 23 24 25 25 26 27 • | | • 35 | 23 24 25 26 27 27 • 36 | 24 25 26 27 27 28 • 37 | 24 25 27 27 28 29 • 38 | 25 26 27 28 29 29 • 39 | 26 27 28 28 29 30 • | | • 40 | 26 27 28 29 30 31 • 41 | 27 28 29 30 30 31 • 42 | 27 28 29 30 31 32 • 43 | 28 29 30 31 32 32 • 44 | 28 29 31 31 32 33 • This public domain table was made by APL programs written by the author. • William Knight <http://www.math.unb.ca/~knight> Friday,
Dla testu jednostronnego • HAjest albo < 0.5 (w dowolnej parze druga obserwacja ma większą szansę być większa) (Bs = N–) lub HAjest > 0.5; (w dowolnej parze pierwsza obserwacja ma większą szansę być większa) (Bs = N+)
P-wartość • Gdy HAjest > 0.5, wtedy Bs = N+, i P-wartośćjest Pr(Y Bs ) • Gdy HAjest < 0.5, wtedy Bs = N–, i P-wartośćjest Pr(Y Bs ) • Gdy HAjest 0.5, wtedy Bs = max(N+, N–), i P-wartość = 2Pr(Y Bs ) • gdzie Y ma rozkład Bernoulliego (n, 0.5)
Przykład: przeszczepy skóry • Po dwóch stronach ciała 11 ochotników zastosowano przeszczepy skóry. • Jeden przeszczep ma dobre dopasowanie HLA z odbiorca, drugi nie. • Obserwujemy czas do odrzucenia przeszczepu (nie ma rozkładu normalnego więc nie można stosować testu Studenta). • Czy dobre dopasowanie HLA zwiększa czas przetrwania przeszczepu ?
Testu znaków używamy gdy • Dane nie mają rozkładu normalnego • Gdy dane zapisane są w postaci preferencji a nie wielkości liczbowej, np. lepsze/gorsze, mniejsze/większe itp.
Test znakowany Wilcoxona • Podobny do testu znaków ale bardziej czuły • Metoda • Liczymy różnice w parach • Znajdujemy wartość bezwzględną • Przyporządkowujemy rangi wartościom bezwzględnym (1 dla najmniejszej, n dla największej) • Każdej randze przyporządkowujemy jej znak (+,-)
W+ : suma rang dodatnich • W- : suma rang ujemnych • Ws : min(W+, W-) • Odrzucamy H0gdy Ws≤wartość krytyczna • Tabela wartości krytycznych jest dostępna w kartotece z wykładami.
Przed & Po vs. Grupa kontrolna • Czasami obserwujemy obiekty przed i po pewnym zabiegu i mierzymy wpływ zabiegu na poszczególne obiekty • Dostajemy pary zależnych obserwacji • Czasami parujemy podobne (ze względu na zmienne zakłócające) obiekty z grupy zabiegowej i kontrolnej • Również dostajemy pary zależnych obserwacji
Czasami obiektów w grupie kontrolnej i zabiegowej nie można w naturalny sposób połączyć w pary • takie obserwacje traktujemy jako dwie niezależne próby
Czasami oczekujemy, że obiekty w naturalny sposób się zmieniają w trakcie eksperymentu. Chcemy odróżnić zmiany wywołane zabiegiem od zmian wynikających z upływu czasu Obserwujemy grupę zabiegową i kontrolną przed i po zabiegu Obiekty w grupie kontrolnej dostarczają nam informacji jakiej zmiany należy oczekiwać jedynie w wyniku upływu czasu Obiekty w grupie zabiegowej dostarczają nam informacji o wpływie zabiegu Cztery grupy obserwacji
Możemy porównać obiekty z grupy zabiegowej przed i po zabiegu za pomocą testu dla par Również obiekty z grupy kontrolnej możemy porównać przed i po zabiegu za pomocą testu dla par Dowiemy się czy była zmienność w każdej z grup Naprawdę interesuje nas porównanie zmian wartości cechy (przed i po zabiegu) Zwykle w takim przypadku analizujemy różnice po-przed za pomocą testu dla dwu prób