1 / 33

Wykład 13 Przykład z muszkami (krzyżówka wsteczna CcNn z ccnn)

Wykład 13 Przykład z muszkami (krzyżówka wsteczna CcNn z ccnn). Uzupełniamy tabelkę wartościami oczekiwanymi przy Ho. Czy w badanej populacji muszek kolor oczu i kształt skrzydła są zmiennymi niezależnymi ? p 1 = Pr( czerwone oczy | normalne skrzydła ),

donny
Download Presentation

Wykład 13 Przykład z muszkami (krzyżówka wsteczna CcNn z ccnn)

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Wykład 13 Przykład z muszkami (krzyżówka wsteczna CcNn z ccnn)

  2. Uzupełniamy tabelkę wartościami oczekiwanymi przy Ho

  3. Czy w badanej populacji muszek kolor oczu i kształt skrzydła są zmiennymi niezależnymi ? p1= Pr(czerwone oczy|normalne skrzydła), p2= Pr(czerwone oczy|mniejsze skrzydła), H0: p1 = p2 ; kolor oczu i rozmiar skrzydła są niezależne HA: p1p2 ; kolor oczu i rozmiar skrzydła są zmiennymi zależnymi

  4. Zastosujemy test chi-kwadrat dla niezależności 2s =  (O-E)2/E ma przy H0 rozkład 21. Testujemy na poziomie = 0.05; odrzucamy gdy 2s > 3.84 = 2critical X2 = Wniosek

  5. Nie możemy jednak powiedzieć, że czerwone oczy powodują, że muszka ma normalne skrzydła. Prawidłowy wniosek to obserwacja, że kolor oczu i kształt skrzydła są zmiennymi zależnymi albo, że u muszek z normalnymi skrzydłami częściej występują czerwone oczy niż u muszek z mniejszymi skrzydłami. Nie możemy formułować wniosku przyczynowego ponieważ nie kontrolujemy analizowanych zmiennych a jedynie je obserwujemy. [W tym wypadku zależność wynika z faktu, że geny determinujące kształt oczu i rozmiar skrzydła leżą na jednym chromosomie.]

  6. Tablice wielodzielcze: rk • r rzędów, k kolumn: rk • Analiza analogiczna do tablic 22. • Przykład: 34 (r = 3 ; k = 4 )

  7. Czy kolor oczu i włosów są zmiennymi zależnymi? H0: Kolor włosów i kolor oczu to zmienne niezależne HA: Kolor oczu i kolor włosów to zmienne zależne Wykonujemy test niezależności chi-kwadrat 2 = (O-E)2/E ma przy H0 rozkład 26. {df = (r-1)(k-1) = (2)(3) = 6}

  8. Testujemy na poziomie = .0005. Wartość krytyczna 26 = . • 2s = • Wniosek

  9. Estymator dla Pr(Oczy niebieskie) = • Estymatordla Pr(Oczy niebieskie| włosy brązowe) = • Estymator dla Pr(Oczy niebieskie|czarne włosy) = • Estymator dla Pr(Oczy niebieskie|jasne włosy) = • Estymator dla Pr(Oczy niebieskie| rude włosy) =

  10. Testowanie niezależności odpowiada testowaniu, że odpowiednie p-stwa warunkowe są te same w każdej klasie. Gdy testujemy niezależność w dużych tabelach to na ogół nie zapisujemy H0za pomocą p-stw warunkowych Przypomnienie założeń: Próby losowe Obserwacje niezależne "E" w każdej komórce musi być  5

  11. Dokładny test Fishera • Stosujemy dla małych rozmiarów prób • Przykład : ECMO • ECMO to ``nowa’’ procedura służąca ratowaniu noworodków cierpiących na poważne zaburzenia pracy układu oddechowego. • CMT – konwencjonalna terapia

  12. H0: wynik nie zależy od zabiegu • Znajdziemy warunkowe p-stwo zaobserwowanych wyników przy ustalonych ``sumach’’ w rzędach i kolumnach (przy H0). • Przypomnijmysymbol Newtona - • – na tyle sposobów można wybrać zbiór k elementowy ze zbioru n elementowego

  13. Na ile sposobów dokładnie 4 dzieci spośród 5 z tych które ``miały’’ umrzeć mogło przypadkowo zostać przyporządkowanych do grupy CMT – • Na ile sposobów dokładnie 6 dzieci spośród 34 z tych które ``miały’’ przeżyć mogło przypadkowo zostać przyporządkowanych do grupy CMT – • Na ile sposobów 10 dzieci spośród 39 mogło przypadkowo zostać przyporządkowanych do grupy CMT –

  14. HA: ECMO jest lepsza niż CMT • Przypadki bardziej ekstremalne w kierunku alternatywy • # liczba śmierci = CMT:4, ECMO:1  CMT:5, ECMO:0 • P-wartość = • Wniosek

  15. Przedziały ufności dla różnicy między p-stwami warunkowymi • W tabelach 2x2, wyrażamy H0jakop1 = p2 • Przykład z lekarstwem • p1 = Pr(poprawa | lekarstwo), p2 = Pr(poprawa | placebo).

  16. Przybliżony 95% PUdla p1-p2wynosi W przykładzie z lekarstwami

  17. PUdla p1-p2wynosi Mamy 95% pewności, że p-stwo poprawy po zażyciu lekarstwa jest większe od p-stwa poprawy po zażyciu placebo o co najmniej i nie więcej niż o W ogólności do konstrukcji przedziałów ufności na poziomie (1–) stosujemy Z/2(zamiast 1.96) .

  18. Regresja liniowa • Dane: pary obserwacji (X, Y), • (x1, y1), (x2, y2), …, (xn, yn) • Przykłady: X = stężenie, Y = szybkość reakcji • X = dawka, Y =odpowiedź • X = waga, Y = wzrost • X = wyniki z pierwszego kolokwium, • Y = wyniki z drugiego kolokwium

  19. Najczęściej mamy jedną losową próbę i obserwujemy dwie zmienne • Czasami jedną z tych zmiennych kontrolujemy – wówczas zwykle nazywamy ją X a ``odpowiedź’’ oznaczamy jako Y

  20. Przykład : n = 5

  21. Wartości brzegowe: Jak zwykle średniex = x/n, y = y/n Sumy kwadratów: SSX = (x-x)2 = 28 = (n-1) sX2 , SSY = (y-y)2 = 26 = (n-1) sY2 Sx= Sy=

  22. Nowa wielkość: "suma iloczynów“ SPXY = (x –x)(y –y) = Mierzy stopień korelacji między X i Y Gdy SPXY>0 to ``najlepsza’’ prosta opisująca relację między X i Y odpowiada funkcji rosnącej a gdy SPXY <0 , funkcji malejącej. Wygodny wzór do obliczeń SPXY = (xy) – (x)(y)/n = xy – nxy = ,

  23. Model statystyczny • Y = 0 + 1 X + błąd losowy • Dla ustalonej wartości X, Y jest zmienną losową o wartości oczekiwanej • Y|X = 0 + 1 X i odchyleniu standardowymY|X . Będziemy zakładali, że Y|Xnie zależy od X. • Nasz cel – estymacja 0 i1.

  24. 1estymujemy za pomocą • b1 = 0estymujemy za pomocą • b0 = y - b1x = • Wyestymowana prosta regresji ma wzór

  25. W jakim sensie ta prosta jest najlepsza ? • Dla każdej wartości możemy obliczyć wartość y przewidywaną przez daną prostą • = b0 + b1 x . • Dla każdej pary obserwacji (x,y) obliczamy różnicę między wartością zaobserwowaną y a przewidywaną • różnica = y -

  26. Suma kwadratów różnic • Definicja: • SS(res) = (y- )2 • Możemy korzystać ze wzoru • SS(res) = SSY - SP2XY /SSX • SS(res) =

  27. ``Najlepsza’’ prosta to taka, która daje najmniejszą możliwą wartość SS(res) • SS(res) mierzy jakość dopasowania

  28. Nie zdążyliśmy • Testowanie hipotez dla regresji • Standardowe założenie – Błąd ma rozkład normalny • Najbardziej interesująca hipoteza to • H0: 1= 0 (Y nie jest skorelowane z X) • Można tu stosować test analogiczny do testu Studenta. Warto o tym poczytać.

More Related