1 / 73

Wykład 3 Wzór Bayesa, cd.: Wpływ rozkładu a priori .

Wykład 3 Wzór Bayesa, cd.: Wpływ rozkładu a priori. Załóżmy teraz, że w pewnej populacji: 30% ludzi ma HIV, test do wykrywania HIV ma czułość 99.7% i specyficzność 98.5% (jak przedtem) . Jakie jest prawdopodobieństwo, że osoba z dodatnim wynikiem testu ma HIV ?.

Download Presentation

Wykład 3 Wzór Bayesa, cd.: Wpływ rozkładu a priori .

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Wykład 3Wzór Bayesa, cd.: Wpływ rozkładu a priori. Załóżmy teraz, że w pewnej populacji: • 30% ludzi ma HIV, • test do wykrywania HIV ma czułość 99.7% i specyficzność 98.5% (jak przedtem). Jakie jest prawdopodobieństwo, że osoba z dodatnim wynikiem testu ma HIV?

  2. P-stwo, że osoba z dodatnim wynikiem testu jest (faktycznie) chora wynosi:

  3. Zmienna losowa: Wartość zależna od wyniku eksperymentu. • Przykład: Liczba orłów uzyskanych w jednym rzucie monetą.

  4. Zmienna losowa dyskretna • Zbiór wartości, które może przyjąć zmienna losowa dyskretna jest skończony lub przeliczalny. Możliwe wartości będziemy oznaczali x1,x2, … • Rozkład zmiennej dyskretnej X określamy podając prawdopodobieństwa pi=P(X=xi). • Np. w rzucie symetryczną kostką liczba oczek X ma rozkład P(X=i)= , i=1,...6.

  5. Ciągła zmienna losowa • Prawdopodobieństwo przyjęcia każdej ustalonej wartości wynosi zero, np. P(X=3.14159265358979323)=0 • Na tym kursie będziemy rozważać tylko zmienne losowe ciągłe opisane funkcją gęstości f(x).

  6. Dystrybuanta zmiennej X: • Dla liczby definiujemy • Własności: FX(x) jest funkcją niemalejącą, ciągłą z prawej strony, oraz

  7. Narysuj dystrybuantę dyskretnej zmiennej losowej X takiej, że P(X=0)=1/3 oraz P(X=1)=2/3.

  8. Narysuj dystrybuantę rozkładu jednostajnego na odcinku [a,b].

  9. Wartość oczekiwana i wariancja (wzory).Zmienna losowa dyskretna • x :=E(X)= xi P(X= xi)=xipi • Var(X)= (xi- x)2 P(X= xi) =xi2pi - x2 • Przykład 1 (rzut monetą, X=1, gdy orzeł, X=0, gdy reszka) E(X)= Var(X)= • Przykład 2 (X=wynik rzutu kostką) E(X)= Var(X)=

  10. Rozkład dwupunktowy z parametrem • P(Y=1)=p, P(Y=0)=1-p. • Oblicz: • EY= • VarY=

  11. Wartość oczekiwana i wariancja, cd.Zmienna losowa ciągła

  12. Wartość oczekiwana jest środkiem ciężkości figury określonej przez krzywą gęstości.

  13. Przykład: rozkład jednostajny na [0,1].

  14. Własności wartości oczekiwanej i wariancji E(aX+b)=aEX+b Var(aX+b)=a2Var(X)

  15. Dla dwóch zmiennych losowych X i Y: E(X+Y)=EX+EY E(X-Y)=EX-EY E(aX+bY+c)=

  16. Niezależność zmiennych losowych: Jeżeli zmienne X i Y są niezależne to dla każdej pary zdarzeń A i B Przykład1: Wybieramy (losowo) liczbę dwucyfrową; X:=liczba dziesiątek, Y:=liczba jedności, A={1, 2}, B={3, 4, 5}.

  17. Niezależność zmiennych losowych, cd. Przykład 2: Wybieramy (losowo) liczbę z zakresu 12,...,101; X:=cyfra dziesiątek, Y:=cyfra jedności, A={1, 2}, B={3, 4, 5}. Przykład 3: Liczby oczek, X, Y, w dwóch kolejnych rzutach kostką.

  18. Jeżeli X i Y są niezależne, to E(XY)=E(X)·E(Y) i Var(X+Y)=Var(X)+Var(Y).

  19. Ćwiczenia: X i Y niezależne Var(X-Y)= Var(X+X)=

  20. Schemat Bernoulliego i rozkład dwumianowy • Anita, Beata i Krystyna rzucają monetą i podają łączną liczbę orłów,Y. Podaj rozkład zmiennej Y

  21. Histogram rozkładu w populacji. Populacja =”wszystkie” rzuty trzema monetami

  22. Schemat Bernoulliego: • nniezależnych powtórzeń tego samego eksperymentu • dwa możliwe wyniki w każdej próbie - ``sukces’’ i ``porażka’’ (np.O iR, albo1i0) • w każdej próbie p-stwo sukcesuwynosi p Rozkład dwumianowy: • Y = łączna liczba sukcesów w schemacie Bernoulliego Przykłady: liczba orłów na 5 rzutów, liczba wyzdrowień wśród 10 pacjentów poddanych pewnej kuracji

  23. Rozkład dwumianowy:

  24. Niektóre własności symbolu Newtona • Liczba możliwych ciągów y sukcesów i n-y porażek • = = • = = • Ogólnie

  25. W przykładzie p=1/2; • Uwaga: Rozkład dwumianowy jest symetryczny dla p=1/2.

  26. Przykład: Efekt uboczny lekarstwa • 20% ludzi dostaje nudności po zażyciu pewnego lekarstwa • Lekarz przepisał lekarstwo czterem nowym pacjentom • Y – liczba pacjentów w naszej próbie, którzy dostali nudności • Podaj rozkład zmiennej Y

  27. Odpowiedź:

  28. P(co najmniej dwóch dostanie nudności) = • P(co najwyżej jeden dostanie nudności) =

  29. Parametry rozkładu dwumianowego • EY = np • Var Y=np(1-p)

  30. Przykład • Jeden na ośmiu dorosłych mężczyzn ma podniesiony poziom cholesterolu. Losowo wybieramy 10 mężczyzn z populacji. Jakie jest p-stwo, że (dokładnie) 2 spośród nich ma podniesiony poziom cholesterolu ?

  31. Jakie jest p-stwo, że co najmniej jeden z nich ma podniesiony poziom cholesterolu? • Ilu średnio mężczyzn na dziesięciu ma podwyższony poziom cholesterolu?

  32. Rozkład normalny • Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych • Przykłady: • Błąd pomiarowy • Wzrost, wydajność • Temperatura ciała • Zawartość różnych składników we krwi

  33. Funkcja gęstości • Y ~ N(,) •  - wartość oczekiwana,  - odchylenie standardowe

  34. Standardowy rozkład normalny N(0,1) • Parametry:  =0 ,=1 • Do oznaczenia zmiennej losowej o rozkładzie N(0,1) będziemy używali litery Z • Dystrybuanta rozkładu normalnego N(0,1): Φ(x)=P(Z < x). • Test: Φ(0)= • Tablica dystrybuanty Φ(x) (z „Introduction to the Practice of Statistics”, Moore, McCabe)

  35. Korzystanie z Tablic • P(Z < 0.95) = • P(Z <= 0.95) = • P(Z > 0.75) = • P(Z < - 1.5)= • P(1.12 < Z < 2.24)= • P(Z>1.96)=

  36. Pożyteczne wzory • Φ(-x) = • P(Z > z) = • P(z1 < Z < z2) = • Oblicz: Pr(|Z| > 1.96) =

  37. Dowolny rozkład normalny: N(, ) • Załóżmy, że poziomy cholesterolu w pewnej populacji mają rozkład normalny o średniej  = 220 i odchyleniu standardowym = 40. • Y ma rozkład N(220, 40) • Jaka część populacji ma poziom cholesterolu powyżej 240?

  38. Standardyzacja • Y ~ N(,) • (Y-)/ ma rozkład normalny! • Oznaczmy Z= (Y-)/. Mamy: • EZ= • Var(Z)= • Zatem Z~ N(0,1)!

  39. Przykład cd. • P(Y > 240)=? • P(Y>y), gdzie y=240. • Oznaczamy z = (y-)/ = (240-220)/40 = 0.5. • P(Y > 240) = P(Z > 0.5)=

  40. Jakie jest p-stwo, że u losowo wybranej osoby cholesterol będzie pomiędzy 200 a 260? • y1 = 200; z1 = (200-220)/40 = -0.5; • y2 = 260; z2 = (260-220)/40 = 1.0; • P(200 < Y < 260) = P(-0.5 < Z < 1.0) =

  41. Oblicz P(Y < 170)

  42. Reguła 68%–95%–99.7% (reguła 3 ) Jeżeli zmienna X ma rozkład normalny, to • P(-<X<+)= • P(-2<X<+2)= • P(-3<X<+3)=

  43. Kwantyle • W jakim punkcie y dystrybuanta osiąga zadaną wartość p? • Przykłady: • Mediana to kwantyl rzędu 50%. • Trzeci kwartyl to kwantyl rzędu 75%?

  44. Znajdź trzeci kwartyl rozkładu opisującego poziom cholesterolu. • Znajdź kwantyl rzędu 0.1 dla rozkładu poziomów cholesterolu.

  45. Ocena normalności • Znaczna część procedur statystycznych, które poznamy w dalszej części kursu wymaga założenia, że próba pochodzi z populacji o rozkładzie normalnym. Założenie to można sprawdzać np. wykonując proste obliczenia lub rysując wykres kwantyl-kwantyl.

More Related