740 likes | 1k Views
Wykład 3 Wzór Bayesa, cd.: Wpływ rozkładu a priori. Załóżmy teraz, że w pewnej populacji: 30% ludzi ma HIV, test do wykrywania HIV ma czułość 99.7% i specyficzność 98.5% (jak przedtem) . Jakie jest prawdopodobieństwo, że osoba z dodatnim wynikiem testu ma HIV ?.
E N D
Wykład 3Wzór Bayesa, cd.: Wpływ rozkładu a priori. Załóżmy teraz, że w pewnej populacji: • 30% ludzi ma HIV, • test do wykrywania HIV ma czułość 99.7% i specyficzność 98.5% (jak przedtem). Jakie jest prawdopodobieństwo, że osoba z dodatnim wynikiem testu ma HIV?
P-stwo, że osoba z dodatnim wynikiem testu jest (faktycznie) chora wynosi:
Zmienna losowa: Wartość zależna od wyniku eksperymentu. • Przykład: Liczba orłów uzyskanych w jednym rzucie monetą.
Zmienna losowa dyskretna • Zbiór wartości, które może przyjąć zmienna losowa dyskretna jest skończony lub przeliczalny. Możliwe wartości będziemy oznaczali x1,x2, … • Rozkład zmiennej dyskretnej X określamy podając prawdopodobieństwa pi=P(X=xi). • Np. w rzucie symetryczną kostką liczba oczek X ma rozkład P(X=i)= , i=1,...6.
Ciągła zmienna losowa • Prawdopodobieństwo przyjęcia każdej ustalonej wartości wynosi zero, np. P(X=3.14159265358979323)=0 • Na tym kursie będziemy rozważać tylko zmienne losowe ciągłe opisane funkcją gęstości f(x).
Dystrybuanta zmiennej X: • Dla liczby definiujemy • Własności: FX(x) jest funkcją niemalejącą, ciągłą z prawej strony, oraz
Narysuj dystrybuantę dyskretnej zmiennej losowej X takiej, że P(X=0)=1/3 oraz P(X=1)=2/3.
Narysuj dystrybuantę rozkładu jednostajnego na odcinku [a,b].
Wartość oczekiwana i wariancja (wzory).Zmienna losowa dyskretna • x :=E(X)= xi P(X= xi)=xipi • Var(X)= (xi- x)2 P(X= xi) =xi2pi - x2 • Przykład 1 (rzut monetą, X=1, gdy orzeł, X=0, gdy reszka) E(X)= Var(X)= • Przykład 2 (X=wynik rzutu kostką) E(X)= Var(X)=
Rozkład dwupunktowy z parametrem • P(Y=1)=p, P(Y=0)=1-p. • Oblicz: • EY= • VarY=
Wartość oczekiwana jest środkiem ciężkości figury określonej przez krzywą gęstości.
Własności wartości oczekiwanej i wariancji E(aX+b)=aEX+b Var(aX+b)=a2Var(X)
Dla dwóch zmiennych losowych X i Y: E(X+Y)=EX+EY E(X-Y)=EX-EY E(aX+bY+c)=
Niezależność zmiennych losowych: Jeżeli zmienne X i Y są niezależne to dla każdej pary zdarzeń A i B Przykład1: Wybieramy (losowo) liczbę dwucyfrową; X:=liczba dziesiątek, Y:=liczba jedności, A={1, 2}, B={3, 4, 5}.
Niezależność zmiennych losowych, cd. Przykład 2: Wybieramy (losowo) liczbę z zakresu 12,...,101; X:=cyfra dziesiątek, Y:=cyfra jedności, A={1, 2}, B={3, 4, 5}. Przykład 3: Liczby oczek, X, Y, w dwóch kolejnych rzutach kostką.
Jeżeli X i Y są niezależne, to E(XY)=E(X)·E(Y) i Var(X+Y)=Var(X)+Var(Y).
Ćwiczenia: X i Y niezależne Var(X-Y)= Var(X+X)=
Schemat Bernoulliego i rozkład dwumianowy • Anita, Beata i Krystyna rzucają monetą i podają łączną liczbę orłów,Y. Podaj rozkład zmiennej Y
Histogram rozkładu w populacji. Populacja =”wszystkie” rzuty trzema monetami
Schemat Bernoulliego: • nniezależnych powtórzeń tego samego eksperymentu • dwa możliwe wyniki w każdej próbie - ``sukces’’ i ``porażka’’ (np.O iR, albo1i0) • w każdej próbie p-stwo sukcesuwynosi p Rozkład dwumianowy: • Y = łączna liczba sukcesów w schemacie Bernoulliego Przykłady: liczba orłów na 5 rzutów, liczba wyzdrowień wśród 10 pacjentów poddanych pewnej kuracji
Niektóre własności symbolu Newtona • Liczba możliwych ciągów y sukcesów i n-y porażek • = = • = = • Ogólnie
W przykładzie p=1/2; • Uwaga: Rozkład dwumianowy jest symetryczny dla p=1/2.
Przykład: Efekt uboczny lekarstwa • 20% ludzi dostaje nudności po zażyciu pewnego lekarstwa • Lekarz przepisał lekarstwo czterem nowym pacjentom • Y – liczba pacjentów w naszej próbie, którzy dostali nudności • Podaj rozkład zmiennej Y
P(co najmniej dwóch dostanie nudności) = • P(co najwyżej jeden dostanie nudności) =
Parametry rozkładu dwumianowego • EY = np • Var Y=np(1-p)
Przykład • Jeden na ośmiu dorosłych mężczyzn ma podniesiony poziom cholesterolu. Losowo wybieramy 10 mężczyzn z populacji. Jakie jest p-stwo, że (dokładnie) 2 spośród nich ma podniesiony poziom cholesterolu ?
Jakie jest p-stwo, że co najmniej jeden z nich ma podniesiony poziom cholesterolu? • Ilu średnio mężczyzn na dziesięciu ma podwyższony poziom cholesterolu?
Rozkład normalny • Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych • Przykłady: • Błąd pomiarowy • Wzrost, wydajność • Temperatura ciała • Zawartość różnych składników we krwi
Funkcja gęstości • Y ~ N(,) • - wartość oczekiwana, - odchylenie standardowe
Standardowy rozkład normalny N(0,1) • Parametry: =0 ,=1 • Do oznaczenia zmiennej losowej o rozkładzie N(0,1) będziemy używali litery Z • Dystrybuanta rozkładu normalnego N(0,1): Φ(x)=P(Z < x). • Test: Φ(0)= • Tablica dystrybuanty Φ(x) (z „Introduction to the Practice of Statistics”, Moore, McCabe)
Korzystanie z Tablic • P(Z < 0.95) = • P(Z <= 0.95) = • P(Z > 0.75) = • P(Z < - 1.5)= • P(1.12 < Z < 2.24)= • P(Z>1.96)=
Pożyteczne wzory • Φ(-x) = • P(Z > z) = • P(z1 < Z < z2) = • Oblicz: Pr(|Z| > 1.96) =
Dowolny rozkład normalny: N(, ) • Załóżmy, że poziomy cholesterolu w pewnej populacji mają rozkład normalny o średniej = 220 i odchyleniu standardowym = 40. • Y ma rozkład N(220, 40) • Jaka część populacji ma poziom cholesterolu powyżej 240?
Standardyzacja • Y ~ N(,) • (Y-)/ ma rozkład normalny! • Oznaczmy Z= (Y-)/. Mamy: • EZ= • Var(Z)= • Zatem Z~ N(0,1)!
Przykład cd. • P(Y > 240)=? • P(Y>y), gdzie y=240. • Oznaczamy z = (y-)/ = (240-220)/40 = 0.5. • P(Y > 240) = P(Z > 0.5)=
Jakie jest p-stwo, że u losowo wybranej osoby cholesterol będzie pomiędzy 200 a 260? • y1 = 200; z1 = (200-220)/40 = -0.5; • y2 = 260; z2 = (260-220)/40 = 1.0; • P(200 < Y < 260) = P(-0.5 < Z < 1.0) =
Reguła 68%–95%–99.7% (reguła 3 ) Jeżeli zmienna X ma rozkład normalny, to • P(-<X<+)= • P(-2<X<+2)= • P(-3<X<+3)=
Kwantyle • W jakim punkcie y dystrybuanta osiąga zadaną wartość p? • Przykłady: • Mediana to kwantyl rzędu 50%. • Trzeci kwartyl to kwantyl rzędu 75%?
Znajdź trzeci kwartyl rozkładu opisującego poziom cholesterolu. • Znajdź kwantyl rzędu 0.1 dla rozkładu poziomów cholesterolu.
Ocena normalności • Znaczna część procedur statystycznych, które poznamy w dalszej części kursu wymaga założenia, że próba pochodzi z populacji o rozkładzie normalnym. Założenie to można sprawdzać np. wykonując proste obliczenia lub rysując wykres kwantyl-kwantyl.