650 likes | 1.15k Views
Biostatystyka. inż. Jacek Jamiołkowski. Wykład 4. Zmienne losowe i ich rozkłady. Definicja zmiennej losowej.
E N D
Biostatystyka inż. Jacek Jamiołkowski Wykład 4 Zmienne losowe i ich rozkłady
Definicja zmiennej losowej • Zmienną losową nazywamy funkcję określoną na przestrzeni zdarzeń elementarnych, przyporządkowującą każdemu zdarzeniu elementarnemu liczbę rzeczywistą z określonym prawdopodobieństwem. Wartości jej nie możemy więc z góry przewidzieć, bowiem zależy ona od przyczyn losowych. • Przykładowo, jeśli zmienną losową X zdefiniujemy sobie jako „sumę oczek dwoma kostkami”, to jasne jest, że wartości funkcji nie można z góry przewidzieć. Wartościami funkcji mogą być liczby rzeczywiste (2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12), z określonymi prawdopodobieństwami (najmniejsze jest prawdopodobieństwo wyrzucenia sumy oczek 2 i 12, a największe 7, ze względu na liczbę sprzyjających zdarzeń elementarnych).
Rodzaje zmiennych losowych • Jeżeli zbiór wartości zmiennej losowej jest zbiorem przeliczalnym lub skończonym, wówczas zmienną losową nazywamy dyskretną. Jeśli natomiast zmienna losowa przyjmuje dowolne wartości z pewnego przedziału liczbowego, to nazywamy ją zmienną losową ciągłą.
Definicja dystrybuanty • Niezależnie od typu, każdą zmienną losową X można jednoznacznie określić za pomocą teoretycznej dystrybuanty. Dodatkowo, oprócz dystrybuanty zmienna losowa dyskretna charakteryzowana jest za pomocą funkcji prawdopodobieństwa, a zmienna losowa ciągła za pomocą funkcji gęstości rozkładu. • Dystrybuantą zmiennej losowej X nazywamy funkcję F(x), określonej na całym zbiorze liczb rzeczywistych (xR), zdefiniowanej następująco: • F(x) = P(X < x) • Czyli innymi słowy wartość dystrybuanty zmiennej losowej X w punkcie x, jest prawdopodobieństwem, że zmienna losowa X przyjmie wartość mniejszą niż x.
Własności dystrybuanty • Dystrybuanta: F(x) = P(X < x) • 0 ≤ F(x) ≤ 1 • F(x) jest funkcją niemalejącą • F(x) jest funkcją przynajmniej lewostronnie ciągłą
Parametry rozkładów zmiennych losowych • Z rozkładem każdej zmiennej losowej związane są pewne charakteryzujące go wielkości liczbowe. Charakterystyki te nazywa się parametrami rozkładu zmiennej losowej. Do najważniejszych parametrów zmiennych losowych należą wartość oczekiwana i wariancja zmiennej losowej. • Wartość oczekiwana E(x) = m jest wartością, wokół której skupiają się wartości zmiennej losowej przy wielokrotnym powtarzaniu eksperymentu. • Wariancja V(x) = σ2 zmiennej losowej to miara rozproszenia wartości zmiennej wokół wartości oczekiwanej, którą oblicza się ze wzoru: • V(x) = E(X – E(X))2
Rozkład zmiennej losowej dyskretnej Zmienne losowe i ich rozkłady
Zmienna losowa dyskretna • Zmienna losowa X jest typu dyskretnego, jeżeli istnieje skończony, albo przeliczalny zbiór jej wartości x1, x2, …, xn, … przyjmowanych przez zmienną z prawdopodobieństwami odpowiednio p1, p2, …, pn, … • Funkcja prawdopodobieństwa zmiennej losowej X jest wówczas określona następująco: przy czym: jeśli zbiór wartości zmiennej losowej jest skończony jeśli zbiór wartości zmiennej losowej jest przeliczalny
Funkcja prawdopodobieństwa • Funkcję prawdopodobieństwa zmiennej losowej dyskretnej X można przedstawiać w postaci tabeli par (xi, pi) – jeśli jest to zbiór skończony:
Funkcja prawdopodobieństwa • Przykład: • Określ funkcję prawdopodobieństwa zmiennej losowej X, zdefiniowanej jako liczbę reszek, wyrzuconych podczas rzutu 3 monetami.
Funkcja prawdopodobieństwa Przestrzeń zdarzeń elementarnych doświadczenia losowego jest następująca: Ω = {(O, O, O), (O, O, R), (O, R, O), (O, R, R), (R, O, O), (R, O, R), (R, R, O), (R, R, R)} W doświadczeniu można wyrzucić 0, 1, 2 lub 3 reszki, zatem: x1 = 0, x2 = 1, x3 = 2, x4 = 3, a p1 = 1/8, p2 = 3/8, p3 = 3/8, p4 = 1/8 Funkcja prawdopodobieństwa zmiennej losowej będącej liczbą reszek wyrzuconych w wyniku rzutu 3 monetami jest następująca:
Funkcja prawdopodobieństwa Funkcję prawdopodobieństwa zmiennej losowej dyskretnej można przedstawić również w postaci wykresu:
Dystrybuanta zmiennej losowej dyskretnej • Dystrybuanta zmiennej losowej dyskretnej spełnia ogólną definicję: • F(x) = P(X < x) • i przyjmuje postać: Np. F(x1) = 0 F(x2) = p1 F(x3) = p1 + p2 F(x4) = p1 + p2 + p3 … F(xn) = p1 + p2 + p3 + … + pn = 1
Dystrybuanta zmiennej losowej dyskretnej • Przykład: • Określić dystrybuantę zmiennej losowej X zdefiniowanej jako liczba reszek wyrzuconych za pomocą 3 monet.
Dystrybuanta zmiennej losowej dyskretnej Funkcja prawdopodobieństwa dla tej zmiennej losowej została już określona: Należy pamiętać, że dystrybuanta przyjmuje wartości dla każdej liczby rzeczywistej, a nie tylko dla wartości przyjmowanych przez zmienną losową, dlatego w przypadku dyskretnej zmiennej losowej wartości dystrybuanty najwygodniej określić za pomocą przedziałów:
Dystrybuanta zmiennej losowej dyskretnej Dystrybuantę zmiennej losowej dyskretnej można przedstawić również w postaci wykresu:
Wartość oczekiwana i wariancja • Wartość oczekiwana dyskretnej zmiennej losowej określona jest wzorem: Wariancję dyskretnej zmiennej losowej wyraża wzór:
Wartość oczekiwana i wariancja • Przykład: • Wyznacz wartość oczekiwaną i wariancję zmiennej losowej X określonej jako liczbę wyrzuconych reszek w rzucie 3 monetami.
Wartość oczekiwana i wariancja Funkcja prawdopodobieństwa dla tej zmiennej losowej została już określona: E(X) = x1·p1 + x2·p2 + x3·p3 + x4·p4 = = 0 · 0,125 + 1 · 0,375 + 2 · 0,375 + 3 · 0,125 = = 0,375 + 0,75 + 0,375 = 1,5 V(X) = (x1– E(X))2 ·p1 + (x2– E(X))2 ·p2 + (x3– E(X))2 ·p3 + + (x4– E(X))2 ·p4 = = (0 – 1,5)2 · 0,125 + (1 – 1,5)2 · 0,375 + (2 – 1,5)2 · 0,375 + + (3 – 1,5)2 · 0,125 = = 2,25 · 0,125 + 0,5 · 0,375 + 0,5 · 0,375 + 2,25 · 0,125 = = 0,28124 + 0,09375 + 0,09375 + 0,28124 = 0,75
Wybrane rozkłady dyskretne Zmienne losowe i ich rozkłady
Rozkład równomierny • Z rozkładem równomiernym (inaczej zwany jednostajnym), mamy do czynienia gdy zmienna losowa może przyjmować wszystkie wartości z jednakowym prawdopodobieństwem: • Przykładem zmiennej losowej o równomiernym rozkładzie jest zmienna X zdefiniowana jako „liczba oczek uzyskana w wyniku rzutu jedną kostką”.
Rozkład zero-jedynkowy • Rozkład zero-jedynkowy występuje w sytuacji, gdy rezultatem doświadczenia losowego są dwa wykluczające się zdarzenia. • Zmienna losowa X ma rozkład zero-jedynkowy, jeśli przyjmuje wartość 1 z prawdopodobieństwem p, a wartość 0 z prawdopodobieństwem q = 1 – p. • Funkcja prawdopodobieństwa ma postać: • Przykładem zmiennej losowej o rozkładzie zero-jedynkowym jest zmienna zdefiniowana następująco „wynikowi rzutu monetą przypisujemy 1 w przypadku wyrzucenia orła, a 0 w przypadku reszki”.
Rozkład dwumianowy (Bernoulliego) • Jeśli mamy do czynienia z doświadczeniem Bernoulliego, tzn. gdy wielokrotnie (n≥ 2) powtarzane jest doświadczenie losowe, którego wynikiem może być jeden z dwóch stanów: „sukces” z prawdopodobieństwem p lub „porażka” z prawdopodobieństwm q = 1 – p, to zmienna losowa określona jako „liczba sukcesów w n próbach” ma rozkład dwumianowy z parametrami n i p, przy czym zmienna losowa może przyjąć wartości k = 0, 1, 2, …, n. Prawdopodobieństwo wystąpienia tych wartości określa wzór: • Przykładem zmiennej losowej o rozkładzie dwumianowym jest zmienna określona jako „liczba orłów wyrzuconych w 100 rzutach monetą”. Zmienna ma rozkład dwumianowy o parametrach n = 100 i p = 0,5.
Rozkład dwumianowy (Bernoulliego) • Wartość oczekiwana i wariancja zmiennej losowej o takim rozkładzie zależy od parametrów rozkładu i dana jest wzorami: • E(X) = n·p • V(X) = n·p·q • Np. dla przytoczonego przykładu: • E(X) = 100· 0,5 = 50 • V(X) = 100· 0,5· 0,5 = 25 • czyli najbardziej prawdopodobne jest, że w 100 rzutach monetą wypadnie 50 razy orzeł.
Rozkład Poissona • Zmienna losowa X, przyjmująca wartości k = 0, 1, 2, … z prawdopodobieństwami określonymi wzorem: • ma rozkład Poissona o parametrze λ. Przedstawia on liczbę wystąpień jakiegoś zjawiska w określonej liczbie prób, jeśli te zdarzenia są niezależne od siebie. Rozkład Poissona jest używany do obliczenia przybliżonych wartości prawdopodobieństwa rozkładzie dwumianowego w przypadku dużej liczby prób (n ≥ 50) i niskim prawdopodobieństwie sukcesu (p ≤ 0,1), przy czym parametr rozkładu Poissona jest wyrażony zależnością: λ = n·p. Można to w skrócie zapisać:
Rozkład Poissona • Dystrybuanta zmiennej losowej X o rozkładzie Poissona dana jest wzorem: • Wartość oczekiwana i wariancja zmiennej losowej o rozkładzie Poissona równe są parametrowi λ tego rozkładu, tzn.: • E(X) = λ • V(X) = λ • Przykładem zmiennej losowej o rozkładzie zbliżonym do rozkładu Poissona jest zmienna „liczba wypadków w ciągu roku, przy prawdopodobieństwie dziennym wynoszącym 0,001”
Rozkład geometryczny • Rozkład geometryczny opisuje prawdopodobieństwo zdarzenia, że pierwszy „sukces” w doświadczeniu Bernoulliego wystąpi dokładnie w k-tej próbie. • Zmienna losowa X ma rozkład geometrycznym jeśli przyjmuje wartości k = 1, 2, 3, …, a jej funkcja prawdopodobieństwa dana jest wzorem: • P(X = k) = p·qk – 1, gdzie q = 1 – p • Przykładem zmiennej losowej o rozkładzie geometrycznym jest zmienna „w którym rzucie monetą wypadnie pierwszy orzeł”. • Dystrybuantę rozkładu geometrycznego opisuje wzór:
Rozkład geometryczny • Wartość oczekiwana i wariancja rozkładu geometrycznego wyrażone są wzorami: • Np. W którym rzucie kostką można oczekiwać, że wypadnie czwórka? • p = 1/6 E(X) = 6
Rozkład hipergeometryczny • Rozkład hipergeometryczny jest związany z tzw. schematem urnowym. Jest to doświadczenie polegające na losowaniu bez zwracanian elementów spośród populacji zawierającej M elementów typu pierwszego i N elementów typu drugiego. Rozkład hipergeometryczny określa liczbę wylosowanych w takim doświadczeniu elementów typu pierwszego. Należy zwrócić uwagę, że prawdopodobieństwo sukcesu zmienia się po każdym wylosowanym elemencie, ponieważ losowanie przebiega bez zwracania (odmiennie niż w rozkładzie dwumianowym).
Rozkład hipergeometryczny • Funkcja prawdopodobieństwa rozkładu hipergeometrycznego opisana jest wzorem: • gdzie M jest liczbą interesujących nas elementów, N liczbą pozostałych elementów, n liczbą losowanych elementów, a k liczbą wylosowanych interesujących nas elementów. • Wartość oczekiwana i wariancja wyrażone są wzorami: • gdzie:
Rozkład zmiennej losowej ciągłej Zmienne losowe i ich rozkłady
Zmienna losowa ciągła • Zmienną losową ciągłą nazywamy taką funkcję X, która przyjmuje dowolne wartości z pewnego przedziału liczbowego (lub przedziałów). • Z powyższej definicji wynika, że liczba wszystkich możliwych i wzajemnie się wykluczających zdarzeń elementarnych jest nieskończona i dlatego prawdopodobieństwo w punkcie odpowiadającym xi równa się zero. Innymi słowy zdarzenie, że wzrost losowo wybranej osoby wynosi dokładnie 175,0000000… (nieskończenie wiele 0 po przecinku) jest niemożliwe. • Z tego względu opis rozkładu zmiennej losowej ciągłej musi być inny niż dla zmiennej losowej dyskretnej. Do opisania rozkładu zmiennej losowej ciągłej służy funkcja gęstości prawdopodobieństwa.
Funkcja gęstości prawdopodobieństwa • Funkcja gęstości prawdopodobieństwa ciągłej zmiennej losowej X to dowolna funkcja nieujemna f (x) ≥ 0 określona na zbiorze liczb rzeczywistych o własności: To znaczy pole pod krzywą funkcji gęstości prawdopodobieństwa w przedziale (a, b) jest równe prawdopodobieństwu, że zmienna X przyjmie wartość z tego przedziału. Z powyższego wynika, że funkcja gęstości prawdopodobieństwa musi spełniać warunek: (prawdopodobieństwo zdarzenia pewnego jest równe 1)
a b Funkcja gęstości prawdopodobieństwa f (x) P(a<X<b)
Dystrybuanta zmiennej losowej ciągłej • Dystrybuanta zmiennej losowej ciągłej musi spełniać ogólną definicję: • F(x) = P(X < x) • i przyjmuje postać:
Dystrybuanta zmiennej losowej ciągłej • Dystrybuanta zmiennej losowej ciągłej posiada następujące własności: przy czym a < b
Dystrybuanta zmiennej losowej ciągłej Dystrybuantę zmiennej losowej ciągłej można przedstawić w postaci wykresu: P(X<3)=0,5
Charakterystyki liczbowe zmiennej losowej • Wartość oczekiwana ciągłej zmiennej losowej określona jest wzorem: Wariancję ciągłej zmiennej losowej wyraża wzór: Medianą ciągłej zmiennej losowej jest taka wartość x, dla której spełniona jest równość:
Wybrane rozkłady ciągłe Zmienne losowe i ich rozkłady
a b a b Rozkład jednostajny • Zmienna losowa X ma rozkład jednostajny w przedziale • (a, b), jeśli jej funkcja gęstości i dystrybuanta określone są wzorami:
Rozkład jednostajny • Jeśli zmienna losowa ma rozkład jednostajny, to wystąpienie dowolnej wartości z określonego przedziału jest jednakowo prawdopodobne, a wartości spoza tego przedziału nie występują wcale. • Parametry rozkładu jednostajnego – wartość oczekiwaną, wariancję i medianę opisują wzory:
Rozkład jednostajny • Przykład: • Autobusy komunikacji miejskiej przyjeżdżają na przystanek dokładnie co 10 minut. Pasażer przychodzi na przystanek w przypadkowym momencie czasu. Zmienna X oznacza czas oczekiwania na przyjazd autobusu. Określić rozkład zmiennej losowej X, jej gęstość, dystrybuantę oraz obliczyć prawdopodobieństwo, że pasażer będzie oczekiwał na autobus krócej niż 8 minut. Jaka będzie wartość oczekiwana, wariancja, odchylenie standardowe i mediana zmiennej losowej X?
Rozkład jednostajny • Z warunków zadania wynika, że najkrótszy czas oczekiwania wynosić może 0 minut, a najdłuższy 10 minut. Wszystkie wartości pośrednie są jednakowo prawdopodobne, zatem mamy do czynienia z rozkładem jednostajnym. • Wartość funkcji gęstości prawdopodobieństwa zmiennej X, zgodnie ze wzorem ma postać:
Rozkład jednostajny • Dystrybuanta zmiennej X na podstawie przedstawionego wzoru to: Prawdopodobieństwo, że pasażer będzie oczekiwał na autobus krócej niż 8 minut, czyli P(X<8) można obliczyć korzystając z wyznaczonej dystrybuanty rozkładu:
Rozkład jednostajny • Parametry rozkładu zmiennej X, zgodnie z przedstawionymi wzorami wynoszą:
Rozkład wykładniczy • Zmienna losowa X ma rozkład wykładniczy z parametrem λ (gdzie λ > 1), jeżeli funkcja gęstości i dystrybuanta określone są wzorami:
Rozkład wykładniczy • Jeśli zmienna losowa ma rozkład wykładniczy, to nie może przyjąć wartości ujemnej, a prawdopodobieństwo wartości dodatniej zmniejsza się wykładniczo ze wzrostem jej wartości. Rozkład taki opisuje często czas trwania różnych zdarzeń, np. czas bezawaryjnej pracy jakiegoś urządzenia, czas wykonywania jakiejś czynności, itp. • Parametry rozkładu wykładniczego – wartość oczekiwaną, wariancję i medianę opisują wzory:
Rozkład wykładniczy • Przykład: • Zaobserwowano, że czas rozmowy w pewnym automacie telefonicznym można opisać rozkładem wykładniczym, przy czym średni czas trwania rozmowy wynosi 50 sekund. Jaka jest funkcja gęstości i dystrybuanta tego rozkładu? Jakie jest prawdopodobieństwo, że losowo wybrana osoba będzie rozmawiać krócej niż pół minuty? A jakie, że rozmowa potrwa dłużej niż 2 minuty?
Rozkład wykładniczy • Wiadomo, że zmienna losowa X, wyrażająca czas rozmowy losowo wybranej osoby ma rozkład wykładniczy, oraz że E(X)=50. Aby wyznaczyć funkcję gęstości zmiennej X, należy znaleźć parametr λ rozkładu: • E(X) = λ λ = 50 • Zatem funkcja gęstości prawdopodobieństwa zdefiniowana jest następująco:
Rozkład wykładniczy • Dystrybuanta zmiennej losowej X: • P(X < 30) = F(30) = 1 – e-30/50 = 1 – e-0,6 = 1 – 0,549 = 0,451 • P(X > 120) = 1 – P(X < 120) = 1 – F(120) = 1 – 1 + e-120/50 = • = e-2,4 = 0,091