1 / 59

Zmienne losowe i ich rozkłady

Biostatystyka. inż. Jacek Jamiołkowski. Wykład 4. Zmienne losowe i ich rozkłady. Definicja zmiennej losowej.

Download Presentation

Zmienne losowe i ich rozkłady

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Biostatystyka inż. Jacek Jamiołkowski Wykład 4 Zmienne losowe i ich rozkłady

  2. Definicja zmiennej losowej • Zmienną losową nazywamy funkcję określoną na przestrzeni zdarzeń elementarnych, przyporządkowującą każdemu zdarzeniu elementarnemu liczbę rzeczywistą z określonym prawdopodobieństwem. Wartości jej nie możemy więc z góry przewidzieć, bowiem zależy ona od przyczyn losowych. • Przykładowo, jeśli zmienną losową X zdefiniujemy sobie jako „sumę oczek dwoma kostkami”, to jasne jest, że wartości funkcji nie można z góry przewidzieć. Wartościami funkcji mogą być liczby rzeczywiste (2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12), z określonymi prawdopodobieństwami (najmniejsze jest prawdopodobieństwo wyrzucenia sumy oczek 2 i 12, a największe 7, ze względu na liczbę sprzyjających zdarzeń elementarnych).

  3. Rodzaje zmiennych losowych • Jeżeli zbiór wartości zmiennej losowej jest zbiorem przeliczalnym lub skończonym, wówczas zmienną losową nazywamy dyskretną. Jeśli natomiast zmienna losowa przyjmuje dowolne wartości z pewnego przedziału liczbowego, to nazywamy ją zmienną losową ciągłą.

  4. Definicja dystrybuanty • Niezależnie od typu, każdą zmienną losową X można jednoznacznie określić za pomocą teoretycznej dystrybuanty. Dodatkowo, oprócz dystrybuanty zmienna losowa dyskretna charakteryzowana jest za pomocą funkcji prawdopodobieństwa, a zmienna losowa ciągła za pomocą funkcji gęstości rozkładu. • Dystrybuantą zmiennej losowej X nazywamy funkcję F(x), określonej na całym zbiorze liczb rzeczywistych (xR), zdefiniowanej następująco: • F(x) = P(X < x) • Czyli innymi słowy wartość dystrybuanty zmiennej losowej X w punkcie x, jest prawdopodobieństwem, że zmienna losowa X przyjmie wartość mniejszą niż x.

  5. Własności dystrybuanty • Dystrybuanta: F(x) = P(X < x) • 0 ≤ F(x) ≤ 1 • F(x) jest funkcją niemalejącą • F(x) jest funkcją przynajmniej lewostronnie ciągłą

  6. Parametry rozkładów zmiennych losowych • Z rozkładem każdej zmiennej losowej związane są pewne charakteryzujące go wielkości liczbowe. Charakterystyki te nazywa się parametrami rozkładu zmiennej losowej. Do najważniejszych parametrów zmiennych losowych należą wartość oczekiwana i wariancja zmiennej losowej. • Wartość oczekiwana E(x) = m jest wartością, wokół której skupiają się wartości zmiennej losowej przy wielokrotnym powtarzaniu eksperymentu. • Wariancja V(x) = σ2 zmiennej losowej to miara rozproszenia wartości zmiennej wokół wartości oczekiwanej, którą oblicza się ze wzoru: • V(x) = E(X – E(X))2

  7. Rozkład zmiennej losowej dyskretnej Zmienne losowe i ich rozkłady

  8. Zmienna losowa dyskretna • Zmienna losowa X jest typu dyskretnego, jeżeli istnieje skończony, albo przeliczalny zbiór jej wartości x1, x2, …, xn, … przyjmowanych przez zmienną z prawdopodobieństwami odpowiednio p1, p2, …, pn, … • Funkcja prawdopodobieństwa zmiennej losowej X jest wówczas określona następująco: przy czym: jeśli zbiór wartości zmiennej losowej jest skończony jeśli zbiór wartości zmiennej losowej jest przeliczalny

  9. Funkcja prawdopodobieństwa • Funkcję prawdopodobieństwa zmiennej losowej dyskretnej X można przedstawiać w postaci tabeli par (xi, pi) – jeśli jest to zbiór skończony:

  10. Funkcja prawdopodobieństwa • Przykład: • Określ funkcję prawdopodobieństwa zmiennej losowej X, zdefiniowanej jako liczbę reszek, wyrzuconych podczas rzutu 3 monetami.

  11. Funkcja prawdopodobieństwa Przestrzeń zdarzeń elementarnych doświadczenia losowego jest następująca: Ω = {(O, O, O), (O, O, R), (O, R, O), (O, R, R), (R, O, O), (R, O, R), (R, R, O), (R, R, R)} W doświadczeniu można wyrzucić 0, 1, 2 lub 3 reszki, zatem: x1 = 0, x2 = 1, x3 = 2, x4 = 3, a p1 = 1/8, p2 = 3/8, p3 = 3/8, p4 = 1/8 Funkcja prawdopodobieństwa zmiennej losowej będącej liczbą reszek wyrzuconych w wyniku rzutu 3 monetami jest następująca:

  12. Funkcja prawdopodobieństwa Funkcję prawdopodobieństwa zmiennej losowej dyskretnej można przedstawić również w postaci wykresu:

  13. Dystrybuanta zmiennej losowej dyskretnej • Dystrybuanta zmiennej losowej dyskretnej spełnia ogólną definicję: • F(x) = P(X < x) • i przyjmuje postać: Np. F(x1) = 0 F(x2) = p1 F(x3) = p1 + p2 F(x4) = p1 + p2 + p3 … F(xn) = p1 + p2 + p3 + … + pn = 1

  14. Dystrybuanta zmiennej losowej dyskretnej • Przykład: • Określić dystrybuantę zmiennej losowej X zdefiniowanej jako liczba reszek wyrzuconych za pomocą 3 monet.

  15. Dystrybuanta zmiennej losowej dyskretnej Funkcja prawdopodobieństwa dla tej zmiennej losowej została już określona: Należy pamiętać, że dystrybuanta przyjmuje wartości dla każdej liczby rzeczywistej, a nie tylko dla wartości przyjmowanych przez zmienną losową, dlatego w przypadku dyskretnej zmiennej losowej wartości dystrybuanty najwygodniej określić za pomocą przedziałów:

  16. Dystrybuanta zmiennej losowej dyskretnej Dystrybuantę zmiennej losowej dyskretnej można przedstawić również w postaci wykresu:

  17. Wartość oczekiwana i wariancja • Wartość oczekiwana dyskretnej zmiennej losowej określona jest wzorem: Wariancję dyskretnej zmiennej losowej wyraża wzór:

  18. Wartość oczekiwana i wariancja • Przykład: • Wyznacz wartość oczekiwaną i wariancję zmiennej losowej X określonej jako liczbę wyrzuconych reszek w rzucie 3 monetami.

  19. Wartość oczekiwana i wariancja Funkcja prawdopodobieństwa dla tej zmiennej losowej została już określona: E(X) = x1·p1 + x2·p2 + x3·p3 + x4·p4 = = 0 · 0,125 + 1 · 0,375 + 2 · 0,375 + 3 · 0,125 = = 0,375 + 0,75 + 0,375 = 1,5 V(X) = (x1– E(X))2 ·p1 + (x2– E(X))2 ·p2 + (x3– E(X))2 ·p3 + + (x4– E(X))2 ·p4 = = (0 – 1,5)2 · 0,125 + (1 – 1,5)2 · 0,375 + (2 – 1,5)2 · 0,375 + + (3 – 1,5)2 · 0,125 = = 2,25 · 0,125 + 0,5 · 0,375 + 0,5 · 0,375 + 2,25 · 0,125 = = 0,28124 + 0,09375 + 0,09375 + 0,28124 = 0,75

  20. Wybrane rozkłady dyskretne Zmienne losowe i ich rozkłady

  21. Rozkład równomierny • Z rozkładem równomiernym (inaczej zwany jednostajnym), mamy do czynienia gdy zmienna losowa może przyjmować wszystkie wartości z jednakowym prawdopodobieństwem: • Przykładem zmiennej losowej o równomiernym rozkładzie jest zmienna X zdefiniowana jako „liczba oczek uzyskana w wyniku rzutu jedną kostką”.

  22. Rozkład zero-jedynkowy • Rozkład zero-jedynkowy występuje w sytuacji, gdy rezultatem doświadczenia losowego są dwa wykluczające się zdarzenia. • Zmienna losowa X ma rozkład zero-jedynkowy, jeśli przyjmuje wartość 1 z prawdopodobieństwem p, a wartość 0 z prawdopodobieństwem q = 1 – p. • Funkcja prawdopodobieństwa ma postać: • Przykładem zmiennej losowej o rozkładzie zero-jedynkowym jest zmienna zdefiniowana następująco „wynikowi rzutu monetą przypisujemy 1 w przypadku wyrzucenia orła, a 0 w przypadku reszki”.

  23. Rozkład dwumianowy (Bernoulliego) • Jeśli mamy do czynienia z doświadczeniem Bernoulliego, tzn. gdy wielokrotnie (n≥ 2) powtarzane jest doświadczenie losowe, którego wynikiem może być jeden z dwóch stanów: „sukces” z prawdopodobieństwem p lub „porażka” z prawdopodobieństwm q = 1 – p, to zmienna losowa określona jako „liczba sukcesów w n próbach” ma rozkład dwumianowy z parametrami n i p, przy czym zmienna losowa może przyjąć wartości k = 0, 1, 2, …, n. Prawdopodobieństwo wystąpienia tych wartości określa wzór: • Przykładem zmiennej losowej o rozkładzie dwumianowym jest zmienna określona jako „liczba orłów wyrzuconych w 100 rzutach monetą”. Zmienna ma rozkład dwumianowy o parametrach n = 100 i p = 0,5.

  24. Rozkład dwumianowy (Bernoulliego) • Wartość oczekiwana i wariancja zmiennej losowej o takim rozkładzie zależy od parametrów rozkładu i dana jest wzorami: • E(X) = n·p • V(X) = n·p·q • Np. dla przytoczonego przykładu: • E(X) = 100· 0,5 = 50 • V(X) = 100· 0,5· 0,5 = 25 • czyli najbardziej prawdopodobne jest, że w 100 rzutach monetą wypadnie 50 razy orzeł.

  25. Rozkład Poissona • Zmienna losowa X, przyjmująca wartości k = 0, 1, 2, … z prawdopodobieństwami określonymi wzorem: • ma rozkład Poissona o parametrze λ. Przedstawia on liczbę wystąpień jakiegoś zjawiska w określonej liczbie prób, jeśli te zdarzenia są niezależne od siebie. Rozkład Poissona jest używany do obliczenia przybliżonych wartości prawdopodobieństwa rozkładzie dwumianowego w przypadku dużej liczby prób (n ≥ 50) i niskim prawdopodobieństwie sukcesu (p ≤ 0,1), przy czym parametr rozkładu Poissona jest wyrażony zależnością: λ = n·p. Można to w skrócie zapisać:

  26. Rozkład Poissona • Dystrybuanta zmiennej losowej X o rozkładzie Poissona dana jest wzorem: • Wartość oczekiwana i wariancja zmiennej losowej o rozkładzie Poissona równe są parametrowi λ tego rozkładu, tzn.: • E(X) = λ • V(X) = λ • Przykładem zmiennej losowej o rozkładzie zbliżonym do rozkładu Poissona jest zmienna „liczba wypadków w ciągu roku, przy prawdopodobieństwie dziennym wynoszącym 0,001”

  27. Rozkład geometryczny • Rozkład geometryczny opisuje prawdopodobieństwo zdarzenia, że pierwszy „sukces” w doświadczeniu Bernoulliego wystąpi dokładnie w k-tej próbie. • Zmienna losowa X ma rozkład geometrycznym jeśli przyjmuje wartości k = 1, 2, 3, …, a jej funkcja prawdopodobieństwa dana jest wzorem: • P(X = k) = p·qk – 1, gdzie q = 1 – p • Przykładem zmiennej losowej o rozkładzie geometrycznym jest zmienna „w którym rzucie monetą wypadnie pierwszy orzeł”. • Dystrybuantę rozkładu geometrycznego opisuje wzór:

  28. Rozkład geometryczny • Wartość oczekiwana i wariancja rozkładu geometrycznego wyrażone są wzorami: • Np. W którym rzucie kostką można oczekiwać, że wypadnie czwórka? • p = 1/6  E(X) = 6

  29. Rozkład hipergeometryczny • Rozkład hipergeometryczny jest związany z tzw. schematem urnowym. Jest to doświadczenie polegające na losowaniu bez zwracanian elementów spośród populacji zawierającej M elementów typu pierwszego i N elementów typu drugiego. Rozkład hipergeometryczny określa liczbę wylosowanych w takim doświadczeniu elementów typu pierwszego. Należy zwrócić uwagę, że prawdopodobieństwo sukcesu zmienia się po każdym wylosowanym elemencie, ponieważ losowanie przebiega bez zwracania (odmiennie niż w rozkładzie dwumianowym).

  30. Rozkład hipergeometryczny • Funkcja prawdopodobieństwa rozkładu hipergeometrycznego opisana jest wzorem: • gdzie M jest liczbą interesujących nas elementów, N liczbą pozostałych elementów, n liczbą losowanych elementów, a k liczbą wylosowanych interesujących nas elementów. • Wartość oczekiwana i wariancja wyrażone są wzorami: • gdzie:

  31. Rozkład zmiennej losowej ciągłej Zmienne losowe i ich rozkłady

  32. Zmienna losowa ciągła • Zmienną losową ciągłą nazywamy taką funkcję X, która przyjmuje dowolne wartości z pewnego przedziału liczbowego (lub przedziałów). • Z powyższej definicji wynika, że liczba wszystkich możliwych i wzajemnie się wykluczających zdarzeń elementarnych jest nieskończona i dlatego prawdopodobieństwo w punkcie odpowiadającym xi równa się zero. Innymi słowy zdarzenie, że wzrost losowo wybranej osoby wynosi dokładnie 175,0000000… (nieskończenie wiele 0 po przecinku) jest niemożliwe. • Z tego względu opis rozkładu zmiennej losowej ciągłej musi być inny niż dla zmiennej losowej dyskretnej. Do opisania rozkładu zmiennej losowej ciągłej służy funkcja gęstości prawdopodobieństwa.

  33. Funkcja gęstości prawdopodobieństwa • Funkcja gęstości prawdopodobieństwa ciągłej zmiennej losowej X to dowolna funkcja nieujemna f (x) ≥ 0 określona na zbiorze liczb rzeczywistych o własności: To znaczy pole pod krzywą funkcji gęstości prawdopodobieństwa w przedziale (a, b) jest równe prawdopodobieństwu, że zmienna X przyjmie wartość z tego przedziału. Z powyższego wynika, że funkcja gęstości prawdopodobieństwa musi spełniać warunek: (prawdopodobieństwo zdarzenia pewnego jest równe 1)

  34. a b Funkcja gęstości prawdopodobieństwa f (x) P(a<X<b)

  35. Dystrybuanta zmiennej losowej ciągłej • Dystrybuanta zmiennej losowej ciągłej musi spełniać ogólną definicję: • F(x) = P(X < x) • i przyjmuje postać:

  36. Dystrybuanta zmiennej losowej ciągłej • Dystrybuanta zmiennej losowej ciągłej posiada następujące własności: przy czym a < b

  37. Dystrybuanta zmiennej losowej ciągłej Dystrybuantę zmiennej losowej ciągłej można przedstawić w postaci wykresu: P(X<3)=0,5

  38. Charakterystyki liczbowe zmiennej losowej • Wartość oczekiwana ciągłej zmiennej losowej określona jest wzorem: Wariancję ciągłej zmiennej losowej wyraża wzór: Medianą ciągłej zmiennej losowej jest taka wartość x, dla której spełniona jest równość:

  39. Wybrane rozkłady ciągłe Zmienne losowe i ich rozkłady

  40. a b a b Rozkład jednostajny • Zmienna losowa X ma rozkład jednostajny w przedziale • (a, b), jeśli jej funkcja gęstości i dystrybuanta określone są wzorami:

  41. Rozkład jednostajny • Jeśli zmienna losowa ma rozkład jednostajny, to wystąpienie dowolnej wartości z określonego przedziału jest jednakowo prawdopodobne, a wartości spoza tego przedziału nie występują wcale. • Parametry rozkładu jednostajnego – wartość oczekiwaną, wariancję i medianę opisują wzory:

  42. Rozkład jednostajny • Przykład: • Autobusy komunikacji miejskiej przyjeżdżają na przystanek dokładnie co 10 minut. Pasażer przychodzi na przystanek w przypadkowym momencie czasu. Zmienna X oznacza czas oczekiwania na przyjazd autobusu. Określić rozkład zmiennej losowej X, jej gęstość, dystrybuantę oraz obliczyć prawdopodobieństwo, że pasażer będzie oczekiwał na autobus krócej niż 8 minut. Jaka będzie wartość oczekiwana, wariancja, odchylenie standardowe i mediana zmiennej losowej X?

  43. Rozkład jednostajny • Z warunków zadania wynika, że najkrótszy czas oczekiwania wynosić może 0 minut, a najdłuższy 10 minut. Wszystkie wartości pośrednie są jednakowo prawdopodobne, zatem mamy do czynienia z rozkładem jednostajnym. • Wartość funkcji gęstości prawdopodobieństwa zmiennej X, zgodnie ze wzorem ma postać:

  44. Rozkład jednostajny • Dystrybuanta zmiennej X na podstawie przedstawionego wzoru to: Prawdopodobieństwo, że pasażer będzie oczekiwał na autobus krócej niż 8 minut, czyli P(X<8) można obliczyć korzystając z wyznaczonej dystrybuanty rozkładu:

  45. Rozkład jednostajny • Parametry rozkładu zmiennej X, zgodnie z przedstawionymi wzorami wynoszą:

  46. Rozkład wykładniczy • Zmienna losowa X ma rozkład wykładniczy z parametrem λ (gdzie λ > 1), jeżeli funkcja gęstości i dystrybuanta określone są wzorami:

  47. Rozkład wykładniczy • Jeśli zmienna losowa ma rozkład wykładniczy, to nie może przyjąć wartości ujemnej, a prawdopodobieństwo wartości dodatniej zmniejsza się wykładniczo ze wzrostem jej wartości. Rozkład taki opisuje często czas trwania różnych zdarzeń, np. czas bezawaryjnej pracy jakiegoś urządzenia, czas wykonywania jakiejś czynności, itp. • Parametry rozkładu wykładniczego – wartość oczekiwaną, wariancję i medianę opisują wzory:

  48. Rozkład wykładniczy • Przykład: • Zaobserwowano, że czas rozmowy w pewnym automacie telefonicznym można opisać rozkładem wykładniczym, przy czym średni czas trwania rozmowy wynosi 50 sekund. Jaka jest funkcja gęstości i dystrybuanta tego rozkładu? Jakie jest prawdopodobieństwo, że losowo wybrana osoba będzie rozmawiać krócej niż pół minuty? A jakie, że rozmowa potrwa dłużej niż 2 minuty?

  49. Rozkład wykładniczy • Wiadomo, że zmienna losowa X, wyrażająca czas rozmowy losowo wybranej osoby ma rozkład wykładniczy, oraz że E(X)=50. Aby wyznaczyć funkcję gęstości zmiennej X, należy znaleźć parametr λ rozkładu: • E(X) = λ λ = 50 • Zatem funkcja gęstości prawdopodobieństwa zdefiniowana jest następująco:

  50. Rozkład wykładniczy • Dystrybuanta zmiennej losowej X: • P(X < 30) = F(30) = 1 – e-30/50 = 1 – e-0,6 = 1 – 0,549 = 0,451 • P(X > 120) = 1 – P(X < 120) = 1 – F(120) = 1 – 1 + e-120/50 = • = e-2,4 = 0,091

More Related