1 / 45

Statystyka

Statystyka. Wojciech Jawień <wojciech.jawien@uj.edu.pl> http://farm.cm-uj.krakow.pl/dyd/stat p. 323. Program zajęć. Wymiar 10 godzin wykładu (5 spotkań po 2 godziny) 20 godzin ćwiczeń (10 spotkań po 2 godziny). Program zajęć – tematyka. Wykłady

Download Presentation

Statystyka

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Statystyka Wojciech Jawień <wojciech.jawien@uj.edu.pl> http://farm.cm-uj.krakow.pl/dyd/stat p. 323

  2. Program zajęć • Wymiar • 10 godzin wykładu (5 spotkań po 2 godziny) • 20 godzin ćwiczeń (10 spotkań po 2 godziny)

  3. Program zajęć – tematyka • Wykłady • Podstawowe pojęcia: prawdopodobieństwo, zmienna losowa, rozkłady prawdop. • Estymacja, statystyka opisowa • Testowanie hipotez • Elementy statystycznej kontroli jakości

  4. Program zajęć – tematyka (cd.) • Ćwiczenia • Ilustracja materiału wykładowego poprzez praktyczne wykonanie analiz statystycznych z wykorzystaniem programów ogólnego zastosowania i specjalistycznych: • MS Excel • Statistica • SAS (Stat i Graph) • R (darmowy S-Plus)

  5. Zasady zaliczenia • Na ćwiczeniach obowiązuje materiał z poprzednich wykładów (kolokwia). • Praca na ćwiczeniach.

  6. Podstawowe pojęcia

  7. Zdarzenia • Eksperyment – powtarzalny sposób postępowania dający jakiś wynik • nie zakładamy powtarzalności wyniku • Zdarzenie elementarne – każdy możliwy wynik eksperymentu

  8. Zbiory zdarzeń • Zbiór zdarzeń elementarnych – zbiór wszystkich możliwych wyników eksperymentu • Zdarzenie losowe – dowolny podzbiór zbioru zdarzeń

  9. Prawdopodobieństwo • Określone dla zdarzeń losowych lub elementarnych. • Własności definiujące:

  10. Częstość • Częstość zdarzenia A: liczba wystąpień zdarzenia A liczba powtórzeń eksperymentu

  11. Prawdopodobieństwo i częstość • Tylko w nielicznych przypadkach można obliczyć teoretyczne prawdopodobieństwa. • Zazwyczaj musimy przybliżać je za pomocą częstości. Przybliżenie to jest tym lepsze, im większa liczba powtórzeń eksperymentu (prawo wielkich liczb).

  12. Prawdopodobieństwo warunkowe • Zdarza się, że interesują nas nie wszystkie możliwe wyniki eksperymentu, a jedynie te, które spełniają pewien warunek (zdefiniowany przez zdarzenie losowe) • Prawdopodobieństwo zdarzeń przy tak ograniczonym zbiorze zdarzeń elementarnych można obliczyć ze wzoru:

  13. Prawdopodobieństwo warunkowe – przykłady • P(♂)0,5 • P(♂|starał się na WF UJ)=290/17600,16 • policzenie tego wprost ze wzoru byłoby trudniejsze. • P(♂|przyjęty na WF UJ)=37/2540,15

  14. Zatem dla zdarzeń niezależnych: Zdarzenia niezależne • Jeśli nałożony warunek nie zmienia prawdopodobieństwa, zdarzenia nazywamy niezależnymi

  15. Zmienna losowa • Jeżeli wynik eksperymentu wyrazimy w postaci liczbowej to otrzymamy zmienną losową • Ściślej: zmienna losowa to odwzorowanie zbioru zdarzeń elementarnych w zbiór liczb rzeczywistych. Nie musi być wzajemnie jednoznaczne. • np. tę samą wygraną w grze liczbowej można uzyskać dla wielu układów wylosowanych liczb.

  16. Zmienna losowa • Gdy zmienna losowa może przybierać dowolne wartości z pewnego przedziału, nazywamy ją zmienną losową ciągłą. • Jeśli natomiast przyjmuje tylko pewne wartości, a nie przyjmuje wartości pośrednich nazywamy ją zmienną losową dyskretną.

  17. Zmienna losowa ciągła • Losujemy liczbę z przedziału [0,1] – to nasza zmienna losowa X. Jakie są prawdopodobieństwa:

  18. Zmienna losowa ciągła • Dla zmiennych losowych celowe jest rozważanie prawdopodobieństw w przedziałach a nie punktach. • Pożytecznym sposobem przedstawienia zachowania zmiennej losowej jest histogram.

  19. Histogram

  20. Histogramy • Ze wzrostem liczby przedziałów częstości obserwacji w przedziałach stają się coraz niższe. • Można temu zapobiec wykreślając częstość / szerokość przedziału. W takim histogramie pole powierzchni słupka jest równe częstości.

  21. Histogram

  22. Histogramy

  23. Funkcja gęstości rozkładu prawdopodobieństwa • Ze wzrostem liczby pomiarów częstość dąży do prawdopodobieństwa. Jeśli równocześnie zwiększamy liczbę przedziałów, histogram dąży do wykresu tzw. funkcji gęstości rozkładu prawdopodobieństwa. • Ma ona sens tylko dla zmiennej losowej ciągłej.

  24. Funkcja gęstości rozkładu

  25. Funkcja gęstości – właściwości • Funkcja gęstości rozkładu prawdopodobieństwa pozwala obliczać prawdopodobieństwo znalezienia zmiennej losowej w dowolnym przedziale.

  26. Funkcja gęstości

  27. Funkcja rozkładu (dystrybuanta) • Dystrybuanta podaje prawdopodobieństwo nieprzekroczenia przez zmienną losową wartości argumentu. • Funkcja rozkładu ma sens zarówno dla ciągłych, jak i dyskretnych zmiennych losowych.

  28. Funkcja rozkładu • jeśli X jest niewiększe od b i nie jest niewiększe od a • W języku logiki: • Można więc napisać:

  29. Funkcja rozkładu • Dla ciągłych zmiennych losowych było: • a więc

  30. Funkcja rozkładu • Kto pamięta cokolwiek z rachunku całkowego zauważy, że dystrybuanta jest funkcją pierwotną dla funkcji gęstości rozkładu: • Nachylenie wykresu dystrybuanty odpowiada więc funkcji gęstości.

  31. Funkcja rozkładu i f. gęstościInne właściwości (pole pod wykresem f(x) jest zawsze równe 1) • F jest funkcją niemalejącą

  32. Rozkłady prawdopodobieństwa • Różne eksperymenty opisywane mogą być różnymi funkcjami gęstości, czyli zmienne losowe mogą mieć różne rozkłady prawdopodobieństwa. • W praktyce bardzo często spotykamy rozkład normalny.

  33. Rozkład normalny • Funkcja gęstości dana jest wzorem: • Jej konkretna postać określona jest przez dwa parametry: • wartość oczekiwaną • odchylenie standardowe

  34. Rozkład normalny

  35. Rozkład normalny • Dlaczego rozkład normalny jest tak częsty? • Model Hagena. • Centralne twierdzenie graniczne

  36. Model Hagena dla błędów pomiarowych • Błąd jest wypadkową wielu niezależnych czynników, wszystkich tego samego rzędu. • Każdy czynnik z równym prawdopodobień-stwem wpływa na zawyżenie lub zaniżenie wyniku pomiaru. Można udowodnić, że gdy spełnione są te założenia, to wynik pomiaru podlega rozkładowi normalnemu.

  37. Wartość oczekiwana i odchylenie standardowe • Wartość oczekiwaną i odchylenie standardowe można określić dla wielu innych (ale nie wszystkich) funkcji gęstości rozkładu: kwadrat odchyle-nia stand. nazy-wamy wariancją.

  38. Centralne twierdzenie graniczne • Jeżeli zm. losowa X ma dowolny rozkład prawdopodobieństwa (ale taki, że określone są i ), to oznacza średnią z n pomiarów • w praktyce zwykle wystarczy n rzędu 10.

  39. Estymacja parametrów • Parametry rozkładu normalnego zwykle nie są znane. Na podstawie serii pomiarów możemy je oszacować: jest oszacowaniem dla wartości oczekiwanej jest oszacowaniem odchylenia standardowego

  40. Standardowy rozkład normalny • Jeśli X ma rozkład normalny o parametrach i to: ma rozkład normalny o parametrach zwany standardowym rozkładem normalnym.

  41. Standardowy rozkład normalny standardowy

  42. Suma i różnica niezależnych rozkładów • Jeżeli X ma rozkład o parametrach i oraz Y ma rozkład o parametrach i to parametry rozkładu ich sumy X+Y są następujące: • Podobnie, dla różnicy X-Y:

  43. Suma i różnica rozkładów • Kształt rozkładu sumy lub różnicy jest zwykle inny od kształtu składników. Są jednak wyjątki, np. rozkład normalny lub • Suma lub różnica dwóch zmiennych o rozkładzie normalnym też ma rozkład normalny.

  44. Średnia z pomiarów o rozkładzie normalnym • Jeśli zmienna losowa X ma rozkład normalny o parametrach i : • to średnia z n pomiarów ma rozkład normalny o parametrach i :

  45. Galeria rozkładów ciągłych

More Related