170 likes | 321 Views
Metody wnioskowania na podstawie podprób. Maria Czogała. METODA BOOTSTRAP. Niech. będzie próbą prostą wylosowaną. z tej zbiorowości. - realizacją próby x, oraz. - pewną statystyką określoną na przestrzeni prób. - niech będzie estymatorem tego parametru.
E N D
Metody wnioskowania na podstawie podprób Maria Czogała
Niech będzie próbą prostą wylosowaną z tej zbiorowości - realizacją próby x, oraz - pewną statystyką określoną na przestrzeniprób. - niech będzie estymatorem tego parametru. Załóżmy, że badamy populację ze względu na zmienną losową X o nieznanym rozkładzie F.
Definicja: Próbą bootstrapową nazywamy wektor losowy taki, że dla są niezależnymi zmiennymi losowymi o rozkładzie F oraz m jest ustaloną liczbą naturalną.
Ponieważ cała operacja przeprowadzana jest w oparciu o ustalone wartości więc losowość w próbie związana jest jedynie z losowymi wyborami pewnego elementu spośród w każdym z n ciągnięć. Zaobserwowaną realizację traktujemy jako populację, z której czerpiemy proste próby losowe. W celu otrzymania realizacji próby bootstrap dokonuje się n-krotnego losowania ze zwracaniem spośród elementów oryginalnej próby.
Definicja: Bootstrapowym estymatorem parametru rozkładu zmiennej losowej X jest statystyka postaci: gdzie: N- pewna ustalona liczba naturalna dla , przy czym to k-ta próba bootstrapowa.
Metody bootstrapowe umożliwiają również estymację przedziałową nieznanego parametru W tej pracy zaprezentuję metodę wyznaczania przedziałów ufności dla parametru rozkładu zmiennej losowej X z wykorzystaniem metody percentyli. Znanych i wykorzystywanych jest wiele podejść do tego zagadnienia.
Jeżeli jest estymatorem parametru to bootstrapową aproksymacją rozkładu statystyki stanowi rozkład statystyki postaci: jest próbą bootstrapową odpowiadającą próbie losowej Rozkład ten jest wykorzystywany do budowy przedziału ufności dla parametru gdzie:
Percentylem rzędu , gdzie , jest wartość zajmująca pozycję o numerze w ciągu wartości uporządkowanych niemalejąco, pod warunkiem, że jest liczbą całkowitą. Wyznaczamy percentyle rozkładu empirycznego zmiennej losowej otrzymanego w wyniku generowania N razy n-elementowych ciągów.
Jeżeli nie jest liczbą całkowitą, to percentylem jest wartość występująca na pozycji o numerze albo Przedziałem ufności dla parametru otrzymanym metodą percentyli przy wiarygodności jest przedział postaci: są percentylami rzędu, odpowiednio rozkładu empirycznego statystyki wyznaczonego na podstawie wygenerowanych wartości. gdzie:
Niech S będzie próbą n- elementową oraz niech będzie estymatorem parametru Metoda Jackknife pozwala oszacować wariancję tego estymatora oraz podaje konstrukcję estymatora redukującego obciążenie wyjściowego estymatora rzędu
Próbę S dzielimy losowo na G zależnych grup o równych liczebnościach, a następnie dla każdej grupy obliczamy estymator parametru według tej samej reguły funkcyjnej co ale bazujący na obserwacjach nie należących do grupy. Następnie dla każdej grupy wyznaczamy: Wartości nazywamy pseudowartościami.
Definicja: Funkcję nazywamy estymatorem Jackknife
Dziękuję za uwagę Maria Czogała