420 likes | 702 Views
ŠTATISTICKÁ INDUKCIA. PREDNÁŠKA 4. štatistická indukcia úlohy štatistickej indukcie druhy výberov teoretické rozdelenia. teória odhadu bodový odhad intervalový odhad. Štatistická indukcia. zaoberá sa výberovým skúmaním vo všeobecnosti štatistické skúmanie rozlišujeme:
E N D
PREDNÁŠKA 4 • štatistická indukcia • úlohy štatistickej indukcie • druhy výberov • teoretické rozdelenia • teória odhadu • bodový odhad • intervalový odhad
Štatistická indukcia • zaoberá sa výberovým skúmaním • vo všeobecnosti štatistické skúmanie rozlišujeme: • vyčerpávajúce (úplné) zisťovanie • skúmajú sa všetky štatistické jednotky v rámci štatistického súboru • spadá do deskriptívnej (popisnej) štatistiky • závery majú deterministický charakter
Štatistická indukcia • výberové (neúplné) zisťovanie • skúmajú sa len vybrané jednotky • závery majú pravdepodobnostný charakter • spadá do induktívnej štatistiky
Výberové skúmanie • Ak chceme vedieť ako chutí víno, uložené v hektolitrovom sude, nemusíme vypiť celý sud. Stačí malý dúšok k posúdeniu jeho kvality…. • Ak však chceme zistiť, či náklad orechov v nákladnom aute je z veľkej časti pokazený, stačí keď vyberieme pár orechov z rôznych miest nákladu a rozlúskneme ich…
Štatistická indukcie – základné pojmy • rozlišujem 2 základné pojmy: • základný súbor (ZS) • výberový súbor (VS)
Základný súbor • všetky jednotky • rozlišujeme ZS: • reálny • hypotetický • ZS z hľadiska rozsahu: • konečný • nekonečný
Výberový súbor • je tvorený len vybranou časťou jednotiek ZS • podmnožina jednotiek ZS • je reprezentatívnou vzorkou ZS • pri vyčerpávajúcom skúmaní je VS totožný so ZS
Výberové skúmanie • vychádzajúc z teórie pravdepodobnosti závery z výberových skúmaní sú prakticky rovnocenné záverom z vyčerpávajúceho skúmania
Parameter základného súboru Štatistika výberového súboru - výberový priemer Označenia • Parameter • charakteristika popisujúca základný súbor • Výberová charakteristika • charakteristika popisujúca výberový súbor • je odhadom parametrov základného súboru n- rozsah výberového súboru N - rozsah - stredná hodnota s12 - výberový rozptyl 2 - rozptyl s1 - výberová smerodajná odchýlka - smerodajná odchýlka Q – všeobecné označenie un – všeobecné označenie
Štatistická indukcie • cieľ – poznávať vlastnosti ZS na základe VS • má dve základné úlohy: • teória odhadu • testovanie štatistických hypotéz • pomocné úlohy: • vytváranie VS – určovanie rozsahu VS, určenie spôsobu, druhu výberu jednotiek • určenie teoretických rozdelení charakteristík získaných z výberových súborov - keďže výberové charakteristiky sú z hľadiska ZS náhodné veličiny, je potrebné zvoliť správny model rozdelenia výberových charakteristík
Vytváranie výberového súboru • rozlišujeme rôzne druhy výberov • podľa kritéria pre výber jednotiek: • náhodný výber • zámerný výber • samovýber • podľa opakovateľnosti výberu jednotky • výber s opakovaním • výber bez opakovania • podľa členenia ZS • jednoduchý • zložený • skupinový • oblastný
Vytváranie výberového súboru • Spôsob výberu = technika náhodného výberu: • losovanie • generátor náhodných čísel - MY • systematický náhodný výber
Teoretické rozdelenia • z jedného ZS je možné vytvoriť veľký počet výberových súborov s určitým, vopred stanoveným rozsahom • dostávame rôzne hodnoty výberových charakteristík • každá náhodná veličina má svoje rozdelenie pravdepodobnosti, ktoré závisí od: • rozdelenia pravdepodobnosti skúmanej premennej v ZS • typu výberovej charakteristiky • rozsahu VS
Teoretické rozdelenia • najčastejšie používané rozdelenia: • normálne rozdelenie • c2rozdelenie • Studentovo rozdelenie • Fischerovo rozdelenie
Normálne rozdelenie • funkcia hustoty normálneho rozdelenia • parametre normálneho rozdelenia: - stredná hodnota určuje polohu rozdelenia - smerodajná odchýlka, určuje variabilitu tvaru rozdelenia
Normálne rozdelenie • Stredná hodnota - m– zmena strednej hodnoty - porovnanie modrej a žltej krivky • Smerodajná odchýlka - s – zmena variability - porovnanie modrej a ružovej krivky
P(|t| > t (s.v.)) = t(s.v.= 12) t Studentove rozdelenie • vzniká podielom dvoch náhodných veličín X....N(0,1), c2 .... c2(k) • jednovrcholové symetrické rozdelenie • krivka je podobná krivke N(0,1), je však plochšia • parameter rozdelenia – k – počet stupňov voľnosti • s rastúcim k sa rozdelenie blíži k normálnemu • k>30 – možná aproximácia
Fischerove rozdelenie • vzniká podielom dvoch náhodných veličín c12.... c2(k1) a c22.... c2(k2) • asymetrické rozdelenie vychýlené doľava • parametre rozdelenia – k1, k2 – počet stupňov voľnosti
P(F > F(s.v.1;s.v.2)) = F(s.v.1;s.v.2 ) Fischerove rozdelenie
Teória odhadu • bodový odhad – neznámy parameter ZS odhadujeme jedným číslom • intervalový odhad – neznámy parameter ZS odhadujeme intervalom s vopred stanovenou spoľahlivosťou
Bodový odhad • odhad parametra Q ZS jedným bodom (číslom) pomocou výberovej charakteristiky un, • symbolicky: est Q = un • výberová charakteristika je náhodná veličina, ktorej hodnoty kolíšu podľa toho, aké hodnoty xj sa dostali do VS
Bodový odhad • rozdiel medzi Q a un – chyba odhaduDun Dun=Q – un • chyba odhadu - čo najmenšia • pri odhadoch použiť najlepšie odhady, t.j. také výberové charakteristiky, ktoré zaručujú malú chybu odhadu Dun
Bodový odhad • výberová charakteristika un, ktorá je bodovým odhadom parametra Q ZS musí mať vlastnosti, ktoré zabezpečia, aby Dunbola čo najmenšia • základné vlastnosti bodových odhadov: • konzistencia • neskreslenosť • výdatnosť • suficiencia
Konzistencia • výberová charakteristika un je konzistentným odhadom parametra Q ZS, ak platí: • tzn.: čím je väčší rozsah VS, tým sa výberová charakteristika líši od parametra len minimálne.
Neskreslenosť • výberová charakteristika un je neskresleným odhadom parametra Q ZS, ak platí: • asymptoticky neskreslený odhad parametra Q je výberová charakteristika, pre ktorú platí:
Neskreslenosť • neskreslenosť znamená, že stredná hodnota odchýlok odhadov zo všetkých možných VS s rozsahom n od parametra Q sa rovná 0 • v každom konkrétnom prípade výberového skúmania sa dopúšťame chyby, avšak požadujeme aby stredná hodnota chýb bola rovná nule (t.j. aby sa v priemere nulovali…)
Výdatnosť • každá výberová charakteristika je náhodná veličina, ktorej variabilitu meriame rozptylom • výberovú charakteristiku nazývame výdatným odhadom, ak zo všetkých možných výberových charakteristík má najmenší rozptyl
Suficiencia • dostatočnosť • okrem výberovej charakteristiky un neexistuje žiadna iná charakteristika, ktorá by poskytovala ďalšie doplňujúce informácie o odhadovanom parametri Q ZS.
Bodový odhad parametrov ZS • strednú hodnotu ZS odhadujeme pomocou výberového priemeru • rozptyl ZS odhadujeme pomocou výberového rozptylu • smerodajnú odchýlku ZS odhadujeme pomocou výberovej smerodajnej odchýlky
Intervalový odhad • bodový odhad – vtedy keď je nevyhnutné, aby odhadom bolo jedno konkrétne číslo • bodový odhad výberovej charakteristiky poskytuje síce neskreslený a výdatný odhad, nevieme však určiť chybu, ktorej sa dopúšťame • bodový odhad sa preto používa len ako východisko pre intervalové odhady a testovanie štatistických hypotéz
Intervalový odhad • intervalovým odhadom parametra ZS Q: • t.j. odhadovaný parameter Q sa nachádza v intervale (q1,q2) s pravdepodobnosťou 1-a • interval (q1,q2) = interval spoľahlivosti • je závislý od a
Intervalový odhad • a –udáva pravdepodobnosť, že parameter Q nie je z intervalu spoľahlivosti – riziko odhadu • pravdepodobnosť 1-a potom hovorí, že parameter ZS je z intervalu (q1,q2) a nazýva sa koeficient spoľahlivosti, resp. spoľahlivosť odhadu f(un) a1+a2=a a1 a2 1-a q1 q2 Q
Intervalový odhad • so zvyšovaním spoľahlivosti sa rozširuje interval spoľahlivosti a tým sa znižuje presnosť odhadu • pri nižšej spoľahlivosti je síce interval spoľahlivosti užší, ale súčasne sa zvyšuje riziko odhadu • prakticky sa volí spoľahlivosť 1-a = 95%, resp. 99% • základom intervalového odhadu je: • odhad charakteristiky un • určenie rozdelenia un
Intervalový odhad pre strednú hodnotu m • predpokladajme, že štatistický znak X v základnom súbore má …N(,2) • ak vytvoríme výberový súbor o rozsahu n, potom aj • ak poznáme rozptyl základného súboru (teoretické východisko), vytvoríme normovanú premennú: umá rozdelenie N(0,1) nezávislé od strednej hodnoty
Intervalový odhad pre strednú hodnotu m f(un)=N(0,1) • podľa N(0,1) určíme q1, q2 = u1-a/2 a/2 a/2 1-a -u1-a/2 u1-a/2
a/2 a/2 1-a -u1-a/2 u1-a/2 Intervalový odhad pre strednú hodnotu m • po úprave: • prípustná chyba závisí od: • zvolenej spoľahlivosti • variability ZS • rozsahu VS D D
poznáme s? n>30 Intervalový odhad pre strednú hodnotu m • určenie hodnoty u1-a/2 nie áno est s=s1 u1-a/2 ..... N(0,1) NORMSINV(1-a/2) áno nie u1-a/2 ..... ta, (n-1) TINV(a, (n-1))
Intervalový odhad pre rozptyl s2a s • vytvoríme veličinu: c2má c2rozdelenie s (n-1) stupňami voľnosti • na základe c2 vytvoríme interval spoľahlivosti pre s2 • po úprave:
f(2) /2 /2 1 - 21-/2 2/2 Intervalový odhad pre rozptyl s2a s • interval spoľahlivosti pre smerodajnú odchýlku s • hodnoty c21-a/2 a c2a/2Þ kvantily c2 rozdelenia • CHIINV(a/2, (n-1)) • CHIINV(1-a/2, (n-1))