280 likes | 490 Views
Testovanie. štatistických hypotéz. Nehovor: “Objavil som pravdu!”, ale radšej, “Objavil som jednu z právd” Kahlin Gibran “Prorok”. Testovanie š tatistických hypotéz. Parametre základného súboru nepoznáme
E N D
Testovanie štatistických hypotéz Nehovor: “Objavil som pravdu!”, ale radšej, “Objavil som jednu z právd” Kahlin Gibran “Prorok” doc.Ing. Zlata Sojková, CSc.
Testovanie štatistických hypotéz Parametre základného súboru nepoznáme Môžeme však o nich vysloviť určité predpoklady, ktoré formulujeme ako hypotézya overujeme štatistickými postupmi - testovanie štatistických hypotéz (TH). Overovať možno nielen predpoklady o parametroch (napríklad strednej hodnote), ale aj o tvare rozdelenia štatistického znaku (napr. testovanie zhody empirického rozdelenia početností s normálnym rozdelením. doc.Ing. Zlata Sojková, CSc.
Príklady: • Chceme overiť, či sa priemerné výdavky na potraviny v r. 2000 významne zvýšili oproti r.1999, pričom na základe výberového skúmania predstavovali v r. 1999 34% a v r. 2000 36% • Výrobca reflektorov uvádza, že ich stredná životnosť predstavuje 70 hodín. Za tým účelom sa uskutočnilo výberové skúmanie ana vzorke 20 reflektorov sa zistila priemerná životnosť 67 hodín a výberová smerodajná odchýlka 2 hodiny. Má výrobca pravdu ??? doc.Ing. Zlata Sojková, CSc.
Základnépojmy • Formulujeme východiskovú - nulovú hypotézuH0, ktorá vždy tvrdí zhodu toho čo porovnávame - testujeme, napr. hpotézu o zhode strednej hodnoty so známoukonštantou 0, • H0 : = 0,, všeobecne H0 : Q = Q0 • Oproti nulovej hypotéze formulujeme alternatívnu hypotézu H1,napr. H1 : 0, , všeobecne H1 : Q Q0,obojstranný test resp. H1 : Q > Q0jednostranné H1 : Q < Q0testy Nulová a alternatívna hypotéza sa musia vzájomne vylučovať doc.Ing. Zlata Sojková, CSc.
Parameter základného súboru Q, o ktorom máme určitú hypotézu nepoznáme, iba ho odhadujeme na základe výberového súboru pomocou výberovej charkteristiky un. Rozhodnutie o zamietnutí resp. nezamietnutí nulovej hypotézy uskutočňujeme na základe náhodného výberu. Nemôžme ho urobiť s absolútnou presnosťou.Existuje riziko odhadu. Za predpokladu, že platí nulová hypotéza , rovná sa parameter Q predpokladanej veličine Q0 Ho : Q = Qo . Keďže est. Q = un, potom rozdiel = un - Q0 je iba náhodnou chybou, spôsobenou náhodným výberom. doc.Ing. Zlata Sojková, CSc.
Ak však H0 neplatí , t.j. Q Q0, potom sa rozdiel môže skladať • z náhodnej chyby • systematickej chyby, ktorá odráža skutočný rozdiel medzi • parametrom základného súboru Q a jeho predpokladanou • veľkosťou Q0 • = un - Q0 = (un - Q) + (Q- Q0) Náhodná chyba Systematická chyba - rozdiel V praxi nemožno zistiť , či rozdiel obsahuje iba náhodnú chybu, alebo aj systematickú. Ak je však malé pripisujeme ho iba náhodnosti výberu, ak prekročí určitú veľkosť, predpokladáme, že zahrňuje aj systematickú chybu - rozdiel. doc.Ing. Zlata Sojková, CSc.
Rozhodnutie o zamietnutí, resp. nezamietnutí H0 predpokladá • znalosť kritickej hodnoty, ktorá rozdiel rozdelí na dve časti : • pri rozdieloch menších alebo rovných ako kritická hodnota H0 nezamietame, • pri rozdieloch> ako kritická hodnota, H0 zamietame. Veľkosť v konkrétnych prípadoch kolíše, je náhodnou veličinou,. Preto sa snažíme transformovať , ktoré je funkciou un a parametra základného súboru Q na veličinu G, ktorá má známe teoretické rozdelenie (napr. Normované normálne, res. Studentovo či iné rozdelenie). G = f(un , Q) G = f() pričom funkcia hustoty náhodnej premennej G je f(g) Vychádzame z platnosti H0:Q = Q0 a vypočítame testovaciu charakteristiku g = f(un , Q0) doc.Ing. Zlata Sojková, CSc.
- hladina významnosti, obvykle 0.05 1 - /2 /2 g1 g2 Obor prijatia hypotézy H0 kritický obor, obor zamietnutia H0 Rozhodnutie o výsledku testu:Môžeme potom nájsť také kritické hodnoty g1a g2náhodnej veličiny G , pre ktoré platí: P(g1 G g2) = 1 - alebo P(g1 G g2) = g ? g ? kritický obor, obor zamietnutia H0 kritický obor, obor zamietnutia H0 doc.Ing. Zlata Sojková, CSc.
Rozhodnutie o výsledku testu, zamietnutí resp. nezamietnutí nulovej hypotézy H0 závisí od voľby • hladiny významnosti , • hladina významnosti rozdeľuje obor hodnôt • veličiny G na obor prijatia a obory zamietnutia H0 • V prípade, že H0 : Q=Q0 nezamietame, tvrdíme, že rozdiel medzi Q a Q0 je štatisticky nepreukazný, t.j. nesignifikantný • Ak H0 : Q=Q0 na hladine • významnosti , zamietame, • rozdiel medzi Q a Q0 je • štatisticky preukazný, t.j. • signifikantný doc.Ing. Zlata Sojková, CSc.
Chyba prvého druhu -pravdepodobnosť zamietnutia správnej hypotézy Chyba druhého druhu - pravdepodobnosť prijatia nespravnej hypotézy 1 - … pravdepodobnosť prijatia správnej hypotézy 1 - …sila testu f(H0) f(H1) 1 - 1 - = P(H1/H0) = P(H0/H1) • -pravdepodobnosť prijatia H1 keď platíH0 -pravdepodobnosť prijatia H0 keď platí H1 doc.Ing. Zlata Sojková, CSc.
Chyba prvého druhu a chyba druhého druhu sú vzájomne previazanými chybami.Znižovanie chyby jedného duhu vedie k zväčšovaniu chyby druhého druhu. Preto je potrebné nájsť kompromis medzi nimi. Z uvedeného dôvodu sa obvykle volí = 0,05. doc.Ing. Zlata Sojková, CSc.
Anjel ako “objednávateľ si chce byť istý, že bocian nedodá príliš veľa chlapcov. 52% alebo ešte viac sa mu zdá vo vzorovej zásielke príliš mnoho. “Dodávatelˇ“ bocian vie, že v priemere dodáva 51% chlapcov, ale pri prísnych podmienkach “prebierky” by bolo 16% jeho jeho zásielky odmietnuté, aj keď “celková produkcia” zodpovedá požiadavkám. Otázkou je ako je rozdelené riziko medzi dodávateľom a odberateľom. Na obrázku anjel neriskuje vôbec nič... doc.Ing. Zlata Sojková, CSc.
Postup testovania: • Formulujeme základnú a alternatívnu hypotézu • Zvolíme hladinu významnosti • Vypočítame potrebné výberové charakteristiky a zvolíme správne testovacie kritérium, ktorého hodnotu vypočítame, • Rozhodneme o výsledku testu, t.j. o zamietnutí, resp. nezamietnutí nulovej hypotézy porovnaním hodnoty testovacieho kritéria s kritickými hodnotami príslušného rozdelenia (nájdené v tabuľkách) doc.Ing. Zlata Sojková, CSc.
Testy hypotéz o strednej hodnote A. Testy zhody strednej hodnoty so známou konštantou H0 : = 0 Nech štatistický znak X má v základnom súbore približne normálne rozdelenie ….N(, 2) Predpokladajme, že odhadovaná stredná hodnota sa rovná známej konštante 0, t.j. H0 : = 0 oproti alternatívnej hypotéze H1 : 0 pri obostrannom teste est = pričom … N(, 2/n) doc.Ing. Zlata Sojková, CSc.
a) predpokladajme,žepoznáme rozptyl základného súboru 2 (teoretický predpoklad) Potom vytvoríme ako testovaciu chrakteristiku náhodnú veličinu: má …N(0,1) sme transformovali na známe teoretické rozdelenie.. doc.Ing. Zlata Sojková, CSc.
Rozhodnutie o výsledku testu: Ak |uvyp| u1-/2 => H0 nezamietame Ak |uvyp| > u1-/2 => H0 zamietame f(u) 1 - Obor prijatia H0 doc.Ing. Zlata Sojková, CSc.
b)Ak nepoznáme rozptyl základného súboru, est 2 = s12 , a rozsah výberového súboru n > 30 môžme použiť N(0,1) Ak |uvyp| u1-/2 => H0 nezamietame ak |uvyp| > u1-/2 => H0 zamietame doc.Ing. Zlata Sojková, CSc.
c)Ak nepoznáme rozptyl základného súboru, est 2 = s12 , a rozsah výberového súboru je malý, n 30 Testovacie kritérium Kritická hodnota t (n-1) - kvantil Studentovho rozdelenia Vyhodnotenie testu: Doplňte sami !!! doc.Ing. Zlata Sojková, CSc.
B. Testy hypotéz o zhode dvoch stredných hodnôt nezávislých súborov Nech štatistický znak X1má v prvom základnom súbore približne normálne rozdelenie ….N(1, 12) Štatistický znak X2má v druhom základnom súbore tiež približne normálne rozdelenie ….N(2, 22) Predpokladajme, že odhadované stredné hodnoty 1 a 2 sú zhodné, t.j. testujeme H0 :1 = 2 oproti alternatívnej hypotéze H1 :1 2 pri obostrannom teste est 1 = … N(1, 12/n1) est 2 = … N(2, 22/n2) doc.Ing. Zlata Sojková, CSc.
a) predpokladajme, že poznáme rozptyly základných súborov 12 , 22 (teoretický predpoklad)potom aj Vytvoríme ako testovaciu chrakteristiku náhodnú veličinu: ktorá má …N(0,1) doc.Ing. Zlata Sojková, CSc.
b) predpokladajme, že rozptyly základných súborov 12 , 22 nepoznáme, ale obidva výberové súbory majú dostatočný rozsah n1>30, n2>30 potom môžeme použiť testovaciu chrakteristiku ako v bode a)rozptyly základných súborov nahradíme ich bodovými odhadmi:est 12 = s112 est 22 = s122 doc.Ing. Zlata Sojková, CSc.
c) predpokladajme, že rozptyly základných súborov 12 , 22 nepoznáme, pričom aspoň jeden z výberových súborov má malý rozsah n1 30, alebo n2 30 Ak však môžeme predpokladať, že rozptyly sú zhodné, t.j.12 = 22 = 2,môžeme použiť testovaciu chrakteristiku t, ktorá má Studentovo rozdelenie: Hodnotu testovacieho kritéria t -vyp. porovnáme s kritickou hodnotou t pre (n1 +n2 - 2) stupne voľnosti. doc.Ing. Zlata Sojková, CSc.
d) predpokladajme, že rozptyly základných súborov 12 , 22 nepoznáme, pričom aspoň jeden z výberových súborov má malý rozsah n1 30, alebo n2 30 Nemôžeme však predpokladať zhodu rozptylov(12 22 ) (Overuje sa F-testom)Môžeme použiť približný Behrens-Fischerov test zhody stredných hodnôt pri nehomogénnej variancii doc.Ing. Zlata Sojková, CSc.
C. Test hypotézy o zhode dvoch stredných hodnôt závislých súborov Predpokladajme, že dvakrát po sebe uskutočníme merania na tých istých štatistických jednotkách, čím získame nasledovné merania: x11 , x12, …x1j , …, x1n x21,x22, …x2j , …, x2n Údaje tvoria tzv. párové pozorovania -tzv. závislé náhodné výbery Pre každú dvojicu, pár môžeme vypočítať diferenciu: dj = x1j - x2j , Index poradia merania, j = 1,2,…,n x i j Index súboru meraní v čase i = 1,2 doc.Ing. Zlata Sojková, CSc.
Testovať budeme Ho : 1 = 2 , alebo Ho : d = 0 oproti alternatívnej hypotéze Ho : d 0 Testovacie kritérium bude mať Studentovo rozdelenie s (n - 1) stupňami voľnosti Vyhodnotenie testu: Ak |t vyp.| < t (n-1) Ho nezamietame, t.zn. Stredné hodnoty závislých súborov sú zhodné, resp. stredná hodnota diferencií sa štatisticky významne nelíši od nuly. Ak |t vyp.| t (n-1) Ho zamietame….. doc.Ing. Zlata Sojková, CSc.
Príklady závislých výberov • Skúmame vplyv očkovacej látky proti slintačke u ošípaných na zníženie hmotnosti. Zatým účelom náhodne vyberieme npokusných zvierat a aplikujeme im očkovacie sérum. Vážením pred očkovaním a dva týždne po očkovaní získame n -párových hodnôt • Skúmame vplyv reklamy na výšku tržieb za vybraný výrobok. Náhodne vyberieme n-predajní a zisťujueme tržby pred reklamou a tri týždne po spustení reklamy. doc.Ing. Zlata Sojková, CSc.
Testy hypotéz o rozptyloch A. Test zhody rozptylu so známou konštantou H0 :2 = 20 , est 2 = s12 oprotiH1 :2 20 Má 2 rozdelenie s (n-1) stupňami voľnosti testovacie kritérium Obor zamietnutia 2 1- /2 Obor zamietnutia 2 /2 Obor nezamietnutia H0 doc.Ing. Zlata Sojková, CSc.
B. Test zhody dvoch rozptylov H0 :12 = 22 est 12 = s112 , est 22 = s122oprotiH1 :12> 22 , jednostranný test Testovacie kritérium má Fischerovo rozdelenie so stupňami voľnosti: s.v.1 =1= n1-1, s.v.2= 2= n2-1 Pozn. Do čitateľa dávame väčší ropzptyl, preto F>1 a alternatívna hypotéza môže byť iba jednostranná Vyhodnotenie testu: Ak F vyp. < F ( 1, 1) H0 nezamietame , rozptyly základných súborov môžeme považovať za zhodné Ak F vyp. F ( 1, 1) H0 zamietame , rozptyl prvého súboru (v čitateli) je signifikantne väčší od druhého doc.Ing. Zlata Sojková, CSc.