1 / 28

Testovanie

Testovanie. štatistických hypotéz. Nehovor: “Objavil som pravdu!”, ale radšej, “Objavil som jednu z právd” Kahlin Gibran “Prorok”. Testovanie š tatistických hypotéz. Parametre základného súboru nepoznáme

muncel
Download Presentation

Testovanie

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Testovanie štatistických hypotéz Nehovor: “Objavil som pravdu!”, ale radšej, “Objavil som jednu z právd” Kahlin Gibran “Prorok” doc.Ing. Zlata Sojková, CSc.

  2. Testovanie štatistických hypotéz Parametre základného súboru nepoznáme Môžeme však o nich vysloviť určité predpoklady, ktoré formulujeme ako hypotézya overujeme štatistickými postupmi - testovanie štatistických hypotéz (TH). Overovať možno nielen predpoklady o parametroch (napríklad strednej hodnote), ale aj o tvare rozdelenia štatistického znaku (napr. testovanie zhody empirického rozdelenia početností s normálnym rozdelením. doc.Ing. Zlata Sojková, CSc.

  3. Príklady: • Chceme overiť, či sa priemerné výdavky na potraviny v r. 2000 významne zvýšili oproti r.1999, pričom na základe výberového skúmania predstavovali v r. 1999 34% a v r. 2000 36% • Výrobca reflektorov uvádza, že ich stredná životnosť predstavuje 70 hodín. Za tým účelom sa uskutočnilo výberové skúmanie ana vzorke 20 reflektorov sa zistila priemerná životnosť 67 hodín a výberová smerodajná odchýlka 2 hodiny. Má výrobca pravdu ??? doc.Ing. Zlata Sojková, CSc.

  4. Základnépojmy • Formulujeme východiskovú - nulovú hypotézuH0, ktorá vždy tvrdí zhodu toho čo porovnávame - testujeme, napr. hpotézu o zhode strednej hodnoty  so známoukonštantou 0, • H0 :  = 0,, všeobecne H0 : Q = Q0 • Oproti nulovej hypotéze formulujeme alternatívnu hypotézu H1,napr. H1 :   0, , všeobecne H1 : Q Q0,obojstranný test resp. H1 : Q > Q0jednostranné H1 : Q < Q0testy Nulová a alternatívna hypotéza sa musia vzájomne vylučovať doc.Ing. Zlata Sojková, CSc.

  5. Parameter základného súboru Q, o ktorom máme určitú hypotézu nepoznáme, iba ho odhadujeme na základe výberového súboru pomocou výberovej charkteristiky un. Rozhodnutie o zamietnutí resp. nezamietnutí nulovej hypotézy uskutočňujeme na základe náhodného výberu. Nemôžme ho urobiť s absolútnou presnosťou.Existuje riziko odhadu. Za predpokladu, že platí nulová hypotéza , rovná sa parameter Q predpokladanej veličine Q0 Ho : Q = Qo . Keďže est. Q = un, potom rozdiel  = un - Q0 je iba náhodnou chybou, spôsobenou náhodným výberom. doc.Ing. Zlata Sojková, CSc.

  6. Ak však H0 neplatí , t.j. Q  Q0, potom sa rozdiel môže skladať • z náhodnej chyby • systematickej chyby, ktorá odráža skutočný rozdiel medzi • parametrom základného súboru Q a jeho predpokladanou • veľkosťou Q0 •  = un - Q0 = (un - Q) + (Q- Q0) Náhodná chyba Systematická chyba - rozdiel V praxi nemožno zistiť , či rozdiel obsahuje iba náhodnú chybu, alebo aj systematickú. Ak je však malé pripisujeme ho iba náhodnosti výberu, ak prekročí určitú veľkosť, predpokladáme, že zahrňuje aj systematickú chybu - rozdiel. doc.Ing. Zlata Sojková, CSc.

  7. Rozhodnutie o zamietnutí, resp. nezamietnutí H0 predpokladá • znalosť kritickej hodnoty, ktorá rozdiel  rozdelí na dve časti : • pri rozdieloch menších alebo rovných ako kritická hodnota H0 nezamietame, • pri rozdieloch> ako kritická hodnota, H0 zamietame. Veľkosť v konkrétnych prípadoch kolíše, je náhodnou veličinou,. Preto sa snažíme transformovať , ktoré je funkciou un a parametra základného súboru Q na veličinu G, ktorá má známe teoretické rozdelenie (napr. Normované normálne, res. Studentovo či iné rozdelenie). G = f(un , Q)  G = f() pričom funkcia hustoty náhodnej premennej G je f(g) Vychádzame z platnosti H0:Q = Q0 a vypočítame testovaciu charakteristiku g = f(un , Q0) doc.Ing. Zlata Sojková, CSc.

  8.  - hladina významnosti, obvykle 0.05 1 -  /2 /2 g1 g2 Obor prijatia hypotézy H0 kritický obor, obor zamietnutia H0 Rozhodnutie o výsledku testu:Môžeme potom nájsť také kritické hodnoty g1a g2náhodnej veličiny G , pre ktoré platí: P(g1  G  g2) = 1 -  alebo P(g1  G  g2) =  g ? g ? kritický obor, obor zamietnutia H0 kritický obor, obor zamietnutia H0 doc.Ing. Zlata Sojková, CSc.

  9. Rozhodnutie o výsledku testu, zamietnutí resp. nezamietnutí nulovej hypotézy H0 závisí od voľby • hladiny významnosti , • hladina významnosti  rozdeľuje obor hodnôt • veličiny G na obor prijatia a obory zamietnutia H0 • V prípade, že H0 : Q=Q0 nezamietame, tvrdíme, že rozdiel medzi Q a Q0 je štatisticky nepreukazný, t.j. nesignifikantný • Ak H0 : Q=Q0 na hladine • významnosti , zamietame, • rozdiel medzi Q a Q0 je • štatisticky preukazný, t.j. • signifikantný doc.Ing. Zlata Sojková, CSc.

  10. Chyba prvého druhu  -pravdepodobnosť zamietnutia správnej hypotézy Chyba druhého druhu - pravdepodobnosť prijatia nespravnej hypotézy 1 -  … pravdepodobnosť prijatia správnej hypotézy 1 -  …sila testu f(H0) f(H1) 1 -  1 -   = P(H1/H0) = P(H0/H1) • -pravdepodobnosť prijatia H1 keď platíH0 -pravdepodobnosť prijatia H0 keď platí H1  doc.Ing. Zlata Sojková, CSc.

  11. Chyba prvého druhu a chyba druhého druhu sú vzájomne previazanými chybami.Znižovanie chyby jedného duhu vedie k zväčšovaniu chyby druhého druhu. Preto je potrebné nájsť kompromis medzi nimi. Z uvedeného dôvodu sa obvykle volí  = 0,05. doc.Ing. Zlata Sojková, CSc.

  12. Anjel ako “objednávateľ si chce byť istý, že bocian nedodá príliš veľa chlapcov. 52% alebo ešte viac sa mu zdá vo vzorovej zásielke príliš mnoho. “Dodávatelˇ“ bocian vie, že v priemere dodáva 51% chlapcov, ale pri prísnych podmienkach “prebierky” by bolo 16% jeho jeho zásielky odmietnuté, aj keď “celková produkcia” zodpovedá požiadavkám. Otázkou je ako je rozdelené riziko medzi dodávateľom a odberateľom. Na obrázku anjel neriskuje vôbec nič... doc.Ing. Zlata Sojková, CSc.

  13. Postup testovania: • Formulujeme základnú a alternatívnu hypotézu • Zvolíme hladinu významnosti  • Vypočítame potrebné výberové charakteristiky a zvolíme správne testovacie kritérium, ktorého hodnotu vypočítame, • Rozhodneme o výsledku testu, t.j. o zamietnutí, resp. nezamietnutí nulovej hypotézy porovnaním hodnoty testovacieho kritéria s kritickými hodnotami príslušného rozdelenia (nájdené v tabuľkách) doc.Ing. Zlata Sojková, CSc.

  14. Testy hypotéz o strednej hodnote A. Testy zhody strednej hodnoty so známou konštantou H0 : = 0 Nech štatistický znak X má v základnom súbore približne normálne rozdelenie ….N(, 2) Predpokladajme, že odhadovaná stredná hodnota  sa rovná známej konštante  0, t.j. H0 : = 0 oproti alternatívnej hypotéze H1 :  0 pri obostrannom teste est  = pričom … N(, 2/n) doc.Ing. Zlata Sojková, CSc.

  15. a) predpokladajme,žepoznáme rozptyl základného súboru 2 (teoretický predpoklad) Potom vytvoríme ako testovaciu chrakteristiku náhodnú veličinu: má …N(0,1)  sme transformovali na známe teoretické rozdelenie.. doc.Ing. Zlata Sojková, CSc.

  16. Rozhodnutie o výsledku testu: Ak |uvyp| u1-/2 => H0 nezamietame Ak |uvyp| > u1-/2 => H0 zamietame f(u) 1 -  Obor prijatia H0 doc.Ing. Zlata Sojková, CSc.

  17. b)Ak nepoznáme rozptyl základného súboru, est 2 = s12 , a rozsah výberového súboru n > 30 môžme použiť N(0,1) Ak |uvyp| u1-/2 => H0 nezamietame ak |uvyp| > u1-/2 => H0 zamietame doc.Ing. Zlata Sojková, CSc.

  18. c)Ak nepoznáme rozptyl základného súboru, est 2 = s12 , a rozsah výberového súboru je malý, n  30 Testovacie kritérium Kritická hodnota t (n-1) - kvantil Studentovho rozdelenia Vyhodnotenie testu: Doplňte sami !!! doc.Ing. Zlata Sojková, CSc.

  19. B. Testy hypotéz o zhode dvoch stredných hodnôt nezávislých súborov Nech štatistický znak X1má v prvom základnom súbore približne normálne rozdelenie ….N(1, 12) Štatistický znak X2má v druhom základnom súbore tiež približne normálne rozdelenie ….N(2, 22) Predpokladajme, že odhadované stredné hodnoty 1 a 2 sú zhodné, t.j. testujeme H0 :1 = 2 oproti alternatívnej hypotéze H1 :1  2 pri obostrannom teste est 1 = … N(1, 12/n1) est 2 = … N(2, 22/n2) doc.Ing. Zlata Sojková, CSc.

  20. a) predpokladajme, že poznáme rozptyly základných súborov 12 , 22 (teoretický predpoklad)potom aj Vytvoríme ako testovaciu chrakteristiku náhodnú veličinu: ktorá má …N(0,1) doc.Ing. Zlata Sojková, CSc.

  21. b) predpokladajme, že rozptyly základných súborov 12 , 22 nepoznáme, ale obidva výberové súbory majú dostatočný rozsah n1>30, n2>30 potom môžeme použiť testovaciu chrakteristiku ako v bode a)rozptyly základných súborov nahradíme ich bodovými odhadmi:est 12 = s112 est 22 = s122 doc.Ing. Zlata Sojková, CSc.

  22. c) predpokladajme, že rozptyly základných súborov 12 , 22 nepoznáme, pričom aspoň jeden z výberových súborov má malý rozsah n1 30, alebo n2 30 Ak však môžeme predpokladať, že rozptyly sú zhodné, t.j.12 = 22 = 2,môžeme použiť testovaciu chrakteristiku t, ktorá má Studentovo rozdelenie: Hodnotu testovacieho kritéria t -vyp. porovnáme s kritickou hodnotou t pre (n1 +n2 - 2) stupne voľnosti. doc.Ing. Zlata Sojková, CSc.

  23. d) predpokladajme, že rozptyly základných súborov 12 , 22 nepoznáme, pričom aspoň jeden z výberových súborov má malý rozsah n1 30, alebo n2 30 Nemôžeme však predpokladať zhodu rozptylov(12  22 ) (Overuje sa F-testom)Môžeme použiť približný Behrens-Fischerov test zhody stredných hodnôt pri nehomogénnej variancii doc.Ing. Zlata Sojková, CSc.

  24. C. Test hypotézy o zhode dvoch stredných hodnôt závislých súborov Predpokladajme, že dvakrát po sebe uskutočníme merania na tých istých štatistických jednotkách, čím získame nasledovné merania: x11 , x12, …x1j , …, x1n x21,x22, …x2j , …, x2n Údaje tvoria tzv. párové pozorovania -tzv. závislé náhodné výbery Pre každú dvojicu, pár môžeme vypočítať diferenciu: dj = x1j - x2j , Index poradia merania, j = 1,2,…,n x i j Index súboru meraní v čase i = 1,2 doc.Ing. Zlata Sojková, CSc.

  25. Testovať budeme Ho : 1 = 2 , alebo Ho : d = 0 oproti alternatívnej hypotéze Ho : d  0 Testovacie kritérium bude mať Studentovo rozdelenie s (n - 1) stupňami voľnosti Vyhodnotenie testu: Ak |t vyp.| < t (n-1) Ho nezamietame, t.zn. Stredné hodnoty závislých súborov sú zhodné, resp. stredná hodnota diferencií sa štatisticky významne nelíši od nuly. Ak |t vyp.|  t (n-1) Ho zamietame….. doc.Ing. Zlata Sojková, CSc.

  26. Príklady závislých výberov • Skúmame vplyv očkovacej látky proti slintačke u ošípaných na zníženie hmotnosti. Zatým účelom náhodne vyberieme npokusných zvierat a aplikujeme im očkovacie sérum. Vážením pred očkovaním a dva týždne po očkovaní získame n -párových hodnôt • Skúmame vplyv reklamy na výšku tržieb za vybraný výrobok. Náhodne vyberieme n-predajní a zisťujueme tržby pred reklamou a tri týždne po spustení reklamy. doc.Ing. Zlata Sojková, CSc.

  27. Testy hypotéz o rozptyloch A. Test zhody rozptylu so známou konštantou H0 :2 = 20 , est 2 = s12 oprotiH1 :2 20 Má 2 rozdelenie s (n-1) stupňami voľnosti testovacie kritérium Obor zamietnutia 2 1- /2 Obor zamietnutia 2  /2 Obor nezamietnutia H0 doc.Ing. Zlata Sojková, CSc.

  28. B. Test zhody dvoch rozptylov H0 :12 = 22 est 12 = s112 , est 22 = s122oprotiH1 :12> 22 , jednostranný test Testovacie kritérium má Fischerovo rozdelenie so stupňami voľnosti: s.v.1 =1= n1-1, s.v.2= 2= n2-1 Pozn. Do čitateľa dávame väčší ropzptyl, preto F>1 a alternatívna hypotéza môže byť iba jednostranná Vyhodnotenie testu: Ak F vyp. < F  ( 1, 1)  H0 nezamietame , rozptyly základných súborov môžeme považovať za zhodné Ak F vyp.  F  ( 1, 1)  H0 zamietame , rozptyl prvého súboru (v čitateli) je signifikantne väčší od druhého doc.Ing. Zlata Sojková, CSc.

More Related