380 likes | 782 Views
TESTOVANIE ŠTATISTICKÝCH HYPOTÉZ. PREDNÁŠKA 5. testovanie štatistických hypotéz: základná terminológia chyba I. a II. druhu všeobecný postup testovania testy hypotéz o strednej hodnote test zhody strednej hodnoty so známou konštantou test zhody dvoch stredných hodnôt – nezávislé výbery
E N D
PREDNÁŠKA 5 • testovanie štatistických hypotéz: • základná terminológia • chyba I. a II. druhu • všeobecný postup testovania • testy hypotéz o strednej hodnote • test zhody strednej hodnoty so známou konštantou • test zhody dvoch stredných hodnôt – nezávislé výbery • test zhody dvoch stredných hodnôt – závislé výbery • testy hypotéz o rozptyle • test zhody rozptylu so známou konštantou • test zhody dvoch rozptylov
Testovanie štatistických hypotéz • vychádzame z toho, že parametre ZS nie sú známe • môžeme však o nich vysloviť určité predpoklady • predpoklady overujeme štatistickými metódami, ktoré nazývame štatistické hypotézy • postup = testovanie štatistických hypotéz
Testovanie štatistických hypotéz • vychádzame zo základnej hypotézy = H0 hypotéza • oproti nej je postavená alternatívna hypotézaH1 • cieľom testovanie hypotéz je rozhodnutie o prijatí alebo zamietnutí základnej hypotézy • ak zamietame základnú hypotézu, potom prijímame alternatívnu hypotézu
Testovanie štatistických hypotéz • štatistická hypotéza môže vyjadrovať predpoklad o rovnosti parametra ZS s ľubovoľnou známou konštantou alebo parametrom iného základného súboru • v tomto prípade hovoríme o H0 hypotéze H0: Q=Q0H0: Q-Q0=0 • také hypotézy, pri ktorých sa predpokladá nerovnosť parametra ZS, sa nazývajú H1 hypotézy
Testovanie štatistických hypotéz • H1 hypotézy môžu byť v rôznych tvaroch: • obojstranná H1: Q¹Q0 • jednostranné: • pravostranná H1: Q>Q0 • ľavostranná H1: Q<Q0
Testovanie štatistických hypotéz • parameter Q, o ktorom máme určitú hypotézu, nepoznáme • odhadujeme ho pomocou výberovej charakteristiky un • un je náhodná premenná, pričom predpokladáme, že poznáme jej rozdelenie
Testovanie štatistických hypotéz • rozhodnutie o zamietnutí, resp. nezamietnutí H0 uskutočňujeme na základe náhodného výberu • nemôžeme ho urobiť s absolútnou presnosťou • existuje určité riziko odhadu • za predpokladu, že platí H0, rovná sa parameter Q predpokladanej veličine Q0 • keďže est Q=un, potom rozdiel D=un-Q0 je len náhodnou chybou spôsobenou náhodným výberom
Testovanie štatistických hypotéz • ak však H0 neplatí, t.j. Q¹Q0, potom sa rozdiel môže skladať z náhodnej chyby a systematickej chyby, ktorá odráža skutočný rozdiel medzi parametrom ZS Q a jeho predpokladanou veľkosťou Q0 = un-Q0=(un-Q)+(Q-Q0) náhodná chyba systematická chyba - rozdiel
Testovanie štatistických hypotéz • v praxi nemožno zistiť, či rozdiel obsahuje iba náhodnú chybu alebo aj systematickú • ak je však malé, pripisujeme ho iba náhodnosti výberu • ak prekročí určitú veľkosť, predpokladáme, že zahrňuje aj systematickú chybu - rozdiel
Testovanie štatistických hypotéz • rozhodnutie o zamietnutí, resp. nezamietnutí H0 predpokladá znalosť kritickej hodnoty, ktorá rozdiel rozdelí na dve časti : • pri rozdieloch < ako kritická hodnota, H0 nezamietame • pri rozdieloch ako kritická hodnota, H0 zamietame • veľkosť v konkrétnych prípadoch kolíše, je náhodnou veličinou,preto sa snažíme transformovať na veličinu G, ktorá má známe teoretické rozdelenie (napr. normované normálne, resp. Studentovo či iné rozdelenie)
Testovanie štatistických hypotéz G = f(un,Q) Þ G = f() • pričom funkcia hustoty náhodnej premennej G je f(g) • vychádzame z platnosti H0:Q = Q0 a vypočítame testovaciu charakteristiku g =f(un,Q0) • rozhodnutie o výsledku testu: • môžeme potom nájsť také kritické hodnotyg1 a g2 náhodnej veličiny G, pre ktoré platí: P(g1 G g2) =1-alebo P(g1 Gg2) =
Testovanie štatistických hypotéz • hladiny významnosti • hladina významnosti rozdeľuje obor hodnôt veličiny G na obor prijatia a obory zamietnutia H0 f(g) 1-a a/2 a/2 g1 g2 kritický obor, obor zamietnutia H0 kritický obor, obor zamietnutia H0 obor prijatia H0
Testovanie štatistických hypotéz • Závery testov je možné robiť dvomi spôsobmi: • klasický (na základe kritickej hodnoty) • moderný prostredníctvom p hodnoty(p value) P hodnotapredstavuje pravdepodobnosť, že výberová charakteristika nadobudne aspoň takú hodnotu ako je skutočne zistená hodnota (hodnota testovacej charakteristiky) p hodnota = P(U>u) p hodnota = vypočítaná hladina významnosti prakticky: ak p hodnota < hladina významnosti (a), tak H0 zamietame ak p hodnota < 0,05 rozdiel je preukazný ak p hodnota < 0,01 rozdiel je vysokopreukazný
Testovanie štatistických hypotéz • CHYBY PRI TESTOVANÍ: • popri správnom rozhodnutí o výsledku testu: • prijatí správnej hypotézy • zamietnutí nesprávnej hypotézy • môže dôjsť k nesprávnemu rozhodnutiu: • zamietnutí správnej hypotézy – chyby I.druhu • prijatí nesprávnej hypotézy – chyby II. druhu
Skutočnosť pravda nepravda H0: pravda Naše rozhodnutie H1: nepravda Testovanie štatistických hypotéz • 1-a – pravdepodobnosť prijatia správnej hypotézy • a– riziko zamietnutia správnej hypotézy • ak sa znižuje a, znižuje sa vznik chyby I. druhu = rozšíri sa obor prijatia H0 • znižovaním a však rastie riziko vzniku chyby II. druhu – označuje sa ako b • potom 1-b udáva silu testu = pravdepodobnosť zamietnutia H0 v prípade, ak je skutočne nesprávna • v praxi: a=0,05, resp. a=0,01 správne Chyba II. typu Chyba I. typu správne
Testovanie štatistických hypotéz chyba I. a II. druhu - graficky H0 hypotéza H1 hypotéza
rovnosť rozdiely definovanie zber údajov testovanie záver testu Testovanie štatistických hypotéz • všeobecný postup testovania: 1. Formulácia hypotéz • nulová hypotéza H0 - obsahuje definíciu rovnosti • alternatíva hypotéza - je opakom k nulovej hypotéze 2. Definovanie hladiny významnosti • akú pravdepodobnosť sme ochotní akceptovať pre chybu I.typu • väčšinou 0,05 alebo 0,01 4. Voľba testovacieho kritéria • na základe typu testu • jeho výpočet 5.Určenie kritických hodnôt 3. Výberové skúmanie • vytvorenie výberového súboru • výpočet výberových charakteristík 6. Rozhodnutie o výsledku testu • prijatie, resp. zamietnutie H0 • interpretácia
Testy hypotéz o strednej hodnote • test zhody strednej hodnoty so známou konštantou • poznáme s2 • nepoznáme s2 a n>30 • nepoznáme s2 a n£30 • test zhody dvoch stredných hodnôt • nezávislé súbory: • poznáme s21, s22 • nepoznáme s21, s22 a n1,n2>30 • nepoznáme s21, s22 a n1, resp. n2£30 • závislé súbory
Test zhody strednej hodnoty so známou konštantou • Test zhody strednej hodnoty so známou konštantou • nech štatistický znak X má v ZS približne normálne rozdelenie X....N (, 2) • predpokladajme, že stredná hodnota m sa rovná známej konštante m0 • formulácia hypotéz: H0: m = m0 H1: m ¹ m0 • odhadujeme, že est m =
Test zhody strednej hodnoty so známou konštantou • predpokladáme, že poznáme s2 ZS (teoretický predpoklad) • testovacia charakteristika • u má N(0,1)
Test zhody strednej hodnoty so známou konštantou • nepoznáme s2 ZS a rozsah VS >30 • est s2 = s12 • testovacia charakteristika • u má N(0,1)
Test zhody strednej hodnoty so známou konštantou • nepoznáme s2 ZS a rozsah VS £ 30 • est s2 = s12 • testovacia charakteristika • t má t (n-1)rozdelenie (Studentove r.)
Test zhody strednej hodnoty so známou konštantou • rozhodnutie o výsledku testu: f(u) 1-a a/2 a/2 u1-a/2 -u1-a/2 kritický obor, obor zamietnutia H0 kritický obor, obor zamietnutia H0 obor prijatia H0 • ak |uvyp, tvyp| < u1-/2, ta, (n-1)Þ H0 nezamietame • ak | uvyp, tvyp| ³ u1-/2, ta, (n-1)Þ H0 zamietame
Test zhody dvoch stredných hodnôt • Test zhody dvoch stredných hodnôt – nezávislé výbery • predpokladáme, že výberové súbory sú nezávislé: • prvky jedného súboru nemôžu byť zároveň prvkami druhého súboru • prvky sa v danom súbore neopakujú • nech štatistický znak X1v prvom ZS má normálne rozdelenie N(1, 12) • nech štatistický znak X2v druhom ZS má normálne rozdelenie N(2, 22)
Test zhody dvoch stredných hodnôt • predpokladajme, že odhadované stredné hodnoty 1 a 2 sú zhodné • formulácia hypotéz: H0: m1 = m2 ,resp. H0: m1 - m2 = 0 H1: m1 ¹ m2 ,resp. H1: m1 - m2 ¹ 0 • odhadujeme, že: • est m1 = • est m2 =
Test zhody dvoch stredných hodnôt • predpokladáme, že poznáme rozptyly ZS1 a ZS2 (teoretický predpoklad) potom aj • testovacia charakteristika • u má N(0,1)
Test zhody dvoch stredných hodnôt • nepoznáme rozptyly ZS1 a ZS2 a rozsahy VS1 a VS2>30 • est s12 = s112, est s22 = s122 • testovacia charakteristika (po úprave), inak rovnaká ako v prípade a) • u má N(0,1)
Test zhody dvoch stredných hodnôt • nepoznáme rozptyly ZS1 a ZS2 a rozsah VS1 £ 30 alebo rozsah VS2£30 est s12 = s112, est s22 = s122 podmienka: rozptyly porovnávaných základných súborov sa rovnajú testovacia charakteristika: t má t (s.v.)rozdelenie (Studentove r.) stupne voľnosti = n1+n2-2
Test zhody dvoch stredných hodnôt • predpokladajme, že rozptyly základných súborov 12 , 22 nepoznáme, pričom aspoň jeden z výberových súborov má malý rozsah n1 30, alebo n2 30. Nemôžeme však predpokladať zhodu rozptylov(12 22 ) (Overuje sa F-testom).Môžeme použiť približný Behrens-Fischerov test zhody stredných hodnôt pri nehomogénnej variancii.
Test zhody dvoch stredných hodnôt • Test zhody dvoch stredných hodnôt – závislé výbery = párový t-test • predpokladáme, že výberové súbory sú závislé: • skúmanie na tej istej štatistickej jednotke dva krát • prvky sa v daných súboroch opakujú • rozsahy výberových súborov sa musia rovnať
Test zhody dvoch stredných hodnôt • test je založený na diferencii di=xi1-xi2 • formulácia hypotéz: H0: m1 = m2 ,resp. H0: md= 0 H1: m1 ¹ m2 ,resp. H1: md ¹ 0 • testovacia charakteristika • t má t (n-1)rozdelenie (Studentove r.)
Testy hypotéz o rozptyle • test zhody rozptylu so známou konštantou • test zhody dvoch rozptylov
Test zhody rozptylu so známou konštantou • Test zhody rozptylu so známou konštantou • nech štatistický znak X má v ZS približne normálne rozdelenie X....N (, 2) • predpokladajme, že rozptyl s2 sa rovná známej konštante s02 • formulácia hypotéz: H0: s2 = s02 H1: s2 ¹ s02 • odhadujeme, že est s2 = s12
Test zhody rozptylu so známou konštantou • testovacia charakteristika • c2 má c2(n-1)rozdelenie (chí kvadrát r.) • Záver testu: • ak c2>c21-a/2Ù c2<c2a/2ÞH0 nezamietame • ak c2£c21-a/2Ú c2³c2a/2ÞH0 zamietame f(2) /2 1 - /2 obor prijatia H0 OZ OZ 21-/2 2/2
Test zhody dvoch rozptylov • Test zhody dvoch rozptylov • nech štatistický znak X1v prvom ZS má normálne rozdelenie N(1, 12) • nech štatistický znak X2v druhom ZS má normálne rozdelenie N(2, 22) • predpokladajme, že odhadované rozptyly s12 a s22sú zhodné • formulácia hypotéz: H0: s12 = s12 H1: s12> s12(jednostranný test) • odhadujeme, že: est s12 = s112 a est s22 = s122
1 - obor prijatia H0 OZ Fa,(n1-1),(n2-1) Test zhody dvoch rozptylov • testovacia charakteristika • F má Fa,(n1-1),(n2-1)rozdelenie (Fischerove r.) f(F) • Záver testu: • ak F< Fa,(n1-1),(n2-1)ÞH0 nezamietame • ak F³Fa,(n1-1),(n2-1)ÞH0 zamietame