500 likes | 794 Views
TESTIRANJE HIPOTEZ. Statistična hipoteza je trditev ali predpostavka o porazdelitv enem zakonu ene ali več slučajnih spremenljivk. Če statistična hipoteza v celoti določa porazdelitv eni zakon , pravimo, da je hipoteza enostavna , sicer pravimo da je hipoteza sestavljena.
E N D
TESTIRANJE HIPOTEZ Statistična hipoteza je trditev ali predpostavka o porazdelitvenem zakonu ene ali več slučajnih spremenljivk. Če statistična hipoteza v celoti določa porazdelitveni zakon,pravimo, da je hipoteza enostavna, sicer pravimo da je hipoteza sestavljena. Enostavna hipoteza mora določati ne le obliko porazdelitvenega zakona slučajne spremenljivke, pač pa tudi vrednosti vseh parametrov v njej.
Predpostavko imenujemo ničelna hipoteza in jo označimo z Predpostavko nasprotno ničelni hipotezi imenujemo nasprotna (alternativna) hipoteza in jo bomo označili z Ničelno hipotezo zapišemo simbolično Nasprotno hipotezo zapišemo simbolično
Iz podatkov slučajnega vzorca izračunamo vrednost posebej izbrane statistike, pravimo ji statistika testa hipoteze Glede na njeno vrednost se odločimo o sprejetju ali zavrnitvi ničelne hipoteze Postopek testiranja je torej zgrajen na delitvi vseh možnih vrednosti statistike testa hipoteze v dve območji, in sicer območje sprejemanja ničelne hipotezein območje njenega zavračanja Opisani postopek lahko pripelje do dveh vrst napak
Zavrnitev ničelne hipoteze, če je pravilna, imenujemo napaka I.vrste.Verjetnost za nastop te napake označimo z Sprejetje ničelne hipoteze, če je napačna, imenujemo napaka II.vrste.Verjetnost nastopa te napake pa označimo z Območje zavračanja ničelne hipoteze imenujemokritično območje testa Verjetnost imenujemo stopnja pomembnosti testa
Verjetnost zavrnitve ničelne hipoteze, pa naj bo pravilna ali pa ne, imenujemo moč testa in je določena s funkcijo za vse določene s za vse določene s
Verjetnost sprejetja ničelne hipoteze je in se imenuje operativna karakteristična krivulja ali enostavno OC-krivulja.
Kadar je kritično območje sestavljeno le iz enega dela gostote statistike testa hipoteze se test imenujemo enostranski test,če pa je kritično območje sestavljeno iz dveh delov, pa je test dvostranski
Postopek testiranja hipotez izvedemo v naslednjih korakih: Postavimo proti in določimo Izberemo primerno statistiko testa hipoteze in določimo kritično območje glede na Izračunamo vrednost statistike testa hipoteze iz podatkov vzorca Preverimo, če vrednost statistike testa hipoteze pade v kritično območje, in skladno s tem ničelno hipotezo zavrnemo ali pa je ne zavrnemo; lahko pa se tudi vzdržimo presoje.
P-vrednostje najmanjša stopnja pomembnosti, pri kateri ničelno hipotezo še lahko zavrnemo pri dobljeni vrednosti statistike testa hipoteze Z vpeljavo P-vrednosti pa se spremenijo tudi koraki v postopku testiranja hipotez. proti in določimo Postavimo . Izberemo primerno statistiko testa hipoteze Izračunamo vrednost statistike testa hipoteze iz podatkov vzorca in pripadajočo P-vrednost Preverimo, če je P-vrednost manjša ali enaka ,in glede na to zavrnemo ničelno hipotezo; sicer pa jo sprejmemo ali se vzdržimo presoje.
Test aritmetične sredine Testirati želimo ničelno hipotezo pri eni od nasprotnih hipotez z vzorcem velikosti n, izbranim iz normalne populacije z znano varianco in pri napaki I.vrste Statistika testa hipoteze je v tem primeru, v skladu s centralnim limitnim izrekom, enaka:
Kritično območje je določeno glede na eno izmed nasprotnih hipotez takole: kjer je
Kadar je velikost vzorca in je neznana, ne moremo uporabiti “normalnih” testov. V primeru, ko je vzorec izbran iz normalne populacije, vrednost statistike pripada t slučajni spremenljivki z n -1 prostostnimi stopnjami Kritično območje pri stopnji pomembnosti in pri ničelni hipotezi je glede na eno od alternativ enako
Test razlike aritmetičnih sredin Imamo neodvisna vzorca velikosti in iz dveh normalnih populacij z aritmetičnima sredinama ter znanima variancama in in Želimo testirati ničelno hipotezo je dana konstanta,nasprotna hipoteza pa je kritično območje je kjer je vrednost statistike Z
Kadar sta varianci populacij neznani, ju pri velikih vzorcih lahko nadomestimo z variancama vzorcev Statistika testa hipoteze pa ostane zaradi centralnega limitnega izreka ista. Za majhne vzorce in neznani varianci populacij,je statistika realizacijat slučajne spremenljivkez stopnjami prostosti
Kjer je Kritično območje za testiranje ničelne hipoteze prinasprotni hipotezi je določeno takole
Test variance Imamo slučajen vzorec velikosti n iz normalne populacije. pri eni Testirati želimo ničelno hipotezo izmed nasprotnih hipotez Statistika testa hipoteze je Kritično območje pri enostranski hipotezi je ali
Pri dvostranski nasprotni hipotezije kritično območje ali slučajna spremenljivka iman-1 stopenj prostosti je variance vzorca
Poznamo vzorca velikosti in iz dveh normalnih populacij z variancama in Testirati želimo enakost varianc populacij. Statistika je F slučajna spremenljivka z in stopnjami prostosti Kritično območje pri ničelni hipotezi in enostranski nasprotni hipotezi ali je določeno ali
Kritično območje pri dvostranski nasprotni hipotezi je za in za
Testi deležev Vzorec je izbran iz binomske populacije, za katero testiramo ničelno hipotezo pri in stopnji pomembnosti Kritično območje je kjer je x število nastopov dogodka pri n ponovitvah poskusa je najmanjše število, ki pri veljavnosti ničelne hipoteze ustreza pogoju
Pri nasprotni hipotezi je kritično območje največje število, ki ustreza pogoju V primeru dvostranske nasprotne hipoteze je kritično območje določenoz in
Za velike vzorce binomsko slučajno spremenljivko nadomestimo z normalno in za testno statistiko uporabimo standardizirano normalno slučajno spremenljivko. Za je njena vrednost enaka Znak -uporabimo, ko je Znak +uporabimo, ko je
Kontingenčne tabele Spremenljivki in naj bosta na populaciji med seboj neodvisni. Obe spremenljivki skupaj razčlenita populacijo na v.s razredov Izberemo vzorec velikosti n in tudi njega razdelimo glede na spremenljivkina v.s razredov Označimo z frekvenco razreda Pri tem velja
Frekvence vseh razredov lahko zapišemo Tabeli, zgrajeni na prikazani način, pravimo kontingenčna tabela.
Neodvisnost spremenljivk in pomeni,da med vrsticami in stolpci ni povezave. Ničelna hipoteza je, da so vrstice in stolpci med seboj neodvisni Vpeljemo teoretične frekvence O veljavnosti ničelne hipoteze se odločimo na osnovi vrednosti statistike z prostostnimi stopnjami
Kadar pri testih uporabljamo opazovane frekvence za računanje teoretičnih frekvenc, je število prostostnih stopenj enako m-t-1, pri čemer je m število členov v vsoti formule za statistiko, t pa je število neodvisnih parametrov, ki smo jih nadomestili z ocenami. Statistika testa hipoteze, ki smo jo opisali, je le približno Zato običajno uporabljamo ta test le, če nobena od teoretičnih frekvenc ni manjša od 5.
Za kontingenčno tabelo je vrednost enaka Število stopenj prostosti je 1
Vzemimo, da imamo v populacij, statistični znak vsake enote v populaciji pa lahko zavzame eno od s možnih vrednosti Ničelna hipoteza je, da so vse populacije glede na delež posameznih vrednosti statističnega znaka, med seboj enake. Za test izberemo iz vsake od v populacij vzorec določene velikosti. Vzorci, ki jih izbiramo iz populacij so lahko različno veliki. Zavrnili bomo ničelno hiptezo, če bo vrednost presegla kritično vrednost
Prilagoditveni test Uporabljamo ga, kadar želimo ugotoviti, če vzorec določene velikosti pripada populaciji, ki ima predpisani porazdelitveni zakon. Uporabljamo ga le pri velikih vzorcih Predpostavimo, da ima populacija diskreten porazdelitveni zakon Vrednosti statističnega znaka naj bodo Iz populacije izberemo vzorec velikosti N in dobljene vrednosti zapišemo v obliki frekvenčne porazdelitve
Vsota vseh frekvenc je Frekvencam pravimo empirične frekvence Vsaki vrednosti priredimo teoretično frekvenco Ničelna hipoteza je, da ima populacija iz katere izhaja vzorec, porazdelitveni zakon Test hipoteze izvedemo s pomočjo statistike
Ničelno hipotezo zavrnemo,če je Vse teoretične frekvencemorajo biti večje od 5 Število prostostnih stopenj je n - t - 1, kjer je n število različnih vrednosti statističnega znaka, t pa število ocenjenih parametrov vporazdelitvenem zakonu.
Vzemimo, da je porzdelitveni zakon zvezen Podatke vzorca velikosti N izbranega zapišimo v obliki zvezne frekvenčne porazdelitve Teoretične frekvence dobimo, da ploščine pod nad vsakim razredom, pomnožimo z N Potem je postopek testiranja hipoteze enak kot v primeru diskretnega porazdelitvenega zakona.
Sekvenčni test Vzemimo, da bi o veljavnosti ničelne hipoteze sklepali po vsakem izboru statistične enote v vzorec Pri tem ni potrebno, da pri določenem številu izbranih enot pride do odločitve V takem primeru izberemo naslednjo enoto in ponovno presojamo o ničelni hipotezi. Vzorec večamo tako dolgo, dokler ne pridemo do odločitve. Tako sprejmemo odločitev o ničelni hipotezi z najmanjšo povprečno velikostjo vzorca Testu take vrste rečemo sekvenčni test.
Diskretna slučajna spremenljivka naj zavzame vrednost x z verjetnostjo Naj bo pri Verjetnost, da so pri veljavni ničelni hipotezi izbrane v vzorec vrednosti je in pri veljavni nasprotni hipotezi
Sekvenčni kvocientni testgradi na primerjavi teh dvehverjetnosti. Statistika testa hipoteze je A in B naj bosta dve realni števili, tako da je in Vzorec povečujemo tako dolgo, dokler velja
Ničelno hipotezo sprejmemo, če je in jo zavrnemo in s tem sprejmemo nasprotno hipotezo, če je Pri danih napakah in sta A in B določeni in
Binomski sekvenčni test Ničelna hipoteza pri nasprotni hipotezi se nanaša na vrednost parametra p binomske populacije Statistika testa hipoteze je
Neenačbe nadomestimo z Vpeljimo oznake Ničelno hipotezo bomo sprejeli, ko bo prvič veljalo in zavrnili če je pa povečamo vzorec. x pomeni število nastopov nekega dogodka, če poizkus ponovimo n-krat
Določanje velikosti vzorca Za oceno aritmetične sredine normalne populacije z natančnostjo d pri stopnji zaupanja je potrebno izbrati vzorec velikosti
Za oceno razlike med aritmetičnima sredinama dveh normalnih populacij z natančnostjo d je potrebno iz populacij pri stopnji zaupanja izbrati vzorca velikosti
Za oceno deleža populacije p z natančnostjo d pri stopnji zaupanja je potrebno izbrati vzorec z velikostjo
Za oceno razlike deležev dveh populacij z natančnostjo d pri stopnji zaupanja je potrebno iz obeh populacij izbrati vzorca z velikostjo
Da pride do odločitve pri binomskem sekvenčnem testu, če je veljavna ničelna hipoteza je v povprečju potrebno izbrati vzorec velikosti
Da pride do odločitve pri binomskem sekvenčnem testu, če je veljavna nasprotna hipoteza je v povprečju potrebno izbrati vzorec velikosti