110 likes | 284 Views
VERJETNOST IN STATISTIKA. PRESKUŠANJE STATISTIČNIH DOMNEV. primerjamo dve domnevi: H 0 : ničelna domneva in H 1 : alternativna domneva ( npr. H 0 trdi, da porazdelitev ustreza zakonu P(2), H 1 pa, da ustreza zakonu P(3.5)). PRESKU ŠANJE STATISTIČNIH DOMNEV.
E N D
VERJETNOST IN STATISTIKA PRESKUŠANJE STATISTIČNIH DOMNEV primerjamo dve domnevi: H0: ničelna domneva in H1: alternativna domneva (npr. H0 trdi, da porazdelitev ustreza zakonu P(2), H1 pa, da ustreza zakonu P(3.5)) PRESKUŠANJE STATISTIČNIH DOMNEV Statistična domneva je trditev o porazdelitvenem zakonu slučajne spremeljivke, ki jo želimo potrditi ali ovreči na podlagi vrednosti, ki jih zavzame na nekem vzorcu. parametrične domneve (trditve o parametrih znanega porazdelitvenega zakona, npr. Poissonovo porazdeljena spremenljivka ima povrečjea) neparametrične domneve (trditve o naravi porazdelitvenega zakona, npr. spremenljivka je normalno porazdeljena) Domneva je enostavna, če v celoti določa porazdelitev (tip in parametre), sicer pa je sestavljena. (npr. če H0 trdi, da je porazdelitev Poissonova z neznanim parametrom - H1 pa, da ni Poissonova, sta obe sestavljeni) Omejili se bomo na osnovne primere parametričnih domnev, ko je vsaj ničelna domneva enostavna. 1 MATEMATIKA 2
VERJETNOST IN STATISTIKA PRESKUŠANJE STATISTIČNIH DOMNEV Leta2003 je bilo v Sloveniji 17321 živorojenih otrok, od tega 8930 dečkov in 8391 deklic. Zanima nas, ali je to v nasprotju z domnevo, da je rojstvo dečka enako verjetno kot rojstvo deklice. Za slučajno spremenljivko X vzamemo število rojstev dečkov. Xje porazdeljenabinomskob(n,p). H0 je enostavna domneva p=0.5, H1 je sestavljena domneva p>0.5. Izberemomajhnoštevilo (npr. 0.05 ali 0.01) in poiščemo kritično vrednost c, da je pri pogoju p=0.5 verjetnost P(X>c)=. Če je število dečkov večje od c, potem H0 zavrnemo, v nasprotnem primeru pa je ne zavrnemo. Binomsko porazdelitev b(17321,0.5) aproksimiramo z N(8660.5, 65.80), in vzamemo =0.05. Ker je dejanska vrednost (8930) večja od c0.05, ničelno domnevo zavrnemo. Pri 1% značilnosti preskusa dobimo c0.01=8813.5, torej domnevo zavrnemo tudi pri ostrejšem preskusu. 2 MATEMATIKA 2
VERJETNOST IN STATISTIKA PRESKUŠANJE STATISTIČNIH DOMNEV Enostavna parametrična domneva u=u0 ima tri alternativne parametrične domneve: u > u0 u < u0 u ≠u0 Za prvo in drugo alternativo pravimo, da sta enostranski, za tretjo pa, da je dvostranska. sprejmemozavrnemo u0 c zavrnemo sprejmemo zavrnemo sprejmemo zavrnemo cu0 c1u0c2 Pri preskušanju trdnosti nekega materiala je smiselna enostranska alternativa, saj nas ne moti, če je le-ta trdnejši kot pričakujemo. Pri preskušanju odstopov velikosti vijaka glede na matico pa raje oblikujemo dvostransko alternativo. 3 MATEMATIKA 2
VERJETNOST IN STATISTIKA PRESKUŠANJE STATISTIČNIH DOMNEV Podobno ravnamo pri drugih preskusih. Pri t-testu tvorimo in upoštevamo, da je T porazdeljen po zakonu S(n-1). Kritične vrednosti za dvostranski poskus pri značilnosti so v (n-1)-vi vrstici in stolpcu, ki ustreza . Kritične vrednosti za enostranski poskusa pa so v stolpcu, ki ustreza. Z porazdeljena po N(0,1) - kako določimo c? dvostranski preskus: enostranski preskus: 4 MATEMATIKA 2
VERJETNOST IN STATISTIKA PRESKUŠANJE STATISTIČNIH DOMNEV Povprečje 10 meritev gostote neke snovi nam je dalo 1.35g/cm3, čeprav bi teoretično pričakovali gostoto 1.2g/cm3. Na podlagi izkušenj vemo, da je pri tovrstnem merjenju standardna napaka =0.25g/cm3. Ali na podlagi tega lahko zavrnemo H0(=1.2g/cm3)? Značilnost preskusa naj bo 5%. 1.) H1(≠1.2) (dvostranski preskus) Ničelne domneve ne zavrnemo. (testna vrednost je manjša od kritične) 2.) H1(>1.2) (enostranski preskus) Ničelno domnevo zavrnemo. (testna vrednost je večja od kritične) Pri sestavljeni alternativi lahko manj verjetni del alternative zmanjša možnost za izključitev ničelne domneve. 5 MATEMATIKA 2
VERJETNOST IN STATISTIKA PRESKUŠANJE STATISTIČNIH DOMNEV 3. Izračunamo deviacijo Kovanecvržemo 50 krat in 29-krat dobimo cifro. Ali lahko sklepamo, da je popačen? Splošni problem: kako ugotovimo, ali je vzorec X1,...,Xnv skladu z domnevo, da je opazovana populacija porazdeljena po nekem zakonu F(x) ? Lotimo se ga takole (Pearsonov 2– test, Goodness of Fit): 1. Realno os razdelimo na intervale I1,...,IKtako, da vsak vsebuje vsaj 5 elementov vzorca. Število vzorcev na intervaluIkoznačimo zbk. 2. Ob privzetku, da je porazdelitev populacije F(x)izračunamo teoretično število vzorcev na intervaluIkin ga označimo zek. Dejstvo: 02je porazdeljena po zakonu 2(K-1). 4. Za izbrano stopnjo značilnosti določimo2iz enačbeP( 2≥2)=. Domnevo zavrnemo, če je 02≥2. 6 MATEMATIKA 2
VERJETNOST IN STATISTIKA PRESKUŠANJE STATISTIČNIH DOMNEV V našem primeru postavimo grb=0, cifra=1 in intervala I1=(-∞,0.5] inI1=(0.5,+∞). Dobimo: b0=21, b1=29, e0=e1=25 in02= 16/25+16/25=1.28 Za2(1)in pristopnjiznačilnosti =5% je mejna vrednost 2=3.841, zato domneve, da je kovanec pošten ne zavrnemo. Koliko cifer bi morali dobiti pri 50 metih, da bi lahko na 5% stopnji značilnosti zavrnili domnevo o poštenosti kocke? Odstop označimo z ain rešimo a2/25+a2/25 >3.841, karnam da a ≥7. To pomeni, da bi pri 32 cifrahaliveč zavrnili domnevo o poštenosti kocke. Na stopnji značilnosti 1% pa bi jo zavrnili šele pri 35 cifrah ali več. G. Mendel je pri enem svojih znamenitih poskusov dobil 355 rumenih in 123 zelenih grahov. Ali je to v skladu z domnevo, da je razmerje med rumenimi in zelenimi 3:1? 7 MATEMATIKA 2
VERJETNOST IN STATISTIKA PRESKUŠANJE STATISTIČNIH DOMNEV Na bolnikih so preskušali vpliv dveh zdravil (AinB) proti nespečnosti. Ali lahko na podlagi podatka o dodatnem številu ur spanja sklepamo o tem, da je eno zdravilo bolj učinkovito od drugega? Privzemimo, da imamorezultatevplivaobehzdravilnaistihbolnikih. Tedaj naredimo parnit-test. (Če bi imeli rezultate na različnih bolnikih, bi morali uporabiti šibkejši neparni t-test.) Pri 95% stopnjizaupanjadomneve, da stazdravilienakovrednizavrnemo. TvorimorazlikoZ=X-Y. Dejstvo: porazdeljenaje poStudentovem zakonuS(n-1). PrimerjamoH0(a=0) protiH1(a≠0). 8 MATEMATIKA 2
VERJETNOST IN STATISTIKA PRESKUŠANJE STATISTIČNIH DOMNEV LINEARNA REGRESIJA S pomočjo metode najmanjših kvadratov lahko določimo premico, ki se najbolje prilega dani množici točk v ravnini. Statistično pa so vrednosti Y podvržene naključnim vplivom, zato je le do določene mere verjetno, da so izračunani koeficienti regresijske premice a+bX blizu dejanskih. • Velja: • Interval zaupanja za smerni koeficient premice je • kjer je tmejna vrednost na stopnji zaupanja pri • porazdelitvi S(n-2). • (2) r(X,Y)2 je število, ki pove, kolikšen delež razpršenosti spremenljivke Y je pojasnjen z razpršenostjo X. 9 MATEMATIKA 2
VERJETNOST IN STATISTIKA PRESKUŠANJE STATISTIČNIH DOMNEV Interval zaupanja za smerni koeficient je [2.103-0.0412 t,2.103+0.0412 t] Za=5% dobimopri S(18) mejno vrednost t=2.101 in pripadajoči interval [2.016,2.190] Zar(X,Y)2 pa dobimo 0.99, torej je vsavariancaYposledica variance X 10 MATEMATIKA 2