170 likes | 397 Views
Grundlæggende teoretisk statistik. Hypotesetest: Generelt. Disposition. Centrale begreber Faser i hypotesetest – testprocedure Se side 129 Den reducerede model i 5 trin. Generelt om test. Hypoteser H o Nulhypotese H 1 Alternativ hypotese Vejledning i opstilling af hypoteser
E N D
Grundlæggende teoretisk statistik Hypotesetest: Generelt
Disposition • Centrale begreber • Faser i hypotesetest – testprocedure • Se side 129 • Den reducerede model i 5 trin
Generelt om test • Hypoteser • Ho Nulhypotese • H1 Alternativ hypotese • Vejledning i opstilling af hypoteser • Vi opstiller kun hypoteser på ukendte forhold i populationen, f.eks. • p (populationsandelen), (middelværdien) eller 2 (variansen) • fordelingen af en stok. variabel, f.eks. X N(, 2) • om der er uafhængighed mellem 2 variable • Altid gældende tilstand i Ho • Forsøgsresultatet i stikprøven skal være i overensstemmelse med H1 • Der skal altid være mindst et “=“ i Ho, f.eks. • Ho : = 30, eller Ho : 30
Eksempler på hypoteser • 2-sidet test • Ho : = 30 • H1 : 30 • Enkelt-sidede test: • Ho : 30 • H1 : < 30 eller • Ho : 30 • H1 : > 30 eller • Ho : = 30 • H1 : < 30
Beslutningssituation Forkast Ho Acceptèr Ho Hvis Ho er sand Type 1 fejl Ok! Ho er falsk Ok! (1-β) Type 2 fejl β Fejltyper i test • Signifikansniveau, = P(Type 1 fejl) • P(Type II fejl) = β • Styrke= P(forkaste Ho ved forskellige værdier af pop.parameteren)= 1-β (se Kapitel L)
Beslutningssituation Dommen Forkast Ho Døm manden Acceptèr H0 Frikend manden Hvis Ho er sand Manden uskyldig Type 1 fejl = Justitsmordet Ok! Ho er falsk Manden skyldig Ok! Type 2 fejl = Lad den skyldige gå Betydning af α og β – eksempel 1 Rets-sag
Beslutningssituation Returner / Behold vareparti Forkast Ho Returnèr parti Acceptèr H0 Behold parti Hvis Ho er sand Vareparti er ok (garanti overholdt) Type 1 fejl Leverandør Ok! Ho er falsk Parti defekt Ok! Type 2 fejl Køber Betydning af α og β – eksempel 2 Levering af stort vareparti
Beslutningssituation Omstil / fortsæt produktion Forkast Ho Omstil produktion Acceptèr H0 Fortsæt produktion Hvis Ho er sand Brændetid 9600t Type 1 fejl Ok! Ho er falsk Brændetid over 10.600 t Ok! Type 2 fejl Betydning af α og β – eksempel 3 Omstilling af produktion til ny type lysstofrør
Test – 2 metoder • KV-metoden • Beregn kritisk værdi ud fra signifikansniveau, α • Er stikprøveresultatet i kritisk område, forkastes H0 • SS-metoden • Beregn signifikanssandsynlighed • Er ss ≤ α (signifikansniveauet) forkastes H0
5 trin i hypotese–test – KV-metoden • Opstil hypoteser • Angiv beslutningssituation med kritisk værdi • Antag H0 er sand • Beregn kritisk værdi (KV-metoden) • Konklusion
Trin 1 – Opstil hypoteser • Der opstilles kun hypoteser om (ukendte) forhold i populationen, f.eks. • Størrelsen af middelværdier, populationsandele, varianser • Fordelingen af en variabel • Uafhængighed / homogenitèt • Dit forsøgsresultat skal være i overensstemmelse med H1 • Der skal altid være et ”=” i H0 • Altid ”gældende tilstand” i H0
30 c Forkast H0 Accepter H0 Trin 2 – Angiv beslutningssituation • Hvad er teststatistik / estimator, f.eks.? • Afgør om det er store eller små (evt. begge i 2-sidet test) værdier af teststatistikken / estimatoren, der er kritiske for H0 ? • Afsæt kritisk(e) værdi(er) på tal-akse med teststatistikken/ estima-torens værdier, f.eks.
Trin 3 – Antag H0 er sand • Når H0 er sand, kan estimators eller teststatistikkens fordeling (evt. approximative fordeling) bestemmes. • Fordelingen kan derfor indtegnes ovenpå tal-aksen for estimator / teststatistik, jf. trin 2 • Afskær signifikansniveauet = P(Type 1 fejl) = α, svarende til arealet under fordelingskurven fra den kritiske værdi.
Trin 4 – Bestem/beregn kritisk værdi • Ved test på middelværdi eller populationsandele (hvor approximation til normalfordeling er ok) beregnes kritisk(e) værdi(er) ud fra signifikans-niveauet og estimators fordeling (t-fordeling eller normalfordeling). • Den kritiske værdi kan evt. slås direkte op i tabeller over teststatistikkens fordeling, f.eks. ved test på uafhængighed i en chi-kvadratfordeling (se kapitel H) eller i en F-fordeling ved test på varianshomogenitèt (se kapitel J)
Trin 5 - Konklusion • Hvis den observerede værdi af estimator/ teststatistik-ken ligger i forkastelsesområdet, forkastes H0.. • Den observerede værdi siges at være signifikant. • Signifikanssandsynligheden, ss vil i så fald være mindre end signifikansniveauet, α. • Ellers accepteres H0
ss = signifikanssandsynlighed • Signifikanssandsynlighed • P(Forsøgsresultatet eller en mere ekstrem værdi af estimatoren/teststatistikken i forhold til Ho) • Hvis f.eks. n=30 biler og gennemsnits-hastigheden er 58 km/t, og σ=6 km/t og hypoteserne er • H0: μ= 60 km/t • H1: μ < 60 km/t vil
Test med signifikanssandsynlighed • Trin 1 – Opstil hypoteser • Trin 2 - Angiv beslutningssituation • Trin 3 – Antag H0 er sand • Trin 4 – Beregn signifikanssandsynlighed • Trin 5 – Konklusion • Hvis den beregnede signifikanssandsynlighed, • ss > signifikansniveauet, α accepteres H0 • ss ≤ signifikansniveauet, α forkastes H0