1 / 33

Testování neparametrických hypotéz

Testování neparametrických hypotéz. Neparemetrické hypotézy. Hypotézy o vlastnostech populace (typ rozdělení, závislosti, …). Testy dobré shody (testy o shodě mezi výb . a teoret . rozdělením) Χ 2 – test dobré shody Kolmogorovův – Smirnovův test pro jeden výběr.

jeslyn
Download Presentation

Testování neparametrických hypotéz

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Testování neparametrických hypotéz

  2. Neparemetrické hypotézy Hypotézy o vlastnostech populace (typ rozdělení, závislosti, …)

  3. Testy dobré shody (testy o shodě mezi výb. a teoret. rozdělením) Χ2 – test dobré shody Kolmogorovův – Smirnovův test pro jeden výběr

  4. Χ2 – test dobré shody Volba H0 • H0: Výběr pochází z populace, v níž jsou relativní četnosti jednotlivých variant rovny číslům, populace musí být roztříditelná podle nějakého znaku do k skupin. • H0: Výběr pochází z rozdělení určitého typu, jehož parametry jsou dány (úplně specifikovaný model). • H0: Výběr pochází z rozdělení určitého typu, přičemž neověřujeme informace o parametrech rozdělení, parametry modelu odhadujeme (neúplně specifikovaný model).

  5. Χ2 – test dobré shody Volba testové statistiky n … rozsah výběru k … počet variant h … počet odhadovaných parametrů modelu ni … empirické četnosti jednotlivých variant π0,i… očekávané rel. četnosti jednotlivých variant

  6. Χ2 – test dobré shody Předpoklad testu Očekávané četnosti musí být větší než 5 (alespoň 80% očekávaných četností musí být větších než 5)

  7. Χ2 – test dobré shody Výpočet p – value

  8. Příklady Litschmannová M., Statistika I. – cvičení, Testování neparam. hypotéz: 12.1 -12.3

  9. Kolmogorovův-Smirnovův test pro jeden výběr Používá se pro ověření hypotézy, zda pořízený výběr pochází z rozdělení se spojitou distribuční funkcí F(x). F(x) musí být úplně specifikovaná.

  10. Kolmogorovův-Smirnovův test pro jeden výběr Výhody oproti X2 -testu dobré shody: • větší síla testu • nemá omezující podmínky (lze použít při výběrech malého rozsahu) • vychází z jednotlivých pozorování a nikoliv z údajů setříděných do skupin

  11. Kolmogorovův-Smirnovův test pro jeden výběr H0 a HA: H0: HA: Testová statistika:

  12. Dn Kolmogorovův-Smirnovův test pro jeden výběr

  13. Kolmogorovův-Smirnovův test pro jeden výběr Nulové rozdělení: Speciální rozdělení pro tento test, kvantily tabelovány – viz. Tab. 5 Výpočet p-value

  14. Příklady Litschmannová M., Statistika I. – cvičení, Testování neparam. hypotéz: 12.4

  15. Testy v kontingenční tabulce

  16. X2 -test nezávislosti v kontingenční tabulce (Testování závislosti dvou kategoriálních proměnných)

  17. Co je to kontingenční tabulka? Dvourozměrná tabulka četností, z jejichž hodnot můžeme usoudit na závislost či nezávislost mezi dvěma kategoriálními proměnnými

  18. Grafický výstup pro analýzu závislosti dvou kategoriálních proměnných • Shlukový sloupcový graf • Kumulativní sloupcový graf • Mozaikový graf • 100% skládaný pruhový graf (Lze použít k explorační analýze závislosti)

  19. Shlukový sloupcový graf(Statgraphics)

  20. Shlukový sloupcový graf(Excel)

  21. Kumulativní sloupcový graf(Excel)

  22. Mozaikový graf (Statgraphics)

  23. 100% skládaný pruhový graf(Excel)

  24. Pojmy: Pozorované (empirické) četnosti Oij(Observedfrequency) – zjištěné sdružené četnosti Očekávané (teoretické) četnosti Eij(Expectedfrequency) – sdružené četnosti očekávané za předpokladu nezávislosti proměnných (aneb platí-li H0) Odchylky, rezidua (Deviation) – rozdíly mezi očekávanými a pozorovanými četnostmi = Eij-Oij

  25. Chí-kvadrát test nezávislosti v kontingenční tabulce Ideální případ nezávislosti Oij=Eij aneb Oij-Eij=0 i=1, …, m; j=1, …, n

  26. Chí-kvadrát test nezávislosti v kontingenční tabulce H0 a HA: H0: Proměnné v kontingenční tabulce jsou nezávislé. HA: Proměnné v kontingenční tabulce jsou závislé. Testová statistika (Pearsonova statistika chí-kvadrát): m … počet řádků kont. tabulky n … počet sloupců kont. tabulky

  27. Chí-kvadrát test nezávislosti v kontingenční tabulce Předpoklady testu: • Žádná očekávaná četnost nesmí klesnout pod 2 • Alespoň 80% četností musí být větších než 5 Výpočet p-value

  28. Rozšířená kontingenční tabulka

  29. Příklady Litschmannová M., Statistika I. – cvičení, Testování neparam. hypotéz: 12.5

  30. Yatesova korekce • Lze provést v případě, kdy nejsou splněny předpoklady chí-kvadrát testu nezávislosti (extrémně nízké očekávané četnosti). • Snižuje pravděpodobnost chyby I. druhu, tím však snižuje sílu testu. Testová statistika (Pearsonova statistika chí-kvadrát): m, n … počet řádků (sloupců) kont. tabulky Výpočet p-value:

  31. Fisherův exaktní test • Užívá se v případě extrémně nízkých očekávaných četností. • Lze použít pouze pro čtyřpolní tabulky. • Určují se pravděpodobnosti výskytu všech možných obměn četností v kontingenční tabulce, které dávají stejné marginální četnosti jako tabulka zjištěných četností…

  32. McNemarův test • Pouze pro čtyřpolní tabulky. • Test shody rozdělení pro závislé alternativní proměnné se stejnými kódy. Nulová a alternativní hypotéza: H0: Procenta „úspěšností“ jsou u obou veličin stejná. HA: Procenta „úspěšností“ nejsou u obou veličin stejná. Testové kritérium: Předpoklad testu: Výpočet p-value:

  33. Příklady Litschmannová M., Statistika I. – cvičení, Testování neparam. hypotéz: 12.6

More Related