1 / 21

Hipotézisvizsgálat (1. rész) Kontingencia táblák

Hipotézisvizsgálat (1. rész) Kontingencia táblák. Honlap: hhtp://xenia.sote.hu/hu/biometr/. Kérdések. A tüdőrákos betegek hány százaléka dohányos? Mennyivel hatásosabb A gyógyszer, mint B gyógyszer? Mennyi a vérplazma T 3 szint referencia értéke Budapesten?

fonda
Download Presentation

Hipotézisvizsgálat (1. rész) Kontingencia táblák

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Hipotézisvizsgálat (1. rész) Kontingencia táblák Honlap: hhtp://xenia.sote.hu/hu/biometr/

  2. Kérdések • A tüdőrákos betegek hány százaléka dohányos? • Mennyivel hatásosabb A gyógyszer, mint B gyógyszer? • Mennyi a vérplazma T3 szint referencia értéke Budapesten? • Azonos-e fiuk és lányok matematikai teljesítménye? • Kevesebb-e a mellékhatása a „coxib” tipusú gyógyszereknek, mint a klasszikus NSAID vegyületeknek, krónikus izületi betegségekben? • Hatásos-e az influenza elleni védőoltás?

  3. A biometriai kérdések két nagy csoportja: • Becslések • A populáció (sokaság) tulajdonságai iránt érdeklődünk • Mintavétel után a mintából megbecsüljük a populáció tulajdonságait (eloszlás, elhelyezkedés, szórás) • Meghatározzuk becslésünk megbízhatóságát. • Hipotézis vizsgálatok • Mintát hasonlítunk egy elméleti értékhez • Mintákat hasonlítunk egymáshoz • Hipotéziseket állítunk fel (H0, H1, azaz 2 vagy több hipotézis) • Meghatározzuk, mekkora kockázattal vállalunk hibás döntést • Döntünk, hogy melyik hipotézist támasztják alá az adatok.

  4. Becslések • Átlag, medián, etc (elhelyezkedés, ) • Szórás, átlag hibája, terjedelem, etc (szóródás, ) • Konfidencia intervallum • Példa: az átlag és annak 95% konfidencia intervalluma • a. eset: ha ismert a populáció szórása () • b. eset: a szórást is becsüljük

  5. Az összehasonlítás tipusai • Kontroll (placebo) és kezelés • “Konvencionális” és új kezelés • Ekvivalencia (x anyag - y anyag összehasonlítása) • Dózis-hatás összefüggés • Receptor kötés (kötési paraméterek) • enzimaktivitás (enzim paraméterek) • Kölcsönhatások vizsgálata

  6. Hipotézis vizsgálat (statisztikai) • Módszer arra, hogy meghatározzuk, hogy adatok mennyiben konzisztensek egy adott, vizsgált statisztikai hipotézissel • Szakmai vita tárgya a statisztikát kutatók körében, hogyan érdemes vizsgálni a véletlen szerepét, hatását • Több iskola van: • klasszikus hipotézis vizsgálatok • Bayesianus vizsgálatok, feltételes valószínűségeken alapulnak. • Hasonló az egyszerű orvosi diagnózis felállításához • Beteg • Előzetes adatok (anamnézis, stb) • néhány lehetséges betegség • Vizsgálatok • Diagnózis (legtöbbször: egy valószínű betegség) • Kezelés

  7. A módszer választáshoz útmutatás • Függ: • A kutatási kérdéstől • Kísérleti elrendezéstől • A mérés skálájától (nominális, rang, intervallum) • Az elemszámtól • Van-e különbség? • 1 csoport • 2 csoport • 3, vagy több csoport • Van-e összefüggés? • Hány független változó van?

  8. Kiinduló feltételezések • A változó mérhető • nominális skálán • ordinális skálán • numerikus skálákon • A null hipotézis vonatkozhat • az eloszlások azonosságára • a mediánok azonosságára • a szóródás azonosságára • A minták száma • Lehet 1, 2, >2

  9. Egy klinikai példaD.E. Matthews and V.T: Farewell: Using and understanding medical statistics. Karger 1996 Relapszus ráta: 4/259=0,015 1,5%de a jól sugarazottakban: 2/236=0,009 0,9% nem jól sugarazottakban: 2/23 =0,087 8,7%

  10. A lehetséges táblák, ha a pirossal irott széli összegek rögzítettek 0. tábla 1. tábla 3. tábla 2. tábla 4. tábla

  11. Az egyes táblák előfordulásának valószínűsége, ha a relapszusokra igaz, hogy r1=r2=rp H0: r1 = r2 , elfogadjuk, ha a megfigyelt különbségek csak a véletlennek tulajdoníthatókH1: r1<>r2 , elfogadjuk, ha a megfigyelt különbségek nagy valószínűséggel a valós populációs relapszus arányokat mutatják A 2. számú tábla a megfigyelt adatok táblája: Mi annak a valószínűsége, hogy 2, 3, vagy 4 relapszus forduljon elő a túl kicsi területen besugárzott 23 beteg között? Összeadjuk a 2, 3, és 4. Táblák valószínűségét: 0,0386+0,0023+0,0001 0,04

  12. Fisher tesztben az egyes táblák valószínűsége, ha a feltételek teljesülnek és a jelölések a standard kontingencia táblának megfelelnek • Feltételek: • A null hipotézis teljesül • bármelyik kimenetel egyformán valószínű • Számitás a binomiális együttható (koefficiens) felhasználásával • levezetés nélkül, ahol R1, C1, t, N a tábla adatai • az 1. sor (row, R1) és az 1. cella (C1) jelöléssel, t a cellába éppen belekerült szám, N az összes adat. • pt valószínűség, hogy az első cellába éppen t kerül.

  13. A hipotézis vizsgálat kimenetele

  14. A döntési küszöbök értékei Elsőfajú hiba (, alfa), második fajú hiba (, béta) A  meghatározása nehezebb oka, hogy sok (esetleg végtelen sok) alternatív hipotézis létezhet Ha az alternatív hipotézis igaz, akkor annak a null hipotézistől való “távolságától” függ a teszt ereje, és a  a módszer ereje (“power”) gyakran ismeretlen, illetve meghatározásához viszonylag sok ismeretre van szükségünk

  15. Kontingencia táblák • Fisher tesztje a 2x2-es táblára (pontos) • Közelítő teszt (Khi négyzet, 2 teszt)

  16. Khi négyzet próba kontingencia táblák vizsgálatára • Feltételezések: • a siker valószínűsége nem változik egyénenként • a megfigyelések az egész populációra nézve függetlenek, azaz ha egy esemény bekövetkezik, az nem befolyásolja a következő eseményeket • Célja: • megállapítani, hogy a megfigyelt adatok mennyire konzisztensek a H0 hipotézissel, • hogy H0: p1=p2, azaz a „siker” valószínűsége azonos a két csoportban • Módszere: • kiszámítjuk a várt (expected) tábla értékeit, és összehasonlítjuk a megfigyelt tábla értékeivel.

  17. Standard kontingencia tábla Ahol R1>=R2 és C1 <= C2

  18. Standard kontingencia tábla, a null hipotézis esetén várható értékek Ahol R1>=R2 és C1 <= C2

  19. A T statisztika eloszlása megközelítőleg 2

  20. Hipotézis vizsgálatra szolgáló módszerek választása(nem paraméteres eset, bevezető kurzus)

More Related