430 likes | 608 Views
Relació entre dues variables qualitatives amb dues o més categories. Prova de Chi quadrat ( 2 ). Relació entre dues variables qualitatives amb dues categories. Distribució de freqüències:
E N D
Relació entre dues variables qualitatives amb dues o més categories. Prova de Chi quadrat (2) URV Curs 2012-13
Relació entre dues variables qualitatives amb dues categories Distribució de freqüències: • una variable qualitativa amb dues categories (binaria) es descriu completament amb el percentatge o la freqüència de una de las categories i el número total de individus. URV Curs 2012-13
Descripció de la informació de variables qualitatives amb dues categories Sexe: home/dona • 30% o 57 homes i n = 190. • 70% o 133 dones. Obesitat: si/no • 16% o 180 obesos i n = 1125. • 84% o 945 no obesos. Ingesta energètica insuficient: si/no • 12% o 521 ingesta insuficient i n = 4342. • 88% o 3821 ingesta no insuficient. Sexe: home/dona • 30% o 57 homes i n = 190. Obesitat: si/no • 16% o 180 obesos i n = 1125. Ingesta energètica insuficient: si/no • 12% o 521 ingesta insuficient i n = 4342. URV Curs 2012-13
Relació entre dues variables qualitatives amb més de dues categories. Distribució de freqüències: • una variable qualitativa amb k (més de dues) categories es descriu completament amb el percentatge o la freqüència de k-1 de les categories i el nombre total d’individus. URV Curs 2012-13
Descripció de la informació de variables qualitatives amb més de dues categories Nivell socioeconòmic: Baix/Mig baix/ Mig alt/Alt • 11’9% o 30 Baix o n =253 • 35’2% o 89 Mig baix • 40’3% o 102 Mig alt • 12’6% o 32 Alt URV Curs 2012-13
Chi quadrat (2) per la comparació de vàries distribucions observades. • S’utilitza en estudis comparatius i en aquest cas la distribució teòrica de les categories de la variable d’interès (dependent) és desconeguda. No obstant, suposem que las mostres que desitgem comparar procedeixen de poblacions no diferents (Ho) i per tant aquesta distribució teòrica es pot estimar a partir de la suma de les mostres. URV Curs 2012-13
Els càlculs es basen en la següent taula tipus: La taula té f files i c columnesofc = freqüències observades; efc = freqüències esperades URV Curs 2012-13
Freqüència esperada (efc): Condicions d’aplicació: efc 5 Graus de llibertat: (c - 1)(f - 1) c = columnes; f = files URV Curs 2012-13
Es calcula l’estadístic de contrast 2, mitjançant la fórmula: URV Curs 2012-13
Formulació de les hipòtesis Ho i H1 • Ho: Les distribucions de les categories de la variable dependent NO SÓN DIFERENTS entre les diferents categories de la variable independent. • H1: Les distribucions de les categories de la variable dependent SÓN DIFERENTS entre les diferents categories de la variable independent. A LA POBLACIÓ!!!!!!!!!!!!!!! URV Curs 2012-13
Exemple 1: Comparació de tres distribucions observades • En un període de 18 anys d’estudi, dels 2594 homes de l’estudi de Framingham (Massachusetts) en van morir 465. D’aquestos, 81 no havien fumat mai, 51 havien deixat de fumar (exfumadors) i 333 eren fumadors. • Ens preguntem si existeix una associació entre l’hàbit de fumar i el risc de morir, és a dir, si a la POBLACIÓ les distribucions de mortalitat (morts/no morts) SÓN DIFERENTS entre les tres categories de fumadors. URV Curs 2012-13
Hipòtesis Ho i H1 • Hipòtesis nul·la: les distribucions de la mortalitat NO SÓN DIFERENTS entre les tres categories de fumadors. A LA POBLACIÓ!!!!!!!!!!!!!!! • Hipòtesis alternativa: les distribucions de la mortalitat SÓN DIFERENTS entre les tres categories de fumadors. URV Curs 2012-13
Freqüències observades a la mostra URV Curs 2012-13
Freqüències observades/esperades a la mostra gll = (c -1)(f – 1) = (3-1)(2-1) = 2 URV Curs 2012-13
Percentatge esperat de morts i vius en no fumadors, ex fumadors i fumadors URV Curs 2012-13
Percentatge esperat de no fumadors, ex fumadors i fumadors en morts y vius: URV Curs 2012-13
Grau de significació de la prova Chi quadrat (2) El nostre resultat 2 = 10’443 correspon a un grau de significació p<0’01 (exactament 0’005), per tant refusem Ho i concloem que la distribució de la mortalitat és diferent entre les tres categories de fumadors. URV Curs 2012-13
Mida de la mostra per comparar dues proporcions observades Nombre d’individus necessaris per identificar com a significativa una comparació de dues proporcions observades URV Curs 2012-13
Mida de la mostra per comparar dues proporcions observades • n = nombre d’individus necessaris a cada grup • z = valor de z corresponent al risc fixat • z = valor de z corresponent al risc fixat • pA = valor de la proporció esperada al grup A • pB = valor de la proporció esperada al grup B • pA-pB = valor mínim de la diferencia que es vol detectar • p = mitjana ponderada de les proporcions pA i pB URV Curs 2012-13
Valors Zα i Zβ URV Curs 2012-13
Exemple 1: Quants individus necessitarem incloure en una mostra per comparar amb una prova d’hipòtesi bilateral, una confiança del 95% i una potència del 80% [ = 0’20], dues proporcions que esperem que siguin una proporció del 40% i l’altre del 50%? URV Curs 2012-13
Exemple 2 Quants individus necessitarem incloure en una mostra per comparar amb una prova d’hipòtesi bilateral, una confiança del 95% i una potència del 80% [ = 0’20], dues proporcions que esperem que siguin una proporció del 5% i l’altre del 20%? URV Curs 2012-13
Mida de la mostra per comparar dues proporcions observades Risc I = risc ; Risc II = risc ; Uni= unilateral; Bi = Bilateral; pA i pB = proporcions esperades als grups A i B URV Curs 2012-13
Prova d’hipòtesi de comparació de dues reparticions observades utilitzant la prova de 2 Exercici Bioestadística FMCS Reus URV Curs 2012-2013 24
Utilitzant les dades de l’exemple “Efecte de hàbit de fumar de la mare sobre el retard mental dels fills” decidiu si hi ha diferències significatives (A LA POBLACIÓ) en la freqüència de retard mental entre els nascuts de part eutòcic i els nascuts de part distòcic. Bioestadística FMCS Reus 25 URV Curs 2012-2013
Els càlculs es basen en la següent taula tipus: La taula té l línies i c columnesolc = freqüències observades; elc = freqüències esperades Bioestadística FMCS Reus 26 URV Curs 2012-2013
La taula te 2 línies i 2 columnesfreqüència observada Bioestadística FMCS Reus 27 URV Curs 2012-2013
La taula te 2 línies i 2 columnesfreqüència observada Bioestadística FMCS Reus 28 URV Curs 2012-2013
La taula te 2 línies i 2 columnesfreqüència observada Bioestadística FMCS Reus 29 URV Curs 2012-2013
Freqüència esperada (elc): Condicions d’aplicació: elc 5 Graus de llibertat: (c - 1)(l - 1) c = columnes; l = línies Bioestadística FMCS Reus 30 URV Curs 2012-2013
Freqüència esperada (elc): Graus de llibertat: (2-1)(2-1)= 1 Condicions d’aplicació: elc 5 Bioestadística FMCS Reus 31 URV Curs 2012-2013
La taula te 2 línies i 2 columnesfreqüència observada/freqüència esperada Bioestadística FMCS Reus 32 URV Curs 2012-2013
Es calcula l’estadístic de contrast 2, mitjançant la fórmula: Bioestadística FMCS Reus 33 URV Curs 2012-2013
Es calcula l’estadístic de contrast 2 Graus de llibertad: (2-1)*(2-1) = 1 Bioestadística FMCS Reus 34 URV Curs 2012-2013
Càlcul de la p El nostre resultat 2 = 3’636 correspon a un grau de significació p>0.05 (exactament 0’056), per tant no refusem la Ho i concloem que la freqüència de retard mental no és diferent entre els nascuts de parts eutòcics i distòcics Bioestadística FMCS Reus 35 URV Curs 2012-2013
Càlcul del nombre d’individus necessaris (mida de la mostra) per la comparació de dues proporcions observades Exercici Bioestadística FMCS Reus URV Curs 2012-2013 36
Quants individus necessitarem incloure en una mostra per estimar (per identificar com a significativa) amb una prova d’hipòtesi bilateral, una confiança del 95% (risc = 0’05) i una potencia del 80% ( = 0’20), a) dues proporcions que esperem que siguin una del 15% i l’altre del 35%? b) dues proporcions que esperem que siguin del 40% i 45% respectivament? c) dues proporcions que esperem que siguin 55% i 80% respectivament? Bioestadística FMCS Reus 37 URV Curs 2012-2013
Mantenint constants (com en l’enunciat) la resta de criteris: Calcula el nombre d’individus necessaris però en el cas d’una prova d’hipòtesi unilateral. Calcula el nombre d’individus necessaris però per una prova amb una potencia del 90% ( = 0’10) Bioestadística FMCS Reus 38 URV Curs 2012-2013
Mida de la mostra per comparar dues proporcions observades • n = nombre d’individus necessaris a cada grup • z = valor de z corresponent al risc fixat • z = valor de z corresponent al risc fixat • pA = valor de la proporció esperada al grup A • pB = valor de la proporció esperada al grup B • pA-pB = valor mínim de la diferencia que es vol detectar • p = mitjana ponderada de les proporcions pA i pB Bioestadística FMCS Reus 39 URV Curs 2012-2013
Valors Zα i Zβ Bioestadística FMCS Reus 40 URV Curs 2012-2013
Quants individus necessitarem incloure en una mostra per comparar amb una prova d’hipòtesi bilateral, una confiança del 95% i una potencia del 80% [ = 0’20], dues proporcions que esperem que siguin una proporció del 15% i l’altre del 35%? Bioestadística FMCS Reus 41 URV Curs 2012-2013
Mida de la mostra (N) per comparar dos grups amb dues proporcions observades pA i pB Risc I = risc ; Risc II = risc ; Uni= unilateral; Bi = Bilateral Bioestadística FMCS Reus 42 URV Curs 2012-2013
Mida de la mostra (N) per comparar dos grups amb dues proporcions observades pA i pB Risc I = risc ; Risc II = risc ; Uni= unilateral; Bi = Bilateral Bioestadística FMCS Reus 43 URV Curs 2012-2013