100 likes | 230 Views
BIOINGEGNERIA S. Salinari Lezione 9. TEST STATISTICI FREQUENTEMENTE USATI IN BIOMEDICINA T-test
E N D
BIOINGEGNERIA S. Salinari Lezione 9
TEST STATISTICI FREQUENTEMENTE USATI IN BIOMEDICINA T-test Il t-test o test di Student viene frequentemente usato per confrontare statisticamente l’uguaglianza delle medie di due popolazioni (unpaired t-test) o di una stessa popolazione (paired t-test) rispetto ad un determinato parametro. Ad esempio si possono confrontare gli effetti di due farmaci diversi utilizzati per lo stesso scopo terapeutico su due gruppi di soggetti o analizzare, sullo stesso gruppo di individui, la variazione di un parametro diagnostico dopo che questi sono stati sottoposti ad una determinata terapia. Il t-test si basa sulle seguenti ipotesi: I dati relative alle due popolazioni seguono una tatistica gaussiana Le due popolazioni hanno la stessa varianza Detti X1 ed X2 i vettori rappresentativi dei dati relativi alle due popolazioni le ipotesi da testare risultano H0: m1= m2 H0: m1= m2 m1 e m2medie dei campioni nelle due popolazioni H1: m1≠m2 H1: m1> m2 o m1< m2 Two tailed test One tailed test
t-test per verificare la differenza fra le medie di due popolazioni diverse Il valore di t per verificare l’ipotesi di differenza delle medie di due popolazioni a statistica gaussiana e di uguale varianza è dato da: t = (m1-m2)/s m1-m2 m1-m2 è la differenza fra le due medie, s m1-m2 è la stima della deviazione standard della differenza fra le medie. Si può dimostrare matematicamente che la varianza della differenza fra due medie è uguale alla somma delle varianze delle due medie: s2 m1-m2 = s2m1 + s2m2 poichè s2m = s2/n (n=campioni nella popolazione) si ha s2m1-m2 = s2m1 /n1+s2m2/n2 e per l’ipotesi di varianza uguale nelle due popolazioni si ottiene: s2 m1-m2 = s2 /n1 + s2 /n2 Resta quindi da calcolare una stima di s2 che è data da: sp2= (SS1+SS2)/(n1+n2) con SS = (xi-m)2/nn = n-1 da cui: t = (m1-m2)/sp2/n1 +sp2/n2 Il valore del t ottenuto va confrontatato con il t delle tavole per significatività a ( in genere si sceglie 0.05) a due code o a una sola coda. L’ipotesi H0 va rigettata per il test a due code se |t|ta(2),n (n=n1+n2). Per il test ad una coda : se Ha: m1<m2 H0 rigettata se t-ta(1),n; se Ha: m1>m2 H0 rigettata se t ta(1),n
t-test per verificare la differenza fra le medie di due popolazioni diverse %calcolo t per diff. media fra 2 popolazioni % x= Sensibilità all'insulina di soggetti obesi diabetici prima di un intervento di Bilio-Pancreatic %Diversion (BPD). Calcolata con OGIS [ml/(min m2)] % y= Sensibilità all'insulina in soggetti normali. x =[273197453310209169240 205 239] y= [375 570 458 513 473 510 519] n1=9 n2=7 xm=mean(x) ym=mean(y) s2x=(n1-1)*var(x) s2y=(n2-1)*var(y) s2p=(s2x+s2y)/(n1+n2-2) s2xmym=s2p/n1+s2p/n2 sxmym=sqrt(s2xmym) t=(xm-ym)/sxmym %Si può verificare che essendo il t calcolato minore del t a due code ricavato dalla tavola per % alfa=0.05 e gradi di libertà=14 l'ipotesi H0 (uguaglianza delle medie) viene rigettata.
Test non parametrici per verificare la differenza fra le medie di due popolazioni diverse: Test di Mann-Whitney In questo test, come in molti test non parametrici, viene usato il rango delle misure. I dati dei due gruppi, considerati insieme, vengono ordinati dal più alto al più basso (o viceversa) e ordinati dando rango uno al dato più grande, due a quello immediatamente inferiore fino ad n al più basso con n=n1+n2 (n1 ed n2 numero di individui nelle due popolazioni). Si calcola quindi la statistica di Mann-Whitney: U = n1·n2 +n1·(n1+1)/2 –R1 con R1 rango della popolazione 1 o U’ = n2·n1 +n2·(n2+1)/2 –R2 con R2 rango della popolazione 2 Se U o U’ è U a(2), n1,n2 letto sulle tavole della statistica di Mann-Whitney, l’ipotesi H0 (uguaglianza delle medie nelle due popolazioni) viene rigettata.
Test non parametrici per verificare la differenza fra le medie di due popolazioni diverse: Test di Mann-Whitney Facendo riferimento all’esempio precedente relativo alla sensibilità all’insulina calcolata con l’OGIS si ha Popolazione 1 Rango Popolazione 2 Rango 273 10 375 8 197 15 570 1 453 7 458 6 310 9 513 3 209 13 473 5 169 16 510 4 240 11 519 2 205 14 239 12 __________________________________________________________ R1 107 R2 29 U’=61 U a(2), n1,n2= 51 L’ipotesi H0 viene rigettata
Differenza fra le medie per una stessa popolazione: t-test per verificare la differenza fra le medie della stessa popolazione Nel caso in cui si debba verificare la differenza fra le medie di un parametro relativo alla stessa popolazione (ad esempio la differenza di un parametro diagnostico prima e dopo l’applicazione di una terapia o la somministrazione di un farmaco) le ipotesi H0 ed Ha diventano: H0: m1-m2 = 0 H0: m1-m2 0 H0: m1-m2 0 Ha: m1-m2 0 Ha: m1-m2< 0 Ha: m1-m2> 0 Test a due code Test a una coda Il t relativo viene calcolato effettuando la media delle differenze del parametro considerato per ogni soggetto e dividendo questa per lo standard error (deviazione standard diviso il numero dei campioni): t = dm / se se =sd/n L’ipotesi è che la differenza d segua una statistica gaussiana. Se il t calcolato risulta maggiore in modulo del corrispondente valore valutato sulle tavole per la significatività desiderata e per il numero di gradi di libertà della popolazione (n= n-1 con n = numero dei dati) l’ipotesi H0 viene rigettata.
Differenza fra le medie per una stessa popolazione: t-test per verificare la differenza fra le medie della stessa popolazione %calcolo t per diff. media stessa popolazione OGIS prima e dopo BPD n=9 xb=[273 197 453 310 209 169 240 205 239 471 294 475 381 225 414 355 391 358] x2=xb(1,:) x1=xb(2,:) dx=x1-x2 dmed=mean(dx) stdx=std(dx) sedx=stdx/sqrt(n) t=dmed/sedx %Si può verificare che essendo il t calcolato minore del t a due code ricavato dalla tavola per % alfa=0.05 e gradi di libertà=8 l'ipotesi H0 (uguaglianza delle medie) viene rigettata.
Differenza fra le medie per una stessa popolazione- Test non parametrici: test di Wilcoxon per verificare la differenza fra le medie della stessa popolazione. La procedura del test di Wilcoxon implica, come per il t-test, il calcolo delle differenze dei campioni relativi allo stesso soggetto. Le differenze vanno quindi ordinate in valore assoluto dalla più piccola alla più grande associando ad ognuna il rispettivo rango. Se due differenze sono uguali si associa ad entrambe la media fra i due valori del rango che sarebbero stati assegnati se le due differenze fossero state diverse. Si associa quindi ad ogni rango il segno della differenza relativa e si sommano i ranghi negativi (T-) e i ranghi positivi (T-) Le ipotesi risultano essere: H0: m1-m2 = 0 H0: m1-m2 0 H0: m1-m2 0 Ha: m1-m2 0 Ha: m1-m2< 0 Ha: m1-m2> 0 Test a due code Test a una coda Per il test a due code H0 viene rigettata se T- o T+ sono T a(2),n letto sulle tavole Per il test ad una coda H0: m1-m2 0 viene rigettata se T- T a(1),n H0: m1-m2 0 viene rigettata se T+ T a(1),n
Differenza fra le medie per una stessa popolazione- Test non parametrici: test di Wilcoxon per verificare la differenza fra le medie della stessa popolazione. Si testa la differenza fra i livelli di Glucosio plasmatico (mg/dL) prima e dopo BPD glucosio pre glucosio post Differenza Rango Rango con segno 170. 188 -18 3 -3 186. 198 -12 2 -2 162. 164 -2 1 -1 169. 146 23 4 4 329. 263 66 8 8 113. 84.6 28.4 5 5 249.2 179.1 70.1 9 9 125.4 88 37.4 6 6 123.3 69.7 53.6 7 7 T+ = 39 T_ = 6T 0.05(2),9 = 5 Poichè sia T+ che T_ sono maggiori di 5 H0 viene accettata .