420 likes | 594 Views
Considerazioni statistiche. Prima di iniziare uno studio calcolo della potenza. Per evitare di fare uno studio che abbia poca probabilità di dimostrare come statisticamente significativo l'effetto vero di un intervento Alla fine dello studio
E N D
Considerazioni statistiche Prima di iniziare uno studio • calcolo della potenza. Per evitare di fare uno studio che abbia poca probabilità di dimostrare come statisticamente significativo l'effetto vero di un intervento Alla fine dello studio • analisi statistica dei dati. Una riduzione del tasso di infortunio più grande nel gruppo di intervento che nel gruppo di confronto basta per dimostrare che l'intervento ha funzionato? No, perchè i dati nella vita reale sono soggetti a variabilità casuale.
Errori di I tipo e probabilità dell’errore (p-value) Probabilità α
p-value alfa (errore I tipo) L'analisi statistica produce un p-value che può essere interpretato come: La probabilità che una differenza ampia almeno quanto quella osservata si sarebbe potuta produrre semplicemente per caso, se veramente non ci fosse un effetto reale dell'intervento.
p-value (errore alfa) α < 0.05
Errore di II tipo e probabilità Beta Se il programma ha in realtà un effetto moderato, ma la differenza non è statisticamente significativa, in tal caso non si rifiuta (cioè si accetta) l’ipotesi iniziale di “nessuna differenza” mentre in realtà questa differenza esiste. Questo errore è conosciuto come errore tipo II. La probabilità che si verifichi tale errore, cioè, la probabilità che non riusciate a rifiutare l'ipotesi quando è falsa, è conosciuta come β.
Errore II tipo e p-value di Beta Probabilità β
Errore II tipo e p-value di Beta β 0.10
Potenza dello studio La probabilità di rifiutare correttamente un'ipotesi falsa, cioè di evidenziare l'efficacia del programma quando questo ha avuto un effetto vero, è 1- β. Questo valore è conosciuto come potenza dello studio.
Prima di intraprendere l'intervento è importante considerare la potenza dello studio, per essere ragionevolmente sicuri di concludere che esiste una differenza se veramente questa esiste (e quindi evitare di fare uno studio che abbia poca probabilità di dimostrare l'effetto vero di un intervento) Ciò può essere fatto in due modi: • prima decidere la potenza desiderata e poi calcolare la dimensione del campione necessario • oppure, disponendo di un determinato numero di operai che potrebbero partecipare allo studio, valutare la potenza che lo studio avrebbe con quel numero
Il primo metodo è preferibile. Tipicamente, i ricercatori progettano le valutazioni in modo che la potenza sia 80% (a volte 90%); cioè se l'intervento è veramente efficace, vi è una probabilità di 80% (90%) che i dati raccolti e i test statistici usati vi permettano di concludere che l'intervento è efficace. Nella pratica, gli interventi nei posti di lavoro coinvolgono solitamente un numero fisso di operai (quelli di un impianto o di un reparto). Così non si può decidere in anticipo la potenza, ma solo di controllare con quale potenza si opera
Parecchi elementi entrano nel calcolo della potenza: • la dimensione dell’effetto, quale effetto dovrebbe avere l'intervento per valere la pena di fare l’intervento e di riproporlo altrove • dimensione del campione, numero di partecipanti alla valutazione o, più formalmente, di unità sperimentali • variabilità delle misure all'interno del campione • valori assegnati per α e β. • tipo di dati raccolti (quantitativi o qualitativi) • disegno sperimentale
Analisi statistica C’è un certo numero di questioni da considerare: • tipo di dati (variabili categoriche o continue) • tipo di disegno di valutazione • unità statistica dello studio • dimensione del campione di studio • aggiustamento per le caratteristiche dei diversi gruppi
Si può utilizzare un pc con un pacchetto di programmi statistico • Epi Info: http://www.cdc.gov/epo/epi/epiinfo.html • PEPI: http://www.usd-inc.com/pepi.html
Alcuni esempi di analisi statistica • Disegni before-and after (dati categorici) • Rapporto di tassi • Differenza di tassi • Test chi-quadrato • Disegni before-and-after con gruppo di controllo (datai categorici) • Rapporto di tassi • Differenza di tassi • Test z
Analisi di disegni before-and-after con dati categorici • Calcolo dei tassi • Rapporto di tassi (rate ratio, RR) • Intervallo di confidenza di RR • Differenza tra tassi (rate difference, RD) • Intervallo di confidenza di RD • Test chi quadrato • Calcolo eventi attesi • Calcolo del chi quadrato • Tavola del chi quadrato
Calcolo dei tassi (rate) 28 : 40 000 = 0.0007 Tasso per 10 5 = 0.0007 × 100 000 = 70 22 : 60 000 = 0.00037 Tasso per 105 = 0.00037 × 100 000 = 37
Rapporto di tassi (rate ratio, RR) Rapporto di tassi (Rate Ratio, RR) = 36.7 / 70 = 0.52 Infortuni prevenuti = 1 – 0.52 = 0.48 (oppure 48%)
Intervallo di confidenza (IC) al 95% di RR Trasforma RR in logaritmo: ln (0.52) = - 0.65 Varianza di ln(RR) = 1/28 + 1/22 = 0.08 Errore standard (SE) = (0.08)0.5= 0.28 LnIC = lnRR ± z (SE) = -0.65 ± 1.96 (0.28) = -1.2 e -0.09 Trasfoma da logaritmo a numero = e-1.2 = 0.30; e- 0.09 =0.92 IC = da 0.30 a 0.92
Differenza di tassi (Rate Difference, RD) Differenza di tassi = 70 – 36.7 = 33.3 per 100 000 ore lavorate
Intervallo di confidenza (IC) al 95% di RR Calcola: ore lavorate/100 000; si ottiene 0.4 e 0.7 Varianza di RD = (28 / 0.4 2 + 22 / 0.6 2) = 236.11 Errore standard (SE) = (236.11) 0.5= 15.37 IC = RD ± z (SE) = 33.3 ± 1.96 (15.37) = 3.22 e 63.45
Calcolo degli infortuni attesi (exp) 50 : 100 000 = exp1 : 40 000; exp1 = (50×40 000)/100 000 = 20 50 : 100 000 = exp2 : 60 000; exp2 = (50×60 000)/100 000 = 30
Calcolo del chi quadrato (28 - 20) + (22 - 30) = 0 (28 - 20)2 + (22 - 30)2 = 32 Chi-quadrato = ((28-20)2/20) + ((22-30)2/30) = 5.33 Gradi di libertà = 1
Tavola del Chi-Quadrato (α = probabilità errore I tipo; GdL = gradi di libertà) Il chi-quadrato con un grado di libertà è 5.33 Livello di significatività =
Analisi di disegni before-and-after con gruppo di controllo. Dati categorici • Rapporto di tassi • Calcolo dei tassi e di RR1 e RR2 • Calcolo di D = differenza tra ln(RR1) e ln(RR2) • Calcolo di Standard Error (SD) della differenza D • Test statistico z = D/SD • Differenza di tassi • Calcolo delle differenze RD1 e RD2 • Calcolo di D = differenza tra RD1 e RD2 • Calcolo dello Standard Error (SD) della differenza D • Test stastico z = D/SD
1) Calcolo dei tassi e di RR1 e RR2 Calcola: ln(RR1) = ln(5.74/6.00) = -0.043 ln(RR2) = ln(2.03/6.40) = -1.149
2) D = Differenza tra ln(RR1) e ln(RR2) Calcola: ln(RR1) = ln(5.74/6.00) = -0.043 ln(RR2) = ln(2.03/6.40) = -1.149 la differenza tra loro: D = ln(RR1) - ln(RR2) = -0.043 -(-1.149) = 1.106
3) Standard Error della differenza D Calcola: Il reciproco dei numeri di infortunio 1/49, 1/46, 1/26, e 1/8 La somma = 0.206 La radice quadrata = 0.453.
4) Test statistico “z” Calcola: z = D / SE = 1.106 / 0.453 = 2.44. Quando z > 1.96 p < 0.05 Quindi i dati mostrano che l’intervento ha funzionato.
1) Differenza tra RD1 e RD2 RD1 = 6.00 - 5.74 = 0.26 RD2 = 6.40 - 2.03 = 4.37
2) D = differenza tra RD1 e RD2 RD1 = 6.00 - 5.74 = 0.26 RD2 = 6.40 - 2.03 = 4.37 Differenza fra gruppo di controllo e gruppo di intervento D = RD2 - RD1 = 4.37 - 0.26 = 4.11
3a) Standard Error di D Per ciascuna delle quattro categorie si calcola: 1) time units = (ore lavorate/100 000)2 2) numero infortuni / time units
3b) Standard Error di D Numero infortuni / time units = 49/8.172 + 46/8.012 + 26/4.062 + 8/3.942 Somma = 3.54 Radice quadrata della somma = 1.8
4) Test statistico z z = D / SE = 4.11/ 1.88 = 2.19 Se z > 1.96 allora p < 0.05 Anche questa analisi mostra che l'intervento ha funzionato
Se i valori di pre-intervento sono diversi Esempio 1 differenza uguale (3) ma rapporti diversi (75% e 50%) Esempio 2 = rapporto uguale (50%) ma differenza diversa (6 e 3)
Se i valori di pre-intervento sono diversi In tal caso i valori di z calcolati con i metodi RR e RD possono non sono gli stessi; debbono essere calcolati entrambi e per entrambi z dovrebbe essere più grande di 1.96 per fornire la prova che l'intervento ha funzionato.