850 likes | 1.23k Views
Campionamento. Campione: parte dell’insieme universo interessato dall’ipotesi di ricerca Popolazione di riferimento: insieme dei casi potenzialmente reperibili (universo). Campionamento. Determinato dall’ipotesi di ricerca e dalle variabili in gioco
E N D
Campionamento • Campione: parte dell’insieme universo interessato dall’ipotesi di ricerca • Popolazione di riferimento: insieme dei casi potenzialmente reperibili (universo)
Campionamento • Determinato dall’ipotesi di ricerca e dalle variabili in gioco • Determinante rispetto all’analisi e all’interpretazione dei risultati
Campionamento Caratteristiche da perseguire nella scelta del campione: • adeguatezza rispetto all’ipotesi di partenza • rappresentatività rispetto alla popolazione • controllo della distorsione • affidabilità
Campionamento Fattori di distorsione della stima campionaria: • influenza i risultati della ricerca • non è controllabile dal disegno sperimentale • determinata dalla tecnica di campionamento utilizzata
Campionamento Paradosso centrale del campionamento (Stuart, 1996) impossibilità di conoscere dall’esame del campione se sia esso scevro di distorsioni
Campionamento Distorsione da selezione • Il campione è adeguato se e solo se non è influenzato da altre variabili che non siano quelle in studio • Per assicurarci questa situazione occorre attuare un meccanismo di selezione casuale
Tecniche di Campionamento Campionamento casuale • consiste nella scelta di una campione attraverso un meccanismo casuale • attraverso questo metodo è possibile conoscere le probabilità di selezione del campione
Tecniche di Campionamento Il campione casuale • è privo di distorsioni dovute alla selezione • è l’unico tipo di campione sul quale è possibile fare inferenza statistica
Tecniche di Campionamento • Esistono diverse tecniche di campionamento • Rimane fondamentale la spiegazione delle procedure di selezione che determinano i risultati della ricerca
Tecniche di Campionamento Campionamento casuale semplice permette di selezionare un campione dalla popolazione in modo da avere la stessa probabilità per ogni possibile campione
Tecniche di Campionamento Campionamento stratificato suddivide il campione in strati, ovvero in sottogruppi, le cui proporzioni corrispondono alla suddivisione della popolazione
Tecniche di Campionamento: Campionamento stratificato • per formare gli strati in modo casuale bisogna estrarre un campione casuale semplice da ogni strato • incrementa la precisione del campionamento • la corretta stratificazione dipende solo dalle conoscenze e dall’abilità dello sperimentatore
Tecniche di Campionamento Campionamento a grappoli • nella prima fase la popolazione è suddivisa in gruppi - chiamati grappoli o cluster – ciascuno dei quali non ha caratteristiche diverse dagli altri • nella seconda fase da tutti i grappoli ne viene selezionato casualmente uno
Tecniche di Campionamento: Campionamento a grappoli • La differenza fra gli strati e i grappoli sta nel fatto che mentre la selezione casuale degli strati avviene a livello della popolazione la selezione casule dei grappoli avviene a livello di unità della popolazione • comporta una perdita di precisione che può essere in taluni casi giustificata da ragioni economiche • Naturalmente maggior variabilità esiste all’interno dei grappoli corrisponde a maggior precisione di campionamento
Tecniche di Campionamento Campionamento a stadi • Dopo aver selezionato due o più grappoli si seleziona all’interno di essi un individuo sempre attraverso un campionamento casuale semplice • Oltre al caso descritto di due stadi si possono verificare ripartizioni a più stadi che determinano una maggior flessibilità del progetto a discapito della rappresentatività del campione
Campionamento • Numerosità campionaria • Va determinata a priori • Dipende : • da H0 e da H1 • dalla potenza del test • dalla minima differenza apprezzabile • dalla varianza casuale • da alpha
Confronto fra le tecniche di campionamento • Casuale semplice: è alla base delle altre tecniche, è attuabile quando la popolazione è omogenea rispetto alla variabile in studio • Stratificato: applica un metodo più preciso ma meno casuale • A grappoli e a stadi: applica un metodo più casuale ma meno preciso
Fallacia nella Stima Campionaria e nel Test Statistico • Ambiguità Fallacia • Errore “Una fallacia è un X che sembra Y, ma è Z” (Johnson, 1987)
Campione e Inferenza Statistica • E’ attraverso il campione che posso fare inferenze in campo statistico • Non esiste inferenza senza fallacie così come non esiste campionamento senza errore • Controllo dell’errore attraverso il metodo
Campione Rappresentativo • Rappresenta la popolazione alla quale si riferisce ma non lo è né per caratteristiche né per numerosità. • Campione Rappresentativo: • Controllo distorsione nella selezione Casualità • Corrispondenza fra campione e popolazione Precisione
Questione di Metodo • Errori non campionari sono eliminabili • Errore campionario controllabile in quanto misurabile • Piano di campionamento: modalità di selezione e parametri/stimatori da misurare
Precisione e Casualità “The surer you want to be the less you have to demand” (Alan Stuart, 1968) Tanto più cerchiamo di controllare la precisione tanto più facilmente possiamo selezionare un campione non casuale La rappresentatività è data dalla differenza tra stima campionaria e parametro della popolazione
Errori legati alla Dimensione del Campione La dimensione ottimale del campione è quella per cui l’errore di campionamento non va oltre una certa soglia Efficienza: precisione per unità di costo Può esser controllata solo nel caso del campionamento probabilistico
Omogeneità e Numerosità • Più n si avvicina a N più l’errore di campionamento diminuisce • Maggiore è la variabilità della stima campionaria minore è l’affidabilità
Esempi di fallacie collegate a distorsioni nel campionamento • Principio inficiato: Casualità • Principio inficiato: Idoneità • Principio inficiato: Numerosità adeguata
Fallacia e Principio di Casualità Se il campionamento non è probabilistico non può esser considerato rappresentativo della popolazione studiata. Le conclusioni a cui portano i risultati del campione non saranno facilmente identificabili in una variabile. Esempio: applicazione di più test statistici sullo stesso campione per diverse dimostrazioni
Disegno sperimentale: si ipotizza la diversità fra tre campioni indipendenti riguardo i punteggi ottenuti in un questionario che misura il QI
T test: Confronto: 1 con 2, 1 con 3, 3 con 2. Tre risultati diversi ciascuno dei quali non è indipendente dall’altro:T1= -3.45 p=0.005, T2 = 1.742 p>0.05, T3=4.21 p=0.001 Anova: crea matematicamente confronti indipendenti e dà un unico risultato: F= 10.23, p<0.001
Applicazione di test univariati su esperimenti multivariati Disegno sperimentale è multivariato ovvero le variabili sono fra loro interdipendenti: Esempio: due scale di misurazione dell’intelligenza Supponiamo di confrontare due gruppi in base ai punteggi ottenuti alle due scale
Dai test univariati abbiamo due risultati diversi: F1= 2.1 p>0.05 F2 = 6.04 p=0.024 Che possono avere solo valore descrittivo Dal test multivariato ho un unico risultato Calcolato sulla base dell’interdipendenza fra le due variabili F = 4.17 p=0.032 Che ha valore dimostrativo
Fallacia e Principio di Idoneità Quando le variabili misurate sul campione sono troppo eterogenee i risultati non danno nessuna indicazione oppure danno indicazioni fallaci rispetto alla popolazione generale Esempi: regressione su gruppi non omogenei, paradosso di Simpson
Regressione su gruppi non omogenei Misura della relazione fra due parametri X e Y in campione composto da due popolazioni diverse con valori medi nei due parametri diversi Il coefficiente R2 è altissimo e la relazione è significativa dal punto di vista dell’analisi statistica che non tiene conto della diversità fra le due subpopolazioni
Paradosso di Simpson Immaginiamo di dover confrontare l’efficacia di due diverse terapie (Terapia A, Terapia B) nel miglioramento di un particolare stato patologico
Tutti i soggetti Migliorati Non migliorati Percentuale di migliorati Terapia A 20 20 50 Terapia B 24 16 60 La terapia B è la più efficace perché produce miglioramento nel 60% dei casi, mentre la terapia A arriva solo al 50%.
… Considerando la differenza fra maschi e femmine nelle due terapie…
Solo maschi Solo femmine Migliorati Migliorati Non migliorati Non migliorati Percentuale di migliorati Percentuale di migliorati Terapia A Terapia A 8 12 18 2 40 80 Terapia B Terapia B 3 21 7 9 30 70 sia nei maschi che nelle femmine è la terapia A a produrre una percentuale maggiore di miglioramenti e non la terapia B
Fallacia e Adeguatezza della Numerosità Quando il campione non è sufficientemente numeroso per quel tipo di variabile presa in esame e per quel tipo di differenza che si vuole misurare si può concludere erroneamente che non ci siano differenze. Esempio: numerosità non sufficiente
Fallacia e principio della causalità “Post hoc, ergo propter hoc” Attraverso il test statistico non è possibile stabilire relazioni causali ma solo differenze. Il test è tutto sbilanciato nel senso di falsificare H0. Esempio: due eventi prossimi in senso temporale vengono considerati l’uno la causa dell’altro. Utilizzando un campione opportuno per dimensioni e rappresentatività qualsiasi idea sarebbe dimostrata. Ma siamo interessati a dimostrare idee qualsiasi o differenze interessanti dal punto di vista clinico? Stabilire a priori le caratteristiche del campione significa assicurare la validità delle idee che si intende dimostrare
Campionamento • Mappa concettuale • Domande in itinere
Validità nella ricerca Nell’ambito ricerca sperimentale: caratteristiche di falsificabilità, generalizzabilità, replicabilità o appropriatezza nella descrizione e nell’utilizzo dei test statistici
Validità di un test In ambito psicometrico: attributo del test che permette di stabilire se il test stesso misura quello che effettivamente vuol misurare. caratteristiche: la struttura del test deve essere unitaria e le relazioni fra il test e altri test che misurano costrutti teorici analoghi.
Validità Validità interna • sono stabilite in modo appropriato le relazioni fra le variabili in studio • sono escluse dal disegno sperimentale quelle variabili confondenti
Validità Esempi di minaccia alla validità interna: • Effetto regressione (studi longitudinali) • L’effetto apprendimento: alcuni fenomeni se studiati in momenti successivi sono influenzati dalla consapevolezza del compito e dalla conoscenza della prova • maturazione degli individui
Validità • Compito dello sperimentatore è quello di misurare l’effetto del fenomeno sia in relazione al ripetersi delle prove che indipendentemente dalle ripetizioni
Validità Esempio: disegno sperimentale di Solomon per il controllo dell’effetto trattamento, apprendimento e maturazione. Suddivisione in gruppi: • Il primo gruppo (I gruppo – sperimentale) è sottoposto a pretest-trattamento e posttest • Il secondo gruppo (II gruppo - di controllo) è sottoposto a pretest e posttest senza trattamento • Il terzo gruppo (III gruppo - sperimentale) è sottoposto a trattamento e post-test. • Il quarto gruppo (IV gruppo – di controllo) è sottoposto solo a post-test.
Validità a Variabili confondenti: fonte di minaccia principale per la validità interna in quanto non controllabili dallo sperimentatore sono spesso distinte in sistematiche e asistematiche.
Validità Variabili sistematiche si riferiscono a quelle variabili che in ogni piano della ricerca agiscono in modo incontrollato. Variabili asistematiche sono caratteristiche di situazioni particolari di quel disegno di ricerca e solo di quello Tuttavia … dipende sempre dal disegno di ricerca
Validità Un esempio di varibili asistematiche sono quelle legate alla mortalità o ai drop-out dei soggetti del campione (studi longitudinali). • Mortalità: perdita non recuperabile di soggetti del campione durante il corso della ricerca. • Drop-out: o le mancate risposte a una parte della ricerca o la perdita recuperabile di soggetti nel corso della ricerca • analisi statistiche della popolazione che all’interno del campione non ha terminato la ricerca
Validità Un esempio di analisi per controllare la mortalità e i drop-out è quella che viene definita Intention- to-treatment- analysis che, in modi diversi a seconda del metodo che viene seguito, confronta la popolazione di soggetti che ha terminato lo studio con quella che non lo ha terminato.
Validità c Relazioni fra le variabili • Nel disegno sperimentale il controllo della validità interna si effettua soprattutto sulla conoscenza delle relazioni fra le variabili • Diversi sono i tipi di variabili che sono utilizzati nelle ricerche sperimentali. Solitamente si indagano gli effetti che una variabile definita fattore determina su una variabile definita dipendente.