170 likes | 310 Views
Principali analisi statistiche. 1. Confronto fra medie (2 o piú campioni). Voto . Variabile continua in funzione di una categorica (es. voto più alto M vs. F). M . F . 2. Correlazione e regressione. Relazione fra due variabile continue (es. il voto medio dipende dal consumo di birre?).
E N D
Principali analisi statistiche 1. Confronto fra medie (2 o piú campioni) Voto Variabile continua in funzione di una categorica (es. voto più alto M vs. F) M F 2. Correlazione e regressione Relazione fra due variabile continue (es. il voto medio dipende dal consumo di birre?) Voto Birre 3. Analisi di tabelle di contigenza Birre SÌ NO Conteggi con due o più variabili categoriche (es. essere astemi dipende dal genere?) M F
Logica del processo inferenziale: i 5 passi 1. Costruireun’ipotesi(questioneoggettodellaricerca) E.g. Problema: glistudentimaschihannodeivotipiùaltidellefemmine? 2. Sceglierel’analisistatistica • E.g. Analisi per testaredifferenzeframedie 3. Pianificareedeseguireilcampionamento E.g. Selezionare un campionedi M e F e raccogliereidati • 4. Eseguireil test 5. Rifiutare o accettarel’ipotesidipartenza • E.g. Maschie femmine non sonodiversi Errorecomune Eseguireilcampionamento prima di aver costruitol’ipotesi e aver sceltol’analisi
Analisistatistica: assunzioni e campionamento Analisistatistica Campionamento Ognianalisirichiedeuncampionamentoadeguato Assunzioni Ognianalisirichiedecheidatiseguanorispettinoalcunecondizioni Se entrambre le condizionisonosoddisfatte Possiamoprocedere con il test diipotesi
Concetti generali: campionamento Il campionamento consiste nelle tecniche di estrazione di un sottoinsieme di unità statistiche dalla popolazione L’insieme di tutti gli studenti dell’Università di Padova Infiniti campioni possibili di diversa dimensione N= dimensione della popolazione n= numerosità del campione
Campionamento: randomizzazione Molte analisi richiedono che i dati siano fra loro indipendenti e che siano estratti a random dalla popolazione L’insieme di tutti gli studenti dell’Università di Padova Tuttiglistudentidevonoavere la stessaprobabilitàdiessereestrattidallapopolazione
Campionamento: replicazione Per applicareognianalisidevoavere un sufficientenumerodiosservazioni (repliche) La dimensione del campione n corrisponde al numerodirepliche Numerodi repliche (n) Gradidilibertà P Varia la potenza del test!!!
Campionamento: replicazione Popolazione 4 repliche 4 repliche Le replichedevonoesserefraloroindipendenti (campionare a random spesso non è sufficiente!) 3 principaliproblemi in biostatistica 1. Dipendenzaspaziale 2. Dipendenzatemporale 3. Dipendenzabiologica
Campionamento: replicazione Ogniosservazione è unavera replica? Non confondete le osservazioni con le repliche Spesso non coincidono! Prima di fare ognitipodicampionamentodeveesserechiaroqualesia la replica
Dipendenzaspaziale Vogliovedere se la lunghezza media diunaparametromorfologico (penna) variaframaschi e femmine ♂ ♀ Popolazione TN-BZ 10 individui per genere 15 penne per individuo 300 misure
Dipendenzaspaziale ♀ ♂ 15 measures per bird
Effettidellapseudoreplicazione df SS MS F value P sex 1 3.42 3.42 5.887 0.025 Residuals 1810.48 0.58 --------------------------------------------------- dfSS MS F value P sex 1 51.4 51.4 63.19 0.0000000000039 Residuals 298242.4 0.81 Supponiamodilavorare con un alpha=0.01 Cosaconcludiamo?
Esempio 2: Dipendenzaspaziale Effettodellafertilità del suolosullacrescitadell’abeterosso Basso N Area di studio 4 siti 10 alberi 4 misure per anello Media1= 15 mm Quantereplicheabbiamo? Alto N 4 siti 10 alberi 4 misure per anello Media2= 17 mm
Dipendenzaspaziale Quandomisuriamo la variabileripetutamentesullastessaunitàdicampionamento le misure non sonoindipendenti Performance deglistudenti prima e dopoilcorsodistatistica: 6 studenti, 12 misure Quanterepliche? Tempo 1 Tempo 2 misura1 misura2
Dipendenzabiologica Similaritànellecaratteristichegenetiche Ad es. individuicheappartengonoallastessafamiglia, popolazionebiologicaecc. FarmacoA FarmacoB Madre B MadreA Sampling A Sampling B
Esempio Esplicativa: Irrigazione------- Variabilerisposta: Produttivitàpioppo ipasso: identificarel’unitàdicampionamento ii passo: identificareilnumerodirepliche iii passo: decidere la distribuzionespazialedellerepliche Terreno Canale
Sampling design: “buoni” e “cattivi” Esempidicattivi design Nessuna replica Pseudoreplicato Sistematico Esempidibuoni design Bloccorandomizzato Completamenterandomizzato
Sampling design: conclusioni Prima di fare ilcampionamentodevicapirequal è la replica dello studio Campionare un sufficientenumerodirepliche Maggiore la variabilitàdellapopolazionemaggioredovràessereilnumerodirepliche