60 likes | 178 Views
Semináře ke kurzu Analytické metody výzkumu Jindřich Krejčí. Chybějící hodnoty. Chybějící hodnoty - co s nimi?. neprovádět analýzu aplikovat teoreticky zdůvodněné postupy vyřazení proměnných nebo objektů z analýzy vyhledání alternativních dat jednoduché způsoby nahrazení:
E N D
Semináře ke kurzu Analytické metody výzkumu Jindřich Krejčí Chybějící hodnoty
Chybějící hodnoty - co s nimi? • neprovádět analýzu • aplikovat teoreticky zdůvodněné postupy • vyřazení proměnných nebo objektů z analýzy • vyhledání alternativních dat • jednoduché způsoby nahrazení: • průměry, klouzavé průměry, medián, sousední hodnoty, ... • analýza missing values -> odhad hodnot
MVA (Missing Values Analysis) • popis a posouzení struktury souboru a chybějících hodnot (průměry, kovarianční matice, korelace, regrese, odhady) • odhad chybějících hodnot • nový datový soubor s odhadnutými hodnotami • určení kategorických proměnných • provede se série t-testů průměrů mezi skupinami • analýza počtu chybějících a nechybějících hodnot (tabulky) • další statistiky • odhady: EM nebo regrese
MVA [VARIABLES =] {varlist}{ALL } [/CATEGORICAL = varlist] [/MAXCAT = {25**}{n }] [/ID = varname] Description: [/NOUNIVARIATE] [/TTEST [PERCENT = {5}] [{T }] [{DF } [{PROB }]... [/CROSSTAB [PERCENT = {5}{n}]] [/MISMATCH [PERCENT = {5}{n}] [NOSORT]] [/DPATTERN [SORT = varname[({ASCENDING })] [varname ... ]] ... [/MPATTERN [NOSORT] [DESCRIBE = varlist]] [/TPATTERN [NOSORT] [DESCRIBE = varlist] [PERCENT={1}{n}]] Estimation: [/LISTWISE] [/PAIRWISE] [/EM [predicted_varlist] [WITH predictor_varlist] ... [OUTFILE ='file' ])] [/REGRESSION [predicted_varlist] [WITH predictor_varlist] ... [OUTFILE = 'file' ])]].
MVA lifeexp infmort health hrswrk prison gdp gdpgrow services labor region /MAXCAT = 25 /ID = country /CATEGORICAL = region /EM ( TOLERANCE=0.001 CONVERGENCE=0.0001 ITERATIONS=25 OUTFILE='E:\A06 MVS\dataNEW.sav' ) .