110 likes | 237 Views
Aula 4. Introdução ao Stata 18 de abril de 2013. Problemas com variáveis string. Problemas com variáveis string. Como transformar variáveis string em variáveis numéricas ??
E N D
Aula 4 Introdução ao Stata 18 de abril de 2013
Problemas com variáveis string Como transformarvariáveis string emvariáveisnuméricas?? • No caso de algunsbancos, dependendoda forma como o dado foiimportadoou lido no stata, variáveissãocaracterizadascomonãonuméricas, ou string. • Contudo, apesar das suascaracterísticasqualitativas (porexemplo, ser homemou ser mulher), a forma maiscorreta de se trabalhar com estasvariáveis é transformá-lasemvariáveisnuméricas. • Se a variávelestácomotexto, porexemplo, “A” “B”ou “C”, a sugestão é utilizar o comando encode. • Exemplo: encode gender, generate(gender2) A nova variável gender2 seránumérica e teráos “labels” homem e mulherassociados a ela. Contudo, ser homem e ser mulhertambémterãovaloresnuméricos. Exemplo do SAEB 2011 list , nolabel
Problemas com variáveis string • Na variável , háumaoumaiscélulaspreenchidas com um caracternãonumérico, porexemplo, X. • Se der o comandodestringeleiráreclamar… existemelementosnãonuméricosqueimpedem a transformação. • A conversãoparanuméricapodeocorrerusando o comandodestringmasdevemosincluir a opçãoignore(X). • Irátransformar X em um valor missing. destring race, replace ignore(X) race: characters X removed; replaced as byte (1 missing value generated)
Quando importa vírgulas na variável destringproficiencia_lp, dpcommareplace • Transforma a variável em numérica usando o separador de decimais. • Exemplo: SAEB 2011
Análise dos dados: zeros e missing • Sempre checar os valores apresentados nos dicionários do banco de dados. • Exemplos: PNAD
Como corrigir missings e não declarados? Countif (variável) == . Countif (variável) == 999999999999 • Exemplo: use G:\stata\mus02psid92m.dta
Recode • Recodifica algumas variáveis categóricas e quando solicitado gera uma nova variável. • Cria faixas de algumas variáveis. • Para os valores das variáveis que não constam no intervalo , assume-se valores missing.
Byvarlist • Sortvarlist : ordena as observações em ordem ascendente de acordo com as variáveis definidas na lista varlist. • Pode usar bysort • Suponha que quer criar para cada indivíduo uma variável que é igual a média de renda das pessoas que possuem o mesmo nível de escolaridade dela. (bysortegen) bysort education: egenaveearnsbyed = mean (earnings)
Variáveis indicadoras • Dummies/variáveis binárias: Suponha que queira criar variáveis indicadoras mutuamente exclusivas para escolaridade. As dummies podem ser criadas uma a uma ou diretamente. Comandos xi • Interações: xi i.edcat*earnings, noomit