1 / 11

Aula 4

Aula 4. Introdução ao Stata 18 de abril de 2013. Problemas com variáveis string. Problemas com variáveis string. Como transformar variáveis string em variáveis numéricas ??

Download Presentation

Aula 4

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Aula 4 Introdução ao Stata 18 de abril de 2013

  2. Problemas com variáveis string

  3. Problemas com variáveis string Como transformarvariáveis string emvariáveisnuméricas?? • No caso de algunsbancos, dependendoda forma como o dado foiimportadoou lido no stata, variáveissãocaracterizadascomonãonuméricas, ou string. • Contudo, apesar das suascaracterísticasqualitativas (porexemplo, ser homemou ser mulher), a forma maiscorreta de se trabalhar com estasvariáveis é transformá-lasemvariáveisnuméricas. • Se a variávelestácomotexto, porexemplo, “A” “B”ou “C”, a sugestão é utilizar o comando encode. • Exemplo: encode gender, generate(gender2) A nova variável gender2 seránumérica e teráos “labels” homem e mulherassociados a ela. Contudo, ser homem e ser mulhertambémterãovaloresnuméricos. Exemplo do SAEB 2011 list , nolabel

  4. Problemas com variáveis string • Na variável , háumaoumaiscélulaspreenchidas com um caracternãonumérico, porexemplo, X. • Se der o comandodestringeleiráreclamar… existemelementosnãonuméricosqueimpedem a transformação. • A conversãoparanuméricapodeocorrerusando o comandodestringmasdevemosincluir a opçãoignore(X). • Irátransformar X em um valor missing. destring race, replace ignore(X) race: characters X removed; replaced as byte (1 missing value generated)

  5. Quando importa vírgulas na variável destringproficiencia_lp, dpcommareplace • Transforma a variável em numérica usando o separador de decimais. • Exemplo: SAEB 2011

  6. Análise dos dados: zeros e missing • Sempre checar os valores apresentados nos dicionários do banco de dados. • Exemplos: PNAD

  7. Como corrigir missings e não declarados? Countif (variável) == . Countif (variável) == 999999999999 • Exemplo: use G:\stata\mus02psid92m.dta

  8. Recode • Recodifica algumas variáveis categóricas e quando solicitado gera uma nova variável. • Cria faixas de algumas variáveis. • Para os valores das variáveis que não constam no intervalo , assume-se valores missing.

  9. Byvarlist • Sortvarlist : ordena as observações em ordem ascendente de acordo com as variáveis definidas na lista varlist. • Pode usar bysort • Suponha que quer criar para cada indivíduo uma variável que é igual a média de renda das pessoas que possuem o mesmo nível de escolaridade dela. (bysortegen) bysort education: egenaveearnsbyed = mean (earnings)

  10. Variáveis indicadoras • Dummies/variáveis binárias: Suponha que queira criar variáveis indicadoras mutuamente exclusivas para escolaridade. As dummies podem ser criadas uma a uma ou diretamente. Comandos xi • Interações: xi i.edcat*earnings, noomit

More Related