240 likes | 442 Views
Universidad de San Andrés Econometría Semestre Otoño 2014. Profesores: Walter Sosa Escudero Mariana Marchionni Asistentes: María Edo M. Amelia Gibbons. Contenido. Organización de la parte práctica del curso Introducción a Stata Interface Datos Comandos Gráficos Do- file.
E N D
Universidad de San Andrés EconometríaSemestre Otoño 2014 Profesores: Walter Sosa Escudero Mariana Marchionni Asistentes: María Edo M. Amelia Gibbons
Contenido • Organización de la parte práctica del curso • Introducción a Stata • Interface • Datos • Comandos • Gráficos • Do-file
Organización del Curso • Página web del curso: http://faculty.udesa.edu.ar/WalterSosa/Econometria/ • Trabajos Prácticos: • Reglas: • grupos de 3 personas • Entrega: impresa (en casillero) y por correo electrónico, en PDF. Esperar acuse de recibo. • Monografía. Entrega: con el final. • Metodología clases prácticas: • Introducción a Stata • Desarrollo de ejemplos econométricos • Desarrollo de ejercicios teóricos y empíricos • Espacio de consulta para la realización de los trabajos prácticos y la monografía.
Introducción a Stata • Stata es un sistema que permite la gestión de base de datos y la realización de cálculos estadísticos y econométricos. • Fuentes de información: • Hamilton, L., 2012, Statistics with Stata: Version 12, Duxbury Press, New York. • Baum., C., 2006, An Introduction to Modern Econometrics with Stata, Stata Press. • Ambos librosestán en reserva en la biblioteca. • www.stata.com
Introducción a Stata – Interface • La interface de Stata comprende el entorno de trabajo. • Las diferentes ventanas que conforman la interface son: • Ventana “Review”: historial de comandos. • Ventana “Variables”: expone las variables que comprenden el dataset actualmente en memoria. • Ventana “StataResults”: es la ventana más grande color negro. Muestra los resultados obtenidos de la aplicación de los comandos. • Ventana “Statacomand”: en esta ventana el usuario introduce comandosmediante el teclado.
Introducción a Stata –Datos Estructura: tabla, en donde cada columna representa a una variable y cada fila a una observación. En cada celda se pueden guardar datos de diferentes tipos. El tipo de dato es el mismo para las observaciones de una misma variable A partir de ahora, utilizaremos una base de datos extraída de la EPH, correspondiente al tercer trimestre de 2011 para ejemplificar.
Introducción a Stata - Datos • Establecer un directorio: • cd "C:\Users\DE\Dropbox\econometría 2014\x - Tutorial 1“ • Archivo -> ChangeWorkingDirectory… • Lectura de Datos en Stata: distintas opciones • Base de datos en formato Stata (.dta): podemos abrirlo directamente en Stata. use eph_2011_t3.dta. • Base de datos en excel: tenemos un archivo excel con datos, llamado eph_2011_t3.xls. Cada columna representa una variable; la primera fila contiene los nombres de dichas variables. Dos métodos:
Introducción a Stata - Datos • Método 1 (Copy & Paste): • Abrir el archivo “eph_2011_t3.xls” en Excel • Abrir Stata. • En Excel, pintar todo el rango de datos que se desea llevar a Stata (incluyendo los nombres de las variables]. • ClickearEdicion/Copiar. • Pasar a Stata, abrir el editor de Stataclickeando en el botón Editor. • En esta ventana, clickearEdit/Paste, • Los nombres de las variables aparecerán en la ventana Variables. • Nota: Este método puede tener problemas si no se dispone de suficiente memoria RAM, por lo que es útil chequear si todos los datos han sido importado correctamente. • Nota II: Stata requiere criterios particulares para los nombres de las variables.
Introducción a Stata – Datos • Método 2 (Insheet) • Grabar el archivo conteniendo los datos en Excel como CSV (separa las columnas en comas]. • Ir a Archivo, Guardar como, CSV (delimitado por comas], Guardar • Ahora tenemos el archivo eph_2011_t3.csv • El archivo está en la siguiente ruta: c: \Users\DE\Dropbox\econometría 2014\ x – Tutorial 1\ eph_2011_t3.csv • Para leer los datos desde Stata, ingresar el siguiente comando: insheetusing"c:\Users\DE\Dropbox\Econometría 2014\x - Tutorial 1\eph_2011_t3.csv",comma • Stata creará una nueva base de datos, y los nombres de las variables aparecerán en la ventana “Variables”.
Introducción a Stata – Datos • Una vez que la base de datos ha sido abierta en Stata, puede grabarse en formato Stata: • Archivo -> Guardar Como -> eph_2011_t3.dta • Una vez grabada con la extensión .dta puede abrirse directamente desde Stata: • Archivo -> Abrir • use eph_2011_t3.dta, clear [clearlimpia la base de datos, se usa si o si antes de abrir una nueva] • A partir de ahora, abrir directamente desde Stata el archivo eph_2011_t3.dta original (contiene las etiquetas de las variables)
Introducción a Stata - Comandos Stata trabaja mediante la especificación por parte del usuario de órdenes que se denominan comandos Existe una determinada sintaxis que debe ser respetada. Tiene la siguiente estructura general: [byvarlist:] comando [varlist] [=exp] [ifexp] [in range] [weight] [, opciones] Los corchetes indican elementos opcionales. Todos los elementos que acompañan a un comando son opciones, de hecho existen comandos que comprenden sólo una palabra. Para conocer las opciones de los comandos: helpcomando
Introducción a Stata - Comandos • display _N [cantidad de observaciones en la base de datos] • describe[describe el dataset] • describe ch04 [describe una variable en particular] • list[muestra todas las variables y observaciones – para interrumpir clickear “break”] • list CODUSU ch04 [muestra observaciones para las variables seleccionadas] • sortCODUSU [ordena las observaciones en forma ascendente de acuerdo a los valores de CODUSU]
Introducción a Stata - Comandos • summarize[muestra resumen de todas las variables] • summarize CODUSU ch04 [muestra resumen variables seleccionadas] • summarize CODUSU, detail[muestra resumen más detallado de variables seleccionadas] • summ • tabulatech04 [tabula la variable seleccionada] • tabch04 ch07 [tabula las variables seleccionadas] • tabch04 ch07, row[tabula las variables seleccionadas incluyendo porcentajes además de frecuencias]
Introducción a Stata - Comandos Posiblesestadísticos: • tabstatch04 [muestra la media de la variable seleccionada] • tabstat ch04, statistics (mean sum countmax) [genera una tabla que muestra los estadisticos descriptivos indicados entre paréntesis]
Introducción a Stata – Comandos • generateingreso=tot_p12/7[genero una variable nueva que contiene el ingreso medido en dólares] • genobs=_n [genera una nueva variable llamada “obs” que enumera las observaciones según su orden] • genobs_total=_N [crea una variable cuyo valor siempre es el mismo y ese valor es la cantidad de observaciones] • gen nulo=. • gen x=uniform()[genera una variable con númerosaleatorios entre 0 y 1] • genedad2=ch06^2 [genera una variable que es el cuadrado de la edad] • egenhoras = rowtotal(pp3e_tot pp3f_tot) [genera una variable que es la suma horizontal de las variables seleccionadas]
Introducción a Stata - Comandos • Preserve and restore ≈ctrl+Z! En Stata no existe un comando “Deshacer” • preserve [guardaprovisionalmente la base de datos] • restore [vuelve a la versiónguardadaprovisionalmente] • Modificar la base de datoscomo en Excel • edit • labelvar ingreso “Ingreso total en Dólares” [etiqueta la variable “Ingreso”] • renameingreso ingreso_dolares [cambia el nombre de la variable ingreso] • replace ch04=0 if ch04==2 [ahora cuando la variable es igual a 0 significa que el individuo es mujer] • drop horas [elimina la variable horas] • keep if ch06<60 [borra las observaciones de aquellos que tienen menos de 60 años]
Introducción a Stata – Comandos • La expresión “if” • sum horasif ch04==1[ejecuta el comando summarize en la submuestra seleccionada: los hombres] • tab horas if (ch04==1 & ch06>30) [tabula la variable horas en la submuestra seleccionada: hombres mayores de 30 años] • tab horas if (ch04==1 & ch06>30)| (ch04==2 & ch06<30) [tabula la variable horas en la submuestra seleccionada: hombres mayores de 30 años o mujeres menores de 30 años]
Introducción a Stata – Comandos • Ej: sum horas if (ch04==1 & ch06>30)|(ch04==2 & ch06<30) [resume estadísticas de la variable horas en la submuestra seleccionada: hombres mayores de 30 años o mujeres menores de 30 años] • Operador jerárquico: el paréntesis determina el orden de aplicación de las sentencias condicionales
Introducción a Stata – Comandos • La expresión “in”: el comando solo se utiliza para las observaciones especificadas. • sum horas in 1/10 [muestra observaciones entre la 1era y la 10ma] • sumhoras in -10/-1 [muestra observaciones entre 10ma empezando de abajo y la primera empezando de abajo] • [, options]: • sum horas, detail [produce estadísticas adicionales, la asimetría, los cuatro valores menores y mayores y varios percentiles] • sum horas, meanonly[suprime la presentación de los resultados y el cálculo de la varianza]
Introducción a Stata – Gráficos Stata provee una serie de herramientas gráficas muy útiles a través del comando graph. En econometría, lo más usado son diagramas de dispersión o líneas. Disponibles a través del comando twoway (scatterorline) Ejemplo: twowayscatter ingreso horas if horas<500 & ingreso>0 Para más información: helpgraph | helptwoway
Introducción a Stata – Do file • Hasta ahora, introdujimos los comandos en la ventana “Statacommands”. • Es recomendable, en cambio, armar do files. Son archivos de texto que se guardan con extension “do”, y que contienen una lista de comandos de Stata. • Algunas ventajas: • Permite ejecutar una sucesión de comandos de Stata de una sola vez • Permite construir programas y rutinas elementales, que pueden ser reutilizadas en diversas situaciones o con otras bases de datos. • Proveen una forma eficiente de progresar en el análisis de datos, ya que es fácil corregir errores o reproducir resultados obtenidos con anterioridad.
Introducción a Stata – Do file • Armando un Do-file • Copiar en c:\micarpeta el archivo eph_2011_t3.dta. Esta será nuestra carpeta de trabajo. • En Stata, clickear el botón “New Do-file Editor” del menú o escribir “doedit” en la ventana de comandos • En el archivo escribimos: • cd c:\micarpeta [Stata buscará archivos en esa carpeta] • use eph_2011_t3.dta, clear [Stata abrirá la base de datos] • Describe • Summarize ch04 • Exit
Introducción a Stata – Do file • Guardar el do-file en “c: \micarpeta” con el nombre eph. Se guardará como “eph.do”. • El do-file puede: • Ejecutarse parcialmente: abrir el do-file, pintar los comandos a ejecutarse, clickear botón “Execute (Do)” • Ejecutarse totalmente: introducir el comando do eph en la ventana de comando Nota: pueden incorporarse comentarios dentro del archivo DO de la siguiente manera: /* Este es un comentario */ También es un comentario una línea iniciada con asterisco *
Introducción a Stata - Log File • Antes de empezar: existe un comandoque genera un archivo llamado log. • Son útiles para llevar un registro de todo lo que aparece en la ventana "resultados“. • Los log-file graban tanto el historial de los comandos como los resultados. • log using "c:\Users\DE\Dropbox\Econometría 2014\x - Tutorial 1\ eph_2011_t3.smcl" [options] • replace • append • log close • Se puede abrir el log file con el Bloc de notas o mediante la opción “File -> Log -> View".