380 likes | 535 Views
Econometría. Profesor : Héctor Allende O. Departamento de Informática Universidad Técnica Federico Santa María. Estructura del Curso. 1.- Introducción. 2.- Modelos de Regresión Múltiple 3.- Construcción de Modelos de Regresión
E N D
Econometría Profesor : Héctor Allende O. Departamento de Informática Universidad Técnica Federico Santa María
Estructura del Curso 1.- Introducción. 2.- Modelos de Regresión Múltiple 3.- Construcción de Modelos de Regresión 4.- Verificación de Supuestos: Linealidad, Normalidad, Homocedasticidad, Independencia 5.- Contraste de Hipótesis y Estimación. 6.- Modelos Estadísticos de Series de Tiempo: Suavizamiento Exponencial, ARIMA, 7.- ANN: modelos de Regresión libre, Series de Tiempo 8. Aplicaciones
DATOS MODELOS HECHOS TEORÍAS FENÓMENOS INTUICIONES
Problema real Planteamiento del problema Objetos y medios Modelos Estadísticos (Cálculo de probabilidades) Recolección de información muestral (Técnicas de muestreo ; diseño de experimentos) Depuración de los datos (Análisis de datos) Estimación de los parámetros (Teoría de la estimación)
Contrastes de Simplificación (Contrastes de hipótesis) Crítica y Diagnosis del Modelo (Análisis de datos) ¿ Es un modelo adecuado ? Nuevo Conocimiento Previsiones Decisiones
Dos ejemplos de modelos cuantitativos PREGUNTA Cómo diseñar un equipo de mantenimiento Cómo aumentar el rendimiento de un proceso MODELO • Variables: • - Número de averías (x1) • - Tiempo reparación (x2) • Hipótesis: las averías • Se producen independientemente • La probabilidad de no avería disminuye exponencialmente con el tiempo • Hipótesis:tiempo reparación • Depende de muchos pequeños factores • Variables: • - Rendimiento en % (y) • - Temperatura x1 • - Concentración x2 • Hipótesis: • El rendimiento aumenta en promedio linealmente con la temperatura y la concentración • Para valores fijos de x1 y x2 el rendimiento varía aleatoriamente alrededor de su valor medio
RECOLECCIÓN DE INFORMACIÓN Muestreo de máquinas para estudiar sus averías y tiempo de reparación Diseño de un experimento que se varíen x1 y x2 y se mida y ESTIMACIÓN PARÁMETROS • Estimar: • , tasa media de averías • , tiempo medio de reparación • , variabilidad en el tiempo de reparación • Estimar: • El efecto de la temperatura (b) y el de la concentración (c) sobre el rendimiento • Variabilidad experimental CONTRASTES DE SIMPLIFI- CACIÓN ¿Tienen todos los tipos de máquinas el mismo ? ¿Los tipos de averías, el mismo y ? ¿Es el efecto de la temperatura y concentración idéntico (b=c ) ? CRÍTICA DEL MODELO ¿Es cierta la independencia entre las averías? ¿Son la variabilidad de x1y x2 en la muestra consistentes con las hipótesis ? ¿Es la relación entre y (x1 , x2) lineal? ¿Es la variabilidad de y para x1, x2fijos, independ. de los valores concretos de x1, x2 ?
¿ Qué es la Econometría ? • Disciplina que se ocupa del análisis cuantitativo de fenómenos económicos:Teoría Económica, Economía Matemática y el Modelado Estadístico de datos Modelo Keynesiano del Consumo Modelo de Klein Modelo de Cuentas Nacionales Modelo de producción Cobb-Douglas Rol de la econometría : Proporcionar métodos para estudiar y medir las relaciones de las variables económicas (teoría v/s la realidad)
Aplicaciones de los modelos Econométricos • Ciencias de la Ingeniería • Ciencias Económicas • Ciencias Naturales • Ciencias Médicas • Ciencias políticas y sociales
Modelo Keynesiano de Consumo (Fu Consumo) (Fu Ingreso) donde: Gasto de Consumo Ingresos Gasto de Inversión (Ahorro) Perturbación Aleatoria
Modelo de Klein (I) Fu Consumo Fu Inversión Demanda Trabajo Identidades
C : Gasto de Consumo K : Existencia Capital I : Gasto de Inversión W : Nómina Sector Privado G : Gasto de Gobierno W´ : Nómina Sector Público T : Impuesto t : Tiempo Y : Ingreso descontado impuesto P : Ganancias : Perturbaciones estocásticas
Relaciones Funcionales (Típicas)Modelos Estructurales (Metamodelos) a) MODELO LINEAL Estocástico b) MODELO CUADRATICO c) MODELO EXPONENCIAL d) etc.
Formulación de Modelos E1: Conocimiento profundo del fenómeno : Observación cuidadosa y identificación de posibles elementos relevantes. (variables) E2: Estado del Arte : Revisar los postulados teoricos existentes, formular hipótesis.(nuevo conociemiento. E3: Determinar los Pocos Vitales : Pareto, causalidad. E4:Validación : Probar con Datos Empíricos, Hipótesis. Sepamos buscar como quien espera encontrar y encontrar como quien espera buscar
Teoría Económica Formulación de Hipótesis Información Datos previa Análisis Explorativode Datos (DM) Modelo Econométrico Estimación de Parámetros Contraste de Hipótesis Validación de Modelo
CLASES DE MODELOS: Función, Estructura, Referencia del Tiempo, Referencia de la Incertidumbre, Generalidad • Descriptivos, Explicativos, Predictívos • Icónicos, Analógicos, Simbólicos • Estáticos, Dinámicos • Determinísticos, Probabilísticos, de Juego • Generales, Especializados
Estáticos Dinámicos Descriptivos Extrapolativos y = + u (Primera parte) y = + yt-1 + ut (Quinta parte) Explicativos y = + x + u (Tercera y cuarta parte) y = + x + yt-1 + ut (Quinta parte)
DATA MINING Y Métodos Estadísticos Cuantitativos
Knowledge Discovery in Data Bases (KDD) “Es un proceso de identificación de patrones válidos, innovativos, potencialmente útiles, no explícitos y comprensibles a partir de los datos”.
KDD • Etapas del KDD : • 1. Selección de Datos • 2. Depuración • 3. Enriquecimiento • 4. Codificación • 5. Data Mining • 6. Reportes
Information Requirement Data Selection Data Bases • Cleaning: • Domain consistency • De-duplication • Outliers detection Enrichment Feedback External Data Coding • Data Mining • Association • Clustering • Classification • Regression Reporting Action KDD
Data Mining (DM) “Etapa de reconocimiento de patrones, a través de algoritmos automáticos o semiautomáticos de grandes bases de datos con el objeto de apoyar a la toma de decisiones dentro de una organización”. DM permite construir modelos mediante algoritmos automáticos SM permite construir modelos orientado por un experto.
DM v/s SM • Capacidad o poder predictivo • Manejabilidad • Perfomance • legibilidad • Rapidez • Tamano
Algoritmos en DM • Existen diversos algoritmos en Data Mining los que se pueden clasificar: • Estadísticos • Machine Learning • Redes Neuronales etc. • Actividades de Data Mining: • Preparación de los datos • Aplicación de algoritmos de DM • Análisis de datos
DM • Algoritmos de DM: • Estadísticos • -Clustering • -Clasificación • -Regresión • -Pronósticos
Aplicaciones • Energía: Apoyo a la toma de decisiones en plantas energía eléctrica (centro de despacho de cargas) • Medicina: Mejora de diagnósticos y asignación de tratamientos en base a reconocimiento de patrones. • Marketing: información demográfica y sistemas de información geográficos, patrones de compra, segmentación de mercados. • Finanzas: predicción de valores y riesgo en el mercado de opciones.
Superficies de Respuesta y Metamodelos • Una superficie de respuesta:Es un gráfico de la variable respuesta como una función de varias variables (factores). • Unmetamodelo: Es una representación algebraica, con los factores como variables independientes (determinísticas o estocásticas) y la variable respuesta como variable dependiente. La que representa una aproximación de la superficie de respuesta. • Metamodelos típicos usado en muchas aplicaciones son: • a) Regresión multiple • b) Markovianos • c) ANN
Meta-modelos • A través de un metamodelo la metodología de superficie de respuesta (RSM) trata de encontrar la respuesta óptima de un conjunto de factores. • La Experimentación con un metamodelo es comúnmente un método de adquirir información • Un proceso de diseño de experimento asume un particular forma funcional o estructura dentro del metamodelo (Lineal model, Quadratic model, etc).
Conceptos de Análisis de Regresión • Los métodos de Regresión son usados para determinar la mejor relación funcional entre las variables. • Supongamos que la relación funcional puede ser representada por: E(Y) = f (X1, ..., Xp / B1, ..., BE) donde E(Y) es el valor esperado de la variable de respuesta Y; los X1, ..., Xp son factores; y los B1, ..., BE son los parámetros de la forma funcional; E(Y) = B1 + B2 X1 + B3 X2 + B4 X1 X2+……
Conceptos de Análisis de Regresión • La observación de un valor de la respuesta Y, para un conjunto de X ’s, es asumida como una variable aleatoria dada por: Y = f (X1, ..., Xp/B1, ..., BE) + Donde , es una variable aleatoria con media igual a 0 y varianza . Los valores de B1,...,BE son obtenidos por algún método de estimación conveniente ( LS, M, GM etc.).
Métodos en Superficie de Respuesta • La metodología de superficie de respuesta (Response surface methodology RSM) involucra una combinación de metamodelos (i.e., regresión lineal y no lineal) y procedimientos secuenciales de optimización (iterative optimization).
Modelo Estadístico (Lineal) x , y son variables independiente y dependiente respectivamente. Además “u” una variable estadística que representa el error. Los parámetros 0 y 1 pueden ser estimados a partir de los datos {(xi , yi)}i=1,...,n mediante método de mínimos cuadrados. Entonces Sea ;
Modelo de Regresión simple Hipótesis Estructural Supuestos: v.a. parámetros Variable de control Perturbación Aleatoria, con esperranza nula, variancia constante, distribuida normalmente con independencia
Consecuencias de los supuestos Dist. Normalmente
Ejemplo de Regresión Simple t 0 1 2 3 4 5 6 V(t) 30 60 46 32 10 4 17 20 40 26 14 8 20 12 V(t) 25 40 46 29 12 6 17 Sea xt = sen tyt = V(t) Luego y(t) = a + b xt + ut