580 likes | 1.35k Views
UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS Facultad de Ciencias Económicas Unidad de Postgrado MAESTRIA EN ECONOMIA CON MENCION EN GESTION Y POLITICA PUBLICA. COEFICIENTE DE DETERMINACION ANALISIS DE VARIANZA PREDICCION P VALUE JARQUE VERA RESET RAMSEY CHOW RESIDUOS RECURSIVOS
E N D
UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS Facultad de Ciencias Económicas Unidad de Postgrado MAESTRIA EN ECONOMIA CON MENCION EN GESTION Y POLITICA PUBLICA COEFICIENTE DE DETERMINACION ANALISIS DE VARIANZA PREDICCION P VALUE JARQUE VERA RESET RAMSEY CHOW RESIDUOS RECURSIVOS CUSUM Mag. Renán Quispe LLanos 2011
Ejemplo: 10
y x β
Reemplazando en la fórmula tenemos: Calculando Varianza ( ) 2 s = = 41 . 9375 0 . 975757 40 . 9209 b 1 ( ) 2 s = = 41 . 9375 0 . 0000303 0 . 00127 b 2 s = 6 . 3969 ˆ b 1 s = 0 . 0356 ˆ b 2
CONSTRUCCION DE INTERVALOS PARA I Para un nivel de significación del 5% observando en la tabla “t” de student: t(n-k)/2= t (10-2)0.05/2 = t8,0.025= 2.306
Otra forma de expresarlo con prob.: P(0.426820.5919)=1-0.05=0.95 Dado un coeficiente de confianza del 95% en el I.p si se construye cien intervalos repetidos con los límites siguientes 0.4268 y 0.919, en el 95% de ellos estarían verdadero parámetro poblacional.
Yi (Xi, Yi) Xi COEFICIENTE DE DETERMINACION (R2) Es un indicador de la bondad de ajuste de la línea de regresión que mide la proporción de la variación total en la variable dependiente Y, que “se explica” o “se debe a” la variación de la variable independiente X.
Planteada la relación inicial la misma se mantiene cuando se establece relaciones a partir de las sumatorias de sus desviaciones cuadráticas. Por un proceso matemático particular se da: SCT = SCR + SCE SCT: Variación total del Yi observado con respecto a la media muestral. La suma total de los cuadrados.
SCR:Variación residual o no explicada de los valores de Y con respecto a la línea de regresión. Suma de los cuadrados residuales SCE:Variación de los valores estimados Yi con respecto a su media. Suma de los cuadrados Explicados
PROPIEDADES : 1. Es una cantidad no negativa 2. Sus límites son Es decir que R varía entre cero y uno R2=1 cuando el ajuste es perfecto, es decir los valores observados coinciden perfectamente con la recta estimada R20 es decir que no hay relación entre la variable dependiente y los variables explicativas. Este R2 no mide el grado de asociación entre x e y, para lo cual se acude a otro indicador
( ) ( ) å - - x x y y Cov ( x , y ) i i = = r ( ) ( ) s s 2 2 2 2 - - x x yi x y i - - n 1 n 1 COEFICIENTE DE CORRELACION Es una medida de asociación lineal entre dos variables PoblacionalMuestral y
PROPIEDADES : • Sus límites son: • Es de naturaleza simétrica, es decir el coeficiente de correlación entre X y Y (rxy) es igual al coeficiente se correlación entre Y y X (ryx) • Si X, Y son estadísticamente independientes y el coeficiente de correlación es cero, pero si r=0 no implica necesariamente independencia. • Es una medida de asociación lineal, es decir mide la asociación lineal entre dos variables .Negativa(-1) o positiva (1)
COEFICIENTE DE DETERMINACION MULTIPLE CORREGIDO En la medida que el numero de variables indepencientes se incrementa, se divide a cada uno de la sumatorias cuadráticas entre sus grados de libertad, obteniendo finalmente un cociente de varianzas.
ANALISIS DE VARIANZA El análisis de varianza tiene por finalidad investigar la explicación conjunta de todas las variables explicativas intervinientes en el modelo, a partir del estudio de los componentes de la variabilidad total. SCT = SCR + SCE De donde se construye un estadístico de frecuencia conocido:
Planteamos la siguiente tabla: F = (valor calculado)
Planteamiento de Dócima de Hipótesis H0: 1 = 2; k = 0 H1: 1 0, 2 0; k 0 Bajo el enfoque de la prueba de significancia, se construye la región crítica de la siguiente manera: R.C. = { F > Fk-1, n-k (tabla de la F)}
Del ejemplo del modelo de Ingreso-Consumo, se realiza los respectivos cálculos, para hallar el estadístico F: El F calculado, se compara con el de la tabla Entonces se rechaza la hipótesis nula, es decir que el “Consumo” es explicado por la variable “Ingreso”.
ANALISIS DE VARIANZA PARCIAL Entonces: (que se compara con el de la tabla) Consultoria Virgen del Carmen S.A.
Docima de Hipótesis H0: r+1 = r+2=......=s = 0 H1: r+1r+2 ..... r+s 0 Bajo el enfoque de la prueba de significancia, se construye la región crítica de la siguiente manera: R.C. = { FC > Fs,n-(r+s) (tabla)} Consultoria Virgen del Carmen S.A.
Ejemplo: Sea los datos sobre consumo privado y sus variables explicativas respectivas.
Para el modelo de consumo Ingreso los estimadores son: C = 1 + 2YND C = 528.78877 + 0.56 YND tc (2.84715) (9.16902) R2 = 83.2 , (dato = 4000) F = 84.05 Incorporando las variables precios (PR) y tasa de interés (TI): C = 1 + 2YND + 3PR + 4IT C = 175.00 + 0.4966YND + 5.0862PR + 2605IT (6.8825) (0.6418) (6.0295) t19-4, 0.05/2=2.131 La tabla de análisis de varianza será: Consultoria Virgen del Carmen S.A.
Entonces: (que se compara con el de la tabla) Consultoria Virgen del Carmen S.A.
F2,15; 0.05 = 3.68 (tabla) Dado que: FC = 1.877 < F2,15; 0.05 = 3.68. Se concluye que la incorporación de las variables precios relativos y la tasa de interés general no mejoran la explicación del modelo estando ya incorporada la variable ingreso disponible. Consultoria Virgen del Carmen S.A.
“p value” Es el valor exacto de la probabilidad, obtenida a partir de la información, el cual nos permite rechazar o no la hipótesis nula (dado un nivel de significancia) sin necesidad de recurrir al uso de tablas. • Si el “p value” <α =1% ó 5%, se rechazará la hipótesis nula. • Si el “p value” > α, se aceptará la hipótesis nula. α = Nivel de significación
“p value” Distribución “t” 5% de área = α Zona de Aceptación “p value” t 0 tc Distribución “F” 5% de área =α Zona de Aceptación “p value” F 0 Fc
Por ejemplo, en el modelo Yt = β1 + β2X1t + β3X2t; tenemos las siguientes salidas: La probabilidad asociada (p value) tanto para el estadístico t, como para la prueba F, son superiores a 0.05 Se acepta la hipótesis nula de significancia individual y significancia conjunta, respectivamente
El estadístico Jarque Bera.- Determina como se encuentra afectado su valor por la presencia de un mayor apuntamiento (mayor a 3) o menor asimetría (cercano a cero) de las perturbaciones. A significa asimetría y C apuntamiento o curtosis Hipótesis: H0: Las perturbaciones tienen una distribución normal H1 : Las perturbaciones no tienen una distribución normal
El estadístico Jarque Bera.- Permite verificar la normalidad de los residuos. La Ho es que los residuos se distribuyen normalmente. La probabilidad asociada al estadístico Jarque-Bera es mayor al 5%, entonces no se puede rechazar la Ho de normalidad de los residuos.
Ejemplo (pregunta del examen): La probabilidad asociada al estadístico Jarque-Bera es mayor al 5%, entonces no se puede rechazar la Ho de normalidad de los residuos.
Test de Reset de Ramsey Se realiza en dos etapas: 1º estima en modelo sujeto a análisis en su forma original: 2º se toma la serie estimada por los parámetros de la regresión anterior y se anexan sus potenciales enteras a la misma regresión como parámetros auxiliares Estadístico de prueba: H0: El modelo está correctamente especificado H1: El modelo no está correctamente especificado
Ejemplo En un modelo sobre el fondo “Afuture” (Yt) en función a las tasas anuales de retorno (Xt), obtenemos el test de Ramsey: H0: El modelo está correctamente especificado H1: El modelo no está correctamente especificado El test de Reset Ramsey indica que añadiendo 2 términos al test “Y2”, “Y3“ el valor del estadístico “F” es 1.16 y la probabilidad asociada al error de rechazar la hipótesis nula cuando es verdadera es de 35.99% mayor al 5%; por lo tanto se acepta que el modelo está correctamente especificado.
Test de Chow (Contraste de Cambio Estructural) El modelo restringido (MR) es: El modelo sin restringir (MSR) es : El estadístico F: H0: Ausencia de cambio estructural H1: Presencia de cambio estructural SRR: suma residual restringida es la que proviene de la estimación del modelo restringido (MR) SR1 y SR2: suma residual sin restringir es el agregado de las sumas residuales de cada una de las regresiones de las submuestras
Ejemplo (pregunta del examen): Probamos la posibilidad que exista un quiebre estructural en el año 1996: Rechazamos la hipótesis de que no hay cambio estructural al 95% de confiabilidad. Por lo tanto, concluimos que en 1996 se produjo un cambio estructural.
Residuos Recursivos (Contraste de Estabilidad) Se obtienen a partir de una estimación recursiva de los parámetros del modelo H0: Los parámetros son estables en el tiempo H1: Los parámetros no son estables en el tiempo
Residuos Recursivos Esquemáticamente el proceso se pude describir a partir del siguiente gráfico
Contraste de Suma Acumulada (Test Cusum) Consiste en la acumulación progresiva de los residuos recursivos que posteriormente se normalizan dividiéndolos entre la estimación insesgada de la desviación típica de la perturbación (S) r = k+1, k+2, ... , n Donde: Debe oscilar entre: H0: Los parámetros son estables en el tiempo H1: Los parámetros no son estables en el tiempo
Contraste de Suma Acumulada (Test Cusum) Wr La representación gráfica de este contraste dibujaría los residuos recursivos sobre el gráfico siguiente: k n r
Ejemplo (pregunta del examen): El estadístico CUSUM se mantiene dentro de las bandas de confianza, con lo cual se puede afirmar que los parámetros son estables a lo largo del período de análisis en un 95% de confianza.
Contraste de Suma Acumulada de Cuadrados (Test Cusum2) Utiliza la suma acumulada del cuadrado de los residuos recursivos (numerador) y la Suma de Cuadrados de la totalidad de los Residuos Recursivos (denominador) r = k+1, k+2, ... , n El valor esperado del estadístico oscila entre cero y uno; así, E(Sr) = 0 cuando r = k, y, cuando r = n, E(Sr) = 1.
Sr E(Sr) + C0 E(Sr) knr E(Sr) - C0 Contraste de Suma Acumulada de Cuadrados (Test Cusum2)
Ejemplo (pregunta del examen): El estadístico CUSUM2 se mantiene dentro de las bandas de confianza, se afirma que los parámetros son estables a lo largo del período de análisis en un 95% de confianza.
PREDICCION Modelo: Modelo estimado: A. Predicción Puntual de La predicción puntual es la misma para un valor particular como para el valor promedio de la variable Las desviaciones standart son diferentes: Para el valor promedio es Para el valor particular es
B. Intervalo de Confianza de una predicción (α=Nivel de significancia): Para el valor promedio Para un valor particular Con “n-k” g.l. y con un nivel de significancia
Ejemplo: Sea los datos sobre consumo privado (y) y sus variables explicativas respectivas: X1: Ingreso disponible (YND), X2: precios relativos (PR) y X3: tasas de interés (IT). El modelo con las variables Y y X1 será: C = 1 + 2YND C = 528.78877 + 0.56YND tc (2.84715) (9.16902)
R2 = 83.2 , (YNDt+1 = 4000) El Intervalo de Confianza para el valor promedio es: dado: t19-2,0.05/2=2.093 Entonces: [2784.5 2.093(78.68)] = [261982, 294917]