1 / 37

Econometria Aula 2 – 20/9/2013

Econometria Aula 2 – 20/9/2013. Exemplo da técnica MQO Hipóteses do Modelo de RLM Ajuste do Modelo Modelo Restrito. Econometria. Exemplo da técnica MQO. MQO. MQO. Resíduos. Resíduos MQO. MQO. M = I- X(X’X) -1 X’. MQO. Econometria. Exemplo da técnica MQO

jens
Download Presentation

Econometria Aula 2 – 20/9/2013

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. EconometriaAula 2 – 20/9/2013 Exemplodatécnica MQO Hipóteses do Modelo de RLM Ajuste do Modelo ModeloRestrito

  2. Econometria Exemplodatécnica MQO

  3. MQO

  4. MQO

  5. Resíduos

  6. Resíduos MQO

  7. MQO M = I- X(X’X)-1X’

  8. MQO

  9. Econometria Exemplodatécnica MQO Modelo de Regressão Linear Múltipla

  10. O Modelo • Utilizadoparaestudar a relação entre umavariáveldependente e umaoumaisvariáveisindependentes. • Forma genérica do modelo de regressão linear: y = f(x1,x2,…,xK,1,2,…K) + ε = x11 + x22 + … + xKK + ε • f(x1,x2,…,xK,1,2,…K) é a equação de regressãopopulacional de y emx1,x2,…,xK . • Y é o regressando • x1,x2,…,xKregressoresoucontroles • ε é o distúrbio aleatório

  11. Exemplo • Função de consumo keynesiana • Não existe uma relação determinística entre consumo e renda. • C = f(X, ε) • Onde ε é o elemento estocástico • Como incorporar este elemento estocástico ao modelo? De forma aditiva: • C = α + βX + ε • Contrapartida empírica do modelo teórico de Keynes.

  12. Exemplo

  13. Exemplo • A reta do gráfico anterior é distorcida pelo racionamento do período de guerra. • Especificação mais apropriada: acomodar a natureza estocástica do dado e as circunstâncias especiais dos anos 1942-1945. • Dummy que identifica este período

  14. Estimando o modelo de consumo Standard errors in parentheses *** p<0.01, ** p<0.05, * p<0.1

  15. Hipóteses do modelo A.1. Linearidadesignifica ser linear nosparâmetros. A.2. Identificação:Sóexiste um únicoconjunto de parâmetrosqueproduz E[y|x]. A.3. Médiacondicional zero A.4. Forma damatriz de variânciacovariância A.5. Geração dos dados A.6. Hipótesessobre a distribuição de probabilidade.

  16. Linearidade do Modelo • f(x1,x2,…,xK,1,2,…K) = x11 + x22 + … + xKK • Notação: x11 + x22 + … + xKK = x. • E[y|x] = 1*1 + 2*x2 + … + K*xK. (1*1 = intercepto).

  17. Linearidade • Modelo linear simples, E[y|x]=x’β • Modelo Quadrático: E[y|x]= α + β1x+ β2x2 • Modelo Loglinear, E[lny|lnx]= α + Σk lnxkβk • Modelo Semilog, E[y|x]= α + Σk lnxkβk • Modelo Translog: E[lny|lnx]= α + Σk lnxkβk + (1/2) Σk Σl δkl lnxk lnxl Todos modelos são lineares e existe um infinito número de variações de modelos lineares.

  18. Linearidade • Linearidade significa ser linear nos parâmetros, não nas variáveis • E[y|x] = 1 f1(…) + 2 f2(…) + … + K fK(…). fk() pode ser qq função dos dados. • Exemplos: • Logs • Variáveis Dummy • Funções quadráticas, interações, etc.

  19. Unicidade da média condicional A relação da média condicional pode ser válida para qualquer conjunto de n observações, i = 1,…,n. Se nK E[y1|x] = x1 E[y2|x] = x2 … E[yn|x] = xn Para todas n observações temos que : E[y|X] = X = E.

  20. Unicidade de E[y|X] Suponhaqueexista um queproduz o mesmo valor esperado, E[y|X] = X = E. Se  =  - . Temosque: X = X - X = E - E = 0. Isto é possível? X é umamatriznK. O quesignificaX= 0? Porhipótese, istonão é possível. Hipótese de ‘postocheio’ – hipótese de ‘identificação’. Podemos ‘estimar’  com nK .

  21. Dependência Linear • Exemplo: x = [i , renda não trabalho, renda do trabalho, renda total] Não existe dependência linear: Nenhuma variável pode ser escrita como uma função linear de outras variáveis do modelo. Condição de identificação. A teoria não necessariamente elimina a possibilidade de dependência linear, contudo, é importante para fazer a estimação possível. y = 1 + 2N + 3S + 4T + , onde T = N+S. y = 1 + (2+a)N + (3+a)S + (4-a)T +  para qualquer a, = 1 + 2N + 3S + 4T + . • O que está sendo estimado…? • Não eliminamos a possibilidade de dependência não linear. Ex: x e x2.

  22. Média condicional zero O y observadoé igual a E[y|x] + variável aleatória. y = E[y|x] +  (distúrbio) • Existe alguma informação sobre  em x? Ou seja, algum movimento em x dá informação sobre ? Caso sim, não especificamos corretamente a média condicional, a função ‘E[y|x]’ não é a média condicional (não é a regressão populacional) • Existe informação sobre  em outras variáveis. Se E[|x]  0 segue que Cov[,x]  0. • Violação da hipótese de ‘independência’

  23. Média condicional zero • E[|todos dados em X] = 0 • E[|X] = 0 é mais forte que E[i | xi] = 0 • O segundo diz que o conhecimento de xinão dá nenhuma informação sobre a média de i. • O primeiro diz que nenhum xj dá informação sobre o valor esperado de I. • “nenhuma informação” é similar a nenhuma correlação.

  24. Homocedasticidade e não Autocorrelação • Var[|X] = 2I. • Var[] = 2I? Prova: Var[] = E[Var[|X]] + Var[E[|X]].

  25. DistribuiçãoNormal de ε • Usada para facilitar as derivações de estatísticas de testes em amostras finitas. • Derivação das distribuições exatas das estatísticas t, F.

  26. O Modelo Linear • y = X+ε, N observações, K colunas em X, incluindo a coluna de um. • Hipóteses sobre X • Hipóteses sobre ε|X • E[ε|X]=0, E[ε]=0 and Cov[ε,x]=0 • Regressão? • Se E[y|X] = X • Aproximação: projeção linear.

  27. Ajuste da Regressão • “Variação:” No contexto do “modelo” , significa a variação de uma variável como resultado do movimento de outra variável • Variação total = yM0y = • M0 = I – i(i’i)-1i’ = transforma uma matriz em desvios com relação a média.

  28. Decomposição da Variação de y Decomposição: y = Xb + e M0y = M0Xb + M0e = M0Xb + e. (Desvios com relação à média. M0e = e ) yM0y = b(X’ M0)(M0X)b + ee = bXM0Xb + ee. (e’ M0X = e’X = 0.) Uma das colunas de X é i. Soma quadrado total = Soma quadrado da regressão (SSR)+Soma quadrado dos resíduos (SSE)

  29. Medida de ajuste R2 = bXM0Xb/yM0y = R2 é limitado a zero e um sss: (a) Existe um termo constante em X e (b) O método utilizado é o MQO.

  30. Adicionando variáveis • R2 nunca é reduzido quando uma variável z é adicionada na regressão:

  31. Adicionando variáveis ao modelo

  32. Adicionando variáveis ao modelo

  33. R2 ajustado = 1 - [(n-1)/(n-K)](1 - R2) • inclui uma penalidade para variáveis que não acrescentam muito ao ajuste do modelo. Pode cair quando uma variável é incluída no modelo.

  34. R2 ajustado O que está sendo ajustado? Penalidade por estar inserindo mais variáveis explicativas. = 1 - [ee/(n – K)]/[yM0y/(n-1)] = 1 – [(n-1)/(n-K)(1 – R2)]

  35. Transformações lineares dos dados • Como uma transformação linear pode afetar os resultados derivados do MQO? • Com base em X, b = (XX)-1X’y. • Os coeficientes de y regredido em Z são c = P -1b • “Valor predito” é Zc = XPP-1b = Xb. O mesmo!! • Resíduos: y - Zc = y - Xb . Os mesmos!! • Soma quadrado dos resíduos – idêntica y-Xb = e = y-Zc. • R2 será igual pois R2 = 1 - ee/y’M0y (!!).

  36. Transformação Linear • Xb é a projeção de y no espaço coluna de X. Zc é a projeção de y no espaço coluna de Z. Mas, como as colunas de Z são simplesmente combinações linearers das de X, o espaço coluna de Z deve ser idêntico ao de X. Consequentemente, a projeção de y em Z será igual a em X. • Quais implicações práticas deste resultado? • Transformação não afeta o ajuste do modelo. • Transformação afeta as “estimativas.” Se b é uma estimativa de , c não pode ser a estimativa de  - será a estimativa de P-1.

More Related