390 likes | 599 Views
Econometria Aula 2 – 20/9/2013. Exemplo da técnica MQO Hipóteses do Modelo de RLM Ajuste do Modelo Modelo Restrito. Econometria. Exemplo da técnica MQO. MQO. MQO. Resíduos. Resíduos MQO. MQO. M = I- X(X’X) -1 X’. MQO. Econometria. Exemplo da técnica MQO
E N D
EconometriaAula 2 – 20/9/2013 Exemplodatécnica MQO Hipóteses do Modelo de RLM Ajuste do Modelo ModeloRestrito
Econometria Exemplodatécnica MQO
MQO M = I- X(X’X)-1X’
Econometria Exemplodatécnica MQO Modelo de Regressão Linear Múltipla
O Modelo • Utilizadoparaestudar a relação entre umavariáveldependente e umaoumaisvariáveisindependentes. • Forma genérica do modelo de regressão linear: y = f(x1,x2,…,xK,1,2,…K) + ε = x11 + x22 + … + xKK + ε • f(x1,x2,…,xK,1,2,…K) é a equação de regressãopopulacional de y emx1,x2,…,xK . • Y é o regressando • x1,x2,…,xKregressoresoucontroles • ε é o distúrbio aleatório
Exemplo • Função de consumo keynesiana • Não existe uma relação determinística entre consumo e renda. • C = f(X, ε) • Onde ε é o elemento estocástico • Como incorporar este elemento estocástico ao modelo? De forma aditiva: • C = α + βX + ε • Contrapartida empírica do modelo teórico de Keynes.
Exemplo • A reta do gráfico anterior é distorcida pelo racionamento do período de guerra. • Especificação mais apropriada: acomodar a natureza estocástica do dado e as circunstâncias especiais dos anos 1942-1945. • Dummy que identifica este período
Estimando o modelo de consumo Standard errors in parentheses *** p<0.01, ** p<0.05, * p<0.1
Hipóteses do modelo A.1. Linearidadesignifica ser linear nosparâmetros. A.2. Identificação:Sóexiste um únicoconjunto de parâmetrosqueproduz E[y|x]. A.3. Médiacondicional zero A.4. Forma damatriz de variânciacovariância A.5. Geração dos dados A.6. Hipótesessobre a distribuição de probabilidade.
Linearidade do Modelo • f(x1,x2,…,xK,1,2,…K) = x11 + x22 + … + xKK • Notação: x11 + x22 + … + xKK = x. • E[y|x] = 1*1 + 2*x2 + … + K*xK. (1*1 = intercepto).
Linearidade • Modelo linear simples, E[y|x]=x’β • Modelo Quadrático: E[y|x]= α + β1x+ β2x2 • Modelo Loglinear, E[lny|lnx]= α + Σk lnxkβk • Modelo Semilog, E[y|x]= α + Σk lnxkβk • Modelo Translog: E[lny|lnx]= α + Σk lnxkβk + (1/2) Σk Σl δkl lnxk lnxl Todos modelos são lineares e existe um infinito número de variações de modelos lineares.
Linearidade • Linearidade significa ser linear nos parâmetros, não nas variáveis • E[y|x] = 1 f1(…) + 2 f2(…) + … + K fK(…). fk() pode ser qq função dos dados. • Exemplos: • Logs • Variáveis Dummy • Funções quadráticas, interações, etc.
Unicidade da média condicional A relação da média condicional pode ser válida para qualquer conjunto de n observações, i = 1,…,n. Se nK E[y1|x] = x1 E[y2|x] = x2 … E[yn|x] = xn Para todas n observações temos que : E[y|X] = X = E.
Unicidade de E[y|X] Suponhaqueexista um queproduz o mesmo valor esperado, E[y|X] = X = E. Se = - . Temosque: X = X - X = E - E = 0. Isto é possível? X é umamatriznK. O quesignificaX= 0? Porhipótese, istonão é possível. Hipótese de ‘postocheio’ – hipótese de ‘identificação’. Podemos ‘estimar’ com nK .
Dependência Linear • Exemplo: x = [i , renda não trabalho, renda do trabalho, renda total] Não existe dependência linear: Nenhuma variável pode ser escrita como uma função linear de outras variáveis do modelo. Condição de identificação. A teoria não necessariamente elimina a possibilidade de dependência linear, contudo, é importante para fazer a estimação possível. y = 1 + 2N + 3S + 4T + , onde T = N+S. y = 1 + (2+a)N + (3+a)S + (4-a)T + para qualquer a, = 1 + 2N + 3S + 4T + . • O que está sendo estimado…? • Não eliminamos a possibilidade de dependência não linear. Ex: x e x2.
Média condicional zero O y observadoé igual a E[y|x] + variável aleatória. y = E[y|x] + (distúrbio) • Existe alguma informação sobre em x? Ou seja, algum movimento em x dá informação sobre ? Caso sim, não especificamos corretamente a média condicional, a função ‘E[y|x]’ não é a média condicional (não é a regressão populacional) • Existe informação sobre em outras variáveis. Se E[|x] 0 segue que Cov[,x] 0. • Violação da hipótese de ‘independência’
Média condicional zero • E[|todos dados em X] = 0 • E[|X] = 0 é mais forte que E[i | xi] = 0 • O segundo diz que o conhecimento de xinão dá nenhuma informação sobre a média de i. • O primeiro diz que nenhum xj dá informação sobre o valor esperado de I. • “nenhuma informação” é similar a nenhuma correlação.
Homocedasticidade e não Autocorrelação • Var[|X] = 2I. • Var[] = 2I? Prova: Var[] = E[Var[|X]] + Var[E[|X]].
DistribuiçãoNormal de ε • Usada para facilitar as derivações de estatísticas de testes em amostras finitas. • Derivação das distribuições exatas das estatísticas t, F.
O Modelo Linear • y = X+ε, N observações, K colunas em X, incluindo a coluna de um. • Hipóteses sobre X • Hipóteses sobre ε|X • E[ε|X]=0, E[ε]=0 and Cov[ε,x]=0 • Regressão? • Se E[y|X] = X • Aproximação: projeção linear.
Ajuste da Regressão • “Variação:” No contexto do “modelo” , significa a variação de uma variável como resultado do movimento de outra variável • Variação total = yM0y = • M0 = I – i(i’i)-1i’ = transforma uma matriz em desvios com relação a média.
Decomposição da Variação de y Decomposição: y = Xb + e M0y = M0Xb + M0e = M0Xb + e. (Desvios com relação à média. M0e = e ) yM0y = b(X’ M0)(M0X)b + ee = bXM0Xb + ee. (e’ M0X = e’X = 0.) Uma das colunas de X é i. Soma quadrado total = Soma quadrado da regressão (SSR)+Soma quadrado dos resíduos (SSE)
Medida de ajuste R2 = bXM0Xb/yM0y = R2 é limitado a zero e um sss: (a) Existe um termo constante em X e (b) O método utilizado é o MQO.
Adicionando variáveis • R2 nunca é reduzido quando uma variável z é adicionada na regressão:
R2 ajustado = 1 - [(n-1)/(n-K)](1 - R2) • inclui uma penalidade para variáveis que não acrescentam muito ao ajuste do modelo. Pode cair quando uma variável é incluída no modelo.
R2 ajustado O que está sendo ajustado? Penalidade por estar inserindo mais variáveis explicativas. = 1 - [ee/(n – K)]/[yM0y/(n-1)] = 1 – [(n-1)/(n-K)(1 – R2)]
Transformações lineares dos dados • Como uma transformação linear pode afetar os resultados derivados do MQO? • Com base em X, b = (XX)-1X’y. • Os coeficientes de y regredido em Z são c = P -1b • “Valor predito” é Zc = XPP-1b = Xb. O mesmo!! • Resíduos: y - Zc = y - Xb . Os mesmos!! • Soma quadrado dos resíduos – idêntica y-Xb = e = y-Zc. • R2 será igual pois R2 = 1 - ee/y’M0y (!!).
Transformação Linear • Xb é a projeção de y no espaço coluna de X. Zc é a projeção de y no espaço coluna de Z. Mas, como as colunas de Z são simplesmente combinações linearers das de X, o espaço coluna de Z deve ser idêntico ao de X. Consequentemente, a projeção de y em Z será igual a em X. • Quais implicações práticas deste resultado? • Transformação não afeta o ajuste do modelo. • Transformação afeta as “estimativas.” Se b é uma estimativa de , c não pode ser a estimativa de - será a estimativa de P-1.