1 / 12

Aula 7

Aula 7. Introdução ao Stata Análise de especificação 10 de maio de 2013. Regressão Linear: comparação de modelos. Coeficiente de determinação: R 2 não ajustado

weylin
Download Presentation

Aula 7

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Aula 7 Introdução ao Stata Análise de especificação 10 de maio de 2013

  2. Regressão Linear: comparação de modelos • Coeficiente de determinação: R2 não ajustado • Quando elevamos o numero de regressores na equação, o valor do R2 não ajustado se eleva - um modelo com maior número de variáveis independentes é melhor do que um modelo com menor número de variáveis independentes. • Esta conclusão pode ser espúria porque podemos estar adicionando variáveis sem sentido (nonsense) ao modelo restrito. • Qualquer variável acrescentada (mesmo que nonsense) estará elevando o valor do R2 não ajustado.

  3. Regressão Linear: comparação de modelos • R2 ajustado: não afetado pelo numero de variáveis. • A adição do regressor eleva o R2 não ajustado apenas quando este é linearmente independente em relação às colunas previas da matriz X. Ou seja, não existe problema de multicolinearidade.

  4. Ajuste do modelo Source | SS df MS Numberofobs = 2955 -------------+------------------------------ F( 7, 2947) = 124.98 Model | 1264.72124 7 180.674463 Prob > F = 0.0000 Residual | 4260.16814 2947 1.44559489 R-squared = 0.2289 -------------+------------------------------ AdjR-squared = 0.2271 Total | 5524.88938 2954 1.87030785 Root MSE = 1.2023 ------------------------------------------------------------------------------ ltotexp | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- suppins | .2556428 .0462264 5.53 0.000 .1650034 .3462821 phylim | .3020598 .0569709 5.30 0.000 .190353 .4137666 actlim | .3560054 .0621118 5.73 0.000 .2342185 .4777923 totchr | .3758201 .0184227 20.40 0.000 .3396974 .4119429 age | .0038016 .0036561 1.04 0.299 -.0033672 .0109705 female | -.0843275 .0455442 -1.85 0.064 -.1736292 .0049741 income | .0025498 .0010194 2.50 0.012 .000551 .0045486 _cons | 6.703737 .27676 24.22 0.000 6.161075 7.2464 ------------------------------------------------------------------------------ .

  5. Modelos aninhados e não aninhados • Modelos nested (aninhados): as variáveis independentes do primeiro modelo formam um subconjunto das variáveis independentes do primeiro modelo. • Modelos não nested (não aninhados): os parâmetros (e variáveis) do primeiro modelo não estão contidos no conjunto de parâmetros (e variáveis) do segundo modelo (e vice-versa). • Em suma, modelos nested são aqueles que podem ser obtidos a partir da simples inclusão de variáveis no primeiro modelo para obter o seguinte modelo.

  6. aninhado Não aninhado

  7. Comparação de modelos • Modelos não aninhados (abordagem não estatística): • olhar coeficiente de determinação e R2 ajustado: saem do lado esquerdo da saída da regressão. • Olhar os valores dos critérios: AIC (Akaike), BIC (Critério Bayesiano ou Schwarz ). • Consideram o ajuste e a parcimônia. Comando no Stata: estatic

  8. Comando ic • O grau para o qual o modelo ajustado melhora em relação ao modelo nulo na explicação da variável dependente é medido pelo maior valor (em termos absolutos) do ll(model) em comparação com o ll(null). • BIC • AIC

  9. Comparação de modelos • Abordagem Estatística: testes de comparação modelos restrito e irrestrito (distância de Wald).

  10. Sobreespecificação do modelo • Inclusão de variáveis irrelevantes no modelo de regressão. • Não altera o fato de que os estimadores dos parâmetros das variáveis relevantes continuam sendo não viesados. • Pode causar efeitos indesejáveis nas variâncias dos estimadores OLS. • Diferente de subespecificação do modelo (omissão de variáveis relevantes!)

  11. Multicolinearidade • Multicolinearidade perfeita: um dos regressores é uma combinação linear de outros regressores – impede solução do MQO. • Quase multicolinearidade: o ajuste da regressão pode ser bom mas os coeficientes podem ter erros padrões muito altos, sinais ou magnitudes incorretas. • Teste vif (varianceinfluencefactor): quando um regressor não é ortogonal a outros regressores a variância do respectivo parâmetro fica inflacionada.

  12. O maior vif não pode ser maior que 10

More Related