120 likes | 237 Views
Aula 7. Introdução ao Stata Análise de especificação 10 de maio de 2013. Regressão Linear: comparação de modelos. Coeficiente de determinação: R 2 não ajustado
E N D
Aula 7 Introdução ao Stata Análise de especificação 10 de maio de 2013
Regressão Linear: comparação de modelos • Coeficiente de determinação: R2 não ajustado • Quando elevamos o numero de regressores na equação, o valor do R2 não ajustado se eleva - um modelo com maior número de variáveis independentes é melhor do que um modelo com menor número de variáveis independentes. • Esta conclusão pode ser espúria porque podemos estar adicionando variáveis sem sentido (nonsense) ao modelo restrito. • Qualquer variável acrescentada (mesmo que nonsense) estará elevando o valor do R2 não ajustado.
Regressão Linear: comparação de modelos • R2 ajustado: não afetado pelo numero de variáveis. • A adição do regressor eleva o R2 não ajustado apenas quando este é linearmente independente em relação às colunas previas da matriz X. Ou seja, não existe problema de multicolinearidade.
Ajuste do modelo Source | SS df MS Numberofobs = 2955 -------------+------------------------------ F( 7, 2947) = 124.98 Model | 1264.72124 7 180.674463 Prob > F = 0.0000 Residual | 4260.16814 2947 1.44559489 R-squared = 0.2289 -------------+------------------------------ AdjR-squared = 0.2271 Total | 5524.88938 2954 1.87030785 Root MSE = 1.2023 ------------------------------------------------------------------------------ ltotexp | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- suppins | .2556428 .0462264 5.53 0.000 .1650034 .3462821 phylim | .3020598 .0569709 5.30 0.000 .190353 .4137666 actlim | .3560054 .0621118 5.73 0.000 .2342185 .4777923 totchr | .3758201 .0184227 20.40 0.000 .3396974 .4119429 age | .0038016 .0036561 1.04 0.299 -.0033672 .0109705 female | -.0843275 .0455442 -1.85 0.064 -.1736292 .0049741 income | .0025498 .0010194 2.50 0.012 .000551 .0045486 _cons | 6.703737 .27676 24.22 0.000 6.161075 7.2464 ------------------------------------------------------------------------------ .
Modelos aninhados e não aninhados • Modelos nested (aninhados): as variáveis independentes do primeiro modelo formam um subconjunto das variáveis independentes do primeiro modelo. • Modelos não nested (não aninhados): os parâmetros (e variáveis) do primeiro modelo não estão contidos no conjunto de parâmetros (e variáveis) do segundo modelo (e vice-versa). • Em suma, modelos nested são aqueles que podem ser obtidos a partir da simples inclusão de variáveis no primeiro modelo para obter o seguinte modelo.
aninhado Não aninhado
Comparação de modelos • Modelos não aninhados (abordagem não estatística): • olhar coeficiente de determinação e R2 ajustado: saem do lado esquerdo da saída da regressão. • Olhar os valores dos critérios: AIC (Akaike), BIC (Critério Bayesiano ou Schwarz ). • Consideram o ajuste e a parcimônia. Comando no Stata: estatic
Comando ic • O grau para o qual o modelo ajustado melhora em relação ao modelo nulo na explicação da variável dependente é medido pelo maior valor (em termos absolutos) do ll(model) em comparação com o ll(null). • BIC • AIC
Comparação de modelos • Abordagem Estatística: testes de comparação modelos restrito e irrestrito (distância de Wald).
Sobreespecificação do modelo • Inclusão de variáveis irrelevantes no modelo de regressão. • Não altera o fato de que os estimadores dos parâmetros das variáveis relevantes continuam sendo não viesados. • Pode causar efeitos indesejáveis nas variâncias dos estimadores OLS. • Diferente de subespecificação do modelo (omissão de variáveis relevantes!)
Multicolinearidade • Multicolinearidade perfeita: um dos regressores é uma combinação linear de outros regressores – impede solução do MQO. • Quase multicolinearidade: o ajuste da regressão pode ser bom mas os coeficientes podem ter erros padrões muito altos, sinais ou magnitudes incorretas. • Teste vif (varianceinfluencefactor): quando um regressor não é ortogonal a outros regressores a variância do respectivo parâmetro fica inflacionada.