110 likes | 245 Views
Revisão. Premissa: seja y e x duas variáveis representando alguma população, deseja-se explicar y em termos de x. Ex: y=salário hora e x=anos de escolaridade Questões: Dado que nunca há uma relação exata entre x e y, como considerar outros fatores que afetam y?
E N D
Revisão Premissa: seja y e x duas variáveis representando alguma população, deseja-se explicar y em termos de x. Ex: y=salário hora e x=anos de escolaridade Questões: • Dado que nunca há uma relação exata entre x e y, como considerar outros fatores que afetam y? • Qual a relação funcional entre y e x? • Captura-se uma relação ceteris paribus entre y e x? As ambiguidades são resolvidas através da equação do modelo linear simples: Y=βo+ β1x+u
Respostas: • Através do termo de erro, ou seja, fatores que não são observados e que afetam y, além de x. • Se os outros fatores em u são mantidos fixos, Δu=0, então x tem um efeito linear sobre y: Δy= β1Δx se Δu=0, ode β1 é o parâmetro de inclinação. A linearidade implica que uma variação de 1 unid. Em x tem o mesmo efeito sobre y, independente do valor inicial de x. • Para obter conclusões ceteris paribus sobre como x afeta y é preciso fazer uma hipótese que restrinja a maneira como u está relacionado com x, e assim obter estimadores confiáveis de βo e β1 de uma amostra aleatória.
Hipótese sobre u: Se βo está na equação, nada se perde ao assumir que : E(u)=0. Isto é, faz-se uma afirmação sobre a distribuição dos fatores não-observáveis na população. Ex: a média da aptidão é zero para as pessoas que trabalham. De qualquer forma, há sempre a possibilidade de redefinir βo para tornar E(u)=0 verdadeiro. Hipótese da média condicional zero: Como u e x são VA’s, então pode-se obter o valor esperado de u condicionado a qualquer valor de x. A hipótese crucial é que o valor médio de u não depende do valor de x, ie: E(u|x)= E(u)=0 Para qualquer x, a média dos valores não-observáveis é a mesma, e assim, deve igualar-se ao valor médio de u na população. Ex:características da terra e quantidade de fertilizante.
Função de regressão populacional Considere o valor esperado de Y=βo+ β1x+u condicionado a x e usando E(u|x)= 0. Então: E(y|x)= βo+ β1x E(y|x) é uma função linear de x. Para um certo valor x, a distribuição de y estará centrada ao redor de E(y|x).
(Wooldridge, exercício 2.1) 1. Seja filhos o número de filhos de uma mulher e educ os anos de educação da mulher. Um modelo simples que relaciona a fertilidade a anos de educação é: filhos = β0 + β1.educ + u , em que u é um erro não-observável. (a) Que tipos de fatores podem estar incluídos em u? É provável que estejam correlacionados com o nível de educação? Explique. (b) Uma análise de regressão simples mostrará o efeito ceteris paribus da educação sobre a fertilidade? Explique.
Mínimos quadrados ordinários Considere {(xi,yi): i=1,2,...,n} como uma amostra aleatória de tamanho n da população. Podemos escrever: yi=βo+ β1xi+ui Defina, para qualquer boe b1 , um valor estimado para y quando x=xi, tal como: ŷi=bo+ b1xi Esse é o valor que se prevê para y quando x=xi. Há um valor estimado para cada observação da amostra, assim, o resíduo para a observação i é a diferença entre o valor verdadeiro de yi e seu valor estimado: ûi=yi-ŷi=yi-bo- b1xi A ideia é escolher boe b1 que tornam a soma dos resíduos quadrados mínima: Min Σûi²
Uma vez determinados os estimadores, construímos a reta de regressão de MQO: ŷi=bo+ b1xi
Propriedades algébricas das estatísticas de MQO • A soma, e portanto a média amostral, soa resíduos de MQO, é zero. (resulta da CPO) Σûi²=0 (2) A covariância amostral entre os regressores e o resíduo de MQO é zero. (resulta da CPO) Σxiûi=0 (3) O ponto( ) sempre está sobre a reta de regressão de MQO.
Defina: SQT SQE SQR SQT é uma medida da variação amostral total em yi. Se a dividirmos por n-1 obteremos a variância amostral de y. SQE mede a variação amostral em ŷi (sendo ) e SQR mede a variação amostral em ûi. Assim: SQT=SQE+SQR Grau de ajuste (R²)= SQE/SQT=1-SQR/SQT R² está sempre entre 0 e 1 e é igual ao coeficiente de correlação amostral entre yi eŷi.