330 likes | 512 Views
Analise de Regressão. Parte 2. Interpretando Valores. Um valor de Y conhecendo X!. Y. X. Y. Y. Interpretando Valores. Y. X. Y i (valor real). *. Y. Interpretando Valores e os Ruídos. Y. ^. X. Y i (valor real). *. ^. Y i (valor estimado ). Y. Y = b 0 + b 1 X.
E N D
Analise de Regressão Parte 2
Interpretando Valores Um valor de Y conhecendo X! Y X
Y Y Interpretando Valores Y X
Yi(valor real) * Y Interpretando Valores e os Ruídos Y ^ X
Yi(valor real) * ^ Yi (valor estimado) Y Y = b0 + b1X Interpretando os Valores e os Ruídos Y Esta equação vai “procurar” passar no meio das distribuições para os possíveis valores de Y a partir de um dado valor X ^ X
Yi(valor real) ^ Yi * ^ Y Yi - Yi (valor estimado) ^ Yi - Yi - Y Y Y = b0 + b1X Interpretando os Ruídos! Y ^ X
Y Yi - ^ Yi - Yi - Y ^ Yi Interpretando os ruídos / resíduos Resíduo Global ou Variação Total em Y Se elevar ao Quadrado e considerar o somatório de todos os possíveis valores obtenho o que se chama de SQDy – Variação Total em Y Variação de Y explicada pela regressão. Se elevar ao Quadrado e considerar o somatório de todos os possíveis valores obtenho o que se chama de SQRegressão – Variação de Y explicada pela regressão Variação de Y Não explicada pela regressão. Se elevar ao Quadrado e considerar o somatório de todos os possíveis valores obtenho o que se chama de SQResíduo – Variação de Y não explicada pela regressão
Yi(valor real) ^ Yi * ^ Y Yi - Yi (valor estimado) ^ Yi - Yi - Y Y Y = b0 + b1X Interpretando os Ruídos Y ^ X
Inclinação Populacional Intercepto Populacional Variável Independente Yi Variável Dependente Yi=0+1Xi +i Y i Erro Aleatório Y = E(Y) = 0 + 1 X 1 Coeficiente angular b0 X Modelo de Regressão Linearmais simples?!! Ŷi=b0+b1Xi i =Yi-Ŷi Modelo estimado Resíduo
Como? De onde surgiu? MMQO Método dos Mínimos Quadrados Ordinários
Yi Y i Y = E(Y) = 0 + 1 X 1 Coeficiente angular b0 X MMQO
MMQO Para se encontrar o mínimo para uma equação, deve-se derivá-la em relação à “variável” de interesse e igualá-la a zero. A sua derivada segunda deverá, obviamente, ser positiva, o que no caso sempre ocorrerá, por se tratar de uma soma de quadrados. Derivando então a expressão (1) em relação aos parâmetros e igualando-as a zero, poderemos obter duas equações que, juntas, vão compor o chamado sistemas de equações normais. A solução desse sistema fornecerá:
Podemos extrapolar: isto é tentar avaliar previsões para fora do intervalo observado para os dados Erro Padrão da Estimativa: É a medida de variabilidade em torno da linha de regressão (isto é, o seu desvio padrão). e = 1602,0971;
Medidas de Variação na Regressão e na Correlação • Utilidade: • Verificar se a variável independente prevê bem a variável dependente no modelo estatístico utilizado! • Soma Total de Quadrados (STQ) • Coeficiente de Determinação • Coeficiente de Correlação Linear
Pressupostos da Regressão e da Correlação • Normalidade • Afeta as inferências sobre os valores dos coeficientes de regressão. • Homocedasticidade • Afeta a forma de cálculo dos coeficientes de regressão • Independência de Erros • Aplica-se, em especial, a valores coletados ao longo de um período de tempo. • Linearidade • O modelo utilizado não é adequado.
0 X 0 X Erros Correlacionados Análise dos Resíduos
Estimativas de Intervalo de Confiança • (valor médio) • Efeito Banda de Confiança
Inferências sobre os Parâmetros: REGRESSÃO e CORRELAÇÃO Testes de hipótese sobre o valor de 1. Testes de hipótese sobre o valor de .
Testes de hipótese sobre o valor de 1 • Hipóteses: • Nula H0: 1 = 0 (não existe relação) • Alternativa H1: 1 0 (existe uma relação) • Determinar o nível de significância do teste () • Calcular a estatística do teste • Comparar Região de Rejeição com a estatística do teste (Tabela da distribuição t com n-2 graus de liberdade) • Concluir
Testes de hipótese sobre o valor de • Hipóteses: • Nula H0: = 0 (não existe correlação) • Alternativa H1: 0 (existe correlação) • Determinar o nível de significância do teste () • Calcular a estatística do teste • Comparar Região de Rejeição com a estatística do teste (Tabela da distribuição t com n-2 graus de liberdade) • Concluir