422 likes | 1.1k Views
Distribuições Bidimensionais. MACS Distribuições Bidimensionais (Ano 1). A análise de correlação é o instrumento estatístico que permite estudar relações quantitativas. A correlação exprime a forma /a força de ligação das variáveis.
E N D
Distribuições Bidimensionais MACS Distribuições Bidimensionais (Ano 1)
A análise de correlação é o instrumento estatístico que permite estudar relações quantitativas. A correlação exprime a forma /a força de ligação das variáveis. Num extremo podemos ter relações funcionais perfeitas e no outro extremo ter a ausência de correlação. Ao fazer uma análise de regressão, estudam-se as relações existentes entre fenómenos, quando são feitas observações de duas ou mais variáveis, através das suas distribuições. Quando se observam somente duas variáveis, a distribuição diz-se bidimensional. Regressão e Correlação
Relação entre preço e produção de batatas: em média, quanto maior a produção, menor o preço e vice-versa. Relação entre idade do marido e da esposa: em média, quanto maior a idade da esposa, maior a idade do marido. Relação entre número de horas de estudo e notas dos alunos de uma turma na disciplina, de matemática: em média, quanto maior o número de horas de estudo, maior o valor da nota obtida. Exemplos
A correlação pode ser: Correlação Simples entre duas variáveis Correlação Múltipla entre mais do que duas variáveis Correlação Positiva as duas variáveis variam no mesmo sentido Correlação Negativa a relação entre as duas variáveis é inversa Correlação Linear os pontos ajustam-se a uma linha recta Correlação não linear os pontos ajustam-se a uma linha com outra forma (por exemplo, regressão quadrática, os pontos ajustam-se a uma parábola) Correlação
Exemplo Considere-se o conjunto de observações de duas variáveis X e Y: Considere a relação entre salário e tempo de serviço, de dez operários:
Diagrama de dispersão Construamos o diagrama de dispersão - representação gráfica de duas variáveis, em que cada par de dados (xi, yi), é representado por um ponto de coordenados (xi , yi), num sistema de eixos coordenados. Utilizando o exemplo anterior, temos: Podemos usar a folha de cálculo Excel ou a máquina de calcular gráfica, para fazer estas representações.
Diagrama de dispersão (cont.) Pela análise do diagrama de dispersão, pode-se concluir, empiricamente, se o grau de correlação linear entre as variáveis é forte ou fraco, conforme o modo como se situam os pontos em redor de uma recta. Esta recta, empiricamente, constrói-se de modo que os pontos de ajustem o melhor possível a ela. A correlação é tanto maior quanto mais os pontos se concentrem, com pequenos desvios, em relação a essa recta.
Exemplos Correlação positiva forte Correlação negativa forte Não existe correlação Correlação positiva fraca Correlação negativa fraca
Exercício Estude a relação entre os quilómetros que um carro apresenta e a sua valorização ao longo dos anos de uso. Considere a seguinte tabela:
Coeficiente de correlação (linear) O coeficiente de correlação permite-nos quantificar a existência ou não de correlação linear. Para se quantificar esta correlação, Pearson, propôs o seguinte cálculo: Podemos utilizar a máquina de calcular gráfica ou a folha de cálculo Excel para calcular este coeficiente. Prova-se que: 1 r 1
Coeficiente de correlação Pode-se utilizar a seguinte escala, para avaliar a intensidade da correlação:
Recta de regressão Existindo correlação linear, os pontos podem ser ajustados através de uma recta, obtendo-se uma expressão do tipo y = a x + b. Iremos determinar esta recta recorrendo à máquina de calcular gráfica e à folha de cálculo Excel.
Folha de cálculo Excel No documento “Texto de apoio n.º 2 – Regressão e correlação com o Excel“ (no mesmo local deste documento), indica-se como construir um gráfico de dispersão e calcular a recta de regressão, bem como o coeficiente de Pearson em dados bivariado, utilizando a folha de cálculo Excel.
Exercícios 1. Um professor decidiu averiguar, junto dos seus alunos, qual a relação entre o número de faltas às aulas da sua disciplina e o número de horas semanais de estudo. Elaborou o seguinte quadro: 1.1 Represente, num sistema de eixos, o conjunto de pontos (x,y), correspondente a: (número de faltas, nº de horas semanais de estudo) 1.2 Indique os tipos de correlação e interprete os dados (resultados). 1.3 Determine a recta de regressão e indique o coeficiente de correlação
Exercícios 2. Os coeficientes de correlação correspondentes a cada uma das distribuições representadas são: -0,01; -0,86 e 0,89. Observe-as cuidadosamente e faça corresponder a cada uma delas o seu coeficiente de correlação: B C A