E N D
INTRODUÇÃO À ESTATÍSTICAAPLICADA Definição: Técnica de recolha, organização, sintetização e apresentação de dados numéricos (E. descritiva). Compreende, ainda, as técnicas por meio das quais são tomadas decisões sobre uma população, baseadas unicamente na observação de amostras , pelo uso de conceito de probabilidade (E. inferencial). • Exemplos: • E. descritiva: estudo da idade da população dos alunos da ESTV. • E. inferencial: a partir da pesquisa amostral da população escolar, inferir a sua estrutura etária.
ESTATÍSTCA DESCRITIVA • Distribuição de Frequência • Definir um n.º de classes ímpar • Amplitude da classe = R / n.º de classes • R – Amplitude (Range) • R = Maior valor (H) – Menor valor (L) • Quadro de distribuição de frequência • Numa coluna as classes e na outra o n.º de casos correspondentes. • Histograma • Gráfico de barras com classes nas abcissas e n.º casos nas ordenadas. • Polígono de frequências • Linha constituída por segmentos de recta que unem os pontos médios dos topos das barras. • Curva de frequência • Suavização curvilínea do polígono de freq. • Distribuição de frequência acumulada • Identifica o .º de casos (%) até cada classe.
ESTATÍSTCA DESCRITIVA Numa turma do 10º ano foram perguntou-se a cada aluno a sua idade. Os dados não classificados são: 14, 15, 16, 17, 18, 19, 14, 15, 16, 17, 14, 15, 16, 14, 15, 16, 15, 16, 15, 15 Os dados classificados e agrupados numa tabela de frequências
ESTATÍSTCA DESCRITIVA Frequência absoluta ou efectiva (fi) de um valor da variável é o numero de vezes que esse valor foi observado Frequência relativa (fri) de um valor da variável é o quociente entre a frequência absoluta do valor da variável e o número total de observações Frequência (relativa ou absoluta) acumulada de um valor da variável é igual à soma das frequências anteriores com a frequência desse valor
ESTATÍSTCA DESCRITIVA Gráfico de barras - frequências absolutas Gráfico de barras - frequências absolutas acumuladas
ESTATÍSTCA DESCRITIVA Na mesma turma do 10º ano perguntou-se a cada aluno a sua altura em centímetros: 147, 167, 171, 172, 151, 154, 150, 155, 156, 160, 160, 164, 163, 159, 158, 162, 169, 170, 174 • Para 20 observações vamos usar 6 classes. Consideram-se ainda as seguintes convenções: • O extremo esquerdo do intervalo (classe) será fechado e o extremo direito aberto; • aos extremos do intervalo chamam-se limites da classe; à diferença dos limites, amplitudes do intervalo da classe; à semi-soma dos limites chama-se ponto médio ou marca da classe
ESTATÍSTCA DESCRITIVA Histograma das frequências absolutas
2. Medidas de Posição* • Valor calculado para um grupo de dados, usado para o descrever. • Média aritmética • Para dados não classificados • μ - M. A. da população μ = Σ X / N • x - M. A. amostral x = Σ x / n • - Para dados classificados • X = (f1x1+f2x2+…fnxn)/n = • Mediana • Corresponde ao valor do item médio quando todos os valores foram organizados de forma crescente ou decrescente. • Se n é ímpar Med = Xk com K = (n+1)/2 • Se n é par Med = (Xk+ Xk+1 )/2 com K = n/2 • Moda • Valor mais frequente. *ou de tendência central
ESTATÍSTCA DESCRITIVA • Calcule a média de idade da turma do 10º ano • Calcule a média das alturas da turma • Calcule a mediana das idades da turma • Calcule a moda das idades da turma
ANÁLISE As diferenças de valores assumido pela média aritmética, mediana e moda indicam-nos o tipo de curva de distribuição de frequência, sem a desenhar. Coeficiente de Pearson Dá-nos informação sobre a simetria da curva de distribuição de frequência (Medida de simetria). C. Pearson = 3 (μ – Med) / σ ou = 3 (x – Med) / s
3. Medidas de Variabilidade • Amplitude total • R = H - L • H – Maior valor da população (ou amostra) • L – Menor valor da população (ou amostra) • Variância e desvio padrão • σ^2 = (Σ(X- μ)^2) / N s^2 = (Σ(x - x)^2) / n • σ = (Σ(X- μ)^2) / N s= (Σ(x - x)^2) / n • σ^2 – Variância populacional • s^2 – Variância amostral • σ - Desvio padrão populacional • s - Desvio padrão amostral
Uma variável aleatória utiliza-se para expressar os resultados de uma experiência aleatória. Em algumas situações, o conjunto de valores que uma variável toma confunde-se com o próprio conjunto de resultados, isto é, com o espaço amostral. Experiência aleatória: Medição da altura de uma pessoa escolhida ao acaso Espaço amostral: Conjunto de todas as alturas atribuíveis a uma pessoa Variável aleatória: Altura (que pode tomar qualquer um dos valores que constituem o espaço amostral
ESTATÍSTCA INFERENCIAL Uma variável quantitativa classifica-se como discreta ou contínua, conforme os elementos do contradomínio da aplicação que a define forem numeráveis ou não numeráveis. Exemplo: A variável resultado do lançamento de um dado é discreto (podendo tomar os valores 1,2,3,4,5 ou 6) A variável distância a percorrer diariamente por um vendedor será contínua, se se admitir que tal distância é medida com precisão absoluta.
DISTRIBUIÇÃO NORMAL DE PROBABILIDADE f(X) Maior precisão σ = 10 σ = 5 μ X f(X) μ-3σ μ μ-2σ μ-1σ μ-1σ μ-2σ μ-3 σ X 68,27% 95,45% 99,73%
A distribuição normal é importante: • Grande número de fenómenos e processos segue esta distribuição; • Pode ser usada com aproximação a outras distribuições (binomial e de Poisson); • A distribuição estatística de amostras, tais como a média, seguem a D. normal.
Distribuição Normal Padronizada • Tem por finalidade potenciar o uso de tabelas; • Obtém-se pela introdução de • Z = (X – μ) / σ f(Z) 0 Z
APROXIMAÇÃO PELA NORMAL À PROB. BINOMIAL Esta aproximação é possível sempre que o número de observações ou tentativas for relativamente elevado. n ≥ 30 e n p ≥ 5 μ = n p σ = n p (1 – p) n – N.º de provas p – Probabilidade de sucesso
INTERVALOS DE CONFIANÇA 95% z -1,96 0 -1,96 Interpretação: Para um determinado nível de confiança (α) será calculado o intervalo que contém a verdadeira média da população (μ). [ I α ] μ = X ± Z σ / n P. e., temos 95% de confiança que a verdadeira média da população está contida no intervalo. [ I 0,95 ] μ = X ± 1,96 σ / n A dimensão do intervalo depende do nível de confiança e do tamanho da amostra.