1.37k likes | 1.76k Views
Estatística e Análise de Dados. Professor Leandro Morilhas. Agenda. Conceito e origem da Estatística. Áreas de Estudo. Medidas de posição central. Medidas de dispersão. Probabilidade. Correlação e regressão linear. Um passeio pela história …. 3000 AC – Censos no Egito. Outras cenas.
E N D
Estatística e Análise de Dados Professor Leandro Morilhas
Agenda • Conceito e origem da Estatística. • Áreas de Estudo. • Medidas de posição central. • Medidas de dispersão. • Probabilidade. • Correlação e regressão linear.
Na Bíblia … • Quarto livro do velho testamento • Instrução a Moisés • Fazer um levantamento dos homens de Israel que estivessem aptos a guerrear
Augusto César • Édito para que se fizesse o censo em todo o império romano Censere em latim = taxar
Maria e José • Em função do édito, Maria e José viajaram para Belém
Guilherme o conquistador • Inglaterra • 1085 • Levantamento estatístico • Terras • Propriedades • Empregados • Animais • Base de cálculo de impostos Domesday = Dia do juízo final
Séc XVII - Tábuas de Mortalidade • John Graunt • Análises de nascimentos e mortes • % de homens ligeiramente superior a de mulheres
Palavra Estatística • Cunhada pelo acadêmico alemão Gottfried Achenwall por volta da metade do século XVIII • O verbete “statistics” apareceu pela primeira vez na Enciclopédia Britânica em 1797
Para entender a ... Estatística Status Estado Poder público Caracterização dos dados
Uma origem controversa Estatística para cobrar IMPOSTOS
E depois …. Facilitar a análise de DADOS
A Estatística é dividida em: Análise de dados: Coleta, organização e resumo dos dados Probabilidade: Necessária para tirar conclusões a partir de amostras Inferência estatística: Tirar conclusões estatísticas de dados específicos usando os conhecimentos de probabilidade
Definições: População É o conjunto de todos os elementos de interesse em um determinado estudo Amostra É uma parte da população selecionada para análise
Dados Dados: são observações (tais como medidas, sexo, respostas de pesquisa) que tenham sido coletados Quantitativos: Quando é possível atribuir um valor numérico Qualitativos: Representam a informação que identifica alguma qualidade, categoria ou característica
Campos de Aplicação Estudos de mercado O gerente de uma fábrica de detergentes pretende lançar um novo produto para lavar a louça, pelo que, encarrega uma empresa especializada em estudos de mercado de "estimar" a percentagem de potenciais compradores desse produto. População: conjunto de todos as famílias do país Amostra: conjunto de algumas famílias, pesquisados pela empresa Problema: pretende-se, a partir da percentagem de respostas afirmativas, de entre os entrevistados sobre a compra do novo produto, obter uma estimativa do número de compradores na População.
Campos de Aplicação Controle de qualidade O administrador de uma fábrica de parafusos pretende assegurar-se de que a percentagem de peças defeituosas não excede um determinado valor, a partir do qual determinada encomenda poderia ser rejeitada. População: conjunto de todos os parafusos fabricados ou a fabricar pela fábrica, utilizando o mesmo processo. Amostra: conjunto de parafusos escolhidos ao acaso de entre o lote de produzidos. Problema: pretende-se, a partir da percentagem de parafusos defeituosos presentes na amostra, "estimar" a percentagem de defeituosos em toda a produção.
Analisando ... Frequências Média Mediana Desvio-Padrão
Medidas úteis para a decisão • Medidas de posição central: • Média ou Valor Esperado • Moda • Mediana
Média Aritmética Simples • Mais usual das medidas estatísticas • Relação entre soma e contagem • Centro geométrico de um conjunto de dados
Exercícios 1 – Em março de 2009, os vendedores da Empresa Equilibrada Ltda. tiveram um aumento de 44% sobre os respectivos salários mensais. Ao final de junho, tendo em vista o considerável aumento das vendas da empresa, foi concedido um novo aumento a cada vendedor, de US$ 200 que começou a ser pago a partir de julho. Sabendo-se que, ao final do ano de 2009, o salário médio mensal dos vendedores da empresa passou a ser de US$ 1.100, pede-se calcular o salário médio mensal dos vendedores da empresa em fevereiro de 2009.
Exercícios 2 – O salário médio mensal pago aos funcionários da Empresa ABC, foi de US$ 199 no primeiro semestre de 2009. Sabendo-se que a partir de julho houve um aumento que fez com que a média, ao final dos doze meses do ano subisse para US$ 217, pede-se calcular: A - O volume total gasto com o pagamento dos salários no mês de julho. B – Mantendo-se os valores do primeiro semestre e o valor encontrado para o mês de julho, caso a empresa queira reduzir os gastos com pessoal, de tal modo que a média ao final do ano de 2009 atinja US$ 180, qual deve ser a média mensal entre agosto e dezembro?
Média aritmética ponderada É preciso considerar as frequências …
Exercícios 3 – Um caminhão cujo peso vazio é de 3.200 kg será carregado com 470 caixas de 11 kg cada, 360 caixas de 9 kg cada, 500 caixas de 4 kg cada e 750 caixas de 6 kg cada. O motorista do caminhão pesa 75 kg e a lona de cobertura da carga pesa 48 kg. A – Sabendo-se que esse caminhão tem que passar por uma balança que só permite passagens a veículos com peso máximo de 16 toneladas, pergunta-se: ele passará pela balança? B – Qual o peso médio das caixas carregadas no caminhão?
Exercícios 4 – O capital da Empresa Maguary Ltda. é formado pelo aporte dos acionistas, por financiamento de longo prazo e pela emissão de debêntures. Cada tipo de capital possui um custo anual diferente dado por uma taxa de juros anual, conforme o quadro: Calcular a taxa média do capital da empresa.
Cuidado com as médias!!! Aparências podem enganar!
Maior problema da média … Maldição dos extremos ou outliers Extremos distorcemalgumas medidas
Solução para o problema … Remover os extremos!!
Pesquisa sobre remuneração • Empresa paga $400,00 aos estagiários de Administração • Quer saber … É muito ou pouco? • Coletou amostra de dados • Dados: {300; 350; 6000; 340; 310; 380} Pouquíssimo!!! 7680 $1.280,00 6
Organizando os dados … • Dados: {300; 350; 6000; 340; 310; 380} • Rol:{300; 310; 340; 350; 380; 6000} $400,00 Extremo distorce a média! • Rol sem extremo:{300; 310; 340; 350; 380} Alto! Média = 1680/5 = $336,00
O centro dos dados ordenados Onde está ocentro???
Mediana • Valor central de uma série ordenada de dados (Rol) {3; 7; 9; 10; 4; 8; 2} Ordenando no Rol 3 maiores {2; 3; 4; 7; 8; 9; 10} n par? 3 menores mediana = 6 {2; 3; 4; 8; 9; 10}
O que é mais frequente Será que está namoda???
Moda • Valor que se repete com maior frequência {2; 3; 4; 7; 7; 9; 10} unimodal {2; 2; 4; 7; 7; 9; 10} bimodal ou multimodal {2; 3; 4; 7; 8; 9; 10} amodal
Medidas de Localização Não Centrais • Usadas para resumir ou descrever as propriedades de grandes conjuntos de dados numéricos: • Quartis • Percentis
Quartis • Dividem os dados ordenados em quatro partes: • Primeiro Quartil (Q1): valor que faz com que 25% das observações sejam menores e 75% sejam maiores que Q1 • Segundo Quartil (Q2): é a MEDIANA – 50% das observações são menores que Q2 e 50% são maiores • Terceiro Quartil (Q3): valor que faz com que 75% das observações sejam menores e 25% sejam maiores que Q3
Dados não agrupados Q1 = valor que corresponde à posição: Q2 = valor que corresponde à posição: Q3 = valor que corresponde à posição:
Regras usadas para obter os valores do quartil • Se o ponto de posicionamento for um número inteiro, é só usar o número correspondente àquela posição • Se o ponto de posicionamento estiver na metade entre 2 números inteiros, a média dos dois números à direita e à esquerda será o quartil • Se o ponto de posicionamento não for a metade do caminho entre dois números inteiros, usamos o que estiver mais próximo.
Exercícios 5 - Os salários mensais para uma amostra de 12 administradores são: 2.350 2.450 2.550 2.380 2.255 2.210 2.390 2.630 2.440 2.825 2.420 2.380 Determine os três quartis. 6 - Para estimar a quantidade de água que seria necessária para abastecer uma cidade na próxima década, a prefeitura precisa descobrir a quantidade de água que uma amostra de famílias utiliza atualmente. As famílias da amostra utilizaram o seguinte volume de água, em milhares de litros: 11,1 21,5 16,4 19,7 14,6 16,9 32,2 18,2 13,1 23,8 18,3 15,5 18,8 22,7 14,0 Encontre os três quartis.
Exercícios 7 - Considere uma população constituída de profissionais liberais que foram, questionados sobre o número de revistas e/ou jornais que os mesmos são assinantes, obteve-se a seguinte tabela: Quais são os três quartis?
Exercícios 8 - Uma empresa produz caixas de papelão para embalagens e afirma que o número de defeitos por caixa de distribui conforme a tabela da população: Determine o valor da moda, da mediana e da média
Medidas de Dispersão • Amplitude • Desvio médio • Variância • Desvio padrão
Encontrando os extremos dos dados • Fundo de investimento, com retornos: {7, 3 e 2} • Amplitude • Maior menos menor • Range ou intervalo Maior - R = Menor - 2 R = 7 = 5
Desvio médio • Desvio médio ou afastamento médio em relação à média Média = 4 Série 2 3 7 Desvios -2 -1 3 É preciso calcular osdesviosABSOLUTOS Soma 0 Média 0