1 / 37

Estatística Descritiva

Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS. Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas de dispersão: variância, desvio padrão, coeficiente de variação. Média aritmética. Mediana.

emlyn
Download Presentation

Estatística Descritiva

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Estatística Descritiva

  2. SUMARIZANDO DADOS MENSURADOS • Medidas de tendência centra: média, mediana, moda. • Separatrizes: quartis, decis percentis • Medidas de dispersão: variância, desvio padrão, coeficiente de variação.

  3. Média aritmética

  4. Mediana É o valor central ou a média aritmética dos dois valores centrais.

  5. Em que: L1 = limite inferior da classe mediana (isto é, da classe que contém a mediana); N = número de itens dos dados (isto é, freqüência total); (f)1 = soma de todas as freqüências das classes inferiores à mediana; fmediana = freqüência da classe mediana; c = amplitude do intervalo da classe mediana.

  6. Moda É o valor que ocorre com a maior freqüência, ou seja, é o valor mais comum. A moda pode não existir e, mesmo que exista, pode não ser única.

  7. Em que: L1 = limite inferior da classe modal (isto é, a que contém a moda); 1 = excesso da freqüência modal sobre a da classe imediatamente inferior; 2 = excesso da freqüência modal sobre a da classe imediatamente superior; c = amplitude do intervalo da classe modal.

  8. Quartis, decis e percentis De maneira geral, os quartis, decis e percentis e outros valores obtidos mediante subdivisões dos dados em partes iguais são denominados quantis.

  9. Variância, desvio padrão

  10. Para as distribuições normais (a) 68,27% dos casos estão incluídos entre X -s e X + s (isto é, um desvio padrão de cada lado da média); (b) 95,45% dos casos estão incluídos entre X - 2s e X + 2s (isto é, dois desvios padrões de cada lado da média); (c) 99,73% dos casos estão incluídos entre X - 3s e X + 3s (isto é, três desvios padrões de cada lado da média).

  11. Se a dipersão absoluta é o desvio padrão s e média é a aritmética X, a dispersão relativa é denominada coeficiente de variação ou de dispersão.

  12. A arte de representar dados

  13. Mas por que usar gráficos? • Uma imagem vale mais que ... • Ganho considerável de tempo para o leitor • A informação fica mais concisa • Atrai mais a atenção

  14. Com o quê estamos lidando? • Variáveis qualitativas ou quantitativas. • Qualitativas • são caracterizadas por estados, níveis ou categorias • ordenadas e não ordenadas • Quantitativas • níveis expressos numericamente • discretas ou contínuas

  15. Preparando os Gráficos Diretrizes gerais, não regras

  16. A B C B A Tempo de Resposta Tempo de Resposta C Número de usuários Número de usuários Preparando os gráficos • Requerer mínimo esforço do leitor • Nível de esforço para ler e entender o gráfico • Ex: direct labeling vs. legend box

  17. Preparando os gráficos (cont.) • Maximizar informação • O gráfico deve ser auto-explicativo • Eixos devem ser informativos • Usar práticas usualmente aceitas • Exs: origem em (0,0); escala cresce da esquerda pra direita; escalas lineares...

  18. 1 0.1 Disponibilidade Indisponibilidade 1 2 3 4 5 1 2 3 4 5 Dia da semana Dia da semana Preparando os gráficos (cont.) • Evitar ambigüidades • Identificar todos os elementos do gráfico(eixos, escala, origem, curvas individuais...) • Minimizar tinta

  19. Preparando os gráficos (cont.) • Os eixos de coordenadas são mostrados e rotulados? • As escalas e divisões são mostradas em ambos os eixos? • O número de curvas é razoável? • Todos os gráficos usam a mesma escala? • As unidades de medida são indicadas? • O gráfico usa as convenções de representação? • Não existem curvas, símbolos, ou textos que podem ser removidos sem afetar a informação?

  20. Erros Comuns Como falhar apresentando resultados

  21. Erros comuns • Apresentar muitas alternativas num único gráfico • Apresentar muitas “imagens” num único gráfico • Informações “não interessantes” • Selecionar variação de escala imprópria

  22. (b)Palavras Chave 1 job/seg 3 jobs/seg (a)Símbolos Response Time =1 =3 R 2 jobs/seg =2 Taxa de chegada l Erros comuns (cont.) • Uso de símbolos ao invés de texto

  23. MIPS 8000 8100 8200 8300 Tipo da CPU Erros comuns (cont.) • Usar gráficos de linha ao invés de coluna

  24. Levando Vantagem “Jogando” com as imagens

  25. 2610 MINE 5200 MINE YOURS YOURS 2600 0 Levando vantagem • Usando origens diferentes de (0,0) para enfatizar diferenças

  26. Vazão Tempo de Resposta Número de Usuários Levando vantagem (cont.) • Usando duas curvas diferentes num mesmo gráfico para enfatizar o contraste

  27. Levando vantagem (cont.) • Plotar quantidades aleatórias sem indicar intervalos de confiança (a) Com intervalo de confiança (a) Sem intervalo de confiança MINE MINE YOURS YOURS

  28. Levando vantagem (cont.) • Figuras modificadas em escala pela altura MINE YOURS

  29. 18 12 15 10 12 8 Frequência Frequência 9 6 6 4 3 2 0 0 [0,6] [6,12] [0,2] [2,4] [4,6] [6,8] [8,10] [10,12] Tempo de Resposta Tempo de Resposta Levando vantagem (cont.) • Escolha “errada” do tamanho das células num histograma

  30. 0 A B C D E F Sistema 12 12 10 11 8 Tempo de Resposta Tempo de Resposta 10 6 4 9 2 0 A B C D E F Sistema Levando vantagem (cont.) • Usar escalas quebradas em gráficos de coluna

  31. Gráficos de Gantt • Usado para exibir a duração relativa de qualquer número de condições booleanas. • Cada condição é mostrada como um conjunto de segmentos de reta horizontais • Os segmentos de reta são arranjados de forma que a sobreposição das retas representa a sobreposição das condições

  32. 60 CPU 20 20 Canal de I/O 30 10 5 15 Rede 0% 20% 40% 60% 80% 100% Gráficos de Gantt (cont.)

  33. Gráficos de Kiviat • Auxilia no reconhecimento de problemas de performance • Gráfico circular em que as métricas são plotadas sobre retas radiais • Parâmetros: 50% HB, 50% LB • Devido a essa configuração, o gráfico ideal é uma estrela!

  34. CPU busy 90% CPU only busy 10% CPU in supervisor state 10% CPU/Channel overlap 80% CPU in problem state 80% CPU wait 10% Channel only busy 10% Any Channel busy 90% Gráficos de Kiviat (cont.) O gráfico ideal para um sistema balanceado

  35. CPU busy 90% CPU only busy 10% CPU in supervisor state 10% CPU/Channel overlap 80% CPU in problem state 80% CPU wait 10% Channel only busy 10% Any Channel busy 90% Gráficos de Kiviat (cont.) Exemplo de um sistema com problemas de balançeamento

  36. Mas e se tudo isso nãofuncionar para convencer osdecision makers?

  37. Rejeitando uma análise • O problema precisa de mais análise • A carga do sistema precisa ser melhor entendida • “Isso vai aumentar a complexidade e o custo” • Isso vai violar o IEEE, ANSI, CCITT, ou qualquer outro padrão • ... ... ...

More Related