280 likes | 622 Views
Controle Estatístico de Qualidade Robert Wayne Samohyl. Capítulo 2. Medidas descritivas e gráficos básicos. 2.2 Média. A média , chamado de x-barra, a soma de uma série de dados dividida pelo número n de dados na soma. Em termos matemáticos, então, podemos escrever. EXEMPLO - MÉDIA.
E N D
Controle Estatístico de Qualidade Robert Wayne Samohyl Capítulo 2. Medidas descritivas e gráficos básicos
2.2 Média • A média , • chamado de x-barra, a soma de uma série de dados dividida pelo número n de dados na soma. • Em termos matemáticos, então, podemos escrever . . .
EXEMPLO - MÉDIA • Na tabela 2.1, são colocadas 50 medidas em milímetros do comprimento de uma peça, por sinal, uma das características essenciais da peça. • Uma coluna de números não é nada interessante para o engenheiro. • Por outro lado, a média das medidas da primeira coluna da tabela é • 100,324 = (102,230 + 99,070 + 99,079 + ... + 98,143)/50, • e o engenheiro agora pode saber se o produto está sendo fabricado centrado no alvo desejado.
2.3 Mediana • Para resolver a distorção de números discrepantes e assimétricos, utiliza-se da mediana, o número no meio dos números ordenados (ou a média dos dois números no meio dos números), nesse caso, na tabela 2.1, • 100,861 ( = (100,827 + 100,894)/2). • Vamos explicar melhor. Numa relação de números ordenados do maior para o menor existe um número que separa todos os números em dois grupos de tamanho igual, os números maiores que a mediana e os números menores. Na lista dos 50 números, há 25 números maiores que 100,861 e 25 números menores. • A diferença numérica entre a mediana e a média no exemplo da tabela 2.1 • (100,861 - 100,324 = 0,537) • poderia ser considerada razoavelmente grande pelo engenheiro, se for considerada pequena a variabilidade dos números, e significaria que a média é realmente distorcida como medida de tendência central, levando o engenheiro a utilizar a mediana.
2.4 Quartil • Os quartís são calculados, partindo da mediana. Com a mediana os dados ordenados foram divididos em dois subgrupos, acima e abaixo da mediana. Para cada subgrupo encontra-se sua própria mediana e essa mediana se chama de quartil. • Obviamente tem um quartil inferior, o primeiro quartil, e um quartil superior, o terceiro quartil. Para completar o raciocínio, pode chamar a mediana original de segundo quartil. • Os quartís dividem os dados ordenados em quatro grupos distintos, cada grupo tem um quarto dos dados. No exemplo na tabela 2.1, cada um dos quatro subgrupos tem aproximadamente 50/4 elementos. • Os quartís são assinalados na tabela 2.1: quartil inferior de 98,572 e quartil superior de 101,810. A diferença numérica entre os quartís superior e inferior, o desvio quartílico, pode ser utilizada também para definir a variabilidade dos dados, assunto detalhado na seção 2.7.
2.5 Medida de variabilidade – desvio padrão • O desvio ao redor da média é definido como a diferença entre um número individual e a média de todos os dados. • Por exemplo, a tabela 2.2 mostra 30 dados de tempo gasto pela empresa para solucionar problemas dos clientes do momento do recebimento da queixa até que a solução seja conferida. A média de tempo gasto é 182,89 minutos, um pouco mais que 3 horas. O primeiro desvio calculado (na terceira coluna) é . -82,89 = 100 – 182,89 = desvio =
Desvio padrão (média) • Para resolver o problema do sinal do desvio, é preferível utilizar o quadrado do desvio, também sem sinal, todos somados como antes e a média deles calculada SX2 = Variância = = SQT/(n – 1) A expressão SQT é usada na área de regressão, assunto do capítulo 13. desvio padrão = SX = √SX2
Tabela 2.2 - Minutos corridos até solucionar a reclamação do cliente, e desvios.
Tabela 2.2 - Minutos corridos até solucionar a reclamação do cliente, e desvios. (Continuação)
Erro padrão – desvio padrão das médias • Um conceito muito importante para os gráficos de controle estudados na segunda parte do livro é o desvio padrão de uma coleção de médias, e leva o nome erro padrão. É quase igual ao desvio padrão, mas a diferença é que é dividido pela raiz quadrada do tamanho da amostra. • erro padrão = • O desvio padrão das médias é pelo menos igual ao desvio padrão dos dados individuais, quer dizer, quando o tamanho n da amostra é maior que um, o desvio padrão das médias é menor. • No final, é para esperar menor variação nas médias que efetivamente eliminam valores muito altos acima da média com os valores muito abaixo da média. • a variação das médias diminui quando o tamanho da amostra aumentar. Esta relação é ilustrada na figura 2.1 para o caso da distribuição normal, assunto prioritário do próximo capítulo.
n = 16 n = 9 n = 4 n = 1 Figure 2.1 - Distribuição normal e erro padrão com tamanhos da amostra diferentes
2.6 O desvio padrão de Shewhart em controle estatístico de qualidade Para simplificar o calculo do desvio padrão, o operador calcula a amplitude (valor máximo menos o valor mínimo) de cada amostra (subgrupo) e disso calcula a média das amplitudes • Shewhart desenvolveu uma tabela de coeficientes d2, mostrados na tabela 2.3, com o poder de transformar a média das amplitudes em desvio padrão. Nota-se que o valor de d2 aumenta com o tamanho da amostra. = 187,308 / 2,326 = 80,528.
Tabela 2.3 - Coeficientes de Shewhart para os gráficos de controle A2 (
Tabela 2.4 - Minutos corridos até solucionar a reclamação do cliente, dados arranjados em 6 subgrupos amostrais com 5 observações em cada grupo.
2.7 Desvio quartílico • Outra medida de variabilidade é o desvio quartílico, a diferença entre o quartil inferior e o quartil superior já estudado anteriormente na seção sobre a mediana. • Voltando para a tabela 2.1 sobre o comprimento em mm, pode ser visto que o desvio quartílico é igual a • 3,238 = 101,810 – 98,572.
2.8 Gráficos Básicos – Caixa das Medianas e Histograma • Sem dúvida, a melhor maneira de analisar uma série de dados é graficamente. • A tentativa de ver padrões e tendências em uma relação de dados escritos em uma tabela certamente resultará em confusão especialmente quando o número de dados é grande.
450,00 400,00 350,00 300,00 250,00 200,00 150,00 100,00 50,00 0,00 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 Dias do mes Figura 2.2 - Tempo gasto em resolver problemas dos clientes
Figura 2.3 - Caixa de medianas para o tempo gasto nas reclamações na tabela 2.2 Um gráfico que reúne as informações da mediana e dos quartis em uma maneira fácil para entender é a caixa das medianas, figura 2.3.
Figura 2.3 - Caixa de medianas para o tempo de máquina funcionando e parado
Histograma • Finalmente apresenta-se o histograma, um gráfico que tem todas as boas características da caixa de medianas, mas exibe muito mais informação sobre a distribuição dos dados. • Foram amostrados em um laticínio 150 sacos de leite contendo por lei 1 litro do alimento. O histograma é um retrato dos dados na tabela 2.5, logo em seguida.
Histograma 120,00% 30 100,00% 25 80,00% 20 60,00% 15 40,00% 10 20,00% 5 0,00% 0 1055 1100 1078 856 878 900 922 945 967 989 maior 1033 1011 Figura 2.4 - Histograma de medidas de sacos de leite de um litro.
Tabela 2.5 - Freqüências de medidas em ml de sacos de leite de um litro.