3.42k likes | 3.61k Views
Lean Seis Sigma. P rograma de certificación de Black Belts. V. Seis Sigma – Medición Parte B P. Reyes / Abril 2010. V. Seis Sigma - Medición. D. Estadística básica 1. Términos básicos 2. Teorema del límite central 3. Estadística descriptiva Medidas de tendencia central
E N D
Lean Seis Sigma Programa de certificación de Black Belts V. Seis Sigma – Medición Parte B P. Reyes / Abril 2010
V. Seis Sigma - Medición D. Estadística básica 1. Términos básicos 2. Teorema del límite central 3. Estadística descriptiva • Medidas de tendencia central • Medidas de dispersión • Funciones de densidad de probabilidad • Distribuciones de frecuencia y • Funciones acumulativas de distribución 4. Métodos gráficos 5. Conclusiones estadísticas válidas
V. Seis Sigma - Medición E. Probabilidad 1. Distribuciones de probabilidad 2. Distribuciones de probabilidad discretas Hipergeométrica, Binomial, Poisson 3. Distribución normal 4. Distribuciones muestrales Chi Cuadrada, t de Student, F 5. Otras Distribuciones de probabilidad Bivariada, Exponencial, Lognormal, Weibull
V. Seis Sigma - Medición F. Capacidad de procesos 1. Índices de capacidad de procesos 2. Índices de desempeño de procesos 3. Capacidad a corto y a largo plazo 4. Capacidad de proceso de datos no normales 5. Capacidad de proceso para datos por atributos 6. Capacidad de procesos bajo Seis Sigma
V.D Estadística básica 1. Términos básicos 2. Teorema del límite central 3. Estadística descriptiva 4. Métodos gráficos 5. Conclusiones estadísticas válidas
Estadística “La estadística descriptiva nos proporciona métodos para organizar y resumir información, la estadística inferencial se usa para obtener conclusiones a partir de una muestra” Por ejemplo, sí deseamos saber el promedio de peso de las personas en una población tenemos dos opciones: Pesar a todas y cada una de las personas, anotar y organizar los datos, y calcular la media. Pesar solo una porción o subconjunto de la población (muestra). Registrar y organizar los datos y calcular la media de la muestra, tomándola para pronosticar o Inferir la media de toda la población.
Población y muestra Población:Es la colección de todos los elementos (piezas, personas, etc.). En nuestro caso sería un número infinito de mediciones de la característica del proceso bajo estudio. Muestra:Es una parte o subconjunto representativo de la población, o sea un grupo de mediciones de las características.
Estadísticos y parámetros Estadístico:Es una medición tomada en una muestra que sirve para hacer inferencias en relación con una población (media de la muestra, desviación estándar de la muestra se indican con letras latinas X, s, p). Normalmente es una variable aleatoria y tiene asociada una distribución. Parámetro:Es el valor verdadero en una población (media, desviación estándar, se indican con letras griegas , , )
Tipos de datos Distribución continuaUna distribución con un número infinito de puntos de datos (variables) que pueden mostrarse en una escala de medición continua. Por ejemplo: Distribuciones normal, uniforme, exponencial y Webull Distribución discreta:Una distribución que resulta de datos contables (discretos) con un número finito de valores posibles. Por ejemplo: Distribuciones binomial, Poisson, hipergeométrica.
Teorema del límite central • La distribución de las medias de las muestras tiende a la normalidad independientemente de la forma de la distribución poblacional de la que sean obtenidas. Es la base de las cartas de control X-R.
Teorema del límite central • Por lo anterior la dispersión de las medias es menor que para los datos individuales • Para las medias muestrales, el error estándar de la media se relaciona con la desviación estándar de la población como sigue:
Teorema del Límite Central • La distribución de las medias de las muestras tienden a distribuirse en forma normal • Por ejemplo los 300 datos (cuyo valor se encuentra entre 1 a 9) pueden estar distribuidos como sigue:
Teorema del Límite Central Población con media y desviación estándar y cualquier distribución. Seleccionando muestras de tamaño n y calculando la X-media o promedio en cada una X-media 1 X-media 2 X-media 3 Conforme el tamaño de muestra se incrementa las muestras se distribuyen normalmente con media de medias y desviación estándar de las medias de las muestras / n. También se denominaError estándar de la media.
Teorema del Límite Central • La distribución de las medias de las muestras tienden a distribuirse en forma normal • Tomando de muestras de 10 datos, calculando su promedio y graficando estos promedios se tiene:
Cartas de Control DEFINICION Es una ayuda gráfica para el control de las variaciones de los procesos administrativos y de manufactura. Causa especial Causas normales o comunes
Variación observada en una Carta de Control • Una Carta de control es simplemente un registro de datos en el tiempo con límites de control superior e inferior, diferentes a los límites de especificación. • El patrón normal de un proceso se llama causas de variación comunes. • El patrón anormal debido a eventos especiales se llama causa especial de variación.
Variación – Causas comunes Límite inf. de especs. Límite sup. de especs. Objetivo
Límite inf. de especs. Variación – Causas especiales Límite sup. de especs. Objetivo
Aplicación en la carta de control “Escuche la Voz del Proceso” Región de control, captura la variación natural del proceso original M E D I D A S C A L I D A D LSC LIC Tendencia del proceso El proceso ha cambiado Causa Especial identifcada TIEMPO
Patrones Fuera de Control Corridas 7 puntos consecutivos de un lado de X-media. Puntos fuera de control 1 punto fuera de los límites de control a 3 sigmas en cualquier dirección (arriba o abajo). Tendencia ascendente o descendente 7 puntos consecutivos aumentando o disminuyendo. Adhesión a la media 15 puntos consecutivos dentro de la banda de 1 sigma del centro. Otros 2 de 3 puntos fuera de los límites a dos sigma
Patrón de Carta en Control Estadístico Proceso en Control estadístico Sucede cuando no se tienen situaciones anormales y aproximadamente el 68% (dos tercios) de los puntos de la carta se encuentran dentro del 1 de las medias en la carta de control. Lo anterior equivale a tener el 68% de los puntos dentro del tercio medio de la carta de control.
Aplicación en Intervalos de confianza • Intervalo de confianza para la media: • A) Sigma conocida y n>30 (n es tamaño de muestra) • B) Sigma desconocida y n<30, los grados de libertad son gl = n-1.
Aplicación en Intervalos de confianza • Intervalo de confianza para proporciones y varianza: • Para proporciones, p es la proporción y n>30 • Para la varianza
No existen en la naturalezados cosas exactamente iguales,ni siquiera los gemelos, por tanto la variación es inevitable y es analizada por la Estadística Estadística Descriptiva
Estadística descriptiva • La estadística descriptiva incluye: • Medidas de tendencia central • Medidas de dispersión • Funciones de densidad de probabilidad • Distribuciones de frecuencia y • Funciones acumulativas de distribución
Estadística descriptiva • Medidas de tendencia central • Representan las diferentes formas de caracterizar el valor central de un conjunto de datos • Media muestral poblacional
Estadística descriptiva • Medidas de tendencia central • Mediana: es el valor medio cuando los datos se arreglan en orden ascendente o descendente, en el caso de n par, la mediana es la media entre los valores intermedios
Estadística descriptiva • Medidas de tendencia central • Moda: Valor que más se repite, puede haber más de una • Media acotada (Truncated Mean): Se elimina cierto porcentaje de los valores más altos y bajos de un conjunto dado de datos (tomando números enteros), para los valores restantes se calcula la media.
Estadística descriptiva • Medidas de tendencia central
Estadística descriptiva • Medidas de dispersión: • Rango: Es el valor mayor menos el valor menor de un conjunto de datos
Estadística descriptiva • Medidas de dispersión: • Varianza: es el promedio de las desviaciones al cuadrado respecto a la media (n para población y n-1 para muestra para eliminar el sesgo)
Estadística descriptiva • Medidas de dispersión: • Coeficiente de variación: es igual a la desviación estándar dividida por la media y se expresa en porcentaje
Medidas de Dispersión- Rango, CV Rango: Valor Mayor – Valor menor Coeficiente de variación: (Desv. Estándar / Media )*100%, Se usa para comparar datos en diferentes niveles de media o tipo. Por ejemplo: Material No. de Media Desviación Coeficiente Observaciones Aritmética Estándar de Variación n sSrel A 160 1100 225 0,204 B 150 800 200 0,250 El Material A tiene una menor variabilidad relativa relativa que el material B Error estándar de la Media: Es la desviación estándar de las medias de las muestras de mediciones, se representa como la desviación estándar de la población entre la raíz de n = número de mediciones por muestra.
Estadística descriptiva • Función de densidad de probabilidad • El área bajo la curva de densidad de probabilidad a la izquierda de un valor dado x, es igual a la probabilidad de la variable aleatoria en el eje x para X<= x • Para distribuciones continuas • Para distribuciones discretas
Estadística descriptiva • Función de densidad de probabilidad
Estadística descriptiva • Función de distribución acumulada Función de densidad Función de distribución acumulada
Métodos gráficos • Se incluyen los métodos siguientes: • Diagramas de caja • Diagramas de tallo y hojas • Diagramas de dispersión • Análisis de patrones y tendencias • Histogramas • Distribuciones de probabilidad normales • Distribuciones de Weibull
Diagrama de caja PERCENTILES, DECILES Y QUARTILES • Cada conjunto de datos ordenado tiene tres cuartiles que lo dividen en cuatro partes iguales. • El primer cuartil es ese valor debajo del cual clasifica el 25% de las observaciones y sobre el cual se encuentra el 75% restante. • El segundo cuartil divide a los datos a la mitad similar a la mediana. • El tercer cuartil es el valor debajo del cual se encuentra el 75% de las observaciones. • Los deciles separan un conjunto de datos ordenado en 10 subconjuntos iguales y los percentiles en 100 partes
Diagrama de caja PERCENTILES, DECILES Y QUARTILES • La ubicación de un percentil se encuentra en: Donde: Lp es el sitio del percentil deseado en una serie ordenada n es el número de observaciones P es el percentil deseado
Diagrama de caja • Por ejemplo para los datos siguientes:
Diagrama de caja La localización del percentil 35 se halla en: O sea que el percentil 35 está al 85% del trayecto comprendido entre la observación 17 que es 29 y la observación 18 que es 31 o sea L35 = 29 + (0.85)(31-29) = 30.7. Por tanto el 35% de las observaciones están por debajo de 30.7 y el 65% restante por encima de 30.7. De la misma forma los percentiles 25, 50 y 75 proporcionan la localización de los cuartiles Q1, Q2 y Q3 respectivamente. Q1: es el número que representa al percentil 25 Q2 o Mediana: es el número que representa al percentil 50 Q3:es el número que representa al percentil 75 (hay 75% de los datos por debajo de este). Rango o Recorrido intercuartílico:es la diferencia entre Q1 y Q3.
Gráficas de caja • Permite identificar la distribución de los datos, muestra la mediana, bases y extremos. • Mediana = dato intermedio entre un grupo de datos ordenados en forma ascendente DEFINICION: • Es una ayuda gráfica para ver la variabilidad de los datos. Primer cuartil Tercer cuartil Mediana Valor mínimo Valor máximo
Métodos gráficos • Diagramas de caja • Representan un resumen de los datos. La línea media es la mediana, los lados son el primer y tercer cuartil. El máximo y el mínimo se dibuja como puntos al final de las líneas (bigotes)