570 likes | 957 Views
Control Estadístico de Procesos. Estadística Profesor: Carlos González Lavado Universidad de Aconcagua www.isuac.com www.cgonzalez.cl. Estadística.
E N D
Control Estadístico de Procesos Estadística Profesor: Carlos González Lavado Universidad de Aconcagua www.isuac.com www.cgonzalez.cl
Estadística La estadística es una ciencia con base matemática referente a la recolección, análisis e interpretación de datos, que busca explicar condiciones regulares en fenómenos de tipo aleatorio.
Estadística descriptiva La estadística descriptiva, que se dedica a los métodos de recolección, descripción, visualización y resumen de datos originados a partir de los fenómenos en estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de parámetros estadísticos son: la media y la desviación estándar. Algunos ejemplos gráficos son: histograma, pirámide poblacional, clústers, etc.
Inferencia estadística La inferencia estadística, que se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio.
Inferencia estadística Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de hipótesis), estimaciones de características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modelamiento de relaciones entre variables (análisis de regresión). Otras técnicas de modelamiento incluyen anova, series de tiempo y minería de datos.
Estadística El propósito de la estadística. El análisis estadístico se usa para manipular, resumir e investigar datos con el fin de obtener información útil en la toma de decisiones
Estadística La estadística encuentra en los gráficos, una herramienta indispensable para ayudar a entender, interpretar y comunicar sus conclusiones.
Gráficos • En éste estudio, solo veremos algunos de ellos. El primero será las llamadas Series de Tiempo.
Gráficos • La misma información puede representarse como un gráfico o diagrama de barras.
Gráficos Datos de producción de una región hipotética:
Gráficos Gráfico de trazos
Gráficos Gráfico de Barras
Gráficos Gráfico de Barras Porcentuales
Gráficos Gráfico de barras horizontales
Gráficos Gráfico circular abierto.
Recogida de Datos Tipos de Datos. • Una variable es un elemento de interés que puede tomar muchos valores numéricos diferentes. • Una constante tiene un valor numérico fijo. • Una variable Cuantitativa es aquella cuyo valores se pueden expresar en cantidades numéricas, como medidas o recuentos. • Una variable cualitativa no es cuantitativa y solo puede clasificarse, pero no medirse
Recogida de Datos Escalas numéricas de medida • Nominal • Ordinal • Intervalos • Razón
Recogida de Datos Datos nominales: Los datos medidos en una escala nominal representan el nivel más bajo de la jerarquía y consisten en categorías en las que se registran el número de observaciones. Estas categorías no tienen un orden lógico ni una relación especifica. Se dice que las categorías son mutuamente excluyentes puesto que un individuo, objeto o medida pueden incluirse sólo en una de ellas.
Recogida de Datos Datos ordinales: Muchos conjuntos de datos están compuestos por categorías cualitativas en las que hay una progresión u orden. Este tipo de datos se conoce como ordinales. Los datos medidos en una escala ordinal contienen más información que los medidos en una escala nominal, debido a que las categorías están ordenadas: los valores en una categoría son mayores o menores que los valores en otras categorías.
Recogida de Datos Datos de intervalo: Los siguientes dos tipos de esquema de clasificación manejan datos cuantitativos. El primer tipo, las escala de intervalos, se produce cuando se toman medidas numéricas sobre algunos elementos y se pueden determinar con exactitud los intervalos entre esas medidas. La escala de intervalo es una forma de medida más completa que la escala ordinal o nominal, ya que permite discernir no solo que valor observado es el más grande, si no también por cuánto.
Recogida de Datos Datos de razón: Por el contrario, los datos medidos en una escala de razón tienen un punto cero fijo o no arbitrario. La escala de este tipo de datos utiliza intervalos definidos con precisión, igual que los datos de escala de intervalos, pero tienen un punto cero también fijo. Los datos medidos con una escala de razón constituyen el nivel más alto de la medida.
Tipos de fuentes de datos Datos secundarios y datos primarios. Los datos necesarios para elaborar un análisis estadístico o bien se encuentran disponibles o deben recogerse. Los datos que se encuentran disponibles se denominan datos secundarios y los datos que deben recogerse se llaman datos primarios
Tecnicas de Recogida de Datos Existen varias técnicas como: • Grupos de interés. • Teléfono. • Cuestionarios por correo. • De puerta a puerta. • Abordaje en Centros Comerciales. • Registros. • Observación. • Entrevista. • Experimento.
Poblaciones y muestras Población En los estudios estadísticos es crucial identificar la población (el grupo sujetos u objetos sometidos a estudio) Una población es el conjunto completo de individuos o elementos de interés Un censo es un intento de medir todos los elementos de una población de interés.
Poblaciones y muestras Muestra Una muestra es un subconjunto seleccionado de la población. En la mayor parte de las investigaciones estadísticas, los censos son bastantes costosos y difíciles, o incluso imposibles. Bajo las anteriores condiciones es necesario seleccionar una muestra que es un subconjunto de la población elegida para el análisis.
Muestreo aleatorio simple Muestras aleatorias y no aleatorias Muestra aleatoria simple resulta cuando se seleccionan n elementos de una población, de manera que todas las combinaciones posibles de n elementos de la población tienen igual probabilidad de ser elegida. Si algunos de los elementos de la población tienen mayor posibilidad de ser elegidos que otros, esto constituye una muestra no aleatoria.
Muestreo aleatorio simple Cuando un muestreo se realiza sin reemplazo, un elemento que se selecciona para la muestra no se devuelve a la población para ser, quizá, seleccionado de nuevo. Cuando el muestreo se realiza con reemplazo, cada elemento elegido se devuelve a la población antes de hacer la siguiente selección.
Tabla de números aleatorios La tabla de números aleatorios proporciona listas de números generados al azar que pueden usarse para elegir muestras aleatorias. Escribir nombres o números en un pedazo de papel y extraerlos al azar es un método válido para una muestra aleatoria simple. Sin embargo, puede ser muy lento si el número de elementos de la población es grande. La tabla de números aleatorios proporciona un método sencillo y rápido para seleccionar al azar los números de los elementos de una población.
Otras técnicas de muestreo Si es posible obtener una muestra aleatoria simple es mejor, ya que por lo general éste es el mejor método. Es fácil realizarlo, es fácil entenderlo y no se puede aducir sesgo en la muestra una vez que se hizo la selección. Sin embargo, no siempre es posible realizar un muestreo aleatorio simple. Para que este método se pueda usar, debe disponerse de una lista de la población.
Otras técnicas de muestreo Una muestra sistemática es aquella para la que se selecciona cada n-ésimo elemento de la población. En un muestreo aleatorio estratificado la población se divide en estratos o subgrupos significativos y se obtiene una muestra aleatoria de cada uno. El muestreo por Conglomerado implica la selección aleatoria de grupos de conglomerados de elementos como parte de la muestra
Presentación de datos Distribuciones de frecuencia. • El concepto de distribución es importante en estadística . Este termino es utilizado para representar un conjunto, arreglo o grupo de valores numéricos. • Una distribución de frecuencias es una lista de clases o categorías de datos junto con el numero de valores que caen dentro de cada una.
Presentación de datos Pasos para la construcción de una distribución de frecuencias • Determinar el numero de clases, por lo general entre 5 y 15 • Determinar el tamaño de cada clase. Para ell se averigua la diferencia entre el valor más grande en el conjunto de datos y el más pequeño, y se divide entre el número de clases que se quiere • Determinar el punto inicial de la primera clase • Contar el número de valores que ocurren en cada clase • Preparar una tabla de la distribución, utilizando los recuentos y/o los porcentajes (frecuencias relativas) Nota: Estos pasos deben considerarse sólo como normas empiricas y no como un proceso riguroso para construir una distribución de frecuancias.
Presentación de datos Frecuencias relativas Las frecuencias relativas, o porcentajes, para una distribución de frecuencias se calculan dividiendo la frecuencia real entre el número total de objetos clasificados. Frecuencias acumuladas La distribución de frecuencias acumuladas muestra el numero total de ocurrencias que son menores o mayores que ciertos valores clave.
Presentación de datos Diagramas y gráficas Las distribuciones de frecuencias constituyen un método ideal para representar los aspectos esenciales de un conjunto de datos en términos entendibles y concisos. Aun así, los dibujos pueden ser más efectivos para desplegar grandes conjuntos de datos. Los diagramas y graficas mas sencillos en su construcción están diseñados para datos nominales u ordinales. Como los datos constituyen categorías, las clases son obvias y es fácil describirlas en una gráfica.
Presentación de datos Diagrama de Pastel (torta) Es una forma efectiva de desplegar los porcentajes en que se dividen los datos. Este tipo de diagrama es particularmente útil si se quiere hacer hincapié en los tamaños relativos de las componentes de los datos.
Presentación de datos Diagrama de barras El diagrama de barras es otro método habitual de presentar en forma gráfica datos con escala nominal u ordinal. Cada barra representa la frecuencia de una categoría. La altura de la barra es proporcional al número de elementos en esa categoría. En general, las barras se ponen en posición vertical con la base en el eje horizontal de la gráfica.
Presentación de datos El diagrama de pareto Es un caso especial del diagrama de barras, que se usa con frecuencia en control de calidad. Este tipo de diagrama consiste en barras que describen las componentes de una línea de producción o de montaje.
Presentación de datos Histograma Este tipo de gráficos es utilizado para la representación grafica de los datos con escala de intervalos o de razón. Las categorías se dibujan a lo largo del eje horizontal y los valores van en el eje vertical. Se parece a un diagrama de barras sólo que no hay espacio entre las barras.
Presentación de datos Polígono de frecuencias El polígono de frecuencias es otro método usual de presentar gráficamente datos con escalas de intervalos o de razón. Para construir el polígono de frecuencias se marcan las frecuencias sobre el eje vertical y los valores de la variable que se está midiendo sobre el eje horizontal, como el histograma.
Presentación de datos Ojiva Se usa para determinar cuantas observaciones hay mayores o menor que un valor determinado en una distribución. Una ojiva menor que indica cuantos elementos de la distribución tienen un valor menor que el limite superior de cada clase.
Estadística descriptiva • PROMEDIO, es una palabra genérica, es decir, existen varios tipos de PROMEDIOS. • Los PROMEDIOS que estudiaremos son: MEDIA, MEDIANA, MODA, MEDIA GEOMÉTRICA Y MEDIA ARMÓNICA. • Los promedios tienen en común que buscan el valor central de los datos estudiados. Por esta razón se los denomina: MEDIDORES DE LA TENDENCIA CENTRAL.
Estadística descriptiva • Media La media aritmética de un conjunto de valores numéricos es la suma de estos valores divididos entre el número de valores. El símbolo que se usa para la media poblacional es la letra griega µ (mu), y el símbolo para la media de la muestra es (x barra) Media Aritmética =
Estadística descriptiva Nota • Cualquier característica medible de una población, por ejemplo, la media de la población (µ), se llama parámetro. • Cualquier característica medible de una muestra, por ejemplo, la media muestral se llama estadístico.
Estadística descriptiva • La mediana de un conjunto de datos es el elemento central en un conjunto de observaciones dispuestas en orden de magnitud. Ejemplo: 5, 6, 8, 9, 11, 15, 17 La mediana es el número 9, pues antes que él, hay 3 números y después de él hay otros 3.
Estadística descriptiva La moda de un conjunto de datos es el valor que ocurre más veces, es decir, el de mayor frecuencia. La MODA puede no existir, e incluso, puede no ser única.
Estadística descriptiva Distribución simétrica y sesgada Distribución sesgada se representa por una curva que no tiene simetría, al contrario de la Distribución simétrica la cual identifica una curva que se puede dividir en dos partes iguales.