1 / 119

Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

1. Análisis de datos. 2. Análisis de datos bivariantes. 3. Correlación y regresión. 4. Series temporales y números índice. 5. Probabilidad. 6. Variables aleatorias. 7. Modelos discretos. 8. Modelos continuos. 9. Variables aleatorias multidimensionales: la distribución normal bivariante.

thane
Download Presentation

Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 1. Análisis de datos.2. Análisis de datos bivariantes.3. Correlación y regresión.4. Series temporales y números índice.5. Probabilidad.6. Variables aleatorias.7. Modelos discretos.8. Modelos continuos.9. Variables aleatorias multidimensionales: la distribución normal bivariante. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Programa de la asignatura Organización de la asignatura Clases teóricas y clases prácticas de ordenador. Se valorará positivamente la asistencia a las clases prácticas. Las prácticas se realizarán en aulas informáticas en horarios preestablecidos. Se utilizará el programa STATGRAPHICS. Profesora: Mónica Catalán Reyes

  2. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Organización de las prácticas Las prácticas de la asignatura serán realizadas con el paquete estadístico Statgraphics. En la biblioteca se puede conseguir un CD con una versión para estudiantes. El mínimo de prácticas en ordenador son 5: - Análisis de datos Univariante- Análisis de datos Bivariante- Regresión- Distribuciones (generación de datos por simulación)- Series temporales. Evaluación de la asignatura La evaluación de la asignatura será el examen final. Se contara positivamente la entrega de un trabajo y ejercicios, estas dos tareassumaráncomo máximo 0,5 puntos a la nota del examen. El trabajo consistirá en analizar una base de datos con dos variables cuantitativas. Realizar el análisis por separado de las variables (univariante) y el conjunto (bivariante) hasta el ajuste de un modelo de regresión. Profesora: Mónica Catalán Reyes

  3. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Bibliografía • PEÑA, D. y ROMO, J.: Introducción a la Estadística para las Ciencias Sociales. McGraw Hill, New York, 1997. • PEÑA, D.: Estadística. Modelos y Métodos, segunda edición, Alianza Universidad Textos, Madrid, 2001. Bibliografía Complementaria • MOORE, D. S.: The Basic Practice of Statistics, segunda edición, Freeman and Co., 2000. • - NEWBOLD, P.: Statistics for business and economics, cuarta edición, Prentice Hall, Englewood Cliffs, 1996. Profesora: Mónica Catalán Reyes

  4. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Introducción El objetivo del curso es la Introducción a los conceptos fundamentales del Análisis de Datos y de la Probabilidad. ¿Qué es la estadística? Es una poderosa herramienta para generar conocimiento que ha experimentado un gran desarrollo a lo largo del tiempo. ¿En qué áreas se aplica la estadística? Actualmente se aplica en todas las áreas del saber, por ejemplo en Sociología, Educación, Psicología, Administración, Economía, Medicina, Ciencias Políticas, entre otras. Ejemplos de su aplicación son: 1) En Administración de Empresas: la estadística se utiliza para evaluar un producto antes de comercializarlo. 2) En Economía: para medir la evolución de los precios mediante números índice o para estudiar los hábitos de los consumidores a través de encuestas de presupuestos familiares.

  5. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Introducción Ejemplos de su aplicación son: 3) En Ciencias Políticas: para conocer las preferencias de los electores antes de una votación mediante sondeos y así orientar las estrategias de los candidatos. 4) En Sociología: para estudiar las opiniones de los colectivos sociales sobre temas de actualidad. 5) En Psicología: para elaborar las escalas de los test y cuantificar aspectos del comportamiento humano (por ejemplo los test que se aplican a los candidatos para un cargo en una empresa). 6) En Medicina: uno entre muchos usos de la estadística, es para determinar el estado de salud de la población. En general en las Ciencias Sociales, la estadística se emplea para medir las relaciones entre variables y hacer predicciones sobre ellas.

  6. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Introducción Etapas de un estudio estadístico Un análisis estadístico se lleva a cabo siguiendo las etapas habituales en el llamado método científico cuyas etapas son: • Planteamiento del problema: consiste en definir el objetivo de la investigación y precisar el universo o población. • Recogida de la información: consiste en recolectar los datos necesarios relacionados al problema de investigación. • Análisis descriptivo: consiste en resumir los datos disponibles para extraer la información relevante en el estudio. • Inferencia estadística: consiste en suponer un modelo para la población e interpretación de los datos a la luz del modelo para obtener conclusiones generales. • Diagnóstico: consiste en verificar la validez de los supuestos del modelo que nos han permitido interpretar los datos y llegar a conclusiones sobre la población

  7. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Introducción Esquema de las etapas de un estudio estadístico DATOS AREA DE INTERES ORGANIZAR Y RESUMIR ESTADÍSTICA DESCRIPTIVA(Tablas, Gráficos, Medidas Descriptivas, etc.) • Tema de Investigación • Antecedentes Previos • Objetivos • Preguntas de Investigación • Posibles Hipótesis • Unidad de Análisis • Población • Variables INTERPRETACIÓN Muestra ¿Población o Muestra? INFERENCIA ESTADÍSTICA Población CONCLUSIONES Probabilidad INFORMACIÓN

  8. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Introducción Ejemplos de algunos problemas a estudiar 1) Se quiere estudiar si en cierto colectivo existe discriminación salarial debida al sexo de la persona empleada. 2) Se quiere determinar el perfil de los trabajadores en términos de condiciones económicas y sociales en diferentes comunidades. 3) Se quiere estudiar el consumo de las personas de una zona determinada en cuanto a vestuario, alimentación, ocio y vivienda. 4) Se quiere determinar las tallas estándar en vestuario para mujeres españolas. 5) Se quiere determinar el tiempo que dedican al trabajo y a la familia los trabajadores de distintas empresas del país. 6) Se quiere determinar el perfil sociodemográfico de los estudiantes de una Universidad. 7) Se quiere estudiar el gasto en teléfono móvil mensual de los estudiantes de una Universidad, y si éste tiene alguna relación con su edad u otras características.

  9. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Introducción Ejemplos de algunos problemas a estudiar 1) Se quiere estudiar si en cierto colectivo existe discriminación salarial debida al sexo de la persona empleada. 2) Se quiere determinar el perfil de los trabajadores en términos de condiciones económicas y sociales en diferentes comunidades. 3) Se quiere estudiar el consumo de las personas de una zona determinada en cuanto a vestuario, alimentación, ocio y vivienda. 4) Se quiere determinar las tallas estándar en vestuario para mujeres españolas. 5) Se quiere determinar el tiempo que dedican al trabajo y a la familia los trabajadores de distintas empresas del país. 6) Se quiere determinar el perfil sociodemográfico de los estudiantes de una Universidad. 7) Se quiere estudiar el gasto en teléfono móvil mensual de los estudiantes de una Universidad, y si éste tiene alguna relación con su edad u otras características.

  10. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Resumen de algunos conceptos planteados en la Introducción • VARIABLE: es lo que se va a medir y representa una característica de la UNIDAD DE ANÁLISIS. • ¿QUIÉNES VAN A SER MEDIDOS?: Los sujetos u objetos o Unidades de Análisis de una Población o una Muestra • POBLACIÓN : Es el total de unidades de análisis que son tema de estudio. • MUESTRA: Es un conjunto de unidades de análisis provenientes de una población. Población: “Las personas que trabajanen empresas de comunicación” Muestra Muestra: 60 trabajadores de empresas de comunicación Unidad de análisis: Trabajador de empresa de comunicación Variables: sexo, edad, salario, Nº de horas de trabajo, etc. Mónica Catalán Reyes-2007

  11. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Resumen de algunos conceptos planteados en la Introducción • Problema de Investigación • Antecedentes Previos • Objetivo • Preguntas de Investigación • Posibles Hipótesis • Unidad de Análisis • Población • Variables Respuesta al problema de investigación INFORMACIÓN Herramientas Estadísticas Mónica Catalán Reyes-2007

  12. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 ACTIVIDAD 1 Vamos a trabajar en los siguientes problemas de investigación: 6) Se quiere determinar el perfil sociodemográfico de los estudiantes de una Universidad; y 7) Se quiere estudiar el gasto en teléfono móvil mensual de los estudiantes de una Universidad, y si éste tiene alguna relación con su edad u otras características. Definir: Población bajo estudio, unidad de análisis, variables de interés.

  13. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 El total de elementos de la población serán N y los de la muestra n MUESTRA La muestra se genera a través de algún tipo de muestreo PROBABILISTICO NO PROBABILISTICO - Todas las unidades de la población tienen alguna probabilidad de ser seleccionadas. - Para obtener la muestra se requiere tener identificados los elementos de la población. -  Los elementos de la población se identifican a través de un listado de elementos, denominado marco muestral. - Para obtener una muestra se requiere de datos previos acerca de la población. - Una de sus ventajas es que puede medirse el tamaño del error en las predicciones. Muestreo aleatorio simple Muestreo sistemático Muestreo estratificado Mónica Catalán Reyes-2004

  14. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 El total de elementos de la población serán N y los de la muestra n MUESTRA La muestra se genera a través de algún tipo de muestreo PROBABILISTICO NO PROBABILISTICO • - Este tipo de muestra también se denomina muestra dirigida. • Suponen un procedimiento de selección informal y un poco arbitrario. • La elección de los elementos no depende de la probabilidad, sino de causas relacionadas con las características del investigador. • Son utilizadas en algunas investigaciones y a partir de ellas se hacen inferencias hacia la población. • La muestra dirigida selecciona sujetos típicos, con la esperanza de que serán casos representativos de una población determinada. Muestra de sujetos voluntarios Muestra de expertos Muestra de sujetos-tipo Muestra por cuotas

  15. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Variable: corresponde a la característica de la Unidad de Análisis TIPOS DE VARIABLES Variables Cualitativas Variables Cuantitativas ORDINAL NOMINAL CONTINUA DISCRETA Tipos de escalaIntervalo o Razón Característica o cualidad cuyas categorías no tienen un orden preestablecido. Ejemplos: Sexo, Deporte Favorito, etc. Toma valores enteros Ejemplos: Número de Hijos, Número de empleados de una empresa, Número de asignaturas aprobadas en un semestre, etc. Toma cualquier valor dentro de un intervalo Ejemplos: Peso (escala de Razón); Estatura (escala de Razón); Temperatura (Escala de Intervalo), etc. Característica o cualidad cuyas categorías tienen un orden preestablecido. Ejemplos: Calificación (S, N, A); Grado de Interés por un tema, etc. Escala de Razón: Tiene un cero absoluto, el cambio de unidad de medida no afecta la descripción de la variable. Escala Intervalo:Tiene un cero arbitrario y al cambiar de unidad de medida cambia la descripción de la variable. Unidad de Medida: Gramos o Kilos para la variable Peso; Grados C o F para Temperatura

  16. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Frecuencia: desde un conjunto de unidades, corresponde al Número o Porcentaje de veces que se presenta una característica. Variable Cuantitativa Variable Cualitativa Variable Cualitativa Variable Cuantitativa NOMINAL CONTINUA NOMINAL CONTINUA ORDINAL ORDINAL DISCRETA DISCRETA Frecuencia Absoluta (F) Frecuencia Relativa (f) TIPO FRECUENCIA Frecuencia Absoluta Acumulada (FAA) Frecuencia Relativa Acumulada (fra)

  17. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Problema de Investigación: Se quiere establecer el perfil de las industrias de conserva en función de algunas características. Unidad de Análisis: Industria de Conserva Población: Industrias de Conservas del país EJEMPLO Variables - Tipo de Industria: se clasifica en industria tipo A, B, C o D. (cualitativa nominal) - Nº de Empleados: se refiere al número de empleados en las líneas de producción. (cuantitativa discreta) - Superficie: se refiere a los metros cuadrados (unidad de medida) disponibles para las áreas de producción. (cuantitativa continua) - Calificación: calificación realizada por una institución pública sobre cumplimiento de ciertos estándares (Muy Bien, Bien, Regular, Mal). (cualitativa ordinal) Datos

  18. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Problema de Investigación: Se quiere establecer el perfil de las industrias de conserva en función de algunas características. Unidad de Análisis: Industria de Conserva Población: Industrias de Conservas del país EJEMPLO TABLAS DE FRECUENCIA (2) (1) (3) (4)

  19. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Problema de Investigación: Se quiere establecer el perfil de las industrias de conserva en función de algunas características. Unidad de Análisis: Industria de Conserva Población: Industrias de Conservas del país EJEMPLO 1) Titulo General Elementos que observamos en las TABLAS 2) Titulo por columna/fila Auto-explicativa 3) Frecuencias 4) Fuente Tabla 1: Distribución de las Industrias de Conservas de acuerdo a Tipo de Industria desde tabla de frecuencias (1) Fuente: Informe 2006, Ministerio de Industria y Energía

  20. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Pregunta: ¿Cómo se construye una tabla cuando la variable es Cuantitativa (x)? • 1) Determinar el número de clases o intervalos (k) (C1, C2, ..., Ck): • Total de unidades de análisis (n) • Regla de Sturges: k =1 + 3,3 logn • 2) Determinar amplitud del intervalo • - Valor mínimo que toma la variable en el grupo, min(xi) i=1, 2,...,n. • Valor máximo que toma la variable en el grupo, max(xi) i=1, 2,...,n. • Rango= max(xi)-min(xi) = R • Amplitud =(R+1)/k = a • 3) Construir los intervalos: Límite inferior y Limite superior de cada intervalo • LIj =Límite inferior de la clase j, j=1, 2,...,k • LSj =Límite superior de la clase j, j=1, 2,...,k • LI1 = min(xi)-(1/2) • LS1 = LI1 + a • LI2 = LS1 • LS2 = LI2+ a • .....

  21. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Respuesta: Confeccionar la tabla aplicando el procedimiento anterior Elementos de una tabla de frecuencia cuando la variable es continua (x) [LI1 ; LS1 [ [LI2 ; LS2 [ [LIk ; LSk] aj = (LSj – LIj)) cj = (LIj) + LSj )/2

  22. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Ejercicio: confección de una tabla de frecuencia para una variable continua Los datos corresponden a la edad de los hijos de los trabajadores de una empresa Realice la siguiente actividad • Construya un Diagrama de Tallo y Hoja • ¿Cuál es la variable?; ¿Cuál es la Unidad de análisis?; ¿Cuánto vale n?; ¿Cuál es el rango de la variable?. • Sobre una Tabla de frecuencia: ¿Cuántos intervalos podría construir?; ¿Cuál es la amplitud de cada intervalo?; ¿Cuántas medidas de frecuencia puede obtener para cada intervalo?. • Construir tabla de frecuenciapara la variable: Intervalos, centro de clase, amplitud, frecuencias. Datos ordenados de menor a mayor Diagrama de Tallo y Hoja: permite organizar los datos de una variable medida sobre un conjunto de individuos. Su utilidad viene dada cuando no contamos con herramientas automáticas para ordenar los datos. Mónica Catalán Reyes-2004

  23. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Gráfico de Sectores Circulares (de Torta) TIPOS DE GRÁFICOS

  24. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 TIPOS DE GRÁFICOS 2. Gráfico de Barras • Este tipo de gráfico se utiliza generalmente para representar la frecuencia de las categorías de una variable cualitativa. • Cuando una variable es cuantitativa se puede utilizar este tipo de gráfico sólo si la variable se ha transformada en categorías. • Hay distintas versiones de estos gráficos (por ejemplo en Excel), y en algunos casos son muy útiles para describir el comportamiento de una variable en distintos grupos.

  25. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 TIPOS DE GRÁFICOS 3. Histograma Histograma Distribución de los hijos de trabajadores de la empresa de acuerdo a edad • Histograma • - Permite la representación de la frecuencia de una variable Cuantitativa. • El ejex se refiere a la variable. • El ejey se refiere a la frecuencia (Nº , %). • Cada barra representa la frecuencia de la variable en la población en estudio (o la muestra). • El histograma se puede construir desde los datos de la tabla de frecuencia de la variable en estudio. Nº edad Ejemplo En el gráfico se puede observar el número de hijos de menor edad (7-8 años), las de mayor edad (13-14 años); y además que la mayoría de hijos de los trabajadores están entre los 10 y 12 años.

  26. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 TIPOS DE GRÁFICOS 5. Polígono de Frecuencia Distribución de los hijos de trabajadores de la empresade acuerdo a edad • Esta representación se basa en el Histograma. • Sólo es útil para variables cuantitativas. • El eje x se refiere a la variable. • El ejey se refiere a la frecuencia (Nº , %). • Los puntos que permiten la unión de las líneas representa el centro de clase (o marca de clase). edad Nº

  27. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 TIPOS DE GRÁFICOS 5. Diagrama de Caja Edad de las personas que se realizaron angioplastía entre 1980 y 2000 • Permite identificar gráficamente la media, los percentiles 25 y 75, mínimo y máximo de una variable. • Sólo es útil para variables cuantitativas. • El eje x permite identificar la poblacion en estudio. • El ejey representa los valores de la variable en estudio.

  28. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 TIPOS DE GRÁFICOS 5. Diagrama de Caja Edad de las personas que se realizaron angioplastía entre 1980 y 2000 máximo Percentiles 75 media • Permite identificar gráficamente la media, los percentiles 25 y 75, mínimo y máximo de una variable. • Sólo es útil para variables cuantitativas. • El eje x permite identificar la poblacion en estudio. • El ejey representa los valores de la variable en estudio. media Percentil 25 mínimo

  29. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 TIPOS DE GRÁFICOS 5. Diagrama de Caja Edad de las personas que se realizaron angioplastía entre 1980 y 2000 máximo Percentiles 75 media media Percentil 25 mínimo

  30. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 TIPOS DE GRÁFICOS 6. Otros

  31. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 TIPOS DE GRÁFICOS OBSERVACIONES * El Tipo de Gráfico seleccionado va a depender de la variable en estudio. * El Gráfico debe contener un Título General y la identificación de cada eje (variable en estudio y frecuencia). * En ocasiones resulta más ilustrativo un gráfico que una tabla de frecuencia. * Al igual que las tablas, los gráficos deben ser auto-explicativos.

  32. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 NOTACION Variables Cuantitativas OBSERVACIONES * El Tipo de Gráfico seleccionado va a depender de la variable en estudio. * El Gráfico debe contener un Título General y la identificación de cada eje (variable en estudio y frecuencia). * En ocasiones resulta más ilustrativo un gráfico que una tabla de frecuencia. * Al igual que las tablas, los gráficos deben ser auto-explicativos.

  33. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 • Media Aritmética (Promedio) • Mediana • Moda MEDIDAS DE TENDENCIA CENTRAL Datos Cuantitativos Datos Cuantitativos ordenados de menor a mayor Mediana Media Aritmética o Promedio Si n es impar Si n es par Moda Datos Cualitativos y Cuantitativos

  34. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 • Percentil (ejemplo: 25, 50, 75) • Decil (ejemplo: 4, 5, 8) • Cualtil (ejemplo: 1, 2, 3) Percentiles, Deciles o Cuartiles Percentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando losndatos están ordenados de Menor a Mayor El Percentil va de 1 a 100 El percentil 25 (25/100): es el valor de la variable que reúne al menos el 25% de los datos Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posición 20. Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posición 22. El Decil va de 1 a 10 El Decil 4 (4/10): es el valor de la variable que reúne al menos el 40% de los datos Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posición 32. Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posición 34. El Cuartil va de 1 a 4 El Cuartil 3 (3/4): es el valor de la variable que reúne al menos el 75% de los datos Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posición 60. Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posición 64.

  35. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 • Rango • Varianza • Desviación Estándar MEDIDAS DE DISPERSIÓN Datos Cuantitativos Varianza Rango Desviación Estándar Comparación entre Variables Se refiere al comportamiento de las variables cuantitativas en un grupo. Por ejemplo: Si se tiene un conjunto de personas a las que se les mide Estatura, Peso, Edad: Entre estas variables ¿cuál presenta mayor variación? Coeficiente de Variación

  36. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 • Asimetría • Kurtosis o Apuntamiento Otras medidas o Coeficientes Además de la posición y la dispersión de los datos, otra medida de interés en una distribución de frecuencias es la simetría y el apuntamiento o kurtosis. Si CA=0 si la distribución es simétrica alrededor de la media. Si CA<0 si la distribución es asimétrica a la izquierda Si CA>0 si la distribución es asimétrica a la derecha Coeficiente de Asimetría - Si CAp=3 la distribución se dice normal (similar a la distribución normal de Gauss) y recibe el nombre de mesocúrtica. - Si CAp>3, la distribución es más puntiaguda que la anterior y se llama leptocúrtica, (mayor concentración de los datos en torno a la media). - Si CAp<3 la distribución es más plana y se llama platicúrtica. Coeficiente de Apuntamiento

  37. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 • Asimetría • Kurtosis o Apuntamiento Otras medidas o Coeficientes Ejemplos

  38. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 • Asimetría • Kurtosis o Apuntamiento Otras medidas o Coeficientes Ejemplos Histograma Medidas descriptivas Datos

  39. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Rango Intercuatilico (RI): es la diferencia entre el tercer y el primer cuartil RI=C3-C1 Del ejemplo anterior se tiene que Q1=C1=3 y Q3=C3=5 por lo tanto RI= 5-3=2 • Comparación de la Media y la Mediana: Robustez • Los datos atípicos son datos extremos o lejanos de la mayoría de las observaciones. • La media y la mediana tienen un comportamiento diferente frente a los datos atípicos • La media en su calculo considera todos los datos, incluyendo los datos atípicos. • La mediana es una medida que se ve poco afectada por los datos atípicos, no los considera en su calculo dado que separa los datos. • Sobre la base de lo anterior, la mediana es una medida robusta en comparación con la media.

  40. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Media, Desviación típica, Coeficientes de Asimetría y Apuntamiento para datos Agrupados (tabla de frecuencias) 2) La Desviación típica para datos agrupados esta dada por: Tabla de frecuencia (para variable cuantitativa) n1 f1 n2 f2 3) El Coeficiente de Asimetría para datos agrupados esta dado por: nk fk Sea cj la marca de clase (o centro de clase) y fj la frecuencia relativa de la clase j, donde j=1, 2,…, k. 1) La Media para datos agrupados es igual a la suma de los productos de las marcas de clase por sus frecuencias relativas, de la forma: 4) El Coeficiente de apuntamiento para datos agrupados esta dada por:

  41. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Media, Desviación típica, Coeficientes de Asimetría y Apuntamiento para datos Agrupados (tabla de frecuencias) Tabla de frecuencia (para variable cuantitativa) 5) La Mediana para datos agrupados es igual a la clase o intervalo que concentra al menos el 50% de los datos. Para esto se observan las frecuencias relativas acumuladas n1 FA1 fa1 f1 n2 f2 FA2 fa2 nk fk 6) El cuartil 1 (Q1 o C1) para datos agrupados es igual a la clase o intervalo que concentra al menos el 25% de los datos. Observar las frecuencias relativas acumuladas. Sea cj la marca de clase (o centro de clase), fj la frecuencia relativa de la clase j, donde j=1, 2,…, k. Sea Fajla frecuencia absoluta acumulada de la clase j y faj la frecuencia relativa acumulada de la clase j, donde j=1, 2,…, k. 6) El cuartil 3 (Q3 o C3) para datos agrupados es igual a la clase o intervalo que concentra al menos el 75% de los datos. Observar las frecuencias relativas acumuladas. Se pueden obtener percentiles y deciles

  42. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Descripción de 2 variables cualitativas Distribución conjunta Problema Interesa estudiar cual es el principal medio de transporte preferido por un grupo de personas a la hora de dirigirse al centro comercial. Para esto se consultó a cada persona sobre la actividad a la que se dedicaba y el medio de transporte preferido.

  43. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Descripción de 2 variables cualitativas Distribución conjunta Nº de personas Actividad: confeccionar tabla con porcentajes respecto del total de personas (n=60)

  44. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Descripción de 2 variables cualitativas Distribución conjunta Nº de personas y % respecto de tipo de Transporte

  45. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Descripción de 2 variables cualitativas Distribución conjunta Nº de personas y % respecto de tipo de Actividad

  46. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 • Resumen: análisis de frecuencia de 2 variables cualitativas • Si tenemos dos variables cualitativas podemos construir una tabla de doble entrada con las frecuencias absolutas Fij, donde i=1, 2,…, m y j=1, 2,…, k. • La frecuencia relativa conjunta se obtiene dividiendo cada Fij por n y se escribe fij. • La distribución marginal de la 1ª variable se obtiene calculando • i=1,2,…,m • La distribución marginal de la 2ª variable se obtiene calculando • j=1,2,…,k • La distribución condicionada se refiere a estudiar la distribución de una variable dado un nivel o categoría de la otra variable.

  47. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Descripción de 2 variables cuantitativas Distribución conjunta Problema Interesa estudiar el numero de piezas que se le cambiaron a las máquinas que fallaron un número determinado de veces en un año. Para esto se tiene el registro de una partida de 104 máquinas que presentaron fallas en una región. • Calcular lo siguiente • Distribución relativa conjunta • Distribución del número de fallos condicionada a 3 piezas. • La media del numero de fallos • La media del numero de piezas • La media del numero de fallos condicionada a las 2 piezas

  48. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Descripción de 2 variables cuantitativas Solución Problema Interesa estudiar el numero de piezas que se le cambiaron a las máquinas que fallaron un número determinado de veces en un año. Para esto se tiene el registro de una partida de 104 máquinas que presentaron fallas en una región. Distribución relativa conjunta Media Nº de piezas=2,62 Media de fallos=2,28 • Calcular lo siguiente • Distribución relativa conjunta • Distribución del número de fallos condicionada a 3 piezas. • La media del numero de fallos • La media del numero de piezas • La media del numero de fallos condicionada a las 2 piezas Cov(x,y)= (0. 1.0,038+ 0. 2 .0,048+…+ 4. 3 .0,202)- 2,62.2,28 =6,19-5,96 = 0,23

  49. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Descripción de 2 variables cuantitativas • Si se tienen 2 variables cuantitativas discretas que se miden a un conjunto de unidades se puede construir: • Tablas de doble entrada de frecuencias a absolutas y de frecuencias relativas. • Distribución marginal de cada variable. • Distribución de una variable condicionada a una categoría de la otra. Distribución conjunta Frecuencia Relativas Frecuencia Absolutas Medidas que se pueden calcular Covarianza de x con y Media o promedio de x y de y Desviación típica de x y de y Correlación de x con y

  50. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Ejemplo 1 Sobre los datos que se tienen para el curso Aplicar todo lo visto hasta ahora sobre estadística descriptiva, no olvide identificar el problema, la unidad de análisis, las variables en estudio (definición de cada una de ellas donde se identifique la unidad de medida para las variables cuantitativas y las categorías de las variables cualitativas).

More Related