370 likes | 838 Views
Descripción de una variable. Tema 1. Descripción breve del tema. Definiciones fundamentales Tabla de frecuencias Datos agrupados Medidas de posición Medidas de tendencia central: media, mediana, moda Cuantiles Medidas de dispersión Varianza, desviación típica, rango
E N D
Descripción de una variable Tema 1 Depto. Estadística, Universidad Carlos III
Descripción breve del tema • Definiciones fundamentales • Tabla de frecuencias • Datos agrupados • Medidas de posición • Medidas de tendencia central: media, mediana, moda • Cuantiles • Medidas de dispersión • Varianza, desviación típica, rango • Representaciones gráficas • Diagrama de barras, histograma, diagrama de cajas… • Medidas de forma • Asimetría, curtosis Depto. Estadística, Universidad Carlos III
Objetivos • Reconocer el papel de la Estadística en la resolución de problemas. • Conocer los términos básicos que se utilizan en Estadística. • Interpretar las representaciones gráficas asociadas a un conjunto de datos. • Conocer los estadísticos básicos que se utilizan para describir una muestra. Depto. Estadística, Universidad Carlos III
Descripción breve del tema • Definiciones fundamentales • Tabla de frecuencias • Datos agrupados • Medidas de posición • Medidas de tendencia central: media, mediana, moda • Cuantiles • Medidas de dispersión • Varianza, desviación típica, rango • Representaciones gráficas • Diagrama de barras, histograma, diagrama de cajas… • Medidas de forma • Asimetría, curtosis Depto. Estadística, Universidad Carlos III
Definiciones fundamentales • Población: conjunto de elementos de los que se estudia una característica. Tamaño de la población es su número de elementos (N, puede ser infinito). N = 50 • Muestra: conjunto (representativo) de elementos de la población. Tamaño de la muestra es su número de elementos (n). n = 11 • Individuo: cada elemento de la población. Depto. Estadística, Universidad Carlos III
Definiciones fundamentales • Variable: característica a estudiar en los individuos de la población (X ó Y). • Dato: valor, numérico o no, que toma la variable sobre un individuo concreto de la muestra, (x ó y). Depto. Estadística, Universidad Carlos III
Tipos de variables • Cuantitativa: toma valores numéricos • Discreta: el conjunto de valores que puede tomar es finito o numerable. • Número de hijos. • Continua: puede tomar una cantidad infinita no numerable de valores. • Duración de una batería. • Cualitativa: los valores que toma se corresponden con cualidades no cuantificables Depto. Estadística, Universidad Carlos III
Descripción breve del tema • Definiciones fundamentales • Tabla de frecuencias • Datos agrupados • Medidas de posición • Medidas de tendencia central: media, mediana, moda • Cuantiles • Medidas de dispersión • Varianza, desviación típica, rango • Medidas de forma • Asimetría, curtosis • Representaciones gráficas • Diagrama de barras, histograma, diagrama de cajas… Depto. Estadística, Universidad Carlos III
Tabla de frecuencias Tenemos k valores distintos en la muestra x1,…, xk • Frecuencia absoluta de un valor xi número de veces que aparece xi en la muestra, ni • Frecuencia relativa de un valor xi cociente de frecuencia absoluta entre tamaño, fi= ni /n Si tenemos variables cuantitativas, ordenamos x1<…< xk • Frecuencia absoluta acumulada del valor i-ésimo suma de las frecuencias absolutas hasta la de xi, Ni=n1+…+ni • Frecuencia relativa acumulada del valor i-ésimo frecuencia absoluta acumulada entre tamaño, Fi= Ni /n Depto. Estadística, Universidad Carlos III
Tabla de frecuencias Altura de los alumnos de una clase (en cm). Se ha cogido una muestra de tamaño n = 12, obteniendo los siguientes datos: 174, 180, 187, 174, 179, 172, 180, 180, 176, 180, 160, 160 Depto. Estadística, Universidad Carlos III
Descripción breve del tema • Definiciones fundamentales • Tabla de frecuencias • Datos agrupados • Medidas de posición • Medidas de tendencia central: media, mediana, moda • Cuantiles • Medidas de dispersión • Varianza, desviación típica, rango • Representaciones gráficas • Diagrama de barras, histograma, diagrama de cajas… • Medidas de forma • Asimetría, curtosis Depto. Estadística, Universidad Carlos III
Datos agrupados A veces es necesario agrupar los datos de una variable cuantitativa. • Muestra grande y difícil de manejar • Variable continua y no se repite ningún valor Clase: cada intervalo en que se agrupan los datos, pueden ser del mismo tamaño o no. Marca de clase: punto medio del intervalo. El número de clases suele tomarse entre 5 y 20, generalmente entero más próximo a n1/2 . Depto. Estadística, Universidad Carlos III
Tabla de frecuencias (agrupados) Altura de los alumnos de los N = 48 alumnos de la clase de la tabla anterior. Depto. Estadística, Universidad Carlos III
Descripción breve del tema • Definiciones fundamentales • Tabla de frecuencias • Datos agrupados • Medidas de posición • Medidas de tendencia central: media, mediana, moda • Cuantiles • Medidas de dispersión • Varianza, desviación típica, rango • Representaciones gráficas • Diagrama de barras, histograma, diagrama de cajas… • Medidas de forma • Asimetría, curtosis Depto. Estadística, Universidad Carlos III
Valores típicos o representativos que pretenden resumir los datos en un solo valor. Media: es la media aritmética de los datos (su centro de gravedad). Es sensible a valores extremos y particularmente útil cuando los datos son simétricos respecto a ella. Medidas de tendencia central Depto. Estadística, Universidad Carlos III
Mediana: al menos la mitad de los datos son mayores o iguales que ella y al menos la mitad son menores o iguales. No es sensible a valores extremos (es robusta). Moda: es el valor con mayor frecuencia (no tiene por qué se único) Medidas de tendencia central Depto. Estadística, Universidad Carlos III
Medidas de tendencia central = 175.17 Me = 177.5 Moda = 180 174, 180, 187, 174, 179, 172, 180, 180, 176, 180, 160, 160 Depto. Estadística, Universidad Carlos III
Cuantiles Son medidas de posición no central. • Cuartiles: dividen a la muestra en 4 partes iguales (Q1, Q2, Q3). • Percentiles: dividen a la muestra en 100 partes iguales (P25= Q1). • Deciles: dividen a la muestra en 10 partes iguales. Depto. Estadística, Universidad Carlos III
Cuantiles Dada la muestra de alturas de alumnos • Primer cuartil = 173.5 • Segundo cuartil (mediana) = 177.5 • Tercer cuartil = 180 • Valores extremos: 160 y 187 Depto. Estadística, Universidad Carlos III
Descripción breve del tema • Definiciones fundamentales • Tabla de frecuencias • Datos agrupados • Medidas de posición • Medidas de tendencia central: media, mediana, moda • Cuantiles • Medidas de dispersión • Varianza, desviación típica, rango • Representaciones gráficas • Diagrama de barras, histograma, diagrama de cajas… • Medidas de forma • Asimetría, curtosis Depto. Estadística, Universidad Carlos III
Medidas de dispersión Cuantifican la dispersión de los datos de la muestra. • Varianza: promedio de las desviaciones cuadráticas a la media • Desviación típica: raíz cuadrada de la varianza Depto. Estadística, Universidad Carlos III
Medidas de dispersión • Aplicación de la desviación típica (y media): Al menos el 100(1-1/k2)% de los datos están en el intervalo • Ejemplo: Anotación de Pau Gasol en los 51 partidos que jugó en la temporada 2006/2007. 4; 10; 10; 10; 11; 11; 12; 12; 13; 13; 15; 15; 16; 16; 16; 16; 17; 17; 19; 19; 20; 21; 21; 21; 21; 22; 22; 22; 23; 23; 23; 23; 23; 23; 24; 24; 24; 24; 25; 25; 25; 27; 28; 28; 29; 29; 30; 30; 31; 31; 34. Anotación media = 20.55 ; Desv. Típica anotación = 6.64 Depto. Estadística, Universidad Carlos III
Medidas de dispersión • Rango: Distancia entre observaciones extremas, xk – x1 • Rango intercuartílico: Distancia entre el tercer y el primer cuartil, RI = Q3– Q1 • Coeficiente de variación: CV = s / • MEDA = Mediana|X-Mediana(X)| Depto. Estadística, Universidad Carlos III
Medidas de dispersión Partimos de los datos: 174, 180, 187, 174, 179, 172, 180, 180, 176, 180, 160, 160 • Varianza = 60.14 • Desv. Típica = 7.75 • Rango = 27 • Rango intercuartílico = 6.5 • Coeficiente de variación = 4.43% • MEDA = 3 Depto. Estadística, Universidad Carlos III
Media = 174.65 Mediana = 174 Moda = 180 Primer cuartil = 169.5 Tercer cuartil = 180 Varianza = 58.40 Desv. típica = 7.64 Rango = 27 RI = 10.5 CV = 4.38% Medidas de posición y dispersiónpara los N = 48 individuos obtenemos Depto. Estadística, Universidad Carlos III
Descripción breve del tema • Definiciones fundamentales • Tabla de frecuencias • Datos agrupados • Medidas de posición • Medidas de tendencia central: media, mediana, moda • Cuantiles • Medidas de dispersión • Varianza, desviación típica, rango • Representaciones gráficas • Diagrama de barras, histograma, diagrama de cajas… • Medidas de forma • Asimetría, curtosis Depto. Estadística, Universidad Carlos III
Diagrama de barras Cada barra tiene como longitud la frecuencia de la variable que representa. Se utiliza con variables cualitativas o cuantitativas discretas. Diagrama de barras para el Congreso de los Diputados Depto. Estadística, Universidad Carlos III
Diagrama de sectores Cada sector del círculo tiene un área proporcional al valor que representa. Se utiliza con variables cualitativas o cuant. discretas con pocos valores. Diagrama de sectores para el Congreso de los Diputados Depto. Estadística, Universidad Carlos III
Diagrama de cajasAparecen cuartiles, mediana y valores extremos Depto. Estadística, Universidad Carlos III
Histograma El área de cada rectángulo es proporcional a su frecuencia. Se utiliza para variables cuantitativas (continuas), precisa de su agrupamiento. Histograma y polígono (poligonal) de frecuencias para las clases de la diapositiva 13 Depto. Estadística, Universidad Carlos III
Muestra de n = 12 individuos 16 | 00 17 | 24469 18 | 00007 Población con los N = 48 individuos 16 | 000 16 | 23 16 | 4 16 | 16 | 888899 17 | 000001 17 | 22233 17 | 445 17 | 6 17 | 8999 18 | 0000000 18 | 23 18 | 445555 18 | 77 Diagrama de tallos y hojas Anotación Pau Gasol Temporada 06/07 0 | 4 0 | 1 | 000112233 1 | 5566667799 2 | 011112223333334444 2 | 55578899 3 | 00114 Depto. Estadística, Universidad Carlos III
Descripción breve del tema • Definiciones fundamentales • Tabla de frecuencias • Datos agrupados • Medidas de posición • Medidas de tendencia central: media, mediana, moda • Cuantiles • Medidas de dispersión • Varianza, desviación típica, rango • Representaciones gráficas • Diagrama de barras, histograma, diagrama de cajas… • Medidas de forma • Asimetría, curtosis Depto. Estadística, Universidad Carlos III
Medidas de forma • Coeficiente de Asimetría: sirve para estudiar las desviaciones respecto de la media Depto. Estadística, Universidad Carlos III
Asimetría CA<0 CA>0 CA~0 Depto. Estadística, Universidad Carlos III
Medidas de forma • Coeficiente de Apuntamiento (o curtosis): indica el grado de concentración de los valores que toma la variable en torno a su media Depto. Estadística, Universidad Carlos III
Apuntamiento o curtosis CAp>0 CAp<0 CAp~0 Depto. Estadística, Universidad Carlos III