280 likes | 818 Views
Al hacer Un sondeo de opinión El control de calidad de un artículo Un estudio para conocer la efectividad de un medicamento Calcular la composición futura de una población .... Estamos haciendo. Estadística. Tipos de Estadística. La Estadística descriptiva o deductiva:
E N D
Al hacer • Un sondeo de opinión • El control de calidad de un artículo • Un estudio para conocer la efectividad de un medicamento • Calcular la composición futura de una población • .... Estamos haciendo Estadística
Tipos de Estadística • La Estadística descriptiva o deductiva: • Trata del recuento, ordenación y clasificación de los datos obtenidos de las observaciones: • Construcción de tablas, gráficos y cálculo de parámetros. • La Estadística inferencial o inductiva: • Utiliza los resultados de la estadística descriptiva y se apoya en el cálculo de probabilidades para la obtención de conclusiones sobre una población a partir de los resultados obtenidos de una muestra.
Población, muestra y variable estadística Población: Conjunto de elementos que se quiere estudiar. • Habitantes de una ciudad. • Televisores fabricados en una factoría. • Alumnos de primero de bachillerato. Muestra: Cualquier subconjunto de una población. El número de elementos de una muestra se llama tamaño. Variable estadística: Cada uno de los rasgos o características que se quiere estudiar de los elementos de la población, susceptible o no de medida. • Color del pelo: negro, castaño, rubio o pelirrojo • Sexo: hombre o mujer • Miembros asalariados de una familia: 0, 1 , 2 , 3 ,4 , 5 • Alturas de alumnos:178, 169, 172, 183, …
Variables cualitativas y cuantitativas Población: Alumnos de bachillerato de una localidad determinada • Sexo • Modelo de zapatillas deportivas • Barrio de la localidad en que vive • Deporte preferido (modalidad) • Número de hermanos • Núm.de suspensos en la 1ª evaluación • Núm de libros leídos trimestralmente • Num. de llamadas telefónicas diarias (Recuentos) (números) • Tiempo diario delante del televisor • Tiempo de estudio • Altura • Peso • Tiempo empleado en llamadas (Cualquier cantidad en un intervalo)
Variables cualitativas: Distribución de frecuencias Clase modal o moda Frecuencia absoluta del valor xi: Número de veces que se repite. Se representa por fi. Frecuencia relativa del valor xi: Cociente entre la frecuencia absoluta de xi y el número total de datos de la distribución. Se representa por hi. Propiedades: Las frecuencias absolutas fi , i= 1,..., r, verifican: I ni 0 II n1 + n2 + n3 + ... + nr = N Las frecuencias relativas hi, i= 1,..., r, verifican: I hi 0 II h1 + h2 + h3 + ... + hr = 1
Variables cualitativas: Representación gráfica Diagrama de Barras Diagrama de Sectores
Variables cuantitativas discretas: Distribución de frecuencias Frecuencias absolutas Diagrama de barras y polígono de frecuencias Frecuencias absolutas acumuladas Diagrama de barras y polígono de frecuencias Un profesor tiene anotadas en su cuaderno las notas de 30 alumnos de un clase: 5 3 4 1 2 8 9 8 7 6 6 7 9 8 7 7 1 0 1 5 9 9 8 0 8 8 8 9 5 7 Tabla de Frecuencias Frecuencia absoluta acumulada de xi: Suma de las frecuencias absoluta de todos los valores anteriores a xi más la frecuencia absoluta de xi: Fi=f1+f2+f3+…+f1 Frecuencia relativa acumulada de xi: Cociente entre la frecuencia absoluta acumulada de xi y el número total de datos: Hi = Fi/N = h1+h2+h3+…+hi
Agrupación de datos • Si la variable es continua, o discreta con un número de datos muy grande, es aconsejable agrupar los datos en CLASES. • ¿Cuál es el número idóneo de clases? • El número clases debe ser aproximadamente igual a la raíz cuadrada positiva del número de datos. • ¿Cómo escoger las clases? • Es aconsejable que los límites de clase (tanto el superior como el inferior) sean números “redondos”, como múltiplos de 5, 10, … • Se debe procurar que todas las clases tengan la misma amplitud o tamaño. • Los intervalos se deben construir de modo que el límite superior de una clase coincida con el límite inferior de la siguiente. • Adoptaremos el criterio de que los intervalos sean cerrados por la izquierda y abiertos por la derecha.
Tabla estadística 10 0 15 20 25 30 5 0 5 10 15 20 25 30 Variables cuantitativas discretas: Datos agrupados Histograma Los histogramas se utilizan generalmente para distribuciones de variable continua o discreta con gran número de datos y que se han agrupado en clases. Si los intervalos no son de igual amplitud, la altura de los rectángulos deben calcularse teniendo en cuenta que sus áreas sean proporcionales a la frecuencia de cada intervalo. Como hay 36 datos, el número de clases que debemos formar puede ser aproximadamente 6. Si el intervalo lo extendemos desde 0 hasta 30, al dividir por 6 se tiene que la amplitud de cada clase debe ser 5. Las edades de las personas que acuden al logopeda a lo largo de un mes son: 3 2 11 13 4 3 2 4 5 6 7 3 4 5 3 2 5 6 27 15 4 21 12 4 3 6 29 13 6 17 6 13 6 5 12 26 Los rectángulos tienen como base la longitud de los intervalos y como altura la frecuencia absoluta de cada intervalo
Variables cuantitativas: Medidas de posición Media aritmética Media aritmética Media aritmética: Valor tal que si todos los N valores de la variable tomaran dicho valor, sumarían lo mismo que suman efectivamente. Se obtiene dividiendo la suma de todos los valores de la variable entre el número de valores. Si conocemos la frecuencia de cada uno de los datos:
Las calificaciones en la asignatura de historia de los 40 alumnos de una clase viene dada por la tabla: Hoja de cálculo Se ha aplicado un test sobre satisfacción en el trabajo a 88 empleados de una fábrica, obteniéndose las resultados: Hoja de cálculo
Variables cuantitativas: Medidas de posición Moda: Se llama moda de una variable estadística al valor de dicha variable que presenta mayor frecuencia absoluta. Se representa por Mo. En el caso de datos agrupados en intervalos, es fácil determinar la clase modal (clase con mayor frecuencia), pero el valor dentro del intervalo se obtiene mediante la expresión: Li = Límite inferior de la clase modal C = amplitud de los intervalos D1= Diferencia entre la frecuencia absoluta de la clase modal y la frecuencia absoluta de la clase anterior. D2 = Diferencia entre la frecuencia absoluta de la clase modal y la frecuencia absoluta de la clase siguiente.
Cálculo de la moda D2 D1 Mo x c-x Li c
Variables cuantitativas: Medidas de posición Mediana: Se llama mediana de una variable estadística a un valor de la variable, tal que el número de observaciones menores que él es igual al número de observaciones mayores que él. Se representa por M. Cálculo de la mediana Variable estadística discreta Datos agrupados: Se construye la tabla de frecuencias acumuladas. La mediana es el primer valor de la variable cuya frecuencia acumulada excede a la mitad del número de datos. Cuando la mitad del número de datos coincida con la frecuencia acumulada de un valor, la mediana es la semisuma entre ese valor y el siguiente de la tabla. Datos simples: Si el nº de datos es impar, el valor central de la variable es único. Si el nº de datos es par, existen dos términos centrales. Se toma como valor de la mediana la semisuma de estos dos valores. Ejemplos
Cálculo de la mediana (II) Variable estadística continua o discreta con datos agrupados en intervalos Para determinar la clase mediana se procede del mismo modo que en el caso de variables discretas con datos no agrupados en intervalos. Para determinar el valor concreto de la variable que deja a su izquierda igual número de datos que a su derecha, aplicamos la fórmula: Li = Límite inferior de la clase modal c = amplitud de los intervalos N = Número total de datos Fi-1 = Frecuencia absoluta acumulada de la clase anterior a la clase mediana. Fi = frecuencia absoluta de la clase mediana.
Test sobre satisfacción en el trabajo: N=88 Clase mediana: [56-62) 14 25 x Aplicando la fórmula: 62 56 6 Li = 56 c = 6 N/2 = 44 Fi-1 = 30 fi = 25 M=56+3.36=59.36
50 M Método gráfico para el cálculo de la mediana • Representamos el histograma de frecuencias acumuladas porcentuales • Trazamos el polígono de frecuencias acumuladas, uniendo los vértices superiores derechos de los rectángulos del histograma. • Sobre el polígono determinamos el valor de la variable que corresponde a una frecuencia acumulada del 50%.
100% 75% 25% 0 50% Q3 Q1 Q2 Los quintiles son cuatro valores que dividen la distribución de datos en 5 partes iguales, dejando debajo de ellos el 20%, el 40 %, 60% y el 80 % de los datos respectivamente. Se representan por K1, K2, K3 y K4. 100% 20% 60% 80% 0 40% K1 K3 K4 K2 Variables cuantitativas: Medidas de posición Cuantiles: La mediana divide los datos de la distribución en dos partes iguales. Podemos estudiar otros parámetros que dividan la distribución de datos en otras proporciones. Los percentiles son noventa y nueve valores que dividen la distribución de datos en 100 partes iguales, dejando debajo de ellos el 1%, el 2 %, 30%, …, y el 99 % de los datos respectivamente. Se representan por P1, P2, P3,…., P99. Los deciles son nueve valores que dividen la distribución de datos en 10 partes iguales, dejando debajo de ellos el 10%, el 20 %, 30%, …, y el 90 % de los datos respectivamente. Se representan por D1, D2, D3,…., D9. Los cuartiles son tres valores que dividen la distribución de datos en 4 partes iguales, dejando debajo de ellos el 25%, el 50 % y el 75 % de los datos respectivamente. Se representan por Q1, Q2 y Q3.
Las calificaciones en la asignatura de historia de los 40 alumnos de una clase viene dada por la tabla: Cálculo de Q1 N/4=10. Cálculo de P70 70.N/100=28 Calcular los cuartiles primero y tercero y los percentiles de orden 30 y 70 Cálculo de Q3 3.N/4=30 Cálculo de P30 30.N/100=12 <12 <10 Q1=4 P30=4 >10 >12 <28 P70=6 =30 >28 Q3=6.5 Total = 40
Se ha aplicado un test sobre satisfacción en el trabajo a 88 empleados de una fábrica, obteniéndose las resultados: Calcular: a) Los cuartiles primero y tercero. b) Los percentiles de orden 40 y 90
Test sobre satisfacción en el trabajo: N=88 Q1 deja la cuarta parte de la distribución a su izquierda :N/4=22 Clase del primer cuartil: [50-56) <22 >22 7 15 x Aplicando la fórmula: 56 50 6 Li = 50 c = 6 N/4 = 22 Fi-1 = 15 fi = 15 M=50+2.8=52.8
Test sobre satisfacción en el trabajo: N=88 Q3 deja las tres cuartas partes de los datos a su izquierda :3.N/4=66 Clase del tercer cuartil: [62-68) <66 11 >66 18 x Aplicando la fórmula: 68 62 6 Li = 62 c = 6 N/4 = 66 Fi-1 = 55 fi = 18 M=62+3.67=65.67
Test sobre satisfacción en el trabajo: N=88 P40 deja el 40% de los datos a su izquierda :88.40/100=35.2 Clase de P40: [56-62) < 35.2 > 35.2 5.2 25 x Aplicando la fórmula: 62 56 6 Li = 56 c = 6 40.N/100 = 35.2 Fi-1 = 30 fi = 25 M=56+1.25=57.25
Test sobre satisfacción en el trabajo: N=88 P90 deja el 90% de los datos a su izquierda :88.90/100=79.2 Clase de P90: [68-74) 6.2 < 79.2 9 > 79.2 x Aplicando la fórmula: 74 68 6 Li = 68 c = 6 90.N/100 = 79.2 Fi-1 = 73 fi = 9 M=68+4.13=72.13
75% 25% Q1 P40 Q3 Método gráfico para el cálculo de los cuantiles • Representamos el histograma de frecuencias acumuladas porcentuales • Trazamos el polígono de frecuencias acumuladas, uniendo los vértices superiores derechos de los rectángulos del histograma. • Sobre el polígono determinamos el valor de la variable que corresponde a una frecuencia acumulada correspondiente al cuantil deseado