990 likes | 3.24k Views
¿Qué es Estadística?. Es la ciencia encargada de recoger, clasificar, describir y analizar datos numéricos que sirvan para deducir conclusiones y tomar decisiones a partir de estos análisis. La Estadística se divide en dos grandes grupos:. Estadística descriptiva o deductiva:
E N D
¿Qué es Estadística? Es la ciencia encargada de recoger, clasificar, describir y analizar datos numéricos que sirvan para deducir conclusiones y tomar decisiones a partir de estos análisis. La Estadística se divide en dos grandes grupos: • Estadística descriptiva o deductiva: Se ocupa de la recolección, organización y representación de datos en forma coherente. • Estadística inductiva o inferencial: Se ocupa de interpretar los datos recogidos y obtener conclusiones a partir de ellas.
¿ Qué es una población? Población o Universo: Es el conjunto de todos los individuos u objetos que poseen alguna característica común observable. Una población puede ser finita o infinita. • Ejemplo: • La población consistente en la fabricación de refrigeradores, en • una empresa determinada, en un día determinado, es finita. • La población formada por todos los posibles sucesos (caras o • sellos en tiradas sucesivas de una moneda es infinita. • La población formada por los Números Naturales es infinito • La población formada por el número de alumnos de un colegio • determinado, en un año determinado es finito.
¿Qué es una muestra? Muestra es un subconjunto de la población. Es una parte de ella. Se dice que una muestra es representativa de la población, cuando corresponde más o menos al 20% de ella. Y se pueden deducir importantes conclusiones acerca de ésta, a partir del análisis de la misma. Ejemplo: Población: Padres de los alumnos de un colegio Muestra: Padres de los alumnos de Octavo año La muestra se puede elegir en forma aleatoria, estratificada o mixta
¿Qué es una variable? Una variable es la característica o atributo a observar. El conjunto de valores asignados a la variable se llama dato o dominio de la variable. Las variables pueden ser continuas o discretas. Variable continua es aquella que puede tomar cualquier valor entre dos valores dados, es decir, en un rango determinado. Ejemplo: La estatura de los alumnos de un cuarto básico es continua, porque pueden medir 1,40 m 1,42 m 1,408 m etc
Variables discreta son aquellas que toman un valor entero Ejemplo: El número de hijos de una familia es discreta, porque puede haber 1, 2, 3, ....etc. hijos Ejercicios • Decir de las variables siguientes cuáles representan datos discretos o datos continuos. • Número de acciones vendidas cada día en un mercado de valores. Respt: Discreta
Temperaturas registradas cada media hora en un observatorio. Respt: Continua • Período de duración de ampolletas producidos por una empresa determinada Respt: Continua • Censos anuales del colegio de profesores. Respt: Discreta • Número de billetes de $10000 circulando en Chile Respt: Discreta • Pulgadas de precipitación en una ciudad durante varios meses del año. Respt: Continua
Alumnos matriculados en la Universidad Andrés Bello, en los últimos cinco años. Respt: Discreta • Dar el dominio de cada una de las siguientes variables y decir si son continuas o discretas. • Número de litros de agua en una máquina de lavar. Dominio : cualquier valor de cero litros a la capacidad de la máquina ( 12,3 12,005 12,0047 etc) Variable : Continua • Número de libros en un estante de librería. Dominio : 0, 1, 2, 3, ........ Hasta el mayor número de libros que puedan entrar en el estante. Variable : Discreta
Suma de puntos obtenidos en el lanzamiento de un par de dados Dominio : 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 Variable : Discreta • Tiempo de vuelo de un proyectil Dominio : De cero en adelante ( 5 5,3 5.045 etc) Variable : Continua • Estado civil de un individuo Dominio : Casado, soltero, viudo Variable : Discreta • Velocidad de un automóvil en kilómetros por hora. Dominio : De 0 en adelante ( 120 120,8 120,04 etc) Variable : Continua
Distribuciones de frecuencias Toma de datos: Es la obtención de una colección de los mismos queno han sido ordenados numéricamente. Ejemplo: Conjunto de alturas de 100 estudiantes, sacados de una lista alfabética de una Universidad. Ordenación: Es una colocación de los datos numéricos tomados, en orden creciente o decreciente de magnitud. Ejemplo: 32 , 45, 100, 120 , 145, 186, 198, 200 ( ordenación creciente ) 200, 198, 186, 145, 120, 100, 45, 32 ( ordenación decreciente)
Al recoger información se obtiene un gran número de datos, que conviene presentar en forma resumida en una tabla llamada distribución de frecuencias. Frecuencia absoluta: es el número de veces que se repite un valor de la variable.
Ejemplo: Los siguientes datos son las calificaciones obtenidas, en la asignatura de Matemática, por un grupo de 30 alumnos: 7 – 3 – 5 – 4 – 3 – 4 – 5 – 6 – 5 – 7 – 3 – 2 – 6 – 5 – 4 – 6 – 3 - 4 – 5 – 2 - 7 – 4 – 5 – 7 – 6 – 5 – 4 – 2 –3 - 1
Variable estadística Frecuencia absoluta Frecuencia acumulada Calificación Nº de alumnos ------------- 1 1 1 2 3 4 3 5 9 4 6 15 5 7 22 6 4 26 7 4 30 Frecuencia acumulada hasta un valor determinado: es el número de observaciones menor o igual al valor considerado. Se obtiene sumando sucesivamente las frecuencias absolutas. Ejemplo:
Frecuencia relativa: es el cuociente entre la frecuencia absoluta y el número total de individuos de la muestra NOTA: La suma de las frecuencias relativas es igual a 1 Ej. 1 / 30 + 3 / 30 + 5 / 30 + 6 / 30 + 7 / 30 + 4 / 30 + 4 / 30 = 30 / 30 = 1
Frecuencia relativa porcentual: Es la frecuencia relativa expresada en porcentajes. NOTA: La suma de las frecuencias relativas porcentuales es el 100%
Ejercicios • Los siguientes datos son las calificaciones de un grupo de 27 alumnos en la asignatura de matemática: 5 6 5 7 4 2 3 5 4 6 7 5 4 6 5 4 5 6 4 3 4 6 7 5 4 5 6 • Construya una tabla de distribución de frecuencias • ¿Cuántos alumnos tienen nota inferior a 5? • ¿Qué porcentaje de alumnos tiene nota 4? • ¿Cuántos alumnos tiene nota 6? • ¿Qué porcentaje de alumnos tiene nota superior o igual a 4?
Respuesta • b) 10 alumnos tienen nota inferior a 5,0 • c) El 25,9% de los alumnos tiene nota 4,0 • 6 alumnos tienen nota 6,0 • El 88,8% de los alumnos tiene nota igual o superior a 4,0
Una encuesta realizada a alumnos de Cuarto Medio acerca de su futura profesión, indica lo siguiente: • Completar la tabla con frecuencia • acumulada, relativa y relativa • porcentual. • b) ¿Cuántos alumnos fueron encuestados? • c) ¿Cuál es la profesión que tiene mayor • preferencia? • d) ¿Qué porcentaje de alumnos prefiere • arquitectura? • e) ¿Qué porcentaje de alumnos prefiere • medicina?
Respuesta b) 60 alumnos fueron encuestados c) Economía es la profesión con mayor frecuencia d) El 15% de los alumnos prefiere Arquitectura e) El 10% de los alumnos prefiere Medicina
En una muestra de 40 familias, el número de hijos se distribuye según la tabla: • Completa la tabla con frecuencia • acumulada, relativa y relativa • porcentual. • b) ¿Cuántas familias tienen menos de • 4 hijos? • c) ¿Cuántas familias tienen 5 hijos? • d) ¿Cuál es la frecuencia relativa de las • familias que tienen 2 hijos? • e) ¿Qué porcentaje de familias tiene 6 • hijos? • f) ¿Qué fracción representan las familias • con 2 hijos? • g) ¿Qué fracción representan las familias • con 4 hijos?
Respuesta b) 22 familias tienen menos de 4 hijos c) 3 familias tienen 5 hijos d) La frecuencia relativa de familias con 2 hijos es de 0,20 e) El 2,5% de las familias tiene 6 hijos f) 1 / 5 de las familias tienen 2 hijos g) 7 / 20 de las familias tienen 4 hijos
Medidas de tendencia central en valores no agrupados. Son valores representativos de la totalidad de los datos. Su cálculo permite analizar los datos en torno a un valor central. • Los valores centrales más usados son: • Media aritmética. • Mediana • Moda.
Media aritmética: corresponde al promedio de los valores. Se simboliza por X En forma General : X = x1 + x2 + x3 +....xn n Media aritmética ( X ) La media aritmética se obtiene sumando los valores de la variable dividido por el número total de valores.
Ejemplo: Determinar el promedio de notas de un alumno, en la asignatura de Lenguaje y comunicación. Las notas son: 3- 5 - 7 - 6 - 4 - 5 - 3 - 5 - 4 - 5 - 3 - 4 X = 3 + 5 + 7 + 6 + 4 +5 + 3 +5 + 4 + 5 + 3 + 4 = 54 = 4,5 12 12 Luego, el promedio de notas del alumno es 4,5
Mediana ( Me ) Es el valor de la variable que deja igual número de valores antes y después de él en una distribución de frecuencias Según el número de valores de la variable se distinguen dos casos: • Si el número de valores es impar, la mediana coincide con el valor central. Ejemplo: 5 – 8 – 9 – 11 – 12 – 13 – 15 Luego, la mediana es el 11 NOTA: los valores deben estar ordenados. Puede ser en forma creciente o decreciente
Si el número de valores es par, la mediana es el promedio aritmético de los dos valores centrales. Ejemplo: 2 – 3 – 5 – 6 – 8 – 9 – 11 – 12 El calculo sería: ( 6 + 8 ) : 2 = 14 : 2 = 7 Luego, la mediana es 7
Moda ( Mo ) Es el valor de la variable que tiene mayor frecuencia Ejemplo: La moda es 4 hijos, porque tiene mayor frecuencia, que es del 14 familias.
Respuesta: X = 84 + 91 + 72 + 68 + 87 + 78 = 480 = 80 6 6 Ejercicios • Las calificaciones de un estudiante de la UNEMI, en seis pruebas, fueron 84, 91, 72, 68, 87 y 78. Hallar el promedio de sus notas. Luego, el estudiante tiene promedio 80 • Diez medidas de diámetro de un cilindro fueron registradas como: 3,88 4,09 3,92 3,97 4,02 3,95 4,03 3,92 3,98 y 4,06
X = 3,88 + 4,09 + 3,92 + 3,97 + 4,02 + 3,95 + 4,03 + 3,92 +3,98 +4 ,06 10 = 39,82 = 3,98 10 Respuesta: Luego, la media aritmética es 3,98 • Calcular el salario medio semanal de 65 empleados
X = 440.000 + 650.000+ 1.200.000 + 1.190.000 + 950.000 + 735.000 65 = 5.165.000 = 79.461,538 65 Respuesta Luego, el sueldo promedio es $ 79.461,5
Respuesta: Se deben ordenar las calificaciones: 68 72 78 84 87 91 Luego, la mediana es 78 + 84 = 162 = 81 2 2 • Las calificaciones de un estudiante de la UNEMI, en seis pruebas, fueron 84, 91, 72, 68, 87 y 78. Hallar la mediana de sus calificaciones • Hallar la moda de los siguientes números: 3, 5, 2, 6, 5, 9, 5, 2, 8. Respuesta: La moda es el número 5, ya que su frecuencia es mayor
Representación gráfica de la información • Gráfico lineal o de segmentos: Se utiliza especialmente para representar datos numéricos de situaciones que ocurren en períodos sucesivos.
gráfico de Barra : Permite hacer comparaciones mediante barras paralelas colocadas en forma vertical u horizontal entre dos ejes perpendiculares.
Gráfico circular: Consiste en un círculo dividido en sectores que representan las frecuencias relativas porcentuales de una distribución Los 360 grados del círculo se dividen proporcionalmente al porcentaje correspondiente de cada frecuencia.
Distribución de frecuencias con datos agrupados • Rango: Es la diferencia entre el mayor valor y el menor de ellos. Ejemplo: Si la estatura del alumno más alto de un curso es 1,92 m y la del menor es 1,68 m, entonces el rango de estos datos es: 1,92 m – 1,68 m = 0,24 m = 24 cm. • Clases o intervalos : En la ordenación de datos muy numerosos, es usual presentarlosagrupados y ordenados en clases o categorías.
Ejemplo: En un grupo de 50 alumnos se registraron los siguientes puntajes en una prueba: • 76 66 77 70 83 88 63 77 67 68 72 82 • 74 84 63 76 84 78 75 72 75 83 80 73 • 83 75 67 72 83 83 84 84 67 71 87 80 • 77 64 77 82 83 85 79 72 83 83 87 Para ordenarlos y agruparlos, se establecen los intervalos que se usarán, determinando el rango de los datos. Dato mayor: 88 Dato menor: 61 Rango: 88 – 61 = 27 De acuerdo con el rango y teniendo en cuenta la cantidad de datos, se forman los intervalos.
Si quisiéramos formar 6 intervalos, se tiene que dividir el rango con la cantidad deseada. 27 : 6 = 4, 5 se aproxima a 5 ( amplitud aparente del intervalo) El intervalo 60 – 64 es un símbolo para representar a la clase respectiva Los valores 60 y 64 son los límites aparentes de la clase.
Lri = = 69,5 Límite real inferior = Lrs = = 75,5 Límite real superior = Los límites reales de una clase se obtienen calculando el promedio entre el límite aparente superior de una clase y el límite aparente inferior de la clase siguiente. Ejemplo: Calcular los límites reales de la clase 70 – 74 • Tamaño o amplitud de una clase: Corresponde a la diferencia entre su límite real superior y el límite real inferior. Ejemplo: 75,5 – 69,5 = 5 Su amplitud es igual a 5 NOTA: Todas las clases tienen igual tamaño.
Ejemplo. Intervalo Marca de clase 60 – 64 62 65 – 69 67 70 – 74 72 Ejemplo: Intervalo Frecuencia 1 – 5 12 6 – 10 11 11 -15 10 • Marca de clase: Es el punto medio de un intervalo de clase. • Frecuencia total: Es la suma de las frecuencias absolutas de todas las clases. Frecuencia total 12 + 11 + 10 = 33
Ejercicios • Dado los siguientes puntajes, determinar: • 76 66 77 70 83 88 63 77 67 68 72 82 • 74 84 63 76 84 78 75 72 75 83 80 73 • 83 75 67 72 83 83 84 84 67 71 87 80 • 77 64 77 82 83 85 79 72 83 83 87 • Determinar seis intervalos • Determinar el límite real superior e inferior de cada clase • Determinar la marca de clase de cada intervalo • Determinar la frecuencia absoluta
Respuesta Se debe determinar el rango: Pje mayor – Pje menor: 88 – 61 = 27 Luego, 27 : 6 = 4,5 se aproxima a 5 la amplitud del intervalo
Ordena los siguientes datos de menor a mayor y calcula su rango: 3,22 2,92 3,01 4,48 5,06 4,31 2,98 3,07 Respuesta: Ordenado: 2,92 2,98 3,01 3,07 3,22 4,31 4,48 5,06 Rango: 5,06 – 2,92 = 2,14 • La siguiente distribución de frecuencias corresponde a los salarios de los empleados de una fábrica:
Respuesta: acum Salarios ( $ ) Frecuencia 50.000 – 54.999 7 55.000 – 59.999 25 60.000 – 64.999 57 65.000 – 69.999 102 70.000 – 74.999 154 75.000 – 79.999 182 80.000 – 84.999 198 85.000 – 89.999 206 f) Determina la frecuencia acumulada.
Respuesta: Salarios ( $ ) Frecuencia relativa 50.000 – 54.999 7 / 206 = 0,033 55.000 – 59.999 18 / 206 = 0,087 60.000 – 64.999 32 / 206 = 0,155 65.000 – 69.999 45 / 206 = 0,218 70.000 – 74.999 52 / 206 = 0,252 75.000 – 79.999 28 / 206 = 0,135 80.000 – 84.999 16 / 206 = 0,077 85.000 – 89.999 8 / 206 = 0,038 g) Determinar la frecuencia relativa
Respuesta: % Salarios ( $ ) Frecuencia relativa 50.000 – 54.999 3,3 55.000 – 59.999 8.7 60.000 – 64.999 15,5 65.000 – 69.999 21,8 70.000 – 74.999 25,2 75.000 – 79.999 13,5 80.000 – 84.999 7,7 3,8 85.000 – 89.999 h) Determinar la frecuencia relativa porcentual
Ejercicio Después de medir las alturas de 40 alumnos de un curso, resultaron los siguientes valores de la variable: • 178 150 166 182 175 163 175 150 162 • 155 161 165 160 159 160 168 165 162 • 155 157 161 162 155 167 164 162 158 • 158 163 166 167 156 164 170 176 172 160 a) Determina el rango Respuesta: 182 - 150 = 32
Respuesta: Intervalo Frecuencia 150 – 154 4 155 – 159 8 160 – 164 14 165 – 169 7 170 – 174 2 175 – 179 4 180 – 184 1 b) Determina 8 intervalos: Respuesta: El rango es 32. Luego, 32 : 7= 4,5 (5 amplitud ) c) Determinar la frecuencia
Respuesta: Respuesta: Intervalo Intervalo F. acum F. Relat % 150 – 154 150 – 154 10 4 155 – 159 155 – 159 20 12 160 – 164 160 – 164 26 35 165 – 169 165 – 169 33 17,5 170 – 174 170 – 174 35 5 175 – 179 175 – 179 39 10 180 – 184 180 – 184 40 2,5 g) Determinar la frecuencia acumulada h) Determinar la frecuencia relativa porcentual
i) ¿Cuántos alumnos miden menos de 160 ? Respuesta: 12 alumnos miden menos de 160 j) ¿Qué porcentaje de alumnos mide entre 170 y 174 ? Respuesta: El 5% de los alumnos miden entre 170 y 174 k) ¿Qué porcentaje de alumnos mide entre 160 y 174 ? Respuesta: El 57,5 % de los alumnos mide entre 160 y 174 l) ¿Cuál es la frecuencia total ? Respuesta: n = 40 m) ¿Cuál es la amplitud del intervalo ? Respuesta: c =Lrs – Lri = 159,5 - 154,5 = 5
Representación gráfica en datos agrupados Histograma: Es un gráfico de barras verticales que sirve para representar los datos de una distribución de frecuencias en la cual los valores de la variable están agrupados en intervalos. El histograma tiene la siguiente característica: Las bases de las barras o rectángulos están sobre el eje horizontal y su ancho ( longitud sobre el eje) es igual al tamaño de los intervalos de clase.
f 10 8 6 4 2 Eje x = intervalos Eje y = frecuencia I 5- 7 8-10 11-13 14-16 17-19 Ejemplo: Esta tabla de distribución de frecuencias indica las edades de los alumnos que asisten a clases de Inglés.