560 likes | 801 Views
Estad í stica. Capítulo 2.2. Organización de datos numéricos. Introducci ó n. El aprendizaje de esta unidad se va a centrar en la organizaci ó n de variables numéricas, ya sean discretas o continuas. 2.
E N D
Estadística Capítulo 2.2 Organización de datos numéricos
Introducción El aprendizaje de esta unidad se va a centrar en la organización de variables numéricas, ya sean discretas o continuas. 2
Una vez que los datos de la encuesta se encuentran listos, el siguiente paso es organizar la información y ordenarla. ARREGLO ORDENADO • Por cada variable se hace un ordenamiento simple. • El determinar cual es el dato que tiene menor valor y cual el de mayor valor es información vital para empezar a trabajar con variables cuantitativas. 3
Suponga que decide llevar a cabo un estudio del costo de una comida en un restaurante de una gran ciudad. A 50 restaurantes citadinos se les consultó sobre el precio promedio de sus platos y se obtuvieron los siguientes resultados. Ejemplo 4
Ejemplo 5
Ejemplo Arreglo ordenado 6
Calcular el rango es determinar la longitud numérica que existe entre el primer dato y el último. Rango • Restar el dato menor del dato mayor de la muestra y se obtiene el rango. • Rango = DatoMayor - DatoMenor 7
La pregunta que estamos analizando ya tiene sus datos ordenados, ahora determinar a simple vista cuales son los datos mayor y menor respectivamente: Ejemplo 8
En una muestra o población el rango es la distancia entre el dato mayor y el dato menor. Se calcula restando ambos datos. RANGO 9
Ejemplo Cálculo del rango. Muestra de restaurantes citadinos 10
Sin importar si los datos están o no ordenados, siempre es posible crear una distribución de frecuencias para los datos de una variable en una muestra. La distribución de frecuencias es una tabla de resumen en la que los datos están organizados en clases o grupos numéricamente ordenados. DISTRIBUCIÓN DE FRECUENCIAS 11
DISTRIBUCIÓN DE FRECUENCIAS Seleccionar el número apropiado de agrupaciones oclases para la tala, determinando una amplitud conveniente de las clases y estableciendo los límites de cada una para evitar traslape. Se organiza en filas y columnas para resumir la información y poder realizar interpretaciones de manera rápida y efectiva.
La Amplitud de cada intervalo o clase se calcula dividiendo el rango entre el número de intervalos elegidos. Se ha convenido que todos los intervalos tienen la misma anchura. Amplitud de intervalo o clase 13
La mayoría de las veces la amplitud de un intervalo es mejor trabajarla con una anchura que sea un número entero (aplican restricciones). Si el resultado de la división es decimal, se redondea el resultado de la siguiente manera. Amplitud de unIntervalo o clase • Si el resulta es menor de 0.5 se elimina la parte decimal. • En caso contrario se pasa al próximo entero. 14
Ejemplo Cálculo de la amplitud Muestra de restaurantes citadinos 15
Se organiza en filas y 2 columnas: Columna 1: El nombre de la variable que se está analizando. Columna 2: Las veces que se repiten los datos con las mismas características de la variable y se le llama frecuencia. DISTRIBUCIÓN DE FRECUENCIAS 16
Como la variable es numérica, se trata de valores y si éstos son más de 10 datos diferentes, es conveniente hacer grupos para administrarlos con eficiencia. A cada grupo de datos se le llama Intervalo. DISTRIBUCIÓN DE FRECUENCIAS 17
Un intervalo es como un rango, tiene un dato mayor y un dato menor y el estilo de representación puede ser de varias maneras, las más generalizadas son: DatoMenorpero menos queDatoMayor DISTRIBUCIÓN DE FRECUENCIAS 18
Ejemplo 19
La información en cada intervalo debe ser única. Para determinar el número de intervalos para una distribución, se calcula con la información del valor del Rango. DISTRIBUCIÓN DE FRECUENCIAS 20
Se sugiere que una distribución de frecuencias no debe tener menos de 5 intervalos, ni más de 15. Si no se sigue esta convención, la interpretación de los datos puede ser demasiado condensada o muy dispersa y en ambos casos los resultados aunque están bien, no son objetivos. Y puede afectar la toma de decisiones. DISTRIBUCIÓN DE FRECUENCIAS 21
Los datos por ser numéricos, pueden ir de 100 a 1000, o se pueden extender a 10,000, etc. Un intervalo es similar al rango, el cual tiene un dato mayor y un dato menor, solo que la distancia entre ellos recibe el nombre de Amplitud DISTRIBUCIÓN DE FRECUENCIAS 22
Determinar el número de intervalos que sirva a una muestra se basa en la experiencia o sentido común de la persona que va a generar la distribución de frecuencias. DISTRIBUCIÓN DE FRECUENCIAS 23
Procedimiento para generar una distribución de frecuencias • Calcular el rango. • Elegir el número de intervalos • Calcular la anchura de cada intervalo • Generar los intervalos de clases (no deben menos de 5 ni más de 15) • Determinar la frecuencia para cada intervalo. 24
Calcular las frecuencias de la distribución para los 50 restaurantes citadinos Ejemplo 25
Ejemplo 26
Ejemplo • En este caso, se iniciará el primer intervalo con el dato menor de la muestra = 14 • A 14 se le suma la amplitud que es 7 y es = 21 • El primer intervalo será el siguiente: 14 pero menos de 21 27
Ejemplo • Para calcular el segundo intervalo, se toma como dato menor el 21 y se le suma la amplitud que es 7 = 28. • El segundo intervalo resulta ser: De 21 a menos de 28 • Para el tercer intervalo, se toma como dato menor el 28 y se le suma 7 = 35 • El tercer intervalo será: De 28 a menos de 35 28
Ejemplo • En el cuarto intervalo, el dato menor es 35, se suma la amplitud 7 = 42. • El cuarto intervalo resulta ser: De 35 a menos de 42 • En el quinto intervalo, al dato menor 42 se le suma 7 = 49 • El quinto intervalo es: De 42 a menos de 49 29
Intervalos o clases Ejemplo 30
Calcular la frecuencia de cada intervalo. Ejemplo El primer intervalo de “14 pero menos de 21”, se cuenta el número de datos que tienen esa característica y solo es 14. Al contar los números resulta que es 1 dato El segundo intervalo de de “21 pero menos de 28” se cuenta 22, 23, 25, 26 y 27 que son 5 31
Ejemplo 32
Ejemplo El tercer intervalo de “28 pero menos de 35”, se cuenta 30, 31, 31, 32, 33, 34, 34 (35 no); la frecuencia es 7. El cuarto intervalo de “35 pero menos de 42” se cuentan 35, 35, 35, 36, 36, 37, 37, 38, 38, 38, 39, 39, 39, 39, 40, 41 y resultan 16 33
Ejemplo 34
Ejemplo El quinto intervalo de “42 pero menos de 49”, está formado por se cuenta ; la frecuencia es 7. El sexto intervalo de “35 pero menos de 42” se cuentan y resultan 16 35
Ejemplo 36
Ejemplo 37
Fronteras de clase • Las fronteras de clase o límites de clase, son los extremos numéricos de una clase. • Un intervalo tiene la forma “a – b”, contiene los números que empiezan en “a” y que casi terminan de “b” 39
Ejemplo • Intervalo 14 pero menos de 21 • La frontera inferior es 14 • La frontera superior se acerca a 21 • Intervalo 21 pero menos de 28 • La frontera inferior es 21 • La frontera superior se acerca a 28 40
Frontera real de clase • Numéricamente, “antes de A” no es un número. • Se establece un límite de acuerdo a la formulación de los datos. • Si los datos se ministran con dos decimales, se busca el número que está exactamente antes de la frontera superior. 41
Calcular las fronteras reales de la siguiente distribución: Ejemplo 42
Marca de Clase Es el punto medio de un intervalo de clase, se calcula sumando sus fronteras y dividiendo el resultado entre dos. El intervalo es dividido a la mitad
Calcular las marcas de clase de la siguiente distribución: Ejemplo 45
Frecuencia Relativa La frecuencia relativa es la proporción de frecuencia que corresponde un intervalo con relación al tamaño de la muestra.
Cálculo de la frecuencia relativa • Se suman todas las frecuencias • Se divide la frecuencia de cada intervalo entre el total de frecuencias. • Todas las frecuencias son valores entre 0.0 y 1.0 • La suma de todas las frecuencias relativas debe ser igual a uno (1) 48
Ejemplo Cálculo de frecuencia relativa 49
Frecuencia Acumulada La frecuencia acumulada es la suma parcial para cada intervalo, permite hacer observaciones sobre los intervalos que están por debajo de él.