290 likes | 887 Views
Análisis de los datos. Introducción. El análisis de la datos depende del enfoque y del tipo de investigación que se haya seleccionado, como también de los objetivos que se hayan planteado. Existen dos grandes familias de técnicas de análisis de datos:
E N D
Introducción • El análisis de la datos depende del enfoque y del tipo de investigación que se haya seleccionado, como también de los objetivos que se hayan planteado. • Existen dos grandes familias de técnicas de análisis de datos: • Técnicas cualitativas: en las que los datos son presentados de manera verbal (o gráfica) - como los textos de entrevistas, las notas, los documentos… • Técnicas cuantitativas: en las que los datos se presentan en forma numérica. • Estas dos modalidades son especies radicalmente diferentes y utilizan conocimientos y técnicas completamente diferenciadas.
Programas informáticos para el análisis de datos • Para el análisis de datos cuantitativos, tenemos en la actualidad programas como el SAS, SPSS, MINITAB, SVSTAT, RESAMPLING, STATGRAPHIS. • Para el análisis de datos cualitativos existen programas como el QUALPRO, ETHNOGRAPH, NUDIST, AQUAD.
La estadística • La estadística se constituye en una herramienta fundamental para el análisis de los datos. • La estadística es fundamental para resolver problemas de descripción de datos, análisis de muestras, contrastación de hipótesis, medición de relaciones y predicciones.
La estadística • El término estadística proviene de la palabra Estado que fue originalmente utilizado para designar el levantamiento de datos estatales para orientar sus decisiones. • Definición de estadística • La estadística es la rama de la matemática usado para la recolección, organización, resumen, análisis e interpretación de un grupo de números u observaciones.
División de la estadística • La estadística se divide en dos grandes ramas: estadística descriptiva y estadística inferencial. La estadística inferencial es parte de la estadística que tiene como objetivo obtener y generalizar los resultados para una población a partir de una muestra, a través del cálculo de probabilidades. La estadística descriptiva es parte de la estadística que tiene por objeto describir los datos observados . Incluye: recolección, organización, resumen y presentación de datos.
Variables, valores, escalas • Datos • Los datos son los valores que las variables asumen y son usados para describir un evento. • Variables • Es la característica de cada sujeto (cada caso). • Llamamos “variable” precisamente porque “varía” de sujeto a sujeto. • Cada sujeto tiene un valor para cada variable. • Ejemplos: • Variable “sexo”; Valores “hombre” y “mujer” • Variable “edad en su último cumpleaños”; Valores: 0, 1, 2, 3 • Variable “ingresos anuales”; Valores: cualquier número entre 0 y cientos de miles o millones de Bs. • Escalas • Conjunto de valores que puede tomar una variable se llama la escala de esa variable
Estadística descriptiva • Permite describir resumir y analizar la información obtenida de la muestra. • Para tal fin se recolecta la información, se tabula, se grafica y en muchos casos se obtienen medidas que resuman los datos. • Básicamente hay tres tipos de medidas de resumen: • medidas de tendencia central, • medidas de dispersión o variabilidad de los datos y • medidas de ubicación.
La distribución de frecuencias • Una distribución de frecuencias es la organización de datos en forma tabular, usando clases (intervalos) y frecuencias. • La frecuencia(ni) de un valor de dato es el número de veces que ocurre el dato en el conjunto de datos.
Distribución de Frecuencias para variables cualitativas • Cuando se observa un rasgo cualitativo de un conjunto de unidades, las observaciones se clasifican en categorías. • Tales datos se organizan en tablas de frecuencia que muestra los recuentos de las categorías individuales. • La comprensión de los datos se refuerza si también se calcula la proporción (frecuencia relativa) de las observaciones en cada categoría.
La representación de la tabla de distribución de frecuencias es como sigue:
Ejemplo: • Los tipos de sangre de 20 donadores se listan abajo. Resumir los datos usando una tabla de frecuencias . ROH+ ROH- ROH+ ROH- ROH- ROH+ ROH- ROH+ ROH- ROH- ROH+ ROH- ROH+ ROH- ROH- ROH+ ROH- ROH+ ROH- ROH- Solución • Interpretación: • 12 donadores tienen tipo de sangre ROH-. • el 40% de los donadores tienen tipo de sangre ROH+ y 60% ROH-.
Ejercicio • Se ha clasificado a 20 individuos según su nivel de estudios que puede tomar valores: Nivel de estudios = • Y se han obtenido los siguientes datos: 1 4 3 3 3 2 2 4 2 2 1 4 2 3 2 3 4 2 3 Resumir los datos usando una tabla de frecuencias y calcular las frecuencias.
Distribución de frecuencias para variables cuantitativas de datos no agrupados • La distribución tendrá la forma: 1
Distribución de frecuencias de variables cuantitativas de datos no agrupados • Donde, los elementos que la componen son: • Número total de observaciones (N). • Variable en observación (xi). • Frecuencia absoluta (ni). Numero de veces que se repite xi. • Frecuencia relativa(fi). Porcentaje de elementos pertenecientes a cada clase. • Frecuencia absolutaacumulada (Ni). Suma de frecuencias absolutas de una clase con las frecuencias absolutas de todas las clases anteriores. • Frecuencia relativaacumulada (Fi). Suma de frecuencias relativas de una clase con las frecuencias relativas de todas las clases anteriores.
Ejemplo • El número de hijos de 30 familias son como se muestran: 1 4 3 2 3 4 5 2 2 1 2 5 1 4 2 1 3 2 4 1 2 3 2 3 2 1 4 3 2 5 • Resumir los datos usando una tabla de frecuencias.
Solución • Interpretación: • 6 familias tienen 3 hijos. • 27 familias tienen de 1 a 4 hijos. • El 10% de las familias tienen 5 hijos. • 53% de las familias tienen de 1 a 2 hijos.
Ejercicio • En un Instituto existen 2200 estudiantes matriculados que se distribuyen por edades de la siguiente forma: 215 de 14 años, 437 de 15, 421 de 16, 396 de 17, 512 de 18, 124 de 19 y 95 de 20. Construir una TDF.
Distribución de frecuencias de variables cuantitativas para datos agrupados • Se utiliza para representar variables continuas o datos que tienen un gran número de observaciones, siendo la mayoría de ellos distintas. En esta tabla se agrupan los datos en subgrupos llamados clases. Para la construcción de la TDF se debe seguir los siguientes pasos • Paso 1. Definición del número de clases (k) • Existen dos maneras distintas para determinar este valor: • Se puede utilizar la regla de Sturges: • Regla del cuadrado: . • Paso 2. Cálculo del rango o amplitud muestral . Es la diferencia entre el dato máximo y el mínimo.
Distribución de frecuencias de variables cuantitativas para datos agrupados • Paso 3. Cálculo de la amplitud o ancho de intervalos de clases (C). Resulta de dividir el rango entre el número de clases. XElvalor resultante se redondea al entero superior más próximo. • Paso 4. Escoger los límites de clase. Esto implica hallar los límites inferior y superior de cada intervalo. • Para la primera clase, es el valor más pequeño de los datos y es el límite inferior sumado el ancho de clase. • Para las demás clases, es el límite superior de la anterior clase y es el límite inferior sumado el ancho de clase. • Paso 5.Calcular los demás elementos de la distribución.
Ejemplo • Los pesos en libras de 30 postulantes a la Academia de Policía son: 143 151 136 127 132 132 126 138 119 104 113 90 126 123 121 133 104 99 112 129 107 139 122 137 112 121 140 134 133 123. • Resumir los datos usando una tabla de frecuencias.
Ejercicio • Sean las notas de 50 estudiantes. 60 85 33 52 65 77 84 65 74 57 71 35 81 50 35 64 74 47 54 68 80 61 41 91 55 73 59 53 77 45 41 55 78 48 69 85 67 39 60 76 94 98 66 66 73 42 65 94 88 89 • Construir la tabla de distribución de frecuencias.