240 likes | 449 Views
Capitulo II Descripción de los conjuntos de datos. UNIVERSIDAD TECNICA DE AMBATO. Descripción de los conjuntos de datos. Distribución de frecuencias. Tabla de contingencias. Visualizaciones graficas. Diseño tallo y hoja. Distribución de frecuencias acumuladas. Histograma.
E N D
Capitulo II Descripción de los conjuntos de datos UNIVERSIDAD TECNICA DE AMBATO
Descripción de los conjuntos de datos • Distribución de frecuencias • Tabla de contingencias • Visualizaciones graficas • Diseño tallo y hoja • Distribución de frecuencias acumuladas • Histograma • Distribución de frecuencia relativa • Polígono de frecuencia • Distribución de frecuencias relativas acumuladas • Ojivas • Diagrama de barras • Gráficos circulares • Gráficos lineales
Descripción de los conjuntos de datos • Casi todos los trabajos estadísticos comienzan con el proceso de recoger datos y formar con ello el conjunto que se utilizara en el estudio y luego ser interpretados para esto se utilizan distintas herramientas como tablas diversas visualizaciones graficas tablas de contingencia, etc
Distribución de frecuencias • Distribución de frecuencias es como se denomina en estadística a la agrupación de datos en categorías mutuamente excluyentes que indican el número de observaciones en cada categoría. Esto significa una de las cosas más importantes de la matemática, su estadística con la agrupación de datos. La distribución de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el número existente en cada clase.
Elementos fundamentales para elaborar una distribución de frecuencia: • 1) RANGO. • 2) AMPLITUD TOTAL. • 3) LAS CLASES. • 4)EL NUMERO DE CLASES. • 5) VALOR DEL INTERVALO O AMPLITUD
Distribución de frecuencias acumuladas • Una distribución de frecuencias acumuladas identifica el número acumulado de observaciones incluidas bajo el límite exacto superior de cada clase de la distribución. Las frecuencias acumuladas de una clase pueden determinarse sumando las frecuencias observadas de esa clase a las frecuencias acumuladas de la clase anterior.
Distribución de frecuencias relativas • La frecuencia absoluta, es una medida que está influida por el tamaño de la muestra, al aumentar el tamaño de la muestra aumentará también el tamaño de la frecuencia absoluta. Esto hace que no sea una medida útil para poder comparar. Para esto es necesario introducir el concepto de frecuencia relativa, que es el cociente entre la frecuencia absoluta y el tamaño de la muestra. La denotaremos por fi • Donde N = Tamaño de la muestra
Distribuciones de frecuencia relativa acumuladas • Al igual que en el caso anterior la frecuencia relativa acumulada es la frecuencia absoluta acumulada dividido por el tamaño de la muestra, y la denotaremos por Fi
Tabla de contingencias • En estadística las tablas de contingencia se emplean para registrar y analizar la relación entre dos o más variables, habitualmente de naturaleza cualitativa (nominales u ordinales).
Supóngase que se dispone de dos variables, la primera el sexo (hombre o mujer) y la segunda recoge si el individuo es zurdo o diestro. Se ha observado esta pareja de variables en una muestra aleatoria de 100 individuos. Se puede emplear una tabla de contingencia para expresar la relación entre estas dos variables, del siguiente modo:
Visualizaciones graficas • En estadística denominamos gráficos a aquellas imágenes que, combinando la utilización De sombreado, colores, puntos, líneas, símbolos, números, texto y un sistema De referencia (coordenadas), permiten presentar información cuantitativa.
La utilidad De los gráficos es doble, ya que pueden servir no sólo como sustituto a las tablas, sino que también constituyen por sí mismos una poderosa herramienta para el análisis De los datos, siendo en ocasiones el medio más efectivo no sólo para describir y resumir la información, sino también para analizarla.
Histograma • En estadística, un histograma es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables, normalmente señalando las marcas de clase, es decir, la mitad del intervalo en el que están agrupados los datos.
Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores continuos. En los casos en los que los datos son cualitativos (no-numéricos), como sexto grado de acuerdo o nivel de estudios, es preferible un diagrama de sectores.
Polígono de Frecuencias • Es un gráfico de líneas que se usa para presentar las frecuencias absolutas de los valores de una distribución en el cual la altura del punto asociado a un valor de las variables es proporcional a la frecuencia de dicho valor.
Ojivas • Es un gráfico acumulativos, el cual es muy útil cuando se quiere representar el rango porcentual de cada valor en una distribución de frecuencias.
Diagrama de barras Diagramas de barras simples • Representa la frecuencia simple (absoluta o relativa) mediante la altura de la barra la cual es proporcional a la frecuencia simple de la categoría que representa.
Diagramas de barras compuesta • Se usa para representar la información de una tabla de doble entrada o sea a partir de dos variables, las cuales se representan así; la altura de la barra representa la frecuencia simple de las modalidades o categorías de la variable y esta altura es proporcional a la frecuencia simple de cada modalidad.
Gráficos circulares • Las Gráficas circulares denominadas también gráficas de pastel o gráficas del 100%, se utilizan para mostrar porcentajes y proporciones. El número de elementos comparados dentro de un gráfico circular, pueden ser más de 5, ordenando los segmentos de mayor a menor, iniciando con el más amplio a partir de las 12 como en un reloj. Una manera sencilla de diferenciar los segmentos es sombreándolos de claro a oscuro, siendo el de mayor tamaño el más claro y el de menor tamaño el más oscuro.
Gráficos lineales • Lineales: se representan los valores en dos ejes cartesianos ortogonales entre sí. Las gráficas lineales se recomiendan para representar series en el tiempo, y es donde se muestran valores máximos y mínimos; también se utilizan para varias muestras en un diagrama.
Diseño tallo y hoja • EL DIAGRAMA DE TALLO Y HOJA Es una técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes. El o los dígitos principales forman el tallo y los dígitos secundarios las hojas. Los tallos están colocados a lo largo del eje vertical, y las hojas de cada observación a lo largo del eje horizontal.