1.77k likes | 2.49k Views
Apuntes de apoyo de “Estadística Descriptiva”. Martínez Stone Claudia Montserrat. Origen de la Estadística . En su origen, la estadística surge como una disciplina enfocada a conocer los recursos del Estado mediante su cuantificación, de ahí su nombre.
E N D
Apuntes de apoyo de“Estadística Descriptiva” Martínez Stone Claudia Montserrat
Origen de la Estadística En su origen, la estadística surge como una disciplina enfocada a conocer los recursos del Estado mediante su cuantificación, de ahí su nombre. Posteriormente con la diversificación de sus aplicaciones, se dio por llamar estadísticas a las tablas en las que se codifica la información, extendiéndose este nombre a la disciplina en general de recopilar, ordenar, analizar e interpretar información cuantitativa.
Definiciones de Estadística • Noreau de Jonneis (1847).- "La Estadística es la ciencia de los hechos sociales, expresados en términos numéricos". • Romelín (1863).-"La Estadística describe las características de la sociedad humana a base de observaciones metodológicas y de enumeraciones de fenómenos similares".
Definiciones de Estadística • Arthur Bowley (1901).- "La Estadística es la ciencia de los promedios, la ciencia de los grandes números". • Mason y Lind (1998).- “Ciencia que trata de la recopilación, organización, presentación, análisis e interpretación de datos numéricos (Estadísticas) con el fin de realizar una toma de decisiones más efectiva”
Método Estadístico Identificación y definición del problema. Formulación de objetivos e hipótesis. Recopilación de la información. Organización y aplicación de las herramientas estadísticas. Análisis e interpretación. Conclusiones. Toma de decisiones.
Descriptiva, estudia poblaciones totales que describe a través de medidas que la resumen llamadas parámetros: • Medidas de tendencia central • Medidas de Posición • Medidas de dispersión • Asimetría • Kurtosis ESTADÍSTICA • Inferencial,estudia una muestra de la población que analiza exhaustivamente, y a partir de ella infiere lo que sucede en la población a través de los estimadores de los parámetros (estadísticos) que la describen: • Probabilidad • Muestreo • Estimación • Pruebas de Hipótesis
Muestra,parte representativa de la población, o un subconjunto de ella • Población,se refiere a una totalidad, es decir, al conjunto de todos los elementos que la conforman, o, a todos los valores que puede tomar la variable en estudio
VARIABLE Elemento de interés que puede tomar valores diferentes. Cualitativa;solo puede clasificarse pero no medirse, no proporciona información cuantificable, se refiere solamente a las características de la variable Cuantitativa;es aquella cuyos valores se pueden expresar como cantidades numéricas
Discretas,solo pueden asumir ciertos valores que se caracterizan por ser enteros, finitos y positivos VARIABLES CUANTITATIVAS Continuas,pueden asumir cualquier valor dentro de un cierto intervalo, caracterizándose porque pueden ser decimales e infinitas
EJEMPLOS DE VARIABLES DISCRETAS • Número de autos vendidos en un mes por una agencia. • Número de cuadernos utilizados al semestre por un estudiante. • Número de puntos anotados en un juego de baloncesto. • Número de personas que asisten cada semana a los servicios religiosos de cierto templo. CONTINUAS • Precio de una acción en una muestra de varios días. • Peso de cajas de fruta empacadas para su exportación. • Velocidad de un automóvil en ciertos tramos de una carretera. • El tiempo de duración de 5,000 lámparas incandescentes.
SERIES DE TIEMPO: Aquellas cuya información muestra un orden cronológico o una evolución temporal de la variable. VARIABLES CUANTITATIVAS SERIES DE CORTE TRANSVERSAL: Aquellas cuya información se toma en un mismo momento del tiempo entre diferentes miembros de una población o lugares.
SERIE ESTADÍSTICA Conjunto de datos ordenados que miden los cambios en una variable, ya sea de manera cronológica o transversal SERIE SIMPLE SERIE DE FRECUENCIAS SERIE DE CLASES Y FRECUENCIAS O DE DATOS AGRUPADOS
Serie Simple Como su nombre lo indica, es la más sencilla, y se define como: “Conjunto de datos ordenados de manera ascendente o descendente, que miden las variaciones de un fenómeno o variable”
Serie o Distribución de Frecuencias “CONJUNTO DE DATOS ORDENADOS QUE MIDEN LOS CAMBIOS EN UN FENÓMENO O VARIABLE, RELACIONÁNDOLOS O PONDERÁNDOLOS CON SU FRECUENCIA” Frecuencia, es el número de veces que un término o valor que adopta una variable se repite o existe en una serie estadística; se representa como y ó f.
Serie de Clases y Frecuencias “CONJUNTO DE DATOS ORDENADOS, AGRUPADOS EN SUBCONJUNTOS QUE MIDEN LOS CAMBIOS DEL FENÓMENO O VARIABLE Y RELACIONÁNDOLOS CON SU FRECUENCIA” Clase, es un subconjunto de algunas observaciones de la variable, cercanos unos a otros, de acuerdo con sus características. Intervalo de clases, es el rango de valores encontrados dentro de una clase.
Rango Número de clases que se desean Intervalo de clase = Intervalo de Clase • Buscamos el valor más pequeño o el primer valor en una serie ordenada previamente (frontera inferior) y el valor más grande (frontera superior). • Calculamos el rango o recorrido de la serie (Rango = F. Sup. – F. Inf.). • Dividimos el rango entre el número de clases que se desea tener.
EJEMPLO: Los siguientes datos se refieren a la duración en horas de 40 focos tomados por el departamento de control de calidad de su fábrica.
Ejercicios de Aplicación • 1.- Elaboración de ejercicios que impliquen la representación en Series de los datos: • a.1. Los siguientes, son los números de videocámaras producidas durante 50 turnos de 8 horas seleccionadas al azar. • a.2. Un Banco, esta estudiando el número de veces que es utilizado por día un cajero automático localizado en un supermercado. A continuación se indica los números de veces que el aparato se empleo en los últimos 30 días
Representación Gráfica • Nos permite observar rápidamente el comportamiento de la serie estadística. • Histograma • Polígono de frecuencias • Ojiva • Gráfica por sectores • Gráfica de Pareto
INFORMACIÓN CUALITATIVA Se representa gráficamente por: Histogramas Gráficas de Pareto Gráficas de Sectores
DATOS BIVARIADOS Se obtienen cuando se miden dos variables en una sola unidad experimental. Cuando se miden más de dos variables se denominan multivariados. Representación gráfica: • Gráficas de barras • Gráficas de línea • Gráficas de área
Ejercicios de Aplicación • 1.- Leer en la Antología el Tema de Representación Gráfica para conocer los diferentes tipos de gráficas que existen. • 2.- Del siguiente ejercicios (Anexo en material) Graficar la información y presentarla, mediante: • Histograma • Polígono • Gráfica de Sectores
Medidas de Tendencia Central Las medidas de tendencia central se usan para buscar el valor central de la serie o distribución estadística. Son: • la media, • la mediana y • la moda.
Media • Es el valor central, teórico y exacto que representa el centro de una serie estadística. Puede ser: • Aritmética • Geométrica • Armónica
Propiedades de la Media Todo conjunto de datos de nivel de intervalo y de nivel de razón tiene una media. Al evaluar la media se incluyen todos los valores. La media es única para un conjunto de valores dado.
Propiedades de la Media Es muy útil para comparar dos o más poblaciones. Es la única medida de tendencia central en donde la suma de las desviaciones de los valores individuales respecto de la media es igual a cero.
Media Aritmética Es un número tal que si sumamos tantas veces como términos tenga la serie estadística, su suma no se altera. Es lo que se conoce como promedio simple, se calcula:
MEDIA ARITMÉTICA Sea la sucesión cuyos términos son: x1, x2, x3 ...… xn. Designando con a la media aritmética obtenemos: x + x + x + x + x + x = x1+ x2 + x3 +...+ xn Por lo tanto: para una serie simple: nx = x1+ x2 + x3 +...+ xn Despejando la x queda la fórmula:
MEDIA ARITMÉTICAEJEMPLO SERIE SIMPLE Duración de 40 focos ... n = 40 xi = 3,068
MEDIA ARITMÉTICASERIE DE FRECUENCIAS Las frecuencias nos indican cuántas veces se repiten los datos, por lo que la suma de Y, nos indica el total de datos.
MEDIA ARITMÉTICAEJEMPLO SERIE DE FRECUENCIAS Duración de 40 focos ... y = 40 xiy = 3,068
MEDIA ARITMÉTICASERIE DE CLASES Y FRECUENCIAS • Dado que ahora la variable agrupa a un subconjunto de valores (datos), es necesario, representarla con la marca de clase xim. • Marca de clase, valor representativo de los datos que se agrupan en la clase, se calcula con la media aritmética de los límites de cada clase. FÓRMULAS