1 / 41

Estadística… ¿Para que nos sirve…?

Estadística… ¿Para que nos sirve…?. La estadística se utiliza como tecnología al servicio de las ciencias donde la variabilidad y la incertidumbre forman parte de su naturaleza . La ciencia por lo general se ocupa de fenómenos observables.

durin
Download Presentation

Estadística… ¿Para que nos sirve…?

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Estadística…¿Para que nos sirve…? La estadística se utiliza como tecnología al servicio de las ciencias donde la variabilidad y la incertidumbre forman parte de su naturaleza. La ciencia por lo general se ocupa de fenómenos observables. La ciencia se desarrolla observando hechos, formulando leyes que los explican y realizando experimentos para validar o rechazar dichas leyes.

  2. Definición: • Es la rama de la matemática que comprende métodos y técnicas que se emplean en la recolección, ordenamiento, resumen, análisis, interpretación y comunicación de conjuntos de datos. • Descriptiva:Sistematización, recogida, ordenacióny presentación de los datos referentes a un fenómeno que presenta variabilidad o incertidumbre para su estudio metódico. • Probabilidad: con objeto de deducir las leyes que rigen esos fenómenos. • Inferencia: poder de esa forma hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones.

  3. Pasos de un estudio estadístico

  4. Plantear hipótesis sobre una población • Los fumadores tienen “más bajas” laboralesque los no fumadores • ¿En qué sentido? ¿Mayor número? ¿Tiempo medio? • Decidir qué datos recoger (diseño de experimentos) • Qué individuos pertenecerán al estudio (muestras) • Fumadores y no fumadores en edad laboral. • Criterios de exclusión ¿Cómo se eligen? ¿Descartamos los que padecen enfermedades crónicas? • Qué datos recoger de los mismos (variables) • Número de bajas • Tiempo de duración de cada baja • ¿Sexo? ¿Sector laboral? ¿Otros factores? • Recoger los datos (muestreo) • ¿Estratificado? ¿Sistemáticamente? • Describir (resumir) los datos obtenidos • tiempo medio de baja en fumadores y no (estadísticos) • % de bajas por fumadores y sexo (frecuencias), gráficos,... • Realizar una inferencia sobre la población • Los fumadores están de baja al menos 10 días/año más de media que los no fumadores. • Cuantificar la confianza en la inferencia • Nivel de confianza del 95% • Significación del contraste: p=2%

  5. Población: Es un conjunto cuyos elementos poseen alguna característica común que se quiere estudiar, ya sea de individuos, de animales, de objetos, de medidas, de producciones, de acontecimientos o de sucesos. La población puede ser finita o infinita. Muestra:subconjunto de la población al que tenemos acceso y sobre el que realmente asemos las observaciones ( mediciones). Debería ser “representativo” Esta formado por miembros “seleccionados” de la población (individuos, unidades experimentales). Población y Muestra:

  6. Muestreo • En estadística un muestreo es la técnica para la selección de una muestra a partir de una población. • Al elegir una muestra, se espera que sus propiedades sean extrapoladles a la población. Este proceso permite ahorrar recursos, obteniendo resultados parecidos que si se realizase un estudio de toda la población.

  7. Técnicas de muestreo Muestreo probabilístico: sontodos aquellos métodos para los que puede calcularse la probabilidad de extracción de cualquiera de las muestras posibles. -Sin reposición de los elementos. -Con reposición de los elementos. *Sistemático: Se utiliza cuando el universo es de gran tamaño o ha de extenderse en el tiempo. *Estratificado:Consiste en la división previa de la población de estudio en grupos o clases que se suponen homogéneos respecto a característica a estudiar. A cada uno de estos estratos se le asignaría una cuota que determinaría el número de miembros del mismo que compondrán la muestra. (agrupados en estratos) Muestreo por conglomerados:Cuando la población se encuentra dividida, de manera natural, en grupos que se suponen que contienen toda la variabilidad de la población, es decir, la representan fielmente respecto a la característica a elegir, pueden seleccionarse sólo algunos de estos grupos o conglomerados para la realización del estudio.

  8. Variables • Una variable es una característica observable que varía entre los diferentes individuos de una población. La información que disponemos de cada individuo es resumida en variables. • En los individuos de la poblaciónhumana, de uno a otro es variable: • El grupo sanguíneo • {A, B, AB, O}  Var. Cualitativa • Su nivel de felicidad “declarado” • {Deprimido, Ni fu ni fa, Muy Feliz}  Var. Ordinal • El número de hijos • {0,1,2,3,...}  Var. Numérica discreta • La altura • {1’62 ; 1’74; ...}  Var. Numérica continua

  9. Tipos de variables • Cualitativas: son aquellas cuando las observaciones realizadas se refieren a un atributo (no son numéricas), por ej: sexo, nacionalidad, profesión. Si sus valores (modalidades) no se pueden asociar naturalmente a un número (no se pueden hacer operaciones algebraicas con ellos) • Nominales: Si sus valores no se pueden ordenar • Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No) • Ordinales: Si sus valores se pueden ordenar • Mejoría a un tratamiento, Grado de satisfacción, Intensidad del dolor

  10. Cuantitativas: son aquellas en que cada observación tiene un valor expresado por un numero real, por ej: peso, temperatura, salario. (tiene sentido hacer operaciones algebraicas con ellos) • Discretas: Si toma valores enteros • Número de hijos, Número de cigarrillos, Num. de “cumpleaños”. • Continuas: Si entre dos valores, son posibles infinitos valores intermedios. • Altura, Presión intraocular, Dosis de medicamento administrado, edad, peso, estatura.

  11. Los posibles valores de una variable suelen denominarse modalidades. • Las modalidades pueden agruparse en clases (intervalos) • Edades: • Menos de 20 años, de 20 a 50 años, más de 50 años • Hijos: • Menos de 3 hijos, De 3 a 5, 6 o más hijos • Las modalidades/clases deben forman un sistema exhaustivo y excluyente • Exhaustivo: No podemos olvidar ningún posible valor de la variable • Mal: ¿Cuál es su color del pelo: (Rubio, Moreno)? • Bien: ¿Cuál es su grupo sanguíneo? • Excluyente: Nadie puede presentar dos valores simultáneos de la variable • Estudio sobre el ocio • Mal: De los siguientes, qué le gusta: (deporte, cine) • Bien: Le gusta el deporte: (Sí, No) • Bien: Le gusta el cine: (Sí, No) • Mal: Cuántos hijos tiene: (Ninguno, Menos de 5, Más de 2)

  12. Presentación de datos Las tablas de frecuencias y las representaciones gráficas son dos maneras equivalentes de presentar la información. Las dos exponen ordenadamente la información recogida en una muestra.

  13. Clasificación de las variables (tipos de escala) • Escala nominal: etiquetas simples, solo permite identificar el objeto en estudio. Ej: código de barras, Rut, patente. • Escala ordinal: mediciones en que que existe un orden implícito, admite grados de calidad. • Escala intervalar: considera no solo la información, permite el orden, permite también cuantificar las diferencias entre los individuos que pertenecen a clases o categorías distintas. (En esta escala no existe el cero absoluto) • Escala de razón: considera todas las cualidades de la escala anterior, pero si existe el cero absoluto. Ej : escalas de medición ‘’KM’’

  14. Tabulación de datos • Frecuencia [f]: numero de veces que se repite un dato (también se le denomina frecuencia absoluta) • Frecuencia acumulada [Fac]: es la que se obtiene sumando ordenadamente las frecuencias absolutas hasta la que ocupa la ultima posición • Frecuencia relativa [Fr]: es el cuociente entre la frecuencia absoluta de uno de los valores de la variable y el total de datos, expresado en tanto porciento • Frecuencia relativa acumulada [Frac] es la que se obtiene sumando ordenadamente la frecuencia relativa hasta la que ocupa la ultima posición. • Marca de clase: se define como el promedio de lados extremo de un intervalo. • Datos a Granel: datos dispersos, datos sueltos

  15. Tablas de frecuencia

  16. Medidas de tendencia central • TRES MEDIDAS SE USAN PARA DESCRIBIR EL “CENTRO” O “LOCALIZACION” DE UN CONJUNTO DE DATOS. • ‘’LA MODA’’ • ‘’LA MEDIANA’’ • ‘’LA MEDIA’’ (PROMEDIO) -LA MEDIA GEOMETRICA -LA MEDIA ARMONICA

  17. La Moda • Interpreta el significado de centro como el valor que ocurre con mayor frecuencia. (el que mas se repite) Se define o calcula: • La moda puede no ser única

  18. La Mediana • La mediana identifica el valor central de los valores provenientes de una muestra. La mediana es entonces una medida de centralidad. La mitad de los valores de la ‘’muestra’’ serán mas grandes que la mediana y la otra mitad serán mas pequeños. Se calcula: -Si ‘’N’’ es impar: (Donde ‘’Me’’ sera la mediana) -Si ‘’N’’ es par:

  19. La Media • Media aritmética:es el valor obtenido sumando las observaciones y dividiendo esta suma por el número de observaciones que hay en el grupo. La media resume en un valor las características de una variable teniendo en cuenta a todos los casos. Solamente puede utilizarse con variables cuantitativas Se calcula: -Donde ‘’xi’’ es la marca de clase

  20. Media geométrica: La media geométrica de N observaciones es la raíz de índice N del producto de todas las observaciones. La representaremos por G. -Se calcula: (No interfieren valores o medidas negativas) • La media geométrica de un conjunto de observaciones es la raíz n ésima de su producto. El cálculo de la media geométrica exige que todas las observaciones sean positivas.

  21. Media armónica: La media armónica de N observaciones es la inversa de la media de las inversas de las observaciones y la denotaremos por H. -Se calcula:

  22. Desviaciones • Desviación media:Si calculamos la suma de los errores absolutos y la dividimos por el tamaño de la muestra, es decir, calculamos el promedio de los ‘’errores absolutos’’, obtenemos una medida de dispersión conocida con el nombre de “DESVIACION MEDIA” (D.M)  Errores absolutos: ignora el signo de cada desvío (+/-). • En general si disponemos del conjunto de valores x1 ,x 2……………….x n , la desviación • media para estos valores se define por:

  23. Desviación estándar:La desviación estándar resulta ser la distancia que se obtiene entre un dato observado o medido y la media de los mismos. Es decir:

  24. Gráficos estadísticos • Los gráficos son medios popularizados y a menudo los más convenientes para presentar datos, se emplean para tener una representación visual de la totalidad de la información. Los gráficos estadísticos presentan los datos en forma de dibujo de tal modo que se pueda percibir fácilmente los hechos esenciales y compararlos con otros. 

  25. Tipos de gráficos estadísticos • Barra • Línea • Circulares • Áreas • Cartogramas • Mixtos • Histogramas • Dispersogramas • Pictogramas

  26. Gráficos de barras verticales • Representan valores usando trazos verticales, aislados o no unos de otros, según la variable a graficar sea discreta o continua. Pueden usarse para representar: • O una serie • O dos o mas series(también llamado de barras comparativas)

  27. Gráficos de barras horizontales • Representan valores discretos a base de trazos horizontales, aislados unos de otros. Se utilizan cuando los textos correspondientes a cada categoría son muy extensos. • O para una serie • O para mas o dos series

  28. Gráficos de barras proporcionales • Se usan cuando lo que se busca es resaltar la representación de los porcentajes de los datos que componen un total. Las barras pueden ser:  Verticales Horizontales

  29. Gráficos de barras comparativas • Se utilizan para comparar dos o más series, para comparar valores entre categorías.  Las barras pueden ser:  Verticales  horizontales

  30. Gráficos de barras apiladas • Se usan para mostrar las relaciones entre dos o mas series con el total. Las barras pueden ser: verticales horizontales

  31. Gráficos de líneas • En este tipo de gráfico se representan los valores de los datos en dos ejes cartesianos ortogonales entre sí.  Se pueden usar para representar:  una serie dos o más series

  32. Estos gráficos se utilizan para representar valores con grandes incrementos entre sí.

  33. Gráficos circulares • Estos gráficos nos permiten ver la distribución interna de los datos que representan un hecho, en forma de porcentajes sobre un total. Se suele separar el sector correspondiente al mayor o menor valor, según lo que se desee destacar. Se pueden ser:  En dos dimensiones En tres dimensiones

  34. Gráficos de Áreas • En estos tipos de gráficos se busca mostrar la tendencia de la información generalmente en un período de tiempo.Pueden ser:  Para representar una serie Para representar dos o más series En dos dimensiones En tres dimensiones.

  35. Cartogramas • Estos tipos de gráficos se utilizan para mostrar datos sobre una base geográfica. La densidad de datos se puede marcar por círculos, sombreado, rayado o color.

  36. Gráficos Mixtos • En estos tipos de gráficos se representan dos o más series de datos, cada una con un tipo diferente de gráfico. Son gráficos más vistosos y se usan para resaltar las diferencias entre las series. Pueden ser:  en dos dimensiones en tres dimensiones. (polígono de frecuencia)

  37. Histogramas • Estos tipos de gráficos se utilizan para representa distribuciones de frecuencias. Algún software específico para estadística grafican la curva de gauss superpuesta con el histograma. 

  38. Los dispersogramas • Son gráficos que se construyen sobre dos ejes ortogonales de coordenadas, llamados cartesianos, cada punto corresponde a un par de valores de datos x e y de un mismo elemento suceso.

  39. Pictogramas • Los pictogramas son gráficos similares a los gráficos de barras, pero empleando un dibujo en una determinada escala para expresar la unidad de medida de los datos. Generalmente este dibujo debe cortarse para representar los datos. • Es común ver gráficos de barras donde las barras se reemplazan por dibujos a diferentes escalas con el único fin de hacer más vistoso el gráfico, estos tipos de gráficos noconstituyen un pictograma. Pueden ser:  En dos dimensiones En tres dimensiones.

  40. Las ojivas en estadística • La ojiva es una gráficas asociada a la distribución de frecuencias, es decir que en ella se permite ver cuántas observaciones se encuentran por encima o debajo de ciertos valores, en lugar de solo exhibir los números asignados a cada intervalo. • La ojiva apropiada para información que presente frecuencias mayores que el dato que se está comparando tendrá una pendiente negativa (hacia abajo y a la derecha) y en cambio la que se asigna a valores menores, tendrá una pendiente positiva.

  41. Diagramas Integrales • Se realizan a partir de las frecuencias acumuladas. Indican, para cada valor de la variable, la cantidad (frecuencia) de individuos que poseen un valor inferior o igual al mismo. Se pasan de los diferenciales a los integrales por integración y a la inversa por derivación.

More Related