1 / 45

Nociones Básicas de Estadística

Nociones Básicas de Estadística. Dr. Gerardo Alfaro C. Dr. Fernando Ávila C. Porque la Estadística?. "Algún día el pensamiento estadístico será tan nece­sario como la habilidad para leer y escribir“ (H. G. Wells)

rafael-reed
Download Presentation

Nociones Básicas de Estadística

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Nociones Básicas de Estadística Dr. Gerardo Alfaro C. Dr. Fernando Ávila C.

  2. Porque la Estadística? • "Algún día el pensamiento estadístico será tan nece­sario como la habilidad para leer y escribir“ (H. G. Wells) • El problema que enfrentan los investigadores no es la escasez de información, sino cómo utilizar la información disponible para tomar las decisiones más adecuadas.

  3. Desde la perspectiva de una toma de decisiones informada, cabe preguntarse por qué un investigador necesita saber estadística. Cuatro razones fundamentales: • Para saber cómo presentar y describir la información en forma adecuada • Para saber cómo obtener conclusiones sobre poblaciones grandes basándose solamente en la información obtenida de las muestras • Para saber cómo mejorar los procesos • Para saber cómo obtener pronósticos confiables

  4. Es común emplear los métodos estadísticos en las áreas funcionales de negocios: contabilidad, finanzas, administración y mercadotecnia. En contabilidad se utilizan los métodos estadísticos para seleccionar muestras con fines de auditoría y para comprender los determinantes del costo en la contabilidad de costos. En finanzas se utilizan los métodos estadísticos para elegir entre carteras alternativas de inversión y para detectar las tendencias en las medidas financieras a través del tiempo. En la administración se recurre a los métodos estadísticos para mejorar la calidad de los productos manufacturados o de los servicios que presta alguna organización. En mercadotecnia se aplican los métodos estadísticos para estimar la proporción de clientes que prefieren un producto en lugar de otro, además, para saber el porqué de su preferencia. También se utiliza para obtener conclusiones y determinar la estrategia publicitaria que resultará más útil para aumentar las ventas de un producto.

  5. Def. Estadística • El termino estadística proviene del latín statisticum collegium (“consejo de Estado”) y de su derivado italiano statista (“hombre de Estado o político”). Por lo tanto, los orígenes de la estadística están relacionados con el gobierno y sus cuerpos administrativos. • La estadística es el conjunto de técnicas que se emplean para la recolección, análisis e interpretación de datos. • La ciencia que tiene por objeto aplicar las leyes de la cantidad a los hechos sociales para medir su intensidad, deducir las leyes que los rigen y hacer su predicción próxima.

  6. ESTADíSTICA DESCRIPTIVA VERSUS INFERENCIA ESTADíSTICA • Estadística descriptiva: se refiere a los métodos de recolección, descripción, visualización y resumen de los datos, que pueden ser presentados en forma numérica o gráfica y la • Inferencia estadística: la generación de los modelos y predicciones relacionadas a los fenómenos estudiados, teniendo en cuenta el aspecto aleatorio y la incertidumbre en las observaciones).

  7. OPERACIONALIZACIÓN • En el proceso global de operacionalización hay que diferenciar dos nociones fundamentales: la conceptualización y la medición. a)La conceptualización: hace referencia al proceso teórico mediante el que se clarifican las ideas o constructos teóricos. Esta clarificación ha de hacerse de manera que la definición del constructo teórico comprenda el significado que se le suele asignar. b)La medición connota, en cambio, el proceso general que vincula las operaciones físicas de medición con las operaciones matemáticas de asignar números a objetos

  8. El proceso completo implicaría, en consecuencia, un triple nexo que relaciona los conceptos teóricos con las operaciones físicas de medición, y de éstas con los símbolos matemáticos. • Si queremos que nuestras teorías sean generalizables a través de una variedad de entornos, o con respecto a una variedad de fenómenos, obviamente tenemos que conceptualizar nuestras variables de forma que las proposiciones que contengan estas variables puedan aplicarse en tales entornos y fenómenos diversos.

  9. Medición de variables • Por variable generalmente se entiende cualquier cualidad o característica de un objeto (o evento) que contenga, al menos, dos atributos (categorías o valores), en los que pueda clasificarse un objeto o evento determinado. • Los atributos son las distintas categorías o valores que componen la variable. En función de ellos se clasifica a los objetos (o eventos) en un grupo u otro. • Variables como la "edad" (años cumplidos), la "altura" (centímetros), o el "nivel de ingresos" (en pesos), toman valores (numéricos). Por el contrario, variables como "sexo" (varón ,mujer), "estado civil" (soltero, casado, viudo, separado, divorciado), o "satisfacción conyugal" (bastante satisfecho, satisfecho, ni satisfecho ni insatisfecho, insatisfecho, bastante insatisfecho) adoptan categorías.

  10. La medición de una variable consiste, precisamente, en el proceso de asignar valores o categorías a las distintas características que conforman el objeto de estudio. Para que la medición se realice adecuadamente se recomienda, al menos, cumplir tres requisitos básicos: • a)Exhaustividad:Lamedición de la variable ha de efectuarse de forma que ésta comprenda el mayor número de atributos (categorías o valores) posible. • b)Exclusividad: Los distintos atributos que componen la variable deben ser mutuamente excluyentes. Por lo que deberán definirse de manera que cualquier observación sólo pueda clasificarse en términos de un único atributo. • c) Precisión: Realizar el mayor número de distinciones posibles. Ello contribuye a la consecución de una información más precisa.

  11. Tipologías de variables según criterios de clasificación.

  12. Variables nominales • Aquellas variables cuyos atributos sólo cumplen las condiciones esenciales de exhaustividad y exclusividad. Únicamente se hallan compuestas por distintas denominaciones, entre las que no puede establecerse ningún tipo de relación (de orden o de otra clase): Ello limita las posibilidades de análisis estadísticos en este tipo de variables. • A esta modalidad pertenecen las variables sexo, estado civil, nacionalidad, partido político, color del pelo, grupo sanguíneo, situación laboral; cualquier variable que indique una cualidad del objeto o evento que se analice, sin establecer ninguna graduación entre las distintas categorías que conforman la variable.

  13. Variables ordinales • Variables cuyos atributos participan de las características anteriormente referidas, a las que se suma la posibilidad de poderse "ordenar", en el sentido de "mayor que" o "menor que "'. No obstante, continúa sin poderse conocer la magnitud exacta que diferencia a un atribulo de otro. Las variables ordinales son, igualmente, variables no métricas o cualitativas. Expresan una "cualidad" del objeto o acontecimiento, no una "cantidad". • Como ejemplos pueden citarse las variables clase social, nivel de estudios, ideología política, satisfacción laboral, calificación académica, curso académico o cualquier otra que comprenda categorías "ordenables" (en un sentido u otro).

  14. Variables de intervalo • Constituyen variables cuantitativas o métricas. Puede "cuantificarse" la distancia exacta que separa cada valor de la variable. Ello es posible gracias al establecimiento de alguna unidad física de medición estándar (años, pesos, horas, minutos, metros, grados). Lo que posibilita que pueda afirmarse, por ejemplo, que la distancia que separa a aquellas personas de 15 y 16 años es la misma entre aquellos de 72 y 73 años.

  15. Variables de proporción o razón • A las características del nivel de intervalo se suma la posibilidad de establecer un cero absoluto. Lo que permite el cálculo de "proporciones" y la realización de cualquier operación aritmética. La mayoría de las variables de intervalo son, a su vez, de razón (ingresos, n° de habitantes, n°de veces que se asiste a un concierto. • Ello lleva a algunos autores, como Blalock (1978), a afirmar que la distinción entre variables de intervalo y variables de razón es puramente académica más que real. Una vez que se ha determinado la magnitud de la unidad, resulta difícil concebir la posibilidad de fijar cero unidades.

  16. Tipos de variable según la escala de medición • 1) Variables continuas: Aquellas variables en las que pueden hallarse valores intermedios entre dos valores dados, al conformar una escala ininterrumpida de valores. • 2) Variables discretas: Cuando en la escala de medición de la variable no cabe la posibilidad de hallar dos valores intermedios, comprendidos entre dos atributos de la variable. • La generalidad de las variables denominadas cualitativas (nominales y ordinales) son discretas. También lo son algunas cuantitativas, como el n.o de miembros de una familia (no puede haber 2 hijos y medio), o el n.o de coches vendidos.

  17. Tipos de variables según su función en la investigación • 1) Variables independientes, explicativas o predictoras (X): Aquellas variables cuyos atributos se supone que influyen en los que adopta una segunda variable (la dependiente). Figuran en las hipótesis de la investigación e indican posible "causas" de la variación de la variable que centra el interés de la indagación (la dependiente o variable efecto) • 2) Variables dependientes o criterio (Y): Variables cuyos atributos "dependen" -como su nombre indica- de los que adopten las variables independientes. Ambos tipos de variables corresponden a los objetivos de la investigación,

  18. Tipos de variables según su nivel de abstracción • 1) Variables generales: Aquellas variables que son tan genéricas y abstractas que no pueden ser directamente observadas. Su medición exige que se traduzcan a variables intermedias e indicadores. Un ejemplo típico de variable genérica lo representa la variable "status social" porque necesita de indicadores concretos que ayuden a su medición. • 2) Variables intermedias: Expresan alguna dimensión o aspecto parcial de los comprendidos en la variable genérica. Por ejemplo, el "nivel educativo" para la medición de la variable "status social". • 3) Indicadores o variables empíricas: Representan aspectos específicos de las dimensiones que comprende un concepto abstracto o variable genérica. Se distinguen por ser directamente medibles. Por ejemplo, los "cursos académicos cumplidos" como indicador para la dimensión "nivel educativo".

  19. Diseño de la muestra • Por población (o universo de estudio) comúnmente se entiende un conjunto de unidades, para las que se desea obtener cierta información. Las unidades pueden ser personas, familias, viviendas, escuelas, organizaciones, artículos de prensa ... ; y la información vendrá dictada por los objetivos de la investigación (condiciones de habitabilidad de la vivienda, reacción familiar ante el fracaso escolar, la práctica de la religión en las escuelas). • En la definición y acotación de la población han de mencionarse características esenciales que la ubiquen en un espacio y tiempo concreto. Una vez definida la población, se procede al diseño de la muestra: la selección de unas unidades concretas de dicha población.

  20. Métodos de muestreo

  21. Ejemplo • Propuesta de investigación • Identificación de variables • Población • Muestra • Nivel de medición de variables

  22. Medidas de tendencia central • Las medidas de tendencia central (media, mediana y moda) sirven como puntos de referencia para interpretar las datos que se obtienen en un experimento. El propósito de las medidas de tendencia central es: (caso calificaciones) • Mostrar en qué lugar se ubica la persona promedio o típica del grupo. • Sirve como un método para comparar o interpretar cualquier puntaje en relación con el puntaje central o típico. • Sirve como un método para comparar el puntaje obtenido por una misma persona en dos diferentes ocasiones. • Sirve como un método para comparar los resultados medios obtenidos por dos o más grupos

  23. Las medidas de tendencia central más comunes son: • La media aritmética: comúnmente conocida como media o promedio. Se representa por medio de una letra M o por una X con una línea en la parte superior. • La mediana: la cual es el puntaje que se ubica en el centro de una distribución. Se representa como Md. • La moda: que es el puntaje que se presenta con mayor frecuencia en una distribución. Se representa Mo.

  24. Moda (Mo) Es la medida que indica cual dato tiene la mayor frecuencia en un conjunto de datos; o sea, cual se repite más. Mediana (Med) • Es el valor central de un conjunto de valores ordenados en forma creciente o decreciente. Dicho en otras palabras, la Mediana corresponde al valor que deja igual número de valores antes y después de él en un conjunto de datos agrupados. • Según el número de valores que se tengan se pueden presentar dos casos: • Si el número de valores es impar, la Mediana corresponderá al valor central de dicho conjunto de datos. • Si el número de valores es par, la Mediana corresponderá al promedio de los dos valores centrales (los valores centrales se suman y se dividen por 2).

  25. Medidas de tendencia central

  26. Cálculo de medidas puntuales con Excel utilizar funciones y análisis y si • Base datos pedidos

  27. Medidas de dispersión • Las Medidas de Dispersión nos resumen la información de la “muestra” o serie de datos, dándonos información acerca de la magnitud del alejamiento de la distribución de datos en relación a un valor central o de concentración de los datos. • Rango • Varianza • Desviación Estándar • Coeficiente de Pearson

  28. RANGO ( R ) • Es la diferencia entre el valor máximo y el valor mínimo de un conjunto de datos, es fácil de calcular y sus unidades son las mismas que las de la variable. Posee algunos inconvenientes; no utiliza todas las observaciones (solo 2 de ellas), también puede verse afectada por alguna observación extrema. • Su fórmula es: R = Dato máximo - Dato mínimo

  29. VARIANZA • Mide la distancia existente entre los valores de la serie y la media. La varianza siempre será mayor que cero. Mientras más cerca se encuentren los valores de cero, estos valores están más concentrados alrededor de la media; además es el cuadrado de la desviación estándar. Su ecuación es:

  30. DESVIACION ESTÁNDAR • Es la diferencia entre el valor de un dato y el valor de la media de su distribución, también mide la variabilidad de las observaciones con respecto a la media, es igual a la raíz cuadrada de la varianza. Esta medida de dispersión siempre es positiva. Su fórmula es.

  31. Coeficiente de Pearson • comparar poblaciones en las que las unidades de medida son distintas, o que aún teniendo la misma unidad de medida difieren en sus magnitudes. • Esta situación se nos presenta por ejemplo cuando tenemos que comparar la dispersión del peso y la altura o si queremos comparar la dispersión en las alturas de una población de caballos y otra de ratones. • Coeficiente de variación para una muestra: • Coeficiente de variación para una población:

  32. ASIMETRÍA • Es una medida de forma de una distribución que permite identificar y describir la manera como los datos tiende a reunirse de acuerdo con la frecuencia con que se hallen dentro de la distribución. Permite identificar las características de la distribución de datos sin necesidad de generar el gráfico. Donde: = media aritmética. Md = Mediana. s = desviación típica o estándar

  33. El Coeficiente de Pearson varía entre -3 y 3 • Si As < 0 ? la distribución será asimétrica negativa. • Si As = 0 ? la distribución será simétrica. • Si As > 0 ? la distribución será asimétrica positiva.

  34. Cálculo de medidas puntuales con Excel utilizar funciones y análisis y si • Base datos pedidos

  35. Distribuciones de probabilidad • Cuando se asignan valores de probabilidad a todos los valores numéricos posibles de una variable aleatoria X, ya sea mediante un listado o a través de una función matemática, se obtiene como resultado una distribución de probabilidad. • Para una variable aleatoria discreta, se pueden enlistar todos los valores numéricos posibles de la variable en una tabla con las probabilidades correspondientes. Existen diversas distribuciones estándar de probabilidad que pueden utilizarse como modelos para una amplia gama de variables aleatorias discretas en aplicaciones. • Distribuciones observamos binomial, hipergeométrica y Poisson.

  36. Distribución Binomial • La distribución binomial es una distribución discreta de probabilidad aplicable como modelo a diversas situaciones de toma de decisiones, siempre y cuando pueda suponerse que el proceso de muestreo se ajusta a un proceso Bernoulii. Un proceso Bernoulli es un proceso de muestreo en el que: • (1) Sólo son posibles dos resultados mutuamente excluyentes en cada ensayo u observación. Por conveniencia, a estos resultados se les denomina éxito y fracaso. • (2) Los resultados del conjunto de ensayos u observaciones, constituyen eventos independientes. • (3) La probabilidad de éxito, que se denota mediante p, permanece constante de un ensayo a otro. Es decir, el proceso es estacionario.

  37. Puede utilizarse la distribución binomial para determinar la probabilidad de obtener un número determinado de éxitos en un proceso Bernoulii. Se requieren tres valores: el número específico de éxitos (X), el número de ensayos u observaciones (n) Y la probabilidad de éxito en cada uno de los ensayos (P).

  38. Ejemplo

  39. Distribuciones de probabilidad para variables aleatorias continuas: VARIABLES ALEATORIAS CONTINUAS • A diferencia de una variable aleatoria discreta, una variable aleatoria continua es la que puede tomar cualquier valor fraccionario en un rango determinado de valores. Como existe un número infinito de posibles mediciones fraccionarias, no pueden enlistarse todos los valores posibles con una probabilidad correspondiente. Más bien, se define una función de densidad de probabilidad. Esta expresión matemática da la función de X, y se representa mediante el símbolo f (X), para cualquier valor designado de la variable aleatoria X. A la gráfica de una función de este tipo se le denomina curva de probabilidad y el área entre dos puntos cualesquiera bajo la curva da la probabilidad de la ocurrencia aleatoria de un valor entre esos dos puntos.

  40. Existen diversas distribuciones continuas de probabilidad comunes que son aplicables como modelos a una amplia gama de variables continuas en determinadas circunstancias. Existen tablas de probabilidades para esas distribuciones estándar, haciendo que resulte innecesario el método de la integración para determinar las áreas bajo la curva de probabilidad para estas distribuciones. Los modelos comunes de distribuciones de probabilidad continua que se describen son las distribuciones normal.

  41. Distribución normal de probabilidad • La distribución normal de probabilidad es una distribución continua de probabilidad que es, al mismo tiempo, simétrica y mesokúrtica. Con frecuencia se describe a la curva de probabilidad que representa a la distribución normal como una campana.

  42. La distribución normal de probabilidad es muy importante en inferencia estadística por tres razones principales: • (1) Se sabe que las mediciones que se obtienen en muchos procesos aleatorios tienen esta clase de distribución. • (2) Con frecuencia pueden utilizarse las probabilidades normales para aproximar otras distribuciones de probabilidad, tales como las distribuciones binomial y Poisson. • (3) Las distribuciones de estadísticas como la media muestral y la proporción muestral tienen distribución normal cuando el tamaño de la muestra es grande, sin importar la forma de la distribución de la población de origen

  43. Ejemplo

More Related