360 likes | 615 Views
Conceptos Básicos de Estadística. Centro de Estudios Adlerianos. Eduardo Aguilar Enero - 2010. Para qué sirve estadística?. Estadística nos ayuda a generalizar conclusiones que inferimos a partir de datos (hechos) particulares. Ejemplo: elecciones nacionales
E N D
Conceptos Básicos de Estadística Centro de Estudios Adlerianos Eduardo Aguilar Enero - 2010
Para qué sirve estadística? • Estadística nos ayuda a generalizar conclusiones que inferimos a partir de datos (hechos) particulares. Ejemplo: elecciones nacionales • Con estadística no podemos demostrar que una hipótesis (conjetura) es correcta: apenas podemos descartar una hipótesis por ser poco verosímil a la luz de los datos (hechos) que disponemos.
Para qué sirve probabilidad? • Probabilidad nos ayuda a deducir conclusiones particulares a partir de un conocimiento general. Ejemplo: dado balanceado, moneda balanceada. • Para medir probabilidades usamos números reales comprendidos entre 0 y 1. (o porcentajes)
Probabilidad parte de conocimiento general (modelo, ley) Probabilidad DEDUCE conocimiento particular Importante! Estadistica vs Probabilidad • Estadística parte de conocimiento particular (datos) • Estadística INFIERE conocimiento general
“...Pero las estadísticas son injustas con el indivíduo. A pesar de que el diámetro promedio de las piedras de una pila sea de cinco centímetros, encontraremos que poquísimas piedras de ese montón tienen exactamente cinco centímetros de diámetro...” Marie-Louise von FranzEl hombre y sus símbolos
Cuándo precisamos estadística? • Dos dificultades al inferir conclusiones generales: • Diferencias observadas pequeñas comparadas con imprecision experimental y variabilidad biológica. • Para protegernos de conclusiones equivocadas debidas a nuestra capacidad para detectar patrones.
“Les statistiques sont une forme d'accomplissement de désir, tout comme les rêves.” Al igual que los sueños, las estadísticas son una forma de realización de deseos Jean Baudrillard(sociólogo francés)
En la práctica... • No es necesario conocer los detalles matemáticos: hay programas que se encargan de hacer los cálculos PERO • Es imprescindible entender conceptualmente cuándo usar una determinada herramienta y, sobre todo, no perder de vista sus limitaciones.
“Sin datos, todo lo que sos es una persona más opinando” Anónimo
Conceptos: muestra y población • Muestra es el conjunto de información (datos) que dispongo para inferirconclusiones generales. • Población es el conjunto de indivíduos (objetos) a los cuales se aplicanlas conclusiones generales.
Muestra “representativa” • Eliminar tendencias en la selección de los elementos de la muestra:el candidato ideal es cualquiera! • El tamaño de la muestra determina la incertidumbre de nuestra generalización. • Siempre considerar el tamaño de la muestra.
Proyecciones de Resultados ElectoralesTamaño Muestra: 1209 Error: 3%
Resultados Elecciones NacionalesPoblación: ciudadanos habilitados
Toda observación (intención de voto, resultado lotería, temperatura de mañana, etc) cuyo valor no podemos conocer de antemanocon certeza. Qué es una variable aleatoria?
Para cada valor posible de una variable aleatoria, la distribución de probabilidad informa la probabilidad de la variable tomar ese valor. Qué es una distribución de probabilidad?
La distribución Normal (o Gausiana, o campana) emerge cuando varios componentes aleatoriosindependientes se superponen para generar la variabilidad. Por qué la distribución Normal es importante?
Porque los promedios de grupos de medidas tienen una distribución Normal ! ( Teorema del Límite Central ) Por qué la distribución Normal es importante?
“The average human has one breast and one testicle.” El humano promedio tiene un seno y un testículo Des McHale(humorista irlandés)
Tipos de variables aleatorias • Nominales (o categóricas): voto • Ordinales: estrellas de hoteles • Intervalo: temperatura en grados Celsius • Racionales: temperatura em grados Kelvin
Dos (o más) variables están correlacionadas si tienen variaciones sincronizadas (conjuntas). Diámetro abdominal y probabilidad de infarto coronario Presión atmosférica y probabilidad de lluvia Variables Correlacionadas
Correlación NO implica Causalidad Importante!
“Está demostrado que festejar el cumpleaños es saludable. Las estadísticas muestran que las personas que más cumpleaños festejan son las más longevas” Anónimo
Dos usos diferentes de estadística • Estudios para generar nuevo conocimiento (escuela bayesiana - Fisher) • Investigación científica • Datamining (exploración de datos) • Estudio para tomar decisiones concretas(escuela frecuentista – Neyman-Pearson) • Control de calidad • Eficacia de medicamentos
Estudios para descartar una hipótesis específica Usa datos recabados en experimento planificado. Estudia la verosimilitud de una hipotesis específica. Dos tipos de estudio para generar conocimiento • Estudios Exploratorios • Usa Base de Datos pre-existente • Busca relaciones sugestivas de nuevas hipótesis. • Los datos no pueden usarse para evaluar las nuevas hipótesis.
Para generalizar conocimiento particular: PRIMERO formulo una conjetura (hipótesis) concreta SEGUNDO planifico cómo recabar datos (experimento) TERCERO uso estadística para evaluar la verosimilitud de la conjetura a la luz de los datos obtenidos. El orden es importante!
“He [an unsophisticated forecaster] uses statistics as a drunken man uses lamp posts - for support rather than for illumination.” Él [un predictor burdo] utiliza las estadísticas como un borracho utiliza las columnas de alumbrado más para apoyarse que para iluminarse. Andrew LangBiography (poeta escocés)
Es una medida de la verosimilitud de nuestra conjetura a la luz de los datos recogidos. Cuál es la probabilidad de haber recogido esos datos si nuestra conjetura es falsa? Cuanto menor es esa probabilidad más significativo desde el punto de vista estadistico es el resultado del experimento. Qué significa “estadísticamente significativo”?
Algunos valores arbitrarios • Un experimento produce resultados significativos si la probabilidad (valor p) es menor a 0,05. • Parámetros tales como el valor promedio se presentan con su intervalo de confianza del 95%. • El poder estadístico de un control de calidad debe ser como mínimo de 80%.
“On fait la science avec des faits, comme on fait une maison avec des pierres : mais une accumulation de faits n'est pas plus une science qu'un tas de pierres n'est une maison.” Hacemos ciencia usando datos, análogamente a como construimos una casa usando piedras: PERO datos acumulados no constituyen una ciencia así como un montón de piedras no es una casa. Henri Poincaré