110 likes | 254 Views
Organización: Cátedra de Ecología General, Fac. de Ciencias Naturales e IML. Estadística Aplicada a Ecología. Docente disertante: Dra Mariela del Carmen Alderete. Agosto 2013. Inferencia Estadística. Aplicación de estadística. Poner a prueba hipótesis científicas.
E N D
Organización: Cátedra de Ecología General, Fac. de Ciencias Naturales e IML Estadística Aplicada a Ecología Docente disertante: Dra Mariela del Carmen Alderete Agosto 2013
Inferencia Estadística Aplicación de estadística Poner a prueba hipótesis científicas Juicio: culpable (guilty) versos inocente (innocent). El sistema asume inocencia mientras el culpable no esté claro: refuta la hipótesis nula(nivel de significancia, α).
La variable long de alas de mosca doméstica tiene distribución normal con μ = 45,5 y σ2 = 15,21. Se colecta una muestra de 5 longitudes alares y se pretende poner a prueba que tales moscas proceden de una población N (45,5; 15,21). Estadística paramétrica implica conocer la distribución del cjto de datos y sus parámetros Una prueba estadística examina un cjto de datos muestreales y sobre la base de una distribución esperada de los datos (esperada según la hipótesis a prueba) lleva a tomar una decisión de aceptar la hipótesis que subyace a la distribución esperada o rechazarla y aceptar una hipótesis alternativa. Ho) μ = μo Ho) μ ≥ μo Ho) μ ≤ μo H1) μ ≠ μo H1) μ < μo H1) μ > μo Todo sistema de hipótesis debe ser mutuamente excluyentes Sistema bilateral de hipótesis H0: μ=45.5 H1: μ ≠ 45.5 o sea que H1 puede ser > a 45.5 < a 45.5
Distribución esperada de medias muestrales bajo H0. Las regiones de aceptación y rechazo para un nivel de significación α están delimitadas en la abscisa. Al trabajar con entes biológicos, ninguna prueba será 100% cierta. Lo mejor seria aceptar la hipótesis nula y sea 100 % verdadera( todas las longitudes alares dieron 45.5 cm) o rechazar la hipótesis nula y que sea 100% falsa (ninguna de las long alares miden 45.5 cm). Pero debemos aceptar errores
hay dos clases de error (de tipo I o α y II oβ) y antes de realizar una prueba estadística debemos decidir la magnitud de los errores. ¿Con cuanto error soy capaz de aceptar? Si la H0 implica que la μ=A, con una distribución simétrica, se presentan las áreas (sinónimo de probabilidad) de aceptación y rechazo de H0. Las áreas implican valores de α y β.
El error de tipo I o probabilidad (α) y cuando se expresa como porcentaje se denomina nivel de significación (α = 0,05 o 5%). • Si hay un 5% de error de tipo I, implica que 5 de cada 100 muestras se decidirá rechazar la Ho, concluyendo que la muestra no procede de una población con la media propuesta por Ho La presencia del error de tipo II (aceptar la Ho cuando es falsa) implica que existe una H1 que debe ser verdadera y por lo tanto, para calcular el error de tipo II debe especificarse H1. No hay pruebas suficientes para que el culpable sea condenado (está en duda su inocencia). Es preferible no condenar a condenar un inocente. PRUEBAS ESTADÍSTICAS CONSERVATIVAS Mientras menor sea la región de rechazo (menor α) en la distribución propuesta por Ho, mayor será la región de aceptación y por lo tanto mayor será el nivel de confianza de la prueba (1-α) propuesto por el observador. Sin embargo, mientras menor sea α, mayor será el solapamiento con la distribución propuesta por H1, de modo que mayor será β. Hay que tratar de que α y β sean lo más pequeños posible.
La variable long de alas de mosca doméstica tiene distribución normal con μ = 45,5 y σ2 = 15,21. Los límites de las regiones críticas se calculan: Punto crítico inferior: Z(α/2) σ/√n + μ = -1.96√15,21/√5 + 45,5 = 42,08 Punto crítico superior: Z(1-α/2) σ/√n + μ = +1.96√15,21/√5 + 45,5 = 48,92 Entonces se considera improbable que muestras con medias menores a 42,08 o mayores a 48,92 hubieran sido extraídas de una población con media poblacional μ= 45,5 en la long. Alar. Si se presentan muestras con long mayores o menores a esos valores implican que se debe rechazar la hipótesis nula que la media es de 45,5.
Cualquier prueba de hipotesis 1- Planteo de H0 y H1 2- Elección del nivel de significancia (α) para la prueba 3- Elección del estadístico de prueba (bajo H°) y valor crítico a determinarse según (α) y grados de libertad (gl) . Determinación de su valor crítico (valor en tabla, en softwares tablas incluidas) 4- Cálculo de´estadísticos y se compara con el valor crítico 5- Decisión: se rechaza o no la H0
Grados de libertad (gl) es un estimador del número de categorías independientes en una prueba o experimento estadístico: N-r donde N es cantidad total de datos o categorías independientes y r representa la cantidad de estimadores. Si estimamos la media de una muestra, gl=n-1. Las unidades muestreales deben ser independientes entre si y aleatorias (represente toda la variabilidad posible del cjto datos) Grados de libertad Tamaño de muestra (n) Si el investigador necesita registrar diferencias significativas (rechazar H°) debo tener una muestra suficientemente grande que permita registrar un T crítico, por ej, pequeño para que rápidamente se rechace H° . Verifiquen lo mencionado observando la tabla t.
Comparación entre dos muestras independientes • Planteo: I) H0= μ1 = μ4 , o equivalente a Ho= μ1 - μ4 = 0 • H1 = μ1 ≠ μ4 prueba de dos colas • II) Nivel de significación: α: 0.05% e intervalo de confianza del 95%. III) Estadístico t: debe basarse en la distribución de los datos. Y el t crítico o t de tabla ((“t (1-α/2, na+nb-2”) se basa en Ho IV) “t”, si el “tobs” calculado es mayor que el de tabla (“t (1-α/2, na+nb-2)) se encuentra en la zona de rechazo en la distribución de probabilidad , p<0,05, y por lo tanto rechazo H0 y acepto H1 . • V) Estadístico que relaciona parámetro y estimador El estadístico t obs tiene distribución t de Student, con esperanza o media igual a 0 y varianza que depende de los dos tamaños de muestras y (n1+n2-2 )grados de libertad.
Antes de cualquier análisis estadístico paramétrico: • OJO: se necesitan cumplir de supuestos para comparar dos muestras: • Distribución homogénea: varianzas iguales de cada media. (me interesa diferencias en medias). • Las dos muestras aleatorias e independientes • Deben responder a distribución simétrica. Si no es así probar con transformar variables. diferencia entre dos muestras de log de abundancia de N. oligospilus entre el Mollar (1) y Tafí del Valle (4).