1 / 51

Tamaño de Muestra

Tamaño de Muestra. METODO CIENTIFICO. Guías generales, retroalimentación, búsqueda de coherencia entre etapas. Problema preliminar Objetivos, justificación Definición de variables Hipótesis preliminar Revisión conceptual Problema Redefinición de variables Hipótesis

bena
Download Presentation

Tamaño de Muestra

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Tamaño de Muestra

  2. METODO CIENTIFICO Guías generales, retroalimentación, búsqueda de coherencia entre etapas • Problema preliminar • Objetivos, justificación • Definición de variables • Hipótesis preliminar • Revisión conceptual • Problema • Redefinición de variables • Hipótesis • Revisión de métodos • Diseño • Conducción • Análisis y síntesis • Interpretación y discusión • Conclusiones y recomendaciones • Reporte.

  3. DISEÑO • Elementos por estudiarse (sujetos, unidades) • Criterios de inclusión y de eliminación. • Forma de obtener los elementos (muestreo) • Estructura de la investigación : • Experimental u observacional • Prospectivo o retrospectivo • Longitudinal o transversal • Descriptivo o comparativo

  4. DISEÑO • ¿Qué , cómo, cuándo, con qué medir? • Formas de captación • Tamaño de muestra • Validez externa (extrapolación ) • Validez interna (control factores confusores) • ¿Estudio piloto? • Logística

  5. MEDICION Medir es tipificar o caracterizar un propiedad en un elemento de estudio. Previamente se debe conceptualizar la propiedad por medirse y obtener un indicador mediante una operacionalización. X CONCEPTO X1 X2 ... Xn INDICADORES Validez o Exactitud: el grado de que el indicador refleje la riqueza del concepto, que lo represente sin error. Confiabilidad o Precisión: la consistenciala medición con la cual un mismo elemento se mide sin o con poco cambio en diferentes circunstancias.

  6. Escala de medición Variables Ejemplos nominal Sexo: masculino, femenino Categóricas Nivel socioeconómico: Bajo, Medio y Alto ordinal de intervalo Temperatura, calificación de examen, etc. de razón o relación Numéricas Estatura, peso, distancia, etc. Número de hijos por familia, etc. absoluta

  7. VARIABLES Como al medir, es decir obtener el indicador con las operaciones establecidas en diferentes elementos o en uno solo en diferentes épocas, se tienen generalmente resultados distintos; se le llama variable al conjunto de posibles resultados. Ejemplos: • Peso de una persona en kilogramos • Temperatura rectal de un paciente en centígrados • Numero de episodios asmáticos por semana • Sexo de una persona • Grado de dolor en la región lumbar

  8. MEDICION NUMERICA Cuando el resultado de la medición se expresa con números, se llama medición numérica. También se dice que tenemos una escala numérica. Con esta forma o escala de medición se pueden calcular promedios o medias, desviaciones estándar, modas, correlaciones y en general aplicar las llamadas pruebas paramétricas. Ejemplos: • Temperatura en grados centígrados • Peso en Kg. , estatura en cm. • Número de episodios gripales • Bilirrubina en suero mg. por litro. • Número de leucocitos por mm. cúbico.

  9. ESCALAS ORDINALES Cuando el resultado de la medición se expresa en grados de intensidad, pero sin poder precisar el incremento de un grado a otro, únicamente se puede establecer un orden entre esos grados, se llama escala ordinal. En este caso sólo es válido en sentido estricto, la obtención de la moda, la mediana o los porcentiles. Aunque con muestras grandes y aplicándolo a conjuntos de resultados, se pueden manejar como variables numéricas y aplicar pruebas paramétricas.

  10. Ejemplos: • Grado de dolor en artrosis • Grado en hepatomegalia + ,++ ,+++ • Posición jerárquica en el trabajo

  11. ESCALAS NOMINALES Cuando el resultado de la medición es la ubicación o clasificación de un elemento a una categoría, y si estas no tienen un orden, se tiene una medición en escala nominal, con la cual sólo se le dan nombres a las categorías. En este caso no se pueden obtener medias o varianzas, solo modas. Se estudia la frecuencia de ocurrencia de los casos en cada una de las categorías. Las categorías deben ser mutuamente exclusivas y exhaustivas.

  12. Ejemplos: • Carrera de procedencia de un técnico. • Servicio de un hospital • Órgano afectado por un padecimiento. Se pueden usar k-1 variables indicadoras para obtener una representación numérica de la pertenencia a k categorías.

  13. σ/ n Y1, Y2, Y3, Y4,...Y100,.. ,Y200,...Y400,... TEOREMA CENTRAL DEL LIMITE Población de elementos a los que se les mide, Y, con media, μ, y desviación σ Media μ Desviación σ Frecuencias Y Regularidad estadística del primer orden (se observa en la naturaleza) Proceso de extracción de muestras al azar, de tamaño n “grande” μ Población teórica (conceptual) de promedios muestrales. Y Regularidad estadística del segundo orden (se construye como inferencia)

  14. σ/ n TEOREMA CENTRAL DEL LIMITE es el error estándar de la media muestral El error estándar señala el grado de error que se comete al tratar de conocer μ, con la media muestral.

  15. ERROR ESTANDAR DE LA MEDIA MUESTRAL EE(x) La media muestral se acerca más a la media poblacional, mientras más pequeño sea el error estándar. Si el tamaño de muestra crece, disminuye el error estándar y el conocimiento de la media poblacional con la muestral es mas preciso. Otra forma de disminuir el error estándar, es procurando mediante el control de variación, tener más factores constantes (o casi) en la población original.

  16. ERROR ESTANDAR DE LA MEDIA MUESTRAL EE(x) δ El error estándar depende de un parámetro desconocido que es σ. Entonces, éste se estima con la desviación estándar de la muestra, s. En base a las propiedades del modelo de distribución normal, se construyen los llamados intervalos de confianza para conocer μ, la media poblacional. Estos son : P[Y - 1.96(σ/ n ) < μ< Y + 1.96(σ / n )]= .95

  17. A partir del intervalo de confianza anterior, si se puede especificar en la etapa de planeación, el error hacia arriba o hacia abajo que se considera máximo aceptable. Es decir, se desea que la diferencia máxima entre el valor por obtenerse de Y, y el parámetro desconocido sea Entonces de la igualdad: δ=1.96σ/ n, se despeja el valor del tamaño de muestra: n=1.962σ2/δ2 TAMAÑO DE MUESTRA PARA CONOCER UNA MEDIA POBLACIONAL

  18. TAMAÑO DE MUESTRA PARA CONOCER UNA MEDIA POBLACIONAL Para poder usar la expresión anterior es necesario conocer el valor de σ. Usualmente no se conoce, por lo que se recurre a conocimientos previos sobre poblaciones semejantes, o bien se conduce un estudio piloto para estimar el valor de σ e insertarlo en la fórmula. Por supuesto el estudio piloto tambien puede servir para ensayar procesos de medición, estimar, costos, etc.

  19. TEOREMA CENTRAL DEL LIMITE PARA PROPORCIONES En el enunciado del teorema central del límite solo se pide que la población tenga elementos en los que se mide una variable numérica. Entonces se puede considerar el caso de una variable categórica con sólo dos categorías (dicotómica) para hacerla numérica se usa un valor de uno, 1, cuando un elemento tiene la característica A y cero, 0, cuando no. Entonces se puede demostrar que la media de un conjunto de valores cero y uno es igual a la proporción de unos.

  20. TEOREMA CENTRAL DEL LIMITE PARA PROPORCIONES Así la media muestral Y, es la proporción muestral, p; y la media poblacional, , es la proporción poblacional, P. Además la varianza es igual a P(1-P). Entonces el teorema central de límite señala que si se toman muestras de tamaño n (grande ), de una población con valores cero y uno, con proporción poblacional P; entonces los promedios o proporciones muestrales, tendrán una regularidad estadística modelada con la normal.

  21. TEOREMA CENTRAL DEL LIMITE PARA PROPORCIONES Los parámetros de esta distribución son una media de P y una desviación estándar (error estándar de P) igual a:

  22. P [ p - 1.96 p(1-p)/n < P< p + 1.96 p(1-p)/n ]= .95 √ √ P(1-P) n P P-δ P+δ TEOREMA CENTRAL DEL LIMITE PARA PROPORCIONES Población de elementos a los que se mide una variable dicotómica. Con “1” para “ a” y “ 0” si no. 1-P P 0 1 n grande: np>5 y n(1-p)>5 Proceso de extracción de muestras de tamaño n Población teórica de los posibles valores de las proporciones muestrales. Valores de p.

  23. nmin = 2 3{P(1-P)}2 Tamaño de muestra mínimo para una adecuada cercanía a la normal de la distribución de las p en muchas muestras. Glen McPherson “Statistics in Scientific Investigation. Its Basis, Application, and Interpretation” Springer Verlag, 1990

  24. TEOREMA CENTRAL DEL LIMITE σ n  Error estándar de Y Proceso de tomar muchas muestras de tamaño n, y calcular promedios en cada muestra, Y n>0  f (Y) n>10  μ Y n>30  n>30 nP>5 n(1-P)>5   Sólo se toma una muestra, pero se evalúa en relación a la normal 0 1 1 2 3 4 5 μ= P, σ2 = P(1-P)

  25. Distribución de diferencias de medias de muestras. Consideremos que se toma una muestra de tamaño n1 de una población 1 y otra de tamaño n2 de una población 2. Si ambas muestras son “grandes” o bien la variable de estudio tiene distribucion normal, entonces: Si las varianzas se pueden considerar iguales: Si los tamaños de muestra son iguales:

  26. Dos promedios Homoscedasticidad Regularidad de 2o nivel 1 2 1 2 Proceso de toma de muestras de tamaños n1 y n2 . Se obtiene: f ( x1 -x2) Sp=√[(n1-1)S21+(n2-1)S22]/(n1+n2-2) .025 .025 SX1-X2=√(Sp2(1/n1 +1/n2 )) x1-x2 t gle =n1+n2-2 (μ1-μ2)-1.96σX1-X2 (μ1-μ2)-1.96σX1-X2 μ1.μ2

  27. Dos promedios Homoscedasticidad Regularidad de 2o nivel 1 2 1 2 Proceso de toma de muestras de tamaños n1 y n2 . Se obtiene: f ( x1 -x2) Sp=√[(S21+S22]/(n) .025 .025 SX1-X2=√(2Sp2(1/n)) x1-x2 t gle =n1+n2-2 (μ1-μ2)-1.96σX1-X2 (μ1-μ2)-1.96σX1-X2 μ1.μ2

  28. Dos ubicaciones para la distribución de diferencias de medias de muestras, ambas con tamaño n. Zona de rechazo de Ho Es la probabilidad de que siendo cierta Ha: no se rechaza Ho, es el error tipo II . A - se le llama potencia de la prueba Es la diferencia real entre

  29. pequeña

  30. mayor

  31. Mucho mayor

  32. Fijos Cambia Cambia Fijos

  33. Etapa de planeación Coeficiente de Variación Diferencia entre medias como % de una media base δ*

  34. Etapa de análisis Capacidad de detección La probabilidad de detectar una diferencia entre medias poblacionales de magnitud  o mayor es de 1-

  35. n=10, n=100,

  36. n=10, n=100,

  37. CV.100 CV. 80 CV.40

  38. La muestra obtenida es la de las dos poblaciones. Por población es la mitad

  39. Efecto de disminuir la varianza

  40. Diferencia de proporciones

  41. Diferencia de 4 medias, Medias 1,2,3,4 Medias 1,3,5,7

  42. Se toman del libro de D Murray "Design and Analysis of Group - Randomized Trials" Oxford University Press 1998- p364. Se considera necesario de DEFF anteriores despejar el CCI , coeficiente de correlación intraconglomerado. DEFF=(1+(m-1))CCI, ya que esta m es el numero de UUM por UPM en la encuesta de referencia. La m de expresiones de pag.363 es la del diseño experimental que se planea. Por ejemplo para indicadores de talla/edad, peso/talla en la ENN1999 el DEFF fue de 2.1 y la m de 50, luego CCI es de 0.042 . Se usa la Delta como capacidad de detección o efecto detectable de interés, pero expresada como proporción de la desviación estándar de la variable de interés . T1 es de 1.96 y con beta de 0.8 la T2 es de 0.842

  43. El valor de m , el numero de unidades de primer nivel, vg. Niños. El valor de g , el numero de unidades de segundo nivel, vg. comunidades

More Related