1 / 12

ESTIMACION

ESTIMACION

vienna
Download Presentation

ESTIMACION

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. ESTIMACION • En varios pasajes de este libro hemos planteado la dificultad que se confronta en las investigaciones, de llegar a conclusiones sobre una población grande mediante el estudio de la totalidad de sus elementos, lo que hace imperativo la necesidad de seleccionar muestras, de las cuales se obtienen medidas (estadísticos) que vienen a contribuir a la inferencia sobre las medidas de la población (parámetros). • La estimación puede ser de dos tipos: • Estimación puntual • Estimación por intervalo • Mediante la estimación puntual se utiliza un estadístico muestral para estimar el parámetro poblacional, la media muestral es un estimador puntual utilizado para estimar el parámetro poblacional en un solo valor o punto. Por ejemplo el gerente financiero de una empresa desea saber cuál es la media de las cuentas por cobrar. De los datos relativos a una muestra de tamaño n = 200 cuentas, se encontró que el monto medio de las cuentas por cobrar es de X = 125,000. Entonces este valor es utilizado como estimador puntual de la media de las cuentas por cobrar de toda la población. LA ESTIMACION POR INTERVALOS Establece que el parámetro de la población se encuentra dentro de un rango, esto es, entre un valor mínimo denominado límite inferior y un valor máximo, denominado límite superior. La estimación por intervalo implica la introducción de un nivel de confianza de que el intervalo contiene el valor del parámetro. Niveles de confianza 90%, 95% y 99% que en realidad son convencionales, usted podría estimar con valores diferentes a estos incluso menores de 90%, claro está, que mientras menor es el nivel de confianza menor será la exactitud de la estimación.

  2. Prosiguiendo con la estimación puntual y a modo de ejemplo, suponga usted que se tienen los siguientes datos referentes al tiempo en minutos que le toma a un auditor auditar unos documentos contables. 30, 40, 38, 36,34, 26, 24, 33, 22, 28 La media X = 30 + 40 + 38 + 36 + 34 + 26 + 24 + 33 + 22 + 28 …….. X = 29.7 minutos 10 X = 29.7 minutos es la media muestral, ahora el cálculo de la varianza muestral, veamos

  3. ESTIMACION POR INTERVALOS La media de la población  El procedimiento para determinar el intervalo (a,b) que comprenda un parámetro de la población, en este caso de la media de la población  con cierta probabilidad 1 - , se conoce como estimación por intervalos donde  es la probabilidad de que el intervalo no contenga el valor del parámetro y 1 -  probabilidad de que intervalo incluya el valor del parámetro, se escribe de la siguiente manera. P (a <  < b) = 1 -  donde a y b son dos variables aleatorias y respectivamente son los límite inferior y superior del intervalo. (a,b) es conocido también como intervalo de confianza. Así pues, si la media muestral X es un estimador de la media población , el intervalo de confianza de  viene dado así, P (X  Z X ) = 1 -  P (X - Z X   X + Z X) = 1 -  Donde Límite inferior = X - Z X Límite superior = X + Z X Z = Valor típico de Z que corta cualquiera de las colas por /2 de la distribución. X = error estándar de la media muestral. n Z =  2  2 Z

  4. PROPIEDADES DE UN BUEN ESTIMADOR 1) Estimador insesgado Un estimador es insesgado si la media de su distribución muestral es igual al parámetro correspondiente. Esto es, el estimador esperado es igual al parámetro población, esto es, E () =  Ambas colas de la curva tienen la misma longitud. 2) Estimador consistente Un estimador es consistente si, a medida que n aumenta, el valor del estadístico se aproxima al parámetro. 3) Estimador suficiente Un estimador es suficiente si ningún otro estimador puede proporcionar más información sobre el parámetro. 4) Estimador eficiente Dado todo estimador insesgado, es más eficiente aquel que tenga la varianza más pequeña.  E() = 

  5. Prosiguiendo con la construcción del intervalo de confianza, con un nivel de significación del 5%,  = 0.05, esto quiere decir que al estimar la media  de población existe la probabilidad de 5% de que esta no esté dentro del intervalo estimado y un 95% de certeza de que si esté incluido en el intervalo, veamos Asumiendo que la distribución Z, es una distribución normal, la curva que la representa es simétrica y  debe asimismo distribuirse simétricamente, es decir, /2, como se ve en la figura siguiente  = 0.05 = 0.025 2 2  = 0.05 = 0.025 2 2 0.95 Z = 1.96 2 Z = 1.96 2 Z nos indica que la probabilidad debe dividirse entre 2, es decir, 0.95 = 0.4750 2 2 o restarle 0.025 a 0.50 (0.50 – 0.025) = 0.4750, ubicamos este valor o su aproximado y veremos que corresponde a Z = 1.95 de esta forma nuestro intervalo queda así, 2

  6. P(X – 1.95X    X + 1.96 X) = 0.95 Donde Limite inferior = X – 1.96x Limite superior = X + 1.96 X O también P(X – 19.96     X + 1.96 ) = 0.95 n n Ejemplo Suponga que la media muestral X de una muestral de n = 10 cuentas resultó ser $3000 ¿Cuál es el intervalo de confianza de la media población  con 5% de significación. Suponga que se sabe que la desviación estándar de población es  = 50 P X – 1.96     X + 1.96  = 0.95 n n P 300 – 1.96 50    300 + 1.96 50 = 0.95 10 n P 300 – 1.96 x 50    300 + 1.96 x 50 = 0.95 3.16 3.16 P 300 – 1.96( 15.82)    300 + 1.96 ( 15.82 )= 0.95… P 300 – 31    300 + 31 = 0.95 P 269    331 = 0.95

  7. Esto quiere decir, que con un 95% de confiabilidad, la media de la población está comprendida entre $269 y $331 o entre $269,000 y $331,000 Estimación del intervalo de confianza cuando  es desconocida La solución del problema anterior consistente en la estimación de la media poblacional , supuso el conocimiento de la desviación estándar de la población, pero resulta y viene a ser que regularmente el investigador no dispone o no conoce esta desviación estándar de la población , debiendo calcular y usar la desviación estándar muestral S para obtener el error estándar como una aproximación del error estándar X poblaciónal. La construcción del intervalo es como se aprecia a continuación. Pero como SX = S la construcción puede ser así n P X – Z  SX    X + Z  SX 2 2 = 1 -  P X – Z  SX    X + Z  SX = 1 -  2 2

  8. Ejemplo Suponga que es usted el gerente de auditoria de una empresa y con la finalidad de controlar el tiempo que se gasta en auditar un documento, selecciona una muestra de n = 121 dctos. la cual arroja una duración promedio X = 16.6 mins y una desviación estándar S = 3.63 minutos. Usted puede cambiar al supervisor del grupo a menos que la duración promedio sea a lo sumo de 16 minutos. El nivel de significación es de un 90% para tomar la decisión, ¿Cuál es su decisión? Datos n = 121 X = 16.6 minutos S = 3.63 minutos  = 0.10 Solución P X – ZS    X + Z S = 1 -  n n P 16.6 – 1.65    16.6 + 1.65 = 0.90 P 16.6 – 1.65 x    16.6 + 1.65 x = 0.90  2  2 3.63 121 3.63 121 P { 16.11   17.10 } = 0.90 P 16.6 – 1.65 x 0.33    16.6 + 1.65 x 0.33 = 0.90

  9. Interpretación Con un 90% de probabilidad la verdadera de la población de auditores, se toma entre 16.11 y 17.10 minutos para auditar un documento. Decisión Como la empresa estima máximo 16 minutos promedio para auditar un documento conforme a un estudio de costo / utilidades, se decide cambiar al supervisor de auditoria con la finalidad de eficientizar la labor y obtener mejores resultados. Estimación del intervalo de confianza de la  para muestras pequeñas Investigaciones condujeron a científicos a considerar muestras grandes cuando n =  = 30 y por supuesto cuando n < 30, las muestras son caracterizadas como muestras pequeñas. En los dos ejemplos anteriores, es evidente que las muestras fueron grandes y se hicieron conclusiones utilizando la distribución normal o distribución Z. Pero resulta que no siempre puede ser posible obtener por lo menos 30 observaciones, como por ejemplo encontrar 30 personas o más que quieran prestarse para probar una nueva medicina para curar el SIDA, la hepatitis C, etc. El teorema del límite central asegura normalidad en el muestreo solo si la muestra es grande. Cuando la muestra es pequeña, puede ser suya la necesidad de recurrir a una distribución alternativa, hasta hoy día la distribución “t” of student o sencillamente distribución t.

  10. Según su autor, ésta distribución se aplica cuando se cumplen las tres condiciones siguientes: • Las muestra es pequeña, n < 30 •  es desconocida • La población es aproximadamente normal • Igual que la distribución Z, l,a distribución t tiene una media igual a cero, es simétrica respecto de la media y su valor oscila entre - y + . Sin embargo, difieren en que la varianza de Z es 2 = 1 y la varianza de t >1, específicamente esta varianza se obtiene por la siguiente fórmula • 2 = n -1 • n-3 • Esta variación depende de los grados de libertad (gl o df) que es el número de observaciones menos el número de restricciones impuestas sobre tales observaciones, • Suponga amigo lector que se tiene que n = 6 observaciones que deben producir una media de 15. Esta media viene a ser una restricción y son n -1, 6 – 1 = 5 grados de libertad. De ahí que se pueden seleccionar 5 observaciones cualquiera, por ejemplo, 15, 12, 14, 16, 11. Después de estos cinco valores, no hay libertad para seleccionar una sexta observación.

  11. Construcción del intervalo con la distribución “t” of student, P X – t x S    X + t x S = 1 -  n n El valor puede ubicarse en la tabla F del anexo, suponiendo que se desea obtener para una muestra n = 15 y un nivel de significación  = 0.01 gl = n -1 = 14, como se asume que la distribución t es aproximadamente normal, el error  = 0.01 , se va a dividir por 2, aludiendo a las dos colas de la curva normal como puede verse en la figura siguiente  2  2  = 0.01 = 0.005 2 2  = 0.01 = 0.005 2 2  t  = 2.977 2 t  = 2.977 2

  12. Entonces si usted se ubica donde se intersecan n -1 = 14 y 0.005, encontrará que Ejemplo Suponga que se desea determinar el monto medio de ventas por establecimiento de venta al detalle de un determinado producto durante el último año. Como la población de este tipo de establecimiento es muy grande, se seleccionó una muestra de tamaño n = 25, dando lugar a una media X = $3,425 y una desviación estándar S = 200. Con un nivel de confianza del 95 por ciento, estime la media  de ventas de todos los establecimientos que expenden este producto. Datos n = 25 X = $3,425 S = $200 y 1 -  = .95 Para 25 – 1 grados de libertad y t  = 2.977 2 t  = 2.064 2  = 0.025 2 En consecuencia el intervalo de confianza es, P 3,425 – 2.064 x 20025   3,425 + 2.064 x 20025 = 0.95 P 3,425.44    3,507.56 = 0.95 Interpretación Con 95 por ciento de confiabilidad el monto medio de ventas de los establecimientos de ventas al detalle oscila entre $3342.44 y $3507.56

More Related