490 likes | 937 Views
ESTADÍSTICA y la INVESTIGACIÓN. Universidad Nacional HERMILIO VALDIZÁN ESCUELA DE POSTGRADO. Dr. Alex V. Cabello Calixto. Aproximación de la Investigación a la Realidad. HIPÓTESI. CAMPO DE ACCIÓN. HIPÓTESIS. OBJETIVO. OBJETO. T E O R Í A. Coherencia.
E N D
ESTADÍSTICA y la INVESTIGACIÓN Universidad Nacional HERMILIO VALDIZÁN ESCUELA DE POSTGRADO Dr. Alex V. Cabello Calixto
Aproximación de la Investigación a la Realidad HIPÓTESI CAMPO DE ACCIÓN HIPÓTESIS OBJETIVO OBJETO T E O R Í A Coherencia Realidad SUBJETIVO – CIENTÍFICA (Situación Problema) Operacionalización De la Hipótesis PROBLEMA Realidad OBJETIVO – CONCRETA (Situación Problémica)
Diseño de la Investigación DES Contexto Social PROBLEMA (Efecto / comportamiento) DEONTOLOGÍA Fines FACTORES F1 F2 F3 … Población Objetivos Metas (Solución) MUESTRA …??? • Planateamiento del Problema • Fundamentac. Teórico-Epistemológico • Análisis de Resultados • Conclusiones / Recomendaciones INVESTIGACIÓN REALIDAD: PASADA - ACTUAL - ESPERADA
IDEA DEL PROYECTO DES Contexto Social • “Gestión del PEI” • Formulación • Ejecución • Evaluación CALIDAD EDUC. Fines • F1. La participación • De la COMUNED • Directivos • Docentes • PP FF • Alumnos • F2 … POBLACIÓN IEIs del nivel Primario del distrito de “Amarilis” Objetivos Metas (Solución) …??? • MUESTRA • IEI. “M. Cáceres” • ………………………..
ESTADÍSTICA DESCRIPTIVA REALIDAD POSIBLE (Pasada – Presente – Futura) POBLACIÓN MUESTRA • A N A L I S I S • SISTEMATIZACIÓN • PRESENTACIÓN • ELABORACIÓN DE • LOS ESTADÍGRAFOS • ESTANDARIZACIÓN • DE LA INFORMACIÓN • CORRELACIÓN • REGRESIÓN • TENDENCIA CARACTERIZACIÓN ¿QUÉ ES? • RECOLECCIÓN de la Información – DATOS (Variables) • Univariado • Bivariado • Multivariado EXPLICACION ¿POR QUÉ ES? • E S T I M A C I Ó N • GENERALIZACIÓN • PRUEBA DE HIPÓTESIS • PROYECCIÓN DE MODELOS CARAC. ESTIMADA PREDICCIÓN ¿SERÁ? ESTADÍSTICA INFERENCIAL TOMA DE DECISIONES (cambio e innovación)
Población y Muestra UNIVERSO POBLACIÓN (N) Estimación • Caract. de la Población • (+/-) • Distribución de datos • Estadígrafos, etc. • Métodos de Muestreo • No Probabilística • M. Proporcional • M. Intencionado • M. de juicio • Probabilística • M. Aleatorio simple • M. Estrateficado • M. Sistemático MUESTREO MUESTRA (n) Inferencia Estadística n = Tamaño de la muestra • Caract. de la muestra • Distribución de datos • Estadígrafos, etc. Descripción
Tamaño de la Muestra A. MUESTREO ALEATORIO Población No Definida (Infinita) Población Defiinida (Finita) Factor de Ajuste: ! LOS RESULTADOS SON EQUIVALENTES! Z : nivel de confianza = 1 2 3 1σ 2 σ 3 σ 0.66 0.95 0.99 N : población p : probabilidad a favor (posibilidad de participación de los elementos) q : probabilidad en contra (p + q = 1) e : máximo error de estimación aceptable en los resultados de la invest. (del 2 al 10 %) n : tamaño de la muestra
Niveles de confianza y el Error muestral de mayor aplicación
B. MUESTREO ESTRATIFICADO Modelo “A” Probabilidad de participar en cada estrato p = ni / N Muestra por cada estrato n° = (p) ni Modelo “B” Factor de participar en cada estrato f = n / N Muestra por cada estrato n° = (f) ni
TAMAÑO DE MUESTRA 2 z2 V(y) = ---- n = ----- n E Donde: V : varianza n : tamaño de la muestra z : estadística Z correspondiente y : estimador de la varianza : Valor estimado de la desviación estándar del parámetro de la población E : máxima magnitud de error aceptable
Nivel Número Directores Subdirectores Gerentes Subgerentes Jefes de departamentos 500 100 300 10 100 TALLER 8: DETERMINACIÓN DE LA MUESTRA EJERCICIO 1 Supóngase que el objetivo de nuestra investigación es determinar los factores que inciden en la productividad de los obreros de la Construcción Civil de Lima; por lo que es necesario entrevistar a los gerentes de las constructoras para conocer su opinión. Determine la muestra, con los siguientes datos: 1.Número de gerentes 20 000. 2.Error de estimación: 5% • Determinar el tamaño de la muestra para el 95% y 90% de confiabilidad. • ¿Cuál es el mejor tamaño de muestra?. Determinar el tamaño de muestra estratificado para los estilos de liderazgo predominantes en las 382 empresas más grandes del país, con un 95% de confiabilidad y un 5% de margen de error, a través de la aplicación de una encuesta a sus ejecutivos cuya composición es la siguiente:
Estadística Descriptivo - Inferencial MODELO I. Población Actual y Estimada Métodos Descriptivos Métodos de Predicción o estimación Procedimientos • RECOLECCIÓN • SISTEMATIZACIÓN • PRESENTACIÓN • ELABORACIÓN DE • LOS ESTADÍGRAFOS • ESTANDARIZACIÓN • DE LA INFORMACIÓN • CORRELACIÓN • ESTIMACIÓN • PBA de HIPÓTESIS REALIDAD Posible REALIDAD (Histórica / Actual) POBLACIÓN POBLACIÓN ESTIMADA (datos estimados) DATOS MUESTRA (datos reales) DATOS CARAC. ACTUAL ¿QUÉ ES? CARAC. ESTIMADA ¿QUÉ SERÁ? TOMA DE DECISIONES
PROCESO ESTADÍSTICO ( UNIVARIADO ) DESCRIPTIVO INFERENCIAL UNIVERSO UNIVERSO POBLACIÓN POBLACIÓN CAUSAS (factores) REALIDAD (Histórico - Actual) MUESTREO REALIDAD (Posible) MUESTRA • ESTIMACIÓN • Generalización / Predicción • RECOLECCIÓN • Observación • Evaluación • Entrevista • Encuesta .... • ORDENAMIENTO • Según Valores • Ascendente / Descendente • Según Atributos • Orden de Méritos • Orden alfabético • ......... DATOS Cuantit ativos Cualitativos DATOS ORDENADOS DATOS CLASIFICADOS • CLASIFICACIÓN • según: • Criterio • Sturges • Gauss • TABULACIÓN • Datos Individuales / Clasificados ESTADÍGRAFOS (De posición / Dispersión De forma / Concentración) CUADROS (Datos) TABLAS (Frecuencias de Datos) Simples Absolutas Acumuladas. Relativas INDICES SERIES TEMPORALES GRÁFICAS Pictogramas Barras - Histogramas Cartogramas Curvas -Polígonos Sec.circulares Sectores Circulares REPRESENTACIÓN
Tabulación Simple de los Datos • La siguiente información represente la remuneración diaria (dólares) del personal de una empresa. • a. ¿Cuál es el nivel de remuneración diaria en esta empresa?: Mínima, Máxima, de orden 10? • b. ¿Cuál es el rango de la remuneración diaria del personal en esta empresa? • c. ¿Cuántas personas están comprendidas en cada caso? • d. ¿Cuál es la probabilidad de que un personal nuevo esté en cada caso? • e. Si la empresa tuviese 100 empleados ¿Cuántos estarían en cada caso? • f. Si la empresa tuviese 250 empleados ¿Cuántos estarían en cada caso?
Tabla Nro. 01 EMPRESA “A”: Distribución del personal según Remuneración Diaria (Dólares - 2012) Fuente : Planilla de remuneraciones de la empres “A” Elaboración : Propia - 2012
Tabulación de Datos Clasificados Edad de los 80 participantes a un programa de capacitación laboral de la provincia de Huánuco. Datos en orden ascendente.
CLASIFICACIÓN según la Regla de Sturges Tabla Nº. 02 Huánuco: Participantes al Programa de Capacitación Laboral según edad. Año 2008 i = 11 Fuente: Información sobre la edad de los 80 participaantes Elaboración: Propia
Tablas de Frecuencias A. Absolutas B. Relativas
Tabla N° 03 HUÁNUCO. Distribución de las Frecuencias Esperadas al Programa de Capacitación Laboral según edad parara 300 personas. i = 11 Fuente: Tabla anterior Elaboración: Propia
(Tabla Auxiliar) BARRAS 20 15 10 5 0 17 28 33 50 61 73 84 Edad Gráfica N° 01 HUÁNUCO. Participantes al Programa de Capacitación según edad Fuente: Tabla N” 01 Elaboración: Propia
Gráfica Nº. 02 HISTOGRAMA 119 136 144 149 158 125 138 145 150 161 126 138 145 150 163 128 140 146 152 164 132 140 146 153 165 135 142 147 154 168 135 142 147 156 171 135 144 148 157 176 FUENTE: Entrevista a los estudiantes. UNHEVAL Elaboración: Propia. Junio 2006
GRÁFICA Nº 03 HUÁNUCO: Peso en libras de los 40 estudiantes de la UNHEVAL HISTOGRAMA con LA CURVA DE GAUSS FUENTE: Entrevista a los estudiantes. UNHEVAL Elaboración: Propia. Junio 2006
GRAFICA No. 04 HUANUCO: Rendimiento Académico de los ochenta estudiantes de la Universidad Nacional “Hermilio Valdizan”. I Ciclo de la Facultad de Ciencias Económicas. POLÍGONO y AREA DE FRECUENCIAS FUENTE: Tabla Nº Elaboración: Propia. Noviembre. 2008
GRAFICA No. 04 HUANUCO: Peso de los cuarenta estudiantes de la Universidad Nacional “Hermilio Valdizan”. POLIGONO DE FRECUENCIAS (AREA) FUENTE: Tabla Nº Elaboración: Propia. Noviembre. 2008
GRAFICA No. 05 HUANUCO: Rendimiento Académico de los ochenta estudiantes de la Universidad Nacional “Hermilio Valdizan”. i Ciclo de la Faculta de Ciencias Económicas. CURVA DE FRECUENCIAS FUENTE: Tabla Nº Elaboración: Propia. Noviembre. 2008
GRAFICA No. 06 HUANUCO: Rendimiento Académico de los ochenta estudiantes de la Universidad Nacional “Hermilio Valdizan”. I Ciclo de la Faculta de Ciencias Económicas. (Año 2000 – I) “OJIVAS” FUENTE: Actas de Evaluación. UNHEVAL Elaboración: Propia. Noviembre. 2008
GRÁFICA No. 07 HUANUCO: PESO DE LOS CUARENTA ESTUDIANTES DE LA UNHEVAL ( Libras ) SECTORES CIRCULARES FUENTE: Entrevista a los estudiantes. UNHEVAL Elaboración: Propia. Junio 2000
Medidas de Posición y Dispersión De RESUMEN Promedio (X) –Mediana (Me) –Moda (Mo) De DISPERSIÓN Rango (R) Desviación Media (DM) Varianza (Va) Desv. Estándar ( δ ) Coef. de Variación (CV) Datos de la Muestra CUANTILES (División de datos ordenados) Mediana (Me = 2 partes) Cuartil (C = 4 partes) Quintil (Q = 5partes) Decil (D = 10 partes) Percentil (P = 100 partes)
Estadígrafos de Resumen o de Tendencia Central MODELOS: Donde: Xi = Datos individuales o marcas de clases ni = Frecuencia de los datos individuales o de las clases N = Número total de datos Ni = Frecuencia acumulada de los datos individuales na = Frecuencia simple de la clase referencial Li = Límite inferior de la clase referencial c = Intervalo o rango de la clase A = Cualquier dato o marca de clase de la serie Relación entre Las tres Medidas
EJEMPLO. Determinar los estadígrafos de resumen o centralización referidos a la edad de los 80 participantes al Programa de Capacitación Laboral. Tabla Auxiliar i = 11 . Valores y su posición en la Campana de Gauss
Estadígrafos de Dispersión MODELOS: Tabla Auxiliar
EJEMPLO. Determinar los estadígrafos de resumen o centralización referidos a la edad de los 80 participantes al Programa de Capacitación Laboral. Tabla Auxiliar i = 11 Edad promedio = 49 años Valores:
Clasificación de datos según Gauss. Tabla Nº. 12 HUÁNUCO: Clasificación y distribución NORMAL de los 80 participantes en el Programa de Capacitación Laboral según Edad. Ẋ =49 δ = 18 2 δ = 36 3 δ = 54
Determinación de los Estadígrafos de DISTRIBUCIÓN Estadística ESTADÍSTICA DESCRIPTIVA EST. INFERENCIAL UNIVERSO UNIVERSO POBLACIÓN POBLACIÓN REALIDAD (Histórico - Actual) CAUSAS (factores) MUESTREO REALIDAD (Posible) MUESTRA • ESTIMACIÓN: • Generalización • Predicción • RECOLECCIÓN • DE DATOS • Observación • Evaluación • Entrevista • Encuesta .... • ORDENAMIENTO • DE DATOS: • Según Valores • Ascendente • Descendente • Según Atributos • Orden de Méritos • Orden alfabético • ......... • DATOS • Cuantitativos • Cualitativos • DATOS • ORDENADOS • DATOS • CLASIFICADOS • CLASIFICACIÓN • según: • Criterio • Sturges • Cuantiles • Desviación Típica • TABULACIÓN • Datos Individuales • Datos Clasificados TABLAS de FRECUENCIAS Frec. Simples Absolutas Frec. Acumuladas Relativas CUADROS de DATOS • ESTADÍGRAFOS DE LA DISTRIBUCIÓN DE • FRECUENCIAS • De Simetría • De Apuntamiento • De Concentración • De las Areas de Distribución
Proceso de la INFERENCIA Estadística ESTADÍSTICA DESCRIPTIVA EST. INFERENCIAL UNIVERSO UNIVERSO POBLACIÓN POBLACIÓN REALIDAD (Histórico - Actual) CAUSAS (factores) MUESTREO REALIDAD (Posible) MUESTRA • ESTIMACIÓN: • Generalización • Predicción UNIVERSO • POBLACIÓN • (N) • Promedio • Varianza • Proporciones Aceptar Rechazar Hipótesis Puntual Intervalo Decisión Error de correcta Tipo I Error de Decisión Tipo II correcta Ho Ho ESTIMACIÓN Muestreo • Varianza de Poblaciones • Diferencias de las Distribuciones • de Frecuencias esperadas y observadas • A. Parámetros de la • Muestra • B. Parámetros Muestrales • Proporciones • Promedio • Varianza (D.T.) • Distribución de Frecs. MUESTRA (n)
ESTADÍSTICA EXPLICATIVA REALIDAD (Histórica / Actual) POBLACIÓN MUESTRA • RECOLECCIÓN • SISTEMATIZACIÓN • PRESENTACIÓN • CORRELACIÓN • PARAMÉTRICA • VARIACIÓN MARGINAL • COVARIANZA • REGRESIÓN -TENDENCIA EXPLICACION ¿POR QUÉ ES? CAUSAS EFECTOS Variable Variable “X” “Y” DATOS Reales CARAC. ESTIMADA PREDICCIÓN ¿SERÁ? DATOS Estimados POBLACIÓN ESTIMADA • ESTIMACIÓN DE DATOS • FORMULACIÓN - PROYECCIÓN • DE MODELOS • GENERACIÓN DE MEDIDAS • DE CAMBIO E INNOVACIÓN. REALIDAD POSIBLE TOMA DE DECIS. ¿Debe ser?
Ejemplo 2: En una encuesta de satisfacción a los empleados con un error muestral del 3%, resulta que el 60% se muestran satisfechos, significa que entre el 57 y el 63% (60% ± 3%) del total lo estarán. Ejemplo 3: Si los resultados de una encuesta electoral indicaran que un partido iba a obtener el 55% de los votos y el error estimado fuera del 3%, se estima que el porcentaje real de votos estará en el intervalo 52-58% (55% ± 3%).
PROBLEMA Se pretende precisar la condición socioeconómica de una población con 4,947 habitantes, distribuidos según el nivel educativo, de la siguiente manera: Las condiciones son: Determinar, el tamaño de la muestra para cada caso aplicando cada uno de los siguientes modelos: