240 likes | 460 Views
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I). I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos. VARIABLES. Variable: característica de cada sujeto (cada caso) de una base de datos.
E N D
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I) I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos. • VARIABLES Variable: característica de cada sujeto (cada caso) de una base de datos. Se denomina “variable” precisamente porque “varía” de sujeto a sujeto. Cada sujeto tiene un valor para cada variable. El proceso de definir y medir las variables es crucial. Si se realiza una definición incorrecta o se mide mal: todos los análisis posteriores, así como las conclusiones a las que se llegue, serán incorrectas. El tipo de variable afecta al tipo de análisis que se puede realizar. Los métodos estadísticos utilizados dependen del tipo de variable.
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I) I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos. • VARIABLES • TIPOLOGÍA • VARIABLES CONTINUAS Y DISCRETAS • VARIABLE TEMPORAL, TRANSVERSAL Y DATOS DE PANEL • VARIBLE CUALITATIVA Y CUANTITATIVA • ESCALAS DE MEDIDA • NOMINAL • ORDINAL • INTERVALO • RAZÓN
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I) I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos. • TIPOLOGÍA • VARIABLES CONTINUAS Y DISCRETAS • VARIABLE TEMPORAL, TRANSVERSAL Y DATOS DE PANEL Discretas: el número de valores posibles entre dos valores dados es finito (se cuenta). Continua: el número de valores posibles entre dos valores dados es infinito (se mide). Temporal: valores a lo largo del tiempo referidos a un sujeto. Transversal: valores en un momento del tiempo referido a varios sujetos. Datos de Panel: Valores referidos a varios sujetos a lo largo del tiempo.
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I) I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos. • TIPOLOGÍA • VARIBLE CUALITATIVA Y CUANTITATIVA Cualitativa (no paramétrica): Los valores son “categorías”. Las categorías son valores diferentes por una cualidad, no por una cantidad. Cuantitativa (paramétrica): Los valores de la variable son “números” . Cada valor posible es menor o mayor que otro valor.
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I) I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos. • ESCALAS DE MEDIDA • La escala nominal identifica la pertenencia de un elemento a un grupo o a otro. • Sólo se puede saber sobre I y J, si xi = xj o xi xj. • Ej.: Variable Sexo. 0:Hombre, 1:Mujer • En la escala ordinal los números asignados a la variable sirven para establecer un determinado orden entre personas u objetos. • Además de la información de la escala nominal, se conoce si xi > xj o xi < xj. • Ej.: Variable Preferencias. 1:Nada, 2: Poco, 3: Algo, 4:Mucho
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I) I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos. • ESCALAS DE MEDIDA • En la escala de intervalo asigna números que permiten establecer la diferencia entre los distintos objetos. • Además de lo anterior podemos saber que si I es mayor que J, I es xi - xj más grande que J. • Ej.: Variable Temperatura. 0º: No indica ausencia de temperatura. 30º no implica el doble de calor que 15º. • Con la escala de razón es posible hablar del número de veces que un objeto o persona es mayor que otra. • Además de lo anterior se puede saber que si I es mayor que J, I es xi / xj veces superior a J. • Ej.: Variable Ingresos. 0 € indica ausencia de ingresos. 1.000 € es el doble de salario que 500 €.
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I) I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos. • ESCALAS DE MEDIDA
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I) I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos. • IMPORTACIÓN DE DATOS A EXCEL http://www.ine.es Inebase / Sociedad / Mercado Laboral / ETCL. Encuesta Trimestral de Coste Laboral Resultados detallados Principales series desde trimestre 1T/2000 Tabla 1.2 Principales series de ETCL por comunidad autónoma, periodo, componentes del coste y unidad de medida. Selección: Componente del Coste (Coste total por trabajador, Coste total por hora) Comunidades Autónomas (Total, todas las CC.AA.) Periodo (Todos) Unidad de medida (Euro) Filas Columnas Componente del Coste Periodo Comunidades Autónomas Unidad de medida
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I) I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos. • IMPORTACIÓN DE DATOS A EXCEL http://www.anuarieco.lacaixa.comunicacions.com
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I) I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos. • IMPORTACIÓN DE DATOS A EXCEL http://www.meh.es Estadísticas e Informes / Presupuestos y Cuentas Públicas / Sector Público Español / Base de datos económicos del sector público español (BADESPE) Base de datos económicos del sector público español (BADESPE) Financiación Autonómica Cuadros Resúmenes Por Comunidades y Ciudades Autónomas FINANCIACIÓN AUTONÓMICA (Excel)
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I) I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos. • IMPORTACIÓN DE DATOS A EXCEL http://biblioteca.uam.es/cdestadistica/informacionbibliografica.html SABI/ Nombre de Empresa / Exportar (Excel)
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I) I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos. • PROBLEMAS CON LOS DATOS I. Valores Perdidos o Ausentes: cuando para una variable no se dispone de todos los datos para cada sujeto. • Soluciones a Datos Perdidos: • A. Eliminar todos los casos con valores perdidos. • B. Imputar un valor estimado. • B.1. Imputación de los valores medios: Se sustituyen los valores ausentes por los valores medios de la variable. • B.2. Imputación mediante regresión: Se realiza una regresión siendo la variable dependiente la que posee valores perdidos y como independientes el resto de variables que posean todos los datos. Los datos imputados son las predicciones calculadas en la regresión.
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I) I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos. • PROBLEMAS CON LOS DATOS II. Valores Atípicos - Outliers: Aquellos casos que alguna variable toma valores extremos que difieren del comportamiento del resto de la muestra. Consecuencias: - Distorsionan los resultados - Suelen afectar a la normalidad. Causas: - Errores en los datos (recogida e introducción). - Errores intencionados por parte del encuestado. - Errores de muestreo (introducir en la muestra un individuo que no pertenece a la población) - Outliers verdaderos: casos que pertenecen a la población objeto de estudio y que realmente difieren del resto por la variabilidad inherente
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I) I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos. • PROBLEMAS CON LOS DATOS II. Valores Atípicos - Outliers Detección de valores atípicos - Considerar atípicos aquellos casos cuyos valores estandarizados (media = 0 y desviación típica = 1) superen el siguiente umbral (k): - N<80: k=2,5 - N>80: k > 3 - Si la variable sigue una distribución normal k=3
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I) I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos. • PROBLEMAS CON LOS DATOS II. Valores Atípicos - Outliers • Si es un outlier verdadero o no se puede descartar que no lo sea: • Algunos autores consideran correcto su eliminación para que los análisis reflejen la tendencia mayoritaria de la población. • - Otros consideran que la eliminación no se debe realizar: • - Suavizar su influencia con transformaciones. • - Utilizar contrastes no paramétricos.
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I) I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos. • DATOS AUSENTES http://www.ine.es Inebase / Sociedad / Educación / Avance de la Enseñanza Universitaria
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I) I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos. • DATOS AUSENTES
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I) I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos. • FILTROS
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I) I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos. • FILTROS
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I) I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos. • FILTROS
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I) I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos. • FILTROS
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I) I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos. • FILTROS
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I) I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos. • FILTROS
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I) I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos. • FILTROS