710 likes | 842 Views
Indicadores y Técnicas Cuantitativas de Análisis Económico Diploma en Economía para no Economistas 2009. Docentes: Zuleika Ferre Gabriela Fachola Giorgina Piani. Presentación. A modo de introducción …. ¿Qué entendemos por Estadística?.
E N D
Indicadores y TécnicasCuantitativas de Análisis Económico Diploma en Economía para no Economistas 2009 Docentes: Zuleika Ferre Gabriela Fachola Giorgina Piani
¿Qué entendemos por Estadística? • La Estadística se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, de manera tal que sea posible,a partir de ellos, realizar inferencias válidas sobre los fenómenos bajo análisis • Esto permite: • Entender su comportamiento • Asociar riesgos a las decisiones que se toman bajo condiciones de incertidumbre • Realizar predicciones.
La estadística une dos campos de estudio: • El estudio sistemático de datos numéricos, comprendiendo el resumen y el análisis de la información contenida en ellos • La teoría del azar y de la incertidumbre: la teoría de la probabilidad
Población y muestra • Población o universo: conjunto total objetos. • Ej: Estudiantes de la universidad, hogares de una ciudad, empresas productoras de ciertos bienes y servicios. • Muestra: Subconjunto representativo de la población. Un estadístico utiliza las observaciones de la muestra (datos) para hacer inferencia acerca de la población.
La estadística y la economía • La Estadística interviene en la generación de datos económicos • La Estadística es el fundamento del análisis econométrico. • Econometría: es el estudio sistemático de fenómenos económicos mediante el uso de datos observados y, en general, en un marco de interpretación dado por la Teoría Económica
Tema 1 Análisis exploratorio de los datosEstadística descriptiva
Estadística descriptiva • Principal tarea: describir un conjunto de datos usando ciertos instrumentos. • Su utilidad refiere a: • La organización de datos de manera informativa, para que “hablen por sí mismos” • La detección de errores o comportamientos excepcionales • La simplificación del análisis de datos usando ciertas medidas de resumen que destacan sus características relevantes • La posibilidad de brindar alguna evidencia que ayude a corroborar/rectificar los supuestos que se harán en caso de pretender hacer uso de la EI a partir de ese conjunto de datos
¿Qué observamos en los datos? • Con qué frecuencia se observan los diferentes valores obtenidos (definibles como un valor puntual o un conjunto de valores dentro de cierto intervalo) • La evolución del fenómeno de estudio en el tiempo o entre individuos. Se puede observar la forma del gráfico que resulta de considerar cada dato como un punto. • Dónde se concentran los valores observados, ¿cuál es el valor que en promedio se observa, cuál es el valor más frecuentemente observado y cuál es el valor que separa en dos todo el rango de valores observados? A estos indicadores se les conoce como medidas de tendencia central. Y, por último: • Qué tan dispersos están los datos respecto al valor promedio? Se observan más/menos valores menores/mayores al promedio y con qué concentración? Estas son medidas dispersión (desvío estándar, simetría y kurtosis).
Variable: función que asocia ciertas características de un fenómeno a un número real o a un subconjunto de los reales • Dato estadístico: es el valor observado que tomó una variable • Unidad de observación: es el sujeto a partir del cual se recoge el dato estadístico
El recorrido/rango/dominio de las variables es el conjunto de valores posibles que toma la variable • Notación: Cuando hablemos de variable haremos referencia a un símbolo (X, Y, A, B,...p, q, i) • En función del tipo de dominio, las variables se pueden clasificar en:
Clasificación de variables 1. Variables cualitativas o nominales: sólo admiten ser clasificadas en grupos homogéneos y numerables, a los que no se puede asignar un orden de prelación, de acuerdo a ningún criterio • Ejemplos: religión, raza, sexo, deporte practicado, ocupación, jefe de hogar, etc. 2. Variables ordinales: son las que, aún siendo nominales, son factibles de ordenar • Ejemplos: nivel educativo, nivel socioeconómico
Clasificación de variables 3.Variables cuantitativas: tienen como recorrido cantidades numéricas, por lo que podemos operar aritméticamente con ellas. Dos categorías: • Discretas - Pueden asumir un número finito de valores. Su dominio o rango de variación son los números naturales. • Ejemplos número de habitaciones en un hogar, número de hijos de una familia, etc. • Continuas - Pueden asumir cualquier valor dentro de un intervalo acotado o no acotado, es decir, su dominio es infinito. • Ejemplos: tasa de empleo, tasa de inflación, ingresos, etc. Observación: Hay variables que siendo continuas no son observables más que como discretas: años de educación
Un primer paso…. Observar la frecuencia con que se observan los datos individuales o rangos de valores de esos datos • A través de una tabla (frecuencia simple, frecuencia relativa • La información también puede presentarse en términos de frecuencias acumuladas de los distintos valores • A través de gráficos: Valores de la variable en las abcisas y el número de veces que se repite ese valor en las ordenadas
Datos agrupados • Cuando los datos cubren un amplio rango de valores conviene reducir su número • Agrupando en una cantidad inferior de rangos o clases • Estas clases deben ser construidas de modo que sean exhaustivas y no redundantes, es decir, cada modalidad debe pertenecer a una y sólo una de las clases.
Diagrama de barras para una variable cualitativa Diagrama de tortas para una variable cualitativa Fuente: INE
Pictogramas Pirámides población Uruguay 2000 y 2025
Histograma de frecuencias para una variable discreta.Número de hijos
Diagrama para una variable continua Tasa de desempleo por departamento Año 2002
La evolución temporal de una variable… Tasa de desempleo – Total país
El objetivo es encontrar un valor único que sea de alguna forma representativo del resto • Este único número puede ser considerado como típico de todos los datos • ¿Alcanza con mirar mínimo-máximo? • Importancia de los casos atípicos
Media (aritmética) Como podemos ver, se trata de una suma ponderada, en la que todas las observaciones contribuyen a la suma y todas tienen el mismo ponderador 1/N.
Media para datos agrupados • No sirve la fórmula anterior, a menos que se elija algún valor que “represente” a todo el intervalo • Suele tomarse el punto medio: mi = (Li + Ui )/2 • (Li límite inferior de la clase y Ui es el límite superior) • Por tanto la media para datos agrupados es:
La Mediana • Es el valor que separa en dos todo el rango observado de valores. Es decir, aquel valor para el cual el 50% de los datos resulta en valores menores o iguales a la mediana y el 50% restante es mayor o igual que la mediana. • Si el número de datos es impar, la mediana es la observación central. • Si se tiene un número de observaciones par, la mediana es el promedio de las dos observaciones centrales.
Mediana para datos agrupados Donde: • Li= Limite inferior o frontera inferior del intervalo en el que se encuentra la mediana: intervalo mediano • n = Número de observaciones o frecuencia total • facum(i-1)= frecuencia acumulada anterior al intervalo mediano • fmediana= Frecuencia simple del intervalo mediano • A = Amplitud del intervalo en el que se encuentra la mediana
Media y Mediana • La media y la mediana difieren en la forma en que sus valores son afectados por observaciones ubicadas relativamente lejos de la media (atípicos). • Unos pocos valores extremos tienen un alto impacto provocando que la media se desplace del centro de la distribución. Ejemplo
Ejemplo La media aritmética es: La mediana es:
Media y Mediana • Con lo cual encontramos en esos casos que la media no es muy representativa de los valores de la distribución. El valor extremo “infla” el promedio
El modo o moda • Valor más frecuente en el caso de datos sin agrupar, y la clase con la frecuencia más alta (intervalo o clase modal) en el caso de datos agrupados
Cuartiles, deciles, percentiles Hay otras medidas de posición (no de tendencia central) análogas a la mediana. • Cuartiles: Son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales. • Q1 = x(N+1)/4 - • Q2 = mediana • Q3 = x3(N+1)/4 • Deciles: Divide a la distribución en 10 • Percentiles: Dividen a la distribución en 100 porciones de tamaño igual.
Nuestro objetivo es medir la variabilidad de un conjunto de datos. Es posible hacerlo a través de distintas medidas: • Varianza • Desviación típica • Rango • Recorrido intercuartil
Varianza • Una serie de medidas de dispersión se basa en las distancias de cada observación respecto a la media • Interesa la distancia en términos absolutos, independientemente de si la observación es superior o inferior a la media. • El promedio del cuadrado de esas desviaciones respecto a la media es la varianza s2:
Desviación standard • Al tomar la raíz cuadrada de la varianza obtenemos la desviación estándar,s. • Tiene las mismas unidades de medida que la media y que las observaciones
La desviación estándar para datos agrupadoses análoga a la de la media:
Rango y recorrido intercuartil • El rango, que se define como: Rango = xN − x1 • El recorrido intercuartil queda definido como el intervalo entre el tercer y el primer cuartil: RI = Q3 − Q1 • y corresponde al rango en que están contenidas el 50% de las observaciones centrales