120 likes | 352 Views
PRESENTACION IV ETAPA 1: PREPARACION DE DATOS. Curso Formación Fortalecimiento Institucional Análisis Regional de Frecuencias basado en L-momentos Jorge Nuñez C. CAZALAC La Habana-Cuba 28 Mayo-1 Junio 2012. OBJETIVOS DE LA ETAPA 1.
E N D
PRESENTACION IVETAPA 1: PREPARACION DE DATOS Curso Formación Fortalecimiento Institucional Análisis Regional de Frecuencias basado en L-momentos Jorge Nuñez C. CAZALAC La Habana-Cuba 28 Mayo-1 Junio 2012
OBJETIVOS DE LA ETAPA 1 Los principales objetivos de esta etapa, comunes a todos los procedimientos de análisis hidrológico son: • 1. Maximizar nuestro entendimiento de los datos • 2. Describir la estructura subyacente que ellos tienen (normalidad, multimodalidad, asimetría, • curtosis, linealidad, homogeneidad entre grupos, homocedasticidad, etc.) • 3. Detectar las variables importantes • 4. Detectar valores atípicos y anomalías • 5. Comprobar los supuestos implícitos en los análisis • 6. Determinar los ajustes óptimos de los factores • 7. Proporcionar al analista información relevante en cuanto al modelo que mejor ajusta los datos, una lista de valores atípicos, sentido de certeza en las conclusiones, estimaciones de los parámetros, grado de incertidumbre sobre las estimaciones, lista de las variables importantes, conclusiones sobre las significancias estadísticas de variables individuales. En particular, es esperable que el analista pueda utilizar, como mínimo, algunos de los siguientes procedimientos, que han sido adoptados en la metodología aplicada a los casos de estudio: • Análisis exploratorio: Mediante técnicas y herramientas como uso de histogramas de frecuencias, box-plot, curvas q-q, cálculo de estadística descriptivas, etc. • Análisis de estacionariedad: Mediante la pendiente de la recta de regresión lineal variable-año • Análisis de autocorrelación: Mediante el test de correlación Lag-1 • Análisis de consistencia u homogeneidad: Mediante curvas dobles masa o dobles acumuladas
REPRESENTACION GRAFICA DE RESULTADOS Para un análisis mensual, por ejemplo, los box-plot permiten identificar aquellos meses en los que no tiene sentido un ajuste probabilístico, por un alto número de valores cero, o por representar una estación seca.
Este tipo de gráficas permite determinar diferencias en la estacionalidad de las precipitaciones, lo que es relevante a la hora de agrupar estaciones para un análisis de frecuencia mensual o multimensual. Se debe recordar que ante todo, la esencia de un buen análisis de frecuencia es la caracterización de los procesos físicos y climáticos que determinan el origen de las precipitaciones.
CONFIRMACION DE SUPUESTOS • Supuesto de estacionariedad (falta de tendencia en la serie de datos): • Una posibilidad es usar una regresión lineal y evaluar la significancia de la pendiente. En este caso, se pueden dividir los datos de la serie por su media (eje y) y a los años se les resta 2000 (eje x)
Otra alternativa es utilizar un test no paramétrico, como Man-Kendall o pendiente de Sen. Ambos se encuentran disponibles en la aplicación Makesens, de manera gratuita.http://www.emep.int/assessment/MAKESENS_1_0.xlshttp://www.emep.int/assessment/tools.html
Supuesto de independencia entre series (estaciones) • Otro de los supuestos, aunque es difícil de cumplir en el análisis de variables ambientales, es la independencia entre las series provenientes de distintas muestras (estaciones). A pesar de esto, el ARF-LM de todas formas genera mejores estimaciones que el procedimiento convencional. Una opción es generar una gráfica de coeficientes de correlación entre estaciones en función de la distancia entre ellas.
Supuesto de homogeneidad • Este supuesto se refiere a la ausencia de un error sistemático aparecido en alguna estación, producto de un cambio en su posición o características de funcionamiento. • Puede ser abordado mediante uso de curvas doble masa, aunque hay procedimientos más modernos. • Rhtest: http://cccma.seos.uvic.ca/ETCCDMI/software.shtml • Anclim: http://www.climahom.eu/AnClim.html • Rainbow: http://www.iupware.be/
La idea, entonces, es tener un resumen de las propiedades estadísticas de las series de datos, previo a su análisis mediante ARF-LM