380 likes | 520 Views
Servei d'Estadística 27 de marzo de 2009. Las temperaturas registradas en la Antártida como series de datos funcionales, necesitamos un concepto de tendencia. Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid Pamela Llop
E N D
Serveid'Estadística 27 de marzo de 2009 Las temperaturas registradas en la Antártida como series de datos funcionales, necesitamos un concepto de tendencia Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid Pamela Llop Instituto de Matemática Aplicada del Litoral (IMAL) - CONICET, Argentina
Cuando se habla del cambio climático en la Antártida, la información existente es muy escasa, y la que se aprovecha mucha menos • Los (pocos) estudios que se han hecho dicen que... • Hay una cierta evidencia de calentamiento “global” en la Antártida • Un enfriamiento en la Antártida Continental • Y un calentamiento muy por encima del global del planeta en la Península Antártica • Lo dicen… • IPCC (2001) • Comiso (2000): J. of Climate • Doran et al. (2002): Nature • Vaughan el al. (2003): ClimaticChange • Turner et al. (2005): Int. J. Climatology • … • Steig (Enero, 2009): Nature
PROBLEMAS DETECTADOS EN LOS ESTUDIOS PREVIOS: • Se usa una proporción muy baja de los datos existentes, sólo de estaciones con registros de 50 años y de TODO EL AÑO (menos de 20) • Conclusiones basadas en el ajuste por mínimos cuadrados de tendencias lineales deterministas • No parece muy realista asumir que la evolución de la temperatura es determinista (el futuro está escrito) • La estimación de la tendencia da más peso siempre a los datos centrales • Las medias anuales o mensuales pueden estar muy sesgadas por la abundancia de rachas de “missing data” Sorprende la poca presencia de estadísticos entre los grupos que han realizado los estudios más relevantes sobre la tendencia de parámetros meteorológicos en la Antártida
NUESTRO OBJETIVO: • Proponer nuevas herramientas estadísticas para tratar con datos “malos” • Datos anuales en los que sólo se observa una estación • Una cantidad alta de atípicos en datos que se observan con mucha frecuencia (observaciones no equiespaciadas) • Rachas largas de datos faltantes
EL CASO DE LOS DATOS CLIMATOLÓGICOS DE LA BASE ANTÁRTICA ESPAÑOLA JUAN CARLOS I: Shouth Sheatland Is. BAE-JCI Spanish Antarctic Base Juan Carlos I • Funcionando desde enero de 1988, en la costa SO de la Peninsula Hurd, Isla Livingston (South Shetland Islands) • Se registran TEMPERATURAS AREAS instantáneamente cada 10 minutos • Tomamos la media de datos horarios (media de entre 1 y 5 datos, según el número de missing)
Temperaturas registradas en la Base Antártica Española Juan Carlos I (BAE-JCI) 10 años 10 años
NUEVO ENFOQUE DEL PROBLEMA: • Suponemos que existe una curva/función de temperatura para cada verano que se observa únicamente en periodos discretos de tiempo debido a las limitaciones que imponen los aparatos de medida • Tenemos una serie temporal anual donde para cada año el dato que se observa es una curva XT X4 X3 t X2 X1 verano
VENTAJAS: • No necesitamos observar la serie completa durante todo el año • Se utiliza el micro-dato • No se pierde la información de la estacionalidad diaria • No necesitamos datos equiespaciados
XT X4 X3 t X2 X1 verano ANÁLISIS DE SERIES TEMPORALES PARA DATOS FUNCIONALES El objetivo es estudiar si una serie temporal de datos funcionales tiene o no tendencia
Temperaturas registradas en la Base Antártica Española Juan Carlos I (BAE-JCI) No se ve nada
XT X4 X3 t X2 X1 verano ANÁLISIS DE SERIES TEMPORALES PARA DATOS FUNCIONALES El objetivo es estudiar si una serie temporal de datos funcionales tiene o no tendencia Bosq (1991) introduce el FAR(1) Ferraty y Vieu (2006) comentan los resultados de varios autores Tratan el problema de predecir en procesos estacionarios PRINCIPAL DIFICULTAD: No tenemos una definición asociada al concepto de tendencia para el caso de datos funcionales
ANÁLISIS DE SERIES TEMPORALES PARA DATOS FUNCIONALES Buscamos una “DEFINICIÓN” asociada al concepto DE TENDENCIA para el caso de datos funcionales Ideas basadas en RANGOS • Dos métodos descriptivos de evaluación de tendencias • Proponemos test sobre “curvas máximas” • Reducimos la dimensión infinita del problema
Métodos descriptivos de evaluación de tendencias IDEA 1:Rangos de las curvas Diremos que la serie tiene tendencia si la “serie de rangos” de las curvas tiene tendencia IDEA 2:Rangos de las curvas ordenadas Diremos que la serie tiene tendencia si la serie de los “rangos” de las “series ordenadas” tiene tendencia
IDEA 1: Rangos de las curvas Diremos que la serie tiene tendencia si la serie de “rangos” de las curvas tiene tendencia • Para cada curva Xt calculamos los rangos en un número finito de instantes Rt(1), …, Rt(S) 3 3 3 3 3 3 3 X3 2 2 2 X2 2 t 1 1 1 2 X1 1 2 2 1 1 1 s
IDEA 1: Rangos de las curvas Diremos que la serie tiene tendencia si la serie de “rangos” de las curvas tiene tendencia Cada conjunto de barras corresponde a una curva, cuenta el número de veces a lo largo del tiempo en que el rango es 1,2, …,17
3 3 3 3 3 3 3 X3 2 2 2 X2 2 t 1 1 1 2 X1 1 2 2 1 1 1 s IDEA 1: Rangos de las curvas Diremos que la serie tiene tendencia si la serie de “rangos” de las curvas tiene tendencia • Para cada curva Xt calculamos los rangos en un número finito de instantes Rt(1), …, Rt(S) • Integramos a lo largo de todo el periodo de observación de la curva R3= 17/7 R2= 14/7 R1= 11/7
IDEA 1: Rangos de las curvas Diremos que la serie tiene tendencia si la serie de “rangos” de las curvas tiene tendencia • Comentarios: • Aunque le llamamos “serie de rangos”, no son rangos ya que al tratarse de un promedio de rangos no toman valores enteros • Reducimos la dimensión infinita asociando a cada curva un valor real positivo • No es importante el orden temporal en s=1,…,S, así que se puede generalizar a cualquier tipo de curva • En cada instante que calculamos los rangos tenemos que haber observado todas las series • Para aprovechar mejor los datos lo mejor es suavizar la curva antes de discretizar
INTERPOLACIÓN “SHAPE PRESERVING” de MATLAB • Utiliza información local únicamente de la propia curva • Es no paramétrica • Es un método sencillo • Y siempre mejorable con una modelización previa… • Da una solución bastante razonable!!!
Eliminadas (insuficientes datos) 1076 datos empleados cada año
IDEA 1: Rangos de las curvas Diremos que la serie tiene tendencia si la serie de “rangos” de las curvas tiene tendencia • Para cada curva Xt calculamos los rangos en un número finito de instantes Rt(1), …, Rt(S) • Integramos a lo largo de todo el periodo de observación de la curva
Métodos descriptivos de evaluación de tendencias IDEA 1:Rangos de las curvas Diremos que la serie tiene tendencia si la “serie de rangos” de las curvas tiene tendencia IDEA 2:Rangos de las curvas ordenadas Diremos que la serie tiene tendencia si la serie de los “rangos” de las “series ordenadas” tiene tendencia
IDEA 2: Rangos de curvas ordenadas Diremos que la serie tiene tendencia si la serie de los “rangos” de las series “ordenadas” tiene tendencia • Se calculan las curvas “ordenadas” x(1), …, x(T) (mínima, segunda,…, máxima) • Para cada x(t) calculamos los “rangos” en un número finito de instantes, R’t(1),…,R’t(S), siendo R’t(j) el orden de la curva asociada en el instante j • Integramos a lo largo de todo el periodo de observación de la curva 2 2 2 3 3 3 3 1 3 X3 X(3) 3 R’3= 18/7 R’2= 12/7 R’1= 12/7 X2 X(2) 2 1 1 3 1 1 X1 X(1) 1 1 2 2 s s 2
IDEA 2: Rangos de curvas ordenadas Diremos que la serie tiene tendencia si la serie de los “rangos” de las series “ordenadas” tiene tendencia
IDEA 2: Rangos de curvas ordenadas Diremos que la serie tiene tendencia si la serie de los “rangos” de las series “ordenadas” tiene tendencia • Comentarios: • Aunque le llamamos serie de “rangos”, no son rangos ya que al tratarse de un promedio de rangos no toman valores enteros, tampoco son las series “ordenadas” • Reducimos la dimensión infinita del problema • No es importante el orden temporal en s=1,…,S, así que se puede generalizar a cualquier tipo de curva • En cada instante que calculamos los rangos tenemos que haber observado todas las series • Para aprovechar mejor los datos lo mejor es suavizar la curva antes de discretizar • Sirve de base para los test de “curvas máximas”…
Test para curvas máximas • Proponemos un test sobre la probabilidad de que una curva coincida con la curva máxima • Si no hay calentamiento (H0), las curvas son independientes y la probabilidad es la misma para las T curvas Consideramos la cantidad de veces que una curva coincide con la curva máxima 2 2 2 3 3 3 3 Bajo la hipótesis nula es
Test para curvas máximas • Proponemos un test sobre la probabilidad de que una curva coincida con la curva máxima de las observadas hasta el momento Rechazamos para todos los veranos excepto en 2003/04 que fue un verano “sorprendentemente” frío para las personas que estuvimos allí
CONCLUSIONES: • Con este trabajo no pretendemos dar respuesta a la pregunta de si hay o no calentamiento en la Antártida • Proponemos herramientas estadísticas que permitan incorporar en los estudios la mayor parte de los datos que se están registrando con gran coste económico y humano • Hemos visto que un enfoque basado en el Análisis de Datos Funcionales es útil para tratar series temporales que se observan sólo en una parte del año • Las mismas técnicas se pueden utilizar en otros problemas similares. Por ejemplo, evolución del ozono troposférico