250 likes | 542 Views
ESTUDIO ESTADÍSTICO RECURRENCIA DE TSUNAMIS SOBREDIMENSIONADOS EN LA BAHÍA DE QUINTERO MODELO PREDICTIVO PROBABILÍSTICO. El contexto estadístico. Distribución normal. El modelo de probabilidad más usado en estadística es la distribución normal o gaussiana . El contexto estadístico.
E N D
ESTUDIO ESTADÍSTICORECURRENCIA DE TSUNAMIS SOBREDIMENSIONADOS EN LA BAHÍA DE QUINTEROMODELO PREDICTIVO PROBABILÍSTICO
Distribución normal El modelo de probabilidad más usado en estadística es la distribución normal o gaussiana. El contexto estadístico
Distribuciones con asimetría positiva y soporte mayor que cero Sin embargo, muchos fenómenos naturales no pueden describirse mediante la distribución normal ni mediante otras distribuciones simétricas. Hay diversas áreas de la ciencia donde se requieren modelos de probabilidad asimétricos. El contexto estadístico
Distribuciones de vida • El análisis de tiempos de ocurrencia de eventos aleatorios es de interés en ingeniería y medicina. Este tipo de variable estadística que tiene asociada probabilidades (variable aleatoria) y que corresponde al tiempo tiene una conducta frecuentemente asimétrica, tal como lo indica el estudio pionero de: • Davis (1952) • Y los textos de: • Lawless (2002) • Marshall & Olkin (2007). • La geología es también un área en donde hay interés por el estudio de la ocurrencia de eventos recurrentes, como terremotos y explosiones volcánicas. El contexto estadístico
Modelos de daño acumulativo • En algunos análisis de ocurrencia de eventos en el tiempo se presenta degradación o desgaste debido a acumulación de tensión induciendo a una falla o ruptura cuando un umbral de resistencia es superado. • Ingeniería: fatiga de materiales. • Medicina: varios tipos de cáncer y enfermedades cardíacas crónicas. • Calidad del aire: efecto acumulativo de contaminantes de la atmósfera. • Calidad del agua: efecto acumulativo de nutrientes vegetales. • Neurociencia: producción de espigas en neuronas. • Salud pública: mortalidad humana asociada con diversos factores. • Forestación: efecto del diámetro de un árbol en su mortalidad. • Sismología: recurrencia de terremotos y tsunamis. El contexto estadístico
Modelos de daño acumulativo • Las placas tectónicas que producen los terremotos y tsunamis van acumulando tensión en el tiempo. El contexto estadístico • Con los terremotos, y tal como ocurre con la fatiga de materiales, no es posible medir la cantidad de energía acumulada, transformándose ésta en una variable latente. Sin embargo, sí es posible conocer la cantidad de tiempo que ha transcurrido desde el terremoto predecesor, es decir desde la ruptura anterior.
Probabilidad condicional Considere dos eventos aleatorios “A” y “B”. La probabilidad de que ocurra “A” dado que ya ocurrió “B” se define como: P(A | B) = P(A n B) / P(B) El contexto estadístico En particular, considere “T” como el tiempo hasta ocurrencia de un evento determinado y “A = { T > t }” y “B = { T < dt+ t }”, entonces la probabilidad de que ocurra le evento antes de tiempo dt+ t, dado que ya ha transcurrido un tiempo t es P(T < dt+ t | T > t) = P(t < T < dt+ t) / P(T > t) = (P(T < t + dt + t) - P(T < t ))/( 1- P(T < t)) t dt+ t
Tasa de fallas o de riesgo Considere una variable aleatoria T y sus fdp f(t) y fda F(t) correspondientes. Entonces, la tasa de riesgo o amenaza es h(t) = f(t) / (1 – F(t)); t > 0. El contexto estadístico Gráfico TTT La tasa de fallas, amenaza o riesgo indica qué tan propenso es que un evento que no ocurrido hasta una fecha determinada ocurra en el instante inmediatamente siguiente. Esta tasa no es una probabilidad (sólo en el caso de variables aleatorias discretas lo es, que no es el caso del tiempo, ya que éste es una variable continua), La tasa de riesgo permite distinguir distribuciones, lo que no es fácil de hacer al mirar una fdp y su histograma correspondiente.
Tabla 1. Fechas en que ocurrieron los tsunamis sobredimensionados en Bahía de Quintero, de acuerdo al estudio geológico Escenario 1 Escenario 2 • Tabla 2. Fechas en que ocurrieron los tsunamis sobredimensionados en Bahía de Quintero, de acuerdo al estudio geológico, más un dato imputado
Basados en los comentarios del “contexto estadístico-modelos de daño acumulativo”, contamos con 2 elementos que nos ayudaron a escoger el modelo estadístico usado en el análisis. Estos elementos son: • El tiempo entre ocurrencias de terremotos gigantes y • a acumulación de energía, cuya liberación después de • superar el umbral de resistencia, provoca la ocurrencia del evento sísmico que genera los tsunamis. El modelo predictivo probabilístico • Estos dos elementos permiten proponer unaclasede distribuciones estadísticas de daño acumulativo como modelos predictivos probabilísticos. Éstas son: • La distribución Birnbaum-Saunders (BS) o de fatiga, • La distribución gamma, • La distribución gaussiana inversa (GI), • La distribución log-normal y • La distribución Weibull.
Tabla 4. Resumen de estadísticas descriptivas de tiempos (en años) para los escenarios indicados Análisis exploratorio de los datos
Tabla 4. Resumen de estadísticas descriptivas de tiempos (en años) para los escenarios indicados Tabla 5. Indicadores de bondad de ajuste y criterios de selección de modelos para las distribuciones y escenarios indicados Elección del modelo Escenario 1 Escenario 2
Tabla 4. Resumen de estadísticas descriptivas de tiempos (en años) para los escenarios indicados Tabla 5. Indicadores de bondad de ajuste y criterios de selección de modelos para las distribuciones y escenarios indicados Estimación del modelo predictivo probabilístico Escenario 1 Escenario 2
Escenario 1 Escenario 2 Tasa de riesgo
Mediante estudios históricos y geológicos se reconoció la ocurrencia de 10 tsunamis sobredimensionados en la Bahía de Quintero durante los últimos 6.000 años. • El análisis estadístico realizado se basó en los datos de tiempos transcurridos entre tsunamis,que ocurrieron en promedio cada 600 años, lo que estadísticamente es una muestra pequeña. • Ya que las fechas de los eventos consistieronde intervalos y no datos puntuales, esto se solucionó a través de métodos para datos simbólicos por intervalos. Conclusiones
Una tercera dificultad fue considerarun evento no detectado por lageología mediante imputación de datos, contando así con dos escenarios deobservaciones de tiempos de ocurrencia.El análisis estadístico fue realizado en ambos escenarios. • Primero se realizó un análisis exploratorio para validar los modelos predictivos probabilísticos propuestos que permitieron predecir la probabilidad de ocurrencia de tsunamis sobredimensionados en la Bahía de Quintero. • Luego se usaron métodos de bondad de ajuste y de selección para escoger los modelos predictivos probabilísticos adecuados. En ambos escenario el modelo basado en la distribución Birnbaum-Saunders resultó ser muy apropiado. Este modelo fue usado para estimar las probabilidades de ocurrencia de tsunamis sobredimensionados en Quintero, obteniéndose resultados relativamente similares para ambos escenarios. Conclusiones
Las probabilidades condicionales al tiempo transcurrido desde el último evento (1730), permitieron detectar los mayores riesgos de ocurrencia alrededor de los próximos 900 y 800 años para los escenarios 1 y 2, respectivamente. • Desde el punto de vista del “peor escenario posible” y considerando que la vida útil de la planta es de 25 años, los resultados indican que existe una probabilidad cercana al 5% de que ocurra un tsunami sobredimensionado en Quintero . • Si se considera una perspectiva de 50 años, a partir de hoy, la probabilidad se duplica siendo cercana al 10%. Esto quiere decir que hay una posibilidad en diez de que ocurra un evento de ese tipo durante los próximos 50 años. Conclusiones
Aumentando la perspectiva temporal, la probabilidad de ocurrencia de un tsunami sobredimensionado en los próximos 100 años alcanza al 20% y aproximadamente al 40% a los 200 años. • Las probabilidades continúan aumentando en forma más o menos lineal llegando a estabilizarse aproximadamente cerca de los próximos 800 años, valor que podría considerarse como uno de los instantes más probables de que ocurra un tsunami sobredimensionado en Quintero. • Finalmente, los modelos predictivos probabilísticos paramétricos usados fueron contrastados con una metodología no paramétrica basada en la tasa de riesgo que proporcionó resultados totalmente coherentes y coincidentes entre estas metodologías paramétrica y no paramétrica. Conclusiones