820 likes | 1.08k Views
CURSO PÓS-GRADUADO DE ESPECIALIZAÇÃO Protecção Civil - Riscos Naturais e Tecnológicos 2005/2006 Técnicas de Avaliação (1) Modelação em Acontecimentos Raros M.Isabel Fraga Alves isabel.alves@fc.ul.pt http://docentes.deio.fc.ul.pt/fragaalves/ Departamento de Estatística e Investigação Operacional.
E N D
CURSO PÓS-GRADUADO DE ESPECIALIZAÇÃOProtecção Civil - Riscos Naturais e Tecnológicos2005/2006Técnicas de Avaliação (1) Modelação em Acontecimentos RarosM.Isabel Fraga Alvesisabel.alves@fc.ul.pthttp://docentes.deio.fc.ul.pt/fragaalves/Departamento deEstatística e Investigação Operacional
Katrina : Um desastre (não)natural? • Nova Orleães encontra-se situada abaixo do nível do mar, no meio de dois lagos, a norte e a Este, e do rio Mississipi a sul. • De acordo com as informações divulgadas pelas autoridades locais, esta inundação deveu-se, sobretudo, a uma brecha de 60 metros num dique junto ao lago Pontchartrain.
New Orleans After Hurricane Katrina: An Unnatural Disaster? NewYorkTimes,Sept’05 • The next thing they need to do is to have a double-tiered dike system. I'll refer to them as dikes instead of levees, because we need Dutch engineers to design these structures, not the Army Corps of Engineers. • The first structure should be a concrete damn structure of at least 40-50 feet high that is built all along the lake and every Canal that connects to the lake. • This plan would cost billions, but would guarantee that New Orleans would NEVER face this tragedy again. • WE can work with Dutch engineers and get this engineered properly.
New Orleans After Hurricane Katrina: An Unnatural Disaster? • New Orleans was built on a delta. • Engineers surrounded it with dikes for flood protection. • Yes, I know about Holland. • Holland is not on the Mississippi River. It is not in hurricane alley. • It was a matter of time. So is the next disaster, if this lesson isn't learned. Do we really want to do this again in 20 years?
O que são Valores Extremos? • Quando calamidades naturais de grande magnitude acontecem, questionamos acerca da sua ocorrência e frequência • → Acontecimentos Raros? • Poderiam ter sido tomadas providências(do Lat. providentia, acto de ver com antecipação: s. f., suprema sabedoria divina (grafado com inicial maiúscula); Deus; medida, resolução que se toma para evitar um mal ou para corrigir irregularidades; acontecimento feliz; pessoa que protege outrem; prevenção) de forma a prevenir ou a estarmos melhor preparados para tais calamidades? • Secas, Inundações, Terramotos, Furacões ou Ventos Ciclónicos, Tempestades de Precipitação, ...
O que são Valores Extremos? • Um engenheiro em Nova Orleães pode querer construir um dique com uma altura tal que só • “muito raramente” • vê ameaçada a sua estrutura face a calamidades associadas. • Um engenheiro no Japão pode estar interessado em construir um arranha-céus que permaneça intacto perante um “terramoto de 100-anos”, i.e., que emmédia • “ocorre de 100 em 100 anos” • Um engenheiro pode querer construir uma ponte sobre o Mississipi, fixando a sua altura de forma a que esperemos que a água do rio ultrapasse o nível da ponte “muito raramente”, digamos • “uma vez em 200 anos”
O que são Valores Extremos? • Os exemplos apresentados são apenas alguns dos muitos que poderíamos enumerar, na área de • → Fenómenos Naturais • É evidente que as características de interesse naqueles casos são • extremos • no sentido que focamos a nossa atenção para o • MÍNIMO ( por ex, SECAS – Mínimo da quantidade de Precipitação ) • MÁXIMO ( por ex, INUNDAÇÕES – Máximo do Caudal de um rio )
Porque são importantes os Modelos de Valores Extremos? • Em muitas aplicações estatísticas o interesse é dirigido para a estimação de características centrais (ex, o valor médio da precipitação, o valor médio da temperatura) tendo por base amostras aleatórias provenientes da população sob estudo. • No entanto, em muitas áreas aplicadas, estamos interessados na ocorrência de acontecimentos raros, ie, de grandes ou pequenos valores. • Para os engenheiros, é sabido que os valores utilizados em construção (barragens, edifícios, pontes, etc) são obtidos como um compromisso entre segurança e custo, ie, garantindo a sua “sobrevivência” quando sujeitos a condições extremas e a um “custo” razoável.
Porque são importantes os Modelos de Valores Extremos? • A estimação na área de valores extremos é difícil, devido à falta de dados disponíveis. • O uso de factores ou cargas de segurançatem sido uma solução clássica para o problema, mas actualmente é sabido que esta solução não é completamente satisfatória quer em termos de segurança quer de custo: • por um lado, elevadas probabilidades de falha podem vir a ser obtidas; • por outro, eventualmente os projectos de construção têm associados gastos elevados desnecessariamente. • O conhecimento das distribuições do máximo (e do mínimo) dos fenómenos de interesse é importante na obtenção de boas soluções em problemas de planeamento.
Exemplos de Aplicação • Engenharia Marítima →alturas de onda para a construção de plataformas, diques, molhes costeiros, quebra-mar, etc. • Qual a distribuição da onda máxima? • Engenharia Estrutural →ventos extremos, em termos de velocidade do vento (ou incidência sísmica), tendo por objectivo a construção de edifícios. • Qual a distribuição da velocidade de vento máxima? • Meteorologia →condições meteorológicas extremas influenciam muitos aspectos da vida do ser humano tais como a agricultura ou vida animal, tempo de vida de certos materiais. Nestes casos, mais uma vez se centra a atenção na ocorrência de valores extremos (temperaturas muito baixas ou muito altas, por ex.) • Qual a probabilidade desses acontecimentos raros? • E ainda ...Resistência de materiais, Fadiga de materiais, Resistência à corrosão, estudos de Poluição, etc... !
Ficheiros de Dados (Castillo, Hadi Balakrishnan & Sarabia 2005) • Wind Data →velocidade máxima anual do vento, em milhas/hora, registadas num dado local, durante um período de 50 anos (para a construção de edifícios) • Flood Data →caudal máximo anual de um rio, em metros cúbicos, medido num dado local, durante 60 anos (planeamento de prevenção contra inundações). • Wave Data →altura de onda máxima anual, em pés, observadas num dado local ao longo de 50 anos (construção de quebra-mar). • Epicenter Data →a distância, em milhas, de uma dada central nuclear ao epicentro dos 60 terramotos mais recentes, e com grau de intensidade acima de um certo limiar (prevenção do risco associado a sismos próximos da central nuclear). Os geólogos detectaram uma falha a 50Km da central e que será a principal causa dos sismos naquela área. • Precipitation Data →a precipitaçãp total anual em Filadélfia, nos últimos 40 anos, medida em polegadas, (prevenção contra seca).
Castillo,E., Hadi,A.S., Balakrishnan,N. and Sarabia,J. M., (2005),Extreme Value and Related Models in Engineering and Science Applications, New York:John Wiley & Sons. http://personales.unican.es/castie/extremes/
Modelos de Valores Extremos • Análise de Valores Extremos Modelos dirigidos para Valores extremos, não valores centrais; modelar a cauda da distribuição de interesse • Problema: Como fazer inferência para além da amostra de dados ? • Uma Resposta: usar técnicas baseadas na Teoria de Valores Extremos de forma a proceder a inferênciasestatísticas sobre acontecimentos raros usando apenas uma quantidade limitada de dados! • Notação: Mínimo da Amostra Máximo da Amostra
X variável aleatória. Trata-se da característica de estudo (População). x valor que a v.a. pode assumir amostra aleatória. Réplicas de X . amostra de dados População e Amostra • Notação:
v.a. discreta e v.a. contínua • Exemplo 1: Suponhamos que o estado de determinada estrutura de betão (uma ponte, por ex) pode ser classificado em uma de 3 categorias: • MAU,RAZOÁVEL ou BOM Seja X a v.a. que assume três valores v.a. discreta Seja Y a v.a. que assume valores numa escala contínua de 0 a 10 v.a. contínua
Modelo Probabilístico discreto • Exemplo 1(cont): é possível estabelecer que na referida ponte 20% do betão está em estado MAU, 30% é RAZOÁVEL e 50% está BOM. Se um pedaço da estrutura for analisado ao acaso, então: • Função de massa de probabilidade • (f.m.p.) x | -1 0 1 total ___________________________ P[X=x] | 0.2 0.3 0.5 1 Med(X):= Mediana de X = 0
Modelo Probabilístico discreto • Exemplo 1(cont): calcular a probabilidade de, escolhido um pedaço de betão ao acaso, o estado não ser MAU. Acontecimento A={MAU} = {X=-1}; Acontecimento contrárioAc={nãoMAU} ={X=0 ou X=1} • Função de distribuição (f.d.) • F(x)=P [X x] x | -1 0 1 _____________________ F(x) | 0.2 0.5 1.0 Med(X):= Mediana de X = 0
Modelo Probabilístico contínuo • Exemplo 1(cont): de acordo com uma escala contínua de 0 a 10, e estabelecendo ainda que na referida ponte 20% do betão está em estado MAU, 30% é RAZOÁVEL e 50% está BOM, um modelo probabilístico possível é dado pela função densidade de probabilidade (f.d.p.) na figura e de acordo com as classificações nas categorias: • Função densidade de probabilidade • (f.d.p.): f(y) Med(Y) := Mediana de Y=6.14
Modelo Probabilístico contínuo • Função de distribuição (f.d.): F(y)=P[Y y] Med(Y) := Mediana de Y=6.14
Modelo Probabilístico contínuo • Função de distribuição (f.d.): F(y)=P[Y y] Med(Y) := Mediana de Y=6.14
Modelo Probabilístico contínuo • Função de distribuição (f.d.): F(y)=P[Y y] Med(Y) := Mediana de Y=6.14
Modelo Probabilístico Discreto Modelo Probabilístico Contínuo
Modelo Probabilístico Discreto Valor Médio de X Modelo Probabilístico Contínuo • Exemplo1.(cont.):
amostra aleatória. Réplicas de X . Média da Amostra amostra de dados
amostra aleatória. Réplicas de Y . Média da Amostra amostra de dados
dados ordenados Amostra Ordenada Amostra ordenada (e.o.’s) Mínimo Máximo
Modelo Probabilístico Discreto Variância de X Modelo Probabilístico Contínuo • Exemplo1.(cont.):
amostra aleatória. Réplicas de X . Variância da Amostra amostra de dados da população X
amostra aleatória. Réplicas de Y . Variância da Amostra amostra de dados da população Y
Excedência de nível Excedência:. Seja X uma v.a. e u um dado valor de nível. O acontecimento {X=x} é denominado de excedência do nívelu se x> u.
Exemplo:. As ondas podem destruir um quebra-mar quando as suas alturas excedam um dado valor, digamos 9m. Então não importa se a altura de uma onda é 9.5, 10, 0u 12m , porque as consequências destes acontecimentos são as mesmas. Seja X uma v.a. da altura das ondas e Yu a v.a. definida por é uma v.a. de Bernoulli com probabilidade de sucesso Excedência de nível e modelo Bernoulli
Excedência de nível e modelo Bernoulli Exemplo(altura de onda máxima anual): Ao planear um quebra-mar, os engenheiros civis necessitam de definir o nível de altura de onda, o qual corresponde à altura tal que o quebra-mar terá a resistência suficiente para a enfrentar, no caso de ocorrer, sem estragos. Então um planeamento natural para esse valor seria tomar a altura máxima de onda que atinge o quebra-mar durante o seu tempo de vida. Contudo, este valor é aleatório e não pode ser encontrado. Então, a única coisa que um engenheiro pode fazer é escolher este valor de modo a que venha a ser excedido com uma pequena probabilidade. Para obter esta probabilidade (ou o valor) é necessário conhecer a probabilidade de excedência de certos valores ao longo do ano. Se estivermos interessados no acontecimento da altura máxima anual de ondaexceder um dado nívelh0, temos uma v.a. Bernoulli.
Período de Retorno e modelo Geométrico Suponha-se que um dado acontecimento A (cheia, excedência de nível,…) é tal que a probabilidade de ocorrência durante um período (1 ano) é um pequeno valor p. Consideremos a sequência de experiências de Bernoulli (A ou Ac) ao longo do tempo. O tempo (em anos) até a primeira ocorrênciaA é uma v.a. Geométrica X , com E[X]=1/p. Período de retorno: Seja A um acontecimento, e T o tempoaleatórioentre sucessivas ocorrências de A. O valor médio de T, E[T] é designado por período de retorno de A. (tempo médio para o retorno desse acontecimento)
Períodos de Retorno Se F é a f.d. do máximo anualX, o período de retorno, Tx, do acontecimento A={X>x} (excedência) é Tx = 1/P[A] = [1-F(x)]-1 anos . Se F é a f.d. do mínimo anualX*, o período de retorno, Tx*, do acontecimento A*={X<x} (“shortfall”ou queda) é Tx* = 1/P[A*] = [F(x)]-1 anos .
Período de Retorno de uma cheia Exemplo: Seja F a f.d. do cheiamáxima anual (em m3/seg) numa dada secção do rio O período de retorno de cheias de 70 m3/seg é Quer dizer:uma cheia máxima anual de 70 m3/seg ocorre, em média uma vez em 57.24 anos
Nível de altura de onda Exemplo: Um quebra-mar é desenhado para resistir durante uma vida média útil de 50 anos. Seja F a f.d. da altura máxima anual de onda (em pés) é O nível de altura de onda deverá verificar Quer dizer:nível de altura de onda é h =30.61 pés
Modelo Normal N(m,s) • Função de distribuição (f.d.): Φ(x)=P[X x] Med(X) = E [ X ] = m
Normal & Gumbel Gráfico das funções densidade relativamente aos modelos Normal e Gumbel, para idênticos valores médio e variância Gráfico das funções densidade relativamente aos modelos Normal(0,1) e Gumbel padrão.
Modelo Normal N (m,s) • f.d.p. de X • Valor médio de X • Variância de X • Normal padrão N (0,1) tem f.d.p.
Modelo Gumbel (l,d) • f.d.p. de X • f.d. de X • Gumbel (0,1) tem f.d. • Valor médio de Z • Variância de Z
Função distribuição empírica amostra aleatória. Réplicas de X com f.d. F(x)=P[Xx] ? ? amostra de dados Modelo ? Qual a f.d. F da população? • dados ordenados • função distribuição empírica (f.d.e.)
Quantis extremos: Normal ou Gumbel?? Modelo ? amostra gerada do modelo Gumbel !
Caudas Pesadas ou Leves ? Fazemos frequentemente uma distinção (mesmo que instintiva!...) entre distribuições “bem-comportadas” e distribuições “perigosas” com cauda pesada A classe das distribuições “bem-comportadas” consiste naquelas distribuições com cauda limitada exponencialmente, → grandes observações não são impossíveis, mas a probabilidade de ocorrência decresce a uma velocidade exponencial para zero, à medida que o nível de patamar se torna cada vez maior. →caudas leves. Por outro lado, uma das principais preocupações é a detecção de distribuições consideradas “perigosas”→distribuições de cauda pesada→não existe um limite exponencial, sendo mais provável que se obtenham grandes observações. As grandes observações exercem forte influência na soma total das observações.