460 likes | 679 Views
Dott.ssa Arianna Orasi 5 Marzo 2010. Parte 2 Analisi dei dati di onda. Analisi della performance delle stazioni Statistica a breve termine: analisi zero-crossing Statistica a breve termine: analisi spettrale Analisi climatologica Statistica a lungo termine: analisi degli eventi estremi
E N D
Dott.ssa Arianna Orasi 5 Marzo 2010
Parte 2Analisi dei dati di onda • Analisi della performance delle stazioni • Statistica a breve termine: analisi zero-crossing • Statistica a breve termine: analisi spettrale • Analisi climatologica • Statistica a lungo termine: analisi degli eventi estremi • Controllo di qualità dei dati
Analisi dei dati di onda Rete Ondametrica Nazionale • Attualmente composta da 15 boe oceanografiche dotate di: • -ondametro direzionale accelerometrico • - una stazione meteorologica • -un termometro per la temperatura del mare http:// www.telemisura.it per i dati in tempo reale http://www.idromare.it per le serie storiche
Analisi dei dati di onda Disponibilità dei datiRete Ondametrica Nazionale
Analisi dei dati di ondaAnalisi della performance DATI RACCOLTI:Hs, Tp, Tm, θm ogni 30 minuti (presso le stazioni costiere locali) DATI REGISTRATI: ogni 3 ore a Roma EFFICIENZA STAZIONE η = noss / Toss noss è il numero delle Hs osservate ogni mezz’ora Toss è il numero atteso totale delle Hs osservate ogni mezz’ora
Analisi dei dati di ondaAnalisi della performance I mesi invernali sono più critici per l’efficienza della maggior parte delle stazioni
Analisi dei dati d’onda RAPPRESENTAZIONE DELL’ELEVAZIONE DELLA SUPERFICIE MARINA
Analisi dei dati di ondaStatistica a breve termine Obiettivo: determinazione di parameti sintetici rappresentativi di uno stato del mare. Dati:Il dato di partenza è costituito dalle misure dell’elevazione della superficie del mare ottenute tramite boe accelerometriche. Metodi: 1) analisi zero-crossing 2) analisi spettrale
Analisi dei dati di ondaStatistica a breve termine ANALISI ZERO CROSSING In questo tipo di analisi la misura dell’elevazione della superfcie libera è riferita ad un livello medio (=0). Il metodo consiste nell’individuare gli attraversamenti di tale livello medio nei quali l’elevazione della superficie passa da un valore negativo ad uno positivo (zero up-crossing) o viceversa (zero down-crossing). Alcuni parametri sintetici possono essere usati per descrivere queste registrazioni delle onde e di conseguenza lo stato del mare.
Hi H1 H2 T2 T1 Analisi dei dati di ondaStatistica a breve termine ANALISI ZERO CROSSING
Analisi dei dati di ondaStatistica a breve termine ANALISI ZERO CROSSING Chiamiamo con T il periodo dell’onda ed è la distanza tra due consecutivi up-crossing (o down-crossing). Unità di misura: secondi. L’altezza H è la distanza verticale tra il valore più alto e quello più basso della registrazione tra due zero up-crossing. Unità di misura: m. È possibile ottenere questi valori per ciascuna singola onda per N onde individuate in una registrazione. Allora per descrivere lo stato del mare partendo da una regisrazione utilizziamo i seguenti parametri statistici.
Analisi dei dati di ondaStatistica a breve termine ANALISI ZERO CROSSING Hmean N numero totale di onde singole in una registrazione Tz Hsig (Significant Wave Heigh): Altezza media (m) del terzo più alto delle onde misurate in un dato intervallo di tempo Tsig (Significant Wave Period): Periodo medio (s) del terzo più alto delle onde per un gruppo numeroso e ben definito di onde Hmax: altezza massima dell’onda per un dato intervallo di tempo (~ 17 o 20 minuti) H10: Altezza media del 10% delle onde più alte
Analisi dei dati di ondaStatistica a breve termine ANALISI ZERO CROSSING Un esercizio con R Carichiamo il file con le registrazioni di altezze d’onda e periodi >onde<-read.table(“onde.txt”,header=T) >plot(onde$H0) >Hmean<-mean(onde$H0)[1] 2.4 >Tz<-mean(onde$T) [1] 7.0 >Hmax<- max(onde$H0)[1]4.9 >w<-(onde$H0)==max(onde$H0) >Tmax<-onde$T[w][1] 8.0 #N=21/10~2 >z<-(onde$Order==1|onde$Order==2) >H10<-mean(onde$H0[z])[1] 4.7 >T10<-mean(onde$T[z]) [1] 7.5 #N=21/3=7 >ordina<-order(onde$H0,decreasing=T) >Hsig<-mean(onde$H0[ordina[1:7]]) [1] 3.6 >Tsig<-mean(onde$T[ordina[1:7]]) [1]7.8
Analisi dei dati di ondaStatistica a breve termine DISTRIBUZIONE STATISTICA DELLE ALTEZZE D’ONDA Distribuzione di Rayleigh P(H)= probabilità di registrare un’altezza d’onda H che non ecceda una data altezza d’onda H’ in uno stato del mare rappresentato da un’altezza significativa nota pari a Hsig La probabilita cumulata di eccedere è e di non eccedere E la probabile altezza massima in N onde è data da:
Analisi dei dati di ondaStatistica a breve termine DISTRIBUZIONE STATISTICA DELLE ALTEZZE D”ONDA
Analisi dei dati di ondaStatistica a breve termine DISTRIBUZIONE STATISTICA DEL PERIODO I periodi presentano una minore variabilità rispetto alle altezze d’onda. Non è stata individuata una distribuzione di probabilità rappresentativa universale. Esistono però delle correlazioni empiriche: • Tmax=(0.6~1.3)Tsig • T1/10=(0.9~1.1) Tsig • Tsig=(0.9~1.4)Tz • Tp=(1.2~1.3) Tz Una possibile relazione tra l’altezza d’onda significativa e il periodo significativo di uno stato di mare è: Dove è un parametro da stimare e dipende dalle condizioni locali e in mancanza di informazioni può essere assunto pari a 4.15
Analisi dei dati di ondaStatistica a breve termine UN ESEMPIO CON R Stimiamo il parametro della relzione precedente >plot(sqrt(onde$H0),onde$T) Useremo la funzione lm che serve proprio per adattare modelli lineari ai dati >reg<-(lm((onde$T)~sqrt(onde$H0)-1)) >alpha<-coefficients(reg) [1]4.503 >abline(0,alpha)
Analisi dei dati di ondaStatistica a breve termine ANALISI SPETTRALE In questo caso l’elevazione della superficie del mare può essere ipotizzata come composta dalla sovrapposizione di un infinito numero di onde sinusoidali ciascuna caratterizzata da differente frequenza, altezza e direzione. La distribuzione dell’energia associata a ciascuna onda rispetto alla frequenza è il cosidetto “spettro in frequenza” e rispetto alla frequenza e alla direzione è definita “spettro in direzione” (Pierson, Neumann and James, 1955)
Analisi dei dati di ondaStatistica a breve termine ANALISI SPETTRALE LO SPETTRO IN FREQUENZA Per scomporre l’elevazione della superficie libera si usa la trasformata integrale di Fourier o la variante FFT (Fast Fourier Transform).
Analisi dei dati di ondaStatistica a breve termine ANALISI SPETTRALE LO SPETTRO IN FREQUENZA La trasformata integrale di Fourier accetta in ingresso una funzione del tempo e produce una serie di onde sinusoidali ciascuna descritta dall’ampiezza, dalla frequenza e dalla fase. η(t) = elevazione della superficie dell’acqua registrata al tempo t η0 = elevazione media ω0 = frequenza angolare dell’onda più lunga adattata ai dati j = numero di onde componenti aj = ampiezza della jma componente Φj = fase della jma componente n = numero totale di componenti
Analisi dei dati di ondaStatistica a breve termine ANALISI SPETTRALE LO SPETTRO IN FREQUENZA Esistono forme tipiche degli spettri di energia in frequenza per stati di mare in acque profonde, tra questi: - Lo spettro di PIERSON-MOSKOWITZ esprime la densità di energia in funzione della frequenza, data la velocità del vento. È usato per la previzione/ricostruzione del moto ondoso - Lo spettro di JONSWAP caratterizzato da un picco che regola il grado di concentrazione dell’energia intorno alla frequenza di picco.
Analisi dei dati di ondaStatistica a breve termine ANALISI SPETTRALE LO SPETTRO IN FREQUENZA
Analisi dei dati di ondaStatistica a breve termine ANALISI SPETTRALE LO SPETTRO DIREZIONALE La distribuzione dell’energia associata a ciascuna onda rispetto alla frequenza e alla direzione è definita “spettro in direzione”. Questa ha valori massimi in corrispondenza della direzione media del moto ondoso e tende a diminuire man mano che la direzione si allontana da quella media
Analisi dei dati di ondaAnalisi climatologica L’analisi climatologica indica le caratteristiche statistiche dei parametri ondosi Tabella di contingenza (Hm0, Dir) In R usiamo il comando table
Distribuzione dell’Hsig per classi di direzione per 8 boe della RON (1989 – 2001)) Analisi dei dati di ondaAnalisi climatologica
Analisi dei dati di ondaStatistica a lungo termine: analisi degli eventi estremi Determinazione delle caratteristiche estreme del moto ondoso in acqua profonda è importante per: -> fase progettuale di un’opera off-shore e in-shore -> dimensionamento dell’opera -> verifica dell’operatività dell’opera Parametri di interesse: • Settore di traversia più esposto • Altezza, direzione, periodo medi del moto ondoso incidente • Probabilità di accadimento e la durata delle possibili mareggiate • Massima altezza d’onda prevista nell’arco della vita della struttura
Analisi dei dati di ondaStatistica a lungo termine: analisi degli eventi estremi Onda di progetto (O.P.) deve rappresentare delle condizioni ambientali che possono essere pericolose per la stabilità della struttura marittima -> perciò deve essere associata al tempo di vita previsto per l’opera stessa. L’ O.P. è definirta mediante l’altezza, un periodo e una direzione di provenienza. Il “rischio” associato all’O.P. si specifica attraverso il periodo di ritorno Tr degli stati di mare, con l’altezza d’onda ad esso associato e con la probabilità che questi si verifichino durante la vita dell’opera.
Analisi dei dati di ondaStatistica a lungo termine: analisi degli eventi estremi Obiettivo: determinare le altezze significative dell’onda in acqua profonda aventi un assegnato tempo di ritorno. Metodo: POT (Peak Over Threshold, Goda) Steps: • Selezione dei dati omogenei e indipendenti • Individuazione del modello probabilistico per i dati selezionati • Determinazione da modello del massimo valore dell’altezza d’onda atteso in un fissato arco di tempo 4. Calcolo dell’intervallo di confidenza associato al valore atteso
Analisi dei dati di ondaStatistica a lungo termine: analisi degli eventi estremi Step 1. Selezione dei dati omogenei e indipendenti Selezione delle mareggiate definite come successione temporale degli stati di mare caratterizzati da • Persistenza dell’altezza d’onda sopra la soglia di 1m per più di 12 ore consecutive • Attenuazione dell’altezza d’onda sotto la soglia di 1m per meno di 6 ore consecutive • Apparteneza della direzione di provenienza a un determinato settore angolare (±30°) Mareggiata = valori di altezza, periodo e direzione corrispondenti al culmine d’intensità della successione degli stati di mare L’indipendenza si ottiene ponendo un intervallo temporale tra due mareggiate consecutive e l’ampiezza di tale intervallo si può ricavare tramite la funzione di autocorrelazione della serie temporale osservata. (In letteratura tale intervallo è pari generalmente a 48 ore). L’omogeneità è assicurata scegliendo una seconda soglia d’altezza più alta della prima (attenzione alla scelta della soglia)
Analisi dei dati di ondaStatistica a lungo termine: analisi degli eventi estremi Step 1. Selezione dei dati omogenei e indipendenti Per l’omogeneità direzionale, per le boe della RON, sono stati calcolati i settori di traversia
Analisi dei dati di ondaStatistica a lungo termine: analisi degli eventi estremi Step 2. Individuazione del modello probabilistico per i dati selezionati Le distribuzioni più utilizzate nell’analisi delle onde estreme sono quelle del • I tipo (Gumbel) • II tipo (Frechet) • III tipo limitata inf (Weibull) Tra i metodi di adattamento della distribuzione ai dati più comunemente si usa il metodo dei minimi quadrati (minimo scarto tra i dati osservati e quelli statisticamente attesi) Una misura dell’adattamento è fornita dal coefficiente di correlazione r=cov(x,y)/√var(x)√var(y) oppure per normalizzare la dipendenza di r dalla legge di probabilità esaminata si può ricorrere ad un altro criterio: Minimo rapporto del residuo (1-r) del coefficiente di correlazione (criterio MIR, Goda e Kobune, 1990)
Analisi dei dati di ondaStatistica a lungo termine: analisi degli eventi estremi Step 2. Individuazione del modello probabilistico per i dati selezionati Il metodo dei minimi quadrati permette di trovare una funzione che si avvicina il più possibile ai dati imponendo che la somma degli scarti al quadrato tra la distribuzione stessa e i punti osservati sia minima. Dovremo minimizzare quindi in modo che Con tale metodo si esegue una distorsione degli assi coordinati al fine di trasformare in retta la legge di distribuzione di probabilità. Se y è l’ordinata del grafico distorto, relazionata alla probabilità F(), e x è l’ascissa del grafico distorto, legata alla v.c. H, affinchè le leggi di distribuzione Gumbel, Frechet e Weibull risultino delle rette devono sussistere le relazioni riportate nella tabela seguente.
Analisi dei dati di ondaStatistica a lungo termine: analisi degli eventi estremi Step 2. Individuazione del modello probabilistico per i dati selezionati
Analisi dei dati di ondaStatistica a lungo termine: analisi degli eventi estremi Step 3. Massima altezza d’onda prevedibile in un assegnato intervallo temporale Per individuare la durata dell’intervallo in cui si vuole estendere la previsione si ricorre al concetto di: Tempo di ritorno (Tr) = Numero medio di anni in cui mediamente un generico valore di H non è superato (o uguagliato) Probabilità di incontro (P)= probabilità che un evento con assegnata frequenza si verifichi nel corso di anni Assegnato un tempo di ritorno perciò, il corrispondente valore dell’altezza d’onda di progetto (HTr) può essere ricavato dalla legge di probabilità cumulata identificata. Questa non è una misura assoluta ma è un parametro statistico a cui va associato un intervallo di confidenza.
Analisi dei dati di ondaStatistica a lungo termine: analisi degli eventi estremi Step 4. Calcolo dell’intervallo di confidenza Goda(1988) è il valore atteso dell’altezza d’onda con periodo di ritorno TR è il valore vero dell’altezza d’onda con lo stesso periodo di ritorno è la deviazione standard del campione simulato dove Esiste un’espressione empirica della deviazione standard di z
Analisi dei dati di ondaDeterminazione dell’onda di progetto ESEMPIO CON R Obiettivo: valutare la durata di vita presunta di un’opera marittima date le sue caratteristiche funzionali e i possibili danni che onde maggiori dell’onda di progetto le possono arrecare. Indipendenza degli eventi >cal<-read.table(‘mareggiate_cal.txt’,header=T) >plot(cal$h) >acf(cal$h) Stima di F(H)per ciascun ele mento dell’insieme campionario selezionato >hord<-sort(cal$h) #si ordina in senso decrescente la serie >N<-length(hord) >mat<-matrix(0,N,3) >mat[,1]<-hord >mat[,2]<-1:N >mat[,3]<-mat[,2]/(N+1) #per ogni elemento si stima la frequenza campionaria di eccedenza assumendo #così che tale frequenza coincida con la probabilità di superamneto. ATT non è l’unica relazione #proposta ce ne sono altre.... >gum<-lsfit(mat[,1],-log(-log(mat[,3]))) >gum >ls.print(gum) Calcolo dell’altezza significativa associata ad un periodo di ritorno T applicando il metodo minimi quadrati >T=50 >theta<-1/as.double(gum$coefficients[2]) >epsilon<--as.double(gum$coefficients[1])*theta >H50<-((-log(-log(1-1/T)))*theta)+epsilon SUGGERIMENTO: c’è la possibilità di utilizzare il pacchetto evd che utilizza il metodo della massima verosimiglianza per la stima dei parametri e che fa molte altre cose!
Analisi dei dati di ondaDeterminazione dell’onda di progetto ESEMPIO CON R Obiettivo: valutare la durata di vita presunta di un’opera marittima date le sue caratteristiche funzionali e i possibili danni che onde maggiori dell’onda di progetto le possono arrecare. Calcoliamo ora l’intervallo di confidenza per H50. Dalle tabelle ricaviamo i coefficienti per la Gumbel. >c1<-0.64 >c2<-9 >c3<-0.93 >c4<-0 >c5<-1.33 >vi<-N/50 >c0<-c1*exp(c2*N^(-1.3)+c3*sqrt(-log(vi))) >T<-50 >xT<--log(-log(1-1/T)) >sz<-sqrt((1+c0*(xT-c4+c5*log(vi))^2)/N) >sx<-sd(cal$h) >s<-sx*sz >H50+1.96*s >H50-1.96*s
Analisi dei dati di ondaDeterminazione dell’onda di progetto BOA DI ALGHERO BOA DI CATANIA BOA DI CROTONE BOA DI LA SPEZIA BOA DI MAZARA DEL VALLO BOA DI MONOPOLI
Analisi dei dati di ondaDeterminazione dell’onda di progetto BOA DI PESCARA BOA DI PONZA Franco L. et al. (2004) Atlante delle onde nei mari italiani
Analisi dei dati di ondaControllo di qualità dei dati Standardizzazione = metadata + documentazione + QC Metadata - tutte le informazioni necessarie per un corretto uso delle serie temporali ISO standard per dati georiferiti: ISO19115
Analisi dei dati di ondaControllo di qualità dei dati Quality control L1- automatico Tipicamente nelle operazioni automatiche di acquisizione il sistema effettua una serie di check sui dati appena misurati attribuendo un QC flag ( numero 1-10) I check tipicamente sono: Formattazione del testo Data ed ora corretta Presenza di gaps (inserisce la data e l’ora + mv tipo 999) Dati fuori range Rilevamento di spikes Rilevamento di valori costanti in un certo intervallo di tempo Valori sospetti (operazioni di misura in condizioni non ideali)
Analisi dei dati di ondaControllo di qualità dei dati Quality control L2- completo • Il QC completo si applica all’intera serie temporale. E’ un insieme di elaborazioni e test specifici per ogni tipo di osservazione, ad es. per le serie ondametriche le operazioni L2 sono : • analisi della formattazione • determinazione dei valori registrati con boa a terra • analisi delle tabelle a doppia entrata • ricerca di spike residui • ricerca di misure ripetute (confronto con altri periodi di tempo ed altre boe )
Distribuzioni di probabilità per l’analisi statistica delle onde estreme I tipo Gumbel II tipo Frechet III tipo Weibull A=fattore di scala B=fattore di posizione K=parametro di forma