850 likes | 1.07k Views
6. ČASOVNI PODATKI. Časovne podatke lahko glede na kvaliteto in način zapisa obdelujemo z več tehnikami: Markove verige Zaporedja dogodkov Analiza trenda Analize časovnih zaporedij. 6.1. MARKOVE VERIGE 6.1.1. Zamisel.
E N D
6. ČASOVNI PODATKI • Časovne podatke lahko glede na kvaliteto in način zapisa obdelujemo z več tehnikami: • Markove verige • Zaporedja dogodkov • Analiza trenda • Analize časovnih zaporedij
6.1. MARKOVE VERIGE6.1.1. Zamisel • Najslabša kakovost časovno spremenljivih podatkov je brez numeričnih vrednosti. Podatke sestavlja serij opisov zaporednih stanj sistema. • Metoda Markovih verig testira vzorce v zapisu prehodov enega stanja v drugega. Z njo preiskujemo cikličnost ali ritmičnost. • Pomanjkanje numerične informacije rešimo z verjetnostno teorijo.
6.1.1. Zamisel • Zaporedje 1: A D C C B C A D B BB A B D DD C B A A C D A A • Zaporedje 2: A B C D A B C D A B C D A B C D A B C D A B C D • Če obravnavamo dogodek B, lahko ugotovimo, da se v vsakem od zaporedij 24 črk pojavi 6x. • Verjetnost pojava dogodka B je 6/24 = 0,25.
6.1.1. Zamisel • V obravnavanih zaporedjih pa je kljub enaki verjetnosti pojava B razlika, kdaj se bo dogodek pojavil – pred ali za katerim dogodkom: • V prvem zaporedju se od šestih možnih pojavljanj B-ja pred njim pojavi: • 1 x A 1/6 = 0,167 • 2 x B 2/6 = 0,333 • 2 x C 2/6 = 0,333 • 1 x D 1/6 = 0,167 • V drugem zaporedju je pred B-jem vedno le A, kar je očitno drugače kot v naključnem primeru.
6.1.1. Zamisel • Kako si sledijo stanja, izrazimo s tranzicijsko frekvenčno matriko (prehodov), ki zabeleži število opazovanih prehodov med vsakim od možnih parov stanj.
6.1.2. Kodiranje geoloških zaporedij • Problema sta: • Kako razvrstiti litološke enote v profilu v ločena stanja? • Kaj je kriterij za zapis prehoda med dvema stanjema? • Število opazovanih prehodov naj bi 5x presegalo kvadrat števila litoloških kategorij. • Kriteriji prehoda: • Menjava litologije. • Ne zabeležimo prehoda kategorije v samo sebe. • Ravnine plasti. • Včasih jo je težko definirati. • Stalni določeni interval skozi celotno zaporedje. • Izpustimo tanke plasti, debele pa imajo mnogo prehodov same vase.
6.1.3. Markove analize6.1.3.1. Tranzicijska frekvenčna matrika • Kadar obstaja m litologij ima tranzicijska frekvenčna matrika obliko m x m, z vrstico in stolpcem za vsako litologijo. • Če sta prva in zadnja litologija isti, bo vsota vrstic enaka ustrezni vsoti stolpcev.
6.1.3.2. Tranzicijska verjetnostna matrika • Lastnosti tranzicijske verjetnostne matrike izrazimo v bolj splošno primerljivi obliki tako, da jo spremenimo v verjetnostno. • Matriko verjetnosti prehodov izračunamo tako, da delimo vsak element tranzicijske frekvenčne matrike z ustrezno vsoto vrstice. • Lastnosti nove matrike predstavimo z diagramom, kjer izpostavimo litologije in s puščicami nakažemo verjetni potek litološkega nadaljevanja.
6.1.3.2. Tranzicijska verjetnostna matrika • Lastnosti nove matrike predstavimo z diagramom, kjer izpostavimo litologije in s puščicami nakažemo verjetni potek litološkega nadaljevanja. • Verjetnost, da se neko zaporedje prehodov ujema z nekim določenim ciklom, izračunamo z množenjem verjetnosti.
6.1.3.3. Testiranje tranzicijske frekvenčne matrike • Testiranje izvedemo s testom hipoteze naključnosti, kjer opazovano tranzicijsko matriko primerjamo z matriko, ki bi jo pričakovali, če ni nobenega vzorca. • Izračunamo pričakovano verjetnostno matriko. Pričakovano naključno verjetnostno matriko obrnemo v pričakovano naključno tranzicijsko frekvenčno matriko tako, da jo ponovno izrazimo s preštetimi prehodi.
6.1.3.3. Testiranje tranzicijske frekvenčne matrike • Elemente pričakovane naključne tranzicijske frekvenčne matrike poiščemo tako, da množimo elemente pričakovane naključne verjetnostne matrike z ustreznimi seštevki vrstic iz opazovane tranzicijske frekvenčne matrike. • Opazovana tranzicijska frekvenčna matrika je sedaj neposredno primerljiva z matriko, ki ustreza pričakovanemu naključnemu modelu. • Med seboj ju primerjamo s X2 testom.
6.1.3.3. Testiranje tranzicijske frekvenčne matrike • H0: zaporedje stanj je naključno H1: zaporedje stanj ni naključno • Testna statistiko: primerjamo s tabeliranim X2 z (m-1)2 stopnjami prostosti. • Zaporedje stanj ni naključno, če izračunana vrednost presega kritično.
6.1.3.3. Testiranje tranzicijske frekvenčne matrike • Opozorila: 1. V večini razredov moramo pričakovati vsaj pet prehodov, tako da je število prehodov najmanj 5 x m2. 2. Če je kriterij prehoda menjava litologije, morajo biti po vodilni diagonali opazovane matrike ničle. V vodilni diagonali pričakovane naključne matrika pa neizogibno ne bo ničel, zato pričakovana matrika ni ustrezen model. 3. Test vodi do zavrnitve H0, čim obstaja kakršnakoli oblika nenaključnosti, ne le cikličnost ali ritmičnost. Kadar je kriterij prehoda stalen interval ali plasti, je verjetna (in precej nezanimiva) vrsta nenaključnosti velika debelina iste litologije.
6.2. ZAPOREDJA DOGODKOV6.2.1. Cilji in uporaba • Seznam časov ali datumov: potresi, vulkanski izbruhi, poplave, padci meteoritov, obrati magnetnega pola, masovna izumrtja. • Podatke obravnavamo kot točke v času – trajanje dogodka je izredno kratko. • Metode uporabimo predvsem za napovedovanje novih dogodkov.
6.2.1. Cilji in uporaba • Dogodki so lahko v času razporejeni popolnoma naključno; napovedovanje na osnovi vzorca v preteklosti je nesmiselno. • Oblike nenaključnosti so enakomernost, kopičenje, trend in vzorec. • Pomembna je definicija začetka in konca časovnega intervala.
6.2.2. Testiranje naključnosti • Naključnost pomeni, da pojav enega dogodka ne vpliva na verjetnost, da se zgodi drugi. • Frekvenčna porazdelitev takih podatkov se ujema s Poissonovim modelom. • Poissonova porazdelitev ima le en parameter (), ki podaja povprečno gostoto točk. • Glede na Poissonov model določimo število intervalov z j dogodki (Oj) iz celotnega števila dogodkov (n) in števila intervalov (T) ter ga primerjamo s pričakovanim številom (Ej).
6.2.2. Testiranje naključnosti • H0: dogodki so porazdeljeni naključno H1: dogodki so nakopičeni ali enakomerni • Pričakovanje Ej izračunamo iz Poissonovega modela: • Uporabimo X2 test:
6.2.2. Testiranje naključnosti • Število uporabljenih razredov je odvisno od podatkov. V večini razredov bo običajno le ena vrednost j. Na skrajnih koncih porazdelitve zato združujemo razrede tako, da je pričakovana pogostnost Ej v vsakem razredu ≥ 5. • Za j = 0 uporabimo j! = 1. • Stopnje prostosti so (št. razredov) – 2.
6.2.2. Testiranje naključnosti • Opozorilo: • Test je občutljiv le na frekvenčne porazdelitve števila intervalov; ko je število intervalov doseženo, se intervali učinkovito ločijo med seboj in od časovne lestvice. • Zato test ni občutljiv za nenaključnost v obliki trenda naraščajoče ali padajoče gostote dogodkov v času.
6.2.3. Testiranje trenda (smeri) • Spremembe pogostnosti dogodkov kvantificiramo s spremembami dolžine intervala med njimi. • Graf števila dogodkov proti intervalom med njimi pokaže obstoječe trende, ki jih kvantificiramo s korelacijo.
6.2.3. Testiranje trenda (smeri) • H0: ni trenda spremembe dolžine intervala H1: dolžine intervalov se krajšajo/daljšajo • Testna statistika je Spermanovuvrstitveni korelacijski koeficient: • Kjer je hi dolžina i-tega intervala in n število intervalov oz. število dogodkov – 1. • Kadar izračunana vrednost presega tabelirano, zavrnemo H0.
6.2.4. Testiranje enoličnosti • Enakomerno porazdeljeni dogodki so lahko posledica geoloških procesov, pri katerih pojav dogodka zmanjša verjetnost naslednjega v bližnji prihodnosti, vendar poveča njegovo verjetnost kasneje. • Enoličnost testiramo s Kolmogorov - Smirnov (KS) testom. • H0: dogodki so enakomerni ali naključni H1: dogodki so nakopičeni ali imajo trend spreminjajoče gostote
6.2.4. Testiranje enoličnosti • Ničelni model izrazimo z ravno črto na kumulativnem frekvenčnem grafu (s časom na x osi). Kumulativni graf podatkov bo od te črte odstopal. Največje odstopanje v navpični smeri je osnova za KS statistiko.
6.2.4. Testiranje enoličnosti • Kritične vrednosti KS temeljijo na velikosti odstopanja, ki bi jo pričakovali pri naključnih podatkih. Če je presežena, zavrnemo H0. • Prednost testa je njegova občutljivost tako za trende kot za nakopičenja. • Za vsak dogodek vključuje izračun KS primerjavo razmerja pretečenega dogodka z razmerjem pretečenega časa.
6.2.4. Testiranje enoličnosti • Za i-ti dogodek v zaporedju n dogodkov v časovnem zapisu dolžine T, kjer je ti pretečeni čas od začetka zapisa, primerjamo i/n s ti/T. • Če bi bili dogodki popolnoma enakomerni, bi bil ti/T za vsak dogodek enak (i-k)/n, kjer je k katerakoli konstanta med 0 in 1. • Za KS izračunamo razliki: (i/n) – (ti/T) in ((i-1)/n) - (ti/T) za vsakega od dogodkov (stopnic na grafu).
6.2.4. Testiranje enoličnosti • Manjša kot je neenakomernost, višje bodo posamezne vrednosti. Najvišja absolutna vrednost je KS statistika. • Primerjamo jo s tabelirano kritično vrednostjo. H0 zavrnemo, kadar izračunana vrednost presega kritično.
6.2.4. Testiranje enoličnosti • Pravilnost, ki je skrajni primer enakomernosti, bo v tem testu vodila do izredno nizkih vrednosti KS, vendar jo je statistično izredno težko ločiti od enakomernosti. • Za podatke, ki jih želimo definirati kot pravilne, moramo dopustiti nekaj naključne spremenljivosti ali napake okrog popolnoma redno ponavljajočega se vzorca. • Večanje take spremenljivosti povzroči zveznost možnosti od pravilne, preko enakomerne do naključne porazdelitve.
6.2.5. Testiranje vzorcev • Vrsta nenaključnosti so tudi kratki cikli menjajoče se pogostnosti dogodkov in vzorci z izmenjujočimi se dolgimi in kratkimi vmesnimi intervali. • Vzorec iščemo v zaporedju dolžine intervalov h. Odnos med zaporednimi dolžinami intervalov preiščemo s korelacijskim koeficientom. • Kadar med zaporednimi intervali ni vzorca, je korelacija med hi in hi+1 nič.
6.2.5. Testiranje vzorcev • Značilna negativna korelacija kaže menjajoče se dolge in kratke intervale; pozitivna je znak, da so si zaporedne dolžine intervalov podobne. • H0: ni povezave med zaporednimi dolžinami intervalov H1: obstaja korelacija med zaporednimi dolžinami intervalov
6.2.5. Testiranje vzorcev • Testna statistika je Spearmanov uvrstitveni korelacijski koeficient: kjer je n število dogodkov - 2. • Če izračunana vrednost presega kritično, zavrnemo H0 in ugotovimo, da obstaja vzorec.
6.3. ANALIZE ČASOVNIH ZAPOREDIJ • Čas je posebna spremenljivka, ker: • ima časovna bližina dveh opazovanj poseben pomen. • so podatki že naravno razporejeni glede na čas • je veliko naravnih procesov v času cikličnih.
6.3. ANALIZE ČASOVNIH ZAPOREDIJ • V geologiji so absolutno časovno merljivi le nekateri pojavi: • Podatki na zelo dolgih časovnih lestvicah (106 – 109 let) radiometrično datiranje obrati magnetnega polja, evstatična nihanja morske gladine, izumrtja fosilnih zapisov, magmatizem. • Geofizikalni podatki (potresni), kjer je čas z lahkoto točno merljiv na kratkotrajni časovni lestvici. • Podatki srednje časovne lestvice (1 – 106 let), kjer čas z zadostno ločljivostjo poznamo za zgodovinske dogodke potresi, poplave, vulkanski izbruhi.
6.3. ANALIZE ČASOVNIH ZAPOREDIJ • Časovna razlaga geoloških sekvenc: a. Varve b. Prirastnice fosilov c. Stratigrafska vrtina d. Zaporedje plasti
6.3. ANALIZE ČASOVNIH ZAPOREDIJ • Motnje v časovnem zapisu: • Porušitev zapisa zaradi spreminjanja hitrosti sedimentacije. • Nezmožnost, da bi opazili nižje vrhove v ciklu.
6.3.1. Priprava podatkov6.3.1.1. Interpolacija • Časovno nihanje spremenljivk obravnavamo kot zvezno, enakomerno razporejeno v času. • Če sta t1 in t2 časa v sosednjih točkah in y1 in y2 izmerjeni vrednosti v njih, je vrednost v vmesni točki ti:
6.3.1.2. Glajenje • Surove podatke sestavljata dva dela: • Signal, ki je posledica geološkega procesa • Šum, ki je posledica naključnih motenj • Šum se pojavlja v visokih frekvencah in ima nestalen vpliv na sosednja opazovanja. • Zmanjšamo ga s porazdelitvijo preko kratkega niza opazovanj – z glajenjem.
6.3.1.2. Glajenje • Povprečni niz glajenih podatkov ne sme biti predolg, da ne zgladimo tudi signala. • Vsako opazovano vrednost nadomestimo z oceno vrednosti brez šuma. • Oceno izračunamo z aritmetičnim povprečenjem opazovane vrednosti v obravnavani in v sosednjih točkah. • Vpliv bližjih točk mora biti večji od vpliva bolj oddaljenih tehtanje vrednosti.
6.3.1.2. Glajenje • Sprejeti moramo odločitvi: 1. Kolikšno število opazovanj bomo vključili v tehtano povprečje • Liho • Kratki nizi (3 – 7) ohranjajo signal z relativno visoko frekvenco • Daljši nizi glajenje je učinkovitejše 2. Kakšne bodo vrednosti uteži.
6.3.1.2. Glajenje • Vrednosti uteži, ki jih predlagajo matematiki glede na število členov kvadratnega polinomnega glajenja:
6.3.1.2. Glajenje • Če uporabimo pet členski polinom je ocena y1’ pri času ti: • 35 je vsota uteži, s katero delimo zato, da dobimo skupno utež 1 in s tem preprečimo precenjevanje vrednosti.
6.3.1.2. Glajenje • Pri glajenju nizov z 2n-1 členi, prve in zadnje točke prvotnega časovnega zaporedja ne moremo uporabiti na enak način. • Zgladimo jih z manjšim številom členov ali jih pustimo nespremenjene.
6.3.1.3. Okna in filtri • Okno je razpon točk časovnega zaporedja, preko katerega uporabimo algoritem pri vsaki ponovitvi (= število členov pri glajenju). • Filter sestavljata določen vzorec in algoritem. • Postopke uporabimo za: • Potresne podatke • Poudarjanje gradientov v podatkih časovnih zaporedij: • Meritve stopnje (hitrosti) spremembe spremenljivke • Delitev časovnega zaporedja v manjše pravilne cone, ki jih razmejujejo hitre spremembe.
6.3.1.3. Okna in filtri • Izračunamo niz razlik med zaporednimi opazovanji: yi’ = yi + yi-1 • Kjer yi’ predstavlja novo časovno zaporedje razlik. • Boljši rezultat dobimo, če uporabimo filter, ki temelji na diferencialu polinomnih funkcij.
6.3.1.3. Okna in filtri • Uteži filtra so enake členom polinoma: Preprosti filter razlik Polinomni diferencialni filter • Okno s petimi členi ima uteži filtra enake kot v zgornji tabeli in enačbo zapišemo: yi’ = 2yi+2 + yi+1 - yi-1 - 2yi-2
6.3.1.3. Okna in filtri • Strme lokalne gradiente, povezane s conarnostjo, poudarimo z deljenim premikajočim se oknom: • Okno, razdeljeno v enaki polovici pomikamo preko nabora podatkov. • V položajih,ki ustrezajo prehodu med conama, je razlika med srednjima vrednostma velika glede na varianci, kar kvantificiramo z: kjer sta in srednja vrednost in varianca spremenljivke v dveh polovicah okna.
6.3.2. Časovni trendi • Linearne trende odkrijemo s preprosto bivariatno linearno regresijo, s časom kot neodvisno spremenljivko, ter F testom značilnosti analize variance. • Linearni trend odstranimo tako, da namesto surovih podatkov uporabimo preostanke regresije.
6.3.2. Časovni trendi • Če je regresijska enačba s časom t kot neodvisno spremenljivko: y = a + bt • Izračunamo preostanle kot: yi’ = y – bti – a • Polinomna regresija običajno ni uporabna za odkrivanje trendov v časovnih zaporedjih, ker ukrivljene trende boljše opišejo cikli.