390 likes | 795 Views
Klimatologija - vaje. Andrej Ceglar Soba 93 E-mail: andrej.ceglar@bf.uni-lj.si. Vaja 1. Meteorološki podatki Meteorološke postaje Arhiv meteoroloških podatkov Izmerjeni ter izvedeni meteorološki parametri (dodatek) Vizualizacija baze (vhodna baza, meta baza, uporabniška baza)
E N D
Klimatologija - vaje Andrej Ceglar Soba 93 E-mail: andrej.ceglar@bf.uni-lj.si
Vaja 1 • Meteorološki podatki • Meteorološke postaje • Arhiv meteoroloških podatkov • Izmerjeni ter izvedeni meteorološki parametri (dodatek) • Vizualizacija baze (vhodna baza, meta baza, uporabniška baza) • Dostop do podatkov • Primer klimatološke ter padavinske baze • Uporaba podatkov v različnih aplikacijah • Letni hodi klimatoloških spremenljivk • Klimatski diagrami • Osnovne opisne statistike v klimatologiji • Mere sredine (povprečje, modus, mediana, geometrijska sredina) • Mere variabilnosti (variacijski razmik, kvartilni razmik, varianca) • Programski jezik R
Meteorološke postaje • Prve met. opazovalnice v drugi polovici 18. stoletja • Kraljeva akademija znanosti je 1848 ustanovila Zentralstalt fur Meteorologie and Erdmagnetismus - ZAMG • Najstarejša opazovalnica na Slovenskem etičnem ozemlju je bila ustanovljena v Trstu (1779), prvi zapisani podatki datirajo v leto 1839 • 1871 postaja v Gorici • 1784 Tolmin (ta je delovala do 1810) • 1813 Celovec • 1824 Ljubljana (podatki iz začetnega obdobja so se žal izgubili) • Prvi ohranjeni nizi meteoroloških meritev v Ljubljani so iz leta 1850 (temperatura – maj 1850, zračni pritisk – januar 1852) • Ljubljani so sledile še ostale pomembnejše postaje: Celje (1852), Novo Mesto (1858), Maribor (1863), Ptuj in Kranj (1864)
Meteorološke postaje • Meteorološka mreža je konec 19. stoletja obsegala 85 postaj; kasneje velike spremembe • Slovenska mreža met. postaj pokriva območje velikosti 20000 kvadratnih km. Klimatski režim Slovenije je izredno kompleksen, kar zahteva gosto mrežo postaj. • Število klimatoloških in padavinskih postaj: • 1940 - 183 postaj • 1950 - 200 postaj • 1977 - 360postaj • 2007 - 212 postaj (40 klimatoloških, 172 padavinskih)
Meteorološke postaje • Klimatološke postaje: • Opazovanja 3-krat dnevno (7, 14, 21 CET) – že 120 let takih meritev • Meritve: količina padavin, temperatura zraka, vlažnost, zračni tlak, smer in hitrost vetra, temperatura tal, izhlapevanje, sončno obsevanje, temperatura morja • Opazovanja: oblačnost, vidnost, stanje tal in morja, pojavi v atmosferi • Sinoptične postaje • Urna opazovanja, GTS (Global telecommunications system) • 24 opazovanj / dan na 4 letališčih • Padavinske postaje: • Dnevna opazovanja ob 7 CET • Najgostejša mreža postaj • Meritve: količina padavin v zadnjih 24 urah, glavni vremenski pojavi, pozimi tudi višino snežne odeje ter novozapadlega snega • Avtomatske meteorološke postaje (kontinuirane meritve): • Interval vzorčenja 5 minut za padavine • Interval vzorčenja 30 minut s statistikami (minimum, maksimum, povprečje, standardni odklon) za ostale spremenljivke
Meteorološke postaje • Totalizatorji (kolčina padavin se meri na nekaj mesecev) • Fenološke postaje • Nastop določene razvojne stopnje (fenološke faze) pri izbranih negojenih ter gojenih rastlinah • 61 postaj • Podatki iz postaj predstavljajo osnovo za študije sedanjih klimatskih razmer, časovne ter prostorske spremenljivosti parametrov • Osnova za oceno potencialnih klimatskih sprememb v prihodnosti • Priporočilo WMO: klimatske študije zahtevajo niz vsaj 30-letnih kvalitetnih podatkov • Nehomogeni podatki • Manjkajoči podatki
Meteorološke postaje – nehomogeni podatki • Kaj pomeni nehomogeno? • Iz lat. homogenĕus,ter gr. ὁμογενής “enak po naravi” • Prevod v klimatske nize podatkov: • Homogen klimatski niz je definiran kot niz, kjer je variabilnost posledica variabilnosti klime same. Če je daljši klimatski časovni niz homogen, potem je vsa variabilnost v njem posledica variabilnosti naravne klime (WMO TD-1186). • V nasprotju, nehomogen časovni niz predstavlja kakršnokoli odstopanje, ki vpliva na izmerjene vrednosti in v bistvu ni posledica klimatske variabilnosti ter sprememb.
Meteorološke postaje – nehomogeni podatki • Zakaj lahko časovna vrsta postane nehomogena? • Spremenjene okoliščine meritev, spremenjen način prenosa, shranjevanja, analiziranja podatkov, kar vodi v sistematično odstopanje v določenem delu časovne vrste • Sprememba v izpostavljenosti dežemera, kar vodi k odklonu količine padavin • Sprememba v načinu izračuna povprečne temperature, kar vodi k odstopanju v primerjavi z WMO standardom ((Tmax+Tmin)/2) • Vpliv urbanizacije na temperaturno časovno vrsto (intenziviranje temperaturnih trendov)
Meteorološke postaje – nehomogeni podatki • Zamenjava merilnega inštrumenta lahko vodi k odstopanju (skok) časovnih vrstah trajanja sončnega obsevanja
Meteorološke postaje – nehomogeni podatki • Vpliv spremembe merilne lokacije instrumenta ter spremembe v okolici lahko vplivajo na meritve smeri in hitrosti vetra • Homogenizacija podatkov pomeni uporabiti primerne statistične prijeme za transformacijo podatkov, s čimer poskušamo eliminirati odstopanja (v časovni vrsti podatkov), ki niso klimatskega izvora Pred homogenizacijo (temperatura, Quebec) Trend pred homogenizacijo: -0.7 °C / 106 let Vir: Lucie Vincent.
Meteorološke postaje – nehomogeni podatki Po homogenizaciji (temperatura, Quebec) Trend po homogenizaciji: 2.1 °C / 106 let Vir: Lucie Vincent. • Primerjava različnih obdobij (ob dostopnih metapodatkih) • Identifikacija točke v podatkih, kjer imajo podatki najverjetneje prelomno točko • Iteracija skozi časovno vrsto oz. uporaba ustreznih numeričnih modelov, s katerimi določimo določitev večih prelomnih točk
Arhiv meteoroloških podatkov • Meritve in opazovanja na klasičnih meteoroloških postajah opazovalec vpiše v meteorološki dnevnik: • Veliki dnevnik (sinoptične postaje) • A4 dnevnik (klimatološke postaje) • A4 dnevnik (padavinske postaje) • Registrirni inštrumenti (termografi, pluviografi, ...) • Poročila se pošljejo po pošti na začetku vsakega meseca
Arhiv meteoroloških podatkov Poročilo padavinske postaje Poročilo klimatološke postaje
Arhiv meteoroloških podatkov Dnevnik opazovanj sinoptične postaje
Vizualizacija baze • Digitalizacija in shranjevanje podatkov • Ročno vnašanje podatkov v podatkovno bazo: • 13 sinoptičnih postaj na dnevni ravni • Ostale postaje na mesečni ravni • Pluviografi ter sončni trakovi so digitalizirani s pomočjo digitalizacijskih naprav • SYNOP poročila ter podatki z avtomatskih met. postaj se shranjujejo v podatkovno bazo v realnem času • Vsi podatki (zgodovinski podatki iz arhivov, sveži podatki z operativnih postaj) se procesirajo, nato gredo v podatkovno bazo (z isto programsko opremo) • Do sedaj so bili digitalizirani skoraj vsi časovni nizi za obdobje 1961-2007
Vizualizacija baze • Podatki z avtomatskih meteoroloških postaj ter data logger-jev se shranjujejo v relacijske podatkovne baze Oracle in Postgresql • Trije tipi tabel v podatkovni bazi: • Vhodni podatki z originalnimi vrednostmi • Kontrolirani ter interpolirani podatki za odjemalce • Izvedeni podatki (mesečni podatki, npr. povprečje, ekstremi, vsote, število dni z, ...) • Pomen meta baze
Vizualizacija baze – vnos podatkov • Primer vnašanja podatkov iz dnevnika v bazo: • Opazuje se • vrsta pojava • intenziteta pojava[0-2] • 0 - šibko, 1 - zmerno, 2 – močno, sl - sled, pr - v presledkih • trajanje pojava [od – do] • 5.8 mm padavin (izmerjeno ob 7.00) • Dež in nevihta z zmerno jakostjo • (rano jutro do 10) • Od 15.00 do 16.30 je deževalo v • presledkih, slaba jakost Vnos v padavinsko bazo
Vizualizacija baze – vnos podatkov Padavinska baza: Padavinska tabela: http://www2.arnes.si/~gljsentvid10/meteorologija/at_poj_p.html Klimatološka tabela: http://www2.arnes.si/~gljsentvid10/meteorologija/atm_pojavi_kli.htm • Padavinska baza: • vnos količine padavin • Šifriranje oblike padavin (1 – tekoče padavine) • Šifriranje pojavov: • Stolpec (dež, sneženje, dež s snegom): 1 • Stolpec (toča, slana, megla): 0 • Stolpec (ivje, sodra, babje pšeno): 0 • Stolpec (poledica, nevihta, viharni veter): 2 • Stolpec (snežna odeja, rosa): 0
Vizualizacija baze – kontrola podatkov • Avtomatski, polurni podatki – dnevna kontrola • Klasični klimatološki podatki – mesečna kontrola • Preprosta kontrola sinoptičnih podatkov v realnem času • Avtomatska validacija podatkov je izvršena z določenimi programi, napisanimi v Fortran-u, Pascal-u, Perl-u, PHP-ju ter ostalimi odprtokodnimi orodji • Registrirni inštrumenti (termografi, pluviografi, ...) se v glavnem uporabljajo za kontrolo ročnih meritev • Kontrolne procedure: • Kontrola mejnih vrednosti (nemogoče vrednosti, npr. T > 50 °C) • Test notranje konsistence (npr. Tmin <= Tmax), test prostorske konsistence • Kontrola vrednosti v časovni vrsti, iskanje velikih skokov, test variabilnosti • Primerjava z ostalimi merilnimi napravami (npr. termograf)
Vizualizacija baze – dostop do podatkov • Spletna orodja: PHP, Perl, JavaScript • Na ARSO so razvili spletno aplikacijo za dostop do meteoroloških podatkov direktno iz podatkovne baze
Vizualizacija baze – primer klimatološke ter padavinske baze Črpanje iz klimatološke baze http://192.168.10.185/klima_padavine/klima_sta_var2.php http://192.168.10.185/klima_padavine/padavine_sta_var_md_novo.php Črpanje iz padavinske baze
Osnovne opisne statistike • Opišejo karakteristike dane populacije; iščejo opisne (meta) podatke o populaciji in njenih sestavnih delih • Klimatski sistem je negotov: • Ni v celoti opazovan • Radi bi dostop do različnih parametrov (npr. meritev na populaciji, ki karakterizira eno izmed njenih lastnosti) • Računamo statistiko (npr. merilo karakteristike iz naključno izbranega vzorca) • Ni v celoti razumljiv • Kljub numeričnim modelom ne razumemo popolnoma dinamike klimatskega sistema • Nekaj pomembnih fizikalnih procesov se odvija na manjši skali, kar zahteva uporabo parametrizacij • Dinamični sistem je občutljiv na začetne pogoje – dinamični kaos • Deterministična klimatologija je omejena na kratke časovne skale • Klimatske napovedi so po naravi verjetnostne • Redukcija negotovosti je temelj klimatskega napovedovanja
Osnovne opisne statistike – mere sredine • Povprečje: aritmetična sredina podatkov, pri čemer je N število vzorcev oz. število razpoložljivih podatkov • Mediana: srednja vrednost v nizu podatkov, če jih razvrstimo po velikosti. Polovica vrednosti v nizu je po velikosti večje od mediane, polovica pa manjše. Če smo podatke v nizu razvrstili po velikosti , potem mediano izračunamo kot
Osnovne opisne statistike – mere sredine • Modus (F) je najbolj pogosta vrednost, ki se pojavlja v nizu. Odvisen je od natančnosti podatkov: • Natančnost na nekaj decimalnih mest -> majhna verjetnost za ponovitev • Pri zveznih (številskih) podatkih govorimo o modalnem razredu, ki v frekvenčni porazdelitvi pomeni razred z največjo frekvenco • Geometrijska sredina: predstavlja boljšo označbo centralne tendence (kot aritmetična sredina) za manjše podatkovne nize z ekstremnimi vrednostmi
Osnovne opisne statistike – mere variabilnosti • Maksimalna vrednost (max) – največja vrednost v obravnavanem nizu podatkov • Minimalna vrednost (min) – najmanjša vrednost v obravnavanem nizu podatkov • Variacijski razpon (R) – območje, v katerem se giblje obravnavana spremenljivka (med min. ter max. vrednostjo) • Poleg mediane (kjer podatke številsko razdelimo na polovico), lahko namesto dveh izberemo drugačno število razredov: • štirje razredi -> kvartili ( ), med posameznimi kvartili je četrtina podatkov • deset razredov -> decili • sto razredov -> percentili • V spolšnem ob razdelitvi na poljubno število razredov govorimo o kvantilih
Osnovne opisne statistike – mere variabilnosti • Varianca ( ) – mera za razpršenost niza okrog njegove povprečne vrednosti • Standardni odklon (s) – ocenimo kot koren variance, zato ima enake enote kot spremenljivka, katere lastnosti nas zanimajo • Koeficient variacije (KV) – kazalec, ki prikazuje razpršitev statističnih enot okoli aritmetične sredine njihove populacije; v poštev pride pri razmernostnih spremenljivkah
Letni hodi klimatoloških spremenljivk • Povprečni hodi, ki jih narišemo na podlagi povprečnih mesečnih vrednosti izbranih spremenljivk preko daljšega obdobja • Kdaj izbrane klimatološke spremenljivke dosežejo ekstremne vrednosti, se zadržujejo v ugodnem območju za določene aktivnosti (kmetijstvo, turizem) Povprečna (črna), minimalna (modra), ter maksimalna mesečna temp. (rdeča) za obdobje 1971-2000 Povprečna količina padavin po mesecih za obdobje 1971-2000
Klimatski diagrami • Standardni način primerjave klimatskih razmer v različnih krajih • Klimatski diagrami – veliko informacije o klimi izbrane lokacije • Walter in Leith (1967) – dolgoletna povprečja mesečnih temperatur ter mesečne količine padavin • Razmerje skal (ponavadi) T : RR = 1 : 4 (1 °C ustreza 4 mm padavin)
Klimatski diagrami • Naši kraji T : RR = 1 : 6 (obdobje zmerne suše) T : RR = 1 : 4 (obdobje suše)
Programski jezik R • Objektno orientiran jezik (spremenljivke, podatki, funkcije, ... se shranijo v spomin v obliki objektov, ki jih označuje ime). Uporabnik lahko izvaja operacije nad temi podatki z različnimi operatorji in funkcijami. • Računalnik ukaze sproti prevaja v strojni jezik, jih izvaja in kontrolira • Objekt ustvarimo z operatorjem dodeljevanja: n<-5 • Pomoč za posamezne ukaze: ?ime_ukaza • Zastonjska programska oprema (http://www.r-project.org/) • R for beginners (Emmanuel Paradis): http://cran.r-project.org/doc/contrib/Paradis-rdebuts_en.pdf
Programski jezik R • Primer: Letno trajanje sončnega obsevanja (ure) v Ljubljani (obdobje 1961 – 1990) • Priprava datoteke z vhodnimi podatki (leto, trajanje) • Datoteko uvozimo v R (ukaz read.table()) • Osnovne opisne statistike (ukaz summary()): Min. :1445 ur 1st Qu.:1642 ur Median :1700 ur Mean :1712 ur 3rd Qu.:1777 ur Max. :1987 ur • Varianca (ukaz var()): 14210 • Standardni odklon (ukaz sd()): 119 ur • Variacijski razpon: 542 ur • Koeficient variacije: 7 %
Programski jezik R • Grafična predstavitev podatkov: časovna vrsta (ukaz plot()), histogram (ukaz hist())
Programski jezik R Primer: Letni hod trajanja sončnega obsevanja v Ljubljani (1961 – 1990) Ukaz: barplot2()
Programski jezik R Primer: Primerjava povprečnega trajanja v obdobjih 1961-1990 ter 1991-2007 Two Sample t-test data: data_61_90 and data_91_07 t = -5.97, df = 45, p-value = 3.46e-07 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -317.5493 -157.3358 sample estimates: mean of x mean of y 1712.163 1949.606
Relativna frekvenca makro-cirkulacijskih tipov Vir: Andras Horanyi (Clavier project), 3. december 2007