270 likes | 441 Views
WSTĘPNA OCENA PRZYDATNOŚCI WYBRANYCH ALGORYTMÓW PRZESTRZENNEJ ESTYMACJI MIESIĘCZNYCH I ROCZNYCH SUM OPADÓW NA OBSZARZE POLSKI. Alfred Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan Tamulewicz Instytut Geografii Fizycznej i Kształtowania Środowiska Przyrodniczego UAM. Zarys treści.
E N D
WSTĘPNA OCENA PRZYDATNOŚCI WYBRANYCH ALGORYTMÓWPRZESTRZENNEJ ESTYMACJI MIESIĘCZNYCH I ROCZNYCHSUM OPADÓWNA OBSZARZE POLSKI Alfred Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan Tamulewicz Instytut Geografii Fizycznej i Kształtowania Środowiska Przyrodniczego UAM
Zarys treści • Problem • Cel pracy • Analizowane dane • Metody • Wyniki • Wnioski
Problem • Precyzyjna estymacja punktowych i obszarowych charakterystyk opadów atmosferycznych jest bardzo istotna zarówno w badaniach naukowych, jak i w różnych aspektach gospodarki wodnej i rolnictwa. • Powszechna dostępność komputerowych implementacji różnych algorytmów estymacji przestrzennej (=interpolacji) stwarza olbrzymie szanse, ale także liczne obawy. • możliwa jest szybka i obiektywna – w sensie powtarzalności i niezależności od tzw. doświadczenia badacza – analiza wielkich zbiorów danych • powszechne stosowanie narzędzi matematyczno-statystycznych bez gruntownej znajomości ich podstaw, zakresu stosowania i ograniczeń
Problem cd. • Żaden algorytm estymacji przestrzennych nie jest uniwersalny. Jego przydatność jest różna, w zależności nie tylko od charakteru zjawiska, którego zmienność przestrzenna jest opracowywana, ale także od zagęszczenia i konfiguracji punktów pomiarowych, błędów samego pomiaru i niedokładności określenia lokalizacji stanowisk pomiarowych. • Opady atmosferyczne charakteryzują się nieciągłością czasową i przestrzenną oraz sezonową i przestrzenną zmienność mechanizmów je generujących.
Problem cd. • Co rozumiemy pod pojęciem efektywności (przydatności) algorytmu interpolacyjnego? • optymalną estymację w punkcie? • optymalną estymację dla obszaru? • Czy estymator jest lepszy kiedy wiernie oddaje oryginalne dane pomiarowe? • Czy rozkład błędów pomiarowych w czasie i przestrzeni jest losowy? • A co z nieprecyzyjną informacją o lokalizacji punktów pomiarowych?
Problem cd. • Czy istnieje możliwość podniesienia jakości automatycznej estymacji przestrzennej opadów z wykorzystaniem skorelowanych charakterystyk morfometrycznych rzeźby? • Niestacjonarność pola opadów – algorytmy globalne kontra lokalne.
Cel pracy • Czy testowane algorytmy z taką sama wiarygodnością estymują sumy roczne i miesięczne? • Czy w zróżnicowanej efektywności uwzględnionych algorytmów znajduje odbicie sezonowa zmienność struktury przestrzennej pola opadów? • Które algorytmy są bardziej przydatne do estymacji punktowej, a które dla obszarowej? • Jaka jest wielkość bezwzględnych i względnych błędów estymacji, i jaki jest ich rozkład geograficzny?
Metody • Wykorzystane algorytmy estymacji przestrzennych: • geostatystyczne (kriging): • zwykły kriging z globalnym semiwariogramem (OK-gv), • zwykły kriging z lokalnymi semiwariogramami (OK-lv), • prosty kriging ze zmiennymi średnimi lokalnymi i globalnym semiwariogramem liczonym automatycznie (SKlm-gva), • prosty kriging ze zmiennymi średnimi lokalnymi i globalnym semiwariogramem dopasowanym „ręcznie” (SKlm-gvm), • prosty kriging ze zmiennymi średnimi lokalnymi i lokalnymi semiwariogramami (SKlm-lv), • odwrotności odległości z kwadratowym wykładnikiem potęgowym (ID2), • „triangulacji” (TIN), • minimalnej krzywizny (MC).
Metody • Algorytmy o charakterze lokalnym: OK-lv, SKlm-lv, ID2, TIN i MC. • Algorytmy o charakterze globalnym: OK-gv, SKlm-gva, SKlm-gvm. • Algorytmy uwzględniające dodatkowe dane (wysokość nad poziom morza z cyfrowego modelu rzeźby terenu): SKlm-lv, SKlm-gva, SKlm-gvm. • Algorytmy nie uwzględniające dodatkowych danych: OK-gv, OK-lv, ID2, TIN i MC.
Metody • Metoda oceny jakości algorytmu interpolacyjnego: jackknifing czyli podział zbioru danych na podzbiory: kalibracyjny i walidacyjny. • Porównanie estymacji miar centralnych populacji (wartości obszarowych): średniej (x) i mediany (Me). • Porównanie estymacji miar rozrzutu/rozkładu populacji (wartości obszarowych): odchylenie standardowe (SD), pierwszy i trzeci kwartyl (Q1, Q3), minimum i maksimum (min, maks) skośność (Sk) i kurtoza (K). • Porównanie estymacji wartości lokalnych: średni błąd (ME), pierwiastek średniego błądu kwadratowego (RMSE), współczynnik korelacji (r).
Rok 1980 Suma października Rok 1980 Suma kwietnia Rok 1980 Suma stycznia Rok 1980 Suma roczna Rok 1980 Suma lipca Dane
Metody • Z analizowanych zbiorów danych usunięto losowo co 40 punkt pomiarowy. • Przyjęta procedura zapewniała równomierne rozmieszczenie punktów wybranych do walidacji na terenie całego kraju. • Ze względu na różną liczebność zbioru stacji dla poszczególnych miesięcy i całego roku (minimalnie 2385 dla całego roku, maksymalnie 2504 stacje w lipcu) wylosowano od 59 do 63 punktów pomiarowych, co stanowiło od 2,47 do 2,53% analizowanych zbiorów danych.
Dane:cyfrowymodelrzeźbyterenu(DEM)o roz-dzielczościok. 1 kmGTOPO30http://www1.gsi.go.jp/gtopo30/gtopo30.html
Wyniki:estymacja odchylenia standardowego rozkładu obszarowego opadów
Wyniki:współczynnik korelacji między danymi oryginalnymi i estymowanymi
Wyniki:pierwiastek względnego średniego błędu kwadratowego estymacji (RRMSE)
Wnioski • Z przeprowadzonej analizy wynika że żadna z testowanych metod nie może być uważana za uniwersalną i najlepszą w każdych warunkach. Wyniki testów są nie tylko różne w przypadku poszczególnych zbiorów danych (sumy rocznej i sum miesięcznych), ale także w sytuacji różnych parametrów oceny jakości estymacji. Porównanie wyników obliczeń wykonanych na jednym jedynie zbiorze danych referencyjnych może prowadzić do fałszywych uogólnień. • Generalnie dość słabo wypadły algorytmy (SKlm-), które uwzględniały dane z cyfrowego modelu rzeźby terenu. Zależność między wysokością nad poziom morza a opadami obliczono bowiem w postaci jednego modelu wielomianowego dla całego terytorium Polski.
Wnioski cd. • Lepsze wyniki dają algorytmy oparte na lokalnym modelu struktury pola opadów niż na globalnym. • Algorytmy TIN, SKlm-gva, SKlm-lv były nieco bardziej skuteczne przy estymacjach parametrów populacji (obszarowych), podczas gdy MC, OKgv, OKlv i SKlm-gvm – punktowych.
Wnioski cd. • Zdecydowanie najlepiej wypadła metoda minimalnej krzywizny (MC). Jej średni wynik zarówno z estymacji punktowych, jak i obszarowych był znacznie lepszy niż wszystkich pozostałych metod. • Można ją wstępnie zalecać do rutynowego wykonywania map opadów atmosferycznych, tym bardziej, że nie wymaga specjalistycznego parametryzowania. • Metoda ta daje dobre rezultaty jedynie przy względnie równomiernym pokryciu analizowanego obszaru punktami pomiarowymi.
Wnioski cd. • Zdecydowanie najgorzej w zestawieniu wypadł kriging w oparciu o globalny model struktury pola opadów (OKgv) i popularna metoda odwrotności odległości przy wykładniku kwadratowym (ID2). • Średni błąd estymacji sumy rocznej opadów wahał się od 6,7 (SKlm-lv) do 7,9% (ID2), przy rozrzucie estymacji punktowych od –22,5 do +25,0%. • Średnie błędy estymacji sum miesięcznych (dla wszystkich metod) wynosiły: styczeń – 18,6%, kwiecień – 10,9%, lipiec – 13,0%, październik – 9,2%. Różnice pomiędzy najlepszą a najgorszą metodą estymacji sum miesięcznych wahały się od 0,8% w lipcu do 3,4% w styczniu. Błędy estymacji punktowych mogą przy sumach miesięcznych sięgać 75%, w większości jednak przypadków oscylują w granicach 35%.
Wnioski cd. Prezentowane wyniki mają charakter wstępnej oceny niektórych algorytmów estymacyjnych. Aktualnie trwają dalsze prace związane z testowaniem szerokiego spektrum metod automatycznej estymacji opadów przy wykorzystaniu większej ilości danych, zarówno wartości przeciętnych jak i uwzględniających ekstremalne wysokości opadów.
Dziękuję Za uwagę