420 likes | 881 Views
GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja. Alfred Stach Instytut Paleogeografii i Geoekologii Wydział Nauk Geograficznych i Geologicznych UAM. Eksploracyjna analiza danych. Przestrzenna jednej zmiennej: typ próbkowania
E N D
GEOSTATYSTYKAĆwiczenia dla III roku Geografiispecjalność - geoinformacja Alfred Stach Instytut Paleogeografii i Geoekologii Wydział Nauk Geograficznych i Geologicznych UAM
Eksploracyjna analiza danych • Przestrzenna jednej zmiennej: • typ próbkowania • istnienie danych lokalnie odstających; potencjalne przyczyny • ogólny pogląd na zmienność przestrzenną, wykorzystanie prostej automatycznej procedury interpolacji • istnienie efektu proporcjonalności lokalnej średniej/wariancji • rozgrupowanie danych przy próbkowaniu preferencyjnym
Poligon Hørbyebreenzmienna b1_03b Lokalizacja punktów pomiarowych Powierzchnia rzeczywista
Polygony Thiessen’a • Poligony Thiessen’a (Voronoi): • Założenie, że wartości cechy w nie opróbowanych lokalizacjach są równe wartościom dla najbliżej położonego punktu pomiarowego • Metoda wektorowa • Regularnie rozmieszczone punkty dają w tej metodzie regularną siatkę poligonów • Punkty rozproszone (nieregularnie rozrzucone) powodują powstanie siatki nieregularnych poligonów
Poligon Hørbyebreenzmienna b1_03b Interpolacja – poligony Thiessena Powierzchnia rzeczywista
Traingulacja (TIN) • Inna metoda wektorowa często stosowana do tworzenia cyfrowych modeli rzeźby terenu (digital terrain models - DTM) • Sąsiadujące punkty są łączone liniami (krawędziami), i w efekcie powstaje siatka nieregularnych trójkątów • Obliczenia rzeczywistej odległości między punktami danych w przestrzeni trójwymiarowej przy pomocy trygonometrii • Obliczenia interpolowanej wartości z położenia na płaszczyźnie przechodzącej przez trzy sąsiadujące ze sobą punkty pomiarowe
danab danac danac b c a Konstrukcja TIN Interpolowanawartośćx Widok izometryczny (rzut 3W) Widok w planie
Przykład TIN Rzeczywista powierzchnia z lokalizacjami punktów pomiarowych Wynikowa siatka TIN
Poligon Hørbyebreenzmienna b1_03b Interpolacja – TIN Powierzchnia rzeczywista
Przestrzenna średnia ruchoma • Metoda mająca zastosowanie zarówno dla danych wektorowych, jak i rastrowych: • Bardzo popularna w GIS • Oblicza nieznaną wartość cechy dla określonej lokalizacji na podstawie zakresu wartości dla najbliżej lezących punktów pomiarowych • Kryteria „sąsiedztwa” do obliczeń są określane za pomocą reguły wprowadzanej przez operatora: • Wielkość, kształt sąsiedztwa i/lub charakter danych
Przestrzenna średnia ruchoma (PŚR) – przykłady definicji sąsiedztwa
Przykład PŚR (sąsiedztwo koliste) Rzeczywista powierzchnia z punktami danych Powierzchnia modelowana dla sąsiedztwa o promieniu 11 Powierzchnia modelowana dla sąsiedztwa o promieniu 21 Powierzchnia modelowana dla sąsiedztwa o promieniu 41
Poligon Hørbyebreenzmienna b1_03b Powierzchnia rzeczywista Interpolacja – średnia ruchoma
Interpolacja metodą średniej ważonej odległością(IDW – inverse distance weighted) W metodzie IDW rola otaczających punkt estymowany danych jest w liczonej średniej zróżnicowana w zależności od odległości Zj- wartość cechy Z estymowanej w punkcie j Zi – wartość cechy Z zmierzona w punkcie i (jednym z n punktów danych w otoczeniu) hij – efektywna odległość między punktami i i j - wykładnik potęgowy – waga odległości
Poligon Hørbyebreenzmienna b1_03b Interpolacja – IDW ( = 2) Powierzchnia rzeczywista
Powierzchnie trendu • Wykorzystanie regresji wielomianowej aby dopasować metodą najmniejszych kwadratów powierzchnię do punktów danych • Zazwyczaj operator może decydować o stopniu wielomianu stosowanego w dopasowaniu powierzchni • Wraz ze wzrostem stopnia wielomianu dopasowywana powierzchnia staje się coraz bardziej skomplikowana • Nie zawsze wielomian wyższego stopnia generuje powierzchnię bardziej dokładną – jest to uzależnione od charakteru danych • Im niższy błąd RMS tym lepiej interpolowana powierzchnia odwzorowuje punkty danych • Najczęściej stosuje się wielomiany od 1 do 3 rzędu
Typowe funkcje równań trendu Planarna: z(x,y) = A + Bx + Cy Bi-liniowa: z(x,y) = A + Bx + Cy + Dxy Kwadratowa: z(x,y) = A + Bx + Cy + Dx2 + Exy + Fy2 Sześcienna: z(x,y) = A + Bx + Cy + Dx2 + Exy + Fy2 + Gx3 + Hx2y + Ixy2 + Jy3
Dopasowanie powierzchni trendu wielomianem pierwszego stopnia Punkty interpolowane Punkty danych
Jakość dopasowania (R2) = 92,72 % Przykładypowierzchni trendu Rzeczywista powierzchnia z lokalizacją pomiarów Trend planarny Trend kwadratowy Trend sześcienny Jakość dopasowania (R2) = 82,11 % Jakość dopasowania (R2) = 45,42 %
Poligon Hørbyebreenzmienna b1_03b Powierzchnia rzeczywista Interpolacja – wielomian (1 st.)
Poligon Hørbyebreenzmienna b1_03b Powierzchnia rzeczywista Interpolacja – wielomian (2 st.)
Poligon Hørbyebreenzmienna b1_03b Powierzchnia rzeczywista Interpolacja – wielomian (3 st.)
Eksploracyjna analiza danych • Przestrzenna jednej zmiennej: • typ próbkowania • istnienie danych lokalnie odstających; potencjalne przyczyny • ogólny pogląd na zmienność przestrzenną, wykorzystanie prostej automatycznej procedury interpolacji • istnienie efektu proporcjonalności lokalnej średniej/wariancji • rozgrupowanie danych przy próbkowaniu preferencyjnym
Efekt proporcjonalności średniej lokalnej do wariancji lokalnej
Semiwariogram reszt – statystyki zmiennej b1_03b w grupach swir_03b
I etap próbkowania preferencyjnego: 200 losowych próbek wszystkich zmiennych III etap próbkowania preferencyjnego: dodanie 150 próbek losowo wybranych, lecz jedynie w obrębie grupy 2 g-swir03b II etap próbkowania preferencyjnego: usunięcie z 200 próbek losowo 100 próbek zmiennej b1_03b Zmienne b1_03b i g-swir03b - populacja
Statystyki zmiennej b1_03b: populacja oraz próbkowania – losowe i preferencyjne
Efekt proporcjonalności: relacja między lokalną średnią, a lokalną wariancją Próbka losowa, zmienna b3n_03b Próbka losowa, zmienna b1_03b
Efekt proporcjonalności: relacja między lokalną średnią, a lokalną wariancją Próbka preferencyjna, zmienna b3n_03b Próbka preferencyjna, zmienna b1_03b
Eksploracyjna analiza danych • Przestrzenna jednej zmiennej: • typ próbkowania • istnienie danych lokalnie odstających; potencjalne przyczyny • ogólny pogląd na zmienność przestrzenną, wykorzystanie prostej automatycznej procedury interpolacji • istnienie efektu proporcjonalności lokalnej średniej/wariancji • rozgrupowanie danych przy próbkowaniu preferencyjnym
Analizowane przedziały widma (kanały) Kanał 1: 0,52 – 0,60 µm (światło zielone) Kanał 2: 0,63 – 0,69 µm (światło czerwone) Kanał 3: 0,78 – 0,86 µm (bliska podczerwień)
Wyjście z problemu –statystyki ważone Średnia arytmetyczna Średnia ważona
Rozgrupowanie komórkowe(cell declustering) n=1 n=1 Średnia arytmetyczna » 276,58 n=2 n=8 Średnia ważona = 1011,55/4 »252,94