480 likes | 721 Views
GEOSTATYSTYKA I ANALIZA PRZESTRZENNA Wykład dla III roku Geografii specjalność - geoinformacja. Alfred Stach Instytut Geoekologii i Geoinformacji Wydział Nauk Geograficznych i Geologicznych UAM. Semiwariogram kodów – zmienna ciągła.
E N D
GEOSTATYSTYKAI ANALIZA PRZESTRZENNAWykład dla III roku Geografiispecjalność - geoinformacja Alfred Stach Instytut Geoekologii i Geoinformacji Wydział Nauk Geograficznych i Geologicznych UAM
Semiwariogram kodów – zmienna ciągła Funkcja kowariancji i semiwariogram to charakterystyki ciągłości przestrzennej (lub zmienności) dla całego zakresu wartości cechy. Struktura ciągłości przestrzennej (lub zmienności) może jednak różnić się, zależnie czy pod uwagę bierzemy rozkład punktów danych charakteryzujących się niskimi, średnimi czy wysokimi wartościami cechy. W wielu sytuacjach spotykanych w środowisku przyrodniczym lub społeczno-gospodarczym, losowo występujące wysokie wartości cechy, są otoczone większymi obszarami o średnich lub niskich wartościach, które zmieniają się w sposób ciągły. To czy wartości ekstremalne są w przestrzeni rozproszone, czy też skupione, ma duże znaczenie dla wyjaśniania zjawiska, oraz jakości estymacji.
10 percentyl = 314 25 percentyl = 323 75 percentyl = 332 50 percentyl = 331 90 percentyl = 348 Analiza danych kodowanych– zmienna ciągła
Analiza danych kodowanych– zmienna ciągła Eksperymentalna autokowariancja kodów F-h(zk) i F+h(zk) oznaczają proporcje (ułamek) wartości ogona i głowy nie przekraczających poziomu wartości progowej zk. Kowariancja kodów określa jak często, dwie wartości tej samej cechy oddalone od siebie o wektor h, są jednocześnie nie większe od wartości progowej zk.
wariancja wartości kodów ogona wariancja wartości kodów głowy Analiza danych kodowanych– zmienna ciągła Eksperymentalna autokorelacja kodów
Analiza danych kodowanych– zmienna ciągła Eksperymentalny semiwariogram kodów Wariogram kodów ( 2I(h; zk) ) określa jak często dwie wartości cechy oddalone o wektor h znajdują się po przeciwnych stronach wartości progowej zk. Innymi słowy 2I(h; zk) daje wielkość frekwencji przejść między dwoma klasami wartości cechy jako funkcję odległości (h).
Analiza danych kodowanych– interpretacja graficzna Kowariancja i semiwariogram danych kodowanych można interpretować jako proporcję punktów (par danych), które występują w określonych częściach wykresu rozrzutu z przesunięciem: Kowariancja – obszar zaszrafowany poziomo, Semiwariogram – obszar zaszrafowany pionowo
Powierzchnie semiwariogramu danych kodowanych – zmienna b1_03b Dane niekodowane 50 percentyl = mediana 10 percentyl 90 percentyl
Analiza danych kodowanych– zmienna kategoryzowana Jeśli średnia wartość cechy z na obszarze należącym do określonej kategorii sk bardzo się różni od ogólnej średniej, to geometryczny układ tej kategorii wpływa na kształt i anizotropię semiwariogramu z. Strukturę ciągłości (zmienności) kategorii sk można scharakteryzować za pomocą semiwariogramu określonego na zakodowanych danych obecności/braku tej kategorii według wzoru:
Analiza danych kodowanych– zmienna kategoryzowana Eksperymentalny semiwariogram kodów dla kategorii sk jest obliczany według wzoru: Wariogram kodów ( 2I(h; sk) ) określa jak często dwie lokalizacje oddalone o wektor h należą do różnych kategorii sk`sk. Im mniejsze 2I(h; sk), tym ciągłość przestrzenna kategorii sk jest lepsza. Zasięgi i kształty semiwariogramów kierunkowych są odbiciem struktury geometrycznej kategorii sk.
Powierzchnie wariogramu dla grup zmiennej g-swir03b Grupa 1 Grupa 3 Grupa 2 Grupa 4
Analiza struktury przestrzennej dwóch zmiennych zi(u+h) „głowa” head „ogon” tail h Wartość cechy w punktach u i u + h dotyczy jednej zmiennej zi. zj(u+h) zi(u) „głowa” head „ogon” tail h Wartość cechy w punktach u i u + h dotyczy dwóch zmiennych zi i zj. zi(u)
Wykresy rozrzutu dwóch zmiennych z przesunięciem (crossh-scattergram) Dane cech b1_03b i b3n_03b ze zbioru Horbye3.dat Dane z punktów odległych od siebie o 0-22,5m Średnia odległość 17,645m Ilość par punktów: 74 kowariancja: 62,033 korelacja: 0,5063
Wykresy rozrzutu dwóch zmiennych z przesunięciem (crossh-scattergram) Dane cech b1_03b i b3n_03b ze zbioru Horbye3.dat Dane z punktów odległych od siebie o 22,5-67,5m Średnia odległość 51,381m Ilość par punktów: 640 kowariancja: 63,051 korelacja: 0,4165
Wykresy rozrzutu dwóch zmiennych z przesunięciem (crossh-scattergram) Dane cech b1_03b i b3n_03b ze zbioru Horbye3.dat Dane z punktów odległych od siebie o 67,5-112,5m Średnia odległość 92,41m Ilość par punktów: 1048 kowariancja: 49,056 korelacja: 0,29181
Wykresy rozrzutu dwóch zmiennych z przesunięciem (crossh-scattergram) Dane cech b1_03b i b3n_03b ze zbioru Horbye3.dat Dane z punktów odległych od siebie o 112,5-157,5m Średnia odległość 136,27m Ilość par punktów: 1472 kowariancja: 36,042 korelacja: 0,2139
Wykresy rozrzutu dwóch zmiennych z przesunięciem (crossh-scattergram) Dane cech b1_03b i b3n_03b ze zbioru Horbye3.dat Dane z punktów odległych od siebie o 157,5-202.5m Średnia odległość 181,33m Ilość par punktów: 1930 kowariancja: 21,321 korelacja: 0,1293
Wykresy rozrzutu dwóch zmiennych z przesunięciem (crossh-scattergram) h (m) – ij 0 – 0,807 17,6 – 0,506 51,4 – 0,416 92,4 – 0,292 136,3 – 0,214 181,3 – 0,129
Funkcja kros kowariancji Kowariancja między wartościami cech zi i zj odległymi o wektor h jest obliczona według wzoru: gdzie: N(h) to ilość par punktów odległych o wektor h, a mi-h i mj+hto średnie wartości zi „ogona”, i wartości zj „głowy”.
Funkcja kros kowariancji zmiennych b1_03b i b3n_03b Uporządkowany zbiór kroskowariancji Cij(h1), Cij(h2), … jest zwany eksperymentalną funkcją kros kowariancji
Kros korelogram Wariancja wartości „ogona” (zi) Wariancja wartości „głowy” (zj)
Kros korelogramy zmiennych b1_03bi b3n_03b ij=0,910 h=20,7m N=7
Efekt przesunięcia (lag effect) • Kros kowariancja obliczana w przeciwnych kierunkach jest zazwyczaj odmienna: Cij(h) Cij(-h) • Znacząca różnica pomiędzy Cij(h) i Cij(-h) może oznaczać, że jedna wartość jednej cechy zmienia się w przestrzeni z pewnym opóźnieniem w stosunku do zmian drugiej cechy. Zjawisko to nazywane jest efektem przesunięcia. • Jeśli brak jest klarownej fizycznej interpretacji tego zjawiska, lepiej je zignorować, gdyż może być skutkiem przypadkowej fluktuacji związanej z małą ilością par danych z których wyliczono kowariancję.
Efekt przesunięcia - przykład Badamy skażenie gleb wokół zakładu przemysłowego. Jest ono związane z emisjami gazów i pyłów z komina zakładu. Składnik A zanieczyszczeń związany jest z emisjami pyłowymi, a składnik B – gazowymi. Składnik A będzie zatem „wypadał” z chmury zanieczyszczeń szybciej niż składnik B. Zmiany przestrzenne obu składników będą miały podobną strukturę przestrzenną (bo są efektem tego samego zjawiska), ale z przesunięciem.
Czy nasze zmienne b1_03b i b3n_03b wykazują efekt przesunięcia?
Rozrzut gradientów zmian par punktów dwóch zmiennych • Kros kowariancja (kros korelacja) określa jak wygląda relacja wartości cechy zi w jednej lokalizacji w stosunku do wartości innej cechy zj w lokalizacji odległej o wektor h. • Zamiast porównywać parę danych (zi(u), zj(u+h)) możemy rozważyć porównanie pary przyrostów na dystansie h([zi(u), zi(u+h)], [zj(u), zj(u+h)]), które pokazują wspólną zmianę gradientów wartości zi- i zj- przy zmianie położenia o wektor h. • Jeśli obie cechy są skorelowane dodatnio, to przyrost (spadek) wartości zi- od punktu u do punktu u+h będzie związany ze wzrostem (spadkiem) wartości zj-. • A jeśli obie cechy są skorelowane ujemnie, to ….
zi(u+h) „głowa” head „ogon” tail h zj(u+h) „głowa” head zi(u) „ogon” tail h zj(u) Różnice wartości par punktów dwóch cech (h-increments) Analiza wspólnej zmienności cech zi i zj przy przemieszczeniu o dystans h
Wykresy rozrzutu z przesunięciem dla różnic (h-increments scatergrams) Cechy b1_03b i b3n_3b. Kierunek = 130°; tolerancja kierunku = 22,5°; szerokość pasa tolerancji = 100 m; odstęp = 45 m; tolerancja odstępu = 22,5 m h = 21,8 m h = 50,8 m
Wykresy rozrzutu z przesunięciem dla różnic (h-increments scatergrams) Cechy b1_03b i b3n_3b. Kierunek = 130°; tolerancja kierunku = 22,5°; szerokość pasa tolerancji = 100 m; odstęp = 45 m; tolerancja odstępu = 22,5 m h = 90,7 m h = 134,4 m
Wykresy rozrzutu z przesunięciem dla różnic (h-increments scatergrams) Cechy b1_03b i b3n_3b. Kierunek = 130°; tolerancja kierunku = 22,5°; szerokość pasa tolerancji = 100 m; odstęp = 45 m; tolerancja odstępu = 22,5 m h = 181,0 m h = 226,0 m
Kros semiwariogram Kros semiwariogram jest definiowany jako „połowa nie scentralizowanej kowariancji pomiędzy różnicami na dystansie h”. W przeciwieństwie do kros kowariancji i kros korelogramu kros semiwariogram jest symetryczny w stosunku do cech i wektora przesunięcia to jest zamiana ij na ji, oraz (h) na (-h) nie wpływa na jego wartość. Kros semiwariogram nie może zatem pomagać w wykrywaniu efektu „przesunięcia”. Poza tym kros semiwariogram może być obliczany jedynie dla takich lokalizacji, w których zmierzono obie cechy.
Funkcja kodyspersji Uporządkowany zbiór współczynników kodyspersji ij(h1), ij(h2), ... jest zwany eksperymentalną funkcją kodyspersji. Współczynnik kodyspersji można interpretować jako współczynnik korelacji pomiędzy zmianami cech na dystansie h, kiedy wykres rozrzutu rysowany jest w postaci symetrycznej, tj. każda para lokalizacji (u, u+h) pojawia się dwukrotnie, raz jako punkt o współrzędnych ([zi(u), zi(u+h)], [zj(u), zj(u+h)]), a drugi raz jako punkt ([zi(u+h), zi(u)], [zj(u+h), zj(u)]).
Funkcja kros kowariancji kodów Tak samo jak w przypadku analizy struktury przestrzennej jednej zmiennej, charakter i siła relacji między dwoma zmiennymi może zależeć o skali natężenia porównywanych cech: niskiej, średniej, czy wysokiej. Często wysokie wartości skorelowanych przestrzennie cech będące efektem tego samego zjawiska mogą wykazywać większe podobieństwo niż średnie i niskie, mające odmienną genezę. Przykładem może być zawartość toksycznych metali ciężkich w glebach. Ich niskie lub średnie stężenia mają najczęściej genezę naturalną, związaną z procesami wietrzeniowymi skał macierzystych. Wysokie koncentracje natomiast są zazwyczaj związane z antropogenicznymi emisjami.
Funkcja kros kowariancji kodów Gdzie: Fi-h(zik) i Fj+h(zjk') to proporcje wartości ogona zi i głowy zj, które nie przekraczają poziomów progowych zik i zjk'. Kros kowariancja jest miarą wspólnej dwu-punktowej skumulowaną frekwencji Fij(h;zik, zjk'), określającej jak często wartości zi i zj oddalone o wektor h są jednocześnie nie większe od określonych wartości progowych (zik, zjk').
Gdzie wariancja wartości kodów ogona i(u;zik) jest równa: Kros korelogram kodów Standaryzowaną postacią kros kowariancji kodów jest kros korelogram kodów:
Niezerowy udział w kros semiwariogramie kodów mają jedynie te pary danych, w których wartości obu cech zi, i zj są po przeciwnych stronach ich wartości progowych (zik,zjk'). Udział pary danych w może być pozytywny (+1) lub negatywny (-1), w zależności od tego czy wartości zi i zj wspólnie rosną (maleją) przy przejściu od u do u + h, lub też zmieniają się w sposób przeciwny. Kros semiwariogram kodów
Strukturę przestrzenną danych kodowanych dwóch cech badać można także w innych przypadkach: • i(u;zk) i i(u;zk') mogą dotyczyć tej samej ciągłej (ilościowej) cechyz, ale dla dwóch różnych wartości progowych zk i zk' • i(u;sk) i i(u;sk') odnoszących się do dwóch różnych kategorii sk i sk' • i(u;zk) i i(u;sk) odnoszących się cechy ilościowej i jakościowej (kategorii)
Standaryzowane kros semiwariogramy bezkierunkowe kodów b1_03b i b3n_03b