450 likes | 687 Views
GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja. Alfred Stach Instytut Paleogeografii i Geoekologii Wydział Nauk Geograficznych i Geologicznych UAM. Historia geostatystyki. Pierwsze koncepcje: lata 1938 – 1956
E N D
GEOSTATYSTYKAĆwiczenia dla III roku Geografiispecjalność - geoinformacja Alfred Stach Instytut Paleogeografii i Geoekologii Wydział Nauk Geograficznych i Geologicznych UAM
Historia geostatystyki • Pierwsze koncepcje: lata 1938 – 1956 • Sformułowanie podstaw teoretycznych nowej dziedziny nauki i zaproponowanie nazwy: 1962/1963 • Rozwój teorii – nauka dla wąskiej grupy „wtajemniczonych”: 1963 – 1989 • Pierwszy publicznie dostępny program geostatystyczny pracujący na komputerach osobistych (PC w systemie MS DOS) Geo-EAS: 1989 • Pierwsza edycja biblioteki algorytmów geostatystycznych GsLIB z publicznie dostępnym kodem źródłowym: 1992 • Żywiołowy rozwój teorii i zastosowań geostatystyki: po 1992 roku
Impulsy rozwoju geostatystyki • Geostatystyka to stosunkowo proste, ale masowe numeryczne przetwarzanie danych (głównie rachunek macierzowy). • Powszechne zastosowanie wymaga: • dostępności algorytmów, • względnie tanich komputerów do użytku osobistego wyposażonych w odpowiednią pamięć i moc obliczeniową • Oba te warunki zostały spełnione na przełomie lat 80 i 90 ubiegłego wieku
Publikacje z zakresu geostatystyki Rok 1992 Roczna ilość artykułów (NO. P), suma cytowań (TC), średnia impact factors (MIF), roczna ilość cytowań na pojedynczą publikację (ACPP) w okresie lat 1972 do 2005 Uwaga: “1” i “34” określają odpowiednio rok 1972 i 2005.
Kategorie oprogramowania geostatystycznego:I. specjalistyczne programy komercyjnie
Kategorie oprogramowania geostatystycznego: II. Procedury w specjalistycznym oprogramowaniu dla geologów(ocena zasobów złóż kopalin – głownie węglowodorów)
Kategorie oprogramowania geostatystycznego:III. Wbudowane procedury lub dodatkowe moduły w komercyjnych pakietach GIS
Kategorie oprogramowania geostatystycznego:III. Wbudowane procedury lub dodatkowe moduły w komercyjnych pakietach GIS
Kategorie oprogramowania geostatystycznego:IV. Wbudowane procedury lub dodatkowe moduły w pakietach GIS typu open source
Kategorie oprogramowania geostatystycznego:V. Wbudowane procedury lub dodatkowe moduły w komercyjnych pakietach statystycznych (matematycznych)
Kategorie oprogramowania geostatystycznego: V. Wbudowane procedury lub dodatkowe moduły w komercyjnych pakietach statystycznych
Kategorie oprogramowania geostatystycznego:VI. Geostatystyka w CRAN R – oprogramowanie statystyczne typu open source
Kategorie oprogramowania geostatystycznego:VI. Publicznie dostępne oprogramowanie z chronionym kodem źródłowym
Kategorie oprogramowania geostatystycznego:VII. Publicznie dostępne oprogramowanie typu open source
Kategorie oprogramowania geostatystycznego:VIII. Publikowane w Computers & Geosciences kody źródłowe algorytmów
Kategorie oprogramowania geostatystycznego:IX. Oprogramowanie dydaktyczne
Kategorie oprogramowania geostatystycznego:Podsumowanie • Specjalistyczne programy komercyjnie: Isatis, GS+ • Procedury w specjalistycznym oprogramowaniu dla geologów: RML-HereSIM, LevySIM, GMS, RockWorks • Wbudowane procedury lub dodatkowe moduły w komercyjnych pakietach GIS: Idrisi, ArcGIS, MapInfo • Wbudowane procedury lub dodatkowe moduły w pakietach GIS typu open source: SAGA, ILWIS • Wbudowane procedury lub dodatkowe moduły w komercyjnych pakietach statystycznych (matematycznych): GenStat, S-Plus, MatLab • Geostatystyka w CRAN R – oprogramowanie statystyczne typu open source: gstat, geoR • Publicznie dostępne oprogramowanie z chronionym kodem źródłowym: Vesper, VarioWin • Publicznie dostępne oprogramowanie typu open source: GsLib, S-GeMS, gstat, UNCERT • Publikowane w Computers & Geosciences kody źródłowe algorytmów • Oprogramowanie dydaktyczne: E(Z)-Kriging
Typowy przebieg analizy geostatystycznej Pozyskanie i wstępna weryfikacja danych Eksploracja danych: nieprzestrzenna i przestrzenna Budowa probalistycznego modelu struktury przestrzennej analizowanego cechy Weryfikacja modelu. Estymacja i ocena jej jakości. Symulacje. Optymalizacja
Oprogramowanie geostatystyczne które będziemy używać na ćwiczeniach • Oprogramowanie do modelowania geostatystycznego (S-GeMS – Stanford Geostatistical Modeling Software) wersja 2.0 • Biblioteka oprogramowania geostatystycznego GsLib v. 2 • Oprogramowanie do analiz i modelowania struktury przestrzennej danych dwuwymiarowych VARIOWIN v. 2.21 • Program LCMFIT2 służący automatycznego obliczania (dopasowania) Liniowych Modeli Koregionalizacji (Linear Coregionalization Model). • Program NEWCOKB3D będący nową, rozszerzoną wersją procedury estymacji za pomocą kokrigingu z biblioteki GsLib
Oprogramowanie uzupełniające • AFPL Ghostscript – interpretator języka PostScript i Ghostview – interfejs graficzny dla Ghostscript oraz Pstoedit – konwerter plików PS • Program do analizy graficznej danych przestrzennych 3Plotwersja 4.60 • Program do nauki podstaw algorytmu krigingu E{Z}-Kriging v. 0.2 • Skoroszyt Excela zawierający prosty przykład formuł obliczeniowych krigingu wraz z wizualizacją modelu semiwariancji, obserwowanych wartości i estymacji oraz wag.
S-GeMS (http://sgems.sourceforge.net/) • Oprogramowanie do modelowania geostatystycznego (S-GeMS – Stanford Geostatistical Modeling Software) wersja 2.0 opracowany na Uniwersytecie Stanforda w USA i opisany w publikacjach: Remy, N., 2004: Geostatistical Earth Modeling Software:User’s Manual. Stanford University, May 2004, 1-87. Remy, N., 2004: S-GEMS: The Stanford Geostatistical Modeling Software: atoolfor newalgorithmsdevelopment. [w:] O. Leuangthong andC. V. Deutsch (eds.), GeostatisticsBanff 2004, 865–871.
S-GeMS (http://sgems.sourceforge.net/) • S-GeMS jest oparty na bibliotece algorytmów geostatystycznych napisanych w ANSI C++ i dostępnej publicznie pod nazwą GsTL. • Umożliwia on modelowanie i wizualizację danych trójwymiarowych w oparciu zarówno o graficzny interfejs użytkownika, jak i w trybie znakowym (wsadowym). • Kod źródłowy jest powszechnie dostępny, a struktura programu umożliwia łatwe dodawanie nowych procedur w postaci „wtyczek” (plug-ins). • Ponieważ w S-GeMS wykorzystywane są jedynie biblioteki dostępne dla większości systemów operacyjnych istnieją jego wersje dla Unixa, Linuxa, Windows i Mac OSX • Oprócz klasycznych algorytmów estymacji i symulacji jedno/wielozmiennej S-GeMS zawiera również nowe metody symulacji w oparciu o statystyki wielopunktowe.
GsLIB v. 2 • Biblioteka oprogramowania geostatystycznego GsLib v. 2 opracowana na Uniwersytecie Stanforda (Kalifornia, USA) i opisana w publikacji: Deutsch, C.V., Journel, A.G., 1998: GSLIB: Geostatistical software library and user’s guide. Second Edition. Oxford University Press, New York, 1-369 + CD. http://pangea.stanford.edu/ERE/research/scrf/software (najnowszy kod źródłowy) http://www.gslib.com/(programy skompilowane dla DOS/Windows)
GsLib – informacje ogólne Programy należące do biblioteki GsLib v. 2.x są napisane w języku Fortran 90 i nie zawierają żadnych procedur graficznych i innych związanych z konkretnym systemem operacyjnym, czy też określoną platformą sprzętową. Dzięki temu mogą być kompilowane i uruchamiane zarówno na komputerach z DOS/Windows, MacOs czy też różnych odmianach UNIX. Jest to oprogramowanie typowo profesjonalne, przy tworzeniu którego główny nacisk nie był położony na łatwość użytkowania czyli tzw. „interfejs”, ale na przenośność, funkcjonalność i czytelność kodu źródłowego.
Biblioteka oprogramo-wania geostatys-tycznego GsLib v. 2 – przykład kodu źródłowego – Fortran 90
Biblioteka oprogramo-wania geostatys-tycznego GsLib v. 2 – przykład kodu źródłowego – Fortran 90
Biblioteka oprogramo-wania geostatys-tycznego GsLib v. 2 – przykład kodu źródłowego – Fortran 90
GsLib – zasady pracy Programy z biblioteki GsLib uruchamiane są z wiersza poleceń według ogólnego wzoru: „Ścieżka dostępu\Nazwa pliku programu wykonywalnego z biblioteki – Spacja – Ścieżka dostępu\Nazwa pliku wsadowego z parametrami” czyli na przykład: C:\Program Files\Statios\Gslib90\Histplt.exe C:\Praca\Pomiary04\Histplt.par
GsLib – zasady pracy Plik wsadowy zawierający zestaw danych potrzebnych do prawidłowego przeprowadzenia obliczeń – zwany jest plikiem parametrów. Jest to zwykły plik tekstowy mający domyślnie rozszerzenie *.PAR. Można go przygotować przy pomocy każdego edytora tworzącego pliki w „czystym” kodzie ASCII. W Windows najlepiej do tego celu używać Notatnika. Jeśli program należący do biblioteki GsLib uruchomi się bez podania nazwy i lokalizacji pliku parametrów, na ekranie pojawi się komunikat, zbliżony do zamieszczonego poniżej:
GsLib – zasady pracy Naciśnięcie klawisza Enter wygeneruje wtedy następujący komunikat: Program sygnalizuje błąd braku pliku z parametrami i jednocześnie informuje o wygenerowaniu wzorcowego (blank) takiego pliku, który może użytkownikowi posłużyć jako szablon do przygotowania własnej jego wersji.
GsLib – zasady pracy Uwaga! Utworzony wzorcowy plik parametrów ma nazwę identyczną jak program z biblioteki GsLib, który go wygenerował. Na przykład uruchomienie programu Histplt.exe bez podania nazwy pliku parametrów spowoduje powstanie pliku Histplt.par Ponowne uruchomienie programu Histplt.exe bez podania nazwy pliku parametrów, spowoduje że zostanie domyślnie załadowany i wykonany plik Histplt.par. Efektem tego będzie komunikat o błędzie, zawierający informację o braku pliku danych:
GsLib – program Histplt Program Histplt.exe oblicza podstawowe statystyki opisowe dla zmiennej i kreśli jej histogram. Poniżej zmieszczono wzorcowy plik parametrów programu Histplt.
Biblioteka oprogramo-wania geostatys-tycznego GsLib v. 2 – przykład pliku definiującegoobliczenia w trybie wsadowym(parametr file)
Oprogramowanie uzupełniającehttp://www-sst.unil.ch/research/variowin/index.html • Oprogramowanie do analiz dwuwymiarowych danych przestrzennych VARIOWIN v. 2.21 opracowany na Uniwersytecie w Lozannie, Szwajcaria, i opisane w publikacji: Pannatier, Y., 1996: VARIOWIN: Software for Spatial Data Analysis in 2D. Springer-Verlag, New York, 1-91.
Oprogramowanie uzupełniającehttp://www.ibrae.ac.ru/~mkanev/eng/3plot.html Program do analizy graficznej danych przestrzennych 3Plot wersja 4.60 autorstwa M. Kaniewskiego, E. Sawieljewej, S. Czernowa, W. Demianowa i W. Timonina z Instytutu Bezpeczeństwa Jądrowego z Moskwy i opisany w publikacji: Kaniewski, M., Czernow, S., Demianow, W., 1998: 3Plot Software: Advanced Spatial Data Plot. IBRAE, Moscow, 1-29.
Oprogramowanie uzupełniające • Program do nauki podstaw algorytmu krigingu E{Z}-Kriging v. 0.2 opracowany Dennisa J. J. Walvoorta z Uniwersytetu w Wagenigen, Holandia http://www.ai-geostats.org/index.php?id=114
Oprogramowanie uzupełniające • Wybrane programy (LCMFIT2, NEWCOKB3D), których kody źródłowe opublikowano w czasopiśmie Computers & Geosciences • http://www.iamg.org/index.php?option=com_content&task=category§ionid=19&id=44&Itemid=165 • http://207.176.140.93/documents/oldftp/VOL28/v28-08-01.zip • http://207.176.140.93/documents/oldftp/VOL25/v25-6-2.zip
Oprogramowanie narzędziowe • AFPL Ghostscript – interpretator języka PostScript • Ghostview – interfejs graficzny dla Ghostscript http://www.cs.wisc.edu/~ghost/ • Pstoedit – program do konwersji plików postscriptowych do innych formatów wektorowych http://www.pstoedit.net
http://www.geoinfo.amu.edu.pl/staff/astach/geostat01.htm Źródełko wiedzy i danych:
Format plików danychw oprogramowaniu geostatystycznym • W roku 1989 pojawia się pierwszy publicznie dostępny (bezpłatny) program komputerowy do analiz geostatystycznych sponsorowany przez USA EPA – Geo-EAS: Englund, E., Sparks, A., 1991: Geo-EAS 1.2.1 User’s Guide. EPA report #60018-91/008, EPA-EMSL, Las Vegas, NV.
Format plików danychw oprogramowaniu geostatystycznym • Wprowadzony przez twórców programu format plików danych został powszechnie zaakceptowany i jest stosowany w postaci uproszczonej (simplified Geo-EAS format) między innymi w S-GeMS, GsLib i Variowin • Pliki w tym formacie zapisywane są w postaci tekstowej (ASCII), czyli możliwej do edycji w każdym edytorze tekstowym niezależnie od platformy sprzętowej
Format plików danychw oprogramowaniu geostatystycznym • Pierwsza linia zawiera nazwę pliku. • W drugiej linii zapisuje się liczbę zmiennych(Nvar). • Od linii 3 to linii 3+Nvar znajdują się nazwy poszczególnych zmiennych, które nie mogą być dłuższe niż 10 znaków. • Kolejnych linie zawierają wartościpróbekze zmiennymi uszeregowanymi w tej samej kolejności w jakiej są one wymienione w nagłówku. Kolumny z wartościami mogą być rozdzielone spacjami lub znakami tabulacji. Nazwy próbek muszą być „otoczone” pojedynczym apostrofemnp. ‘próbka 1’, i muszą być na końcu wiersza. • Wszystkie wartości równe lub większe od 1.0E+31 są traktowane jako brakujące (Variowin).