650 likes | 981 Views
GII-01. Geografinių duomenų šaltiniai. 2007 m. kovo 15 d. Š ios dienos darbotvarkė. Šiandien aptarsime geografinių duomenų šaltinius, ir tai, kaip jie įtakos jūsų geografinę analizę
E N D
GII-01 Geografinių duomenų šaltiniai 2007 m. kovo 15 d.
Šios dienos darbotvarkė • Šiandien aptarsime geografinių duomenų šaltinius, ir tai, kaip jie įtakos jūsų geografinę analizę • Yra dviejų tipų duomenų šaltiniai, pirminiai ir antriniai duomenys, tad išnagrinėsime šių tipų duomenų šaltinių panaudojimo pranašumus ir trūkumus • Baigę šią temą galėsite atskirti tų dviejų tipų duomenų šaltinius ir sugebėsite nustatyti, kurie yra tinkami jūsų studijai
Geografinių duomenųšaltiniai Pirminiai ir antriniai erdviniai duomenys • Erdviniai duomenys gali būti suskirstyti į pirminius (surinktus jūsų ir jūsų organizacijos) ir antrinius (surinktus kitos organizacijos) • Jūs esate puikiai susipažinę su pirminiais duomenimis arba turite galimybę užduoti klausimus juos rinkusiems žmonėms • Dėl antrinių duomenų galbūt būtų galimybė susisiekti su duomenis rinkusia organizacija, tačiau dažniausiai turėsite pasikliauti prie duomenų paketo pridėtais metaduomenimis
Geografinių duomenųšaltiniai Pirminių duomenų pavyzdžiai • Žemėtvarkos matavimų duomenys (t. y. surinkti techeometru ir pan.) • Įvesti naudojant koordinačių geometriją (COGO) • Mokslinių tyrimų duomenys (t. y. mokslinės apklausos) • GPS imtuvu surinkti duomenys • Vietovės stebėjimai
Geografinių duomenųšaltiniai COGO Šaltinis: http://www.cogosoftware.com
Geografinių duomenųšaltiniai Antriniai erdviniai duomenys • Surinkti išorinės agentūros • Neįmanoma sužinoti visų detalių apie duomenis, taigi, turime pasikliauti metaduomenimis. Agentūros reputacija taip pat gali būti svarbi • Išorinės agentūros gali būti labai didelės (pvz. NRCan arba USGS) arba labai mažos (pvz., „Džo rūsio GIS krautuvėlė“). Duomenų kokybė gali būti nuo puikios iki siaubingos
Geografinių duomenųšaltiniai Antriniai šaltiniai • Duomenys gali būti pateikti bet kokiu iš įvairiausių formatų, nuo įprastų (JPEG) iki mįslingų (pvz., 9 takelių juosta, BSQ (nuosekliojo diapazono - Band Sequential)) • Didžiąją dalį duomenų sudarys GIS duomenų failai arba nuotolinių tyrimų atvaizdai, nors galite gauti ir popierinius žemėlapius, mokslinių tyrimų rezultatus, tekstinius failus arba Excel lenteles
Antriniai šaltiniai • Internetas tapo pačiu efektyviausiu būdu duomenims platinti • HTTP arba FTP persiuntimas • Elektroninis paštas • Ar galite patikėti, kad paskutinio praėjusio amžiaus dešimtmečio vidurys buvo laikai, kai viskas buvo rašoma į magnetinę juostą ir siunčiama per kurjerį?
Pagrindiniai terminai • Pirminiai šaltiniai • Antriniai šaltiniai
GII-01 Geografinių duomenų tipai 2007 m. kovo 20 d.
Šios dienos darbotvarkė • Šiandien aptarsime du svarbiausius geografinių duomenų tipus ir kuo jie skiriasi geografinės informacijos saugojimo būdų požiūriu • Yra du pagrindiniai duomenų tipai – vektoriniai duomenys ir rastriniai duomenys. Panagrinėsime šių tipų duomenų panaudojimo pranašumus ir trūkumus • Baigę nagrinėti temą galėsite atskirti šiuos du duomenų tipus ir mokėsite nustatyti, kokiais atvejais kiekvienas duomenų tipas tiks jūsų analizei
Geografinių duomenų tipai GIS elementų tipai • Diskretieji elementai • Turi nenutrūkstamą aiškią ribą • Pvz., vandentiekio šuliniai, keliai, savivaldybių ribos • Tolydieji elementai • Tolydžiai kinta visame plote • Neturintys ribų dalykai • Pvz., oro temperatūra, vietovės aukštis
Geografinių duomenų tipai Erdviniai duomenų modeliai • Du pagrindiniai GISmodeliai • Rastrinis modelis • Geriausiai tinka tolydžiai kintantiems duomenims vaizduoti • Ne toks geras linijoms, taškams, plotams • Vektorinis modelis • Geriausiai tinka vaizduoti linijoms, taškams, plotams • Topologija turi būti suformuota, ir performuojama erdvinėms operacijoms
Geografinių duomenų tipai Ką galite gauti? • Vektoriniai failai • Topografiniai žemėlapiai, kadastro duomenys, teminiai duomenys, komunaliniai duomenys... • Daug įvairių formatų (DXF, DWG, DLG, TIGER, ArcExport (E00), IGDS, SDTS, GML, KML)… • Rastriniai failai • DEM, LIDAR, aviaciniai skeneriai(CASI), Landsat, SPOT, QuickBird, IRS, ERS, Radarsat, SRTM, Ikonos, TERRA, GOES, skenuotos aeronuotraukos, ortofotonuotraukos...
Geografinių duomenų tipai Vektorinis modelis • Objektų vietai parodyti ir erdvei suskirstyti naudoja taškus linijas ir poligonus • Tik diskretieji duomenys • Kadangi visi diskretieji duomenys suformuoti vien tik iš taškų, duomenys gali būti nesudėtingai ištempti arba perprojektuoti • Topologija leidžia iškraipyti taškų padėtį suformuojant kitokį vaizdą nepakeitus erdvinių ryšių tarp taškų, linijų ir poligonų
Geografinių duomenų tipai Taškai • Taškas • Pavienė vieta erdvėje, užrašyta viengubu arba dvigubu tikslumu
Geografinių duomenų tipai Linijos • Linija • Iš eilės sutvarkytas rinkinys, kurį sudaro • bent 2 taškai • Galiniai taškai vadinami mazgais, tarpiniai taškai – viršūnėmis Mazgas Viršūnė Viršūnė Mazgas
Geografinių duomenų tipai Linijos • Linija • Linijos su kitomis linijomis gali jungtis tik mazguose
Geografinių duomenų tipai Poligonai • Sudaryti bent iš vienos linijos • Apima plotą • Turi plotą, perimetrą ir saugomus atributus Plotas = 5353 kv.m. Tipas = pelkė
Geografinių duomenų tipai Mazgai ir viršūnės • Kiekvienas mazgas ir viršūnė yra taškas, nors ne kiekvienas taškas būtinai yra mazgas ar viršūnė, • t. y., taškai gali būti atskiri ir nepriklausyti linijai • Dar yra pseudomazgai • Mazgas jungia bent 3 linijas • Pseudomazgas jungia tik 2 linijas ir gali būti pakeistas viršūne
Plotas = 5353 kv.m. Tipas = pelkė Geografinių duomenų tipai Klausimas: kada 2 linijų mazgas nėra pseudomazgas? • Atsakymas: kai linija jungiasi pati su savimi, sudarydama atskirą poligoną • Linija turi turėti pradžios ir pabaigos taškus • Jei linija jungiasi su savimi, mazgas būtinas, taigi, jis nėra pseudomazgas
Geografinių duomenų tipai Vektorinio duomenų modelio pranašumai ir trūkumai • Pranašumai: tikslus, dažnai sukuria patrauklesnius žemėlapius, negu rastras, nėra dantytų ribų, kompaktiškas saugoti • Trūkumai: turi būti suformuota topologija, perdangos ir analizė reikalauja galingo kompiuterio, sunku suvokti sudarymo principus, norėdami redaguoti, vartotojai turi „paimti“ visą žemėlapio lapą
Geografinių duomenų tipai Rastrinis modelis • Duomenys suskaidyti į geografines matricas • Paprastai kiekvienas laukelis yra kvadrato formos • Kiekvienas laukelis dažnai vadinamas gardele (angl. „pixel“, „picture element“ santrumpa) • Kiekvienai gardelei priskiriama reikšmė • Ji gali reikšti atributą arba vietovės aukštį • Geografinės matricos pradžia, orientacija, eilučių ir stulpelių skaičius bei gardelės išsaugomi • Tai leidžia greitai apskaičiuoti kiekvienos gardelės vietą • Rastrinės reikšmės koduojamos • Rodant rastrą kiekviena reikšmė priskiriama atitinkamai vietai
Geografinių duomenų tipai Rastro apibrėžimas Eilutės: 10 Stulpeliai: 10 Eilutės dydis (X): 5 m Eilutės dydis (Y): 5 m Pradžia: X = 503265,509381534 Y = 5345033,13003949 Posūkis: 340 laipsnių tikslus
Geografinių duomenų tipai Rastro reikšmių kodavimas • Neprarandančio informacijos duomenų glaudinimo metodai reikiamai saugojimo vietai sumažinti: • Eilutės ilgio kodavimas (Run-length encoding – RLE): kiekvienoje eilutėje koduojama kiekvienos kategorijos stulpelių pradžia ir pabaiga • Grandininis kodavimas: koduojamos kiekvienos ištisinės srities išorinės ribos • Blokinis kodavimas: plotas suskirstomas 2n dydžio kvadratais, pradedant nuo didžiausio • Saugoma tik kvadratų pradžia ir dydis • Panašu į kvadratų medžius (quadtree), tik skiriamoji geba ne begalinė
Geografinių duomenų tipai Rastro kūrimas • Kiekviena rastro gardelė gali turėti tik vieną reikšmę • Tačiau kas patenka į gardelę? • Dominavimo taisyklė: pasirenkama reikšmė, „užklojanti“ didžiąją gardelės dalį • Svarbos taisyklė: pasirenkama svarbiausia reikšmė • Pvz., siaura upė turės pirmumą prieš ūkininko laukus abipus jos
Geografinių duomenų tipai Dominavimo taisyklė Galutinis rastras Geografinės matricos išdėstymas Pirminiai duomenys
Geografinių duomenų tipai Svarbos taisyklė Galutinis rastras Geografinės matricos išdėstymas Pirminiai duomenys
Geografinių duomenų tipai Rastrinio modelio pranašumai ir trūkumai • Pranašumai • Labai paprastai skaičiuojama analizė (kai geografinės matricos pradžia, orientacija, eilučių ir stulpelių skaičiai ir gardelės dydis tokie patys) • Nesunkiai suprantamas principas • Trūkumai • Failai gali būti labai dideli • Rastras visuomet yra aproksimuotas
Geografinių duomenų tipai Skaitmeniniai reljefo modeliai Skelbiama leidus Dr. Michael Govorov
Geografinių duomenų tipai Aprėptys (Coverages) • Vektorinė duomenų struktūra, apie 1982m. • Saugo erdvinę, atributų ir topologinę informaciją • Erdviniai duomenys saugomi dvejetainiuose failuose, atributai laikomi INFO lentelėse • Kartais vadinama „geosąryšine“ struktūra
Geografinių duomenų tipai GRID • Geografinė matrica panaši į aprėptį, tačiau pritaikyta rastriniams duomenims • Kiekviena geografinė matrica turi susietą reikšmių atributų lentelę (Value Attribute Table – VAT) kuri tvarkoma kaip INFO lentelė, panašiai kaip poligonų atributų lentelė (Polygon Attribute Table – PAT)
Geografinių duomenų tipai Kontūro failai (Shapefiles) • Vektorinė duomenų struktūra, apie dešimtojo dešimtmečio vidurį (ArcView 2.0) • Paprastesnis formatas be topologinių sąryšių • Negali užtikrinti erdvinio vientisumo, pavyzdžiui, persiklojimų nebuvimo arba tarpų kadastre • Gali turėti persiklojančių elementų, žiedinių kiaurymių • Vienas elemento tipas kontūro faile: taškas, linija, poligonas; sudėtiniai elementai • Atributai saugomi dBase faile • Taip pat geosąryšinė struktūra • Ko gero labiausiai paplitęs erdvinių duomenų formatas
Geografinių duomenų tipai Geografinė duomenų bazė • Elementų duomenų rinkinių (taškų, linijų ir poligonų), lentelių, rastro ir TIN rinkinys • Visi erdviniai, atributų, lentelių ir topologiniai duomenys saugomi vienoje sąryšinėje duomenų bazėje • Realizuotas standartinėse SDBVS taikomosiose programose: Access, DB2, Oracle, SQL Server • Kaip duomenų bazės dalį apima „elgseną“
Pagrindiniai terminai • Diskretieji elementai • Tolydieji elementai • Vektoriai • Mazgai • Viršūnė • Briauna • Pseudomazgai • Taškai • Linijos • Poligonai • Rastras • Laukeliai • Pradžios taškas • Orientacija • Eilutės ilgio kodavimas • Grandininis kodavimas • Blokinis kodavimas • Aprėptys (Coverages) • GRID • Kontūro failai (Shapefiles)
GII-01 Geografinių duomenų kokybė 2007 m. kovo 18 d.
Šios dienos darbotvarkė • Šiandien aptarsime su geografinių duomenų kokybe susijusius klausimus ir kaip ji gali paveikti jūsų atiliekamą geografinę analizę • Yra daug įvairių būdų įvertinti duomenų kokybę, ir keletą iš šių metodų panagrinėsime • Baigę nagrinėti šią temą žinosite, kur žiūrėti vertinant duomenų kokybę. Taip pat įgysite žinių užtikrinti, kad visi duomenys, kuriuos parengiate ar modifikuojate, būtų ir kokybiški duomenys
Geografinių duomenų kokybė Preciziškumas ir tikslumas • Kasdieniuose pokalbiuose šie terminai dažnai vartojami pakaitomis • Moksle kiekvienas terminas turi labai konkrečią ir nesutampančią reikšmę • Tikslumas matuoja vieną dalyką, o preciziškumas – visiškai kitą
Geografinių duomenų kokybė Preciziškumas • Preciziškumas reiškia mažiausią galimą skalės padalą, naudojamą kiekvienam stebėjimui matuoti • Ar mes matuojama iki artimiausių 1/4” ar 1/18”? • Ar mes matuojame iki artimiausio decimetro, centimetro ar milimetro? • Jei temperatūra išmatuota kaip 10,3° C ± 0,1 laipsnio, ji 5 kartus preciziškesnė, negu tuo atveju, kai išmatuota kaip 10,3° C ± 0,5 laipsnio
Geografinių duomenų kokybė Tikslumas • Tikslumas nurodo, kaip arti tikrosios reikšmės yra kiekvienas stebėjimas • Jei per šiandieninę radijo stoties A prognozę pranešė, kad temperatūra bus 10° C, o per radijo stoties B prognozę – kad bus 14° C, tai jei tikroji temperatūra bus 11° C, radijo stotis A bus tikslesnė už B Šaltinis: http://www.cogosoftware.com
Geografinių duomenų kokybė Vaizdinė analogija (b) Mažas tikslumas Didelis preciziškumas (d) Didelis tikslumas Didelis preciziškumas (a) Mažas tikslumas Mažas preciziškumas c) Didelis tikslumas Mažas preciziškumas Iliustracija skelbiama leidus Hill and Petrucci, General Chemistry, Third Edition. Prentice-Hall
Geografinių duomenų kokybė Leistinumas • Duomenų leistinumas nurodo duomenų išsamumą ir tinkamumą • Duomenų leistinumo klaidų pavyzdžiai būtų datos, kuriose yra 14-as mėnuo, tekstas skaičių laukeliuose arba atitinkamo lauko reikšmės ribas viršijančios reikšmės • Kad padėtų kontroliuoti duomenų leistinumą, gali būti apibrėžti domenai ir laukų tipai
Geografinių duomenų kokybė Metaduomenys • Pažodžiui metaduomenys reiškia „duomenis apie duomenis“ • Metaduomenyse saugoma svarbi informacija apie tai: • Kas surinko duomenis • Data, kada duomenys buvo surinkti • Mastelis, kuriuo rinkti duomenys • Kokiam panaudojimui duomenys skirti • Teisinės atsakomybės apribojimai • Duomenys, kuriuos gaunate iš interneto, dažnai turi pridėtus metaduomenis
Geografinių duomenų kokybė Metaduomenų pavyzdys Identification_Information: • Citation: • Citation_Information: • Originator: U.S. Environmental Protection Agency Publication_Date: 19980801 Title: • State Soil Geographic (STATSGO) Database for CONUS, Alaska, and Hawaii in BASINS Publication_Information: • Publication_Place: Washington, D.C. Publisher: U.S. Environmental Protection Agency Online_Linkage: • For BASINS model and hydrographic data <http://www.epa.gov/OST/BASINS/> Description: • Abstract: • The STATSGO database is a digital general soil association map developed by the National Cooperative Soil Survey. It consists of a broad based inventory of soils and nonsoil areas that occur in a repeatable pattern on the landscape and that can be cartographically shown at the scale mapped. The soil maps for STATSGO are compiled by generalizing more detailed soil ...
Geografinių duomenų kokybė Metaduomenų pavyzdys Purpose: • STATSGO depicts information about soil features on or near the surface of the Earth. These data are collected as part of the National Cooperative Soil Survey. STASGO is designed primarily for regional, multi-county, riverbasin, state, and multi-state regional planning, management, and monitoring. Supplemental_Information: • Intended_use_of_data: This data set was prepared to support the U.S. EPA BASINS (Better Assessment Science Integrating Point and Nonpoint Sources) System, Version 2.0. • References_Cited: • U.S. Department of Agriculture. 1975. Soil Taxonomy: A basic system of soil classification for making and interpreting soil surveys. Soil Conserv. Serv., U.S. Dep.Agric. Handb. 436. • U.S. Department of Agriculture. 1992. Keys to Soil Taxonomy. SMSS Technical Monograph No. 19. Soil Surv. Staff, Soil Conserv. Serv…. Time_Period_of_Content: • Time_Period_Information: • Single_Date/Time: • Calendar_Date: 19940000 Currentness_Reference: Publication Date
Geografinių duomenų kokybė Metaduomenys • Kaip GIS profesionalas turite parengti metaduomenis kiekvieną kartą, kai kuriate ar redaguojate naują duomenų rinkinį, kurį naudos kiti
Geografinių duomenų kokybė Klaidos plitimas • Du klaidų tipai – sisteminės ir atsitiktinės • Sistemines klaidas lengviau pastebėti ir ištaisyti • Atsitiktines klaidas pastebėti ir ištaisyti sudėtinga, ir jos gali sukelti duomenų rinkinio neapibrėžtumą • Neapibrėžtumas paprastai išreiškiamas procentais, žyminčiais neapibrėžtų duomenų procentinę dalį
Geografinių duomenų kokybė Klaidos plitimas • Kai du tam tikro neapibrėžtumo laipsnio duomenų rinkiniai jungiami tarpusavyje, neapibrėžtumas auga • Kai du duomenų rinkinius naudojame GIS analizei, neapibrėžtumai susijungia, dėl to rezultatų duomenų rinkinio neapibrėžtumo laipsnis yra didesnis • Tai vadinama klaidos plitimu
Pagrindiniai terminai • Preciziškumas • Tikslumas • Leistinumas • Domenai • Laukų tipai • Metaduomenys • Sisteminė klaida • Atsitiktinė klaida • Neapibrėžtumas • Klaidų plitimas
GII-01 Erdvinių duomenų bazės 2007 m. kovo 20 d.