790 likes | 1.09k Views
Luento 2: Spatiaalimallintaminen kulttuuri- ja aluemaantieteessä. Moranin I - indeksi. Luentomateriaali: Mika Siljander ja Jani Vuolteenaho. Esim. ”Vanhukset Helsingissä” - spatiaalianalyysejä. Johdatusta aiheeseen.
E N D
Luento 2: Spatiaalimallintaminen kulttuuri- ja aluemaantieteessä MoraninI - indeksi Luentomateriaali: Mika Siljander ja Jani Vuolteenaho
Johdatusta aiheeseen • - geoinformatiikan yhteydessä hyödynnetään erityyppisiä kvantitatiivisia tutkimusmenetelmiä • - spatiaalianalyysi (spatial analysis, SA) = yleisnimitys paikkaan sidotuille aineistoille tarkoitetuista kvantitatiivisista tutkimusmenetelmistä • -muuttujakeskeisyys (kvantitatiiviselle tutkimukselle tyypillinen tutkimusote); lähtökohtana haluttua ilmiötä mittaavat muuttujat tietyssä spatiaalisessa havaintojoukossa • maantieteessä SA-termiä käytetty 1950- ja 1960-lukujen ”kvantitatiivisesta vallankumouksesta” alkaen
Luennon tavoite: • - antaa yleiskuva ja esimerkkejä yleisesti hyödynnetyistä spatiaalianalyysin menetelmistä yhteiskunta- ja kaupunkimaantieteessä (samoja menetelmiä hyödynnetään myös mm. luonnonmaantieteessä) • Esitellä yleisesti: - Eksploratiiviset (kuvailevat menetelmät) - spatiaalianalyysi menetelmät
Määritelmiä ja termistöä • Analyysi = erittely, jäsentäminen, uuden merkityksellisen tiedon tuottaminen • - analyyttiset Miksi?- jaMitä jos?- kysymykset • vrt. deskriptiiviset Mitä?- ja Missä? –kysymykset • - tarkka rajanveto usein vaikeaa • Spatiaalinen analyysi = tilaa koskeva analyysi
Eräs spatiaalianalyysiin määritelmistä • Spatial analysis is in many ways the crux of GIS, because it includes all of the transformations, manipulations, and methods that can be applied to geographic data to add value to them, to support decisions, and to reveal patterns and anomalies that are not immediately obvious – in other words, spatial analysis is the process by which we turn raw data into useful information. [Longley et al. 2001]
Spatiaalianalyysillä: -suhteellisen pitkät perinteet maantieteessä osa paikkatietoanalyyseista perinteisiä maantieteessä käytettyjä menetelmiä, 1950- ja 1960-lukujen ”kvantitatiivisen vallankumouksen ajoilta” (esim. klassinen lähimmän naapurin menetelmä pisteaineistolle; Nearest neighbour analysis) Tieteenalanäkökulma
Myös muilla tieteenaloilla harjoitetaan spatiaalianalyysia • aluetaloustieteen teoriat (A. Weber, Christaller, Lösch) • operaatiotutkimus ja verkostot (graph theory) • spatiaalinen tilastotiede / geostatistiikka • Geologia (Kriging interpolointi)
Järjestelmänäkökulma • geoinformatiikan menetelmät tutkimusprosessin eri vaiheissa: • paikkatietojärjestelmien toiminnallinen määrittely • 1. tiedon tallennus • 2. tiedon ylläpito ja hallinta • 3. tietoon kohdistuvat kyselyt • 4. tiedon analyysi • 5. tiedon visualisointi • 6. päätöksenteon tuki • - rajanveto varsinaisen spatiaalianalyysin sekä esim. kyselyjen ja overlay-menetelmien välillä on usein hankalaa
1. Geometristen kohdetyyppien mukaan: • piste-, viiva-, alue- ja pinta-aineistoille soveltuvat analyysimenetelmät
2. analyysin kohdistuvuuden mukaan: • Esim. jako rasterikarttataso operaatioiden mukaan - (Tomlin 1990) • globaalit operaatiot (global)- esim. trendipinnan muodostaminen havaintopistejoukon kaikkia kohteita kuvaavan polynomifunktion avulla • vyöhykeoperaatiot (zonal)- esim. keskiarvojen laskeminen taajamille ja ei-taajamille tai esim. keskikorkeuden laskeminen eri maankäyttötyypeille • naapurusto-operaatiot (focal)- esim. korkeusmallin keskiarvoistus operaatio - FOCALMEAN(DEM) • lokaalit operaatiot (local)- esim. Sini-muunnos (alkuperäiselle pikselin arvolle tehdään Sin-operaatio pikseli pikseliltä)
3. matemattisen lähestymistavan mukaan: • Jako (Haining 2003) mukaan • karttamallintaminen - karttatasot muuttujina • matemaattinen mallinnus - esim. jokisysteemien hydrologinen mallinnus, sijaintioptimoinnit • spatiaalinen tilastoanalyysi - tilastomenetelmiä jotka huomioivat spatiaalisen datan erityispiirteet
4. Menetelmän teknisen/matemaattisen vaativuuden mukaan: • Jako (Longley et al. 2001) mukaan • ominaisuus- ja sijaintitietokyselyt • geometrialaskelmat • muunnosoperaatiot • kuvailevat tunnusluvut ja diagrammit • Optimoinnit (verkosto-optimointi) • hypoteesien testaus Yksinkertainen, helppo Monimutkainen, vaikea
- Spatiaalianalyysissa voidaan erottaa 3 menetelmäkokonaisuutta (pätee myös yleisemmin kvantitatiiviseen tutkimukseen) • Eksploratiiviset eli kuvailevat menetelmät • Tilastollinen päättely ja monimuuttujamenetelmät • Matemaattinen mallintaminen (ei käsitellä tässä yhteydessä)
Eksploratiivinen (kuvaileva) spatiaalianalyysi • ESDA = Explorative Spatial Data Analysis • explore = tutkia, tunnustella, etsiä (jotakin ei-tunnettua) • esim. paikkatietokyselyt tutkimuksen alkuvaiheessa eksploratiivista tutkimista tyypillisimmillään • tilastotieteen näkökulmasta ymmärretään tutkimuksen ”esivaiheeksi”
Eksploratiivinen (kuvaileva) spatiaalianalyysi • tavoitteena tiivistää paikkaan sidottua informaatiota helpommin tulkittavaan muotoon • kvantitatiivinen kuvailu, descriptive statistics • voidaan selvittää mm. vaihteluvälejä, ääriarvoja, keski- ja hajontalukuja, jakauman muotoa (normaalisuus, vinous, ym.), muuttujien välisiä riippuvuuksia
Eksploratiivinen (kuvaileva) spatiaalianalyysi • alueellisten jakaumien tutkiminen ollut perinteisesti maantieteen ”menetelmällistä ydintä” • yleensä tutkimusasetelmana: havaintoyksiköt spatiaalisia (esim. maakunnat, kaupunginosat, rakennukset) => tarkastellaan näiden välisiä eroja ja yhtäläisyyksiä eri ominaisuustietojen suhteen • toisaalta voidaan tutkia myös spatiaalisia muuttujia (etäisyys, läheisyys, ryhmittyminen, jne.)
Eksploratiivinen (kuvaileva) spatiaalianalyysi • eksploratiiviset menetelmät voidaan jaotella esittämistavan mukaan seuraavasti: • taulukot ja diagrammit • tunnusluvut • teemakartografiset esittämistavat
Taulukot • - 1-, 2- tai useampiulotteisista jakaumia esittävät frevenssitaulukot (”suorat jakaumat”) ja ristiintaulukot • - taulukkomuodossa voidaan myös keski- ja hajontalukuja, laadullisia kuvauksia, jne. • - esim. maantieteessä erityisesti aluevertailut
Diagrammit Liikeyritysten määrän väheneminen etäisyyden funktiona CBD:stä
Diagrammit Spatial autocorrelation: Moran’s I correlogram.
Tunnusluvut • - klassiset tilastotunnusluvut (populaatiota tai otosta kuvaavat) käyttökelpoisia esim. alueellisissa vertailuissa • pyritään tiivistämään tietoa jonkin määrällisen muuttujan jakaumasta (keski- ja hajontaluvut) tai muuttujien yhteisvaihtelusta (esim. korrelaatiokertoimet) • muuttujan mitta-asteikon huomioiminen
Tilastollisia perustunnuslukuja eri mitta-asteikoille (Spearmanin korrelaatiokerroin) (Pearsonin korrelaatiokerroin) Kts. esim. http://www.fsd.uta.fi/menetelmaopetus/intro.html#intro
Spatiaalianalyysi esimerkkejä Tilastokeskuksen 250m ruututietokanta asukkaat-aineistolle - ”Vanhukset Helsingissä muuttuja”
Lähimmän naapurin indeksi - nearest neighbor index • (maantieteen ”klassista” menetelmäarsenaalia) - suhdeluku, joka kertoo ovatko aineiston havaintopisteet ryhmittyneet tiettyyn spatiaaliseen järjestykseen: jakaantuneet satunnaisesti/karttavat toisiaan? • - lasketaan jakamalla aineiston keskimääräinen etäisyys lähimpään naapuripisteeseen satunnaisesti ryhmittyneelle aineistolle lasketulla vastaavalla arvolla- ARVO: alle 1 = klusteroitumista; arvo 1 = aineisto satunnaisesti ryhmittynyt; yli 1 = havainnot hajallaan- z-arvo (ns. keskihajontapoikkeama suhteessa satunnaisesti ryhmittyneeseen ja normaalisti jakautuneeseen oletusaineistoon) kertoo, kuinka todennäköisesti aineisto on klusteroitunutta • - käyttökelpoinen pisteaineistoille; ottaa huomioon pelkästään sijainnin (esiintymisen) • - analyysin ei liity ominaisuustietoa = 1 > 1 < 1
The Average Nearest Neighbor Distance “The Average Nearest Neighbor Distance ArcGIS tool measures the distance between each feature centroid and its nearest neighbor's centroid location. It then averages all these nearest neighbor distances. If the average distance is less than the average for a hypothetical random distribution, the distribution of the features being analyzed are considered clustered. If the average distance is greater than a hypothetical random distribution, the features are considered dispersed. The index is expressed as the ratio of the observed distance divided by the expected distance (expected distance is based on a hypothetical random distribution with the same number of features covering the same total area).” If the index is less than 1, the pattern exhibits clustering; if the index is greater than 1, the trend is toward dispersion or competition.
ArcGIS - Average Nearest Neighbor (ArcGIS Toolbox > Spatial Statistics Tools) Calculates a nearest neighbor index based on the average distance from each feature to its nearest neighboring feature.
Helsingin asukkaat 250m ruutujen keskipiste - ANN-analyysi Executing: AverageNearestNeighbor hkiruudut_250m.shp "Euclidean Distance" false # 0 0 0 Start Time: Mon Jan 19 13:12:59 2009 Running script AverageNearestNeighbor... Average Nearest Neighbor Summary • Observed Mean Distance: 257,501302 • Expected Mean Distance: 203,702309 • Nearest Neighbor Ratio: 1,264106 • Z Score: 22,909765 • p-value: 0,000000
Sentroidi / painotettu sentroidi – Mean Center / Weighted Mean Center • (maantieteen ”klassinen” menetelmä) • ilmaisee polygonin, viivan tai pistejoukon maantieteellisen keskipisteen tasokoordinaatistossa • analyyseissa enemmän käyttöarvoa tietyllä ominaistiedon muuttujalla painotetulla sentroidilla (voidaan laskea esim. suomenkielisen / ruotsinkielisen /muunkielisen väestön maantieteellinen keskipiste ja verrata näitä keskenään) • kun esim. tunnetaan asuinrakennuksia kuvaavien pisteiden sijaintikoordinaatit (x ja y) sekä asukkaiden lukumäärä (w) kussakin pisteessä, voidaan väestöpainopiste laskea väestömäärällä painotettujen koordinaattiarvojen keskiarvona, eli seuraavasti: • x = Σi wi xi / Σi wi , missä x = väestöpainopisteen x-koordinaattiy = Σi wi yi / Σi wi , missä y = väestöpainopisteen y-koordinaatti
ArcGIS 9.3 – Spatiaalinen sentroidiMean Center / Weighted Mean Center (Spatial Statistics Tools) • violetti piste = painottamaton • musta piste = vanhusten lukumäärällä painotettu
Spatiaalinen (keski)hajonta • voidaan laskea vastaavalla tavalla keskimääräisenä etäisyytenä sentroidista • sovellettu mm. väestötieteessä, muuttoliiketutkimuksessa ja historiallisessa maantieteessä ajallisten muutosten tarkasteluissa
ArcGIS 9.3 – Spatiaalinen (keski)hajontaStandard Distance (Spatial Statistics Tools) Measures the degree to which features are concentrated or dispersed around the geometric mean center
Standard Distance analyysi Helsingissä • Sininen polygoni = painottamaton • violetti polygoni = vanhusten lukumäärällä painotettu
Standard Deviational Ellipse (Spatial Statistics) • “Measuring the trend for a set of points or areas is to calculate the standard distance separately in the x and y directions. These two measures define the axes of an ellipse encompassing the distribution of features. The ellipse is referred to as the standard deviational ellipse, since the method calculates the standard deviation of the x coordinates and y coordinates from the mean center to define the axes of the ellipse. The ellipse allows you to see if the distribution of features is elongated and hence has a particular orientation. While you can get a sense of the orientation by drawing the features on a map, calculating the standard deviational ellipse makes the trend clear. You can calculate the standard deviational ellipse using either the locations of the features or using the locations influenced by an attribute value associated with the features. The latter is termed a weighted standard deviational ellipse.”
Spatiaalisen riippuvuuden tunnusluvut(spatiaalinen autokorrelaatio ja sen laskeminen ArcGIS -ohjelmistolla)
spatiaalista autokorrelaatiota määrittäessä: tarkastellaan muuttujan (ominaisuus)arvojen samankaltaisuutta etäisyyden suhteen • ”läheisyys lisää samankaltaisuutta” – päteekö havaintoaineistoon? • positiivinen ja negatiivinen spatiaalinen autokorrelaatio • autokorrelaation globaalit ja lokaalit (naapurusto)indeksit ilmiöiden kasautumisen tarkasteluissa • globaalit indeksit: kuvaavat ”tilajärjestystä” (samansuuruisten havaintoarvojen klusteroitumista tai sijainnillista heterogeenisyyttä) koko tarkasteltavalla alueella • lokaalit eli paikalliset indeksit: kuvaavat yksittäisten kohteiden samankaltaisuutta (klustereihin kuuluminen) tai erilaisuutta (”outlierit”) suhteessa naapureihin
Hypoteettinen esimerkki spatiaalista autokorrelaatiota kuvaavan globaalin indeksin laskemisesta rasteriaineistolle
Spatiaalisen autokorrelaation laskemisesta: • - perusideana spatiaalisen autokorrelaation laskemisessa (attribuutti- ja sijaintiosasta koostuva) matriisipari, jossa kohteiden ominaisuustietojen samankaltaisuutta/eroavuutta suhteutetaan kohde kohteelta niiden läheisyyteen • - ominaisuustietojen osalta valittavaan indeksiin ja sen laskentatapaan vaikuttaa muuttujien mitta-asteikko (eri indeksejä)- sijainnin samankaltaisuutta kuvataan ns. painoarvomatriisissa, jossa läheisyyden määrittämisessä käytetään eri laskentamenetelmiä- laskennalliset toteuttamistavat vaihtelevat
Yleisesti käytettyjä spatiaalisen autokorrelaation indeksejä • - Moranin globaali indeksi (I): kuvaa tilajärjestystä koko aineistossa- Moranin paikallinen indeksi (I): löytää aineiston yksittäiset klusterit/outlierit positiiviset arvot (0–1) ilmentävät samankaltaisuutta (clusters), negatiiviset arvot (-1–0) ilmentävät läheisten havaintojen poikkeavuutta • - Gearyn indeksi (c) (0–2)- Getis-Ord indeksi (G, G*) • - jne.
Moranin globaalin I-indeksin laskukaava • Lähde: http://www.lpc.uottawa.ca/ • publications/moransi/moran.htm
Globaali indeksi (koko karttatason spatiaalinen autokorrelaatio)- Global Morans I ArcGIS -ohjelmistolla Analyysi-ikkunassa oleellinen tieto:Moran I; Z-score; p-value Huom! Analyysissä POISTA Ruksi kohdasta ”Close the Dialog…”
ArcGIS:n ArcToolboxin työkaluja paikallisen spatiaalisen autokorrelaation laskuun – Local Morans I (Spatial Statistics Tools):