300 likes | 437 Views
Transform ácie obrazu PCA, CCA Vegetačné indexy. PCA, CCA. Analýza hlavných komponentov (PCA – Principal Component Analysis) Analýza kanonických komponentov (CCA – Canonical Component Analysis)
E N D
PCA, CCA • Analýza hlavných komponentov (PCA – Principal Component Analysis) • Analýza kanonických komponentov (CCA – Canonical Component Analysis) • často používané metódy kompresie údajov, ktoré sú redundantné (nadbytočné) – napr.multispektrálne údaje DPZ • buď ako vylepšovacie operácie pred vizuálnou interpretáciou údajov alebo ako predspraco- vanie pred automatizovanou klasifikáciou
PCA • ortogonálna transformácia n-rozmerného spektrálneho priestoru, pri ktorej sú osi rotované, pričom nové osi I a II sú rovnobežné s osami elipsy a ich počiatok je v priemere rozloženia údajov • os I definuje smer prvého hlavného komponentu (PC1), os II smer druhého hlavného komponentu (PC2)
PCA • dôležité je, že údaje pozdĺž smeru osi I majú väčší rozptyl ako údaje pozdĺž originálnych osí A a B • údaje pozdĺž osi II majú už menší rozptyl • os II je kolmá na os I – údaje sú nekorelované • tak to pokračuje aj pri ďalších komponentoch (PC3, PC4 až PCn)
PCA • PC1 zahŕňa najväčšie percento celkového rozptylu scény a nasledujúce komponenty obsahujú postupne menší a menší podiel celkového rozptylu • to umožňuje redukciu rozmerov (počtu pásiem) originálnych údajov, čo zefektívňuje klasifikačný proces znížením výpočtovej náročnosti • napr. Landsat MSS – 4 pásma • z toho PCA – PC1 vyjadruje 97,6 % rozptylu PC2 vyjadruje 1,8 % rozptylu spolu PC1 + PC2 = 99,4 % • kompresia - zníženie rozmerov údajov zo 4 na 2
PCA • matematicky – transformácia originálnych údajov na nové údaje: DNI = a11DNA + a12DNB DNII = a21DNA + a22DNB pričom DNI DNII- dig.hodnoty v novom (PC) súr.systéme DNA DNB- dig.hodnoty v pôvodnom súr.systéme a11 a12 a21 a22– koeficienty transformácie (štatistické veličiny známe aj ako vlastné vektory – eigenvectors – alebo hlavné komponenty) • v skratke sú PC obrazové údaje jednoduchými lineárnymi kombináciami originálnych údajov vynásobené týmito koeficientmi
PCA • štandardizované premenné - všetky pásma majú rovnakú váhu • pre účely kompresie údajov • neštandardizované premenné - väčšiu váhu majú pásma s väčším rozptylom hodnôt (napr. IČ) • pri analýze časových rád • výsledky PCA – okrem PC obrazov aj variančno-kovariančná matica, korelačná matica, vlastné čísla (eigenvalues), vlastné vektory (eigenvectors)
PCA • kovariancia je štatistická miera vzťahu medzi dvomi náhodnými premennými • meria rozsah spoločnej premenlivosti dvoch náhodných premenných (porovnáva sa rozptyl) • korelácia takisto meria zhodu medzi veličinami • rozdiel je v tom, že korelačné koeficienty sú škálované (v intervale od -1 do 1), kým kovariancie sú neškálované • z variančno-kovariančnej a korelačnej matice môžeme zistiť, ktoré pásma navzájom najviac korelujú
PCA • vlastné čísla (eigenvalues) vyjadrujú, koľko informácií (rozptylu) je uchovávaných v jednotlivých komponentoch (PC1 až PCn) • vlastné vektory(eigenvectors) zase určujú, z ktorých pásiem koľko informácií v jednotlivých komponentoch pochádza, čo vidno aj pri grafickom porovnaní pôvodných pásiem a nových komponentov • vlastné vektory indikujú smer nových osí • výsledné PC obrazy sa obyčajne označujú ako hlavné komponenty (čo je teoreticky nesprávne, pretože hlavné komponenty sú v skutočnosti vlastné vektory – koeficienty transformácie)
PCA • PC obrazy môžeme analyzovať v podobe ČB obrazov alebo v podobe farebnej syntézy • V DPZ PCA1 zvyčajne reprezentuje albedo (odraz od pôdneho povrchu) a PCA2 odraz od vegetačnej pokrývky (pozitívne hodnoty v NIR a negatívne vo viditeľnom pásme)
CCA • PCA sa používa najmä vtedy, ak nemáme k dispozícii predbežné informácie o scéne • ak ich máme, je vhodné použiť CCA • pri CCA sa údaje najskôr rozdelia do tried a následne sa nové osi sta- novia tak, aby samaximali- zovala oddeliteľnosťtýchto tried a zároveň minimalizoval rozptyl v rámci týchto tried • týmto spôsobom sa dajú zvýrazniť objekty, ktoré nie sújasne rozoznateľné v pôvodných údajoch
Redukcia počtu kanálov IČ • niektoré klasifikačné metódy dovoľujú použiť len obmedzený počet spektrálnych kanálov • v takých prípadoch je potrebná redukcia počtu kanálov: výber kanálov pomocou PCA, CCA výber kanálov podľa histogramu R G
Vegetačné indexy • zdravá vegetácia – veľké rozdiely v odraznosti vo viditeľnom a blízkom IČ pásme • rastlinné pigmenty (hlavne chlorofyl) absorbujú energiu vo viditeľnom pásme (najmä pre účely fotosyntézy) - najviac absorpcie v R a B pásme, preto sú listy zelené • energia v blízkom IČ pásme sa na fotosyntézu nepoužíva, preto ju listy odrážajú • na veľkom kontraste v odraznosti medzi R a NIR pásmom sú založené vegetačné indexy • sú aplikovateľné na snímky s nízkym aj vysokým rozlíšením, ktoré majú R a NIR pásmo (NOAA, Landsat, SPOT...)
Vegetačné indexy • využívajú sa na kvantitatívne meranie zelenej biomasy • biofyzikálne merania, ktoré dokumentujú typ vegetácie, produktivitu a funkčné zdravie, sú potrebné pre manažment zdrojov, boj proti odlesňovaniu a dezertifikácii aj pre udržateľný rozvoj poľnohospodárstva a vidieka • využívajú sa ako ukazovatele celkovej environmentálnej zmeny, pri monitorovaní poľnohospodárstva a hodnotení jeho dopadov na krajinu • hodnotenie krajinnej pokrývky v lokálnych aj globálnych mierkach
Vegetačné indexy • delenie vegetačných indexov: • pomerové (slope-based) – aritmetické kombinácie • vzdialenostné (distance-based) – rozdiel odraznosti pixela od odraznosti holej pôdy c) ortogonálne tranformácie – Tasseled Cap R R NDVI PVI NIR NIR
Pomerové vegetačné indexy • RATIO, NDVI, RVI, NRVI, TVI, CTVI, TTVI Ratio Vegetation Index (RATIO) – Rouse et al.(1974) • minimalizácia vplyvu topografie (podiel) • citlivý na delenie nulou • nelineárna mierka – výsledný obraz nemá normálne rozdelenie Normalized Difference Vegetation Index (NDVI) – Rouse et al. (1974) • lineárna mierka, redukované delenie nulou • hodnoty od -1 do 1, 0 znamená žiadnu vegetáciu
Pomerové vegetačné indexy Transformed Vegetation Index (TVI) – Deering et al.(1975) • konštanta 0,5 na elimináciu negatívnych hodnôt (platí, len ak sú hodnoty NDVI > -0,5) • odmocnina pre normálne rozdelenie Corrected Transformed Vegetation Index (CTVI) – Perry a Lautenschlager (1984) • úplne eliminuje negatívne hodnoty • výsledný obraz je rovnaký (lepší) ako NDVI
Pomerové vegetačné indexy Thiam's Transformed Vegetation Index (TTVI) – Thiam (1997) • ignoruje prvý zlomok v CTVI kvôli tomu, že je obraz často „zašumený“ (nadhodnotenie zelene) • odmocnina pre normálne rozdelenie Ratio Vegetation Index (RVI) – Birth a McVey (1968), opak indexu RATIO - má rovnaké nedostatky ako TVI - je jednoduchší Normalized Ratio Vegetation Index (NRVI) – Barret a Guyot (1991) - ako NDVI, tvorí normálne rozdelenie
Vzdialenostné vegetačné indexy • PVI, DVI, AVI, SAVI, TSAVI, MSAVI, WDVI • hlavným cieľom je eliminovať efekt svetlosti pôdy v prípadoch, keď je vegetácia riedka a pixel obsahuje zmes zelenej vegetácie a pôdneho podkladu • dôležité najmä v suchých a polosuchých oblastiach • pôdna línia (soil line) – získame ju lineárnou regresiou NIR a R pásma na pixloch holej pôdy Y = a + b.X a – posunv smere osi y b– sklon • jedna skupina VI však berie ako nezávislú premennú R pásmo, kým druhá NIR pásmo
Vzdialenostné vegetačné indexy Perpendicular Vegetation Index (PVI) – Richardson a Wiegland (1977) • 4 kroky: • rovnica pôdnej línie Rg5 = a0 + a1Rg7 Rg5 – Y súradnica (R) Rg7 – X súradnica (NIR) a1 – sklon pôdnej línie a0 – posun línie v smere Y 2. rovnica línie kolmej k pôdnej línii Rp5 = b0 + b1Rp7 b0 = Rp5 – b1Rp7 Rp5 – odraznosť v R pásme Rp7 – odraznosť v NIR pásme b1 = -1/a1
Vzdialenostné vegetačné indexy 3. Nájdenie priesečníka línií (súradnice Rgg5, Rgg7) 4. Výpočet vzdialenosti medzi priesečníkom a súradnicami pixla (Rp5, Rp7) - podľa Pytagorovej vety
Vzdialenostné vegetačné indexy • vylepšené indexy PVI: PVI1 – Perry a Lautenschlager (1984) • originálny PVI je výpočtovo náročný a nerozlišuje medzi pixlami naľavo a napravo od pôdnej línie (vodné plochy od vegetácie) - vegetácia je len napravo a – posun pôdnej línie b – sklon pôdnej línie PVI2 – Walter a Shabaani (1991), Bannari et al.(1996)
Vzdialenostné vegetačné indexy PVI3 – Qi et al. (1994) PVI3 = aNIR - bRED Difference Vegetation Index (DVI) – Richardson a Wiegland (1977) DVI = gMSS7 – MSS5 g – sklon pôdnej línie MSS7 – odraznosť v NIR pásme MSS5 – odraznosť v R pásme • hodnoty rovné 0 indikujú holú pôdu, hodnoty < 0 vodu a hodnoty > 0 vegetáciu (rovnako ako PVI1) Ashburn Vegetation Index (AVI) – Ashburn (1978) AVI = 2MSS7 – MSS5 • meranie zelenej rastúcej vegetácie • koeficient 2 – len ak je MSS7 6-bitový a MSS5 8-bit
Vzdialenostné vegetačné indexy Soil-Adjusted Vegetation Index (SAVI) – Huete (1988) ρNIR – odraznosť v NIR pásme ρRED – odraznosť v R pásme L – faktor pôdy • L sa mení s odraznosťou pôdy (farba a svetlosť) - výber L závisí na hustote vegetácie, ktorú chceme analyzovať (pre riedku vegetáciu L=1, pre stredne hustú L=0,5, pre veľmi hustú L=0,25)
Vzdialenostné vegetačné indexy Transformed Soil-Adjusted Vegetation Index (TSAVI1) – Baret et al. (1989) a – sklon pôdnej línie b – posun pôdnej línie • podľa autorov je koncept SAVI správny len ak sú konštanty pôdnej línie a=1 a b=0 • špeciálne navrhnutý pre polosuché oblasti (nie je veľmi vhodný pre oblasti s hustou vegetáciou) TSAVI2– Baret et al. (1991) • konštanta 0,08 na minimalizáciu vplyvu jasu pôdy
Vzdialenostné vegetačné indexy Modified Soil-Adjusted Vegetation Index (MSAVI1) Modified Soil-Adjusted Vegetation Index (MSAVI2) - Qi et al. (1994) • založené na modifikácii faktora L pre SAVI • lepšia korekcia jasu pôdneho podkladu pre rôzne podmienky vegetačnej pokrývky L = 1 – 2γNDVI*WDVI γ – sklon pôdnej línie • odstraňuje „šum“ pôdy a hodnoty väčšie ako 1
Vzdialenostné vegetačné indexy Weighted Difference Vegetation Index (WDVI) – Richardson a Wiegland (1977) WDVI = ρNIR – γρRED • aj keď je jednoduchý, je rovnako efektívny ako väčšina indexov založených na sklone • váženie R pásma sklonom pôdnej línie maximalizuje signál vegetácie v NIR pásme a minimalizuje vplyv jasu pôdy • indexy založené na vzdialenosti predstavujú významné kvalitatívne a kvantitatívne zlepšenie pre všetky typy aplikácií, špeciálne pre suché a polosuché oblasti
Ortogonálne transformácie • na monitorovanie zelenej vegetácie môžeme použiť druhý komponent PCA Green Vegetation Index (GVI) of the Tasseled Cap – Kauth a Thomas (1976) • druhé zo 4 nových pásiem získaných z Landsat MSS snímok GVI = -0,386MSS4 + -0,562MSS5 + 0,600MSS6 + 0,491MSS7
Ortogonálne transformácie • výsledkom Tasseled Cap transformácie sú 4 indexy: B – soil brightness index – index svetlosti pôdy G – greennes vegetation index – index zel.vegetácie Y – yellow stuff index – index žltých materiálov N – non-such – ostatné zložky • Crist et al. (1986) odvodil potom koeficienty Tasseled Cap transformácie pre Landsat TM: GVI = -0,2728TM1 -0,2174TM2 – 0,5508TM3 + 0,7221TM4 + 0,0733TM5 – 0,1648TM7 • výsledkom sú 3 indexy: B – brigthness – index svetlosti (urb.územia) G – greenness – index zelenej vegetácie (biomasa) W – wetness – index vlhkosti
Ortogonálne transformácie Misra's Green Vegetation Index (MGVI) – Wheeler et al. (1976) a Misra et al. (1977) • ekvivalent GVI, druhé zo 4 nových pásiem získaných transformáciou PCA z Landsat MSS MGVI = -0,386MSS4 - 0,530MSS5 + 0,535MSS6 + 0,532MSS7 • cieľom je vytvoriť druhý komponent PCA • použitie globálnych koeficientov však nezaručuje presný výsledok, ktorý môže byť špecifický • koeficienty korešpondujú s vlastnými vektormi z PCA • ak poznáme tieto vektory, vlastný MGVI index môžeme vypočítať pomocou mapovej algebry