460 likes | 646 Views
Jellemzők és leírók. Vámossy Zoltán 2004 (Gonzales – Woods könyve alapján). Leírók - cél. Szegmentálás eredményeként a képet régiókra bontottuk, ezeket szeretnénk tömör formában leírni Forgatásra, eltolásra, skálázásra invariáns jellemzőket keresünk Leírási módok:
E N D
Jellemzők és leírók Vámossy Zoltán 2004 (Gonzales – Woods könyve alapján)
Leírók - cél • Szegmentálás eredményeként a képet régiókra bontottuk, ezeket szeretnénk tömör formában leírni • Forgatásra, eltolásra, skálázásra invariáns jellemzőket keresünk • Leírási módok: • A régió határaihoz kapcsolódó jellemzőkkel (külső reprezentánsok) • A régió belső jellemzőivel Példa: a régió leírható a határának hosszával • Külsőt leíró jellemzőket használunk, ha a régió alakján van a hangsúly • Belső jellemzőket használunk, ha pl. a textúra, vagy a szín a fontos
Egyszerű leírók • Átlagos intenzitás • Minimális intenzitás • Maximális intenzitás • Korlátozott körülmények között alkalmazhatóak
Külső leírók Javarészt Gonzales-Woods könyv alapján
Lánckód (chain code) • Lánckód: Határ leírására szolgál, egyenes szakaszok sorozatával • 4-es, vagy 8-as szomszédságot használunk • A szegmensek iránya kódolt • Módszer: • Kövessük a határt szisztematikusan - óramutató járásának irányában: (d+5)mod 8: köv. pixel iránya (0..7) • Iránykódot (Freeman) rendelünk minden pixelpárhoz
Lánckód (chain code) • Példa: 003333232212111001 • Problémák: • A lánckód függ a startponttól • Az objektum orientációjával változik • Mintavételezéssel változik
Differenciált lánckód • Tekintsük körkörös sorozatnak a lánckódot és számoljuk ki a differenciákat két egymás utáni elemre vonatkozóan • Példa (nem az ábráé): 10103322 • Differenciált lánckód: 33133030 Számoljuk ki az ábrára!
Alakszám (shape number) • Alakszám: a differenciák körkörös sorozatában a legkisebb • n-ed rendű alakok: n elemű lánckóddal leírható zárt alakok lehetséges formái • Példa (6-od rendű alak): • Lánckód 003221 • Differencia: 303303 • Alakszám: 033033
Alakszám - feladat • Határozzuk meg a alak rendjét, lánckódját, alakszámát
További problémák a lánckóddal • Nagyon hosszú lehet (Megj.: a kerület közelítése a+b*√2, ahol a párosok száma, b páratlanok száma a lánckódban) • Zajokra nem toleráns • Megoldás: • Válasszunk nagyobb rácsot (gridet) • A határpontokat a legközelebbi rácselemhez rendeljük • Gyakorlatban nem túl hatékony megoldások az eddigiek: jobb a poligonokkal való közelítés (pl. legkisebb négyzetek + Split and merge)
Módosított alakszám • Rögzítsük le az alakszám rendjét (pl. n=18) • Határozzuk meg a fő és melléktengelyt (lásd később) és azok arányát = excentricitást • Határozzuk meg azt minimális befoglaló téglalapot, melynek alakszám rendje = n, és oldalainak aránya = excentricitás • Számoljuk ki az alakszámot ebben a rácsban
Lánc simítás • Cél: lánc rövidítése, határ vékonyítása • Legyen S1 és S2 két egymás utáni irány a lánckódban és legyen m=min(S1, S2), valamint M=max(S1, S2). Iterálással hajtsuk végre a következőt (Zamperoni: Methoden der digitalen Bildverarbeitung, Vieweg-Verlag 1991): M-m m új irány 0 - nincs változás 1 - nincs változás 2 páratlan m+1, m+1 2 páros m+1 3 páratlan m+1 3 páros m+1 4 - törlendő m és M 5 pártalan m-1 5 páros m-2 6 páratlan m-1, m-1 6 páros m-1 7 - nincs változás
Szignatúra (Signature) • Signature: a határ 1-D függvényszerű leírása • Különböző módszerek léteznek • Pl. a a súlyponttól mért távolság a szög függvényében
Signature • Invariáns eltolásra, függ a forgatástól és a skálázástól • Forgásra invariáns, ha mindig ugyanazt a startpontot választjuk • A középponttól a legtávolabbi pont ilyen lehet • Skálázásra invariáns, ha normalizáljuk egy tartományra x’=(x-xmin)/(xmax-xmin)
Signature Más signature-k: • A határon haladva az út függvényében az érintő iránya egy referenciairányhoz képest • Meredekség sűrűség függvény: érintőfüggvény hisztogramja • Az egyenes szegmensek csúcsok lesznek a hisztogramban
Átmérő, befoglaló téglalap, … • Átmérő: a határpontokat tekintve, annak a két pontnak a távolsága, amelyek legtávolabb helyezkednek el • A főtengelyekkel (lásd később) egyező állású befoglaló téglalap oldalainak aránya invariáns • Háromszög hasonlóság– Legyen P1, P2, P3 három pont a határon, és d(Pi; Pj) jelölje az Euklideszi távolságát a két pontnak ésS = d(P1; P2) + d(P2; P3) + d(P3; P1) a háromszög kerülete A következő két vektor – hosszak aránya a kerületre – invariáns (d(P1; P2)/S;d(P2; P3)/S)
Fourier leírók • Adott N pontból álló rendezett határ: (x0, y0), (x1, y1) … (xN-1, yN-1) • Minden koordinátát kezeljünk komplexként s(k) = xk + j yk • A DFT: a(u) Fourier leírók • Fourier leíró komplex • Az inverz Fourier eredménye:
Fourier leírók • Ha csak P < N tagot veszünk figyelembe (azaz a magas frekvenciás részleteket: sarokpontokat elhagyjuk), akkor közelítjük az eredeti alakot kevesebb adattal: • A Fourier leírók nem invariánsak, de: • A Fourier leírók nagysága invariáns a forgatásra
Fourier leírók • Eltolásra invariáns, ha a(0) = 0-t állítunk be • Skálázásra invariáns: a’(n) = a(n)/abs(a(1))-t használunk
Fourier leírók - példa • Bináris kép 1090 pontos határral
Fourier leírók - példa • 546, 110, 56, 28, 14 darab Fourier leíróval a kép
Fourier leírók • Invariáns
Régiók geometriai jellemzői Mubarak Shah könyve alapján
Cél • Cél: olyan jellemzők keresése, amelyek invariánsak eltolásra, forgatásra, skálázásra, még általánosabb esetben affin transzformációkra, a jellemzők a régiók belső tulajdonságain alapuljanak
Régió tulajdonságok • Terület • Középpont (súlypont) • Momentumok, nyomatékok • Kerület • Kompaktság • Orientáció • Nyomatéki főtengelyek aránya • Topológiai leírók • Textúra
Terület • Pixelek száma a régióban
Súlypont • Tömegközéppont, vagy súlypont
Nyomatékok (momentumok, inerciák) • Folytonos eset • Diszkrét eset i = p+qnyomaték
Egyértelműség tétele • Az{mpq} nyomatékokat egyértelműen meghatározza aB(x,y)kép, és fordítva,B(x,y)képet egyértelműen meghatározzák{mpq} nyomatékok • Megjegyzés: mpq-t gyakran Mpq-val is jelölöm, illetve fordítva is igaz
Centrális nyomatékok • Eltolás invariánsak • Ha ugyanaz a régió a kép különböző részein jelenik meg, ugyanazokat a centrális nyomatékokat kapjuk eredményül Régió súlypont
Hu-féle nyomatéki invariánsok • Eltolásra, forgatásra, skálázásra invariáns
Kerület és kompaktság • Kerület: A régió határán lévő pixelek száma. (Definíció: Határpixel, amelynek legalább egy szomszédja háttérpixel.) • Megj.: néha másképpen értelmezik (1 és √ 2-es távolságok összege) • Kompaktság • A kör a legkompaktabb kerület terület
Régió orientáció – főtengely transzformáció r r r r r B Nyomatéki főtengely, vagy inercia tengely
Régió orientáció – Principal Axis Transformation (PAT) Másodrendű nyomatéki főtengely
Régió orientáció Egyenes egyenlete Minimalizálandó
Régió orientáció (70. o.) (x,y) r (x0,y0) s • Behelyettesítve(x0,y0)-tr2-be • Differenciálva sszerint és ez 0 • Behelyettesítves(x0,y0)-ba
Régió orientáció (71. o.) szerinti derivált 0 ahol a súlypont Áttérve kapjuk vagy ahol
Régió orientáció (hosszúkás objektum esetén jó!) Szélsőérték, ha a szög szerinti derivált 0
Példa Határozzuk meg a területet, súlypontot, nyomatékokat, kompaktságot, kerületet, orientációt!
Topológiai jellemzők • A lyukak száma a régióban: H • Balról, jobbról, lentről, fentről … • Csatlakozó elemek száma: C • Lásd a régió szegmentálásnál (Connected component algorithm) • Rekurzív algoritmus • Kétszeres soros, végigjárásos módszer (ekvivalencia osztályokkal) • Euler szám: E = C – H • Invariáns: eltolásra, elforgatásra, skálázásra
Javasolt irodalom • Chapter 3-4, Mubarak Shah, “Fundamentals of Computer Vision”, 1992 (book.pdf) • Gonzales, Woods: “Digital Image Processing”, Prentice Hall, 2002