300 likes | 492 Views
Geometria obrazu Wykład 4. Grafy sąsiedztwa. Grafy definiowane przez różne obszary Minimalne drzewo rozpinające Drzewa czwórkowe. Podział obrazu. Metody podziału. Grafy sąsiedztwa. Definicja.
E N D
Geometria obrazuWykład 4 • Grafy sąsiedztwa. • Grafy definiowane przez różne obszary • Minimalne drzewo rozpinające • Drzewa czwórkowe. • Podział obrazu. • Metody podziału
Grafy sąsiedztwa. Definicja. Grafem sąsiedztwa dla zbioru n punktów P w przestrzeni metrycznej nazywamy graf o wierzchołkach w P, do którego krawędź pq należy wtedy i tylko wtedy, gdy spełnione są pewne geometryczne warunki. Definicja K-najbliższym grafem sąsiedztwa jest graf, w którym krawędź pq istnieje, gdy odległość między p i q należy do k najmniejszych odległości z p do innych wierzchołków z P.
grafy bez czworokątów grafy bez trójkątów grafy acykliczne grafy planarne Grafy definiowane przez różne obszary.
Definicja. Minimalne drzewo rozpinające MST(G) grafu G = (V, E), którego każda krawędź e ma wagę w(e), jest spójnym, acyklicznym grafem rozpiętym na zbiorze V i minimalnej sumie wag krawędzi. Algorytm Kruskala. posortuj krawędzie według wag; dobierz kolejne krawędzie w porządku niemalejącym tak, aby nie tworzyły cyklu; Algorytm Prima. wybierz dowolny wierzchołek; dołącz do wybranego zbioru kolejny najbliższy wierzchołek;
Lemat. Algorytmy te działają odpowiednio w czasie O(|E| log |V|) oraz O(|E| + |V| log |V|). Definicja. MST(S) rozpięte na punktach ze zbioru S w Rn jest drzewem o wierzchołkach w S i minimalnej sumarycznej długości krawędzi. Lemat. MST(S) rozpięte na punktach z SR2 można znaleźć w czasie O(n log n), a w przestrzeni d-wymiarowej (d > 2) w O(nd/2).
Podział (segmentacja) obrazu. Podziałem obrazu nazywamy proces podziału cyfrowego obrazu na wiele fragmentów (zbiorów pikseli, zwanych też superpikselami). Celem podziału jest uproszczenie lub zmiana reprezentacji obrazu na uwypuklającą jakąś własność (np. podział na barwy) lub łatwiejszą do analizy (np. dla obliczeń równoległych). Podział obrazu jest zwykle wykorzystywany do lokalizacji obiektów lub ich brzegu na obrazie. Innymi słowy, jest to proces przydzielania pikselom etykiet taki, że piksele z takimi samymi etykietami mają wspólne własności.
Metody segmentacji możemy podzielić na kilka klas w zależności od rodzaju informacji określającej podział lub innych uwarunkowań. Możemy wyróżnić następujące metody: • obszarowe: - działu wodnego, - podziału na kracie (podziału i łączenia), - rozrostu obszaru, • krawędziowe, • punktowe: - klastrowe, - progowe, • hybrydowe – łączące w sobie powyższe metody, • inne (automatyczne, półautomatyczne, zależne od wymiaru, samouczące się).
Metoda działu wodnego. Możemy wyróżnić tu dwie podmetody: • opadu deszczu (rainfall), • zatapiania (sinking). (geomatura.pl)
Metoda opadu deszczu. Dla każdej pary sąsiednich (choć niekoniecznie) pikseli liczymy wagi łączących je krawędzi odpowiadające euklidesowej odległości wektorów RGB w tych punktach: wij = dij = ||RGBi- RGBj||. Otrzymujemy tzw. graf lokalnego sąsiedztwa. Licząc gradienty w tak określonym polu dostajemy następujący podział (kierunek spływu wody z gór): [G.Economou et al. „Godesic distance and MST based image sgmentation”]
Otrzymujemy spójne składowe odpowiadające zlewiskom, które wyznaczają podział obrazu (niebezpieczeństwo stanowi duża „dziura”, wokół której są mało różniące się obiekty – wtedy przy podziale obrazu mogą zostać „wessane” – stają się nierozróżnialne). [G.Economou et al. „Godesic distance and MST based image sgmentation”]
Metoda zatapiania. Tak jak poprzednio tworzymy graf lokalnego sąsiedztwa, obliczamy MST i określamy na nim miarę, np. • suma wag wij na ścieżce łączącej dane punkty lub • maksimum z wag na takiej ścieżce. „Zatapiamy” zlewiska do pewnego poziomu. Obraz dzieli się na obszary zatopione i nie. W zależności od wybranej strategii otrzymujemy różne wyniki. [G.Economou et al. „Godesic distance and MST based image sgmentation”]
Zastosowanie grafu najbliższego sąsiedztwa. Wierzchołkami grafu są poszczególne piksele, a wagą krawędzi minimalna odległość między odpowiednimi punktami (x,y,r,g,b) . Badamy otoczenia pikseli o promieniu r. Takie podejście daje lepszy wynik od poprzedniego np. następującym przypadku: [P.F.Felzenszwalb et al. „Efficient graph-based image segmentation”]
Inny przykład. [P.F.Felzenszwalb et al. „Efficient graph-based image segmentation”]
Drzewo czwórkowe (quadtree). • Drzewo czwórkowe dla n-elementowego zbioru punktów P (card(P) oznacza licz-nosć zbioru P) definiujemy w następujący sposób. Niech Q :=[x1,x2][y1,y2] będzie kwadratem. • Jeśli card(P) 1, to drzewo czwórkowe zawiera pojedynczy liść, w którym pamię-tamy zbiór P i kwadrat Q. • W przeciwnym przypadku dzielimy kwa-drat Q na ćwiartki QNE, QNW, QSW, QSE względem xm := (x1+x2)/2 i ym := (y1+y2)/2, • gdzie PNE := {p P: px > xm , py > ym }, • PNW := {p P: px xm , py > ym }, • PSW := {p P: px xm , py ym }, • PSE := {p P: px > xm , py ym }. • Korzeniowi drzewa odpowiada kwadrat Q a jego synom - QNE, QNW, QSW, QSE . • W wierzchołku v trzymamy kwadrat Q(v). QNE QNW QSW QSE NE NW SW SE
Drzewa czwórkowe mogą być wy-korzystane np. w celu kompresji całotonalnych obrazów bitmap-owych. • Można też skorzystać z nich do tworzenia sieci trójkątów dla efek-tywnych obliczeń numerycznych w szczególnych przypadkach płytek obwodów drukowanych (kierunki ścieżek różnią się o wielokrotność /4). Siatki muszą : • być dopasowane (nie ma wierzch-ołków trójkątów na krawędziach innych trójkątów), • uwzględniać dane (ścieżki są za-warte w krawędziach siatki), • być dobrze ukształtowana (trójkąty muszą mieć określony kształt), • być niejednolite (małe trójkąty bli-sko ścieżek, a duże – daleko).
Metoda podziału na kracie (podziału i łączenia). Wierzchołkami kraty są poszczególne piksele połączone krawędziami z sąsiadami (4 lub 8). Wagą krawędzi jest różnica intensywności barw między sąsiadami. Dzielimy te obszary (jak w drzewie czwórkowym), które nie spełniają warunku podobnej intensywności barw (metoda podziału). Następnie łączymy sąsiadujące obszary o zbliżonych intensywnościach barw. Wadą tej metody jest jej duża złożoność i wrażliwość na dobór parametrów.
Metoda rozrostu obszaru. W metodzie tej, piksel oprócz konieczności posiadania określonych własności (np. koloru) musi sąsiadować z innymi pikselami należącymi do danego obszaru. W tym celu konieczne jest zdefiniowanie parametrów początkowych: • obiektu (obiektów) bazowego, który ma się rozrastać, • kryterium dołączania kolejnych pikseli. Możemy tu zastosować algorytmy morfologii matematycznej. Jeśli krawędzie obszaru nie są wyraźne może się rozlewać po całym obrazie.
Przykład. [http://http://www.cse.unr.edu/~bebis/CS791E/Notes/RegionGrowing.pdf]
Inny przykład. [http://http://research.rmutp.ac.th/research/reference/Region%20growing%20a%20new%20approach.pdf]
Jeszcze jeden przykład. Wśród k najbliższych wierzchołków przypisujmy badanemu pikselowi barwę większości sąsiadów. [R.Cardenes et al. „Computational Geometry Computation and kNN Segmentation in ITK”.
Metoda krawędziowa. Stosując segmentację krawędziową nie wykrywamy bezpośrednio obszarów, ale określamy granice między nimi wykorzystując w tym celu np. filtry gradientowe lub Laplace’a. (http://sirius.cs.put.poznan.pl/~inf74839/proceedings/binwr.pdf)
Metoda skupiskowa (cluster) – wybieramy zbiór obiektów i dopasowujemy do nich elementy obrazu. Następnie powtarzamy to samo z innymi zbiorami, aż nie zajdą żadne zmiany. Przykład. Metoda k-centroidów (k-means). [http://http://en.wikipedia.org/wiki/K-means_clustering]
Metoda progowa. Załóżmy, że mamy dany obraz w różnych odcieniach szarości. Segmentacja przez progowanie polega na określeniu pewnej wartości pro-gowej T (w skali intensywności obrazu), względem której każdy element piksel obrazu jest przydzielany do jednej z dwóch kategorii – obiekt lub tło. Otrzymujemy funkcję W zależności od potrzeb obiekt (tło) odpowiadają punktom o wartości 1 lub 0. Aby operacja progowania miała sens, piksele obiektu muszą mieć inny zakres intensywności niż tło.
Progi możemy definiować na różne sposoby. Mówimy o progu globalnym, gdy wartość progu jest ustalana na podstawie całego obrazu . Gdy wartość progu zależy od współrzędnych przestrzennych (x,y) obrazu to mówimy, że próg jest ustalany dynamicznie . Gdy próg zarówno zależy od intensywności obrazu oraz jego pewnej cechy p(x,y), to próg nazywamy lokalnym. Ma to zastosowanie np. gdy obraz jest nierównomiernie oświetlony (wtedy p(x,y) odpowiada średniej jasności obrazu w danym otoczeniu).
Przykład. Progowanie lokalne z maska Gaussa. X [www.ii.uj.edu.pl/~rakowski/TOM_prezentacja.ppt]
W adaptacyjnym progowaniu wieloprzebiegowym w każdym kroku pewne piksele są klasyfikowane na podstawie ich wartości oraz progu obliczonego na podstawie wartości pikseli z pewnego zdefiniowanego otoczenia. Pozostałe, niesklasyfikowane piksele przechodzą do następnego etapu. Algorytm kończy działanie, gdy wszystkie piksele obrazu zostaną sklasyfikowane. Przykład. Lokalny próg dla piksela (x,y) może być liczony według wzoru txy = mxy + vxy, gdy vxy> vmin, gdzie m oznacza wartość średnią a v wariancję. Jeśli vxy < vmin, to wartość progu txy jest równa wartości progu dla poprzednio przetwarzanego piksela. Praktycznym problemem dającym się rozwiązać przy pomocy progowania adaptacyjnego jest sytuacja, w której na szukany obiekt pada intensywny refleks światła, co czyni jego barwę nieregularną z punktu widzenia kamery. W takim przypadku dobór pojedynczego progu może być niewystarczający.
Przykład. [http://www.ee.pw.edu.pl/~czajewsw/studenckie/magisterskie/Daniel_Chade.pdf]
Niekoniecznie musi być dokładnie jeden próg. Przy progowaniu wielopoziomowym wartości odpowiednich poziomów progowania są elementami wektora T=[T1, T2,..., Tn]. W jego wyniku obraz podlega segmentacji na n+1 obszarów o różnych intensywnościach, np. progowanie dwupoziomowe wyznacza trzy takie obszary: [aragorn.pb.bialystok.pl/~boldak/DIP/CPO-W07-v01-50pr.pdf]
Ten sam algorytm z różnymi progami będzie (zazwyczaj) określał inne obszary. Jak zatem można określać progi , aby wynik był zgodny z naszymi oczekiwaniami? • Ręcznie (interaktywnie). • Automatycznie. Określenie właściwego progu jest skomplikowanym problemem, na którego rozwiązanie może mieć wpływ np. średnia intensywność szukanego obiektu i tła, ich rozmiary itp..