930 likes | 1.06k Views
Identyfikacja wzrokowa zależna od perspektywy (Stephen Palmer, Eleanor Rosch i Paul Chase ( 1981) Identyfikacja poprzez wyodrębnianie geonów - komponentów ( Biederman , 1987 ). Identyfikacja ( rozpoznawanie) obiektu.
E N D
Identyfikacja wzrokowa zależna od perspektywy (Stephen Palmer, EleanorRosch i Paul Chase (1981) Identyfikacja poprzez wyodrębnianie geonów - komponentów (Biederman, 1987) Identyfikacja (rozpoznawanie) obiektu
Rozpoznawanie (recognition) • wzbudzenie przez bodziec wzorca (schemat percepcyjny), zapisanego w pamięci długotrwałej, „najlepiej” reprezentującegp rozpoznawany przedmiot. inaczej: • Porównanie danych sensorycznych z danymi w <wzrokowejpamięci długotrwałej> wraz z • <Rozpoznanie obiektum> pola V1-V2,V3, V4, V5 kory wzrokowej ( aktywacja wzorca)
Wgląd spostrzeżeniowy Wgląd spostrzeżeniowy – nagła, nieoczekiwana zmiana percepcji przedmiotu.
Spostrzeganie jako testowanie hipotez • Poznawcze teorie spostrzegania zakładają, że bodźce są informacyjnie ubogie • W odniesieniu do percepcji to założenie wymaga dalszego założenia, że wrażenia same w sobie są niezdolne do tego, aby dostarczyć trafnego obrazu świata • Wrażenia wymagają wzbogacenia poprzez modele umysłowe. • Wybór modelu umysłowego dokonuje się przez stawianie i weryfikację hipotez
Spostrzeganie jako testowanie hipotez • Co to? • Domysł (hipoteza 1) …………… • weryfikacja • Domysł (hipoteza 2) …………… • Weryfikacja • Domysł (hipoteza 3) …………… • weryfikacja
Identyfikacja wzrokowa zależna od perspektywy (Stephen Palmer, EleanorRosch i Paul Chase (1981) Identyfikacja poprzez wyodrębnianie geonów - komponentów (Biederman, 1987) Identyfikacja (rozpoznawanie) obiektu
Perspektywauprzywilejowana(canonical perspective) • Perspektywa, w której przedmioty są spostrzegane najszybciej i najłatwiej. • Stephen Palmer, EleanorRosch i Paul Chase (1981)
Badania Palmer, Rosch i (1981) • Materiałem empirycznym były fotografie 12 obiektów, między innymi konia, pianina, filiżanki, samochodu, krzesła, telefonu. • Każdemu obiektowi zrobiono dwanaście zdjęć przedstawiających jego różne perspektywy: z góry, z boku, z przodu, z tyłu, oraz wybrany zbiór kombinacji tych czterech prostych perspektyw, na przykład jednoczesne ujęcie obiektu częściowo z przodu, z góry i z boku. • Metoda: • prezentowano badanym wybrane perspektywy wszystkich przedmiotów z poleceniem nazwania spostrzeganego przedmiotu tak szybko, jak to możliwe • Wyniki • Otrzymane wyniki badań wykazały istotny wpływ zastosowanych czterech perspektyw określonego przedmiotu na czas jego rozpoznawania. • Perspektywa kanoniczna przedmiotu jednoczesne ujęcie obiektu częściowo z przodu, z góry i z boku była rozpoznawana najszybciej i najdokładniej. • Najmniej reprezentatywna perspektywa przedmiotu np.. z góry albo od spodu wpływała na najdłuższy czas reakcji jego rozpoznania.
Rozpoznawanie poprzez wyodrębnianie komponentów(Biederman, 1987) • Zgodnie z jego koncepcją, tylko 36 różnych kształtów geometrycznych ( geonów- geometrical ions), takich jak np. bloki, walce, sfery, łuki czy ostrosłupy, zupełnie wystarczy do opisania wszystkich obiektów rzeczywistych. • Według Biedermana system poznawczy dysponuje subsystemami, umożliwiającymi rozpoznanie tych kształtów dzięki zbieraniu informacji dotyczących rejestrowanych w polu wzrokowym linii, krawędzi i kątów, przy czym analizie podlegają cechy równoległości i symetrii. • W ten sposób detekcja kubka wymaga rozpoznania dwóch komponent strukturalnych: cylindra (na ciecz) i łuku (ucho do trzymania). • Rozpoznane komponenty są następnie zestawiane z trwałymi reprezentacjami umysłowymi w celu identyfikacji postrzeganego obiektu. Klasyfikacja percepcyjna jest rozstrzygana na rzecz takiej reprezentacji, do której komponenty strukturalne są najlepiej dopasowane.
Fazy rozpoznawania Biederman (1987) • Aktywacja <wzrokowych detektorów cech >kształtu, ruchu, barwy, itd… i zarazem wydobywanie geonów • Ultra-krótkie magazynowanie danych w <pamięci ikonicznej> do 0.500 milisekund > • Porównanie układów geonów z danymi w <wzrokowejpamięci długotrwałej> • <Rozpoznanie obiektu> pola V1-V2,V3, V4, V5 kory wzrokowej
człowiek ramię przedramię ręka Biederman – rozpoznawanie postaci człowieka
5 wyjściowych geonów i 4 obiekty
Teoria asocjacji w spostrzeganiu • Teoria asocjacjonistyczna (skojarzeniowa) spostrzeżeń głosi prymat części nad całością, wrażeń nad spostrzeżeniami. To oddolna teoria przetwarzania (bottom – up). • Odmienne zestawy wrażeń definiują więc, przez swoją sumę, odmienne spostrzeżenia. Wrażenia łączą się ze sobą w spostrzeżenia na zasadzie praw kojarzenia(asocjacji), to znaczy: • styczności wrażeń w czasie: jednocześnie niebieski i prostokąt • styczności wrażeń w przestrzeni: w tym samym miejscu przestrzeni <niebieski> i <prostokąt> • podobieństwa: wszelkie obiekty niebieskie, obiekty poruszające się w tym samym kierunku • wzajemnego kontrastu, np.: zielone na czerwonym / czerwone na zielonym. • Współwystępowanie wrażeń jest niezbędnym, ale niewystarczającym warunkiem powstania spostrzeżenia. Dopiero wielokrotne występowanie wrażeń poszczególnych sprzyja powstaniu skojarzenia w postaci spostrzeżenia.
Teoria postaci w spostrzeganiu • Zwolennicy tej teorii przyjęli zasadę prymatu całości nad częściami, dokładniej obrazu percepcyjnego nad składnikami sensorycznymi. To odgórna teoria percepcji (top- down). • Oto eksperyment potwierdzający tę teorię: • Badania Navona ( 1977) • E. krótko eksponował na ekranie litery złożone z liter, prosząc o identyfikację liter (złożonych odrębnie od liter składowych) i odwrotnie – samych liter składowych. • Wyniki • Ujawniły, że czas identyfikacji liter złożonych był krótszy od liter składowych, kiedy litery składowe były jasno identyfikowalne. • To potwierdza prymat całości nad częściami, „lasu nad drzewami.”
EksperymentNavon’a(1977) Co to?
Zasady organizacji percepcyjnej Kiedy bodźce są: • blisko siebie • są podobne • są symetryczne • tworzą dobrą kontynuację • dają się „zamknąć,” to automatyczne tworzą wzrokową konfigurację, „postać.”
Zasady organizacji percepcyjnejwg. Wertheimera (1923) Zamykanie Bliskość Podobieństwo powiązanie • Ciągłość Symetria
Teoria wzorców (szablonów) • Teoria zakłada, że proces rozpoznawania obiektu przebiega na zasadzie porównania obrazu sensorycznego z jego percepcyjnym szablonem(template). Szablony percepcyjne są holistyczne (nierozkładalne na części). Obiekt zostaje jako ten szablon, który jest najlepiej dopasowanydo obrazu sensorycznego. • Jak rozwiązać problem, kiedy obiekt ma taki sam kształt, jak szablon, ale jest za duży albo za mały, rozciągnięty albo skrócony, itp..? • Wtedy normalizację obrazu doprowadza do dopasowania obrazu do szablonu. Za normalizację odpowiadają procesy zwane <stałością bodźców>. • Ograniczeniem teorii szablonów jest nietrwałość obrazów w pamięci ultra-krótkiej.,
Co to za znak? = nierozpoznany! Brak szablonu (template) w pamięci długoterminowej
Normalizacja bodźca szablon
Teoria cech w spostrzeganiu • To oddolna teoria spostrzegania ( bottom-up) • Proces spostrzegania wymaga więcej czasu, w miarę jak wzrasta liczba potencjalnych szablonów, do których można zaliczyć przetwarzane dane sensoryczne (Posner, MitchelI, 1967). • Stąd można sądzić, że w dłużej przebiegającym procesie identyfikacji obiektów, rozpoznanie opiera się na podstawie analizy szczególnie dystynktywnych właściwości tych obiektów (przez zespoły komórek zwane detektorami cech) i porównania tychże właściwości z cechami reprezentacji umysłowych obiektów zawartymi w pamięci długotrwałej, a nie na całościowym porównaniu obrazu sensorycznego ze wzorem ( szablonem).
Wejście sensoryczne szablony
Teoria cech w spostrzeganiu Wejściesensoryczne Detektory cech Cechy obiektów w pamięci długotrwałej rozpoznanie
Nabywanie wzorcowych reprezentacji umysłowych Gibson (1969) • Gibson (1969) stwierdziła, że nabywanie wzorcowych reprezentacji umysłowych odbywa się w procesie spostrzegania dystynktywnych cech (features), pozwalających odróżnić jeden wzorzec od drugiego. • Zaproponowała ona cztery zasady, zgodnie z którymi wyróżniane są w procesie spostrzegania cechy kryterialne • 1/ cecha kryterialna musi przyjmować rożne wartości w odniesieniu do rożnych wzorców. Dla liter wydaje się być np. ich wysokość, pozwalająca odróżnić choćby litery: "d", "s" i "p". • 2/ Konkretna wartość cechy kryterialnej przypisana konkretnemu modelowi powinna pozostać niezmienna niezależnie od punktu i właściwości obserwacji (jasność, wielkość i perspektywa). • Tak litera "d" pozostaje zawsze wyższa niż litera "s", niezależnie od rodzaju użytej czcionki (pod warunkiem, że tej samej wobec obu liter. • 3/ wszystkie cechy kryterialne powinny razem (mechanizm integracji cech) składać się w unikatowy wzorzec - a żadne dwa rożne wzorce nie mogą charakteryzować się kombinacją tych samych cech. • Litery "d" i "b" mają mnóstwo cech wspólnych, takich jak np. wysokość, „zaokrąglenia" itd. jednak ich rożna orientacja przestrzenna w zestawieniu z tymi wspólnymi właściwościami gwarantuje ich rozróżnialność. • 4/ liczba cech kryterialnych powinna być relatywnie mała. W przeciwnym razie proces identyfikacji obiektu przebiegałby bardzo długo, a przebiega bardzo szybko (np. czytanie liter czy rozpoznawanie twarzy).
Gibsonateoriabezpośredniejpercepcji Wprowadzenie:Gibson zbudował swoją teorię podczas II Wojny światowej, kiedy polecono mu przygotować film treningowy pilotom. Wtedy rozwinął swoją teorię przepływu wzorów wzrokowych opartą o nakierowanie na nieruchomy punkt do którego zmierza pilot. Reszta otoczenia wzrokowego oddala się od tego punktu przepływając „ponad i wokół”. Istotne są dwie stałe: • biegun (albo punkt, do którego ktoś zmierza) i • horyzont w relacji do wysokości osoby. Te niezmienniki (inwarianty) pozwalają na zachowanie <stałości wielkości>. Gibson podrzuca teorię, że pamięć długoterminowa dostarcza znaczeń perceptom. Znaczeń dostarczają tzw. „affordancje”. Ludzie są zdolni do dość automatycznego „dostrajanie się ” do swojego otoczenia. Gibson wyjaśniał to rezonansem, odfiltrowaniem informacji zgodnych od szumu. Gibson stwierdza, że percepcja wzrokowa jest, skrajnie dokładna, precyzyjna, a złudzenia wzrokowe nie mają praktycznie związku z codzienną percepcją. Inaczej niż teoria postaci, Gibson pojmuje ruch jako znaczący składnik percepcji.Psychologiczne laboratoria i eksperymenty dotychczas pomijały kwestię percepcji w ruchu.
cel horyzont + • przepływy • przepływy przepływy
Gibsonateoriabezpośredniejpercepcji Gibsona teoria percepcji wzrokowej oparta jest o trzy podstawowe idee: • Porządek optyczny obiektów (Optic Array): Wzory optyczne docierające do oczu można pojmować jako porządki optyczne zawierające wszelką informację dostępną siatkówce. Ten porządek dostarcza jednoznacznej informacji o rozmieszczeniu obiektów w przestrzeni. • Gradienty tekstury (Textured Gradients): Kiedy szyk optyczny przepływa wokół widza , gradient tekstury tego co widzi dostarcza informacji o dystansach, szybkości itp. Tego rodzaju percepcja nie wymaga wielkiego przetwarzania informacji przez system poznawczy, gdyż spostrzeganie opiera się na działaniu, ruchu. • Affordancje - oznaczają przypisywanie konkretnych znaczeń do informacji wzrokowej. Gibson utrzymuje, że potencjalne zastosowanie przedmiotu jest bezpośrednio dostrzegane tzn. drabina „zaprasza” do wspinania; kamień, pień do siadania, itd.
(1988) "Perception of Translational Heading From Optical Flow " Warren, William H. Jr., Morris, Michael W., Kalish, Michael ("translational heading" = ruch w przestrzeni ) • Gibson dostrzegł, że kiedy ktoś porusza się, następuje „przepływ” tekstur przez pole widzenia , a centrum tego przepływu, nieruchomy punkt wskazuje na kierunek ruchu. Widać to kiedy siedząc na przednim fotelu jedziemy samochodem itp. Ta teoria jest znana jako is known as the „hipoteza generalnego promienistego przepływu” (Global Radial Outflow Hypothesis) • Artykuł podaje ilustrację pokazując diagram wektorów pola wzrokowego, kiedy rotacyjne ruchy oczu i głowy zakłócają spójność tego przepływu w sposób uporządkowany, kiedy otoczenie wzrokowe jest rozległą płaszczyzną.
Linie pionowe - kierunek ruchu, kropki - elementy otoczenia, odcinki – wielkość wektorów szybkości a/ chwilowe optyczne i siatkówkowe wektory prędkości równolegle do płaszczyzny. b/ chwilowe wektory prędkości na siatkówce oka, kiedy oko dokonuje fiksacji przez jednoczesną rotację „do dołu” i „w prawo” poprzez centrum oka. c/ chwilowe wektory prędkości na na siatkówce oka, kiedy złożono wektory ruchu równoległego do płaszczyzny i wektory spowodowane przez rotację oka. Dostrzegalny jest spiralny wzór w górnym prawym rogu
(1991) Perception of circular heading from optical flow.By Warren, William H.;Mestre, Daniel R.;Blackwell, ArshavirW.;Morris, Michael W.Journal of Experimental Psychology: Human Perception and Performance, Vol 17(1), Feb 1991, 28-43 • Abstract • Obserwatorzy oglądali przepływ przypadkowo rozmieszczonych punktów, który symulował ruch obserwatora po kole. Pytani byli o to, czy przejdą z lewej czy z prawej celu odległego o 16 metrów. (Observers viewed random-dot optical flow displays that simulated self-motion on a circular path and judged whether they would pass to the right or left of a target at 16 m). • Teoretycznie wystarczą tylko dwa punkty w dwu kolejnych ekranach, aby ustalić kierunek ruchu po kole, jeśli oś rotacji jest znana. • Wyniki • Dokładność zachowania kierunku była lepsza 1.5° , kiedy mieli dostarczano im trój- wymiarowej informacji o przepływie tekstur gruntu, ścian. Dokładność była stała dla gęstości punktów > 2, co zgodne jest z teorią.
a/ chwilowe optyczne i siatkówkowe wektory prędkości równolegle do Płaszczyzny b/ chwilowe wektory prędkości na siatkówce oka, kiedy obserwator dokonuje ruchu po kole
Perception of circular heading from optical flow. By Warren, William H.;Mestre, Daniel R.;Blackwell, ArshavirW.;Morris, Michael W. Journal of Experimental Psychology: Human Perception and Performance, Vol 17(1), Feb 1991, 28-43
Computer vision is a field that includes methods for acquiring, processing, analysing, and understanding images and, in general, - high-dimensional data from the real world in order to produce numerical or symbolic information, e.g., in the forms of decisions. Widzenie Sztuczne(widzenie komputerowe)
As a technological discipline, computer vision seeks to apply its theories and models to the construction of computer vision systems. Examples of applications of computer vision include systems for: • Procesy kontroli w przemyśle(np.roboty przemysłowe). • Nawigacja automatyczna(np. pojazdów autonomicznych i robotów mobilnych) • Wykrywanie zdarzeń (np.nadzór optyczny lub zliczanie ludzi). • Organizowanie informacji(np. indeksacja baz obrazów lub sekwencji obrazów). • Modelowanie obiektów lub otoczenia (np. analiza obrazów medycznych albo modelowanie topograficzne ). • Interaction( np. interakcja komputer-człowiek) • Inspekcja automatyczna ( in manufacturing applications
Obliczeniowa ekstrakcja cech z obrazu Przykład Wykrywanie krawędzijest podstawowym narzędziem w przetwarzaniu obrazu i widzeniu komputerowym, szczególnie w obszarach wykrywania cech i ekstrakcji cech, które zmierzają do identyfikacji tych punktów w zdygitalizowanym obrazie w których raptownie zmienia się jasność obrazu lub, formalnie, kiedy wykazuje nieciągłość.
Pamiętajmy to jest obraz na siatkówce Nie ma obiektu i tła Nie ma krawędzi, Nie ma naroży, Nie ma powierzchni, Nie ma części, Nie ma faktury Nie wiadomo, gdzie obiekt, gdzie cień. itd. Tylko informacje o intensywności pobudzenia komórek siatkówki. Widzenie Sztuczne