Wstęp do kognitywistyki OBLICZENIA INSPIROWANE NEUROLOGICzNIE . MARR

Marcin Miłkowski Wstęp do kognitywistykiOBLICZENIA INSPIROWANE NEUROLOGICzNIE. MARR

O czym będzie mowa • Komórki babcine i widzenie • Trzy poziomy jeszcze raz • Widzenie w analizie odgórnej

Jak widzi mózg? • Oko to nie kamera, która rzuca obraz na ekran w mózgu. • Musiałby istnieć w mózgu widz, w którego mózgu byłby ekran, na który patrzyłby kolejny widz...

Komórki babcine • Lata 50-60: odkrycie komórek reagujących na konkretny rodzaj bodźca • Jerzy Konorski (1967): hipoteza istnienia jednostek gnostycznych w mózgu rozpoznających określony rodzaj bodźca • Jerry Lettvin (1969): komórki babcine

Jak widzą ropuchy? • W 1959 r. zespół Lettvina odkrył w układzie nerwowym ropuch komórki reagujące na czarne ruchome obiekty w polu widzenia: • „Detektory robaków”

Hubel i Wiesel (1959) • David H. Hubel (1926-2013); Torsten Wiesel (1924) • Odkryli, że odpowiednie komórki w mózgu kota reagują na bodźce o określonej orientacji: • złożone obrazy powstają z prostych elementów rozpoznawanych przez detektory cech (ale detektor cechy prostej to nie komórka babcina!) • Potem dostali Nobla za pracę nad kolumnami wzrokowymi.

HoraceBarlow (ur. 1921): teoretyk detektorów cech • Aby całkowicie zrozumieć widzenie, wystarczy zrozumieć pojedyncze komórki rozpoznające cechy. • Pierwszy pracował nad detektorami u żab (1953).

Zespoły komórkowe • Teoria konkurencyjna: reprezentacje neuronalne rozproszone w układzie nerwowym • Dopiero cały zespół komórek koduje cechy. • U ssaków prawdopodobnie dominują reprezentacje rozproszone; u prostych organizmów teoria Konorskiego może być wystarczająca!

Marr kontra Barlow • Widzenia nie da się zrozumieć na podstawie pojedynczych neuronów. • To tak jakby chcieć zrozumieć latanie, oglądając pojedyncze pióra! • Aleksander Łuria w ZSRR głosił podobną teorię: należy zrozumieć całe systemy funkcjonalne w mózgu, a nie wąsko lokalizować funkcje w pojedynczych obszarach.

Poziomy Marra • Trzy poziomy Marra Poziom kompetencji

Mnożenie na maszynie Turinga • Funkcja obliczeniowa Mnożenie • Algorytm Tabela maszyny Turinga • Implementacja Konstrukcja maszyny Turinga (fizyczna)

Analiza zadania • Należy wskazać: • problem z zakresu przetwarzania informacji i • ogólne ograniczenia rozwiązania problemu.

Analiza zadania • Poziom obliczeniowy: Czemu służy widzenie? • Odwzorowaniu dwuwymiarowej informacji z siatkówki w trójwymiarową informację o otoczeniu.

Analiza zadania • Zadaniem systemu wzrokowego jest dostarczanie 3W reprezentacji otoczenia, która może posłużyć jako wejście dla procesów rozpoznawania i klasyfikacji • – głównie informacje o kształcie obiektów i ich rozmieszczeniu w przestrzeni • Reprezentacja 3W nie jest egocentryczna, lecz przedmiotowa

Świadectwa empiryczne • Możliwość podwójnych dysocjacji między postrzeganiem a rozpoznawaniem • Lezje prawego płata ciemieniowego – rozpoznawanie zachowane, ale problemy z postrzeganiem kształtów z niezwykłych perspektyw • Lezje lewego płata ciemieniowego – zachowane postrzeganie kształtu, ale zaburzone rozpoznawanie obiektów • Marr: system wzrokowy to wejście systemu rozpoznawania

Podwójna dysocjacja • Uszkodzenie pewnego miejsca mózgu zaburza daną funkcję, ale inną pozostawia w stanie prawidłowym, a zarazem inne uszkodzenie mózgu zaburza tę inną funkcję poznawczą, tę pierwszą zaś pozostawia w stanie prawidłowym.

Racje teoretyczne • Zdolności rozpoznawania nie zależą od zmian wyglądu związanych z: • orientacją przedmiotu, • odległością od obserwatora, • częściowym zasłonięciem przez inne przedmioty. • Zatem system wzrokowy dostarcza informacje do systemów rozpoznawania, które abstrahują od własności perspektywy – reprezentacja niezależna od obserwatora

Analiza algorytmiczna • Wejście = światło docierające do siatkówki • Wyjście = trójwymiarowa reprezentacja otoczenia • Pytania: • Jakiego rodzaju informacje wydobywa się ze światła na siatkówce? • Jak system przechodzi od tych informacji do 3W reprezentacji otoczenia?

Wyzwanie • Konieczność znalezienia elementarnych reprezentacji, które pozwolą wnioskować o strukturze otoczenia ze struktury obrazu.

Elementarne reprezentacje • Podstawowe informacje na siatkówce = wielkość natężenia światła w każdym punkcie obrazu na siatkówce • zmiany w natężeniu to wskazówki ułatwiające wykrycie granic powierzchni • Elementarne reprezentacje pozwalają na wykrycie struktury we wzorcach zmian natężenia • np. przejścia przez zero (nagłe zmiany natężenia)

Przejścia przez zero • Jeśli zmiany natężenia umieścimy na wykresie, nieciągłości będą widoczne jako przejścia krzywej przez linię zerową • Marr zaproponował laplasjan filtru Gaussa do wykrywania przejść przez zero

Szkic pierwotny Obraz • wskazuje zmiany natężenia w obrazie 2W • podstawowe informacje o geometrycznej organizacji zmian natężenia • Elementarne reprezentacje: • przejścia przez zero, • linie wirtualne, • grupy. Surowy szkic pierwotny Elementy poziomu 1 Granice poziomu 2

Subiektywne nieciągłości • Czy te kształty naprawdę widać?

Szkic 2 ½ W • Pokazuje orientację widocznych powierzchni we współrzędnych egocentrycznych • Reprezentuje odległość każdego punktu w polu widzenia od obserwatora • Także orientację każdego punktu i kontury nieciągłości • Bardzo podstawowe informacje o głębi • Zauważmy: tu jeszcze nie ma przedmiotów!

Szkic 3W • określa kształty i ich organizację przestrzenną • przedmiotowy • podstawowe elementy objętościowe i powierzchniowe (ułatwia rozpoznawanie)

Reprezentacja w szkicu 3W • Zależy od rozpoznawalności kształtów jako zespołów uogólnionych stożków. • Uogólnione stożki łatwo reprezentować • wektor opisu ścieżkę osi symetrii figur, • wektor określający odległość prostopadłą od każdego punktu na osi na powierzchni kształtu. • Ale okazuje się, że tak naprawdę jest to zadanie obliczeniowo zbyt trudne dla mózgu (Rolls, 2008).

Ścieżka przetwarzania wg Marra • Etapy w potoku: Obraz natężeń światła Szkic pierwotny Szkic 2½ wym. Wybór modelu

Wyjaśnianie odgórne • Wyjaśnianie jest odgórne z powodu niezdeterminowania • Wiele różnych algorytmów może w zasadzie obliczyć to samo. • Jest wiele sposobów realizacji tego samego algorytmu. • Wieloraka realizowalność  więcej informacji na wyższym poziomie • Marr podaje stosunkowo mało szczegółów neuronalnych (ale w owym czasie bardzo trudno je potwierdzać!)

Przetwarzanie nieświadome • Marr nie analizuje zawartości bufora uwagi. Tu nie ma miejsca na raporty werbalne i na eye tracker, jak u Simona i Newella. • Simona i Newella lekceważy i krytykuje, uważając, że rozwiązywanie problemów jest na zbyt wysokim poziomie abstrakcji, aby je wyjaśnić. • To procesy niedostępne świadomości. Reprezentacje 2½ W nie są nam dostępne!

Przetwarzanie sekwencyjne • Model sekwencyjny: kolejne etapy przetwarzania, od percepcji do reprezentacji przedmiotów • Przekonania nie modyfikują samego wczesnego widzenia (co najwyżej procesy rozpoznawania)

Główne idee Marra • Bardzo wpływowa metodologia trzech poziomów • Klasyczna analiza odgórna • Większość szczegółów na poziomie algorytmicznym • Neurobiologia pojawia się dopiero na poziomie implementacji

Wczesne widzenie i neuronauki obliczeniowe • Dzisiejsze metody łączą zdecydowanie więcej świadectw empirycznych, a modele mają być testowane np. przy użyciu obrazowania. • Neuropsychologia, lezje i podwójne dysocjacje bardzo ważne.

Za tydzień: będzie zastępstwo. Jakub Kozakoszczak opowie Państwu o sieciach neuronowych i uczeniu się czasowników.

Wstęp do kognitywistyki OBLICZENIA INSPIROWANE NEUROLOGICzNIE . MARR