200 likes | 306 Views
Inteligencja Obliczeniowa Wizualizacja. Wykład 16 Włodzisław Duch Uniwersytet Mikołaja Kopernika. Mapy w mózgu. Samoorganizacja Sieci Kohonena. Co było. Wizualizacja Skalowanie wielowymiarowe Porównanie z modelem SOM. Co będzie. Wizualizacja w SOM i MDS.
E N D
Inteligencja ObliczeniowaWizualizacja. Wykład 16 Włodzisław Duch Uniwersytet Mikołaja Kopernika
Mapy w mózgu. Samoorganizacja Sieci Kohonena Co było
Wizualizacja Skalowanie wielowymiarowe Porównanie z modelem SOM Co będzie
Wizualizacja w SOM i MDS • MDS - skalowanie wielowymiarowe Informacja o skupieniachw danych zawarta jest w relacjach topograficznych maksimów gęstości rozkładow. Wizualizacja w niskowymiarowych przestrzeniach wymaga oceny stopnia zniekształcenia - miary liczbowej. MDS, MultiDimensional Scaling (Thorton 1954, Kruskal 1964, Sammon 1964, Duch 1995) - proste miary zgodności topograficznej (MZT). Przestrzeń danych RN, wektory X mapowane na przestrzeń docelową, zwykle YR2. Odległości Rij = D(Xi,Xj) pomiędzy Xi i Xj w RN; odległości rij = d(Yi,Yj) w R2. Znajdź mapę X Y=M(X) minimalizującą globalną MZT, czyli różnicę pomiędzy Riji rij.
Miary zgodności topograficznej Współczynnik stresu i alienacji (Kruskal); dowolna funkcja o nieujemnych przyczynkach, np. f. entropowe. Miara transmisji informacji, określa ile informacji uległo straceniu przy redukcji wymiarowości.
MDS i SOM Pytania: 1) Jak dobre są mapy otrzymane z SOM (w sensie miary TMZ) ? 2) Jak wyglądają mapy optymalne ? 3) Jak udoskonalić SOM by dawał lepszą wizualizację ? Mapa: nie istnieje funkcja! Umieszczenie nowego punktu a mapie wymaga nowej minimalizacji; tylko dla ustalonej liczby punktów można znaleźć odpowiednią funkcję. Zamiast SOM dobra klasyfikacja + MDS ? Lokalna wizualizacja danych, interakcyjne powiększanie, tak, by uniknąć zbyt dużych zniekształceń topograficznych.
Mapy semantyczne Przestrzeń cech dla wyrazów: semantyka w relacjach topograficznych? Np. zdania o 16 zwierzętach: gołąb, kura, kaczka, gęś, sowa, jastrząb, orzeł, lis, pies, wilk, kot, tygrys, lew, koń, zebra, krowa. Koń biega; koń ma kopyta; koń jest duży... 13 binarnych cech: mały, średni, duży; ma 2 nogi, 4 nogi, włosy, kopyta, grzywę, pióra; lubi polować, biegać, latać, pływać. 76 zdań opisujących zwierzęta,razem 13+16=29 wymiarów. Jak wygląda mapa SOM i MDS? Naturalna klasyfikacja nazw zwierząt: Ssaki oddzielone od ptaków, drapieżniki od roślinożernych, małe zwierzęta od dużych. Pytanie o podobieństwo zwierząt do siebie ma sens również w świetle odległości na takiej toposemantycznej mapie. Podobieństwo wyraża się w czasach reakcji odpowiadających osób.
Kula 216 neuronów 1D, 18x12 neuronów w 2D i 6x6x6 neuronów w 3D. 216 neuronów w 1D, 2D i 3D, rosnąca sieć GCS.
Przykłady zastosowań Sztuczne życie i AI: analiza danych z sensorów, kontrola ruchów robotów, mapy poruszania się po labiryntach, akwizycja wiedzy, podobieństwo tekstów i KDM . Badania nad mózgiem: formowanie się map topograficznych, tonotopicznych, motorycznych, somatotopowych, w układzie wzrokowym. Klasyfikacja: genetyka, własności białek, analiza mowy, klasyfikacja pieśni godowych owadów i ptaków, QSAR, astronomia, fizyka .... Kompresja danych, szczególnie obrazów i dźwięków, filtrowanie informacji. Diagnostyka: medycyna, inżynieria Język naturalny: kategoryzacje lingwistyczne, fonetyczne rozpoznawanie mowy, rozbiór gramatyczny, wzorce przenoszenia wyrazów, nabywanie umiejętności lingwistycznych.
Przykłady cd. Optymalizacja: konfiguracja połączeń telefonicznych, projektowanie VLSI, szeregi czasowe, zagadnienia kolejkowania. SOM jako algorytm optymalizacji, np. reprezentacja N-miast na torusie - na razie tylko w 1 pracy. Przetwarzanie sygnałów: filtry adaptacyjne, analiza w czasie rzeczywistym, sygnały radarowe, sonarowe, sejsmiczne, medyczne, podczerwone ... Rozpoznawanie obrazu: segmentacja, wykrywanie obiektów, analiza tekstur.
Mapy ekonomiczne. Dane: Bank Światowy 1992, 39 wskaźników jakości życia. SOM i mapa świata; analiza giełdy i analiza stopów.
Olej z Włoch. 572 próbek olejków z oliwek pobrano z 9 prowincji Włoch. Sieć SOM 20 x 20,uczona % 8 tłuszczówzawartych w olejkach. Mapa 8D => 2D. Dokładność klasyfikacji na testowanych próbkach rzędu 95-97%.
Podstawy teoretyczne CI. Inspiracje statystyczne. Drzewa decyzji. Metody oparte na podobieństwie. Uczenie maszynowe, indukcja reguł logicznych. Zastosowania. Co dalej?
Koniec wykładu 16 Dobranoc !