300 likes | 505 Views
Vybran é kapitoly z „machine learning“. Mária Markošová. Stochastick é metódy vyhľadávania. -simulované žíhanie (simulated annealing) -evolučné algoritmy (adaptive search by evolution). Simulované žíhanie (simulated annealing).
E N D
Vybrané kapitoly z „machine learning“ Mária Markošová
Stochastické metódy vyhľadávania -simulované žíhanie (simulated annealing) -evolučné algoritmy (adaptive search by evolution)
Simulované žíhanie (simulated annealing) Žíhanie: Technika pomalého chladenia roztoku . Napr. pri vytvrdzovaní ocele sa jej teplota zvýši až k bodu topenia a potom sa pomaly znižuje. Cieľ: dosiahnuť stav s najnižšou možnou energiou Cieľ v analýze dát: Nájsť globálne minimum funkcie bez uviaznutia v lokálnom minime. Autori metódy: Kirkpatrick, Gellat, Vecchi, Černý
Trochu fyziky Ako najúspornejšie nasypať kocky cukru do krabice? 1. Nasypeme kocky do krabice 2. Trasieme krabicou, kým nedosiahneme stav s minimálnou potenciálnou energiou. Čo je trasenie krabice? Ak sa kocky majú správne uložiť, treba pripustiť , aby sa ich energia dočasne zvýšila. To je princíp simulovaného žíhania.
Rozdelenie konfigurácií s systému častíc pri teplote T je dané Boltzmanovou distribúciou. E – voľná energia T – teplota K- Boltzmanova konštanta
počet konfig. s danou v. energiou voľná energia Boltzmanovo rozdelenie
Predpoklad: systém sa pri teplote T s časom vyvíja ku stavom s nižšou energiou. Metropolisov algoritmus: Nech je v čase t systém v stave s s voľnou energiou E(s) a teplotou T. V čase t+1 vznikne nová konfigurácia , ktorá má inú energiu . Rozdiel energií starej a novej konfigurácie: Ak potom novú konfiguráciu prijmeme. Ak potom novú konfiguráciu prijmeme s pravdepodobnosťou
Čo robí Metropolisov algoritmus? • Opakovaním Metropolisovho algoritmu pre danú teplotu T dostávame systém v tepelnej rovnováhe. • Stavy systému majú Boltzmanovu distribúciu
Čo to znamená pre analýzu dát? • Dáta nafitujeme nejakou funkciou, napr. . • symbolizuje konfiguráciu s. • Nech je tá funkcia veľmi zložitá, s množstvom maxím a miním. Potrebujeme nájsť globálne minimum. • Použijeme Metropolisov algoritmus, ktorý implementuje náhodné prehľadávanie . Akceptuje taký krok, kde s pravdepodobnosťou 1. • Taký krok, kde akceptuje s pravdepodobnosťou
Proces simulovaného žíhania • Urobíme krát Metropolisovu procedúru. • Tým dostaneme systém do tepelnej rovnováhy s Boltzmanovskou distribúciou stavov. • Vypočítame priemernú “energiu”, to bude energia pre stav s teplotou T. • Zmenšíme teplotu tak, že pre z intervalu • . To spôsobí, že pravdepodobnosť prijatia kroku v “zlom” smere sa zníži. • 4. Opakujeme procedúru od bodu 1.
return nie ano ano akc. novy stav poruš f 1. Metropolisova procedúra • Nastavíme počiatočnú teplotu tak, aby sme z počiatočného stavu akceptovali temer každý prechod. Ako? • Zadáme náhodnú teplotu, náhodne porušujeme počiatočný stav tak, aby sme dostali stav s horšou “energiou” a nastavíme teplotu tak, aby prijatie tohto stavu bolo dostatočne blízke k jednotke. • Metropolisov algoritmus: nie
c) , pri teplote 2. Vypočítame priemernú “energiu” pre Je to vlastne priemerná hodnota
3. Chladenie So zmenšovaním teploty sa chladenie môže spomaľovať, tak, že obmadzíme interval 4. Opakovanie od bodu jedna s nižšou teplotou
Algoritmus simulovaného žíhania inicializácia nie Return ano výsledný stav pri teplote T chladenie
Varianta simulovaného žíhania TA- threshold accepting: Horšie riešenia sa neakceptujú s istou pravdepodobnosťou, ale s pravdepodobnosťou 1, pokiaľ nepresiahne dopredu stanovený prah. Prah sa po každom teplotnom zmenšení zmenšuje tiež, až nakoniec sú akceptované len kroky k minimu.
1 1 6 2 6 2 5 3 5 3 4 4 Konkrétny príklad – problém obchodného cestujúceho. s=(1,2,5,4,3,6,1) počiatočná konfigurácia porušená počiatočná konfigurácia f(s) – funkcia, ktorú minimalizujeme, celková dĺžka trasy medzi mestami
Zvolíme poradie miest (konfiguráciu) • Spočítame dĺžku trasy medzi nimi. • Porušíme trochu počiatočnú konfiguráciu, ak je porucha taká, že trasa sa predĺži, nastavíme teplotu T tak, aby pravdepodobnosť prijatia tejto konfigurácie bola blízka k jednej. • Opakujeme m krát pri danej teplote a spočítame priemernú dĺžku pri teplote T. • Znížime teplotu, čím znižujeme pravdepodobnosť prijatia dlhšej trasy a proces opakujeme pri novej teplote.
Evolučné algoritmy a evolučné stratégie • Evolučné algoritmy simulujú proces kolektívneho učenia sa indivíduí. • Príklad: Každý živý tvor sa evolučnými krokmi snaží zlepšiť svoju šancu prežiť. Môžeme si ho predstaviť ako bod na hyperpovrchu (fittness landscape), ktorý definuje jeho “fittness”, silu. Organizmus sa snaží zlepšiť svoj stav tak, aby sa po hyperploche pohyboval k lokálnemu maximu. • Inicializujeme populáciu bodov na hyperploche. • Necháme populáciu vyvíjať sa, čiastočne náhodne, pričom okolie poskytuje spatnú informáciu (fitness). • a) selekcia – indivíduá s lepšou fittness sa reprodukujú častejšie • b) mutácia - inovácia štruktúry indivíduí • c) rekombinácia – zmiešavanie rodičovskej genetickej informácie pri predávaní potomkom
Siete malého sveta Siete malého sveta sú grafy, ktoré interpolujú medzi náhodnosťou a usporiadanosťou. Modelujú - www sieť - komunikačné siete - sociálne siete - neurónové siete v mozgu - ľudský jazyk ….
osobnosť kamarát osobnosti, Praha kamarát kamaráta novinára, Praha kamarátnovinára,Brno novinárBlava
Efekt malého sveta Milgram r. 1967, zákon šesťstupňovej separácie Reťaz známych, ktorá spája dvoch náhodne zvolených obyvateĺov Zeme má v priemere 6 ohniviek. Vlastnosti sietí malého sveta: 1. dobrá konektivita 2. usporiadanosť 3. klasterizácia
Príklad: sociálna sieť Konektivita: Dvaja ľudia sa dokážu cez sociálnu sieť rýchlo zoznámiť, aj keď sú fyzicky vzdialení. Usporiadanosť: Človek žije v istom usporiadanom lokálnom klastri vzťahov. Klasterizácia: Je veľmi pravdepodobné, že moji priatelia sú priateľmi aj navzájom ( omnoho pravdepodobnejšie ako keď vyberieme náhodne dvoch ľudí v danej sieti)
Krajné prípady Náhodný graf: -dobrá konektivita -malá usporiadanosť -malá klasterizácia Usporiadané mriežky -vysoká usporiadanosť -slabá konektivita -môže byť klasterizácia Siete malého sveta: -dobrá konektivita (ako v náh. grafoch) -môže byť vysoká usporiadanosť -môže byť klasterizácia
Efekt malého a efekt veľkého sveta Priemerná najkratšia vzdialenosť medzi dvoma náhodne vybranými uzlami rastie pomaly s počtom uzlov siete. Priemerná najkratšia vzdialenosť medzi dvoma náhodne vybranými uzlami rastie rýchlo s počtom uzlov siete.
Klasterizácia bod i Koef. klasterizácie pre bod i Koeficient klasterizácie grafu
Newmanov - Wattsov model p- pravdepodobnosť vzniku krátkeho spojenia na uzle Dva režimy: , režim v.s , režim m.s prechod medzi režimami
Numerické výsledky pre N-W model Parametre modelu:N=1000, z=1 --------------------------------------------------------------------- Náhodný graf: l=3.2 --------------------------------------------------------------------- N-W model: p=0 l=50 p=1/4 l=3.6 p=1/64 l=7.4
Čo počítame v sieťach malého sveta? 1. Priemernú najkratšiu vzdialenosť. 2. Klasterizáciu. 3. Režimy a kritickú pravdepodobnosť pri ktorej sa režim veľkého sveta mení na režim malého sveta 4. Dynamické vlastnosti siete: je pripájanie nových uzlov náhodné alebo preferenčné?
Aplikácie - www sieť a jej vlastnosti - komunikačné siete (cestné siete, železničné siete, linky elektrického vedenia) - sociálne siete - charakter ľudského jazyka