1 / 14

Echo state network

Echo state network. Formálny popis. diskrétny matematický model (iterácie n = 1,2,3,...) K - vstupných neurónov: u(n) = (u 1 (n), u 2 (n),..., u K (n)) t N - interných neurónov: x(n) = (x 1 (n), x 2 (n),...,x N (n)) t L - výstupných neurónov: y(n) = (y 1 (n), y 2 (n),...,y L (n)) t.

Download Presentation

Echo state network

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Echo state network

  2. Formálny popis • diskrétny matematický model • (iterácie n = 1,2,3,...) • K - vstupných neurónov: • u(n) = (u1(n), u2(n),..., uK(n))t • N - interných neurónov: • x(n) = (x1(n), x2(n),...,xN(n))t • L - výstupných neurónov: • y(n) = (y1(n), y2(n),...,yL(n))t

  3. ... • váhy uložené v maticiach • N x K matica vstupných váh: • Win(wijin) • N x N matica vnútorných váh: • W(wij) • L x (K+N+L) matica výstupných váh: • Wout(wijout) • N x L matica spätných váh: • Wback(wijback) • reprezentuje spojenia vedúce od výstupných k vstupným neurónom

  4. Topológia

  5. Učenie • aktivácie interných neurónov • výstup • f – aktivačná funkcia sigmoidálna funkcia (tanh) • fout – výstupná funkcia (lineárna) (1) (2)

  6. Učenie • concept of echo states • ak sa stav siete menil dostatočne dlho, možno povedať, že stav siete je jednoznačne určený predchádzajúcimi vstupmi a výstupmi • teda : pre každý interný signál xi(n) existuje echo funkcia ei, ktorá mapuje minulé vstupy a výstupy v momentálnom stave siete.

  7. Učenie • echo stav je prepojený s matematickými vlastnosťami váhovej matice W. • zatiaľ neexistuje nutná a postačujúca podmienka, ktorá umožní rozhodnúť, či dané váhové matice Win, W, Wback a teda aj sieť sú v echo stave. • existuje však postačujúca podmienka pre neexistenciu echo stavov.

  8. Postačujúca podmienka pre neexistenciu echo stavov • NN • U, D, Win, W, Wback, f=tanh • Win, Wback : nemajú vplyv na echo stav • ak pre W je splnené, potom bez ohľadu na vstup a výstup z intervalu UxD platí: sieť neobsahuje žiadne echo stavy • je najväčšie charakteristické číslo matice W

  9. Učenie • Generovanie matice váh – W • je to tzv. riedka matica • veľkosť N x N • náhodná inicializácia [-1,1] • normovanie • škálovanie

  10. Učenie • Škálovací parameter • upravuje dynamiku časovanie zmien v DR • malá hodnota predstavuje rýchle zmeny v DR • štandardne sa používa hodnota z intervalu <0.7,0.98> • voľba tohto je dôležitá pre úspech učenia tejto siete

  11. Učenie • Voľba mohutnosti W • veľkosť trénovacej množiny T • zložitosť danej úlohy • všeobecné pravidlo • N je z intervalu <T/10, T/2> • N sa vyberá bližšie k T/2, čím viac sú dáta z trénovacej množiny periodické • týmto predídeme preučeniu siete

  12. Učenie • Príklad • máme : vstupné a výstupné trénovacie dáta • (u(1), d(1), ... , u(T), d(T)) • chceme : sieť ( Win,W , Wback, Wout ), ktorej výstup y(n) aproximuje výstupné dáta d(n) za pomoci vstupných dát u(n) • Riešenie • Krok 1 - vygenerujeme maticu W • Krok 2 • nainicializujeme sieť na požadovaný stav, napr. x(0) = 0 • za pomoci (1) sieťou preženieme vstupné a výstupné dáta, u(n), d(n-1) n = 0, ..., T

  13. Učenie • v čase n=0 je d(n) nedefinované, položíme d(n)=0 • pre čas > T0(washout time) uložíme • stav siete x(n) ako nový riadok matice M o veľkosti (T-T0+1)x(K+N+L) • tanh-1d(n) ako nový riadok matice T o veľkosti (T-T0+1)xL • Krok 3 (výpočet výstupných váh) • vypočítame čo je Wout s veľkosťou (K+N+L)xL, kde i-ty stĺpec predstavuje i-ty výstupný neurón

  14. Ladenie • nestabilita pri testovaní • treba pridať šum pri procese vzorkovania, teda použiť upravenú rovnicu (1) na tvar: • ako šum zväčša sa použije hodnota z intervalu <0.0001, 0.01> • odstránenie spojení vedúcich z výstupných do výstupných neurónov • počas vzorkovania uložíme stavy bez výstupných neurónov a pri testovaní použijeme modifikovanú rovnicu (2) v tvare:

More Related