1 / 35

Adatbányászati módszerek népzenei elemzések céljára

Adatbányászati módszerek népzenei elemzések céljára.

calvin
Download Presentation

Adatbányászati módszerek népzenei elemzések céljára

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Adatbányászati módszerek népzenei elemzések céljára A szűkebb értelemben vett parasztzene tehát öntudatlanul működő természeti erő átalakító munkájának eredménye ... Éppoly természeti tünemény, mint pl. az állat- vagy növényvilág megnyilvánulási formái. Ennek folytán egyedei – az egyes dallamok – a legmagasabb művészi tökéletesség példái.” (Bartók 1924. 1990 10. o.) Juhász Zoltán, MTA-TTK-MFA 1. A népzenei variálódás modellje 2. Zenei elveket tükröző dallam-vektortér és bázis 3. Zenei típusok és stabilitás-vektorok párhuzamos tanulása önszervező térképen 4. Önszervező felhő – az Kohonen-térkép pontosítása és kiterjesztése 5. Önszervező zenei motívumszótár – az elemi zenei formák feltárása 6. Zenekultúrák kapcsolatainak gépi vizsgálata 7. Zenekultúrák kapcsolatainak jellemzése statisztikai számítással 8. Más alkalmazások: genetika, diagnosztika, kardiológia, biológia

  2. A variánsok életének szimulációs modellje • Alapötlet Pál István dallam-felidézése: az információ egy rokonsági felhőben szétszórva is megtalálható, onnan visszanyerhető.

  3. A szimulációhoz szükséges a dallam matematikai modellje: A dallamvonal vektor Zenei távolság: a dv. vektorok euklideszi, idővetemítéses, vagy másmilyen távolsága

  4. A népzene élet-szimulációja valószínűséggel. Az i. (elfelejtett) dallamot felidézi a j. (élő) dallam: valószínűséggel. Az i. dallamot legalább egy élő felidézi: Zenei táv: Állapotvektor: Táv érzékenység: A szimuláció egy ciklusa: 1. Véletlen felejtés minden élő dallamra egyenlő p valószínűséggel > új állapot: 2. felidézési kísérlet az állapot függvényében, a siker valószínűségével.

  5. A szimuláció eredménye: a népzene önfenntartó optimális rendszer A „nem felejtés” (p) egy kritikus értéke fölött megjelennek a hosszú élettartamú dallamok,de csak az élő népzenei rendszerben. A népzenének tehát struktúrája van. A cél ennek feltárása. A dv. vektorok felhőjének vetülete (PCA) Az élő dallamok (nagy pontok) közötti rokonsági háló p=0,5 fölött stabilizálódik T/K% várható élettartamú dallamok száma különböző nem-felejtési valószínűségek mellett (p) • - Népzenei rendszer élő felidézéssel • Népzenei rendszer véletlen felid. valósz. • - Véletlen rendszer élő felidézéssel Juhász, Z. (2000b). A Model of Variation in the Music of a Hungarian Ethnic Group. Journal of New Music Research 29 (2000) No 2, (pp 159-172).

  6. 2. A zenei bázis meghatározása Zenei elveket tükröző AD térbeli struktúrát keresünk. Probléma: A „struktúra” PCA-val áttekinthetetlen, zeneileg értelmezhetetlen. 2500 magyar nd. első sorainak pontrendszere. Principális bázis: A dallam vektorok kovariancia mátrixának sajátvektorai • A tényleges zenei bázis keresése • A helyi sűrűsödések keresése a felid. val. függvénnyel • A helyi sűrűsödések princ. bázisainak meghatározása • Új bázis konstruálása Schmitt ortogonalizációval a helyi bázisokból

  7. A zenei bázis A zenei rendszert értelmező felhang rsz. Az új bázisvektorok Magyar dallamok első sorai: alaphang – kvint – oktáv alapú zenei rendszer. A sorkezdő és záró hangok ortogonálisan variálódnak. Juhász, Z. (2000a). Contour Analysis of Hungarian Folk Music in a Multidimensional Music- Space. Journal of New Music Research 29 (2000) No 1, (pp 71-83).

  8. Továbblépés szükségessége: • 1. Nagyobb zenei formákhoz nem áttekinthető semmilyen AD lineáris vetület. • 2. A rendszer összefüggő, csak összemosódó helyi sűrűsödései vannak. • 3. Típusokat tanuló algoritmust szeretnénk, ilyen feltételek között. • 4. A típusok zeneileg meghatározó – invariáns - jegyeit is kimutató algoritmust szeretnénk.

  9. 3. Önszervező térkép, adaptív súlytényezőkkel. Eredeti ÖT: a rácspontokhoz rendelt típus vektorokat tanulja: 1. Véletlenül kiválaszt egy tanítóvektort. 2. Megkeresi a leghasonlóbb típusvektort. 3. A típusvektort elmozdítja a tanítóvektor irányába. 4. A típusvektor rácsbeli környezetével u. ezt teszi. > térkép Módosítás: A típusvektorokhoz még súlyvektorokat is rendelünk. A SOM ezeket is tanulja: Az így tanult adaptív súlytényezők jellemzik a dv. idősor l-edik értékének fontosságát (invarianciáját): A típus és a dallam eltérése súlyozott euklideszi távolság:

  10. Eredmény: Két automatikusan tanult magyar típus, a dallamhelyek súlyaival. Juhász, Z. (2007): Analysis of melody roots in Hungarian folk music using self-organizing maps with adaptively weighted dynamic time warping. APPLIED ARTIFICIAL INTELLIGENCE    Volume: 21    Issue: 1    Pages: 35-55

  11. A továbblépés szükségessége: 1. Az ÖT rács-szerkezete helyett folytonos, nagyobb szabadságfokú felhőt szeretnénk. 2. Az ÖT rács 3D 4D változata nehézkes. (5*5 ~ 3*3*3) 3. Az ÖT térképszerűsége csak az osztályozási pontosság feladásával valósul meg. Térképszerűbb és pontosabb tanulást szeretnénk: Önszervező felhő. ÖT ÖF 1 ÖF 2

  12. 4. Önszervező felhő. Az algoritmus 1. lépése: helyi sűrűsödések keresése és a típusvektorok tanulása (K átlag) Dallamvonal vektorok Típus vektorok (csoport-átlagok) Algoritmus: : a k-adik, véletlenül választott dallamvonal vektor (tanító vektor). -ra legjobban hasonlító típus („a győztes”).

  13. Eredmények: típus vektorok és osztályozott dallamok

  14. Az algoritmus 2. lépése: A típusvektorok térképszerű elrendezése AD térben (MDS) A SD típusvektorok távolsága Az AD pontok távolsága Az AD pontok elrendezésének feltétele: Az m-edik AD vektor k-adik koordinátájára vonatkozó rekurzió: .

  15. Eredmény: a magyar népzene típusainak önszervező felhője

  16. Együttműködő tanulás: visszacsatolás a SD típus vektorok tanulása és a megfelelő AD pontok helyzete között • Önszervező felhő kooperatív tanulással • A „győztes” környezetében levő vektorokat is módosítjuk • Az AD pontok elhelyezkedése visszahat a tanulásra • Ezért a konvergencia nem pontos • Az AD rendeződés viszont tagoltabb, térképszerűbb.

  17. Eredmények: Magyar teljes dallamok és első sorok önszervező felhői független és együttműködő tanulással Teljes dallamok Első sorok együttműködő független független együttműködő

  18. Az önszervező felhő és a K átlag, MDS, SOM, PCA algoritmusok a: SOM együttműködő tanulás b: SOM független tanulás a) után c: ÖF független tanulás d: ÖF súlyozott független tanulás e: A típus vektorok PCA vetülete f: ÖF együttműködő tanulás • Előnyök: • síkrács helyett folytonos AD tér • független: pontos, térképszerű • együttm.: van hiba, de tagoltabb a térkép K átlag: független ÖF térkép nélkül PCA: tanítóvektorok lin. térképe tanulás nélkül MDS: tanítóvektorok nemlin. térképe tanulás nélkül SOM: együttműködő ÖF rácshoz kötött térképpel Z. Juhász: Low dimensional visualisation of folk music systems using the self organising cloud. 12th International Society for music information retrieval. 2011. okt. 25-28, Miami, Florida, USA. Szóbeli előadás.

  19. 5. Önszervező zenei motívumszótár Motívum: egy dallamon belül többször, vagy több dallamban gyakran előforduló dallamrészek

  20. Két idősor leghosszabb közös (hasonló) részének keresése részleges din. idővetemítéssel Hasonló szakaszok keresése idősoron belül Vetemítési mátrix Eltérés mátrix Vetemítési mátrix

  21. Önszervező zenei szótár A motívumok azonosítása a SOM pillanatnyi állapotától függ ->A tanítóhalmaz a tanulás során változik Juhász, Z. (2009b): Motive Identification in 22 folksong corpora using dynamic time warping and self organising maps. Proc. of the 10th Internapional Society for Music Information retrieval Conference (ISMIR 2009) ed: K. Hirata, G. Tzanetakis, Japan, october 26-30, Kobe, Japan, pp 171 – 176

  22. Magyar motívum-térkép a zenei bázisban Más típusú motívum térképek Magyarral rokon motívum térképek

  23. 6. Zenei nyelvcsaládok keresése az ismertetett gépi technikákkal Adatbázis (összesen 33 000 dallam, 31 kultúra)Kínai, mongol, kirgiz, volgai, szicíliai, bulgár, azeri, anatólia, karacsáj, magyar, szlovák, morva, román, kasub, finn, norvég, német, luxemburgi, francia, holland, kelta, spanyol, dakota, navajo, komi, mari, kurd, szerb-horvát, orosz, warmiai, nagylengyel „ … az a gyanúm, hogy a földkerekség minden népzenéje, ha elegendő anyag és tanulmány áll majd rendelkezésünkre, alapjában véve visszavezethető lesz majd néhány ősformára, őstípusra, ős – stílus - fajra.” (Bartók 1937) MTA BTK ZTI: - Európai népdalkatalógus digitalizált gyűjtemény: francia (Canteloube), szicíliai (Favara), bolgár (Sztoin), Appalache (Sharp), spanyol (Garcia), orosz (Kotikova), morva (Susil), román (Bartók, Dragoi), szlovák (Bartók, SLP) - Régi magyar népdaltípusok (főszerk: Pávai István) - Anatóliai, azeri, kirgiz, karacsáj, kurd helyszíni gyűjtések (Sipos János könyveiben publikálva) - Hanti, komi (Lázár Katalin könyveiben publikálva) - Mari, csuvas, tatár, votják (Vikár L. és Bereczki G, könyveiben, vmint. Kodály művek forrásai közt publikálva) Polish Academy of Sciences (Institute of Arts, Dr. Ewa Dahlig, Deputy Directory) : - Essen Associative code and folksong database (H. Schaffrath). Német, skót, ír, kínai, dakota gyűjtemények - Kasub, warmiai, nagylengyel gyűjtemények University of Yvaskyla: Finnish Folksong Database Meertens Institute, Utrecht University: Dutch Folksong Database Inner Mongolian University, Kökequota: mongol University of Oslo, Balladerdatatabasen: norvég University of Luxembourg: luxemburgi, lotaringiai Magángyűjtemény: Ördög L. és Ördög M. perui gyűjtései Minden gyűjtemény tud. műhelyben készült. Minden forrás feltünteti az összes dallam gyűjtési adatait.

  24. A gyűjtemények eltérő méreteiből és szerkesztéséből fakadó eltérések kompenzálása Gyűjtemény méretek: 1500 fölött: 16, 1000 fölött: 6, 500 fölött: 9 Minden kultúráról külön ÖF készül. Az ÖF méretét meghatározó feltétel: adott közös küszöb mellett a dallamok 80-85%-át osztályozza. Így a tanult típusok száma a gyűjteményben lévő tényleges típusok számához közelít, függetlenül attól, hogy átlagosan hány dallam tartozik egy típushoz a gyűjteményben. Eredmény: a gyűjteményenként tanult típusok száma közelít egymáshoz: 400 – 576. Az így keletkezett 31 típuskészletet egyesítjük, és ezzel tanítunk egy alkalmas méretű ÖF-t (1000). Így nincsenek előnyben a gyűjteményekben túl sok változattal reprezentált típusok. Előnyben vannak viszont a több kultúrában párhuzamosan meglévő típusok. Ezek közös típusokat tanítanak az egyesített ÖF-n. Juhász, Z. (2006b): A Systematic Comparison of Different European Folk Music Traditions Using Self-Organizing Maps.Journal of New Music Research, 2006, Vol. 35, No. 2, pp 95-112.

  25. 31 kultúra egyesített típuskészletének térképe együttműködő tanulással Kínai, mongol, kirgiz, volgai, szicíliai, bulgár, azeri, anatólia, karacsáj, magyar, szlovák, morva, román, kasub, finn, norvég, német, luxemburgi, francia, holland, kelta, spanyol, dakota, navajo, komi, mari, kurd, szerb-horvát, orosz, warmiai, nagylengyel

  26. Az egyesített felhő gerjesztettségei különböző kultúrák hatására

  27. 7. Az átlapolások véletlenszerűségének elemzése. A kultúrák eltérő típus-számának kompenzálása Kisebb A v. B esetén a csúcs balra tolódik! Mi a valószínűsége annak, hogy N-ből véletlenül kiválasztva egy A és egy B méretű részhalmazt, a metszet éppen x méretű? p(x) N=900, A=255, B=127 x Determ. más Véletlen Determ. rokon Annak valószínűsége, hogy véletlen válogatás esetén a metszet kisebb, mint X: Ha P nagy, a determinisztikus kapcsolat valószínűsége nagy. Z. Juhász and J. Sipos, (2009): A comparative analysis of Eurasian folksong corpora, using self organising maps, Journal of Interdisciplinary Music Studies. (2009), doi: 10.4407/jims.2009.11.005

  28. 31 kultúra kapcsolati hálója MDS-sel szerkesztve. Élek: az okszerű kapcsolat valószínűsége 0,99-nél nagyobb Színek: helyi sűrűsödések Zenei nyelvcsaládok Független genetikai megerősítés: Zenei és genetika rokonság korrelációja: P(z|g)=0,28 P(g|z)=0,82 !!!! A comparative phylogenetic study of genetics and folk music Horolma Pamjav • Zoltán Juhász • Andrea Zalán •Endre Németh • Bayarlkhagva Damdin, Mol Genet Genomics 2012 03. 04.

  29. 8.Helyi sűrűsödés + MDS + ÖF más alkalmazásai: • Populációgenetikai osztályozás, • Születés előtti adatsorok osztályozása diagnosztikai céllal, • Vérnyomásgörbék osztályozása diagnosztikai céllal, • Akusztikai jelek (Madárdallamok, kolomphangok) osztályozása

  30. A legtöbb kultúrában közös terület az egyesített felhőn (a „marker stílus”) Kínai, mongol, volgai, szicíliai, anatóliai, kaukázusi, magyar, szlovák, dakota

  31. A keleti ősnyelv rekonstrukciója a „marker stílust” tartalmazó kultúrákból kínai, mongol, volgai, szicíliai, anatóliai, kaukázusi, magyar, szlovák, dakota (vastag: genetikailag is kimutatottan rokonok) Az egyesített önszervező felhő gerjesztettségei kultúránként Az egyesített önszervező felhő együttműködő tanulással Juhász Z: Őstípusok, népzenei nyelvek elemzése egy öntanuló modell segítségével. In: TÜKRÖZŐDÉSEK. Tanulmánykötet Domokos Mária népzenekutató-zenetörténész tiszteletére 2013, Budapest, L’Harmattan.

  32. „Katonák, négy (?) évezred tekint le rátok”

More Related