190 likes | 387 Views
PRIMERI. ML in DM. M. Gams f Jozef Stefan Institute. Pokazati, kako se uporablja metode ML in DM s primeri. NAMEN. zbiranje podatkov vnos v paket popravljanje podatkov, vizualizacija uporaba ene ali več metod preverjanje metode spreminjanje parametrov metode. OSNOVNO U ČENJE.
E N D
PRIMERI ML in DM M. Gamsf Jozef Stefan Institute
zbiranje podatkovvnos v paketpopravljanje podatkov, vizualizacijauporaba ene ali več metodpreverjanje metodespreminjanje parametrov metode OSNOVNO UČENJE
strojno učenje: supervised, unsupervised …klasificiranje: odl. drevesa, Bayesovi klasifikatorji, diskriminantne funkcije, SVM (support vector machines), nevronske mreže, genetski (evolucijski) algoritmi, hibridni OSNOVNO UČENJE/ klasificiranje
možnosti3x (1,2,3) 3 x 3 x 3 = 27 cel prostor 100 3 … število delcev v vesolju PRIMER
Populacijska evolucija: potomci, selekcija, najboljši imajo nove potomceGenetska koda kot zaporedje simbolov, 3 osebki: 111, 222, 321križanje (breeding)111 + 222122(2), 212(0), 221(1), 211(0), 121(2), 112(1)Mutacija (each third individual, next position, +1)222(1), 212(0), 221(1), 221(1), 121(2), 112(1) GENETSKI ALGORITMI
111, 222, 3211+2 222(1), 212(0), 221(1), 221(1), 121(2), 112(1)1+3 122(2), 311(0), 321(1), 111(1), 121(2), 111(1)2+3 231(0), 321(1), 322(1), 323(2), 222(1), 221(1)3 BEST: 121(2), 122(2), 323(2)NEXT STEP: SEVERAL SOLUTIONS 123(3) GENETSKI ALGORITMI
if high_fever then illnessif fever > 37 then illnessif (axilliar = yes) and (degree of diff = fairly) and (lung = no) and (sex = female) then breast (100%) Rešitev: if x1=1 and x2=2 in x3=3 then (3). PRAVILA:
Hevristika: število ujemanj z 123First step:if x1=1 then (1)if x1=2 then (0)if x1=3 then (0)Next step:if x1=1 and x2=2 then (2)if x1=1 and x2=3 then (1)if x1=2 and x2=2 then (1)Next step: if x1=1 and x2=2 and x3=3 then solution (3) PRAVILA:
Nevronske mreže: Output(neuron) = 1 if Σ wi xi > C 0 otherwise Our case: 9 connections if w1 = 1, w5 = 1 w9 = 1, Σ wi xi = 3 100010001 123123123 x1 x2 x3
Learnweights wiexamplesin a sequence 3 3 3 (1) 111111111 (3) 3 3 2 (0) 110110111 (1) 3 3 1 (0) 110110101 (1) 3 2 3 (2) 110110001 (2) 3 2 2 (1) 110110001 (1) 3 2 1 (1) 110110001 (1) 3 1 3 (1) 110110001 (2) 3 1 2 (0) 110010001 (0) 3 1 1 (0) 110010001 (0) 2 3 3 (1) 110010001 (2) 100010001 Nevronske mreže:
11(1) 12(2) 13(1) DA NE DA NE NE x2=2 x1=1 2x2x3 3x2x3 x1=1 NE NE 1x2x3 12x3 NE x3=3 x1=1 11x3 13x3 x2=2 123 DA NE DA NE 121(2) 122(2) 123(3) DA NE DA NE Učni primeri a) 1x2x3 cel prostorb) primer s tabeloHevristika kot prejIdeja: razdelimo prostor z atributom in ponavljamo DREVESA
Taksonomija strojnega učenja Strojno učenje Nadzorovano Nenadzorovano Klasifikacija Regresija Odkrivanje enačb ILP Razvrščanje v skupine Asociacije
Taksonomija strojnega učenja Strojno učenje Nadzorovano Nenadzorovano Klasifikacija Regresija Odkrivanje enačb ILP Razvrščanje v skupine Asociacije
Klasifikacija • Primer je opisan z množico atributov • Diskretni: DA/NE, barva, dan, … • Zvezni: višina, cena, teža, … • Določamo razred (diskreten)
PRAVILA, KLASIFIKACIJA List – število vseh primerov v listu, ter drugega razreda
MERE Klasifikacija mačke – matrika zamenjav
MERE Accuracy – točnost 19/28= 0,6785 pravilno napovedani / vsemi (za vse razrede ali enega) TP + TN / vsemi (za en razred) (5+18)/28=0,82 Recall - priklic koliko od razreda (mačke) smo jih priklicali pravilno TP / (TP + FN) 5/(5+3)=0,625 Precision – natančnost ob napovedi razreda (mačke) smo jih zadeli koliko TP / (TP + FP) 5/(5+2)=0,71
VELIKO ISKALNIH METOD, ZANIMAJO NAS TISTE, KI DELAJO NAD ZBRANIMI PODATKI GENETSKE, EVOLUCIJSKE METODE UČENJE PRAVILUČENJE DREVESZBEREMO PODATKE, JIH VNESEMO V PAKET, ANALIZIRAMO PODATKE Z RAZNIMI METODAMI IN RAZNIMI PARAMETRI, ZBEREMO UGOTOVITVETAKA BO SEMINARSKA NALOGA OZ. IZPIT DISKUSIJA