140 likes | 383 Views
Analýza fuzzy filtra pre fuzzy rozhodovacie stromy. Savčák Peter. Dnes sa môžete dozvedieť:. Rozhodovacie stromy Entropia Informačný zisk Klasický rozhodovací strom vs. fuzzy rozhodovací strom Algoritmus ID3 Orezávanie rozhodovacích stromov Fuzzy rozhodovacie stromy
E N D
Analýza fuzzy filtra pre fuzzy rozhodovacie stromy Savčák Peter
Dnes sa môžete dozvedieť: • Rozhodovacie stromy • Entropia • Informačný zisk • Klasický rozhodovací strom vs. fuzzy rozhodovací strom • Algoritmus ID3 • Orezávanie rozhodovacích stromov • Fuzzy rozhodovacie stromy • Analýza úrovne fuzzy filtra vo fuzzy rozhodovacom strome • Príklad
Nelistový uzol stromu predstavuje test na hodnotu atribútu Vetva smerujúca z tohto uzla predstavuje možné výsledky testu Listové uzly stromu sú ohodnotené identifikátorom tried teda výsledkami klasifikácie Vlastná klasifikácia prebieha od koreňa stromu k listom stromu Rozhodovacie stromy
Konštrukcia rozhodovacieho stromu: 1, vytvor uzol N, 2, pokiaľ sú vzorky v S rovnakej triedy C, potom ohodnoť N identifikátorom C a skonči, 3, pokiaľ je D prázdne, potom ohodnoť N identifikátorom triedy prevládajúcej v S a skonči, 4, ohodnoť N atribútom t z D, ktorý má najväčší informačný zisk, 5, pre každú hodnotu vi atribútu t vytvor z N hranu ohodnotenú podmienkou t = vi do uzlu Rozhodovacie stromy sú výkonným nástrojom pri rozhodovacom procese
Definícia: Nech A je atribút, a1, a2 ,a3 , ... ,an , sú jeho hodnoty a c1, c2, c3, ... , cn, sú klasifikačné triedy, potom entropia atribútu A sa vypočíta podľa vzťahov: kde P znamená pravdepodobnosť Entropia
Informačný zisk je miera odvodená z entropie. Vzťah: kde Vzťah pomernéhoinformačného zisku: kde Informačný zisk
Lotfi Zadeh navrhol rozhodovací model - obmedzenia a ciele sú považované za fuzzy množinu. Fuzzy rozhodnutie môže byť definované ako voľba spĺňajúca súčasne obmedzenia a ciele. Optimálne rozhodnutie má najväčší stupeň príslušnosti. Spojenie rozhodovacích stromov a fuzzy množín umožnuje lepšiu odolnosť voči poruchám, robustnosti a aplikovateľnosti v neurčitých kontextoch. Fuzzy rozhodovací strom je stromová štruktúra, v ktorej každá hrana je komentovaná podmienkami a každý list je komentovaný fuzzy množinou. Klasický rozhodovací strom vs. fuzzy rozhodovací strom
Vlastnosti: rozšírením metódy klasifikácie založený na výberu testu v uzle a hodnôt vo vetvách účinný algoritmus na generovanie fuzzy rozhodovacieho stromu Algoritmus ID3
Štruktúra: Vykonávaj slučku pokiaľ hĺbka stromu nedosiahlaalebo nie je ďalší vrchol: a) urč entropiu pre každý atribút z trénovacej množiny, ktorý ešte nie zahrnutý. b) zväčši atribút o minimálnu očakávanú entropiu. c) zastav rozširovanie listového vrchola , ak entropia je rovná 0 alebo je blízka 0. d) použi post prunig a Stop. Koniec slučky. Algoritmus vyvinul J.F. Baldwin so svojimi spolupracovníkmi
Orezávanie rozhodovacích stromov je jeden zo spôsobov zdokonalenia samotného rozhodovacieho stromu Spôsoby orezávania stromov: orezávanie pri konštruovaní stromu orezávanie po samotnej konštrukcií stromu Druhá metóda je výpočtovo náročnejšia ako prvá Orezávanie rozhodovacích stromov
Fuzzy rozhodovací strom - rozšírenie klasického rozhodovacieho stromu Základnou charakteristickou črtou - uvažuje hodnotu v rozmedzí [0,1] Podáva vysoký výkon Fuzzifikácia prevádza relácie do neurčitosti klasifikácie Fuzzy rozhodovacie stromy
Fuzzy filter resp. vhodná heuristicka metóda ovplyvňuje stavbu fuzzy rozhodovacieho stromu Filter fuzzy množinymôžeme odstrániť niektoré neurčité informácie s nižším pravdivostným stupňom Hodnota a určuje koncentráciu znalostného filtra Výber a priamo ovplyvňuje výkon fuzzy rozhodovacieho stromu Zvyšovaním hodnoty a , niektoré nejednoznačné malé dáta respektíve rušivé dáta, budú odstránené Vysokéa ale môže zapríčiniť stratu dôležitých dát Analýza úrovne fuzzy filtra vo fuzzy rozhodovacom strome
Uvažujme malú dátovú množinu auta Hlavné dáta príkladu pre atribút A1, A2, A3je max { 0.9, 0.1 } = 0.9, max { 1.0, 0.0, 0.0 } = 1.0, max { 1.0, 0.0 } = 1.0 Množina hlavných dát trénovacej množiny Príklad