120 likes | 239 Views
AKD VII. Diskriminační analýza. Základ metody. Klasifikace do dvou či více skupin (skrze přímku, rovinu či nadrovinu) Obdoba logistické regrese Prediktory spojitého typu Metoda klasifikace se známou příslušností do skupin (aspoň u části jednotek). 3 přístupy.
E N D
Základ metody • Klasifikace do dvou či více skupin (skrze přímku, rovinu či nadrovinu) • Obdoba logistické regrese • Prediktory spojitého typu • Metoda klasifikace se známou příslušností do skupin (aspoň u části jednotek)
3 přístupy • Predikční – příklady (původní smysl) • Popis vztahu dichotomie s ostatními proměnnými - příklady • Porovnání skupin - příklady
Grafická prezentace problému • rozetnutí prostoru na 2 části • ideální rozdělení případů (min. chyba klasifikace) • Užívají se tzv. diskriminační funkce
Základní logika – Bayesův vzorec • Aposteriorní pravděpodobnost založena na apriorní a hodnotě věrohodnostní funkce pro příslušnou podskupinu
Základní kroky • Popisná statistika – vhled do problému • Testy analýzou rozptylu • Test shody kovariančních matic • Standardizované koeficienty diskriminanční funkce • Wilksova lambda • Grafy • Klasifikační tabulka
Vyhodnocení klasifikace - přístupy • Resubstituce • Zadržování pozorování • Trénovací a testovací soubor • ROC křivka
Vyhodnocení klasifikace - ROC • Základní význam – grafické hodnocení úspěšnosti nějakého klasifikátoru (ale dnes i číselné hodnocení-viz dále AUC) • Možné použít pro diskriminační analýzu, ale i pro výsledky jakékoliv jiné klasifikace • Původ ROC je v radiotechnice (2. světová válka)
Klasifikační tabulka • Odvození FPR, TPR atd.
Vyhodnocení klasifikace - ROC • Osa X: 1-FPR (1-specificita) • Osa X: TPR (sensitivita) • Lze srovnat více křivek (predikčních modelů) • Lze testovat