1 / 11

KDD II

KDD II. David Pejčoch. KDD vs. data mining. KDD = Knowledge discovery in databases, česky Získávání znalostí z databází nebo DZD = celý proces (viz např. CRISP-DM) data mining = část procesu spočívající ve vlastním vytěžení ... ale... v praxi se rozdíl mezi pojmy stírá. Klíčové výzvy KDD.

jaunie
Download Presentation

KDD II

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. KDD II David Pejčoch

  2. KDD vs. data mining • KDD = Knowledge discovery in databases, česky Získávání znalostí z databází nebo DZD = celý proces (viz např. CRISP-DM) • data mining = část procesu spočívající ve vlastním vytěžení • ... ale... v praxi se rozdíl mezi pojmy stírá

  3. Klíčové výzvy KDD • Začlenění dodatečných znalostí do modelů • Srozumitelná reprezentace získaných znalostí • Větší interaktivita s uživatelem • Vypořádání se s nekvalitními daty • Zohlednění subjektivních metrik • Media mining • Relační data mining (bez nutnosti specifické přípravy) • Vytěžování sociálních sítí (Facebook v ČR 2,7 mio)

  4. Jaké použít nástroje? • Nekomerční • Weka, Yale, R, Rapid Miner, Knime • Komerční • SAS EnterpriseMiner (kvadrant leaderů) • SAS STAT modul • IBM SPSSModeller (dříve Clementine) (kvadrant leaderů • Angoss Software • ... v některých případech jsou součástí DB řešení

  5. ... jaké je zadání? • Přiřazení analytické otázky jednotlivým týmům • Určení antecedentu a sukcedentu • Použití procedury ASSOC • Fundovaná implikace • AA kvantifikátor • Nalezení rozumného počtu pravidel • Interpretace s využitím dodatečných znalostí • Automatické vytvoření zprávy na SEWEBAR • Syntetizující zpráva na SEWEBAR

  6. Analytické úlohy pro naše týmy

  7. Doporučené nastavení cedentů

  8. Doporučené nastavení: • Literal type = Basic • Gace type = Positive • Mění se podle zadání: • Coefficient type • Coefficient length

  9. Použití procedury ASSOC

  10. ... tak, jdeme na to

More Related