1 / 21

Zpracování informací a znalostí Zadání úkolu č. 4 – DZD

Zpracování informací a znalostí Zadání úkolu č. 4 – DZD. Jan Rauch Katedra informačního a znalostního inženýrství. Obsah. Úkol číslo 4: DZD Asocia č n í pravidla a 4ft-Miner – vybrané pojmy Mimořádné konzultace. Úkol číslo 4: DZD – zadání (1).

eli
Download Presentation

Zpracování informací a znalostí Zadání úkolu č. 4 – DZD

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Zpracování informací a znalostíZadání úkolu č. 4 – DZD Jan Rauch Katedra informačního a znalostního inženýrství

  2. Obsah • Úkol číslo 4: DZD • Asociační pravidla a 4ft-Miner – vybrané pojmy • Mimořádné konzultace

  3. Úkol číslo 4: DZD – zadání (1) Seznamte se se systémem LISp-Miner. K tomu jsou k dispozicitutoriálynaadresehttp://lispminer.vse.cz/tutorial/, použijtepříklad Barbora, viz Barbora - analyza dat.ppsxa http://lispminer.vse.cz/tutorial/t8.html. Vyřešte dílčí analytickou otázku přiřazenou vašemu týmu na následujícím slide. Podrobnosti jsou v souboruAdamek_4IZ210_11_12_leto_ZADANI.pdf, bude k dispoziciionline verse. Výsledkem budou analytické zprávy prezentované pomocí CMS systému JOOMLA, viz http://www.joomla.org/. Podrobnosti budou sděleny na příštím cvičení. Data jsou v souboru Adamek11_CASLAV.zip. Podrobný popis dat je v souboru Adamek_pro_KIZI_0412.pdf , bude k dispoziciionline verse.

  4. Úkol číslo 4: DZD – zadání (2)

  5. Úkol číslo 4: DZD – skupiny atributů

  6. Úkol číslo 4: DZD – data

  7. Úkol číslo 4: CRISP-DM • Porozumění problematice - nevyžaduje se specializovaná medicínská znalost, případné další podrobnosti lze nalézt na webu. • Porozumění datům – viz Adamek_pro_KIZI_0412.pdf • Transformace dat – viz Adamek_pro_KIZI_0412.pdf + LMDataSource • Analytické procedury – asociační pravidla, aplikace procedury 4ft-Miner • Interpretace výsledků a Využití výsledků –analytická zprávav CMS JOOMLA

  8. Úkol číslo 4: DZD – poznámky (1) • Pro přípravu a transformace dat použijte proceduru LMDataSource, viz http://lispminer.vse.cz/tutorial/VideoTutorial/vt2/vt2.html a http://lispminer.vse.cz/tutorial/VideoTutorial/vt3/LMDataSource.html . • Pro řešení analytické otázky použijte proceduru 4ft-Miner, viz http://lispminer.vse.cz/tutorial/t4.html, http://lispminer.vse.cz/tutorial/t5.html a http://lispminer.vse.cz/tutorial/VideoTutorial/vt4/4ftTask.html a případně též LMDataSource_0409.pdfa 4ft-Miner_Cedenty_1111.pdf, • Podrobnosti o tvorbě analytické zprávy budou sděleny na dalším cvičení. • Další informace budou poskytnuty dle potřeby.

  9. Úkol číslo 4: DZD – poznámky (2) • Systém LISp-Miner je vyvíjen na FIS VŠE pro potřeby výzkumu a vývoje, byl vícekrát použit i pro analýzu reálných dat. • Procedura 4ft-Miner je jednou z analytických procedur implementovaných v systému LISP-Miner. Ve výuce předmětu 4IZ210 jsou využity pouze některé možnosti procedury 4ft-Miner . • V systému LISp-Miner jsou mimo jiné další dvě procedury které pracují s asociačními pravidly, přesněji se zajímavými dvojicemi asociačních pravidel. • Procedura SD4ft-Miner hledá dvojice asociačních pravidel které ukazují na dvě podmnožiny objektů, výrazně se lišící co se týče charakteristik nějakého asociačního pravidla. • Procedura Ac4ft-Miner hledá dvojice asociačních pravidel které naznačují nějakou potenciálně užitečnou akci. • Podrobnosti budou sděleny na přednášce.

  10. Asociační pravidla a 4ft-Miner – vybrané pojmy • Matice dat a booleovské atributy • Asociační pravidlo a cedenty v proceduře 4ft-Miner • Příklady 4ft-kvantifikátorů • Příklady zadání parametrů procedury 4ft-Miner

  11. Matice dat a booleovské atributy Matice datM Základní boolevské atributy Atributy Odvozené booleovské atributy: A1(3)  A2(5,7),  A1(4), A1(3)  A2(5,7)

  12. Asociační pravidlo v proceduře 4ft-Miner 4ft-kvantifikátor Sukcedent Antecedent    1 … p  1 … q Dílčí sukcedent Dílčí antecedent Dílčí sukcedent Dílčí antecedent

  13. Cedent a dílčí cedenty (1) Cedent = antecedent, sukcedent nebo podmínka Dílčí cedent = dílčí antecedent, dílčí sukcedent nebo dílčí podmínka Dílčí cedent i= i,1…  i,ki konjunkce literálů literál literál

  14. Cedent a dílčí cedenty (2) Cedent = antecedent nebo sukcedent Dílčí cedent = dílčí antecedent nebo dílčí sukcedent Dílčí cedent i= i,1…  i,ki disjunkce literálů literál literál

  15. Literál a koeficient positivní literál A() literál   A() negativní literál A() – základní booleovský atribut  – coefficient

  16. Příklady 4ft kvantifikátorů  p,Base  Nejméně 100p procent objektů splňujících  splňuje také  a nejméně Base objektů matice Msplňuje  i .  +p,Base  Relativní četnost objektů splňujících  mezi objekty splňujícími  je alespoň o 100p procent vyšší než relativní četnost objektů splňujících  v celé matici M a zároveň nejméně Base objektů matice splňuje  i 

  17. Příklad: 4ft-Miner – Vstup Množina relevantních antecedentů 4ft-kvantifikátor Množina relevantních sukcedentů Minimální a maximální délka antecedentů Množina relevantních podmínek

  18. Koeficient interval – příklad `` 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32,...., 59, 60, 61, 62, 63, 64, 65, 66 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32,...., 59, 60, 61, 62, 63, 64, 65, 66 21,22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32,....,59, 60, 61, 62, 63, 64, 65, 66 ,....,

  19. Koeficient Left cut – příklad zadání 21,22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32,...., 59, 60, 61, 62, 63, 64, 65, 66 21, 22,23, 24, 25, 26, 27, 28, 29, 30, 31, 32,...., 59, 60, 61, 62, 63, 64, 65, 66 21, 22, 23,24, 25, 26, 27, 28, 29, 30, 31, 32,...., 59, 60, 61, 62, 63, 64, 65, 66 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32,...., 59, 60, 61, 62, 63, 64, 65, 66

  20. Koeficient Right cut – příklad zadání 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32,...., 59, 60, 61, 62, 63, 64, 65, 66 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32,...., 59, 60, 61, 62, 63, 64, 65, 66 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32,...., 59, 60, 61, 62, 63, 64, 65, 66 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32,...., 59, 60, 61, 62, 63, 64, 65, 66

  21. Mimořádné konzultace • Vzhledem ke státním svátkům 1. a 8. května vyhlašuji mimořádné konzultační hodiny: • středa 2. 5. 2012 v době 13.15 až 14.15 • středa 9. 5. 2012 v době 13.15 až 14.15. • Další mimořádné konzultace lze dohodnou pomocí e-mailu

More Related