70 likes | 193 Views
Termin ológia. Dušan Zeleník dusan.zelenik@fiit.sk 24.3.2010. Klasifikácia a kategorizácia zaradenie entity do príslušných tried, kategórií s učiteľom (supervised) K lasifikácia využíva triedy sú pevné, definované nemenné, pomenované K ategorizácia využíva kategórie
E N D
Terminológia Dušan Zeleník dusan.zelenik@fiit.sk 24.3.2010
Klasifikácia a kategorizácia • zaradenie entity do príslušných • tried, kategórií • s učiteľom (supervised) • Klasifikácia využíva triedy • sú pevné, definované nemenné, pomenované • Kategorizácia využíva kategórie • nepresné, nedozreté pomenovanie • prekryv kategórií Zhlukovanie • bez učiteľa (unsupervised) Klasifikácia, kategorizácia, zhlukovanie
Presnosť & úplnosť • Presnosť • je podiel počtu získaných relevantných dokumentov k počtu všetkých získaných dokumentom • Úplnosť • je podiel počtu získaných relevantných dokumentov k počtu relevantných dokumentov • často sa používa návratnosť, pokrytie Precison& Recall
lematizácia • účelom lematizácie je nájdenie lemy slova • lema - morfologický základ slova - lexéma • vyrábame lematizátor • stemming • proces redukcie slov na ich koreň, základný tvar • vyrábame stemmer Lematizácia, stemming
kontext • textová spojitosť, súvislosť • súbor súvislostí, situácia; spojitosť, okolnosť vplývajúca na objekt • kontext používateľa, ale i dokumentu, či softvéru • kontextuálne prispôsobovanie (context adaptation) • zmena správania systému podľa • aktuálneho kontextu, atribútov prostredia • personalizácia • prispôsobenie systému podľa • individuality používateľa, jeho záujmov, chutí Context
web crawler, Web spider, Web robot • sťahovač, lezúň • začne z jednéhoaleboviaczdrojovliniek • vyhľadávalinky v dokumentoch • rekurzívnepokračuje • ukladá • sťahovac = downloader • lezúň = crawler = preliezač • sťahúň Web Crawler
Mustra • kto je hoden al. čo je hodnonasledovania • čo je určené, obyč. akopomôckananapodobňovanie Baseline