70 likes | 192 Views
Termin ológia. Dušan Zeleník dusan.zelenik@fiit.sk 24.3.2010. Klasifikácia a kategorizácia zaradenie entity do príslušných tried, kategórií s učiteľom (supervised) K lasifikácia využíva triedy sú pevné , definované nemenné , pomenované K ategorizácia využíva kategórie
E N D
Terminológia DušanZeleník dusan.zelenik@fiit.sk 24.3.2010
Klasifikácia a kategorizácia • zaradenie entity do príslušných • tried, kategórií • s učiteľom (supervised) • Klasifikácia využíva triedy • súpevné, definovanénemenné, pomenované • Kategorizácia využíva kategórie • nepresné, nedozretépomenovanie • prekryvkategórií • Zhlukovanie • bezučiteľa (unsupervised) Klasifikácia, kategorizácia, zhlukovanie
Presnosť & úplnosť • Presnosť • je podielpočtuzískanýchrelevantnýchdokumentov k počtuvšetkýchzískanýchdokumentom • Úplnosť • je podielpočtuzískanýchrelevantnýchdokumentov k počturelevantnýchdokumentov • často sa používa návratnosť, pokrytie Precison& Recall
lematizácia • účelomlematizácie je nájdenielemyslova • lema - morfologickýzákladslova - lexéma • vyrábamelematizátor • stemming • procesredukcieslovnaichkoreň, základnýtvar • vyrábamestemmer Lematizácia, stemming
kontext • textováspojitosť, súvislosť • súborsúvislostí, situácia; spojitosť, okolnosťvplývajúcanaobjekt • kontextpoužívateľa, ale idokumentu, čisoftvéru • kontextuálneprispôsobovanie (contextadaptation) • zmena správania systému podľa • aktuálneho kontextu, atribútov prostredia • personalizácia • prispôsobenie systému podľa • individuality používateľa, jeho záujmov, chutí Context
web crawler, Web spider, Web robot • sťahovač, lezúň • začne z jednéhoaleboviaczdrojovliniek • vyhľadávalinky v dokumentoch • rekurzívnepokračuje • ukladá • sťahovac= downloader • lezúň = crawler • sťahúň WebCrawler
Muštra • kto je hoden al. čo je hodnonasledovania • čo je určené, obyč. akopomôckananapodobňovanie Baseline