50 likes | 218 Views
Raziskovalno delo LHRS, Brezovnik. Sestanek raziskovalne skupine, Maribor, 30.10.2012. Prijavljena tema doktorske disertacije. Detekcija podobnih besedil s pomočjo semantične kompresije in semantične baze znanja iz podatkov Wikipedije. Bistvo raziskave. Detekcija podobnih vsebin
E N D
Raziskovalno deloLHRS, Brezovnik Sestanek raziskovalne skupine, Maribor, 30.10.2012
Prijavljena tema doktorske disertacije • Detekcija podobnih besedil s pomočjo semantične kompresije in semantične baze znanja iz podatkov Wikipedije
Bistvo raziskave • Detekcija podobnih vsebin • copy & shake & paste • Uporaba semantične kompresije • obstaja rešitev na WordNet-u • Uporaba Wikipedije
Problemi • Wikipedija ni semantična baza znanja • poiskati ustrezno obliko • ekstrakcija podatkov • Testni korpus • Čas • 15+ portalov & DKUM & DKMORS & projekti & pedagoško delo
Načrt • Imp. detektor z WordNet-om • Imp. detektor z Wikipedijo • Najdi/naredi testni korpus • Imp. orodja za primerjavo rezultatov • Izvedba primerjave • brez kompresije / WordNet / Wikipedija • Članek