80 likes | 234 Views
Predstavitev raziskovalnega dela v Laboratoriju za heterogene računalniške sisteme. Milan Ojsteršek. Cilj.
E N D
Predstavitev raziskovalnega dela v Laboratoriju za heterogene računalniške sisteme Milan Ojsteršek
Cilj • Zgraditi sistem, ki bo znal iz domensko specifičnih strukturiranih in nestrukturiranih vsebin izluščiti znanje, ki bo se bo uporabljalo pri pomenskem iskanju in odgovarjanju na vprašanja v naravnem jeziku.
Glavna področja raziskovanja • Ogrodje za gradnjo pomenskih slovarjev • uporabniški vmesnik za prikaz in podsodabljanje pomenskih slovarjev, • uporabnikov pomenski označevalnik, • uporaba algoritma COALS in algoritmov za določanje kolokacij pri dopolnjevanju pomenskih slovarjev. • Razločevanje večpomenskosti in pomenski označevalnik. • Priporočilni sistem in sistem za pomensko iskanje ter sistem za odgovarjanje na vprašanja v naravnem jeziku. • Detekcija plagiatov. • Digitalna knjižnica.
Infrastruktura, ki smo jo vzpostavili • POS označevalniki: Slovenski, Nemški , Angleški • Iskalnik konkordanc • Različni algoritmi za določanje kolokacij • Orodje za gradnjo pomenskih slovarjev • Pomensko označevanje • Korpus slovenskih strokovnih besedil • Sistem za vsebinsko priporočanje
Uporaba pomenskega podpisa • Pomoč pri ugotavljanju pomena večpomenskih besedmih zvez. • Ugotavljanje podobnosti posameznih odsekov besedil v različnih dokumentih. • Gručenje dokumentov pri priporočanju vsebin. • Rangiranje dokumentov pri iskanju (nestrukturirani in strukturirani viri). • Avtomatska klasifikacija dokumentov.