180 likes | 307 Views
SOLIM „Erdvinės ontologijos kalbos naudojimas modeliuojant multimedijos informaciją “ ( S patial O ntology L anguage for M ultimedia I nformation M odeling). Eureka Eurostars project E! 4365. Apie EUROSTARS.
E N D
SOLIM„Erdvinės ontologijos kalbos naudojimas modeliuojant multimedijos informaciją“(Spatial Ontology Language for Multimedia Information Modeling) Eureka Eurostars project E! 4365
Apie EUROSTARS • EUROSTARS yra pirmoji Europos inovacijų programa, specialiai skirta finansuoti mažas ir vidutines įmones (MVĮ), vykdančias mokslinius tyrimus, investuojančias į inovacijų ir naujų technologijų kūrimą. Tai Europos Komisijos (EK) ir programos „Eureka“ valstybių narių iniciatyva • EUROSTARS programos tikslas – skatinti Europos MVĮ, vykdančias mokslinius tyrimus ir inovacijas, kurti konkurencingus produktus pasaulinėje rinkoje ir tapti lyderėmis savo srityse, skiriant finansavimą tarptautiniams mokslo ir inovacijų projektams.
KodėlEUROSTARS? Dalyvavimo programoje privalumai: • Europos parama skirta mažų ir vidutinių įmonių moksliniams tyrimams ir plėtrai • Paprastos dalyvavimo projekte procedūros ir ataskaitos • Nacionalinio projekto koordinatoriaus pagalba • Stipri programos orientacija į praktinį rezultatą • Galimybė sukurti inovatyvias, konkurencingas technologijas, produktus • Galimybė užmegzti ilgalaikius ryšius su užsienio partneriais • Įgyti dalyvavimo tarptautiniuose projektuose patirties • Turint technologijas ir produktus, suteikiama galimybė plėstis ne tik Lietuvos, bet ir pasaulinėje rinkoje
Kaip gimė projektas? Buvo vykdytas EUREKA programos finansuojamas projektas MATT (WEB-BASED MULTILINGUAL AUTOMATED TERMINOLOGY TRANSLATION SYSTEM). Projekto koordinatoriai – Olandai mūsų įmonę atrado http://cordis.europa.eu/ svetainėje, kaip partnerius Europiniams projektams.
SOLIM apžvalga • Tikslas: SOLIM papildys informacijos analizę išplečiant ontologines kalbas, koncentruojantis į Ontologinę Interneto kalbą (Ontology Web Language (OWL)) ir šių technologijų panaudojimą sprendimo priėmimui esant erdvės dimensijoms • Rezultatas: išplėsti SOLIM projektu erdvinę ontologinę kalbą prie Ontologinės Interneto kalbos (Ontology Web Language (OWL) priedu OWL-DL (Descriptive Logics – aprašomoji logika). • Tikrinimas: projekto rezultatas tikrinamas 2 kryptimis – mašininio vertimo sistema (Tilde) ir nuotraukų paieška (PicSearch). • Partneriai: SemLab (Koordinatoriai, Olandija); Tilde IT (Lietuva); Picsearch (Švedija); AGMLab (Turkija). • svetainė: www.solim.eu
Apie mašininį vertimą (MV) • Šiuo metu naudojamos 3 pagrindinės technologijos mašininio vertimo kūrimui: • Taisyklėmis paremtas MV (Rule based MT (RBMT)) • Pavyzdžiais paremtas MV (Example based MT (EBMT/SMT)) • Statistinis MV (Statistical MT (SMT)) • Norint sukurti RBMT, reikia turėti/sukurti labai daug taisyklių ir žodynų • Norint sukurti EBMT/SMT, reikia turėti/sukurti labai daug vertimo pavyzdžių • SMT gali būti apmokytas naudojant paralelius tekstynus (korpusus) • SMT šiuo metu plačiausiai naudojama technologija MV kūrimui
Apie ontologijas Ontologija - žinių apie tai, kokios sąvokos egzistuoja pasaulyje ir kaip jos susiję šaltinis, pateikiantis hierarchinį sąvokų tinklą su apibrėžtais ryšiais tarp jų pavidalu.
Ontologijos naudojamos • Dirbtinio intelekto, • Semantinio žiniatinklio, • Programinės įrangos inžinerijos, biomedicinos informatikos, bibliotekininkystės ir informacijos architektūros srityse • Kaip žinių apie pasaulį ar tam tikras jo dalis pateikimo forma.
Mašininis vertimas + ontologijos Ontologija pagerina MV, nes išsprendžia žodžių daugiaprasmiškumo problemą.
Solim privalumai Suteikia galimybę priimti tikslesnį sprendimą ir terminus susijusius su erdvinėmis savybėmis pvz.: • dimensija • orientacija • vieta • atstumas • skiltis • morfologija • judesys?
Pavyzdžiai • P(Georgia | Gruzija) ≅ P(Georgia | Džordžija) • Pavyzdžiui: • The president of Georgia visited Lithuania yesterday. • There are Lithuanians living in Georgia and other states. • A recent court ruling gives Georgia, Alabama and Florida three years to resolve their conflict over use of the water from Lake Lanier. • Experts have failed to travel to Georgia at the Tbilisi international airport. • Azerbaijan has bad relations with Armenia, so it cannot afford to have such relations with Georgia. • US president visited Georgia last month. • Teoriškai, pavyzdžius 3,4 ir 5 MV gali išversti tiksliau naudojant erdvines ontologijas
Semantinė paieška:moteris; eifelio_bokštas;atitinka erdvinei užklausai:“moteris Paryžiuje (Prancūzija)” (trivialu ) pavyzdžiai : http://img234.imageshack.us/img234/7573/jeanbrauddevantlatoureigx0.jpg
(trivialu ) pavyzdžiai Angliški sakiniai kuriems teisingai išversti reikalinga ontologija:panaudojant vietą:“Paris Hilton visits Hilton Paris.“panaudojant dimensiją:“I once shot an elephant in my pajamas.”How he got in my pajams I'll never know… Groucho Marxetc…
Ką projektas davė mūsų įmonei? • Turėjome galimybę ištirti vieną iš būdų kaip patobulinti mašininį vertimą • Užmezgėme ilgalaikius kontaktus su kitų šalių specialistais • Mūsų specialistai įgijo dar daugiau žinių susijusių su mašininio vertimo technologijomis ir jų panaudojimu • Įgijome tarptautinių projektų valdymo patirties
Išvados • Ontologijų integravimas atveria galimybes ateityje tikslinti MV • Semantikos naudojimas leidžia integruoti ne tik ontologijas, bet ir morfologiją, sintaksę į statistinį MV. • Ateities eksperimentai ir įvertinimai reikalingi norint dar daugiau gerinti MV.