130 likes | 249 Views
Zjednotené vyhľadávanie nad prepojenými dátami na webe. Bc. Peter Macko. Vedúci: Ing. Michal Holub. Naše ciele. Písanie dopytov pre sémantický web Využitie prirodzeného jazyka Dopyty so synonymami a nadskupinami slov Inteligentné doplňovanie dopytu. Person. Author. Schéma fungovania.
E N D
Zjednotené vyhľadávanie nad prepojenými dátami na webe Bc. Peter Macko Vedúci: Ing. Michal Holub
Naše ciele • Písanie dopytov pre sémantický web • Využitie prirodzeného jazyka • Dopyty so synonymami a nadskupinami slov • Inteligentné doplňovanie dopytu Person Author Peter Macko – Zjednotené vyhľadávanie nad prepojenými dátami na webe – Michal Holub
Schéma fungovania Articleswritten by Mária Bielik students Articleshas-author ?x student-of Mária Bielik ?y rdf:typeacm:Article ?y acm:has-author ?x ?x acm:student-of „Maria Bielik“ Peter Macko – Zjednotené vyhľadávanie nad prepojenými dátami na webe – Michal Holub Show Articles written by MáriaBielik‘s students.
Napovedač Peter Macko – Zjednotené vyhľadávanie nad prepojenými dátami na webe – Michal Holub Odstránenie nepresnosti dopytu Napovedanie na základe predchádzajúcich častí dopytu
Predspracovanie štruktúry Peter Macko – Zjednotené vyhľadávanie nad prepojenými dátami na webe – Michal Holub • Dekorácia entít a väzieb v datasete • Slová zo schémy datasetu • Slová z nadtried / podtried • Slová z WordNet
Predspracovanie hodnôt • Priradeniehodnôt k entitám • Nájdenie všetkých popisov entity Photo_1: - … - shows: Person_2A42B Person_2A42B: • label^sk: deti • label^en: children Peter Macko – Zjednotené vyhľadávanie nad prepojenými dátami na webe – Michal Holub
ExperimentOntožúr • Zoradenieslovpodľa relevancie • max 5 slov • Dataset: • Mirai (fotky) Peter Macko – Zjednotené vyhľadávanie nad prepojenými dátami na webe – Michal Holub
Základné pojmy Peter Macko – Zjednotené vyhľadávanie nad prepojenými dátami na webe – Michal Holub • Term • Entita alebo väzba v datasete • Popis • Alternatívny názov pre term • Príklad • Term: Photo • Popis: Photo, Picture, Image, Exposure
Výsledky experimentu I • Zoradenie popisov k termu • Zúčastnených: 17 • Počet termov: 30 • Zoradení: 336 • Úspešnosť zoradenia: 89,3 % Peter Macko – Zjednotené vyhľadávanie nad prepojenými dátami na webe – Michal Holub
Výsledky experimentu II • Zoradenie termov k popisu • Zúčastnených: 17 • Počet popisov: 5 • Zoradení: 79 • Úspešnosť zoradenia: 68 % Peter Macko – Zjednotené vyhľadávanie nad prepojenými dátami na webe – Michal Holub
Problémy experimentu Peter Macko – Zjednotené vyhľadávanie nad prepojenými dátami na webe – Michal Holub • Málo používané angl. slová • realm, edifice, posit • Photovs. Image • Image 0.6 • Exposure 0.85
Overenie napovedača a prekladu • Pozorovanie používateľov pri dopytovaní • Porovnanie rýchlosti písania dopytov • OntoSearchvs. SPARQL • Overenie v prostredí Annota • DatasetACM Peter Macko – Zjednotené vyhľadávanie nad prepojenými dátami na webe – Michal Holub
Zhrnutie Peter Macko – Zjednotené vyhľadávanie nad prepojenými dátami na webe – Michal Holub • Dopyty v prirodzenom jazyku • Predspracovanie dátového zdroja • Dekorácia cez štruktúru datasetu a WordNet • Usmernenie používateľa pri písaní