70 likes | 211 Views
Från metadata till uppmärkning av komplexa dokument: Ett ramverk för semantisk dokumentproduktion. Henrik Eriksson Magnus Bång Linköpings universitet. Bakgrund och syfte. Problem: Stora mängder information tillgänglig elektroniskt, men svårt att hitta rätt när sökfrågan är komplex
E N D
Från metadata till uppmärkning av komplexa dokument: Ett ramverk för semantisk dokumentproduktion Henrik Eriksson Magnus Bång Linköpings universitet
Bakgrund och syfte • Problem: Stora mängder information tillgänglig elektroniskt, men • svårt att hitta rätt när sökfrågan är komplex • svårt att navigera i innehållsrik dokumentation • Mål • Semantisk beskrivning av dokumentinnehållet • Stöd för systematiskt författande av komplexa elektroniska dokument
Applikationsområde • Statistiska centralbyrån (SCB) • Informationssökning i dokument • Semantisk märkning av innehållet • Statistikrapportering • Tabeller • Diagram • Statistiska metadata • Databaser för metadata • Forskning vid SCB (Professor Bo Sundgren)
Domain ontology Meta data Electronic documents (PDF) Meta-data editor Word processor Specialized search engine Web front-end Arkitektur
Document retrieval Statistics documents (PDF) Semantic search XMP markup XMP markup XMP markup Reasoning engine Report publication database Functions Semantiska dokument • Kunskapsrepresentation • Ontologier • Semantic web: OWL • Dokumentmodeller • Adobe’s Portable Document Format (PDF) • Extensible Metadata Platform (XMP) • Funktioner • Semantisk sökning • Resonemang, inferens
Dokumentproduktion Knowledge source Analysis Authoring Editing Publication Semantic mark-up Meta data Data
Modeller och verktyg Protégé ontology editor Pre-existing metadata store Statistics ontology Metadata manager XMP manager PDF documents with XMP mark-up