350 likes | 429 Views
A Common Multimedia Annotation Framework for Cross Linking Cultural Heritage Digital Collections. Hennie Brugman MPI for Psycholinguistics, Nijmegen, Netherlands Véronique Malaisé Free University, Amsterdam, Netherlands Laura Hollink Free University, Amsterdam, Netherlands.
E N D
A Common Multimedia Annotation Framework for Cross Linking Cultural Heritage Digital Collections Hennie Brugman MPI for Psycholinguistics, Nijmegen, Netherlands Véronique Malaisé Free University, Amsterdam, Netherlands Laura Hollink Free University, Amsterdam, Netherlands LREC 2008, Marrakech, Morocco Nederlandse Organisatie voor Wetenschappelijk Onderzoek
Overview • The CATCH programme and its annotation requirements • Existing models • Annotation Meta Model (AMM) and its application to CATCH cases • Software and infrastructure • Conclusions Nederlandse Organisatie voor Wetenschappelijk Onderzoek
CATCH – Continuous Access To Cultural Heritage • Dutch research program funded by NWO • Apply state of the art methods to the construction and exploitation of digital collections of large Cultural Heritage institutions • Currently 10 projects, hosted by Cultural Heritage institutions • Rijksmuseum Amsterdam, Dutch National Archive, Dutch National Library, Netherlands Institute for Sound and Vision, etc • Results and software applicable across institutions and collections Nederlandse Organisatie voor Wetenschappelijk Onderzoek
Annotations in CATCH • Objectives: • Cross media, cross collection, cross institution annotation of digital objects and segments of objects • Add new layers of annotation to existing annotations • Centralize storage and exploitation of annotations generated by CATCH projects • Apply and showcase annotation recommendation modules/services from several CATCH projects Nederlandse Organisatie voor Wetenschappelijk Onderzoek
Annotations in CATCH Primitive value (string, date, number,…) “some text description” property Resource Semantic value property http://www.beeldengeluid.nl/GTAA#Subject_kunst_ Nederlandse Organisatie voor Wetenschappelijk Onderzoek
Annotations in CATCH Resource “Abraham van Beijeren” • complete resource • catalog, metadata • resource types • images • text • html, xml • audio • video artist Nederlandse Organisatie voor Wetenschappelijk Onderzoek
Annotations in CATCH Resource segment – sound-video “very much” choral:transcription Nederlandse Organisatie voor Wetenschappelijk Onderzoek
Annotations in CATCH Resource segment - image “roemer” racm-glass:Shape Nederlandse Organisatie voor Wetenschappelijk Onderzoek
Annotations in CATCH Resource segment – scanned handwriting “boven eener verloting te Amsterdam” scratch:transcription Nederlandse Organisatie voor Wetenschappelijk Onderzoek
Annotations in CATCH Resource segment – text “boven eener verloting te Amsterdam” scratch:transcription choice:location http://geonames.org/NL/Amsterdam Nederlandse Organisatie voor Wetenschappelijk Onderzoek
Annotations in CATCH Resource segment – text “boven eener verloting te Amsterdam” “bommenwerpers boven de hoofdstad” http://geonames.org/NL/Amsterdam Nederlandse Organisatie voor Wetenschappelijk Onderzoek
Annotations in CATCH Resource segment – text “boven eener verloting te Amsterdam” “bommenwerpers boven de hoofdstad” http://geonames.org/NL/Amsterdam http://TGN/NL http://TGN/Amsterdam Nederlandse Organisatie voor Wetenschappelijk Onderzoek
Annotations in CATCH • Further requirements for the annotation formalism • Project and media specific extensions • Predefined annotation schemes • Generic and specific queries possible • Expressive and simple • Reuse or include existing annotation models or vocabularies Nederlandse Organisatie voor Wetenschappelijk Onderzoek
Existing annotation models • Semantic web community • Focus on (semantic) annotation values • Anchoring mainly to complete resources or web pages • Linguistic annotation community • Anchoring to text or time series • Usually no semantic values • Media industry (e.g. MPEG-7) • Objections • Not all media types covered • Too complex or specialized • Hardly ever annotation of annotations, and of segments of annotation values Nederlandse Organisatie voor Wetenschappelijk Onderzoek
Annotation Meta Model (AMM) – why RDF? • RDF, RDFS and OWL seem good modeling languages for the domain of annotation - graphs versus hierarchies • Some of our requirements automatically met: • Class and property inheritance • Constraints (e.g. domains and ranges for properties) • Integration of semantic values • Classes and instances for annotation schemes and annotation resp. • General and specific queries Nederlandse Organisatie voor Wetenschappelijk Onderzoek
AMM – Core model Nederlandse Organisatie voor Wetenschappelijk Onderzoek
AMM – Core model Nederlandse Organisatie voor Wetenschappelijk Onderzoek
AMM – Core model Nederlandse Organisatie voor Wetenschappelijk Onderzoek
AMM – Core model Nederlandse Organisatie voor Wetenschappelijk Onderzoek
AMM – Core model Nederlandse Organisatie voor Wetenschappelijk Onderzoek
TextSpan Region2D TimeSegment AMM – Core model AnnotatableObject TextObject ImageObject TimeSeriesObject Coordinates Nederlandse Organisatie voor Wetenschappelijk Onderzoek
ann AMM – Scanned handwriting case Nederlandse Organisatie voor Wetenschappelijk Onderzoek
ann AMM – Scanned handwriting case Nederlandse Organisatie voor Wetenschappelijk Onderzoek
ann AMM – Scanned handwriting case Nederlandse Organisatie voor Wetenschappelijk Onderzoek
ann AMM – Scanned handwriting case Nederlandse Organisatie voor Wetenschappelijk Onderzoek
ann AMM – Scanned handwriting case Nederlandse Organisatie voor Wetenschappelijk Onderzoek
AMM – Other cases • Semantic annotations of segments of text documents • Manually annotated image regions • Complex linguistic annotation of co-occurring speech and gesture • Syntactic annotation of text Nederlandse Organisatie voor Wetenschappelijk Onderzoek
Software and infrastructure • RDF repository, wrapped with AMM web service • Stores AMM model, project-specific annotation schemes and annotation data • Java API, defining and implementing this web service • Clients: • CHOICE@CATCH documentalist support system • Integrated multimedia and web based “Annotation and Recommendation” demonstrator for CATCH Nederlandse Organisatie voor Wetenschappelijk Onderzoek
CHOICE Documentalist Support System Nederlandse Organisatie voor Wetenschappelijk Onderzoek
Annotation and Recommendation demonstrator Nederlandse Organisatie voor Wetenschappelijk Onderzoek
Conclusions • All requirements seem to be met • Applicable to a wide range of very different cases • Repository works efficiently, however not yet tested with a large number of AnnotatableObjects (so far, approx. 50.000) • Highlights: • Layered annotation • All media types are or can be supported • Annotation with multimedia objects or object segments possible Nederlandse Organisatie voor Wetenschappelijk Onderzoek
Thank you Nederlandse Organisatie voor Wetenschappelijk Onderzoek
Instances: CHOICE text annotation (n1, n2) addressesTextSpan a1 dc:title “AndereTijdenGemmeker.txt” partOf r1 apoldaSubject apoldaOntology “Subject” apoldaIdentifier “http://www.beeldengeluid.nl/Thesaurus/GTAASkosv7.owl#” Subject_bevelhebbers_ Nederlandse Organisatie voor Wetenschappelijk Onderzoek
Instances: video/audio annotation t1 hasTime “3521” addressesTimeInterval t2 hasTime “4692” a1 dc:title “gesturing_people.mpg” partOf next transcription “dit is gesproken tekst” a2 textObject partOf (beginNode, endNode) addressesTextSpan partOfSpeech http://www.isodatcats.org/part-of-speech#Noun t3 hasTime “3854” t4 addressesTimeInterval hasTime a3 “5290” dc:title “gesturing_people.mpg” partOf dc:description handshape “some gesture description” http://www.mpi.nl/myShapes#fist Nederlandse Organisatie voor Wetenschappelijk Onderzoek
Instances: syntax tree on text (n0, n3) “Der” addressesTextSpan hasText a1 hasText “Der Mann geht schnell” syntax dc:title “german sentence 1” partOf D r1 partOf “Mann” a2 partOf anchorsTo hasText partOf a4 addressesTS (n4, n8) addressesTS “schnell” a3 (n14, n21) syntax addressesTS (n9, n13) “geht” syntax N syntax Adv V anchorsTo anchorsTo NP1 anchorsTo VP1 anchorsTo NP syntax anchorsTo syntax S1 syntax VP S Nederlandse Organisatie voor Wetenschappelijk Onderzoek