120 likes | 274 Views
Ineke Schuurman Coördinator CLARIN-Vlaanderen. CLARIN: een introductie. Doel van CLARIN?. WAT? Infrastructuur digitale ‘resources’ (+ ‘tools’) VOOR WIE? Onderzoekers in de humane en sociale wetenschappen. WANNEER? 2008-2010 voorbereiding 2011-2015 constructie 2016-….. beschikbaar.
E N D
Ineke Schuurman Coördinator CLARIN-Vlaanderen CLARIN: een introductie
Doel van CLARIN? WAT? • Infrastructuur • digitale ‘resources’ (+ ‘tools’) VOOR WIE? • Onderzoekers in de humane en sociale wetenschappen. WANNEER? • 2008-2010 voorbereiding • 2011-2015 constructie • 2016-….. beschikbaar 2
Doel van CLARIN? WAAROM? • Steeds meer digitale bronnen • Leveren tal van (onvermoede) mogelijkheden voor onderzoek • Moeten goed beheerd worden (en gedocumenteerd en toegankelijk gemaakt en opspoorbaar en ……..) → infrastructuur ! 3
SSH onderzoekers zijn geen taal- en/of spraaktechnologen Vaak zijn deze onderzoekers zich niet bewust van de mogelijkheden van TST in hun domein De beschikbare tools zijn niet altijd even gemakkelijk te gebruiken. Probleemstelling • Veel data in digitale archieven zijn’talig’ • Enkel bekend bij een beperkt publiek • Archieven staan op zich • Elk archief hanteert eigen standaarden (opslag, metadata) • Bevat vaak enkel gewone files (tekst, audio, video) 4
Hoe: Virtueel samen-brengen van be-staande digitale archieven, toegan-kelijk via het web Ter beschikking stellen van TST-tools in de vorm van web-services die bv bewerkingen uit-voeren op data in de archieven. De CLARIN missie Wat: • Creëren van een infrastructuur die resources en tools uit de wereld van de taal- en spraaktechnologie (TST) beschikbaar maakt voor andere wetenschappers 5
Nodige expertise is voorhanden, maar niet in elk land Taalonafhankelijke tools kunnen worden ‘gedeeld’ Taalafhankelijke tools kunnen vaak worden aangepast Financieel aantrekkelijker Waarom Europees? • Ieder (land) voor zich • te gefragmenteerd • lage zichtbaarheid • geen samenwerking • continuïteit niet gegarandeerd 6
Vlaanderen CLIF: CCL Leuven CNTS Antwerpen ELIS Gent ESAT Leuven itec Kortrijk ETRO Brussel LIIR Leuven LT3 Gent Over CLARIN Europa CLARIN consortium: 22 partners (…, CCL, …) CLARIN community: 148 leden in 32 landen (02-2009) 7
GebruikerWat wil men? Overheden, IPR Wat kan/mag er? 4-dimensionele aanpakgedurende eerste fase 2008-2010: ontwerp • TechniekHoe kan het? • Talen Wat is er? 8
Er wordt een BLARK (Basic Language Resources Toolkit) gedefinieerd voor al deze talen Voor implementatie zijn fondsen van derden nodig Talen • Alle talen die in de bij CLARIN betrokken landen worden gesproken en/of bestudeerd worden afgedekt • Geen focus op ‘grote’ talen 9
Duits: Resources: 41 Tools: 5 Taalonafhankelijk Tools: 25 Wat is er al? (stand 02-09) Algemeen: Resources: 689 Tools: 119 Nederlands: Resources: 80 Tools: 5 10
corpusonderzoek topic detection neerslag in versch kranten van ‘Europees’ topic Vergelijken van vertalingen van bepaald boek … Gebruiker • Onderzoek op gebied van “talige informatie” CLARIN: • “Weten WIJ wat zij willen?” • “Weten ZIJ wat ze zouden (kunnen) willen?” 11
Laat ons jullie noden en wensen weten! Wensen? • Vlaamse corpora met (ook) oudere teksten (“vorige spelling”) • Meer digitale bronnen • … 12