1 / 12

CLARIN: een introductie

Ineke Schuurman Coördinator CLARIN-Vlaanderen. CLARIN: een introductie. Doel van CLARIN?. WAT? Infrastructuur digitale ‘resources’ (+ ‘tools’) VOOR WIE? Onderzoekers in de humane en sociale wetenschappen. WANNEER? 2008-2010 voorbereiding 2011-2015 constructie 2016-….. beschikbaar.

dane
Download Presentation

CLARIN: een introductie

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Ineke Schuurman Coördinator CLARIN-Vlaanderen CLARIN: een introductie

  2. Doel van CLARIN? WAT? • Infrastructuur • digitale ‘resources’ (+ ‘tools’) VOOR WIE? • Onderzoekers in de humane en sociale wetenschappen. WANNEER? • 2008-2010 voorbereiding • 2011-2015 constructie • 2016-….. beschikbaar 2

  3. Doel van CLARIN? WAAROM? • Steeds meer digitale bronnen • Leveren tal van (onvermoede) mogelijkheden voor onderzoek • Moeten goed beheerd worden (en gedocumenteerd en toegankelijk gemaakt en opspoorbaar en ……..) → infrastructuur ! 3

  4. SSH onderzoekers zijn geen taal- en/of spraaktechnologen Vaak zijn deze onderzoekers zich niet bewust van de mogelijkheden van TST in hun domein De beschikbare tools zijn niet altijd even gemakkelijk te gebruiken. Probleemstelling • Veel data in digitale archieven zijn’talig’ • Enkel bekend bij een beperkt publiek • Archieven staan op zich • Elk archief hanteert eigen standaarden (opslag, metadata) • Bevat vaak enkel gewone files (tekst, audio, video) 4

  5. Hoe: Virtueel samen-brengen van be-staande digitale archieven, toegan-kelijk via het web Ter beschikking stellen van TST-tools in de vorm van web-services die bv bewerkingen uit-voeren op data in de archieven. De CLARIN missie Wat: • Creëren van een infrastructuur die resources en tools uit de wereld van de taal- en spraaktechnologie (TST) beschikbaar maakt voor andere wetenschappers 5

  6. Nodige expertise is voorhanden, maar niet in elk land Taalonafhankelijke tools kunnen worden ‘gedeeld’ Taalafhankelijke tools kunnen vaak worden aangepast Financieel aantrekkelijker Waarom Europees? • Ieder (land) voor zich • te gefragmenteerd • lage zichtbaarheid • geen samenwerking • continuïteit niet gegarandeerd 6

  7. Vlaanderen CLIF: CCL Leuven CNTS Antwerpen ELIS Gent ESAT Leuven itec Kortrijk ETRO Brussel LIIR Leuven LT3 Gent Over CLARIN Europa CLARIN consortium: 22 partners (…, CCL, …) CLARIN community: 148 leden in 32 landen (02-2009) 7

  8. GebruikerWat wil men? Overheden, IPR Wat kan/mag er? 4-dimensionele aanpakgedurende eerste fase 2008-2010: ontwerp • TechniekHoe kan het? • Talen Wat is er? 8

  9. Er wordt een BLARK (Basic Language Resources Toolkit) gedefinieerd voor al deze talen Voor implementatie zijn fondsen van derden nodig Talen • Alle talen die in de bij CLARIN betrokken landen worden gesproken en/of bestudeerd worden afgedekt • Geen focus op ‘grote’ talen 9

  10. Duits: Resources: 41 Tools: 5 Taalonafhankelijk Tools: 25 Wat is er al? (stand 02-09) Algemeen: Resources: 689 Tools: 119 Nederlands: Resources: 80 Tools: 5 10

  11. corpusonderzoek topic detection neerslag in versch kranten van ‘Europees’ topic Vergelijken van vertalingen van bepaald boek … Gebruiker • Onderzoek op gebied van “talige informatie” CLARIN: • “Weten WIJ wat zij willen?” • “Weten ZIJ wat ze zouden (kunnen) willen?” 11

  12. Laat ons jullie noden en wensen weten! Wensen? • Vlaamse corpora met (ook) oudere teksten (“vorige spelling”) • Meer digitale bronnen • … 12

More Related