120 likes | 294 Views
Mini seminar Waardevolle Data & Diensten. 1. Achtergrond…. 3. Belang!. 2. Project 3TU.Datacentrum. Jeroen Rombouts. This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 2.5 License. Toelichting.
E N D
Mini seminar Waardevolle Data & Diensten 1. Achtergrond… 3. Belang! 2. Project 3TU.Datacentrum JeroenRombouts This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 2.5 License.
Toelichting • SURF Share project WP6 Datacuratielooptijd december ’08 – juni ’09. • “Motiveren door ondersteunen van dataproducenten en onderzoeken van voordelen van data publicatie”. • Toetsing generaliseerbaarheid van opgestelde functionele eisen en identificeren van factoren die de generaliseerbaarheid bepalen.(welke eisen afhankelijk van vakgebied, ‘onderzoekstype’, …).
Achtergrond a a Manuscript Publicatie x x Data Metadata Bibliotheek Repository Onderzoek
Motivatie Fysiek verval opslag media; Verlies van de beschrijvende (meta) data; Niet meer kunnen ‘draaien’ van software om datasets te kunnen visualiseren/bewerken. Risico’s huidig onderzoeksdata ‘beheer’ Belangen lange termijn toegankelijkheid • Waarde van data (kostenintensief, valorisatie, longitudinaal); • Kwaliteit van onderzoek (verificatie, overdracht, kennisdelen).
Omgeving Plan van de National Science Foundation voorbetrouwbare opslag van digitale wetenschappelijke output (2006); In Nederland voor alfa- en gamma wetenschappen: DANS (Data Archiving and Networked Services) (2005); Voor bètawetenschappen nog geen initiatieven.
Het 3TU.Datacentrum Bouwt voort op twee eerdere projecten; E-Archiving – digitaal depot Darelux – Data Archiving River Environment Luxemburg Looptijd 3 jaar 2008-2010; Pilot en financiering via Centres of Excellence (CoE); Pilot TUD, daarna ook datasets TU/e en UT Doel: langdurige toegang tot technisch- wetenschappelijke datasets. Project
Het 3TU.Datacentrum Exploiteren ‘data-archief’ (faciliteren van dataproducenten); Adviseren van dataproducenten; Kennis over lange termijn toegankelijkheid ontwikkelen en verspreiden. Taken Onderdelen • Data repository (archief voor statische data); • Samenwerkingsomgeving (voor lopend onderzoek); • Diensten en toegang tot andere ‘archieven’.
Activiteiten Verzamelen data samenwerken met onderzoekers tijdens het onderzoek (o.a. DARELUX). Datamodel, metadata, ingest, access, … Publiceren van data faciliteren van zelfstandig publiceren of in relatie met een publicatie). Citeerbaar (doi), vindbaar, versiebeheer, … Preserveren van data verzorgen van lange termijn opslag van digitale datasets en zorgdragen voor ‘leesbaarheid’. Multiple backups, normalisatie, refreshing, migratie, audit trail, … Toegankelijk maken van datasets. User agreement, interface, …
(Overige) resultaten/activiteiten • Website datacentrum.3tu.nl; • Samenwerking met SURF, DANS (www.dans.knaw.nl) en KB o.a. in Nationale Coalitie Digitale Duurzaamheid (www.ncdd.nl) en Onderzoeksdata forum (press release); • Samenwerking met o.a. TIB, ETH Zurich, INIST, BL, DTU in DataCite (DOI) consortium (press release); • DRIVER-II (EU-7FP)Demonstrator voor Enhanced Publications CoE MSP; • Waardevolle Data & Diensten project (SURF)Onderzoek naar gebruikers behoeften en positieve effecten.
Belang! • Borging wetenschappelijk niveauVerificatie (en replicatie), nieuw (multi-disciplinair) onderzoek, discussie, … • Efficiëntie (ondersteuning) van onderzoekKosten dataverzameling = ‘sunk costs’, veiligstellen van data en ‘leesbaarheid’, centraal beheer & ontwikkeling, standaarden, … • Communicatie (zichtbaarheid, imago en concurrentie positie)Datasets, publicaties, wetenschapper, instelling, Nederland, EU • Bewaren ‘wetenschappelijk erfgoed’Longitudinaal onderzoek, historisch onderzoek, …
Welke data en waarom ‘deponeren’? Anderen doen het! • Data die openbaar kan/moet zijn en interessant is voor de samenleving (verificatie, nieuw onderzoek); • Toename van publicatie ‘waarde’ (onderbouwd, meer citaties, …); • Data gegenereerd door ‘moeilijk’ herhaalbare processen(kosten, observaties, complexiteit, longitudinaal, …); • Voorwaarden van onderzoeksfinanciers en uitgevers(Nature Publishing Group, NWO, Overheden, …); • Eenvoudig veiligstellen en delen van data;