120 likes | 228 Views
C-DSD: Curating the Dutch Song Database ( Nederlandse Liederenbank ). C-DSD 2011-2012. Martine de Bruin. C-DSD: Curating the Dutch Song Database ( Nederlandse Liederenbank ). In/ bij de Nederlandse Liederenbank ( www.liederenbank.nl ).
E N D
C-DSD: Curating the Dutch Song Database (NederlandseLiederenbank) C-DSD 2011-2012 Martine de Bruin
C-DSD: Curating the Dutch Song Database (NederlandseLiederenbank) In/bij de NederlandseLiederenbank (www.liederenbank.nl) • beschrijvingen: ruim 150.000 liederen, c. 1.500 zangers en c. 16.000 bronnen • ruim 10.000 audiofiles (vooral mp3) • ruim 100.000 scans van diverse herkomst (collecties), in diverse formaten en op diverse locatiesgehost, o.a. Geheugen van Nederland • enkeleduizendenvolledigeliedteksten (in opbouw: c. 100.000 in 2013) • c. 7.000 muzikaletranscripties
C-DSD: Curating the Dutch Song Database (NederlandseLiederenbank) Bewerkelijke dataset - 1 • Bron = boek, blaadje, audio, klok, … • Lied = lied zoals het voorkomt in eenbron • Zanger = uitvoerende van eenopname • Zeer divers materiaal, vocaal/instrumentaal, • van 14e tot 21e eeuw, verschillendedragers, • vaakincompleet of informatiearmovergeleverd • Bijnanietsgeldtvooralles: • Een lied bevataltijdeenliedid en eenbronid, de rest is optioneel, c. 200 velden, 20 tabellen
C-DSD: Curating the Dutch Song Database (NederlandseLiederenbank) Bewerkelijke dataset - 2 • Eenbronkanmeervindplaatsenhebben, waarvan elk meerderereproductiesbestaan (betreftnietalleen de eigencollectie) • Een lied kangekoppeldzijnaanmeerdere scans (zowelmeerderepagina’s als twee of meer sets scans; somsgecropt, somsalsdeel van bron; afhankelijk van de collectie) • Van een lied kunnenmeerdereaudiofilesbestaan (mp3, MIDI) en meerderetekst-transcripties
C-DSD: Curating the Dutch Song Database (NederlandseLiederenbank) Belangrijksteredenenomietsaancuratietewillendoen: • Slechteuitwisselmogelijkheden • Resources (scans etc.) los-vast
C-DSD: Curating the Dutch Song Database (NederlandseLiederenbank) WaaromClarin? • Clarin is eenonderzoekinfrastructuurproject • het zorgtervoordat je vanachter je eigen bureau digitalearchievenuit heel Europa kanraadplegen. • het gaatvaakombeschermdmateriaal, voorzien van auteursrechten en anderebeperkingen. • met Clarinwordenergezamenlijkestandaardsgebruiktvoor het beschikbaarstellen van geschreven, audio- en videodocumenten. • de focus ligt op taal, maar Clarin is ervooriedereonderzoeker die iets met taal van doenheeft: theologen, filosofen, sociologen en anderen van Geesteswetenschappen en SocialeWetenschappen.” • Ditgebeurt door middel van innovatie en curatie
C-DSD: Curating the Dutch Song Database (NederlandseLiederenbank) C-DSD (Curating the Dutch Song Database) • beschikbaarstellen van data • migrerennaaruitwisselbareformaten • online beschikbaarstellen in leesbareformaten (CMDI, DC) • online beschikbaarstellen in eencentralezoekmachine • archiveren van data • duurzaam online beschikbaarstellenm.b.v. PID • Meertens digitaalarchief
C-DSD: Curating the Dutch Song Database (NederlandseLiederenbank) C-DSD - stappen • scripts om data uit de MySQL-liederenbank (relationeel) omtezettennaar XML volgensCLARIN Metadata Infrastructure-principes • Resources onderbrengen in digitaalarchief; hiervanCMDIfilesgenereren • PID-handles opvragen • Op basis van CMDI: DC • Genereren schema • Elementenuit het schema koppelenaanClarin component registry • Elementenuit CCR koppelenaanISOcat (data categorie register)
C-DSD: Curating the Dutch Song Database (NederlandseLiederenbank)