200 likes | 306 Views
Konvertering og bruk av 1910 folketellingen. Fagdag Kulturrådet , 18.06.2014. Agenda. Konvertering av 1910 folketellingen til RDF Demonstrasjon av enkel prototype. Building. Modell for FT1910. Address, Building type, Number of floors, Municipality, Geo Lat/Lng …. Apartment.
E N D
Konverteringogbrukav 1910 folketellingen FagdagKulturrådet, 18.06.2014
Agenda • Konvertering av 1910 folketellingen til RDF • Demonstrasjon av enkel prototype
Building Modell for FT1910 Address, Building type, Number of floors, Municipality, Geo Lat/Lng … Apartment Floor, Number of rooms, Number of kitchen, Rent … Person Name, Gender, Birth date, Birth place, Marital status, Occupation …
Bruk av Eksisterende vokabularer • FOAF: http://xmlns.com/foaf/0.1/ • BIO: http://purl.org/vocab/bio/0.1/ • ResumeRDF: http://rdfs.org/resume-rdf/cv.rdfs# • Building and Room: http://vocab.deri.ie/rooms# • GEO: http://www.w3.org/2003/01/geo/wgs84_pos# • SKOS: http://www.w3.org/2004/02/skos/core# Nye somburdebrukes (fremfornyontologi): • Europeana / Norvegiana • Dublin Core
Kobling til andre datasett * White bubbles indicate "offline" datasets, not available in the LOD-cloud.
Lessonslearned • Scarce data to link to • Concept drift • Simple normalization methods suffice • Additional datasets can increase data quality • Existing vocabularies not sufficient • Conversion to LOD can increase data quality • Case-specific conversion scripts is time consuming, generic tools needed • Techniques needed to propose and validate links
Men hva med Ola Normann? • Vanskelig å finne eksterne kilder • Men, noen aktuelle kilder: • Panteregister • Pantebok • Kirkebok • Matrikkel
Kilder brukt • Folketellinger: • Folketelling 1801 • Folketelling 1865 • Folketelling 1900 • Folketelling 1910 • Tinglysningsdokumenter: • Pantebøker • Panteregister • Matrikkel 1886 • Kirkebok (dåp, konfirmasjon, vielse) • Digitalt Museum / Kulturminnesøk (JSON) • GeoNames (JSON)
Videre arbeid • Konvertere hele FT1910 til RDF • Utvikle ontologier for vanlige attributter: familiestilling, religion, yrke (HISCO/NAPP), bygningstype etc • Utvikle ny modell som kan brukes til å koble ulike (historiske) datasett sammen (hvem, hva, hvor, når)? • Crowdsourcingverktøy for å opprette koblinger mellom autoriteter?
Takk for oppmerksomheten! Håvard Lundberg havard.lundberg@gmail.com twitter.com/havard