480 likes | 624 Views
Beständiga identifikatorer med tillhörande uppslagstjänster!. Peter Hansson Bibliotekssystem och utveckling, Chalmers bibliotek (peter.hansson@chalmers.se) 2006-11-09. Beständig identifikator. En unik symbol som fastställer identiteten av resursen som bär det.
E N D
Beständiga identifikatorer med tillhörande uppslagstjänster! Peter HanssonBibliotekssystem och utveckling, Chalmers bibliotek(peter.hansson@chalmers.se) 2006-11-09
Beständig identifikator • En unik symbol som fastställer identiteten av resursen som bär det. • Symbolen ska vara konstant och finnas för evigt (eller åtminstone under lång tid). • ex. personnummer, ISBN, URN:NBN... ISBN:91-44-03700-7 urn:nbn:se:uu:diva-3475 dokument
Exempel beständiga identifikatorer • Handle System • Handle används av DSpace • ex. 2077/554 • DOI (Digital Object Identifier) • ex. 10.1000/182 • URN:NBN • ex. urn:nbn:se:vxu:diva-2 • PURL (Persistent URL) • ex. http://purl.org/dc/elements/1.1/ • ...
Varför inte använda URL? • Ett företaget köper ett nytt dokumenthanterings-system och dokumenten måste flytta från domänen foretag.se till foretag.se/nyplats. URL för varje dokument ändras. • Företaget köps upp och det gamla företagsnamnet/märket skrotas. Företagsledningen bestämmer att domännamnet nyttforetag.se ska användas istället. Domännamnet i URL:en ändras. • Företaget går så småningom i konkurs. Domännamnet nyttforetag.se blir ledigt (och till salu). URL:erna försvinner helt.
URL • I RFC 1738 “Uniform Resource Locators (URL)” daterad december 1994 skrev Tim Berners-Lee mfl:“Users should beware that there is no general guarantee that a URL which at one time points to a given object continues to do so, and does not even at some later time point to a different object due to the movement of objects on servers.”
URN • RFC 2141 URN Syntax ”Uniform Resource Names (URNs) are intended to serve as persistent, location-independent, resource identifiers and are designed to make it easy to map other namespaces (which share the properties of URNs) into URN-space.” Syntax: <URN> ::= "urn:" <NID> ":" <NSS>
NBN • RFC 3188 Using National Bibliography Numbers as Uniform Resource Names “This document discusses how national bibliography numbers (persistent and unique identifiers assigned by the national libraries) can be supported within the URN (Uniform Resource Names) framework and the syntax for URNs defined in RFC 2141.”
Giltiga URN:NBN • URN:NBN:<ISO 3166 landskod>-<tilldelad NBN-sträng>Ex. URN:NBN:se-2006-1 • URN:NBN:<ISO 3166 landskod>:<undernamnrymd>-<tilldelad NBN-sträng>Ex. URN:NBN:se:slu:epsilon-2 URN:NBN:se:vxu:diva-2 URN:NBN:no:ntnu:diva-214 URN:NBN:de:gbv:089-3321752945 • URN:NBN:<annat registrerat prefix>-<tilldelad NBN-sträng>
Uppslagstjänster • Resolution Service (eng) • Ge uppslagstjänsten en beständig identifikator och uppslagstjänsten vet var resursen för tillfället finns. • Jmf bibliotekskatalog (placering, URL)
Uppslagstjänst (1) VAR FINNS RESURSEN (DOKUMENTET) MED IDENTIFIKATOR X? identifikator adress(er) Uppslagstjänst HÄMTA RESURSEN (DOKUMENTET) MED HJÄLP AV ADRESSEN. ISBN:91-44-03700-7 adress urn:nbn:se:uu:diva-3475 dokument
Uppslagstjänst (2) GE MIG RESURSEN (DOKUMENTET) MED IDENTIFIKATOR X. Webbaseraduppslags-tjänst identifikator identifikator adress(er) Uppslagstjänst dokument ISBN:91-44-03700-7 urn:nbn:se:uu:diva-3475
Konkret exempel Ge mig resursen med identifikator URN:NBN:se-2006-1?
KB:s uppslagstjänst för URN:NBN • http://urn.kb.se/
Vilka resurser kan KB:s uppslagstjänst hitta? Användaren kan vidarebefordras till resurser • som den lokala uppslagstjänsten har information om • som registrerats hos andra kända uppslagstjänster • som blivit tilldelade andra typer av beständiga identifikatorer (doi, handle) och uppslagstjänsten är känd • En lista över kända uppslagstjänster administreras idag av Enheten för digital publicering, Uppsala universitetsbibliotek http://epc.ub.uu.se/rs/services/servicemappings.xml
Direktlänkar (1/3) • http://urn.kb.se/resolve?urn=URN:NBN:se-2006-1 • http://urn.kb.se/resolve?urn=urn:nbn:de:gbv:089-3321752945
Direktlänkar (2/3) • http://urn.kb.se/resolve?doi=10.1016/S0021-9797(03)00401-6 • http://urn.kb.se/resolve?hdl=10.1045/may2001-kahn
Direktlänkar (3/3) • http://urn.kb.se/resolve?method=getownername &identifier-pattern=urn:nbn:se:slu:epsilon- • http://urn.kb.se/resolve?method=isregistered &identifier-pattern=urn:nbn:se:solidaritetshuset-
Hur vet uppslagstjänsten adressen till resursen? • Lokala arkiv och/eller publiceringssystem måste publikt visa vilka identifikatorer som blivit utdelade under deras undernamnrymd och vilka adresser som i dagsläget är giltiga.Jmf hur metadata görs tillgänglig via OAI-PMH (Kommer snart!).
Källfil (alt 1) • Publiceringssystemet skapar/underhåller automatiskt en fil med alla relationer mellan utdelade identifikatorer (URN:NBN) och resursernas aktuella adresser (URL). Filen måste vara skriven i ett speciellt XML- format. • Filen publiceras på nätet och blir tillgänglig via en vanlig URL. Innehållet som denna URL pekar mot kallas för en källfil. • Sedan tar man kontakt med den organisation som tillhandahåller uppslagstjänsten och ber dem registrera källfilen i deras system. KB sköter registreringen i Sverige. • Tjänsten kommer sedan automatiskt att med jämna mellanrum harvesta/hösta/läsa källfilen.
Källfil (alt 2) • En fil med alla relationer mellan utdelade identifikatorer (URN:NBN) och resursernas aktuella adresser (URL) skapas/underhålls manuellt av en administratör. Filen måste vara skriven i ett speciellt XML- format. • Filen publiceras på nätet och blir tillgänglig via en vanlig URL. Innehållet som denna URL pekar mot kallas för en källfil. • Sedan tar man kontakt med den organisation som tillhandahåller uppslagstjänsten och ber dem registrera källfilen i deras system. KB sköter registreringen i Sverige. • Tjänsten kommer sedan automatiskt att med jämna mellanrum harvesta/hösta/läsa källfilen.
Kontrollfunktioner • Uppslagstjänsten kontrollerar att källfilen är tillgänglig när den ska läsas in • Källans innehåll kontrolleras mot registrerade undernamnrymder • Innan en slutanvändare vidarebefordras till en URL undersöker uppslagstjänsten om URL:en fungerar Felrapporter skickas automatiskt ut viae-post till berörda organisationer/personer (teknisk kontakt anges vid registrering).
Om man inte vill ha en egen undernamnrymd • Det går att skapa enstaka URN:NBN-identifikatorer • Dessa enstaka identifikatorer hamnar i dagsläget inte under någon undernamnrymd utan direkt efter landskod.ex. URN:NBN:se-2006-1 • Enstaka URN:NBN administeras helt och hållet av KB (med andra ord KB administrerar själv en källfil med mappningarna)
Mer info • Registrering av URN:NBN, länkar till beskrivning av källfilens formathttp://www.kb.se/isbn/ • Programvara för uppslagstjänsthttp://epc.ub.uu.se/niwiki/ • Registrerade URN namespaceshttp://www.iana.org/assignments/urn-namespaces
OAI-PMHOpen Archives Initiative Protocol for Metadata Harvesting Peter HanssonBibliotekssystem och utveckling, Chalmers bibliotek(peter.hansson@chalmers.se) 2006-11-09
OAI (Open Archives Initiative) • Stödjer och utvecklar interoperabilitetsstandarder för att underlätta spridning av information (framförallt vetenskaplig) • Resultat hittills: OAI-PMH (Protocol for Metadata Harvesting) • På gång: OAI-ORE (Object Reuse and Exchange)
Interoperabilitet • ”Samordningsförmåga” • Interoperabilitet på olika nivåer • Protokoll • Format (metadataformat, fulltextformat) (oai_dc, ?) • Innehåll (skrivregler etc) OAI HAR LYCKATS VÄL! OAI HAR MISSLYCKATS! OAI HAR MISSLYCKATS!
OAI-PMH • PMH = Protocol for Metadata Harvesting • Använder ett annat standardprotokoll: HTTP (GET/POST requests) • Alla svar levereras i XML-format • Protokollet har stöd för flera metadataformat och rekommendationen är att åtminstone erbjuda ”unqualified/simple dublin core” • OBS! Inget protokoll för sökning
Aktörer i OAI-PMH • Data provider (”passiv innehållsleverantör”)Tillhandahåller metadata via OAI-PMH. • Service provider (”tjänsteleverantör”)Tillhandahåller tjänster som bygger på det innehåll som skördas/hämtas från data providers via OAI-PMH.
System i OAI-PMH • Repository – det nätverksanslutna datasystem som tillhandahåller metadata enligt protokollet OAI-PMH • Harvester – en programvara som används av service provider för att samla in metadata från olika data providers
request response Aktörer och system Data provider Service provider Repository Harvester metadata (dokument) (berikad)metadata
Publikationer Avhandlingar Avhandlingar frånChalmers Examensarbeten Vad är sets? Datavetenskap
OAI-PMH requests • 6 st frågor (requests) definieras i protokollet • Identify • ListMetadataFormats • ListSets • ListIdentifiers • ListRecords • GetRecord
R E P O S I T O R Y H A R V E S T E R Service provider”tjänsteleverantör” Data provider”innehållsleverantör”
Identify R E P O S I T O R Y H A R V E S T E R • Namnet på förvaringsplatsen • URL för anrop • E-postadresser (admin) • OAI-PMH version • Beskrivning av förvaringsplatsen Identifyhttp://publications.lib.chalmers.se/search/oai.jsp?verb=Identify
ListMetadataFormats R E P O S I T O R Y H A R V E S T E R • En lista över xml-format som stöds ListMetadataFormatshttp://publications.lib.chalmers.se/search/oai.jsp?verb=ListMetadataFormats
ListSets R E P O S I T O R Y H A R V E S T E R • Lista över “sets” • Kort namn • Fullständigt namn • Utförlig beskrivning ListSetshttp://publications.lib.chalmers.se/search/oai.jsp?verb=ListSets
from=ÅÅÅÅ-MM-DDuntil=ÅÅÅÅ-MM-DDset=svep:medmetadataPrefix=oai_dcfrom=ÅÅÅÅ-MM-DDuntil=ÅÅÅÅ-MM-DDset=svep:medmetadataPrefix=oai_dc ListRecords R E P O S I T O R Y H A R V E S T E R • Lista över poster • identifikator • datum(tillagd/ändrad/borttagen) • namn på sets • metadata ListRecordshttp://publications.lib.chalmers.se/search/oai.jsp?verb=ListRecords&from=2006-01-01&until=2006-06-01&set=svep:med&metadataPrefix=oai_dc
from=ÅÅÅÅ-MM-DDuntil=ÅÅÅÅ-MM-DDset=svep:med metadataPrefix=oai_dc ListIdentifiers R E P O S I T O R Y H A R V E S T E R • Lista över • identifikator • datum(tillagd/ändrad/borttagen) • namn på sets ListIdentifiershttp://publications.lib.chalmers.se/search/oai.jsp?verb=ListIdentifiers&from=2006-01-01&until=2006-06-01&set=svep:med&metadataPrefix=oai_dc
identifier=oai:publications.lib.chalmers.se:208 metadataPrefix=oai_dc GetRecord R E P O S I T O R Y H A R V E S T E R • En post • identifikator • datum(tillagd/ändrad/borttagen) • namn på sets • metadata GetRecord http://publications.lib.chalmers.se/search/oai.jsp?verb=GetRecord&identifier=oai:publications.lib.chalmers.se:208&metadataPrefix=oai_dc
Lär dig mer • Information, kurshttp://www.oaforum.org/tutorial/ • Organisationen OAI, OAI-PMH specifikationer, programvarorhttp://www.openarchives.org • OAI Repository Explorerhttp://re.cs.uct.ac.za/
Tack för er uppmärksamhet! Frågor?