220 likes | 460 Views
DOI in PURL Predstavitev seminarske naloge pri predmetu Informatika II. Manca Noč in Mojca Oblak Maj, 2009. Uvod. vedno bolj se zanašamo na informacije, dostopne na svetovnem spletu, saj se zdi, da rešujejo temeljno težavo sodobnega človeka
E N D
DOI in PURLPredstavitev seminarske naloge pri predmetu Informatika II Manca Noč in Mojca Oblak Maj, 2009
Uvod • vedno bolj se zanašamo na informacije, dostopne na svetovnem spletu, saj se zdi, da rešujejo temeljno težavo sodobnega človeka • splet ponuja hiter in lahek dostop do informacij, s katerimi rešujemo svoje informacijske potrebe • težave se pojavijo zaradi spremenljivosti spleta, saj pogosto do vira, ki smo ga uporabili še včeraj, ni mogoče ponovno dostopati
Uvod II • lokacija dokumenta se lahko spreminja in z enkratnim dostopom do njega ne moremo zagotoviti, da se bo ob vsakokratnem naslednjem dostopu še nahajal na istem mestu • zato so se pojavile potrebe po učinkoviti in trajni unikatni identifikaciji posameznega vira, ne pa zgolj njegove trenutno lokacije
Identifikatorji • na spletu poznamo več vrst identifikatorjev, skupno ime zanje pa je URI (Uniform Resource Identifier) • DOI spada med URI, prav tako pa spada med URN (Uniform Resource Names) • URN so vsi identifikatorji, ki so unikatni in ostanejo lastni dokumentom za nedoločen čas • DOI zadošča vsem zahtevam URI, hkrati pa omogoča tudi izvedbo dodatnih operacij z dokumenti, ne zgolj njihove identifikacije
Identifikatorji II • identifikator enoznačno določa vsebino nekega objekta • splošne značilnosti identifikatorjev • unikatnost (določen identifikator označuje zgolj eno entiteto) • granularnost (identifikator mora biti zasnovan tako, da lahko določa tudi posamezne sestavne dele entitete) • interoperabilnost/kompatibilnost (identifikator ne sme biti prilagojen nobeni posamezni aplikaciji) • prilagodljivost (določen dokument se lahko v elektronskem okolju nahaja v različnih pojavnih oblikah) • trajnost (ko je identifikator enkrat dodeljen entiteti, jo določa za neomejeno časovno obdobje)
Razvoj sistema DOI • začetki segajo v leto 2006, ko so s skupnimi prizadevanji začeli sistem razvijati naslednje organizacije: • Zveza ameriških založnikov (Association of American Publishers) • Mednarodna zveza založnikov (International Publishers Association) • Zveza znanstvenih, tehničnih in medicinskih založnikov (Association of Scientific, Technical and Medical Publishers)
Razvoj II • prvo enostavno implementacijo sistema DOI so predstavili leta 1997 na Frankfurtskem knjižnem sejmu, leta 1998 pa so ustanovili Mednarodno fundacijo za DOI (International DOI Foundation – IDF) • sistem DOI trenutno obravnavajo pri Mednarodni organizaciji za standardizacijo – ISO • sprejet bo kot del standarda ISO TC46/SC9 – skupina standardov, ki določajo identifikacijo in opis vsebinsko povezanih entitet (na primer ISBN)
Raba DOI • sistem DOI rabi za enoznačno identifikacijo entitet intelektualne lastnine, pri čemer je entiteta katerikoli objekt, ki ga je mogoče identificirati • sistem DOI lahko uporabljajo založniki za identifikacijo raznovrstnih fizičnih objektov, ki so manifestacije intelektualne lastnine, vključno s tiskanimi knjigami, posnetki na CD-jih, videokasetah in članki iz revij • sistem se lahko uporablja tudi za manj otipljive manifestacije, še posebej za digitalne datoteke, ki so najbolj običajna oblika intelektualne lastnine na svetovnem spletu
Zgradba DOI • DOI ime je sestavljeno iz predpone in pripone, ki sta ločeni s poševno črto • predpona je sestavljena iz dveh komponent, in sicer številke direktorija (ta je vedno številka 10), in štiriznakovnealfanumerične oznake registranta(organizacija, založnik, lastnik entitet ali upravljavec, ki je pridobil to pripono in je odgovoren za hrambo posameznega DOI-ja) • iz predpone DOI imena ne moremo sklepati o lastniku entitet intelektualne lastnine
Zgradba DOI II • pripona je poljuben znakovni niz, ki ga določi registrantsam • lahko vsebuje tudi identifikatorje, ki so osnovani na podlagi nekega drugega sistema, ki ga uporablja dotična organizacija (del DOI imena lahko postane ISBN ali ISSN številka, kar registrantom olajša administrativno delo) • pripona je lahko dodana entiteti kakršnekoli velikosti in granularnosti (knjigi, članku, izvlečku, tabeli, albumu, pesmi ali melodiji) in katerikoli vrsti datoteke (besedilna, slikovna, avdio, video ali programska)
Primer DOI • 10.1657 / [ISBN] 6387-9387 • 10: številka direktorija • 1657: oznaka registranta • [ISBN] 6387-9387: pripona po izbiri registranta, ki je v tem primeru drug že obstoječ identifikator te entitete – ISBN
Delovanjesistema DOI 1 Shema ponazarja delovanje sistema DOI, na enak način pa deluje tudi sistem PURL, ki bo opisan kasneje. 2 bazapodatkov o DOI ali PURL 3 4 strežnikdokumentov spletnipregledovalnik
Delovanje DOI • Uporabnik se prek spleta poveže v bazo podatkov DOI in v bazo vnese DOI želenega dokumenta. • Iz baze podatkov DOI po razrešitvi DOI imena uporabnik prejme URL želenega dokumenta. • Uporabnik prek URL-ja zahteva dokument od strežnika, na katerem se dokument nahaja. • Strežnik posreduje uporabniku dokument, ki se mu nato prikaže na zaslonu. • Vse te štiri faze lahko potekajo povsem avtomatsko, ne da bi uporabnik sploh vedel zanje. Uporabnik le klikne na DOI, ki je kazalec v dokumentu in s tem sproži te štiri faze.
CrossRef • neprofitna organizacija, ki so jo ustanovili založniki znanstvenih publikacij z namenom, da bi zagotovili zanesljivo citiranje virov tudi pri elektronskih dokumentih • sistem omogoča založnikom, da posameznim člankom pripišejo enopomenski identifikator DOI, ki se skupaj z drugimi metapodatki o članku shrani v Crossref Metadata Database
CrossRef II • baza CrossRef ne vsebuje polnih dokumentov ali vsebine dokumentov, ampak omogoča povezovanje prek DOI imen, ki delujejo kot neke vrste hiperpovezave • ko uporabnik klikne na citirani vir, pride do tega dokumenta v polni obliki • gre za direkten dostop do identificirane vsebine v spletnem okolju, kar omogoča uporabniku hitro in relevantno pregledovanje informacij
PURL • PURL je predhodnik sistema DOI. • Shemo delovanja DOI, ki je bila prikazana na eni od prejšnjih prosojnic, bi lahko brez težav prenesli tudi na delovanje PURL. • Kljub temu da je ideja za njima enaka, se PURL kot rezultat prizadevanja knjižničarjev, da bi tudi na spletu zagotovili enoznačno identifikacijo virov, ni obnesel. • Šele ko so se vmešali založniki in začeli razvijati nadgradnjo tega sistema v DOI, se je tovrstna tehnologija začela širiti.
PURL je permanetni URL naslov, ki naj bi za vedno enoznačno identificiral spletni vir in ne zgolj njegove trenutne lokacije. • Ne usmerja nas na lokacijo dokumenta, ampak na vmesni razreševalni servis, ki nam posreduje trenutni URL dokumenta. • PURL povečuje verjetnost pravilnih rezultatov iskanj veliko bolj kot standardni URL in s tem zmanjša breme ter stroške vzdrževanja uspešnega in dolgoročnega dostopa.
Sestava PURL • protokol: z njim dostopa do PURL razreševalca in se lahko razlikuje od tistega, s katerim dostopamo do vira, ki je povezan z dejanskim PURL-jem • razrešitveni naslov: je IP naslov oz. domena PURL razreševalca; ta del PURL je razrešen z DNS – domain name server • ime: je uporabniško ime, ki je lahko drugačen kot ga ima vir v povezanem URL-ju http://purl.oclc.org/keith/home protokol razrešitveni naslov ime
Viri PURL • Uporabniki morajo dodeliti PURL-je za vse diskretne vire in s tem omogočijo zanesljiv dostop. Tako bi lahko dodajali domače spletne strani, elektronske revije in posamezne članke. • Nediskretni viri, kot so deli v dokumentu, karte in grafike nimajo nobenega smisla zunaj konteksta celotnega dokumenta in niso dobri viri za PURL-je. Slabši viri so tudi začasni dokumenti.
Vzdrževanje PURL • PURL se ne posodablja samodejno, saj so z njimi povezane spremembe URL-jev. • Kadar se spremeni URL, mora vzdrževalec posodobiti podatke v ustreznem strežniku PURL. • Vzdrževanje PURL-ja se izvaja s priključitvijo razreševalca PURL, uporabo spletnega brskalnika in obrazca razreševalnika PURL s katerim se ustvari želene spremembe PURL-ja. PURL-je lahko spreminjajo samo pooblaščeni vzdrževalci.
Uporaba • Uporabniki lahko izberejo PURL na spletni strani ali v dokumentu. PURL naj bi bil razrešen s povezavo URL, ki jo bo brskalnik nato uporabil za dostopanje do vira. • Uporabniki lahko dodajo PURL-je v spletne strani, dokumente in druge vire z vedenjem, da bo PURL ostal dlje časa. • Povezave bodo z uporabo PURL ostale veljavne, tudi če se spremeni URL.
Prihodnost • PURL je starejša tehnologija, ki je nastala na predlog knjižničarjev (OCLC), vendar se v splošni uporabi ni najbolje obnesla. • Sedaj jo bolj uspešno nadomešča DOI, ki predstavlja nadgradnjo PURL tehnologije s strani založnikov. • Verjetno je, da se PURL ne bo nadalje razvijal, saj DOI v celoti nadomešča njegove funkcije in ponuja možnost široke uporabe, tako za založnike kot za načrtovalce digitalnih knjižnic.