650 likes | 866 Views
D a blin sko jezgro (Dublin C ore ) i EAD ( Encoded Archival Description). Struktura informacija 12 . maj 201 1 . Metapodaci. Pojam METAPODATAK vodi poreklo od grčke reči μετά što znači „iza“ Metapodaci su podaci o podacima
E N D
Dablinsko jezgro (Dublin Core) iEAD(Encoded Archival Description) Strukturainformacija 12. maj2011.
Metapodaci • Pojam METAPODATAK vodi poreklo od grčke reči μετάšto znači „iza“ • Metapodaci su podaci o podacima • Metapodatakjeskup atributa potrebnih da se opiše neki resurs • Metapodaci su strukturisani podaci koji opisuju karakteristike nekog objekta
kada se koriste metapodaci? • 1. Za opis digitalnih objekata (dokumenata, zapisa) • 2. Za opis podataka na webstranicama • 3. Kao posebni HTML dokument koji je povezan sa izvorom koji se opisuje • 4. U bazama podatka - povezani sa izvorom kojeg opisuju
Kreiranje metapodataka • Metapodaci se mogu kreirati za bilo koji nivo agregacije objekta: • za zbirku objekata • za pojedinačni objekat • za sastavni deo. • Metazapis – skup metapodataka • Izrada metazapisa koji se sastoji od mnoštva metapodataka liči na katalogizacijubibliotečke, muzeološke i arhivske građe.
Dublin Core Metadata Initiative - DCMI • Dublin Core Metadata Initiative - DCMI je organizacija koja se bavi izradom standarda i rečnika za opis informacija u cilju bolje i lakše manipulacije podacima i objektima. • Fokus rada DCMI je izrada semantike standarda za metapodatke. • http://dublincore.org
Šta je Dablinsko jezgro? • Dablinsko jezgro je standard za metapodatke koji se sastoji od seta elemenata za opis širokog spektra izvora na mreži. • Naziv potiče od mesta Dablin u Ohaju gde se u OCLC 1995. godine održavala inicijativna radionica OCLC/NCSA Metadata Workshop • Reč jezgro ukazuje na to da je osnova set elemenata metapodataka, ali da je taj set proširiv po principu jezgra.
Dablinsko jezgro • „Dublin Core (DC) je mali skup metapodataka koji služe za opis informacije” (Milenković M., 2003) • „Dublin Core je mali jezik za pravljenje klase iskaza o resursu” (Baker, 2000) • DC podrazumeva opis elektronskih izvora informacija • Opis se sastoji od elemenata, a elementi od atributa • Set elemenata kojim se vrši opis naziva se • Dublin Core Metadata Element Set – • skraćeno Dublin Core tj. Dablinsko jezgro
opisi u Dablinskom jezgru • DC sadrži dva nivoa opisa: • Jednostavni • Kvalifikovani • Jednostavni opis sadrži 15 elemenata • Kvalifikovani opis sadrži tri dodatna elementa i kvalifikatore
interdisciplinarnost • Semantika Dablinskog jezgra ustanovljena je od strane internacionalne, multidisciplinarne grupe profesionalaca iz oblasti bibliotekarstva, računarstva, kodiranja teksta, muzeologije i ostalih srodnih disciplina. • DC je uspešno lokalizovan na najmanje dvadesetak jezika. Sedam vlada koristiovu tehniku čuvanja informacija (Australija, Kanada, Danska, Finska, Irska, NoviZaland, Velika Britanija). Postoji poprilično dokumentacije o lokalizaciji na druge jezike. Korišćenje DC-a sa UNICODE (UTF-8) rasporedom znatno bi uvećalo mogućnost lokalizacije na srpski jezik
Klase pojmova • Dveklase pojmova: • Elementi (imenice) • Kvalifikatori (pridevi) • U Internet svetu Dablinsko jezgro je univerzalni jezik za opis digitalnih dokumenta.
Karakteristike DCMES • Upotreba elemenata je opciona • Raspored elemenata nije propisan • Preporučuje se upotreba kontrolisanih rečnika • Preporučuje se korišćenje šifrarnika • Pravila za unos definiše sistem koji koristi DCMES (biblioteka, arhiv, muzej, virtuelna biblioteka...)
Ciljevi Dablinskog jezgra • 1. Jednostavnost u kreiranju i održavanju - omogućava i onima koji nisu katalogizatori da kreiraju zapise za digitalne sadržaje • - teži se što većem pojednostavljivanju, kako bi svako mogao da napravi skup opisnih iskaza • 2. Razumljiva semantika • - sematikakoja se koristi je univerzalno razumljiva • - olakšavanje pretraga preko globalne mreže svima koji imaju potrebu za informacijom
Ciljevi Dablinskog jezgra (nastavak) • 3. Međunarodno učešće i lokalizacija • - originalno je napisan na engleskom jeziku, ali danas postoji i na drugim jezicima (finskom, norveškom, japanskom, francuskom, portugalskom, nemačkom, grčkom, španskom...) • 4. Prilagodljivost - predviđeno je da se Dublin Core može prilagoditi raznim novim digitalnim izvorima informacija koje je potrebno opisati, da se može proširiti zavisno od lokalnih potreba i da je interoperabilan u svim novim situacijama
Sintaksa u Dablinskom jezgru Sintaksa koja se koristi: • Generički oblik - element = “vrednost” • HTML ili XHTML (Web's Hypertext Markup Language format ) • RDF/XML(Resource Description Framework koristećieXtensable Markup Language) • HTML se možeiskoristitizademostraciju DC koncepta, alisloženijeaplikacije je najbolje • praviti u RDF/XML-u
Sintaksa u Dablinskom jezgru • Izbor sintakse zavisi od različitih promenljivih i retko se koristi jedan obrazac sintakse koji odgovara svima • Koncept Dablinskog jezgra je dizajniran tako da raznim dokumentima odgovara različita sintaksa, pa je i sintaksa prilagodljiva u skladu sa ciljevima koji su unapred zadati • DC je veoma prilagodljiv način opisa podataka; pored standardnihtipova (bibliotečkih, arhivskih, muzejskih) moguće je opisati i mesta na osnovugeografskog položaja, poštanskog broja ili sl.
Elementi u Dablinskom jezgru • 15 osnovnih elemenata (jednostavni opis): • 1.Title - Naslov • 2.Subject - Predmet • 3.Description - Opis • 4.Type – Vrsta • 5.Source – Izvor • 6.Relation – Odnos • 7.Coverage - Pokrivenost • 8.Creator - Autor
Elementi u Dablinskom jezgru • 9. Publisher - Izdavač • 10. Contributor – Saradnik • 11. Rights - Prava • 12. Date - Datum • 13. Format - Format • 14. Identifier - Identifikator • 15. Language - Jezik • Svaki element DCMES je opisan uz korišćenjeatributa iz standarda ISO11179.
Title - naslov • 1. Title – Naslov Title="A Pilot's Guide to Aircraft Insurance"Title="The Sound of Music"Title="Green on Greens"Title=„Beograd“ • Atributi: • Name: Title • Identifier: Title • Definition: Ime dato objektu • Comment: Naslov je ime po kome je resurs poznat
Subject – Predmet • 2. Subject – Predmet • Subject="Aircraft leasing and renting"Subject="Dogs"Subject="Olympic skiing"Subject="Street, Picabo" • Atributi: • Name: Subjest and Keywords • Identifier: Subject • Definition: Prikaz sadržaja resursa • Comment: Obično Subject sadrži ključne reči ili fraze koje opisuju sadržaj resursa
Description - opis • 3. Description – Opis Description="Illustrated guide to airport markings and lighting signals, with particular reference to SMGCS (Surface Movement Guidance and Control System) for airports with low visibility conditions." Atributi: • Name: Description • Identifier: Description • Definition: Opissadržajaresursa • Comment: Description služizaopisobjekta. Može da sadržisadržaj, reprezentacijunekoggrafičkogobjekta...
Type - vrsta • 4. Type – Vrsta Electronic art exhibition catalog: Type="Image“ Type="Text“ Type="Exhibition catalog“ • Atributi: • Name: Resource Type • Identifier: Type • Definition: "Priroda" sadržaja resursa • Comment: pogledati dodatak A
Source - izvor • 5. Source – Izvor • Source="Image from page 54 of the 1922 edition of Romeo and Juliet" • Atributi: • Name: Source • Identifier: Source • Definition: Referiše na objekat iz koga je sadašnji objekat nastao • Comment:
Relation - odnos • 6. Relation – Odnos Title="Candle in the Wind"Subject="Diana, Princess of Wales"Date="1997"Creator="John, Elton"Type="sound"Description="Tribute to a dead princess."Relation="Elton John's 1976 song Candle in the Wind" Title="Electronic AACR2"Relation="Anglo-American Cataloging Rules, 2nd edition"
Relation - odnos • Atributi: • Name: Relation • Identifier: Relation • Definition: Relacija ka srodnim resursima • Comment: Relacija treba da bude predstavljena kao reč ili broj, tako da se preko nje može pristupiti srodnim resursima. U tesnoj je vezi s elementom Identifier
Coverage - pokrivenost • 7. Coverage – Pokrivenost • Coverage="1995-1996"Coverage="Boston, MA"Coverage="17th century"Coverage="New York" • Atributi: • Name: Coverage • Identifier: Coverage • Definition: Proširenisadržajresursa • Comment: Coverage sadržiimena, lokacijuilivremenski period kojisuvažnizaresurs.
Creator - autor • 8. Creator – Autor (kreator – osoba, organizacija ili servis) Creator="Shakespeare, William„ Creator="Wen Lee„ Creator="Hubble Telescope" • Atributi: • Name: Creator • Identifier: Creator • Definition: Podatak koji prikazuje ko je odgovoran za pravljenje sadržaja resursa • Comment: Creator treba da sadrži ime osobe, organizacije ili servisa koji je kreiraoresurs.
Publisher - izdavač • 9. Publisher - Izdavač Publisher="University of South Where"Publisher=„Prosveta"Publisher="Carmen Miranda“ Atributi: • Name: Publisher • Identifier: Publisher • Definition: Odgovara na pitanje ko je zaslužan za objavljivanje resursa • Comment: Publisher obično sadrži ime osobe, organizacije ili servisa
Contributor - saradnik • 10. Contributor – Saradnik • dodatni podatak vezan za kreatora, odnosno autora • Atributi: • Name: Contributor • Identifier: Contributor • Definition: Definiše ko je dao doprinos sadržaju resursa • Comment: Contributor sadrži ime osobe, organizacije ili servisa
Rights - prava • 11. Rights - Prava Rights="Access limited to members"Rights= Http://cstr.cs.cornell.edu/Dienst/Repository/2.0/Terms& quot; • Atributi: • Name: Rights Menagment • Identifier: Rights • Definition: Informacije o intelektualnoj svojini resursa. • Comment:
Date - datum • 12. Date – Datum (opisivanja izvora) • Date=“2011-05-05"Date=“2011-05"Date=“2011" • Atributi: • Name: Date • Identifier: Date • Definition: Datum je asociran sa nekim događajem iz „života“ resursa. • Comment: Obično se datum vezuje za sa kreiranje resursa. Način zapisa datuma je poISO8601 yyyy-mm-dd
Format - format • 13. Format - Format Format="image/gif"Format="4 kB“ Format="40 x 512 pixels" • Atributi: • Name: Format • Identifier: Format • Definition: Psihička ili digitalna manifestacija objekta • Comment: Format može sadržati vrstu medija ili veličinu resursa, a može sadržati i softver ili hardver potreban za manipulaciju resursom
Identifier - identifikator • 14. Identifier - Identifikator • Identifier="http://purl.oclc.org/metadata/dublin_core/& quot;“Identifier="ISBN:0385424728“ • Atributi: • Name: Resource Identifier • Identifier: Identifier • Definition: Nedvosmisleno pozivanje na resurs • Comment: u praksi vrednost identifikatoru treba dati prema dogovorenim pravilima. Formalni identifikacioni sistem sadrži Uniform Resource Identifier (URI) Digital Object Identifier (DOI) i International Standard Book Number (ISBN)
Language - jezik • 15. Language – Jezik (dvoslovne i troslovne oznake u skladu sa međunarodnim standardima) Language="en"Language="fr"Language="en-US“ (američki engleski) Atributi: • Name: Language • Identifier: Language • Definition: Jezik intelektualnog sadržaja resursa • Comment: Preporučuje se da se za vrednosti ovog elementa koriste vrednosi definisane u RFC1766
Dodatak a – rečnik DCMI tipova • Rečnik DCMI tipova pruža listu elemenata koji mogu da se koriste kao atributtype DC elementu: • Collection označava da je resurs predstavljen kao grupa, njegovim delovima se možepojedinačno pristupiti. • Dataset prikazuje da je informacija kodirana kao neka struktura (tabela, lista... ) • Event opisuje netrajan, vremenski događaj. • Image je netekstualna vizuelna reprezentacija. Image može da se označava: fotografije,slike, dijagrame, mape, filmove...
Dodatak a – rečnik DCMI tipova • InteractiveResource označava resurs koji zahteva interakciju od korisnika da bi biorazumljiv. Atribut opisuje formulare na webu, aplete, multimedijalno učenje... • Service je sistem koji obezbeđuje funkcije koje su značajne za krajnjeg korisnika (na primer servis za identifikaciju, web server, Z39.50... ) • Software je kompjuterski program u prevedenom ili izvornom kodu. • Sound je resurs koji je primarno namenjen da bude tumačen kao zvuk. • Text je resurs namenjen za čitanje (knjige, pisma, novine... ).
Kvalifikovani opis u dablinskom jezgru • Sadrži dodatne elemente i kvalifikatore • Elementi su: 1. Audience – Publika (namena) 2. Provenance - Poreklo 3. RightsHolder– Vlasnici prava • Kvalifikatorisu: 1. InstructionalMethod– Metod obuke 2. AccrualMethod– Metod prirasta 3. AccrualPeriodicity– Periodičnost prirasta 4. AccrualPolicy– Politika prirasta
unos podataka u kvalifikovanom opisu • Audience="elementary school students"Audience="ESL teachers"Audience="deaf adults“(kome je namenjeno) • Provenance="This copy once owned by Benjamin Spock."Provenance="Estate of Hunter Thompson."Provenance="Stolen in 1999; recovered by the Museum in 2003.“(poreklo objekta) • RightsHolder="Stuart Weibel"RightsHolder="University of Bath“(ko je vlasnik autorskih prava)
unos podataka u kvalifikovanom opisu • InstructionalMethod="Experiential learning"InstructionalMethod="Observation" (metod obuke) • AccrualMethod="Deposit"AccrualMethod="Purchase“(metod/način prirasta) • AccrualPeriodicity="Annual"AccrualPeriodicity="Irregular“(periodičnost prirasta/izlaženja) • AccrualPolicy="Active"AccrualPolicy="Closed "(politika prirasta)
DC – nedostaci i pogodnosti • Glavni nedostaci: • ne postoje kataloška pravila • nizak stepen ujednačenosti podataka u primeni • Glavne pogodnosti: • pogodan za netradicionalnu građu koja postoji u velikom broju (zbirka fotografija...) • mogu da ih kreiranju manje obučeni bibliotekari
Dablinsko jezgro – primeri (XML) • <dc> • <title>Arithmetic</title> • <creator>Sandburg, Carl,1878-1967. </creator> • <creator> Rand, Ted, ill.</creator> • <type/> • <publisher>San Diego :Harcourt Brace Jovanovich,</publisher> • <date>c1993.</date> • <language>eng</language> • <description> • A poem about numbers and their characteristics. Features anamorphic, or distorted, drawings which can be restored to normal by viewing from a particular angle or by viewing the image's reflection in the provided Mylar cone. • </description> • <description>One Mylar sheet included in pocket.</description> • <subject>Arithmetic</subject> • <subject>Children's poetry, American.</subject> • <subject>Arithmetic</subject> • <subject>American poetry.</subject> • <subject>Visual perception.</subject> • </dc>
Dublinskojezgro – primeri (HTML) • <META NAME="DC.Title" CONTENT="Who's who in the Metamorphosis of Ovid : the Analytical Onomasticon Project"><META NAME="DC.Title.alternative" CONTENT="Ovid, Metamorphoses: the Analytical Onomasticon Project (homepage)"><META NAME="DC.Creator.personalName" SCHEME="LCNAF" CONTENT="McCarty, Willard"><META NAME="DC.Creator.personalName" SCHEME="LCNAF" CONTENT="Wright, Burton"><META NAME="DC.Creator.personalName" SCHEME="LCNAF" CONTENT="Suksi, Aara"><META NAME="DC.Creator.corporateName" SCHEME="LCNAF" CONTENT="Analytical Onomasticon Project"><META NAME="DC.Description" CONTENT=“An electronic reference book to persons and places in the Metamorphoses of Ovid. It is based on a densely tagged electronic text of the poem and is generated automatically by indexing software written for the purpose. Both the tagged text and the indexing software will be supplied with the book so that the reader can modify the tagging and regenerate the indexes at will."><META NAME="DC.Subject" SCHEME="LCSH" CONTENT="Ovid, 43 B.C.-17 or 18. Metamorphoses--Concordances--Databases."><META NAME="DC.Subject" SCHEME="LCSH" CONTENT="Mythology, Classical--Databases."><META NAME="DC.Subject" SCHEME="LCSH" CONTENT="Poetry, Latin--Databases.">
Dublinsko jezgro - primeri • <META NAME="DC.Relation.IsFormatOf" CONTENT="Ovid, 43 B.C.-17 or 18. Metamorphoses"><META NAME="DC.Identifier" SCHEME="URL" CONTENT="http://www.princeton.edu/~mccarty/Onomasticon/"><META NAME="DC.Date.modified" IETF.RFC-822 CONTENT="1997-02-01"><META NAME="DC.Type" CONTENT="text"><META NAME="DC.Type" CONTENT="data"><META NAME="DC.Format" CONTENT="?"><META NAME="DC.Source" SCHEME="URL" CONTENT="The electronic text used for the Project was kindly supplied on request by the Packard Humanities Institute; it has subsequently been brought into conformity with the text of the Loeb, 3rd edition, as revised by G. P. Goold."><META NAME="DC.Language" SCHEME="RFC 1766" CONTENT="en"><META NAME="DC.Language" CONTENT="Latin">
Dablinskojezgro – primeri (HTML) • <metadata> <dc:title> UKOLN </dc:title> <dcterms:alternative> UK Office for Library and Information Networking </dcterms:alternative> <dc:subject> national centre, network information support, library community, awareness, research, information services,public library networking, bibliographic management, distributed library systems, metadata, resource discovery, conferences,lectures, workshops </dc:subject> <dc:subject xsi:type="dcterms:DDC"> 062 </dc:subject> <dc:subject xsi:type="dcterms:UDC"> 061(410) </dc:subject>
<dc:description> UKOLN is a national focus of expertise in digital information management. It provides policy, research and awareness services to the UK library, information and cultural heritage communities. UKOLN is based at the University of Bath.</dc:description> • <dc:description xml:lang="fr"> UKOLN est un centre national d'expertise dans la gestion de l'information digitale. </dc:description> • <dc:publisher> UKOLN, University of Bath </dc:publisher> <dcterms:isPartOf xsi:type="dcterms:URI"> http://www.bath.ac.uk/</dcterms:isPartOf> • <dc:identifier xsi:type="dcterms:URI"> http://www.ukoln.ac.uk/</dc:identifier> • <dcterms:modified xsi:type="dcterms:W3CDTF"> 2001-07-18 </dcterms:modified> • <dc:format xsi:type="dcterms:IMT"> text/html </dc:format> <dcterms:extent> 14 Kbytes </dcterms:extent> • </metadata>
Dablinsko jezgro i UNIMARC • Dublin Core UNIMARC Naslov200 $a Glavni stvarni naslov 200 $e Podnaslov 510 $a Uporedni naslov 517 $a Ostali varijantni naslovi Autor (kreator)700 $a Lično ime – primarna odgovornost701 $a Lično ime – alternativna odgovornost710 $a Korporativno ime - primarna odgovornost 711 $a Korporativno ime - alternativna odgovornost Predmet606$a Tematska predmetna 675 $a UDC 676 $a DDC 680 $a LCC 686 $a Ostali klasifikacioni sistemi
Dablinsko jezgro i unimarc • Dublin CoreUNIMARC Opis330 $a Tekst sažetka ili apstrakta Izdavač210 $c Naziv izdavača Saradnici701 $a Lično ime – alternativna odgovornost711 $a Korporativno ime – alternativna odgov. Datum210 $d Godina izdavanja Vrsta609$a Formalna predmetna odrednica Format 336 $a Tip kompjuterskih podataka Identifikator010 $a ISBN 011 $a ISSN 856 $aURL Izvor324 $a Napomena o izvoru Jezik101 $a Jezik jedinice Odnos300 $a Opšta napomena Pokrivenost300 $a Opšta napomena Prava300 $a Opšta napomena
Šta je EAD? • EAD - Encoding Archival Description - kodirani opis arhivske građe • Razvoj projekta od 1993. u Biblioteci Berkli univerziteta u Kaliforniji • Podrazumeva razvoj standarda za kodiranje mašinski čitljivih podataka kao što su inventari, registri, indeksi i drugi dokumenti koji su kreirani u arhivama, bibliotekama, muzejima i kolekcijama rukopisa u cilju podrške korišćenju tih fondova
EAD - kriterijumi • Kriterijume uspostavio Danijel Piti, glavni istraživač na projektu Berkli univerziteta • Kriterijumi: • 1. sposobnost da predstavi obimne informacije pronađene u arhivskim informacionim sredstvima • 2. sposobnost da sačuva hijerarhijske odnose između različtih nivoa opisa