220 likes | 314 Views
Formater og søgeveje. Hvad betyder formatvalget for mulige søgeveje?. Søgbarhed generelt. Relativ størrelse der afhænger af Systemets formåen og fleksibilitet Standarder og samarbejder Afhængighed af centrale løsninger Databaseopbygning og formater Grænsefladens funktionalitet og opsætning
E N D
Formater og søgeveje Hvad betyder formatvalget for mulige søgeveje?
Søgbarhed generelt • Relativ størrelse der afhænger af • Systemets formåen og fleksibilitet • Standarder og samarbejder • Afhængighed af centrale løsninger • Databaseopbygning og formater • Grænsefladens funktionalitet og opsætning • Ressourcetildelingen til katalogen
Søgbarhed i Danmark • DanBib (fællesbasen) • vifte af søgekoder – brede/specifikke • tradition for CCL-søgning – nu også grafik • honorerer forskelligartede behov • Lokale kataloger • målrettet mod primærbrugerne • selektive udvælgelser af søgekoder • både grafisk og tegnbaseret grænseflade
danMARC2-komplekset • Katalogiseringsregler og bibliografisk standard for danske biblioteker • danMARC2 • Praksisregler for Søgeveje • BATH-profilen (indirekte) • danZIG-profilen • Rammeformater: ISO2709, linie, XML
MARC21-komplekset • AACR2 • MARC21 • Lokalt definerede søgekoder? • Bath-profilen, regionale profiler, lokale tilpasninger • Rammeformater: ISO2709, XML
Dublin Core og andre ikke-MARC-formater • Bagvedliggende beslutninger om semantik og dataudvælgelse. Standarder undervejs • Aftaler om udformning af tags m.v. De facto-standarder under udvikling • Søgning/klik via grafiske flader i tabeller eller relationsdatabaser • Rammeformater: Ofte XML men også andre
Hvad er Praksisreglerne? • Definerer søgekodenavne og -indhold • Definerer søgestrenge til både ord- og sætningsregisteropbygning • Definerer udfoldning af div. koder • Bygger på de danske regler • Udnytter danMARC2 til mindste delfelt • Fundament for danZIG-profilen • Findes på BS's hjemmeside under Publikationer (fra 1999)
Hvad kan/skal sammenlignes? • Z39.50-søgemuligheder i DK og hos OCLC (First Search/WorldCat) ud fra dokumentation • Udgangspunkt i definition af BIB1-use-attributter – afspejler formatudnyttelse i registrene • Lokale definitioner og forskelle
Use attr. DK OCLC DC BIB1 1=4 ti ti DC BIB1 1=4 lti ti= DC BIB1 1=5 se se BIB1 1=6 ut ut BIB1 1=6 lut ut= BIB1 1=7 ib nb BIB1 1=8 in ns BIB1 1=12 id no BIB1 1=13 ddc dd BIB1 1=14 ud ud BIB1 1=16 lcc lc BIB1 1=17 nlm lm BIB1 1=18 nal ag BIB1 1=21 em su DC BIB1 1=21 lem su= DC BIB1 1=25 ms hm BIB1 1=25 lms hm= BIB1 1=31 år yr DC BIB1 1=33 nt tk BIB1 1=54 sp ln DC Use attr. DK OCLC DC BIB1 1=56 lok li BIB1 1=59 pu pl BIB1 1=63 no nt DC BIB1 1=1001 mp_id dt BIB1 1=1003 fo au DC BIB1 1=1003 lfo au= DC BIB1 1=1004 pe pn BIB1 1=1004 lpe pn= BIB1 1=1005 ko co BIB1 1=1005 lko co= BIB1 1=1007 is sn DC BIB1 1=1009 lep na= BIB1 1=1012 aj up BIB1 1=1016 default_id [ ] DC BIB1 1=1018 fl pb DC BIB1 1=1031 ma mt DC BIB1 1=1088 ag ha BIB1 1=1088 lag ha= Sammenfaldende BIB1-kodermellem danZIG og OCLC I alt 30 sammenfaldende typer
BIB1 1=9 nl 010 - ? nr BIB1 1=27 hl 6xx x0 - ? em BIB1 1=27 hl= - ? lem BIB1 1=28 hr 6xx x6 - ? em BIB1 1=28 hr= - ? lem BIB1 1=29 id 653 - ? uk (1=1080) BIB1 1=29 id= ? luk BIB1 1=50 gn 074,086 - ? cl BIB1 1=51 mu 028,262 - ? im (1=1092) BIB1 1=58 gc= 6xx - ? em BIB1 1=61 mf 007,008 - ma=xa (1=1031) BIB1 1=1002 et Ext. tit. - ? ti BIB1 1=1002 et= - ? lti BIB1 1=1006 cn 111,711 - ? ko BIB1 1=1006 cn= - ? lko BIB1 1=1008 hc 6xx x1 - ? em BIB1 1=1008 hc= - ? lem BIB1 1=1019 dl 008,040,042 kilde DLC - ? BIB1 1=1023 cr 510 - ? no BIB1 1=1027 rn 027 m.fl. - ? ir (1=1093) BIB1 1=1044 li 948 - ? lok (1=56) BIB1 1=1210 hs 6xx x8 - ? em BIB1 1=1210 hs= 6xx x8 - ? lem BIB1 1=1211 no 019 - ? id (1=12) BIB1 1=5003 ea Ext. au. - ? fo BIB1 1=5003 ea= - ? lfo BIB1 1=5011 st 006 - ? ma (1=1031) BIB1 1=5011 st= - ? BIB1 1=5031 yy 008(date2) - ? år (1=31) BIB1 1=5055 ca 055 (call-no) - ? BIB1 1=5090 sa= 6xx - ? lem (1=21) BIB1 1=5110 kw Keyword ikke au - ? BIB1 1=5245 et Ext. tit. - ? ti (1=1002) BIB1 1=5245 et= - ? lti BIB1 1=5300 he 6xx x5 - ? em BIB1 1=5300 he= - ? lem BIB1 1=5610 nc= 610 - ? lek (1=1074) BIB1 1=5611 cf= 611 - ? lek BIB1 1=5650 de 650 - ? em BIB1 1=5650 de= - ? lem BIB1 1=5655 ge= Genre - ? lem BIB1 1=5856 am URL’er - ? ww (1=1032) BIB1 1=5847 mc 945 (music) - ? ma=mu? BIB1 1=5848 cg 947 (holdings) - ? BIB1 1=5938 vn 938 (vendor inf) - ? BIB1-søgekoder kun i OCLC?
USE attr. DK-søgekoder BIB1 1=5 lse BIB1 1=14 udk BIB1 1=20 kl BIB1 1=20 lkl BIB1 1=33 lnt BIB1 1=35 pa BIB1 1=35 lpa BIB1 1=42 tt 247 - ? et BIB1 1=42 ltt - ? et= BIB1 1=55 ul BIB1 1=60 co 030 - ? sn BIB1 1=1009 ep 600 - kun na= BIB1 1=1024 km 034 - kun [ ] BIB1 1=1026 rt 76x - ? et BIB1 1=1026 lrt - ? et= BIB1 1=1032 ww ? am BIB1 1=1033 vp 773 - ? et BIB1 1=1033 lvp - ? et= BIB1 1=1040 cl BIB1 1=1040 lcl BIB1 1=1074 ek BIB1 1=1074 lek nc= (1=5610) BIB1 1=1080 uk ? - id (BIB1 1=29) BIB1 1=1080 luk ? - id= BIB1 1=1085 ac BIB1 1=1085 lac BIB1 1=1086 cp BIB1 1=1086 lcp BIB1 1=1087 ed BIB1 1=1087 led BIB1 1=1089 bcm BIB1 1=1090 dbk BIB1 1=1091 ic BIB1 1=1092 im mu (1=51) BIB1 1=1093 ir rn (1=1027) BIB1 1=1094 doi BIB1 1=1095 ou BIB1 1=1096 st 785 - ? et BIB1 1=1096 lst - ? et= BIB1-søgekoder kun i danZIG? I alt 28 forskellige datatyper
au lau ke lke db ldb df ldf ds lds me lme fm lfm nb lnb po lpo dk ldk gd lgd ef lef es les ts lts ok fg kk ix nm nr en tf lvx bs mo fv fb Hvad med DAN1-koderne?
Hvad betyder det i praksis?(kode-felterne - lydbogen) Hovedpost: 001 00 *a 24171795 *b 870970 *c 20021009232056 *d 20020717 *f a *t FAUST ln=870970 004 00 *r n *a h 005 00 *z p ma=lb 008 00 *u f *a 2002 *b dk *j f *l dan *v 0 ma=ro 009 00 *a r *g xc ma=ly ma=xc Bindpost: 001 00 *a 24171833 *b 870970 *c 20021009232126 *d 20020717 *f a *t FAUST 004 00 *r n *a b 005 00 *z p ma=lb 008 00 *t m *v 0 ma=mo Kommentar: Koderne kan bruges direkte fra delfelterne, mulighed for at lægge bindspecifikke koder på bindet MARC21: Fra ISO2709-leader: nimi=non musical sound recording m=monograph 001 24171795 005 20021009232056.0 007 sd|bmsfnnmplues=sound recording d=sound disc + størrelse, optageteknik, plastic m.v. 008 020717s2002 dk dan d Kommentar: Koderne skal hentes fra positioner, headeren/leaderen er ikke dubleret – skal bruges til afkodning, koderne er ikke direkte kompatible med danMARC2, ”skæve” værdier og mange niveauer
Hvad betyder det i praksis?(kode-felterne – tidsskrift) 001 00*a00208395*b125320*c20030325192112*d20001031*fa 004 00*rc*ae 008 00*tp*uc*a1999*bgb*cb*hp*leng*v4 ma=pe *c=Hver 2. måned ma=ts 009 00*aa*gxe*btma=xe ma=el (fra 006 i MARC21) MARC21: Fra leader/header: cas s=serial 001 00208395 003 DLC 005 20030325192112.0 006 m d m=computer file/elect. res. d=document (type of computer file - kode fra 008) 007 cr mnu c=elect. res. r=remote m=mixed (color) n=not app. (dimens.) u=unknown (sound) 008 001031c19999999enkbr pss 0 0eng d b=bimonthly r=regular p=periodical s=electronic (orig. Item) s=electronic (this item) Kommentar: Mange koder både som primær og sekundær mat. type. Nogle af dem overlappende??? I hvert fald meget detaljeret
Hvad betyder det i praksis?(ophavsoplysninger) Hovedpost: 100 00 *0 *a Tolkien *h J. R. R. 245 00 *a Ringenes herre *e J.R.R. Tolkien *f indtaling: Torben Sekov *f oversættelse: Ida Nyrop Ludvigsen 700 00 *0 *a Sekov *h Torben Bindpost: Ingen Søgestrenge: lfo+fo+lpe+pe= 100 ah, 700 ah, lpo+po=100 ah fb=245 ef Kommentar: Hvert enkelt delfelt kan medtages eller udelades, Ingen ISBD-tegn, brug af 100 er frivillig, men kan udnyttes til et selvstændigt register, delfeltbogstaver har entydig betydning, nulstillede indikatorer MARC21: 100 1 *a Tolkien, J. R. R.. 245 10*a Ringenes herre /*c J.R.R. Tolkien ; indtaling: Torben Sekov ; oversættelse: Ida Nyrop Ludvigsen. 700 1 *a Sekov, Torben. Søgestrenge: Kan dannes ud fra 100 1 *a, 245 /*c og 700 1 *a Kommentar: Indikatorer skal kunne håndteres, kræver ”tegnundertrykkelse”, ingen mulighed for udeladelse af dele af data, systemet skal kunne identificere foranstillet tegn+delfelt
Hvad betyder det i praksis?(titeloplysninger- lydbog) Hovedpost: 241 00 *a The ¤fellowship of the ring 245 00 *a Ringenes herre Bindpost: 245 00 *g Bind 1 *a Eventyret om ringen Søgestrenge: lti=241a, 245 a, ti=241 a, 245 ga Kommentar: Selvstændigt felt til originaltitler, brug af alfabetiseringsmærke, plads til alle typer oplysninger om bindet i formateret form, mange andre titeldelfelter til rådighed i 245 MARC21: 240 14 *a The fellowship of the ring *l Danish 245 10*a Ringenes herre 505 8 *g Bind 1.*t Eventyret om ringen. Søgestrenge: Kan lægges ud, dog vil der skulle sættes kriterier for et originaltitelregister via 041 Kommentar: 240 er felt til uniforme titler, yderligere titeloplysninger i 245 vil stå i *b med forskellige foranstillede ISBD-tegn, f.eks. :*b og =*b. *a kan IKKE gentages, så der kan kun angives én hovedtitel. 505 bruges både til indholdsnote (530) og bindoplysninger, der kan kun formateres med 4 delfelter, så f.eks. serietiteloplysninger skal gentages i 440/840
Hvad betyder det i praksis?(flerbindsværk i flad struktur) 248 00 *G1 *gVol. 1 *aElectrical stimulaton *j1985 *k327 s. *z0-87055-457-3 248 00 *G2 *gVol. 2 *aMeat and poultry microbiology *j1986 *k436 s. *z0-87055-498-0 248 00 *G3 *gVol. 3 *aRestructured meat and poultry products *j1987 *k519 s. *z0-442-27591-9 MARC21: 505 8 *gVol. 1.*tElectrical stimulaton.*g1985.*g327 s.*g0-87055-457-3.--*gVol. 2.*tMeat and poultry microbiology.*g1986. *g436 s.*g0-87055-498-0.--*gVol. 3.*tRestructured meat and poultry products.*g1987 *g519 s.*g0-442-27591-9. ------------------------------------------------------------------------------------------------------------------- 248 00 *G1 *gVol. 1 *j1985*sAdvances in agricultural biotechnology*v16*z90-247-3198-4 248 00 *G2 *gVol. 2 *j1987*sAdvances in agricultural biotechnology*v21*z90-247-3435-5 MARC21: 505 8 *gVol. 1.*g1985.*gAdvances in agricultural biotechnology.*g16.*g90-247-3198-4.--*gVol. 2.*g1987.*gAdvances in agricultural biotechnology.*gv21.*g90-247-3435-5. Kommentar: årstal, ISBN, serietitel og –nr skal gentages i dedikerede felter for at blive søgbare i de rigtige registre. *g = Miscellaneous information
Hvad betyder det i praksis?(titeloplysninger – tidsskrift) 210 00*aDtsch. Natl.bibliogr., A Neuerschein. Buchhand. 222 00*aDeutsche Nationalbibliographie. Reihe A, Neuerscheinungen des Buchhandels 245 00*aDeutsche Nationalbibliographie*nReihe A*oNeuerscheinungen des Buchhandels 745 00*iPortion of title*aNeuerscheinungen des Buchhandels 860 00*tWöchentliches Verzeichnis der erschienenen und der vorbereiteten Neuigkeiten des deutschen Buchhandels 861 00*tDeutsche Nationalbibliographie und Bibliographie des im Ausland erschienenen deutschsprachigen Scrifttums. Reihe A, Neuerscheinungen des Buchhandels*z0323-3596 MARC21: 210 0 *aDtsch. Natl.bibliogr., A Neuerschein. Buchhand. 222 0*aDeutsche Nationalbibliographie. Reihe A, Neuerscheinungen des Buchhandels 245 00*aDeutsche Nationalbibliographie.*nReihe A,*pNeuerscheinungen des Buchhandels. 246 30*aNeuerscheinungen des Buchhandels 780 00*tWöchentliches Verzeichnis der erschienenen und der vorbereiteten Neuigkeiten des deutschen Buchhandels*w(OCoLC)5630687 785 00*tDeutsche Nationalbibliographie und Bibliographie des im Ausland erschienenen deutschsprachigen Scrifttums. Reihe A, Neuerscheinungen des Buchhandels*x0323-3596*w(DLC) 86644852 Kommentar: Udover ISBD-tegnene i 245 er der ikke den store forskel i mulighederne. Indikatorerne er udnyttet fuldtud men er ikke nødvendige ved normal registeroplægning, felterne er formaterede på samme niveau som danMARC2
Hvad betyder det i praksis?(noter) Hovedpost: 500 00*aUregelmæssig 505 00*aSerie 512 00*iEngelsksprogede numre med titel *tReport *eDepartment of Planning, Technical University of Denmark 539 00*a5 (1999) ti=report fo+ko=department….. Bindpost: 245 00*G98-06*g6, 1998*aMetoder til beregning af jernbanekapacitet*cph.d-afhandling*eaf Anders Hunæus K@ås 506 00*aPh.d.-afhandling 512 00*aNederst på titelsiden: Transportrådet, Banestyrelsen Rådgivning no=nederst …….. 512 00*iPå omslaget*tTrafikstudier ti=trafikstudier 520 00*aOgså udgivet: Kbh. : Banestyrelsen rådgivning no=også …. MARC21: 500 *aUregelmæssig. 500 *aSerie. 500 *aEngelsksprogede numre med titel: Report / Department of Planning, Technical University of Denmark. 500 *a5 (1999). 505 8 *g6, 1998.*tMetoder til beregning af jernbanekapacitet. Kommentar: Bindpostens noter mangler – kan ikke knyttes til i andet end *g. Hvis 500 gøres søgbar vil der opstå meget støj. Hvis bindpostens noter var med, ville de også ende felt 500. Kun enkelte af de mange notefelter indeholder formateringsmuligheder
Hvad betyder det i praksis?(klassifikation og emneord) • Specifikation af danske emneord kræver ændringer i MARC21. DBC og ???? • Specifikation af dk5 kræver ændring i MARC21, og vil kun udløse ét delfelt • Søgbarhed afhænger helt af disse ændringers udformning. Afhængighed af ”fremmed styring”
Dublin Core i XML – et hurtigt eksempel <dc-record> <title>Ringenes herre. Bind 3. Kongen vender tilbage</title> <creator>Tolkien, J. R. R.</creator> <creator>Sekov, Torben</creator> <subject>eventyr</subject> <subject>det gode</subject> <subject>det onde</subject> <subject>eventyrlige fortællinger</subject> <description>Hobbitten Frodo forsøger at bringe en magisk ring, der giver uindskrænket magt, frem til Dommedagsbjerget, hvor den skal ødelægges. I eventyrets og mytens form skildres kampen mellem det gode og onde</description> <publisher>Gyldendal Lydbøger</publisher> <language>dan</language> </dc-record> Kommentar: DC kan udbygges til MARC’ske dimensioner med qualifiers m.v., hvis det ønskes. Søgbarheden vil selvfølgelig afhænge helt af den bagvedliggende bases opbygning
Opsummering • Mange komponenter i søgeveje • Formatspecifitet og datakonsistens influerer direkte på fleksibiliteten • Fælles ”håndteringsgrundlag” en stor fordel ved genbrug og samsøgning • Formatvalg bør bestemmes af de data, der skal lagres/søges/udveksles og de sammenhænge, disse data skal indgå i