140 likes | 330 Views
synthese. eric sieverts UB Utrecht / MIM-HvA. NVB - WB onderwerpsontsluiting II 5 april 2007. thema's. weinig over puur “onderwerpsontsluiting” onderwerpsontsluiting full-text zoeken user / looser generated content catalogiseren / titelbeschrijven en verder:
E N D
synthese eric sieverts UB Utrecht / MIM-HvA NVB - WB onderwerpsontsluiting II 5 april 2007
thema's weinig over puur “onderwerpsontsluiting” • onderwerpsontsluiting • full-text zoeken • user / looser generated content • catalogiseren / titelbeschrijven en verder: • usability / user interfaces • economische aspecten • logistieke aspecten • juridische aspecten kikken op clicken ? Eric Sieverts | e.g.sieverts@uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl
onderwerpsontsluiting free-text retrieval nut van gecontroleerd vocabulaire • OK door standaardisatie / • autorisatie, maar toch: • problemen met recall: • als te weinig trefwoorden • (wat bijna altijd geval zal zijn) • problemen met precisie: • bij specialistisch onderwerp • problemen met recall: • als te weinig digitale tekst • (en door ontbreken van • standaardisatie als retrieval • software zelf te dom is) • problemen met precisie: • als te weinig digitale tekst Eric Sieverts | e.g.sieverts@uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl
onderwerpsontsluiting free-text retrieval nut van gecontroleerd vocabulaire bovendien: zijn we er eigenlijk al uit hoe gebruikers er achter moeten komen op welke woorden ze dan “moeten” zoeken? (werkt Pubmed-oplossing voor ons ook ?) • en wat is de bottomline • bij het (niet) vinden op • titelwoorden? • 48 % WEL gevonden ! • of • 52% NIET gevonden ! Eric Sieverts | e.g.sieverts@uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl
onderwerpsontsluiting weinig digitale tekst veel digitale tekst • ook in gevallen waar titel • wel "veelzeggend" is: • alleen hoofdonderwerp • globaal ontsloten • indien "table of contents" • of goede "samenvatting": • alle invalshoeken / onderdelen • "diepte-indexering" / "granulariteit" fragmenten / hoofdstukken “i-Tunisering” alleen hele boek Eric Sieverts | e.g.sieverts@uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl
onderwerpsontsluiting • alleen "gecontroleerd"? • nut van "user generated" ontsluiting (tags, kennisrepresentatie-wiki, …) • niet-gecontroleerd, maar toch beter? • up-to-date-ness • communities of practice • nut: specifiek ↔ algemeen • hoeveel materiaal krijgt die tags? • toch ook vorm van controle? >> Eric Sieverts | e.g.sieverts@uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl
tags gebundeld op DDC-ranges
retrieval of ontsluiting • free-text retrieval alleen competitief met ontsluiting als er voldoende tekst is • in dat geval retrieval veel beter voor recall • dan waarschijnlijk ook beter voor precisie, zeker voor specialistische onderwerpen • automatische classificatie ook alleen mogelijk als er voldoende tekst is (EN goede thesaurus!) • begrip "metadata" oprekken voor TOCs, samenvattingen, flapteksten, user tags… • begrip metadata heel wat meer dan “door mensen toegekende inhoudelijke ontsluiting” Eric Sieverts | e.g.sieverts@uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl
alleen maar zoeken? ook verleiden? ontdekken zoeken webservices met suggesties zoals Amazon beoordelen hoeveel beoordeeld? “most popular” “long tail” webservices, user generated content, … Eric Sieverts | e.g.sieverts@uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl
catalogiseren • hoe belangrijk is "titelbeschrijving" nog? • alleen nog als hulpmiddel voor vinden (en beoordelen) ? • voor parametric search / faceted search ? • kan het voor gewoon materiaal eenvoudiger ? • gaat iemand iets met FRBR doen? Eric Sieverts | e.g.sieverts@uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl
the experience iedereen denkt dat Google "de maat der dingen" is voor onze gebruikers Eric Sieverts | e.g.sieverts@uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl
the experience iedereen denkt dat Google "de maat der dingen" is voor onze gebruikers maar let op: de Google paradox • met Google "kun je alles vinden" • maar: als echt "alles" in Google zit, is het eigenlijk niet meer te vinden wat bedoelde Erik Oltmans dus met "zoiets als Google"? Eric Sieverts | e.g.sieverts@uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl
Eric Sieverts | e.g.sieverts@uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl