1 / 14

synthese

synthese. eric sieverts UB Utrecht / MIM-HvA. NVB - WB onderwerpsontsluiting II 5 april 2007. thema's. weinig over puur “onderwerpsontsluiting” onderwerpsontsluiting full-text zoeken user / looser generated content catalogiseren / titelbeschrijven en verder:

faris
Download Presentation

synthese

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. synthese eric sieverts UB Utrecht / MIM-HvA NVB - WB onderwerpsontsluiting II 5 april 2007

  2. thema's weinig over puur “onderwerpsontsluiting” • onderwerpsontsluiting • full-text zoeken • user / looser generated content • catalogiseren / titelbeschrijven en verder: • usability / user interfaces • economische aspecten • logistieke aspecten • juridische aspecten kikken op clicken ? Eric Sieverts | e.g.sieverts@uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

  3. onderwerpsontsluiting free-text retrieval nut van gecontroleerd vocabulaire • OK door standaardisatie / • autorisatie, maar toch: • problemen met recall: • als te weinig trefwoorden • (wat bijna altijd geval zal zijn) • problemen met precisie: • bij specialistisch onderwerp • problemen met recall: • als te weinig digitale tekst • (en door ontbreken van • standaardisatie als retrieval • software zelf te dom is) • problemen met precisie: • als te weinig digitale tekst Eric Sieverts | e.g.sieverts@uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

  4. onderwerpsontsluiting free-text retrieval nut van gecontroleerd vocabulaire bovendien: zijn we er eigenlijk al uit hoe gebruikers er achter moeten komen op welke woorden ze dan “moeten” zoeken? (werkt Pubmed-oplossing voor ons ook ?) • en wat is de bottomline • bij het (niet) vinden op • titelwoorden? • 48 % WEL gevonden ! • of • 52% NIET gevonden ! Eric Sieverts | e.g.sieverts@uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

  5. onderwerpsontsluiting weinig digitale tekst veel digitale tekst • ook in gevallen waar titel • wel "veelzeggend" is: • alleen hoofdonderwerp • globaal ontsloten • indien "table of contents" • of goede "samenvatting": • alle invalshoeken / onderdelen • "diepte-indexering" / "granulariteit" fragmenten / hoofdstukken “i-Tunisering” alleen hele boek Eric Sieverts | e.g.sieverts@uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

  6. onderwerpsontsluiting • alleen "gecontroleerd"? • nut van "user generated" ontsluiting (tags, kennisrepresentatie-wiki, …) • niet-gecontroleerd, maar toch beter? • up-to-date-ness • communities of practice • nut: specifiek ↔ algemeen • hoeveel materiaal krijgt die tags? • toch ook vorm van controle? >> Eric Sieverts | e.g.sieverts@uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

  7. tags gebundeld op DDC-ranges 

  8. retrieval of ontsluiting • free-text retrieval alleen competitief met ontsluiting als er voldoende tekst is • in dat geval retrieval veel beter voor recall • dan waarschijnlijk ook beter voor precisie, zeker voor specialistische onderwerpen • automatische classificatie ook alleen mogelijk als er voldoende tekst is (EN goede thesaurus!) • begrip "metadata" oprekken voor TOCs, samenvattingen, flapteksten, user tags… • begrip metadata heel wat meer dan “door mensen toegekende inhoudelijke ontsluiting” Eric Sieverts | e.g.sieverts@uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

  9. alleen maar zoeken? ook verleiden? ontdekken zoeken webservices met suggesties zoals Amazon beoordelen hoeveel beoordeeld? “most popular” “long tail” webservices, user generated content, … Eric Sieverts | e.g.sieverts@uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

  10. catalogiseren • hoe belangrijk is "titelbeschrijving" nog? • alleen nog als hulpmiddel voor vinden (en beoordelen) ? • voor parametric search / faceted search ? • kan het voor gewoon materiaal eenvoudiger ? • gaat iemand iets met FRBR doen? Eric Sieverts | e.g.sieverts@uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

  11. the experience iedereen denkt dat Google "de maat der dingen" is voor onze gebruikers Eric Sieverts | e.g.sieverts@uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

  12. the experience iedereen denkt dat Google "de maat der dingen" is voor onze gebruikers maar let op: de Google paradox • met Google "kun je alles vinden" • maar: als echt "alles" in Google zit, is het eigenlijk niet meer te vinden wat bedoelde Erik Oltmans dus met "zoiets als Google"? Eric Sieverts | e.g.sieverts@uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

  13. Eric Sieverts | e.g.sieverts@uu.nl | http://www.library.uu.nl/medew/it/eric | e.g.sieverts@hva.nl

More Related