70 likes | 186 Views
Bestandkeuze en zoekstrategieën nieuws. Jeroen Bosman VOGIN, 21 november 2013 Wagenin gen. Nieuws. Zoeken actuele discussies:. Twitter search: relatief goede advanced search Nieuwsgroepen: zoeken via Google Groups Discussielijsten: lastig doorzoekbaar tenzij er een webarchief is
E N D
Bestandkeuze en zoekstrategieën nieuws Jeroen Bosman VOGIN, 21 november 2013 Wageningen
Zoeken actuele discussies: • Twitter search: relatief goede advanced search • Nieuwsgroepen: zoeken via Google Groups • Discussielijsten: lastig doorzoekbaar tenzij er een webarchief is • OverzichtbvbijJISCmail> • Fora doorzoeken zoeken met Google Discussions, met Omgili of een site beperking
Interactief: nieuwsgroepen • heet: usenet, news, forums, groups • vroeger apart protocol en vereiste newsreader • nu lezen en archief bij Google Groups • voor specifieke problemen (foutmeldingen) • voor laagdrempelige, actuele discussies • voor sociaal-cultureel en taal(historisch) onderzoek • vluchtig, wilde westen, illegale zaken • Functies deels overgenomen door groepsblogs en profielsites (FB/Google+), Twitter en blog comments
Interactief: discussielijsten • werkt via Email (later ook vaak web-interface) • vaak eerst abonneren, verzenden alleen door abonnees • vrij sterke communities • soms zeer hoge kwaliteit • zoeken lijsten: • Catalist (lijsten met Listserv software) • www.jiscmail.ac.uk/groups/ (Brits hoger onderwijs/wetenschap) • groups.yahoo (lijsten van Yahoo) • bv Nedbib> of Web4Lib > of DIG_REF
Videosearch Zoeken met: • Algemeen: Blinkx en Google Video • Youtube (ook advanced filters!) • Hogeronderwijs: B&G Academia • Known item search en populaire video gaat goed • Maar onderwerpzoeken lastig • Semantic gap tusseneigenlijkeinformatie en doorzoekbare proxy daarvan >>
Beeldontsluiting – semantic gap • text based image en sound retrieval: de computer zoekt in tekst die aan het beeld/geluidgerelateerd is • in explicietaanwezigecomputerleesbaretekst • in bijbehorendewebpagina • in aanwezige metadata (extern of intern) • in computerleesbaargemaakte “embedded” tekst • OCR van in afbeeldingaanwezigetekst • spraakherkenning in geluidsbestand • content based image en sound retrieval >