370 likes | 522 Views
Informationssökning på Internet med musikaliska förtecken … med utflykter i Web2.0-världen. SMBF Uppsala 2008-03-11 Lars Våge Mittuniversitetets bibliotek. Den moderna informationssökningens största utmaning?. Google yourself to death. Googlefixeringen är idag närmast total
E N D
Informationssökning på Internet med musikaliska förtecken…med utflykter i Web2.0-världen SMBF Uppsala 2008-03-11 Lars Våge Mittuniversitetets bibliotek
Google yourself to death • Googlefixeringen är idag närmast total • Syns du inte i Google finns du inte… • …men Google har inte störst index • Google brukar slås av andra vid studier av relevans • Google har inte så avancerade sökfunktioner som vissa andra sökmotorer • Överlappningen mellan de största sökmotorerna är överskattad • Övertron på ett sökverktyg är fördummande och utnyttjas
Hur söker vi på webben? • Flera undersökningar visar att: • Få använder mer än en sökmotor • Få använder avancerade sökfunktioner • Få tittar på mer än en träffsida • Få tittar på annat än den övre delen av första träffsidan (scrollar inte nedåt) • Få följer mer än en eller två länkar • Få bryr sig om att fundera över webbsidors trovärdighet • Sökordsstatistik: vanligast är att man använder två ord, därefter tre, fyra eller ett sökord
Hur blev det så här? • I slutet av 90-talet drabbades Internet av portalitis, alla webbplatser skulle vara portaler • Google dök upp 1998-99 när sökningen kommit i skymundan och hade ett gränssnitt som var rent och avskalat • Googles träffar upplevdes som relevanta, de var först med att använda länkanalys • Idag är Google vare sig störst, ”bäst” eller ger relevantast träffar men vanans makt är enorm • Google dominerar Internetannonseringen och lever främst på denna och är en global maktfaktor i stil med Microsoft
Nyttan av att kunna mer än att Googla • Att kunna söka bra och hitta på nätet blir allt viktigare • I skolarbete, under högskolestudier, i arbetet och på fritiden – hela tiden behöver vi information • Alla som tillägnar sig bra sökteknik får ”konkurrensfördelar” – kan snabbare gå från infosökning till användande av informationen • Överraskande mycket men långt ifrån ”allt” finns att finna på nätet idag • Problemet är att den bra informationen drunknar • Lösningen är dels att bli bra på att skriva sökuttryck, dels att känna till söktjänsterna bättre • Mycket gömmer sig också i den s.k. osynliga webben som inte går att söka med vanliga sökmotorer – det är viktigt att känna till denna problematik
Hur ska man tänka? • Vad är det för typ av information som ska sökas? • Vem/vilka bryr sig tillräckligt mycket för att producera den typen av information? • Var kan den typen av information finnas? Finns den på webben? • Vilka typer av söktjänster är i så fall lämpliga att använda för att hitta den? • Hur ska jag söka i de aktuella söktjänsterna? • Vilka sökord och sökuttryck kan fungera?
Att hitta på bra sökuttryck är A och O • Skriv ner din sökfråga som en vanlig mening och välj ut de viktigaste betydelsebärande orden • Fundera över tänkbara synonymer, ordvarianter och relaterade termer till dessa ord • Är dina sökord mångtydiga eller allt för generella kan det vara bra att komplettera dem • Det kan vara bra att komma på ord som förekommer ofta tillsammans med sökordet men i fel sammanhang - dessa ord bör man exkludera från sökningen • Tips: Föreställ dig vilken mening du vill läsa på träffsidorna och sök på den frasen! ”Huvudstaden i Benin är”
Hur fungerar egentligen sökmotorer? • insamling av webbsidor och skapandet av index i sökmotorer sköts helt av datorprogram • sökmotorer erbjuder fulltextsökning av webbsidor • spindelprogrammet – hämtar webbsidor och söker efter länkar till fler webbsidor och besöker dessa i sin tur • indexeringsprogrammet – analyserar webbsidor och extraherar information som indexeras för att göras sökbar • sökmodulen – är sökmotorns ansikte utåt på webben och möjliggör sökningen mot indexet • alla delar måste fungera bra var för sig och samverka • Sökmotorsökning = sök i webben som den var för ett tag sedan
Att använda olika typer av söktjänster • Idag finns en mångfald av söktjänster för olika ändamål • Att känna till och kunna använda mer än en generell sökmotor kan ge mycket • Specialiserade söktjänster finns både som delar av de vanliga söktjänsterna och som självständiga • I t.ex. Google, Yahoo och Eniro finns ett flertal specialiserade söktjänster dolda under flikar och diskreta länkar • Vissa av dessa är mycket intressanta men andra mindre • De har tydligt definierade begränsningar som källurval, ämnesområde, dokument- eller filtyper, tidsperiod
Specialiserade söktjänster 1 • Nyhetssöktjänster - bör man alltid använda för senaste nytt • Eniros nyhetssök är den bästa svenska, Yahoo har den bästa internationella täckningen och verktygen • I nyhetssöktjänster ingår idag en del bloggar som alternativa nyhetskällor vid sidan av vanliga media • Här finns också pressmeddelanden och nyhetsbyråerna • Prova Newsdesk.se för svenska pressmeddelanden • Möjlighet att söka efter forskningsartiklar finns t.ex. i Google Scholar och Windows Live Academic
Specialiserade söktjänster 2 • Att söka efter bild, ljud och video är populärt • De största söktjänsterna har alla bildsökning men man kan använda svenska Picsearch som är barnvänlig • Findsounds har en bra webbkatalog med ljud • En annan ljudproduktion är podradio (podcasting) – ny trend med sökning med automatisk taligenkänning (Podscope, Everyzing, Blinkx) • Fildelning av bild, ljud, video finns både laglig, halvlaglig och olaglig (Flickr, Youtube) • Det finns inte så många källor som är omedelbart pålitliga när det gäller att söka fakta • Den engelska Wikipedia är av mycket hög kvalitet men de svenska inte lika bra
Wikipedias allt större betydelse som källa och auktoritet • Allt fler dagstidningar och tidskrifter citerar vanemässigt (engelskspråkiga) Wikipedia • Ärevördiga Nature visade i en studie i december 2005 att kvaliteten var fullt jämförbar med Encyclopedia Britannica • Deras undersökning kritiserades men Nature stod på sig och uppmanar forskare att skriva • En av webbens mest besökta och lästa webbplatser vare sig man vill eller inte, alltid högt i Googles träfflistor • Ett fantastiskt socialt kunskapsprojekt som utmärks av social kontroll, global granskning, försök till manipulation (jfr Wiki Scanner) • Wikipedia är Web2.0
Vad kan bloggar fylla för funktioner? • Personlig publicering utan redaktionell översyn • Dagboksanteckningar, dokumentation, terapi • Nyhetsförmedling, kommentar, media watch dogs • Kunskapsförmedling, pedagogiskt verktyg • Åsiktsförmedling, debatt • Kampanjarbete, politiskt verktyg • Skvaller, desinformation • Informationsverktyg inom företag • Publicering av konstnärlig produktion (bild, musik) • Publicering av material som media inte vill, vågar eller får använda
Ljudbloggar, podcasting, poddradio • Bloggartiklar kan förses med s.k. enclosures eller filbilagor ungefär som e-postmeddelanden • Från 2004 och framåt har bloggar med MP3-filer dykt upp och blivit mycket populärt • Fenomenet kallas internationellt podcasting som är en sammankoppling av iPod och broadcasting • Order poddradio används av Sveriges Radio som sänder ett stort antal program på detta sätt • Det finns program för att automatiskt ladda ner MP3-filerna så att man kan lyssna på dem när man vill • Mediet används som både amatörwebbradio och av internationella media som BBC och NPR
Hur fungerar musikbloggar? • Det är nästan alltid olaglig spridning, men inte enbart (ex. Jonathan Powells blogg) • Filerna lagras på webbplatser som Rapidshare, Megaupload m.fl. där man gratis och anonymt kan ladda upp filer (s.k. 1-click webhosters) • Bloggarna länkar sedan till dessa filer • Få av dessa bloggare laddar själva upp material • Bloggarna är viktiga eftersom det inte finns sökmotorer för webbplatser som Rapidshare • För att kunna utnyttja tjänsterna lättsamt krävs att man betalar en månadsavgift till t.ex. Rapidshare • 100-500 MB brukar vara gräns för storlek, försvårar användandet av dessa webbplatser för DVD-pirater
RSS – Riktigt simpel syndikering? • RSS är ett XML-format för att sprida rubriker till nyhetsartiklar • För att kunna läsa dessa behövs en RSS-läsare • Poängen är att RSS-läsaren själv håller rubriklistorna uppdaterade – mycket tidsbesparande • Användaren behöver inte surfa till de individuella källorna för att hålla koll utan tittar bara på rubrikerna • Många större nyhetsmedias webbplatser har idag flera olika ämnesinriktade nyhetskanaler i RSS-format • Nästan alla bloggar har en tillhörande RSS-adress
Prenumerera på RSS-kanaler och podcatching • För att använda RSS behövs en speciell RSS-läsare • Det finns flera webbaserade som är bra – t.ex. Netvibes (som också hanterar podcasts) • Man kan också installera ett särskilt RSS-program på datorn, brukar kallas news aggregators • Har man en webbaserad är man mer flexibel, men har man ett eget RSS-program får man mer funktioner • Webbläsaren Firefox har inbyggt stöd för RSS – där kallas det för ”aktiva bokmärken”, IE 7 kan också RSS • För att prenumerera på ljud- eller videoinnehåll (podcasting) krävs ett podcatcher-program • Man kan spara sina prenumerationer som OPML-filer
Omvärldsbevakning med RSS-sökresultat • I vissa sökmotorer kan man spara träfflistan som en RSS-adress • Det innebär att man kan använda RSS för bevakning av om vissa nyckelord dyker upp i t.ex. nyhetsartiklar • För att det ska fungera bör man datumsortera träffarna på resultatlistan innan man sparar RSS-adressen • Googles nyhetssöktjänst har stöd för RSS – men det är separata nyhetssöktjänster för olika språk • Yahoos nyhetssöktjänst har också stöd för RSS och har alla språk integrerade (bl.a. svenska) • Används också i referensdatabaser och fulltextdatabaser för sökprofiler
Web2.0 – mycket mer än bloggar • Web2.0 – glödhett uttryck inom IT-världen idag • Web2.0 – vagt buzzword som implicerar deltagande • Social bookmarking -> webbtjänster som visar listor av bokmärken som vanliga användare skapat • Gammal idé som inte slagit på allvar förrän Del.icio.us lanserades 2003 • Bokmärkena organiseras inte i ämneshierarkier utan genom att man anger sökbara ämnesord – s.k. tags • Det finns ingen kontrollerad lista av tags utan man kan använda vilka ord som helst som man tycker passar • Tanken med tags är att folk ska kunna organisera sina bokmärken som de vill samtidigt som de kan visa upp dem för andra som kan vara intresserade
Web 2.0 – taggar, kommentarer, marknadsföring • I YouTube kan alla ladda upp och tagga videofiler (10 min) • En intelligent taggning förvandlar YouTube till en effektiv marknadsföringskanal • Flickr följer samma princip men här lagrar och taggar man bilder • Library of Congress har börjat ladda upp fotografier till Flickr och uppmanar folk att tagga och kommentera dem • Amazon är en anfader till alla dessa webbplatser eftersom man där kunnat kommentera mycket länge • I MySpace kan man blogga, delta i communities, grupper, lägga upp egna bilder, videofiler – används också som marknadsföringskanal för musiker • MySpace har låtit musiker ha egna profiler sedan 1998, kan ladda upp egenproducerade 6 MP3-filer
Stjärnan i musikens Web1.0 – All Music Guide • AMG mest använda musiksöktjänsten på nätet – den mest använda musikuppslagsboken • AMG är inte Web2.0 – innehållet skapas med en traditionell redaktionell process • 900 musikkritiker skriver recensioner och biografier • Innehållet licensieras till andra webbplatser • Skapad 1991 av populärkulturexperten Michael Erlewine och matematikern Vladimir Bogdanov som en slags köpguide • Fanns innan webben! (minns ni Gopher?) • Allmusic.com (sedan 1995) är bara en del av vad som finns i databasen • 1,4 miljoner album, 27 000 beskrivningar av klassiska kompositioner, 842 000 bilder av skivomslag, metadata • Notoriskt långsam
Rate Your Music – en musikalisk LibraryThing • RYM är en enorm samling metadata om skivor som skapats av internetanvändarna själva • I december 2006 fanns över 700 000 skivor beskrivna • I RYM kan man skapa listor över skivor man har, skriva recensioner, betygsätta, skapa speciallistor, kommunicera med andra användare • RYM har funnits sedan 2000 och fr.o.m. 2004 kan artister utan skivkontrakt lägga in egna låtar • Är ett utmärkt komplement till AMG som köpguide och innehåller många sociala aktiviteter • Har många topplistor baserade på användarnas betyg • Är en motsvarighet till LibraryThing
Discogs – störst på digital musik och vinylutgåvor • Discogs är mer inriktad på den diskografiska biten än RYM • Lanserades också 2000 av diskjockeyn Kevin Lewandowski som en databas av hans samling • Innehåller nu metadata om snart en miljon skivor, 77 500 skivbolag, 768 000 artister • Ursprungligen inriktad på digital musikutgivning men täcker nu alla genrer och format (störst på vinyl) • Mer detaljerad än RYM i beskrivningen genom katalogiserandet av ”credits” • Innehåller inte alls lika mycket omdömen som RYM • Fungerar också som ett köp- och säljställe
Andra väletablerade sökrelaterade musiksajter och projekt • MusicBrainz och FreeDB-projektet – de två överlevande ersättarna till den ursprungliga CD-databasen CDDB som kommersialiserades på 90-talet (Gracenote) • Music Genome Project – varje låt representeras av 150-500 ”gener” (ett slags attribut) som skapar en vektor som kan avståndskopplas till andra låtar, experter ägnar 30 min åt varje låt (inte Web2.0…) • Pandora använder MGP för att skapa ”radiostationer” som sänder likartad musik • Last.fm – omtalad och prisbelönt webbplats som också skapar personaliserade ”radiostationer”, använder Audioscrobbler för att kartlägga användarnas smak och vanor och kunna göra rekommendationer • Last.fm vs Amazon ”they’re clustering people by their musical tastes, not by what they buy”
”Laglig” nedladdning av liveinspelningar • Vissa artister är uttryckligen emot att samlare utbyter oauktoriserade liveinspelningar • Andra är s.k. trade friendly • Internet Archive har ett omfattande Live Music Archive med över 47 000 konserter • Dimeadozen är en bittorrent tracker för liveinspelningar som inte getts ut officiellt • Dimes lista över oacceptabelt material är än mer omfattande och detaljerad • En annan bittorrent tracker med fria liveinspelningar är bt.etree.org • Liveinspelningar utbyts vanligen i lossless format som flac och shorten, bara ibland lossy som mp3