350 likes | 537 Views
Google Scholar på godt og vondt. Norwegian Online User Group arrangerer seminar på NBFs møte 23/3/2012 Even Hartmann Flood, førstebibliotekar, UBiT even.flood@ub.ntnu.no Lars Iselid, bibliotekar, UMEÅ universitetsbibliotek. Google Scholar - på godt,.
E N D
Google Scholar på godt og vondt Norwegian Online User Group arrangerer seminar på NBFs møte 23/3/2012 Even Hartmann Flood, førstebibliotekar, UBiT even.flood@ub.ntnu.no Lars Iselid, bibliotekar, UMEÅ universitetsbibliotek Google Scholar - på godt, NBF 23 mars 2012
Google Scholar - på godt, Kjetterske tanker til seminar på NBF møte 23 mars 2012 Even Hartmann Flood, førstebibliotekar, UBiT Presentasjonen er på: http://folk.ntnu.no/flood/foredrag/gsnbf.ppt Google Scholar - på godt, NBF 23 mars 2012
Innhold • Litt om GS og bakgrunnen for basen • Hvorfor er den ofte veldig bra? • Søkeeksempler – glimt fra dagliglivet ved NTNU UB Google Scholar - på godt, NBF 23 mars 2012
Google Scholar: scholar.google.com Google scholar er Googles program for å skaffe oversikt over og adgang til primærmateriale – originalarbeidene for forskningsresultater. Google inngikk i 2004 avtale med en del forlag om å få indeksere artiklene deres full tekst. Full tekst inkluderte litteraturlistene, dermed GS fikk nok data til å kunne lage en siteringsdatabase, i likhet med og i konkurranse med ISI Web of Science og Elseviers SCOPUS Dette var grunnlaget for basen Google Scholar. Flere store forlag var med fra starten med sin portefølje: Blackwell, Springer, Oxford UP osv. Google Scholar - på godt, NBF 23 mars 2012 E. Flood. Verdensveven utenfor Google .
Google Scholar I tillegg til de vitenskapelige tidsskriftene høster GS åpne arkiver og åpne tidsskrift som ligger i full tekst. Og en masse annet som ser ut som artikler Bibliografiske databaser ble også høstet og lagt inn i GS, selv om full tekst og siteringer ikke var tilgjengelige. I 2007 kom Elsevier inn med ScienceDirect inn i basen. Da tok det av for alvor! (Antall nedlastinger fra ScienceDirect gikk opp fra 300 000 til 480 000 på to år.) Resultatet: En meget stor database. Google Scholar var kommet for å bli. Google Scholar - på godt, NBF 23 mars 2012 E. Flood. Verdensveven utenfor Google .
Google Scholar • 1) ) Fulltekst med siteringer fra fagfellevurderte tidsskrifter. • Dette er den klart viktigste kilden til GS. Hele teksten er søkbar. Ifølge Peter Jacso (2010) er ca 2 900 forleggere med, ca 21 000 tidsskrifter inne, over 30 mio arbeider med DOI. • 2) GS dekker fulltekst også åpne arkiver, som • fysikkdatabasen Arxiv, • den nordiske databasen DIVA og • alle mulige institusjonsarkiver. • 3) GS har bøker, i særdeleshet siteringer til bøker og ofte lenke til opplysninger om boken hvis den er i Google Books. Google Scholar - på godt, NBF 23 mars 2012 E. Flood. Verdensveven utenfor Google .
Google Scholar • Uavklart – og Google vil ikke si noe om det: • Nøyaktig hva er kildene? Hvilke tidsskrifter dekkes? Hvilke institusjonsarkiv? Noen liste finnes ikke. Og hvor langt tilbake dekkes tidsskriftene? Hvor ofte oppdateres basen Google Scholar - på godt, NBF 23 mars 2012 E. Flood. Verdensveven utenfor Google .
Google Scholar Før vi går videre: Ikke forsøk å forstå hvorfor Google gjør ting de gjør Karen Blakeman, NOLUG 27/2/09: That way lies madness. Forrest Gump, nesten: ”Google is as Google does” Google Scholar - på godt, NBF 23 mars 2012 E. Flood. Verdensveven utenfor Google .
Google Scholar Reaksjon blant bibliotekarer og søkere på GS i 2004: «Der blev i stuen stilhed samme stund. Man skifted øjekast; man trak på mund.» (Fra Peer Gynt) Behandling av vitenskapelige arbeider var alt for viktig til å kunne overlates til roboter. Dette var menneskejobb! Google Scholar - på godt, NBF 23 mars 2012 E. Flood. Verdensveven utenfor Google .
Google Scholar Google skulle ikke komme her og komme her! Og kritikerne fikk det veldig morsomt! Den første tiden ble det funnet utrolig mange feil og unøyaktigheter. Tabelloversikter ble forfattere (masse treff på «results» som forfatter), sidetall og årstall ble blandet sammen og bibliografiske opplysninger ble blandet sammen. Google Scholar - på godt, NBF 23 mars 2012 E. Flood. Verdensveven utenfor Google .
Mange problemer i starten Forfattersøk utløste voldsomme kritikker. Alt mulig av overskrifter endte som forfattere: Tables, results var meget populære navn. Dette er viktig punkt i Péter Jacsó, (2010) "Metadata mega mess in Google Scholar", Online Information Review, Vol. 34 Iss: 1, pp.175 - 191 Mange av disse feilene er blitt forbedret. Jacso nevner nesten en million treff på forfatteren ”F Password”. Når er det ingen. Dypt savnet av forelesere som ville ha morsomme eksempler. Google Scholar - på godt, NBF 23 mars 2012
Mange problemer i starten Mange av disse feilene er blitt forbedret. Jacso nevner nesten en million treff på forfatteren ”F Password”. Når er det ingen. Dypt savnet av forelesere som ville ha morsomme eksempler. Andre tall fra Jacso og idag:: Nå: 966 arbeider av ”background”, var 13 200 i Jacso Nå: 6870 arbeider av ”treatment”, var 39 500 i Jacso. (Disse lavere tallene kom omtrent i 2010 og er *ikke* blitt bedre siden) Google Scholar - på godt, NBF 23 mars 2012
Google Scholar Etter som årene gikk ble ting bedre, feil forsvant, svarene ble mer presise, de gode sidene til GS kom mer og mer frem i svarene. Treffene er mer presise. Det ble ikke på langt nær så morsomt å snakke om GS! Og jeg, en gammel søker og fanatisk tilhenger av informasjonskvalitet har faktisk begynt å bruke GS som førstevalg i svært mange tilfelle. I feel the power of the dark side… Google Scholar - på godt, NBF 23 mars 2012 E. Flood. Verdensveven utenfor Google .
Google Scholar Hvorfor denne forandring og disse kjetterske tanker? Fordi jeg finner stadig oftere arbeider som er fagfellevurdert, høyt sitert, langt oppe på svarlisten og som ikke er i eller kommer ut på søking i andre databaser: Sammenlikninger må bli med de to store sitreringsbasene ISI Web of Science og Elseviers Scopus. Alle de tre har siteringer, størrelse og multifaglighet som sine sterke sider (og eksistensberettigelse) Vurdering opp mot spesialfaglige databaser er ikke gjort. For eksempel, ingen kjemiker ville brukt noen av dem for kjemisøking. Google Scholar - på godt, NBF 23 mars 2012 E. Flood. Verdensveven utenfor Google .
Grunner til flere og bedre treff: GS har materiale de andre ikke har. I tillegg til artiklene fra alle de kommersielle forlagene: 1) Institusjonsarkiv og åpne arkiv hvor forskere har lagt ut artikler som er publisert i vitenskapelige publikasjoner. 2) OA tidsskrifter. Her er det menge redigerte tidsskrifter som finnes gratis full tekst, men som ikke er vurdert som viktige nok for Scopus og ISI. Google Scholar - på godt, NBF 23 mars 2012 E. Flood. Verdensveven utenfor Google .
Grunner til flere og bedre treff: GS har materiale som de andre ikke har. 3) Dekker langt flere nasjonale kilder, også redigerte tidsskrifter. Det er et beklagelig faktum at ISI og Scopus er vestlig orientert. Da GS kom var det mange fra den tredje verden som opplevde sitt materiale ble mye mer lest. 4) GS dekker bøker og kapitler i bøker. Ikke full tekst (?), men siteringer til bøkene og bøkene kommer ut med siteringstall. Google Scholar - på godt, NBF 23 mars 2012 E. Flood. Verdensveven utenfor Google .
Grunner til flere og bedre treff: GS søker full tekst i artiklene de dekker (for det aller meste). Det er mye kraftigere søk enn de andre og gjør det mulig å søke på meget spesifikke emneord. GS finner artikler som også er i de andre basene, men som ikke kommer ut i søket. Rangeringen. Negativt: Vi er bundet av Googles rangering av svarene. Men positivt: Google tar med med hvordan emneordene er i forhold til hverandre, det gir ofte en langt mer relevant rangeringsliste enn etter vanlig boolsk søking. Google Scholar - på godt, NBF 23 mars 2012 E. Flood. Verdensveven utenfor Google .
Grunner til flere og bedre treff: • Lenker til hele teksten • GS har ofte lenker til gratis utgaver av artikler so mer publisert i vitenskapelige tidsskrifter, og som kan være lagt ut på åpne arkiv. • To advarsler her: • Google har vanskelig for å skille mellom flere verker av samme forfatter som har samme titler. Ofte er lenken de oppgir ikke den riktige. • Basert på enkelte resultat – GS gir lenker til materiale som piratkopiert. Google Scholar - på godt, NBF 23 mars 2012 E. Flood. Verdensveven utenfor Google .
Så til søkeeksempler: Resten av denne innledningen blir eksempler for å demonstrere disse punktene. De er hentet fra daglig arbeide ved NTNU UB eller fra søkinger gjort av personlig nysgjerrighet. Google Scholar - på godt, NBF 23 mars 2012 E. Flood. Verdensveven utenfor Google .
Søkeeksempel: Self Compacting Concrete (meget viktig i betongteknologi) Google Scholar - på godt, NBF 23 mars 2012
Søkeeksempel: Self Compacting Concrete Det tredje treffet er til en artikkel vi har trykt – helt normal innførsel. Det andre er til en bok, som vi har på NTNU UB og meget utlånt, temaet er viktig. MEN SÅ: Det første treffet er til en artikkel i det første heftet i et japansk engelskspråklig tidsskrift og dette heftet ikke er i noen database, standard søking i andre databaser ville ikke funnet denne artikkelen. Og tidsskriftet er ikke i noe norsk bibliotek. I GS får vi artikkelen, som er fagfellevurdert og meget høyt sitert, tilgjengelig i pdf gratis. Google Scholar - på godt, NBF 23 mars 2012
Søkeeksempel: Superpave (som er et spesielt veidekke. Har ingenting med katolisisme å gjøre!) Google Scholar - på godt, NBF 23 mars 2012
Søkeeksempel: Superpave Alle tre treffene er til bøker, høyt siterte. De to nederste er til vanlige utgitte bøker, som vi har på NTNU UB. Den første er til et dokument fra Transportation Research Board of the National Academies, trb.org, og er et dokument på 184 sider. Det ligger ute i full tekst, gratis. Ingen av disse tre høyt siterte og evaluerte dokumentene ville kommet ut med søk i ISI eller Scopus. Bøkene ville vi funnet i Bibsys, TRB dokumentet ville vi ikke funnet noe sted. Google Scholar - på godt, NBF 23 mars 2012
Søkeeksempel: Rainwater catchment Resultat av skrankebesøk – ønsket en artikkel om dette. Emnedatabasene var det mest opplagte (Scopus), men tok også et søke på GS: Google Scholar - på godt, NBF 23 mars 2012
Søkeeksempel: Rainwater catchment Første treff var til en bok skrevet av forfatteren brukeren var ute etter – og som han ikke viste om, og som UB hadde. MEGET fornøyd bruker! Andre treff var til artikkel vi har. Den var med i både ISI og Scopus, men kom bare ut på søk i Scopus siden ordet «catchment» var med i sammendraget og ISI hadde ikke sammendrag i 1982. Ga et godt tips til alternativt søkeord. Og legg merke til pdf ugaven som er gratis Tredje artikkel lå inne i alle basene, men kom ikke ut så høyt oppe. Google Scholar - på godt, NBF 23 mars 2012
Søkeeksempel: Forfatter Tore Sager Tore Sager er professor ved BAT, NTNU Google Scholar - på godt, NBF 23 mars 2012
Søkeeksempel: Forfatter Tore Sager De to første treffene er til bøker han har skrevet eller skrevet i, den tredje som (rett skal være rett) er ganske misvisende er til en konferanse hvor han hadde et arbeide. De to første ville ikke kommet ut i ISI eller Scopus, den tredje er i Scopus (som dekker konferanser) Ellers, litt oppsummert: ISI: 12 papers, H – indeks 4 Scopus: 28 papers, H – indeks 7 GS: 48 papers, H – indeks 14 Google Scholar - på godt, NBF 23 mars 2012
Søkeeksempel: Forfatter Tore Sager Kommentar: Tore publiserer mye om planlegging, tidsskrifter i det faget er ikke dekket godt av ISI, bedre av Scopus. Og hans mest siterte arbeider er bøker og kapitler i bøker, bare GS dekker det materialet. Og GS samler opp mye grått materiale, flere på norsk som allikevel er listet med flere siteringer. NB – ikke stol på at GS har eksakte siteringstall, mange muligheter for feil og unøyaktigheter. Men når tallene avviker med en faktor på to eller mer må det kunne regnes som signifikant. Google Scholar - på godt, NBF 23 mars 2012
Betydning av full tekst Søk på drivhuseffektens betydning for golfstrømmen, søkeord: "global warming" "gulf stream" Google Scholar 5990 treff Scopus 28 treff ISI 22 treff ”gulf stream” forekommer ofte i teksten, men ikke alltid høyere opp. Fagordet er thermohaline. (Som jeg lærte etter å ha sett på treffene fra GS) Google Scholar - på godt, NBF 23 mars 2012
Betydning av full tekst Google Scholar - på godt, NBF 23 mars 2012
Betydning av full tekst Boken til Gore er ikke i databasene, det er en bok. Uklart hvor søketermene kommer fra som gir treff, men boken er scannet inn full tekst på Google Books, og det kan godt være de er hentet der. Artikkel to er med i basene og i svarene fra begge de andre og høyt oppe. Artikkel tre kommer ikke ut i søket i de andre to, og er ikke med i Scopus i det hele tatt. «Gulf Stream» er i teksten og kommer ikke ut i WoS Artikkel fire er ikke med i WoS eller Scopus. (Men WoS hadde en artikkel inne fra SA med tittelen «Global climate change on Venus») Lenken til fulltekst er gal, den er til en forelesning av en annen forfatter som også heter Houghton. SA artikkelen er ikke gratis på internett. Men nr 2 og nr 3 er. Google Scholar - på godt, NBF 23 mars 2012
Betydning av full tekst Meget høyt i GS: - søk på "north sea" "cod stock" Climate variability and North Sea cod Carl M. O'Brien, Clive J. Fox, Benjamin Planque & John Casey Nature 404, 142 (9 March 2000) Cited by 200 - Related articles - All 16 versions Denne høyt siterte artikkelen kom ikke med da jeg søkte på ”north sea” cod stock* i ISI eller SCOPUS, selv om den er i basen. Forklaring: GS søker i full tekst, ISI og Scopus bare i tittel, sammendrag og emneord. Artikkelen var en ”brief communication” og hadde ikke sammendrag. Ordet ”stock” er i teksten Google Scholar - på godt, NBF 23 mars 2012
Søkeeksempel: Forfatter Kristian Fauchald Biolog, dro til USA for å arbeide med havbørstemark på 70-tallet. Gammel kjenning Google Scholar - på godt, NBF 23 mars 2012
Søkeeksempel: Forfatter Kristian Fauchald Masse arbeider fra 70 og 80 tallet, høyt sitert.Scopus, 27 treff, hindex 9ISI 50 treff, hindex 12GS 117 treff, hindex 25Ingen av basene ISI eller Scopus har hans mest siterte arbeide, GS har lenke til full tekst i HTMLThe diet of worms: a study of polychaete feeding guilds Oceanogr. Mar. Biol. Ann. Rev., 1979, 17, 193-284K Fauchald, PA Jumars Sitert ca 600 ganger (Scopus), 1000 ganger (ISI) eller 1200 ganger (GS) Google Scholar - på godt, NBF 23 mars 2012
Så et dårlig eksempel: • Dette er en bok (som NTNU UB har) og som er meget sitert. 4287 i GS, ISI og Scopus har godt over 1000.) Innførselen har to feil, en stor og en diger. • Stor feil: Lenken er til en artikkel Pinker skrev om boken i 1999, boken selv kom i 1997. • Diger feil: HTML filen fra Russland er hele boken fulltekst. Og ganske sikkert en piratkopi. (Samme sted har, ifølge Karen Blakeman i England masse andre ulovlige kopier, bl. a. alle Harry Potter bøkene) Google Scholar - på godt, NBF 23 mars 2012