170 likes | 306 Views
TIEDONHAKU INTERNETISTA JA GOOGLEN EDISTYNYT KÄYTTÖ. Krista Auvinen KIRAVO-projekti 2011. Sisällöt. Internet-tiedonhaun ja tiedon luonteesta Kuinka hakukoneet toimivat? Miten hakutulokset muodostuvat? Googlen edistynyt käyttö Mikä ihmeen syvä verkko?
E N D
TIEDONHAKU INTERNETISTA JA GOOGLEN EDISTYNYT KÄYTTÖ Krista Auvinen KIRAVO-projekti 2011
Sisällöt • Internet-tiedonhaun ja tiedon luonteesta • Kuinka hakukoneet toimivat? • Miten hakutulokset muodostuvat? • Googlen edistynyt käyttö • Mikä ihmeen syvä verkko? • Vaihtoehtoisia hakukoneita ja -tapoja Googlelle • Internet-tiedonlähteiden arviointi
Internet-tiedonhaun keveys • Googlaamisen helppous • Arkipäiväinen tiedonhaun mekaaanisuus • Vähimmän vaivan periaate • Omia hakutaitoja ei pysähdytä miettimään • Hakukoneiden mekanismeja ei tunneta • Lähdekritiikki
Internet-tiedon olemus • Verkkotiedon luotettavuus ja sensuuri • Sisältää hyvin monenlaista tietoa mm. kaupallista, tieteellistä ja yhteiskunnallista tietoa • Tietoa mielipiteistä ja trendeistä • Ajankohtaisempaa tietoa saa paremmin kuin painetusta • Julkista, suojattua ja yksityistä tietoa • Paljon materiaalia englanninkielisiltä alueilta vähemmän Suomen
Kirjoitat blogikirjoituksen tai lisäät sisältöä verkkosivuillesi. Verkkoa haravoivat Googlen botit ”ottavat haavinsa” kirjoituksesi. Googlen botin seuraavat linkkejä. Jos sivullesi ei ole linkkejä, sivuasi ei haravoida säännöllisesti. Sivu indeksoidaan. Hakiessasi tietoa Googlella, et hae tietoa koko verkosta vaan Googlen välimuistissa olevasta sisällöstä . Tiedonhaku Googlella. Google ehdottaa avainsanoja kirjoittaessasi hakutermejä. Hakutulos luodaan.
Hakutulokseen sovelletaan Googlen omia suodatuksia. Google lisää hakutulosten joukkoon viitteitä uutisista, tuotteista, videoista, kirjoista ym., joka voi olla relevanttia tiedonhakijalle. Google tuo hakutulokseen verkkosivuja, joissa on aiemmin vierailtu. Google voi painottaa trendikkäitä hakutuloksia. Voit estää tämän poistamalla verkkohistoria käytöstä.
Verkkosivujen ranking-järjestys hakutuloksessa • Tavallisessa internet-tiedonhaussa hakukoneet seulovat internet-sivuja ja ajan myötä sivustoille kehittyy ranking-järjestys. • Ranking eli sivuston nouseminen hakutuloksen kärkeen johtuu yhdeltä osaltaan sivuston linkityksen paljoudesta. Tästä syystä Wikipedia nousee hauissa yleensä kärkeen. • Hakutulosten ranking on melko staattinen ja se saattaa muuttua aika ajoittain. • Perinteiset hakukoneet eivät siis tämän toimintaperiaatteensa takia pysty luotaamaan sitä, mitä on juuri nyt julkaistu internetissa. • Reaaliaikaisen aineiston hakukoneet on tehty sitä varten, että ne luotaavat sitä sisältöä, mihin perinteiset hakukoneet eivät yllä.
Syvä verkko • Mikään hakukone ei pysty löytämään kaikkea, mitä verkossa on. • Googlen kaltaiset hakukoneiden perushaku ei pääse luotaamaan aineistoa, joka sijaitsee esim. salasanana takana olevan tietokannan uumenissa tai organisaation sisäverkossa tai tilastotietokannassa tai kirjastojärjestelmässä. • Tällaista aineistoa varten on olemassa ns. syvän verkon hakukoneet. Näitä hakukoneita ovat esim. CompletePlanet, Yippy, Scirus ja Intute
Käytetyimmät hakukoneet Hitwisehttp://www.hitwise.com/us/datacenter/main/dashboard-10133.html
Googlea edistyneesti • Uutta: Google Instant • Tarkennettu haku • Googlen reaaliaikainen haku • Googlen muut aikarajaukset • Googlen kirjahaku • Google Alerts • Google Finance, Google ProductSearch, Google Maps
Vaihtoehtoja Googlelle • Ihmisten valitsemat ja etukäteen arvioimat sisällöt: Makupalat ja Linkkikirjasto • Metahakukoneet: hakee samaan aikaa monien eri hakukoneiden avulla • Semanttiset hakukoneet: Hakia • Klusteroivat hakukoneet: luo erilaisia kategorioita, joista voit kaventaa tai laventaa hakutulosta: Yippy ja CarrotClustering • Reaaliaikaisen verkon hakukoneet: Googlen reaaliaikainen hakuTwitterSearchCollecta • Visuaaliset hakukoneet esittävät hakutulokset visuaalisessa muodossa: oSkope, Quintura ja RedZ
Vaihtoehtoja Googlelle • Sosiaalisten yhteisöjen sisäinen haku: Slideshare, Delicious, Facebook, Twitter • Sosiaalisen median hakukoneet esim. Collecta ja Omgili • Kuva- ja videohaku • Mobiilihaku mm. lisätyn todellisuuden haku
Internet-tiedonlähteiden arviointi • Luotettavuus • Onko sivun tekijä mainittu? • Onko tekijän yhteystiedot mainittu? • Onko yhteystiedot aitoja? • Annetaanko tekijän pätevyydestä? • Mikä on tekijän taustaorganisaatio tai julkaisijataho: tiedontuottajien luotettavuusjärjestys: 1. Viranomaiset ja yliopistojulkaisut 2.Uutistoimistot 3. Järjestöt 4. Yksityisten sivut 5. Keskustelupalstat 6. Huijaussivustot • Onko sivu laajemman sivuston osa ja millainen tämä sivusto on luotettavuudeltaan? • Maksaako tai sponsoroiko joku sivun? • Onko sivusto asiantuntijoiden arvioima tai suosittelema? (onko mukana hyvissä aihehakemistoissa tai tunnetussa verkkolehdessä) • Onko sivustolla toimittaja, joka tarkistaa asiatiedot?
Internet-tiedonlähteiden arviointi • Tiedon oikeellisuus • Onko sivulla oleva tieto paikkansa pitävää, luotettavaa ja virheetöntä? • Ovatko tulkinnan sivustolla järkeviä? • Perustellaanko sivulla olevat väitteet? • Onko sivustolla lähdeluetteloa? • Onko sivulla mainontaa? • Onko mielipiteet, mainonta ja faktat eroteltu toisistaan? • Yritetäänkö tiedolla vaikutta mielipiteisiin? • Onko lähteet mainittu? • Onko sivusto virheetön kieliasullisesti? • Löytyykö vastaava tieto muista lähteistä?
Internet-tiedonlähteiden arviointi • Objektiivisuus • Mikä tarkoitus tiedon tuottamisella on ollut? • Kenelle sivu on suunnattu? • Onko tekijän tarkoitusperät ilmaistu? • Onko tieto puolueetonta? • Onko sivustolla ideologisia ja poliittisia painotuksia? • Onko sivulla mainontaa? • Onko mielipiteet, mainonta ja faktat eroteltu toisistaan? • Yritetäänkö tiedolla vaikutta mielipiteisiin? • Onko lähteet mainittu? • Onko sivusto virheetön kieliasullisesti? • Löytyykö vastaava tieto muista lähteistä?
Internet-tiedonlähteiden arviointi • Ajantasaisuus • Milloin sivu on tehty? • Milloin se on julkaistu internetissa? • Milloin sisältöä on muokattu viimeksi? • Päivitetäänkö sivustoa säännöllisesti? • Milloin tiedot on kerätty? • Toimivatko linkit?