280 likes | 409 Views
Tiedonetsinnän perusteet. Juha Heinänen Kankaanpään kaupunginkirjasto. Sisällysluettelo . Tiedonhaku prosessina Erilaisia tietolähteitä Tiedonhaku Hakutulosten arviointi. Tiedonhaku prosessina. Tiedontarve Tietolähteen valinta Hakustrategia Tulosten arviointi Mahdolliset lisähaut.
E N D
Tiedonetsinnän perusteet Juha Heinänen Kankaanpään kaupunginkirjasto
Sisällysluettelo • Tiedonhaku prosessina • Erilaisia tietolähteitä • Tiedonhaku • Hakutulosten arviointi
Tiedonhaku prosessina • Tiedontarve • Tietolähteen valinta • Hakustrategia • Tulosten arviointi • Mahdolliset lisähaut
Tiedon tarve • Mitä tietoa tarvitaan? • Mihin tarkoitukseen? • Miten kattavasti? • Miten nopeasti? • Vuorovaikutuksessa seuraavan kohdan kanssa
Tietolähteen valinta • Tiedon tarve vaikuttaa siihen mistä lähteestä sitä kannattaa etsiä • Laadukkaasta tieteellisestä tiedosta suuri osa edelleen paperilla • Tieteenalasta riippuu julkaistaanko se artikkeleina vai laajempina kirjoina eli monografioina • Sähköinen julkaisu on tulossa
Tietolähteitä • Kirjat • Lehdet, aikakausjulkaisut • Sähköiset aineistot – tietokannat, cd-romit • Kirjastojen aineistoluettelot • www- sivustot
Kirjat • Luettavuudeltaan vielä ylivoimainen tietolähde • Vanhoja perustapoja löytää kirjoja • Kirjaston kokoelman selailu • Hakuteokset • Bibliografiat • Kirjojen lähdeluettelot
Kirjastojen aineistoluettelot • Kirjastojen kokoelmatietokannat ovat nykyään yleisesti selattavissa verkon kautta • Kankaanpään kaupunginkirjasto: http://www.kankaanpaa.fi/sivistyskeskus//html/fi/kirjasto.html • Suomen yleiset ja oppilaitoskirjastot: http://www.kirjastot.fi/
Kirjastojen aineistoluettelot • Hakutietokantoja, jotka vaihtelevat käytetyn ohjelman mukaan, mutta yhteisiä piirteitä • hakumahdollisuuksia: tekijän nimen, teoksen nimen, asiasanojen tai muiden tekijöiden mukaan • Tukevat sanojen katkaisua ja boolen logiikkaa – mahdollistavat hyvinkin tarkat haut
Sanan katkaisu • Tietokoneet vertailevat merkkijonoja, joten aina kun mahdollista kannattaa käyttää katkaisua • Saadaan haku kattamaan eri sijamuotoja: talo* kattaa talojen, talot ja talo • Mahdollisuus tehdä virheitä pienenee: Polit* kattaa Politovskajan ja Politkovskajan • yleisesti merkitään asteriskilla *, muita mahdollisuuksia ?, joskus - joskus ei mitään, kuten Kankaanpään kirjaston verkkohaussa
Boolen logiikka • Operaattori JA tai AND hakutuloksen pitää täyttää molemmat ehdot - supistaa haun tulosten määrää • Operaattori TAI tai OR hakutuloksen pitää täyttää joko toinen tai molemmat hakuehdoista – laajentaa hakutulosta • Operaattori EI tai NOT hakutuloksessa ei saa olla ilmoitettua sanaa
Lehdet • Paperilehtien sisällöstä osa verkossa • Pelkästään verkossa ilmestyviä lehtiä • Verkossa lehtien sisältöä tietokannoissa –suomalaisia Arto (kotimaisten aikakauslehtien artikkeliviitetietokanta) ja Aleksi – joita pääsee käyttämään Nelli-tiedonhakuportaalin kautta www.nelliportaali.fi
Internet • Kanava, jonka kautta päästään kaikkien edellä lueteltujen tietolähteiden äärelle • Alku 1960-luvun lopulla perustetussa Arpanet –verkossa ja sen TCP/IP tiedonsiirtoprotokollassa • 1983 sotilas- ja siviiliverkot erilleen • Räjähdysmäinen kasvu 90-luvun alussa • 1990 www, 1993 Mosaic-selain, joka mahdollisti www:n käytön tavalliselle käyttäjälle
Internet II • Yhteen liitettyjen koneiden hajautettu, linkkien yhdistämä verkko, jota ei ole alun perin suunniteltu tiedonhakuun • Ei kattavaa hakemistoa • Mikään hakuohjelma ei läpikäy koko verkon julkista sisältöä • Vapaa ja rajoittamaton sisällöntuotanto – informaation laatu vaihtelee jyrkästi
Aihehakemistot • Perusajatukseltaan linkkilistoja • Hyvät puolet: sisältö hakemistoissa jollain tavoin valikoitua – pyrkimys laatuun • Huonot puolet: sisältö valikoitua ja sitä myöten suppeampaa kuin hakukonehaussa • Soveltuu aihealueisiin joita on hankala määritellä hakusanoilla • Soveltuu selailuun, kun halutaan yleiskuva laajemmasta aiheesta
Aihehakemistoja • Pioneerina yahoo! (http://dir.yahoo.com/) • Suomessa Hämeenlinnan kaupunginkirjaston makupalat (http://www.makupalat.fi ) • Suppeampaan suuntaan mennessä virtuaalikirjastot, joiden sisältö on valikoitua ja kirjastomaisesti järjesteltyä: http://www.kirjastot.fi/linkkikirjasto
Hakukoneet • Hakukoneiden haku kohdistuu hakurobottien tekemään tietokantaan • Hyvät puolet: haun kohteena kokotekstiä miljoonien dokumenttien verran – yleensä aina haku tuottaa jonkinlaisia tuloksia • Huonot puolet: haku tuottaa usein liikaa tuloksia, joissa parhaat eivät erotu kovinkaan hyvin
Hakukoneet 2 • Google – tunnetuin, muttei ainoa www.google.com tai www.google.fi • Muita: • AllTheWeb www.alltheweb.com • Altavista www.altavista.com • Ulkoisesti melko samantapaisia • Mekaaninen sanahaku, jonka tulokset järjestyvät relevanssin mukaan
Käytännön hakuvinkkejä • Useimmissa mahdollisuutena tarkennettu haku • Sanankatkaisu ei yleensä toimi – voi olla tarpeen vaihdella hakusanoja • Boolen logiikka toimii – oletuksena yleensä AND/JA operaattori • Käytä fraasihakuja missä mahdollista: ero merkittävä esimerkiksi erisnimiä hakiessa • Laajoissa hauissa merkitse muistiin miten olet hakenut
Tiedonhaun portit • Portaalit yhdistelevät hakukoneen ja aihehakemistojen ominaisuuksia • Mahdollistaa räätälöidyn haun, joka yhdistelee molempia tapoja • Vaikeampia käyttää kuin pikahakukoneet, mutta tieto jäsennellympää • http://tiedonhaunportti.kirjastot.fi/ • Nelli-portaali http://www.nelliportaali.fi
Julkishallinnon tietoja • http://www.suomi.fi - valtionhallinnon tietoja kootusti • Kunnalliset sivustot. Mallia www.kankaanpaa.fi
Hakutuloksen arviointi • Vastaako hakutulos alussa esitettyyn kysymykseen? • Jos ei, miten hakua on muokattava – onko muutettava hakutekijöitä tai tekniikoita vai kenties tietolähdettä? • Vastaako hakutulos tiedontarpeeseen – vai pitääkö hakukysymystä muokata ja jatkaa etsimistä?
Lähdekritiikki • Vanhat lähdekritiikin periaatteet pätevät edelleen: Kuka kirjoittaa, miksi, milloin, miten kontrolloituna? • Korostuvat verkossa, koska kuka tahansa voi kirjoittaa siellä mitä tahansa ja näyttää ulkoisesti melko uskottavalta
Auktoriteetti • Auktoriteetti: kuka on tekstin takana? • Voiko www-sivun osoitteesta nähdä kuka on tiedon takana • Onko yhteystietoja, onko tiedon tuottaja asiantuntija tai viranomainen?
Sisältö • Tekstin luonne: faktaa, mielipiteitä, propagandaa? • Rajoitukset: Näkökulma, kattavuus, yksityiskohtaisuus? • Luotettavuus: mihin teksti perustuu, miten se dokumentoidaan. Onko nootteja tai lähdeluettelo? Voidaanko tekstin tiedot varmentaa muista lähteistä?
Alkuperäisyys • Mitä lähempänä tiedon alkulähdettä sen parempi – yleensä • Mieluummin tilastotiedot tilastokeskuksesta kuin lehtijuttu niistä • Mieluummin tieteellinen tutkimus kuin lehtijuttu tutkimuksesta
Tuoreus • Milloin teksti on kirjoitettu ja julkaistu? • Ovatko tiedot ajan tasalla? • Kaikki tieto ei vanhene yhtä nopeasti
Sähköiseen aineistoon viittaaminen • Jos tieto on asiallista ja laadukasta siihen voi hyvin viitata tutkielmissa • Missä muodossa se tehdään vaihtelee eri aloilla • Lisäongelmia: tiedon tuottajaa joskus hankala selvittää, nettitiedon pysyvyys on heikko, nettitiedon laatu vaihtelee rajusti