250 likes | 363 Views
Tiedonhankinta ja –haku tieteellisessä kirjoittamisessa. Timo Aalto Kumpulan tiedekirjasto. Tiedonhankintaprosessin vaiheet. ongelman tai aiheen määrittely tiedonhaun suunnittelu (tiedontarpeen määrittely, hakusanojen ja -lauseiden muotoilu, tiedonlähteiden valinta)
E N D
Tiedonhankinta ja –haku tieteellisessä kirjoittamisessa Timo Aalto Kumpulan tiedekirjasto
Tiedonhankintaprosessin vaiheet • ongelman tai aiheen määrittely • tiedonhaun suunnittelu (tiedontarpeen määrittely, hakusanojen ja -lauseiden muotoilu, tiedonlähteiden valinta) • tiedonhaun toteutus (tiedonhaun tekniikat) • hakutuloksen arviointi • julkaisujen paikantaminen (esim. Helka-kokoelmatietokannan käyttö) • tiedon käyttö ja arviointi (lopullisten tulosten arviointi ja lähdekritiikki) • ongelman ratkeaminen
Tiedonhankinnan suunnittelu • Hankinta kannattaa aloittaa analysoimalla tarvetta: • Mistä aiheesta tietoa tarvitaan? • Mitä aiheesta tiedetään ennestään? • Mihin laajempaan aihepiiriin aihe kuuluu, mitä osa-alueita siinä on? • Mistä näkökulmasta asiaa tarkastellaan? • Mikä kuuluu aiheeseen, mikä ei, mikä siinä on keskeistä? • Mistä/keneltä löytyy aiheesta lisää tietoa?
Tiedonhankinnan suunnittelu • Esim. ”Rakenteisten dokumenttien indeksointi tekstitiedonhakujärjestelmissä” • Rakenteinen dokumentti – XML, SGML, puolirakenteiset dokumentit (semi-structured) muut (ei-rakenteiset) dokumentit • Indeksointi – hakujärjestelmät, tallennus, tietokannat, käänteistiedostot, rakenteet, kentät • Tekstitiedonhaku – tiedonhaku, IR (information retrieval) • Miellekartan luominen suosittu hahmotuskeino
Hakulausekkeiden muotoilu • Käsitteiden analysointi: • onko käsite liian yleinen/suppea • Käsite hakusanaksi: sijamuoto, kirjoitusasu, fraasit, katkaiseminen (oikea katkaisumerkki!) • Hakusanojen yhdistäminen • Rakenteeton haku (à la Google) vai yhdistäminen loogisilla operaattoreilla (AND/OR/NOT) • Kenttiin kohdistaminen • Kaikki, tekijä, nimeke, asiasanat, tiivistelmä?
Hakutekniikoita • Pikahaku (nopea haku parilla keskeisellä sanalla) • Helmenkasvatus • Analysoi hyvä löytynyt dokumentti ja paranna hakua siitä löytyvillä käsitteillä • Viiteanalyysi • Katso mihin dokumentissa viitataan/missä viitataan dokumenttiin • Laajenna hakua synonyymeillä, ylä/alakäsitteillä • Tarkenna hakua spesifimmeillä ilmaisuilla • Kirjanpito onnistuneista hauista!
Hakutulosten arviointi • Yleensä 10-20 ensimmäisen tuloksen arviointi riittää • lukemisjärjestys: otsikko-avainsanat-(tiivistelmä)-johdanto-(kaaviot)-johtopäätökset… • Lähdekritiikki! • Tieteellisessä julkaisussa ilmestyminen ei laadun tae • Webhaussa kriittisyys erityisen tärkeätä
Web-lähteiden arviointikriteereitä • Tekijyys • Tekijän asema ja asiantuntemus, lähteiden käyttö, tekstin ulkoasu, aineiston sijainti • Puolueettomuus • Ajantasaisuus • Kattavuus • Tekninen toimivuus • Lisätietoja (Tampereen yliopisto)
TKT:n hakupalveluita • ACM Guide to Computing Literature • Sisältää bibliografiset tiedot yli 750 000:sta tietojenkäsittelyn julkaisusta • ACM Digital Library • Kokotekstit kaikista ACM:n julkaisemista artikkeleista • IEEE Xplore • IEEE/IEE:n julkaisuja kokotekstinä • Lecture Notes in Computer Science • Springerin tietojenkäsittelyn julkaisusarja • Aineistot saatavilla Nelli-portaalin kautta
Hakupalveluita • Google Scholar, CiteSeer, Scirus • Tieteelliseen tietoon erikoistuneita web-hakukoneita • Palauttavat yleensä joko suoraan artikkelin tai kustantajan kuvailutiedot artikkelista riippuen onko HY:lla hankittuna ko. aineistoa – aineistojen etäkäyttö! • Osa tuloksista myös suoraan tutkimusryhmien omista arkistoista • Palautetut artikkelit eivät välttämättä ”virallisia”!
Muita hyödyllisiä e-aineistoja • MOT Sanakirja • Sisältää ATK-sanakirjan • RefWorks • Viitteidenhallintaohjelma (ohjesivu)
Formaalit tiedonlähteet • Julkista, vahvistettua ja yleensä kirjallista tietoa • Ensisijaiset lähteet: • uutta tietoa ensi kertaa tai täydellisesti ilmaistuna • Artikkelit tieteellisissä lehdissä ja konferenssijulkaisuissa, standardit, patentit, tekniset raportit • Tieteellisten julkaisujen validisuus ja arvo pyritty takaamaan esim. vertaisarvioinnilla (Referee)
Esimerkkejä ensisijaisista lähteistä • Extensible Markup Language (XML) 1.0 (Third Edition). W3C Recommendation 04 February 2004 • Chiamarella, Y; Mulhem, P; Fourel, F. (1996). A Model for Multimedia Information Retrieval. Technical Report, FERMI ESPRIT BRA 8134. Univ. of Glasgow. April 1996. • David Carmel, Yoelle S. Maarek, Matan Mandelbrod, Yosi Mass, Aya Soffer, Searching XML documents via XML fragments, Proceedings of the 26th annual international ACM SIGIR conference on Research and development in information retrieval, July 28-August 01, 2003, Toronto, Canada
Toissijaiset lähteet • Tiivistävät, jäsentävät ja auttavat löytämään ensisijaisissa lähteissä esitettyä tietoa • Oppikirjat, käsikirjat, kokoomateokset, yleiskatsaukset (survey), "newsletters", sanastot jne. • Osa kirjoista/yleiskatsauksista ensisijaislähteiden veroisia • Viittausten määrä voi olla keino selvittää teosten auktoriteettia • Lähdeluettelot hyviä resursseja ensisijaisten lähteiden paikallistamisessa
Esimerkkejä toissijaisista lähteistä • Baeza-Yates, R; Ribeiro-Neto, B.(1999).Modern Information Retrieval. Addison-Wesley • Robert W.P. Luk , H. V. Leong , Tharam S. Dillon , Alvin T.S. Chan , W. Bruce Croft , James Allan, A survey in indexing and searching XML documents, Journal of the American Society for Information Science and Technology, v.53 n.6, p.415-437, May, 2002 • Wikipedia
Informaalit tiedonlähteet • Yksityisluontoista / ”epävirallista” tietoa: • Oma tietämys • ”Nahkakantiset manuaalit”: Asiantuntijat, kollegat, työn ohjaaja! • Virallisesti vielä julkaisemattomat tutkimustulokset • Myös verkkokeskustelut, blogit jne.
Informaalit tiedonlähteet • Saattaa olla vahvistamatonta ja epätäydellistä/väärää: ei kannata luottaa liikaa • Hyviä vihjeiden ja hakuideoiden saamisessa sekä tiedon jäsentelyssä • Viitattava harkiten (=vain jos tietoa ei ole saatavana formaalina)
Helka Helsingin yliopiston kirjastojen tietokanta Hs TIET – Kumpulan tiedekirjaston Tkt:n kokoelma: Hs TIET LK: Kirjat Hs TIET LR: Teknillisiä raportteja, väitöskirjoja Hs TIET KC: Kongressijulkaisuja Hs TIET KO/C: TKTL:n gradut ja teknilliset raportit Tietojenkäsittelyn painetut lehdet kuluva vuosi yläkerrassa, vanhemmat 1.krs A-linjastossa (lehtiä ei lainata) 1.krs myös standardeja Painetut aineistot
Painetut aineistot • Tkt:n aineistot sisällönkuvailtu ACM:n CCS-järjestelmällä: • http://www.helsinki.fi/kumpula/tiedekirjasto/kokoelmat/_acm.htm • http://www.acm.org/class/1998/ • Varsinaista asiasanoitusta ei kaikissa Tkt:n aineistoissa • Tietojenkäsittelyssä ei kontrolloitua asiasanastoa
ACM CCS-luokitus A. General Literature B. Hardware C. Computer Systems Organization D. Software D.0 GENERAL D.1 PROGRAMMING TECHNIQUES (E) D.2 SOFTWARE ENGINEERING (K.6.3) D.3 PROGRAMMING LANGUAGES D.3.0 General D.3.1 Formal Definitions and Theory (D.2.1, F.3.1, F.3.2, F.4.2, F.4.3) D.3.2 Language Classifications Applicative (functional) languages Concurrent, distributed, and parallel languages … Very high-level languages D.3.3 Language Constructs and Features (E.2) D.3.4 Processors D.3.m Miscellaneous D.4 OPERATING SYSTEMS (C) D.m MISCELLANEOUS E. Data F. Theory of Computation G. Mathematics of Computation …
Haku Helkasta • Lisäksi • Tekijä • Teoksen/lehden nimeke • ISBN/ISSN • Asiasana (selaus) • Sanahaku (hakee kaikista kentistä, katkaisu ?) • Komentohaku (AND/OR/NOT)
Muita kotimaisia tietokantoja • Linda • Suomen yliopistokirjastojen yhteisluettelo • Aineistoa saatavissa kaukopalveluna (maksullista, Kumpula ei toimita yksityishenkilöille) • Arto • Kotimaisten artikkeleiden viitetietokanta • Molemmat käytettävissä yliopiston verkossa
Mistä lisätietoja & neuvoja • Verkkoaineistojen etäkäyttö • Verkkoaineistojen käytön itseopiskelu • Kirjaston neuvonta • Kirjaston tieteenalavastaava (timo.aalto@cs.helsinki.fi)