340 likes | 455 Views
A hatékony információkeresés alapjai. Aranyi Zoltán SZTE Klebelsberg Könyvtár aranyi@ ek.szte.hu. Áttekintés. Alapfogalmak Adatbázisok kategorizálása Adatbázisok jellemzése Keresés menete Keresési technikák Találatok feldolgozása. Alapfogalmak 1.
E N D
A hatékony információkeresés alapjai Aranyi Zoltán SZTE Klebelsberg Könyvtár aranyi@ek.szte.hu
Áttekintés • Alapfogalmak • Adatbázisok kategorizálása • Adatbázisok jellemzése • Keresés menete • Keresési technikák • Találatok feldolgozása
Alapfogalmak 1. • Adatbázis : Adatmezőkből álló rekordok rendezett halmaza. Logikai szerkezettel rendelkező, információk tárolására és visszakeresésére szolgáló számítógépes állomány. (Forrás : Elektronikus könyvtári értelmező szótár : http://www.bibl.u-szeged.hu/mke_eksz/docs/ekszotar/)
Alapfogalmak 2. • Rekord : A számítógépes adatbázisok egyik alapegysége: önállóan kezelhető, logikailag összetartozó adatmezők együttese (pl. egy dokumentum bibliográfiai adatsora). (Forrás : Elektronikus könyvtári értelmező szótár : http://www.bibl.u-szeged.hu/mke_eksz/docs/ekszotar/)
Alapfogalmak 3. • Mező : A rekord alapegysége, melyet névvel (kóddal) és tartalommal látnak el. Megkülönböztetünk kereshető és nem kereshető (de megjeleníthető) mezőket.
Struktúra Mező => Rekord => Adatbázis
Adatbázisok kategorizálása • Két fő szempont : • TARTALOM • TÍPUS • A fentiek keverednek egymással • Bizonyos esetekben a kategorizálás (pl. információ hiányában) nem végezhető el egyértelműen
Adatbázisok tartalom szerinti csoportosítása • Milyen szakterületet ölelnek fel? • Lehet multidiszciplináris is! • Milyen típusú forrásokat dolgoz fel? • Pl. könyvek, folyóiratok, szabadalmak, videodokumentumok, vegyes, stb. • Milyen a feldolgozás mélysége? • Csak bibliográfiai adatok, vagy tartami kivonatok is, esetleg teljes szöveg; stb. • Milyen időtartamot fed le? • Milyen gyakran frissítik? • Hány rekordot tartalmaz?
Adatbázisok típus szerint • Bibliografikus • „szakirodalmi” • szabadalmi • vegyes • Teljes szövegű (full-text) • Faktografikus • Katalógus • Egyéb (pl. kémiai szerkezeti, stb.) • Vegyes (a fentiek közül több is)
A szakirodalmazás menete • Két fő fázisa a tágabb értelemben vett ELŐKÉSZÍTÉS és a VÉGREHAJTÁS • A két fő fázis ciklikusan ismétlődik • Ha EREDMÉNYESEN akarunk dolgozni, az előkészítés a hosszadalmasabb, a nagyobb körültekintést igénylő fázis
Keresés előkészítése • Tisztáznunk kell a keresés célját • Megfelelő adatbázis(oka)t kell keresnünk • Tartalmuk és típusuk szerint is mérlegelni kell • Át kell gondolnunk a keresendő fogalomköröket • Meddig terjed a határ ; milyen keresőszavak merülhetnek fel (szerzőnevek, tárgyszavak, stb.) ; hol érdemes csonkolni ; kell-e korlátozni a keresést (idő, nyelv, dokumentum típusa szerint) ; milyen operátorokat használunk majd ; stb.
Keresés végrehajtása • A találatok kiértékelését követően az esetleg felmerülő problémák miatt legtöbbször vissza kell térni az előkészítéshez, és módosítani kell a keresést. Ezt akár többször is érdemes megtenni. • A „végső” találati halmaz még feldolgozásra vár, ez nem kerülhető meg!
Keresési technikák • Kulcsszavas keresés : egy vagy több szó előfordulását keressük • Böngészés : indexben szereplő szavakat vagy kifejezéseket keresünk („lista” áttekintése) (Hasonlóan, mint Az SZTE EK OPAC-ja ppt-ben!)
Csonkolás, karakterhelyettesítés • Az egyes adatbázisok különböző speciális karaktereket használnak : *, $, %, #, ?, ! • Eltérő csonkolási típusok lehetnek : • A) Végtelen csonkolás • Általánosan használt; akárhány karakter követheti a beírtakat (nulla is!) • B) Adott karakterre történő csonkolás • Karaktersorozaton belül is használhatjuk (pl. wom!n => woman ; women) • C) Csonkolás megadott határok között (pl. 4 karakterre) • A magyar nyelvi sajátosságok miatt nagyon alaposan át kell gondolni a használatukat
Keresések korlátozása • Leggyakoribb esetei : idő, nyelv, dokumentum típusa • Legtöbbször valamely mező kitöltésével (pl. megjelenés éve / időszaka), vagy legördülő menüből történő kiválasztással (pl. dokumentum típusa) működik • Akkor érdemes használni, ha biztosak vagyunk a hatékonyságában
Operátorok • A legtöbb adatbázis keresések eredményeiből találati halmazokat képez • A halmazok, vagy egyes keresőszavak között, de halmaz és keresőszó között is kapcsolatokat létesíthetünk: erre szolgálnak az operátorok • Három típusukat különítjük el: • Logikai vagy Boole-operátorok • Helyzeti operátorok (más elnevezése is lehet!) • Szám- vagy numerikus operátorok
Logikai operátorok • A legelterjedtebb operátorok: ÉS, VAGY, NEM (AND, OR, NOT) • Ritkán speciális karaktereket is használhatnak helyettük (*, +, -, stb.) • Jelentésüket „halmazábrákkal” (Venn-diagram) szoktuk szemléltetni • Egyértelmű a használatuk, ha zárójeleket alkalmazunk
AND (ÉS) erős kicsi erős AND kicsi Sok kicsi sokra megy. x Erős, mint a méreg. x Kicsi a bors, de erős. A sorrend tetszőleges : erős AND kicsi ugyan azt adja, mint kicsi AND erős
OR (VAGY) erős kicsi erős OR kicsi Sok kicsi sokra megy. Erős, mint a méreg. Kicsi a bors, de erős. A sorrend tetszőleges : erős OR kicsi ugyan azt adja, mint kicsi OR erős
NOT (NEM ; DE NEM) kicsi erős kicsi erős erős NOT kicsi kicsi NOT erős Sok kicsi sokra megy. x Sok kicsi sokra megy. Erős, mint a méreg. Erős, mint a méreg. x Kicsi a bors, de erős. xKicsi a bors, de erős. x A sorrend fontos : erős NOT kicsi mást jelent, mint kicsi NOT erős
Helyzeti operátorok • Hívhatják szóközelségi, távolsági, stb. operátoroknak is • Jelentésük, jelölésük, alkalmazhatóságuk keresőrendszerenként változik • Szavak, kifejezések sorrendjét és távolságát határozzuk meg segítségükkel • Leggyakrabban a "pontos kifejezés keresése" esetet alkalmazzuk
Pontos kifejezés keresése 1. • Az egyik nagy Internet-kereső azegér elefánt keresésére ~166.000 találatot ad (2013 szeptember végén) • Ugyan ezt kapjuk az elefánt egér megadásával (~166.000 találat) • Az "egér elefánt"beírására 2.910 találatunk lesz • Az "elefánt egér"1.820 találatot produkál
Pontos kifejezés keresése 2. • Egy másik Internet-kereső azegér elefánt keresésére ~33.500 találatot ad (az előző ~166.000 volt) • Az elefánt egér keresésre ~2.780.000 találat van (előzőleg ~166.000 találat) • Az "egér elefánt"2170 találatot eredményez (2.910) • Az "elefánt egér" pedig 191.00 találatot (1.820) • A látszólagos ellentmondás oka : a kereső az "elefánt egér" kifejezésbe beleveszi az "elephantear" -t is.
Példa helyzeti operátorok menüből történő használatára CompLex Web Jogtár keresőablaka
Szám- vagy numerikus operátorok • < ; > ; = ; =< ; <= ; => ; >= ; - (-tól/-ig) • Általában űrlapokon használjuk őket:
Keresési eredmények értékelése • Két fő problémával találkozhatunk • Túl sok találat • Túl kevés találat • Leginkább a sok találat okoz gondot
Túl sok találat… • Újra át kell gondolnunk a téma megközelítését • Újabb keresőszavak, kifejezések használata • Operátorok használata (az AND sokat szűkít, a helyzeti operátorok méginkább!) • Korlátozások (idő, nyelv dokumentum típusa) megfontolása
Túl kevés találat… • Helyesírás ellenőrzése • Tágabb fogalmak, kifejezések használata • Operátorok : az OR bővít! • Csonkolás használata • Téma átgondolása : Lehet, hogy rossz a megközelítésünk?
A keresés módosítása után • Új keresés lefuttatása • Újabb értékelés!!! (Esetleg újabb futtatás…) • Mentés előkészítése: minden találat, vagy csak a kijelöléssel kiválasztottak • Mentés : csak a találatok, vagy a keresés menete (stratégia) is – későbbi futtatás, átdolgozás céljából
Keresés „befejezése” • Lehet, hogy kezdetben csak a bibliográfiai adatok állnak rendelkezésünkre, de újabb ötleteket, megközelítéseket kaphatunk a primer dokumentumokfeldolgozása során • Ez újabb információkeresésre sarkallhat bennünket
Információk a sikeres tanuláshoz • Az alapos megértéshez, a gyakorlati ismeretek elsajátításához a teljes diasorozatot érdemes tanulmányozni • Tesztkérdések csak az aláhúzott című diákból lesznek • GYAKORLAT TESZI A MESTERT!