330 likes | 471 Views
Professzionális információkeresés. A hivatkozások használata a tartalmi keresésben. Készítette: Bognár Noémi Erika, Informatikus könyvtáros MA, 1. évfolyam. Felhasznált irodalom. Ungváry Rudolf - Vajda Erik: Könyvtári információkeresés. Bp.: TYPOTEX, 2002.
E N D
Professzionális információkeresés. A hivatkozások használata a tartalmi keresésben. Készítette: Bognár Noémi Erika, Informatikus könyvtáros MA, 1. évfolyam
Felhasznált irodalom • Ungváry Rudolf - Vajda Erik: Könyvtári információkeresés. Bp.: TYPOTEX, 2002. • Ungváry Rudolf– Orbán Éva: Osztályozás és információkeresés. Kommentált szöveggyűjtemény. 2. köt. Bp.: OSZK, 2001. • Varga Katalin: Szöveg és tartalom az információs társadalomban: Módszerek és lehetőségek az információ minőségi szelektálására. Pécs: PTE FEEK, 2005.
Bevezető • A könyvtári információkeresés végezhető kézzel (manuálisan) cédulakatalógusban, dokumentumokban vagy akár másokat megkérdezve. Végezhető mechanikai eszközökkel és készülékekkel (lyuk- és fénylyukkártyák, mikrofilmes berendezések) (= OFFLINE keresés) • és számítógépek (= ONLINE keresés) segítségével.
Online információkereső rendszerekben a felhasználó közvetlen – interaktív – kapcsolatot teremthet a számítógép segítségével a dokumentumleírások (olykor a digitális vagy digitalizált dokumentumok) állományával. • Ma az információkeresésnek szinte mindig van online szakasza.
A keresőkép • A kérdés átvétele • A kérdés céljának megfogalmazása • Nyelvi korlát • Dokumentum típus meghatározása • Színvonal meghatározása • Kronológiai, időbehatárolás • Térben történő korlát • Az információ mélysége • A kapcsolódó határterületek figyelembe vétele
Szókapcsolatok, operátorok, csonkolás Csonkolás • végtelen csonkolás (?) • csonkolás megadott határok között (# : 0 vagy 1 karakter) • csonkolás pontosan a megadott számú karakterre (! : pontosan 1)
Boole-operátorok • ÉS / ANDLogikai szorzás: mindaz, ami egyik is, a másik is, a dokumentumban mindkét kifejezés előfordul! Ebből még nem következik, hogy azonos sorrendben, vagy egymás közelségében találhatók meg az ismérvek között • VAGY / ORA találati halmazomban megjelenik mindaz, ami az egyik, vagy a másik fogalommal kapcsolatos. Megjelennek azok a dokumentumok is, melyekben mindkét kifejezés együtt fordul elő • NEM / NOTKizárja az egyik kérdést
A közelségi, távolsági, helyzetet jelző, számoperátorok • Azt a célt szolgálják, hogy meghatározhassuk, hogy mennyire szoros kapcsolat legyen két kifejezés között. EGYÜTT, KÖZEL NEAR • SzámoperátorokNumerikus adatok (pl. dátum, olvadáspont, stb.) esetén alkalmazhatóak
Kereső taktikák • Felügyelő taktikák (céljuk, hogy a keresést a megfelelő vágányon tartsák, és a hatékonyságra figyeljenek.) • folyamatos ellenőrzés • mérlegelés • javítás • kaptafa • Jegyzetelés • Fájlszerkezeti taktikák(hogyan találja meg a kereső az utat a széles értelemben vett információhordozók között, pontosabban az információ szerkezetében, a kívánt forrásig vagy a forrásban lévő információig.) • biblizés • problémaelemzés • áttekintés • kizárás • kiterjesztés • körülállványozás
Kereső taktikák • A kérdés megfogalmazásával kapcsolatos taktikák(a keresőkép tervezésében, módosításában segítenek: nem korlátozódnak a számítógépes keresésekre.) • specifikusság • bőszavú kérdésmegfogalmazás • szűkszavú kérdésmegfogalmazás • hasonlóságok engedése ~ megengedő vagy-ok (OR) • hasonlóságok tiltása • Fogalom és szóhasználati taktikák(a kérés megfogalmazása közben a kifejezések kiválasztásának módosításában segítenek) • feljebb a hierarchiában • lejjebb a hierarchiában • asszociáció • szomszéd – keresés • nyomkövetés • variációk • szórendváltozás • helyesírási változatok • ellentét szerinti keresés
Kereső taktikák • Képzelettaktikák • Gondolkodj! Gondolkodni kell! • Ne toposzokban gondolkodj! • Szárnyalj szabadon! • Meditálj! • Konzultálj! • Mentsd a tanulságokat! • Böngéssz! • Vedd észre a zsákutcát! • Alkudozz! • Tárolj! • Állj meg és térj vissza!
Keresési stratégiák • A stratégia a keresésen belül meghatározott szempont érvényesülését jelenti, annak eldöntését, hogy mi a keresés lebonyolításának legjobb útja. • A taktika e cél közvetlen megvalósítására alkalmazott konkrét módszereket képviseli. • A stratégia tehát az átfogó keresési terv, a koncepcionális (fogalmi) szint, a taktika pedig a konkrét megoldás, a „fogások” összessége.
Egyszerű gyorskeresés (briefsearch, quick and dirty search) • Az egyszerű gyorskereséssel egyszeri, Boole-operátorokkal végzett rövidre szabott keresést valósítanak meg annak érdekében, hogy előzetes képet kapjanak az adatbázis rekordjainak a kérdéssel kapcsolatos jellemzőiről • Gyors és zajos keresés. A „zaj” kifejezés ebben az esetben annyit jelent, hogy a jó találatokon kívül az első merítésre egy csomó oda nem illő találatunk is lesz. • Alkalmazhatjuk a kereső kifejezéseket csonkolt formában is – ezzel csak növeljük a találataink számát.
Többszörös egyszerű gyorskeresés (multiple briefsearch) • Akkor célszerű követni, ha az összes specifikus keresőfogalom metszetének eredménye várhatóan a nullához közelít. • Alapelve: néhány szempont egyidejű keresése a lehető legtöbb adatbázisban
Hólabdakeresés (pearl growing) • Kevés találatnál • A leggyakoribb, hogy a felhasználó megadja az egyik, általa ismert és a tárgyba vágó dokumentum adatát, melyet kikeresünk. • Ebből megállapítható, milyen ismérvek (deszkriptorok, tárgyszavak, jelezetek) reprezentálják a tartalmát – tehát a keresett tárgy fogalmát ezekkel végezhető a keresés, hogy még több hasonló adathoz jussunk.
Interaktív vizsgálódás • Keresés átfogó szempontok alapján (több 100 találat) • Találatok alapján legfontosabb szerzők, módszerek, kapcsolódások megállapítása ezek alapján új keresés
a1 ismérv a2 ismérv a3 ismérv V A G Y b1 ismérv b2 ismérv b3 ismérv V A G Y Keresőkérdés A, B, C, között, unió metszet különbség Építkezés tömbökből A. szempont B. szempont C. szempont c1 ismérv c2 ismérv c3 ismérv V A G Y
Építkezés tömbökből • A lényege az, hogy az első lépésben megállapítjuk a kereső kifejezések valamilyen láncát. • Ezt követően minden egyes kereső kifejezés esetén végiggondoljuk, milyen más kifejezés jöhet még az adott kifejezéssel kapcsolatban szóba, és ezeket egy-egy építőkockába vonjuk össze oly módon, hogy az egy építőkockába tartozó kifejezéseket vagylagosan összekapcsoljuk. • Az egyes építőkockák egy-egy keresőfogalmat reprezentálnak. • A keresőfogalmat az építőkockába vagylagosan összevont összes kifejezés együttesen nevezi meg.
Egymásutáni leválogatás (successive fractions) • A teljesség növelésének heurisztikus módszere, hogy valamelyik kész építőkockát (keresőfogalmat reprezentáló kifejezések csoportját) töröljük és a maradékkal keresünk. • A módosítás lényege, hogy a sok találatot eredményező kérdéssel kezdünk, majd fokozatosan kizárunk ebből egyes elemeket, melyek jelentősége kisebb a többiéhez képest. • Akkor alkalmazzuk, ha túl sok, vagy éppenséggel túl kevés találat a keresés eredménye és a keresés tárgya nehezen fogalmazható meg.
Páronkénti leválogatás (pairwise facetets) • Ha mindegyik keresőfogalom (építőkocka) nagyjából azonos mértékben specifikus, azaz egyformán fontos, akkor páronként képezhetjük metszetüket. • A találati eredményeket vagy külön-külön (a páronkénti keresés eredményeként), vagy az egész keresési folyamat uniójaként fogadhatjuk el.
Relevancia-visszacsatolás • A hólabdakereséshez hasonló, azzal a különbséggel, hogy csak a legpontosabbnak tűnő találatoknál végezzük el a további tájékozódást, keresést. A hólabdakeresés első lépéseként is értelmezhető.
Keresést bővítő eljárások • ÉS – kevesebb kifejezéssel • VAGY – több kifejezéssel • NEM – nem használni • Szűkítés feloldása • Csonkolás alkalmazása • Kevésbé korlátozó közelségi operátorok használata • Átfogóbb kifejezés használata
Keresést szűkítő eljárások • ÉS – több kifejezéssel • VAGY – kevesebb kifejezéssel • NEM – használni • Csonkolást nem használni • Korlátozóbb közelségi operátorok használata • Egyedibb kifejezés használata • Szűkítés használata
Találatok értékelése • A (megtalált releváns információk) = találatok (hits) • B (megtalált nem releváns információk) = zaj (noise, fals drop) • C (releváns nem talált információk) = veszteség (misses, losses) • D (nem releváns, nem talált információk) = érdektelen információk • A keresés tökéletes: B és a C halmaz üres. • Még mindig optimális: C halmaz üres.
Teljesség és pontosság • A tökéletesség mértékét a teljességgel és a pontossággal jellemzik. • A teljesség növelésével a pontosság elkerülhetetlenül csökken, és ez fordítva is igaz.
Teljesség és pontosság • A teljesség azt mutatja, hogy a releváns dokumentumok hányadrésze jelent meg találatként, a komplementere azt, hogy hányadrészét nem találtuk meg. Teljesség: a / a + c • A pontosság arra ad választ, hogy a visszakeresettek hányadrésze releváns – komplementere arra, hogy hányadrésze nem, vagyis irreleváns. Pontosság: a / a + b
Az információkeresés sajátos, nagyon kedvelt és hatékony eszköze a hivatkozások mentén történő keresés. • Az idézésnek vannak presztízsmotívumai is, de a lényeg, hogy az információkeresésben tartalmi jegyekre utalhat egy-egy hivatkozás. • A hivatkozási indexek, mint pl. a WoS adatbázis is, rendelkeznek egyéb tartalomfeltáró eszközökkel. A hivatkozás csak egy újabb szempont.
Hirsch-index • ~ a h-index, az egyéni teljesítmény mérését szolgálja, de használható folyóiratok, kutatói team-ek értékelésére is. Alapja a hivatkozások gyakorisága adott szerző műveire. • Adott szerző h-indexe „n”, ha létezik „n” számú publikációja, melyre „n” alkalommal hivatkoztak. • Tehát a h-indexe 12, ha legalább 12 cikkére legalább 12 alkalommal hivatkoztak, míg a többire 12-nél kevesebben.