150 likes | 280 Views
REŠERŠNÍ STRATEGIE. Mgr. Anna Vitásková. základy vyhledávání. booleovské operátory – logické operátory. logický součin logický součet logická negace. základy vyhledávání. logický součin- operátor AND – univerzita AND Plzeň „a zároveň“ – zúžení dotazu, logický součin, průnik množin.
E N D
REŠERŠNÍ STRATEGIE Mgr. Anna Vitásková
základy vyhledávání • booleovské operátory – logické operátory logický součinlogický součetlogická negace
základy vyhledávání • logický součin- operátor AND – univerzita AND Plzeň • „a zároveň“ – zúžení dotazu, logický součin, průnik množin Plzeň univ.
základy vyhledávání logický součet operátor OR – vysoká škola OR univerzita „nebo“ – rozšíření dotazu, logický součet, sjednocení množin univ vš
základy vyhledávání • logická negace – operátor NOT – univerzita NOT Plzeň „ne, bez“ – výsledek se zužuje, odstranění nežádoucích dokumentů, logická negace, záleží na pořadí slov • mohou se kombinovat i s dalšími možnými operátory (ekvivalence, větší, menší, blízkost slov, apod.) univ. Plzeň
základy vyhledávání distanční operátory (proximitní operátory) hledaná slova se vyskytují nedaleko od sebe nebo v těsném sousedství • near – blízký - uživatel sám určí vzdálenost mezi slovy, někdy je nastaveno standardně (př. NEAR 5) • adjacent (ADJ) – sousední - slova vedle sebe nezávisle na pořadí – výhoda při hledání jmen • followed by - slova lze vyhledat jako frázi • within 3 • pre/1 • v jednotlivých databázích se liší
základy vyhledávání krácení podle slovních kořenů jsou nalezeny záznamy, které obsahují zadaný kořen slova: • „*“ - pro více znaků – knihovn* : (vyhledá se) knihovny, knihovnictví, knihovník…atd. • „?“ – pro jeden znak, dá se použít i uprostřed slova – ato?: (vyhledá se): atom, atol; filo?ofie: vyhledá jak filozofie tak i filosofie • v různých databázích se může lišit – př. v JIB má „?“ funkci „*“ – rozšíří o více znaků
rešeršní strategie základní strategie • strategie stavebních kamenů • strategie rostoucí perly • strategie osekávání ---------------------------------------------- • strategie vyhledávání nejdříve podle nejužší fasety • strategie vyhledávání nejdříve podle nejmenší četnosti výskytu
strategie stavebních kamenů strategie stavebních kamenů – rozdělení dotazu na několik dílčích a kombinace jejich výsledků příklad: aplikace autorského zákona v oblasti elektronických dokumentů a kopírování klíčové pojmy: autorský zákon kopírování elektronické dokumenty, e-dokumenty, elektronické knihy, e-knihy,elektronické časopisy, e-časopisy dotazy: „elektronické dokumenty“ OR „elektronické knihy“ OR „elektronické časopisy“ „e-dokumenty“ OR „e-knihy“ OR „e-časopisy“ kopírování „autorský zákon“ konečný výsledek: spojení výsledků jednotlivých vyhledávání
strategie rostoucí perly strategie rostoucí perly – vyhledání záznamů k nejužšímu pojmu a postupné rozšiřování příklad: aplikace autorského zákona v oblasti elektronických dokumentůa kopírování klíčové pojmy: autorský zákon kopírování elektronické dokumenty, e-dokumenty, elektronické knihy, e-knihy,elektronické časopisy, e-časopisy dotaz: autorský zákon AND kopírování AND elektronické dokumenty pokud málo dokumentů – rozšíření tématu:autorský zákon AND kopírování AND („elektronické dokumenty“ OR e-dokumenty OR „elektronické knihy“ OR e-knihy OR “elektronické časopisy“ OR e-časopisy)
strategie osekávání • strategie osekávání – postupné zmenšování počtu záznamů (omezování vyhledávání) - zužování dotazu, zpřesňování klíčových slov za účelem snížení konečného počtu dokumentů • příklad: • aplikace autorského zákona v oblasti elektronických dokumentů a kopírování • dotaz • aplikace autorského zákona AND kopírování AND elektronické dokumenty • pokud mnoho dokumentů, pak omezíme například pomocí vyloučení určitého druhu dokumentů: • (aplikace autorského zákona AND kopírování AND elektronické dokumenty) NOT knihy
priorita nejužší fasety • strategie vyhledávání nejdříve podle nejužší fasety – nejdříve použijeme pojem na nižší úrovni, případně rozšiřujeme pomocí nadřazeného pojmu příklad: vliv dialogové technologie na akvizici nejdříve: akvizice AND dialogové technologie pokud nedostaneme uspokojivý počet dokumentů: akvizice AND automatizace
priorita nejnižšího počtu odkazů • strategie vyhledávání nejdříve podle nejmenší četnosti výskytu (četnost výskytu termínu v databázi) příklad: faktografické informační systémy o životním prostředí hledáme-li v databázi informatických oborů – nejdříve termín životní prostředí bude pravděpodobně méně četný než termín faktografické informační systémy
rešeršní požadavek v SJ • vyjádření pojmů rešeršního požadavku v selekčních jazycích zvolených informačních souborů • bereme v úvahu konkrétní vyjadřovací prostředky zvoleného informačního zdroje (databáze apod.) • nezbytné použití různých pomůcek typu: nápověda zvoleného informačního zdroje klasifikační schémata knihovnicko-bibliografických třídění tezaury rejstříky apod.
formulace rešeršního dotazu • spojení selekčních údajů pomocí operátorů - rešeršní logika • využití pokročilých metod při práci s bázemi dat i při vyhledávání v prostředí internetu usnadňuje rešeršérovi formulaci rešeršního dotazu, šetří čas ( peníze) a především zpřesňuje výsledky hledání • rozšířené hledání - klíčová slova se spojují do vzájemného vztahu operátory a využívají se další možnosti v závislosti na nabídce konkrétního dotazovacího jazyka či rozhraní vyhledávacího programu