430 likes | 625 Views
Internet - jak hledat a najít. Internet je informační médium. Důležité je vědět kde hledat a jak hledat. Jak hledat a najít. Katalogové vyhledávací servery (Předmětové katalogy) Vyhledávací servery Souhrnné vyhledávací služby Metavyhledávače Archivy programů Zjišťování e-mailů
E N D
Internet - jak hledat a najít Internet je informační médium. Důležité je vědět kde hledat a jak hledat.
Jak hledat a najít • Katalogové vyhledávací servery (Předmětové katalogy) • Vyhledávací servery • Souhrnné vyhledávací služby • Metavyhledávače • Archivy programů • Zjišťování e-mailů • Autorské právo
Katalogové vyhledávací servery • hierarchicky uspořádané seznamy kategorií, lze v nich i vyhledávat • cca 15 hlavních kategorií • odkaz (adresa + popis stránky) • při hledání slova lze použít operátorů AND, OR, AND NOT • @ označuje křížový odkaz (na toto místo vedou odkazy z více kategorií)
Hledání informací • 1. požadavek na jejich získání • 2. volba informačního zdroje • 3. dotaz informačnímu zdroji • 4. analýza výsledku • 5. zpracování a využití získané informace • Pozor! pojem „výroba obuvi“ hledejte zadáním slova „obuv“ než „výroba“
Řazení výsledků • informace o počtu odkazů (počet sekcí) • odkazy zobrazovány po částech (např. 10 ze 100) • zvýrazňují se tučně hledaná slova • vyhledává i podobná slova nebo části jiných slov (např.: formace -> informace, forma -> formát) • odkazy jsou řazeny podle relevace (uvedena v závorce v %), není zcela jasné podle čeho se určuje
Výhody • 1. relativně malé množství informací (lze reálně prohlédnout) • 2. popis stránek (podle něj lze rozpoznat, zda je pro nás stránka zajímavá) • 3. hierarchická struktura procházení • 4. křížové odkazy (rychlé nalezení odkazu)
Nevýhody • 1. absence plných textů (na popis odkazu se nelze vždy spolehnout) • 2. k dispozici jsou jen odkazy zadané uživateli • 3. občasná neaktuálnost odkazů
seznam.cz (první český univerzální předmětový katalog, vůbec nejnavštěvovanější web v ČR) atlas.cz najdi.to (provozuje Czech On Line) divoky.volny.cz (provozuje Czech On Line) yahoo.com (vůbec první předmětový katalog, má velmi jednoduchý design pro rychlé načtení, mezi více slov dává automaticky AND, zná však jen + a -) dmoz.org (Open Directory Project – vytyčil si za cíl být největším katalogem na světě, nyní má více jak 2 mil. záznamů, tvoří ho dobrovolníci) Nejznámější katalogy
redbox.cz (provozuje Contactel) centrum.cz katedrala.cz (obsahuje systém hodnocení stránek, není vždy přehledný) www.opendir.cz – česká verze, slouží také jako metavyhledávací server search.quick.cz (provozuje Český telecom, vznikl ze zmije.cz) www.czis.cz – český informační systém Nejznámější katalogy
Vyhledávací servery • uchovávají celé texty stránek a používají silný vyhledávací jazyk • nehledáme jen podle názvu, ale podle obsahu stránky pomocí klíčových slov • klíčová slova jsou termíny, které vybíráme tak, aby vhodně charakterizovaly hledané informace • indexování – soubor s klíčovými slovy obsahující odkazy na další dokumenty v nichž se klíčová slova vyskytují
Vyhledávací servery • stoplist – seznam slov (předložky, spojky ...), která nejsou zařazena do indexového souboru • selektivní síla klíčového slova (pokud je klíčové slovo příliš obecné, termín se ignoruje, např.: „xml html www“, na klíčové slovo „-?“ nalezne AltaVista 50 mil. odkazů), • v dotazech lze používat i závorky • fráze – píší se do uvozovek, slova v závorkách se musí nacházet v prohledávaných dokumentech najednou a v zadaném pořadí
operátor význam title:text text se musí nalézat v nadpisu stránky text:text text se musí nacházet v textu stránky, nikoli v nadpisu, odkazu image:jméno Hledají se dokumenty obsahující obrázek jméno. link:adresa Hledají se dokumenty odkazující na dané URL adresa. host:adresa Hledají se dokumentyz daného serveru adresa. domain:doména Hledají se dokumenty na serverech ze zadané domény. anchor:text text se musí nalézat v odkazu, tj. mezi <a> a </a>. applet:jméno Najde dokumenty obsahující javový aplet jméno. ambed:objekt Najde dokument s vloženým objektem objekt. url:URL Najde stránky obsahující URL v adrese. Kontextové operátory(podporuje např. altavista.com): Řazení výsledků:podle frekvence slova, pozice klíčového slova v nadpisech a podle operátorů se stránka ohodnotí
Výhody • 1. obrovský rozsah dat • 2. výborné možnosti specifikace dotazu • 3. možnost upřesnění dotazu (hledat z nalezených nebo hledat podobné) • 4. doplňkové služby (hledá se ve specializovaných katalozích knih, CD ...)
Nevýhody • 1. mnoho nalezených odkazů • 2. složitý vyhledávací jazyk • 3. občasná neaktuálnost odkazů
Rozdíly mezi Katalogovými vyhledávacími servery a Vyhledávacími servery • katalogy neobsahují celé dokumenty, jen jejich základní popis • vyhledávací servery používají vyhledávací jazyk • záznamy do katalogů zaznamenávají uživatelé • katalogy odkazují většinou jen na celé weby, vyhledávací servery na jednotlivé dokumenty
Kdy použít předmětové katalogy (Katalogové vyhledávací servery)? • umíme rozumně popsat téma, které hledáme. Např. jízdní řád, pravidla sportu. • hledáme odkazy ze zadané oblasti Např.: adresy knihoven, škol. toto nelze použít u vyhledávacích serverů
Kdy použít vyhledávací servery? • jsme schopni určit téma, ale je příliš úzké nebo specifické, např. sběratelství – korkový uzávěr • nejedná se o téma, ale o pojem, např. umělohmotné obaly
kompas.seznam.cz (zvládá různé kódování, AND = a, OR = nebo, NOT = ne) hledej.atlas.cz (mnoho nastavení, umí např. * - pravostranné rozšíření) fulltext.centrum.cz (operátory podporuje jen české a *) www.megatext.cz (vyvinut společností Microton, umí slova v různých pádech, zobrazí je s částí textu, kde se nacházejí) najdi.to (provozovatel Czech Online) excite.com lycos.com Nejznámější vyhledávací servery
altavista.com (nejznámější vyhledávací server na světě, vytvořila firma Digital, která ho prodala firmě Compaq, používá stovky multiprocesorovým počítačů, řada z nich pracuje v pozadí bez přímého propojení s uživatelem a aktualizují data v databázích), +, -, AND, OR, NOT, „fráze“, operátory host: ..., lze upravit podobu výsledku viz. Customize settings, pokud bude nějaké písmeno velké, bude hledat přesně tak, jak je napsáno Nejznámější vyhledávací servery
askjeeves.com (první služba, která se pochlubila vyhledáváním v přirozeném jazyce bez nutnosti znát operátory, pokud nenajde odpověď, nabídne otázky na které zná odpověď, pouze v angličtině) google.com (jedna z nejnovějších vyhledávacích služeb, „I’m feeling Lucky“ - automatické přesměrování na první nalezenou stránku, u nás má Redbox) Nejznámější vyhledávací servery
Souhrnné vyhledávací služby • portál umožňující vyhledávat na různých vyhledávacích serverech • alenka.cz (provozována občanským sdružením Projekt PinkNet, nabízí rozhraní pro cca 300 informačních a vyhledávacích služeb, přehledné uspořádání, lze nastavit svůj vzhled)
Metavyhledávače • neprohledávají Internet, ale využívají existující vyhledávací servery
Každý dotaz uživatele prochází následujícími kroky: • 1. uživatel zapíše dotaz do stránky webovského prohlížeče a odešle jej • 2. metavyhledávač dotaz přijme a rozešle jej vybraným vyhledávacím službám • 3. jednotlivé vyhledávací služby dotaz přijmou, zpracují a zašlou výsledek zpět • 4. metavyhledávač počká, až shromáždí odpovědi od všech vyhledávačů nebo alespoň od většiny • 5. teprve potom může výsledky zpracovat (odstranit duplicity, seřadit podle relevance, poskytnout jednotný formát) • 6. dokument s výsledkem dotazu je zaslán uživateli
vzhledem k tomu, že musí čekat na odezvu více serverů, jsou pomalé jejich rychlost je závislá na rychlém připojení k Internetu odstraňují duplicity Nevýhoda Výhoda
www.archon.cz (jediný český) opendir.cz metacrawler.com profusion.com (převzatá portálem IntelliSeek) search.com Nejznámější metavyhledávače
Archivy programů • www.slunecnice.cz • stahuj.cz • tucows.com, tucows.cz • shareware.com • download.com
Zjištění e-mailu, které jsou veřejně přístupné • lide.cz (informace také o netmeetingu, ICQ) • ldap.atlas.cz (informace také o netmeetingu, ICQ) • bigfoot.com (pouze americké adresy)
Programy, aplikace a softwarové doplňky • šablony do wordu • aktuální verze antivirového programu • opravné balíčky • ovladače • atd.
Autorské právo • i když lze téměř vše z Internetu stáhnout, podléhá to autorskému zákonu a licenčním podmínkám
demoverze • výrazně omezená verze programu, který je jinak prodáván běžným způsobem. Uživatel může program testovat, ale nemůže např. ukládat soubory nebo tisknout. Slouží zároveň jako ochrana proti nelegálnímu šíření.
shareware • metoda šíření programů, kdy uživatel před zakoupením získá plně funkční verzi programu, který může po omezenou dobu zkoušet. Doba je určena licenčními podmínkami zpravidla od 14 dnů do 2 měsíců. Poté si musíte produkt koupit, jinak porušujete autorský zákon. Pokud naleznete na Internetu registrační čísla, které tyto programy odblokovávají, porušujete tím zákon a navíc programátoři, kteří usilují o způsob šíření programů, který je pro všechny výhodnější.
freeware • program zadarmo. Můžete jej bezplatně používat. Je však zakázáno např. bez svolení autora program měnit nebo ho vydávat za vlastní.
public domain • častěji se vyskytují v prostředí Linuxu. Autor programu vám dává k dispozici nejen program, ale také zdrojový kód, s nímž si můžete dělat, co chcete (upravovat jej, použít ve vlastních programech). Podle zákona si to však autor může rozmyslet a pokud bude chtít za své dílo poplatky, stojí zákon na jeho straně. Z tohoto důvodu vzniká řada programů pod společnou licencí, která používání takto vzniklých programů upravuje, např. GNU (General Public Licence – veřejná všeobecná licence)
Kromě těchto základních kategorií, vznikají nové, které si vymýšlejí sami autoři. Lze je zařadit zhruba mezi freeware a shareware: • Crippleware • používá se pro programy, které tvůrce vydává za shareware, ale jsou spíše demoverzí, protože jim chybí řada funkcí (nemyslí se tím funkce, bez kterých se můžete i obejít např. nemožnost ukládat soubory)
Adware • za program nemusíte platit, lze jej legálně používat, omezení je v tom, že program obsahuje plochu na reklamu kterou si pravidelně obměňuje z Internetu. • Cardware • místo zaplacení registračního poplatku musíte autorovi poslat pohlednici nebo něco jiného
Internetjak hledat a najít Literatura: Jiří Bráza, Internet.cz jak hledat a najít, 3. aktualizované vydání, Grada Publishing, Praha 2001, ISBN 80-247-9002-5 RNDr. Radomír Palovský, CSc., Ing. Vilém Sklenák, CSc.: Informace a Internet, VŠE v Praze, Fakulta informatiky a statistiky, 1998, ISBN 80-7079-562-X
Úkol • Ve wordu vytvořit tabulku s odkazy