Wyszukiwanie informacji w Internecie

Wyszukiwanie informacji w Internecie Wydział Prawa i Administracji Pracownia Komputerowa mgr inż. Adam Bielański

Internet Inter-net sieć o zasięgu globalnym, łącząca sieci lokalne. Internet łączy miliony komputerów pracujących z różnymi systemami operacyjnymi. Aby komputery i programy na nich pracujące mogły bez przeszkód wymieniać dane, niezależnie od różnorodnych sposobów przesyłania danych potrzebne są uniwersalne protokoły transmisji. Stanowią one „międzykomputerowy” język porozumiewania się. Wszystkie informacje w Internecie przesyłane są w postaci niewielkich pakietów. Większe informacje przed przesłaniem dzielone są na pakiety.

Protokół TCP/IP Transport pakietów w Internecie reguluje zespół dwóch protokołów TCP/IP. Wymagają one aby każdy komputer przyłączony do Internetu miał unikalny cyfrowy 32 bitowy adres IP, np.: 149.156.224.2 (cztery człony ośmiobitowe —liczby z zakresy 0-255, rozdzielone kropkami). Pula takich adresów (IPv4), używana od wielu lat jest już na wyczerpaniu. Przygotowane do wdrożenia są adresy 128 bitowe (IPv6), zapisywane jako 8 członów 16 bitowych. IPv4 dysponuje pulą 232 = 4 294 967 296, a IPv6 ma 2128 = 3,4028236692093846346337460743177*1038. 8 czerwca 2011 roku najwięksi giganci Internetu (Google, Facebook i Yahoo!) przełączyli się na nowy protokół. Adresy są niewygodne dla użytkowników Internetu.

Adresy domenowe Wprowadzono więc drugi system adresów — tak zwane adresy symboliczne, lub adresy domenowe np.: cicero.law.uj.edu.pl (odpowiada adresowi IP 149.156.224.2). Takie adresy łatwiej zapamiętać, można także często je odgadnąć znając zasady ich tworzenia. Jeśli człowiek wpisuje adres domenowy, jego komputer zwraca się do serwera DNS w żądaniem przetłumaczenia adresu domenowego na adres IP. I tym adresem posługuje się komputer w dalszej części sesji.

Adresy domenowe Obecnie w adresach domenowych występują tylko małe litery alfabetu łacińskiego,również z literami alfabetów narodowych (od końca 2009r.). Adresy składają się z członów rozdzielonych kropką (a nie przecinkiem). Ostatni, dwuliterowy człon jest oznaczeniem kraju, a dokładniej kraju zarejestrowania domeny, a nie krajem „pobytu” komputera. I tak pl = Polska, de=Niemcy, fr=Francja, hr=Chorwacja, ru=Rosja, a eu=Europa (Unia Europejska), Brak dwuliterowego oznaczenia kraju = USA. Ten fragment adresy domenowego jest zawsze przestrzegany.

Adresy domenowe Niektóre domeny są często używane dla stron niezwiązanych z krajem, któremu je przydzielono, lecz ze względu na podobieństwo do skrótów, na przykład: * .tv - Tuvalu, często używane dla stron związanych z telewizją. * .fm - Mikronezja, często używane dla stron radia internetowego (np.: last.fm). * .me - Czarnogóra, często używana dla stron społecznościowych, z powodu, że angielskie słowo "me" oznacza "ja". * .cd - Demokratyczna Republika Konga - skrót CD oznacza płytę kompaktową. * .mu - Mauritius - koncerny muzyczne, muzyka. * .dj - Dżibuti, rzadko używana dla stron dotyczących Dj-ów i branży muzycznej. * .si - Słowenia, rzadko używana dla stron hiszpańskojęzycznych, ze względu na to, że hiszpańskie "si" oznacza "tak". Czasami używa się też innych domen dla stron niezwiązanych z danym krajem, ale rzadko (mołdawskie .md dla stron medycznych, .sh należące do Wysp Świętej Heleny, dla stron związanych z Szanghajem lub Shenzhen).

Adresy domenowe (cd) Przedostatni człon adresu (dla USA ostatni) — występuje często, ale nie koniecznie — określa rodzaj działalności właściciela serwisu internetowego lub miejsce geograficzne. I tak domeny określające rodzaj działalności: • com — podmioty prowadzące działalność komercyjną, tu przeważnie znajdziemy różne firmy np.: www.fiat.com.pl (fiat w Polsce), www.tasco.com.pl (sieć supermarketów Geant), www.asus.com.tw (firma Asus z Tajwanu). Wiele firm o zasięgu międzynarodowym rejestruje również swoje domeny w USA (np.: www.fiat.com lub www.ford.com) aby ułatwić ich znalezienie potencjalnym odbiorcom. Wtedy w takich serwisach umieszczone są odsyłacze do przedstawicielstw firmy w poszczególnych krajach. • edu — domena edukacyjne; uczelnie, szkoły, ale również placówki naukowe nie prowadzące działalności dydaktycznej, np. www.uj.edu.pl to serwer Uniwersytetu Jagiellońskiego,

Adresy domenowe (cd) • gov — instytucje związane z władzą wszelkiego rodzaju—w Polsce również sejm (www.sejm.gov.pl), senat (www.senat.gov.pl) oraz NIK (www.nik.gov.pl), • mil — instytucje związane z wojskiem i obronnością, • net — podmioty związane z sieciami komputerowymi, • org — organizacje nie związane z władzą a więc patie, organizacje pozarządowe, ruchy społeczne, • int — instytucja międzynarodowe, np.: strona Światowej Organizacji Zdrowia www.who.int , • prv — strony WWW prywatnych użytkowników internetu.

Adresy domenowe (cd) Niedawno wprowadzono nowe domeny — na razie mało popularne: • aero — dla instytucji i organizacji związanych z lotnictwem, • biz — dla biznesu, • coop — dla spółdzielni, • info — dowolne zasoby o charakterze informacyjnym, • museum — dla muzeów, • name — dla osób prywatnych, • pro — dla osób wykonujących wolne zawody.

Adresy domenowe (cd) • Domeny określające miejsce w Polsce: • • krakow.pl — (uwaga: krakow nie Kraków) domena Krakowa np.: www.krakow.pl, www.komunikacja.krakow.pl, www.wawel.krakow.pl • • waw.pl — domena Warszawy • • gda.pl — domena Gdańska, np.. www.pg.gda.pl serwis WWW Politechniki Gdańskiej • wroc.pl — domena Wrocławia, • lodz.pl — domena Łodzi, • Kolejne licząc od prawej człony oznaczają domeny użytkowników np: cicero.law.uj.edu.pl oznacza czytając od prawej domena polska, domena edukacyjna, UJ, wydz. Prawa, komputer cicero.

Adresy domenowe (cd) Zasady dotyczące drugiej od prawej domeny często nie są przestrzegane np.: onet.pl, interia.pl. Na oznaczania rodzaju serwera (przedostatnia część nazwy) należy zwracać uwagę, gdyż pomyłki mogą prowadzić do nieoczekiwanych rezultatów. Np.: www.mswia.gov.pl to serwer Ministerstwa Spraw Wewnętrznych i Administracji natomiast pod adresem www.mswia.com.pl do niedawna był serwer pornograficzny. Jednak przy poszukiwaniu w internecie informacji przeważnie odgadywanie adresu nie wystarcza. Z tego powodu powstały różnego typu serwisy wyszukiwawcze ułatwiające poszukiwania.

Serwisy wyszukiwawcze • Stopniowo powstawały różne typy serwisów wyszukiwawczych: • katalogi stron internetowych, • wyszukiwarki • multiwyszukiwarki

Katalogi stron internetowych Najwcześniej powstały katalogi stron internetowych. Było to przystosowanie do potrzeb Internetu rozwiązania znanego od dawna w bibliotekach – katalogu działowego. Tworzona jest drzewiasta struktura tematów, i tam umieszczane są odsyłacze do skatalogowanych stron internetowych. Katalogi pozwalają przeszukiwać zasoby Internetu według tematów. To jedyny typ serwisu wyszukiwawczego odpowiadający na pytanie: Pokaż strony o...... Korzystanie z katalogu jest łatwe, intuicyjne, nie wymaga instrukcji. www.katalog.onet.pl http://katalog.wp.pl/ http://dir.yahoo.com/ http://www.dmoz.org/

Zalety w wady katalogów • Zalety: • Korzystanie z katalogu jest łatwe, zgodne z ludzką intuicją, nie wymaga instrukcji, • Zasoby są dobrze skatalogowane, w danym dziale znajdziemy zasoby rzeczywiście na dany temat, • Katalogi pozwalają rozpocząć poszukiwanie bez znajomości słów kluczowych określających poszukiwaną tematykę. • Wady: • Zawartość katalogów jest bardzo uboga (tworzą je ludzie pracujący powoli), • Niekiedy trudno odgadnąć, w którym dziale umieszczono jakiś temat. • Podsumowanie: Katalogi znakomicie nadają się do rozpoczęcia poszukiwań, pozwalają określić jakimi hasłami prezentowana jest poszukiwana tematyka. Lecz na szukaniu w katalogach nie można zakończyć poszukiwań!

Niektóre adresy www.sejm.gov.pl prace Sejmu  przegląd wszystkich projektów ustaw www.europa.eu/rapid

Wyszukiwarki Główną wadą katalogów jest ich skąpa zawartość spowodowana zbieraniem stosunkowo powolną pracą człowieka. Aby zapewnić szybsze zbieranie informacji o zasobach Internetu postanowiono „zatrudnić” do tego komputer i program. Dla wyszukiwarki informacje o zasobach Internetu zbiera program, zwany robotem lub szperaczem. Działa on wg schematu: wczytaj stronę internetową, skopiuj na serwer, wyszukaj na niej jeden odsyłaczy i po tym odsyłaczu przejdź na następną stronę. Jednak współczesny program nie potrafi określić tematyki strony (jak to robił człowiek katalogujący strony WWW), a jedynie zapamiętać słowa występujące na stronie. Z tego powodu wyszukiwarka nie może odpowiedzieć na pytanie „pokaż strony o..” a jedynie „pokaż strony zawierające wskazany wyraz lub wyrazy”.

Wyszukiwarki Wyszukiwarka przeważnie tak rozumie pytania: spacja między wyrazami zamieniana jest na operator logiczny AND w więc zapytanie ukryty internet zostanie zrozumiane: pokaż strony www zawierające oba te wyrazy na stronie – lecz w dowolnej konfiguracji, nie koniecznie razem. dwa (lub więcej) wyrazy razem musza być objęte cudzysłowem więc zapytanie „ukryty internet” oznacza pokaż strony, na których występuję te wyrazy razem. operator OR rozdziela hasła, z których musi wystąpić przynajmniej jedno. tak więc zapytanie „opieka społeczna” OR „pomoc społeczna” oznacza: pokaż strony, na których występuje przynajmniej jeden z podanych terminów. Wystąpienie hasła po operatorze NOT wyklucza stronę w wyniku poszukiwania, więc gmina NOT budżet oznacza: pokaż strony zawierające słowo gmina, lecz strony zawierające również budżet należy odrzucić.

Wyszukiwarki • Wyszukiwarka przeważnie tak rozumie pytania: • spacja między wyrazami zamieniana jest na operator logiczny AND w więc zapytanie ukryty internet zostanie zrozumiane: pokaż zasoby zawierające oba te wyrazy na stronie – lecz w dowolnej konfiguracji, nie koniecznie razem. • dwa (lub więcej) wyrazy razem musza być objęte cudzysłowem więc zapytanie „ukryty internet” oznacza pokaż strony, na których występuję te wyrazy razem. • operator OR rozdziela hasła, z których musi wystąpić przynajmniej jedno. tak więc zapytanie „opieka społeczna” OR „pomoc społeczna” oznacza: pokaż strony, na których występuje przynajmniej jeden z podanych terminów. • gwiazdka * zastępuje dowolną ilość znaków do końca hasła, tak więc zapytanie stworzy* dotyczy wyrazów: stworzył, stworztła, stworzyciel itd..

Do wyszukania znaleźć odpowiedź na pytanie: Odpowiedź na pozew została złożona po terminie. Sąd odrzucił wniosek o przywrócenie terminu. Czy, w wypadku wystąpienia pozwanego z powództwem wzajemnym, dowody i twierdzenia przytoczone w odpowiedzi na pozew ulegają prekluzji w związku z orzeczeniem Sądu Najwyższego, czy też są one traktowane jako niebyłe, nie przedstawione w sprawie i mogą zostać przytoczone w pozwie wzajemnym?

Do wyszukania znaleźć odpowiedź na pytanie: Odpowiedź na pozew została złożona po terminie. Sąd odrzucił wniosek o przywrócenie terminu. Czy, w wypadku wystąpienia pozwanego z powództwem wzajemnym, dowody i twierdzenia przytoczone w odpowiedzi na pozew ulegają prekluzji w związku z orzeczeniem Sądu Najwyższego, czy też są one traktowane jako niebyłe, nie przedstawione w sprawie i mogą zostać przytoczone w pozwie wzajemnym? sugestia: prekluzja "termin zawity"

Do wyszukania znaleźć odpowiedź na pytanie: Jakie zalety i wady ma spółka cicha? powództwo przeciwegzekucyjne Jak prawo polskie traktuje przestępstwa komputerowe? Jakie są dostępne materiały omawiające zjawisko uporczywego prześladowania w internecie.

Do wyszukania znaleźć odpowiedź na pytanie: Jakie zalety i wady ma spółka cicha sugestia: „spółka cicha” wady zalety Co to jest powództwo przeciwegzekucyjne? sugestia: „powództwo ekscydencyjne” Jak prawo polskie traktuje przestępstwa komputerowe? sugestia: "przestępczość komputerowa" "prawo polskie„ Jakie są dostępne materiały omawiające zjawisko uporczywego prześladowania w internecie. sugestia: "prześladowanie w internecie" uporczywe

Inne wyszukiwarki AltaVistawww.altavista.com HotBothttp://www.hotbot.com/ Lycoshttp://www.lycos.com pokazuje miniatury znalezionych stron WWW

Multiwyszukiwarki Zasoby poszczególnych wyszukiwarek różnią się między sobą. Gdy porównamy zasoby dwóch wyszukiwarek, okaże się, że będą strony występujące w obu, a także strony WWW występujące tylko w jednej, a w drugiej nie. Pomimo, że wyszukiwarka Google jest najpotężniejsza, są zasoby, których nie znajdziemy w Googlach, a znajdziemy w innych wyszukiwarkach. Przy robieniu poważnych poszukiwań materiałów w Internecie należy skorzystać z kilku wyszukiwarek. W takim przypadku warto skorzystać z jednej z multiwyszukiwarek. Multiwyszukiwarka to serwis nie posiadający własnej bazy zasobów Internetu, ale współpracujący z kilkoma wyszukiwarkami. Pytanie odebrane od użytkownika jest rozsyłane do współpracujących wyszukiwarek. Z odpowiedzi tych wyszukiwarek tworzona jest wspólna lista przedstawiana użytkownikowi.

Multiwyszukiwarki – wady i zalety Multiwyszukiwarki nie mają własnych baz danych. Jednakże wyraźnie podnoszą komfort pracy, bo umożliwiają jednoczesne korzystanie z wielu "zwykłych" wyszukiwarek/katalogów. Otrzymane zapytanie multiwyszukiwarka jest wysyła równocześnie (lub sekwencyjnie) do wielu serwisów wyszukiwawczych, a zebrane w ten sposób wyniki są wyświetlane na oddzielnej stronie. Mogą być segregowane według miejsca skąd pochodzą, trafności itd. Niektóre multiwyszukiwarki dają się skonfigurować, czyli ustawić liczbę i rodzaj serwisów wyszukiwawczych, do których będzie wysłane zapytanie. Zalety Multiwyszukiwarka pozwala na szybkie wygodne przeszukanie naraz zasobów kilku wyszukiwarek. Wady Ze względu na różny sposób interpretowania pytań złożonych przez poszczególne wyszukiwarki, przez multiwyszukiwarki nie przechodzą takie pytania.

Multiwyszukiwarki – przyklady Multiwyszukiwarki są dostępne poprzezswoje adresy w Internecie lub są osobnymi programami. DogPile to multiwyszukiwarka, sprawdza światowe zasoby Internetu, wykorzystuje kilkanaście serwisów naraz, m.in.: Excite, Go2.com, Lycos, Lycos A2Z, Magellan, Thunderstone, WebCrawler, What U Seek, Yahoo. http://www.dogpile.com/ Metacrawler sprawdza między innymi Google, Yahoo, Bing i Askhttp://www.metacrawler.com/, Search sprawdza między innymi Google, Yahoo, Bing Ask, Open Directoryhttp://www.search.com/ Ixquickhttp://s3-eu.ixquick.com/do/metasearch.pl InfoSpacehttp://www.infospace.com/ispace/ws/index szuka stron WWW, obrazów, video

Multiwyszukiwarki – programy Są też multiwyszukiwarki w postaci programów do zainstalowania. Jedną z nich jest Copernic Agent występujący w trzech wersjach „Basic” (darmowy) i bardziej rozbudowane, płatne „Personal” i „Proffesional”. Strona producenta www.copernic.com. Polski program Negative do pobrania ze strony http://www.negative.pl/

Grupowanie wyników multiwyszukiwarek (clustering) Prowadzona jest analiza występowania poszczególnych terminów w wynikach w wyszukiwarek, co pozwala sa sensowne pogrupowanie wyników poszukiwania. http://search.carrot2.org/stable/search 29

Możliwe jest wyświetlenie wyników w postaci grup w folderach (folders) lub w postaci graficznej (circles) lub FoamTree) 30

Grupy dyskusyjne Z Wikipedii, wolnej encyklopedii Grupa dyskusyjna – w Internecie to ogólna nazwa wszelkich form dyskusji internetowej przypominających wymianę korespondencji, a nie rozmowy w czasie rzeczywistym. Grupy dyskusyjne przyjmują formę list dyskusyjnych pozwalających na automatyczną wymianę e-maili, grup Usenetowych, grup występujących w Fidonecie i forów dyskusyjnych dostępnych przez bramki WWW. Grupy dyskusyjne mogą stanowić cenne źródło informacji.

Grupy dyskusyjne – podział ze względu na dostępność Grupy dyskusyjne ze względu na dostępność można podzielić na: • zamknięte – tzn. być dostępne tylko dla wybranej grupy osób (np: grupy przeznaczone dla pracowników jednej firmy), • półotwarte – tzn. dostępne dla wszystkich, ale pod pewnymi warunkami, (np. po udowodnieniu swoich kwalifikacji), • moderowane – czyli dostępne dla wszystkich, ale wysyłane nań komunikaty są cenzurowane przez specjalną osobę, • otwarte dla zarejestrowanych – czyli dostępne dla wszystkich, którzy się doń zapisali i niecenzurowane, • całkowicie otwarte – czyli dostępne także dla tych, którzy się do nich nie zapisali.

Grupy dyskusyjne – podział ze względu na dostępność „Instrukcja obsługi” grup dyskusyjnych http://rtfm.killfile.pl/ Przykłady adresów poprzez które można przeglądnąć grupy dyskusyjne: http://usenet.gazeta.pl/usenet/0,0.html http://groups.google.pl/ Ale standardowym czytnikiem grup dyskusyjnych jest program pocztowy np.: Mozilla Thunderbird (raczej nie Outlook) Zasady korzyskania z grup dyskusyjnych reguluje netetykieta, dostępna między innymi pod adresem http://pl.wikipedia.org/wiki/Netykieta.

Księgi Wieczyste Siatka działek geodezyjnych: http://maps.geoportal.gov.pl/webclient/ Wyszukiwarka działek Księgi wieczyste (jeszcze niekompletna) http://ksiegi-wieczyste-online.pl/ ->"wyświetl mapy" w górnym menu mapy -> "dane o charakterze katastralnym". http://ekw.ms.gov.pl/pdcbdkw/pdcbdkw.html Niestety na razie brak rozsądnego przejścia od numeru działki o numeru księgi wieczystej. Można to zrobić jedynie z pomocą Wydziału Geodezji, Kartografii i Katastru, Starostwa Powiatowego.

KRS Krajowy Rejestr Sądowy on line http://www.ekrs.pl/ http://www.krs-online.com.pl Wyszukiwanie ludzi http://people.yahoo.com www.ditel.com.pl instytucje i formy

Praca www.pracuj.pl (łącze do płatnej usługi LM i CV) www.praca.pl www.infopraca.pl (podaje ilość zgłoszeń) www.gazetapraca.pl (kalkulator płac, porady do CV) www.praca.gratka.pl

Ukryty internet (deep web) Z zasady działania wyszukiwarki wynika, że zawiera ona wyłącznie informacje o tych stronach WWW, do których dojdzie jej robot, zbierający informacje. Są jednak takie serwisy WWW, w których trzeba podać jakieś zapytanie (np.: katalog biblioteki, baza aktów prawnych) lub zalogować się (podać nazwę użytkownika i hasło). Do takich zasobów Internetu roboty nie mają dostępu, bo nie potrafią zadać pytania, podać nazwy użytkownika oraz hasła.. Tak więc te zasoby — tworzące „ukryty internet” nie będą widoczne w wyszukiwarkach. Polska nazwa „ukryty internet” nie oddaje istoty zjawiska. Tych zasobów nikt nie ukrywa, są tylko niewidoczne w wyszukiwarkach. Lepiej oddają charakter angielskie nazwy „deep web” (głęboki internet) lub „invisible internet” (niewidoczny internet). Tzw. głęboki Internet albo ukryty Internet zawiera kilkaset razy więcej zasobów niż Internet do powszechnego użytku, widoczny dla zwykłych przeglądarek.

Ukryty internet (deep web)

Ukryty internet (deep web) Większość zasobów ukrytego stanowią specjalistyczne bazy danych i dokumentów elektronicznych, a także archiwa bardzo cennych materiałów źródłowych i referencyjnych. Zwykłe przeglądarki nie indeksują stron internetowych z tymi materiałami. Zasoby te utrzymywane są w sieci głównie przez uniwersytety oraz instytucje rządowe i międzynarodowe. Odnośniki do tych olbrzymich zasobów są zbierane, kwalifikowane i katalogowane przez wyspecjalizowanych redaktorów. Katalogi są często jedyną "bramą", przez którą można dotrzeć do zasobów wielokrotnie większych, niż te dostępne powszechnie.Do zasobów głębokiego internetu można uzyskać dostęp poprzez „bramy” stanowiąca adresy WWW odpowiednich serwerów. I tak poprzez bramę o adresie http://www.bj.uj.edu.pl/uj/katalog (adres katalogu on-line Biblioteki Jagiellońskiej) mamy dostęp do zasobów katalogu tej biblioteki.

Ukryty internet (deep web) Przeszukiwania w ukrytym internecie są znacznie bardziej mozolne niż poszukiwania w „płytkim internecie” – widocznym w wyszukiwarkach, ale wyniki poszukiwań są często znacznie ciekawsze. Po wpisaniu w wyszukiwarce zapytania „ukryty internet” lub „deep web” otrzymamy jako odpowiedź strony zawierające spis bram do ukrytego internetu. Kolekcję bram do zasobów ukrytego internetu zawierają między innymi strony WWW: http://www.bg.umcs.lublin.pl/nowa/deep.php http://www.ukrytyinternet.yoyo.pl/gleboki.html

Niektóre bramy do ukrytego internetu http://dmoz.org/ - największy na świecie katalog stron redagowany przez internautów. http://scholar.google.com/ - najnowsze dziecko Google - przeszukuje sieć pod kątem materiałów akademickich dla wykładowców i studentów. http://www.allsearchengines.com/ - ogromny zasób linków do wyszukiwarek ogólnych i specjalistycznych . http://www.searchenginecolossus.com/ - wyszukiwarki lokalne ze 153 krajów. http://www.northernlight.com/ - katalog kwalifikowanych materiałów z różnych dziedzin. Szerokie możliwości dostosowania do indywidualnych potrzeb, wiele opcji wyszukiwania. http://www.digital-librarian.com/ - miejsce do poszukiwania bibliografii, źródeł i opracowań ze wszelkich dziedzin. (http://www.scirus.com/) - ponad 410 mln dokumentów, z licznych stron www, m. in.nw domenach edu, org, gov (np. PubMed Central, Nature Publishing Group, strony uczelni wyższych, strony Open Access, raporty techniczne NASA) http://vlib.org/ The WWW Virtual Library

Niektóre bramy do ukrytego internetu http://www.freepint.com/gary/direct.htm - narzędzia przeszukiwania i katalogi zasobów Niewidocznego Internetu. Są tam także serwisy dodatkowe, na przykład lista list czyli rankingów z całego świata. " http://www.completeplanet.com/ - katalog "głębokich" zasobów Internetu, innowacyjna technologia przeszukiwania LexiBot. Mnóstwo danych i materiałów źródłowych. http://infomine.ucr.edu/ - katalog materiałów dla studentów i wykładowców. http://www.kent.ac.uk/lawlinks/electronic-law-library/index.html - Electronic law library Legal databases at Kent 42

STRATEGIE WYSZUKIWAWCZE • Strategia „ON THE WEB” -najczęściejstosowane przez internautów. Polega na korzystaniu z jednej popularnej wyszukiwarki internetowej i prostych zapytań. Przeważnie nieskuteczna i nieefektywna. Wyszukiwarki dobrze sprawdzają się w wyszukiwaniu popularnych serwisów WWW, przeszukiwaniu słowników i encyklopedii, dokumentów HTML - dają miliony odpowiedzi. • Strategia „VIA THE WEB” - jeden ze sposobów na Ukryty Internet. Polega na korzystaniu z różnych narzędzi wyszukiwawczych, dostosowanych do potrzeb i oczekiwań użytkowników. Polega na tym, by nawet za pomocą tych narzędzi szukać głębiej - poszukiwać wielowarstwowo, wieloetapowo. Strategia ta dobrze nadaje się to poszukiwań naukowych. 43

Wiarygodność informacji w Internecie Informacje znalezione w Internecie należy poddać weryfikacji. Nie każda informacja znaleziona w sieci musi być prawdziwa. Najczęściej, lecz nie jedynie, zagrożenie występuje w serwisach amatorskich i forach dyskusyjnych. Bardziej wiarygodne są źródła informacji w serwisach WWW niezależnych instytucji, cieszących się autorytetem. Bardziej wiarygodne są informacje podpisane przez autora, niż anonimowe. Ze względu na łatwość publikowania informacji w Internecie i brak jakichkolwiek form weryfikacji treści – odbiorca informacji musi sam dokonać zweryfikować jej prawdziwość, przed dopuszczeniem jej do własnej świadomości i przed jej dalszym wykorzystaniem i rozpowszechnianiem. Wskazane jest weryfikowanie informacji w tradycyjnych źródłach wiedzy- książkach i czasopismach fachowych. Można zwrócić się do specjalistów z danej dziedziny wiedzy.

Wiarygodność informacji w Internecie Przeważnie weryfikacja prawdziwości informacji pochodzącej z Internetu jest trudniejsza od jej wyszukania! Warto tu zacytować naszego narodowego wieszcza Adama Mickiewicza” Wiedzę możemy zdobywać od innych, ale mądrości musimy nauczyć się sami. 45

Wyszukiwanie informacji w Internecie