360 likes | 500 Views
Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de Ciência da Informação. Fontes de Informação Especializada. Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 26setembro2007. Aula 26set2007. Assuntos de hoje Buscadores da Internet (search engines)
E N D
Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de Ciência da Informação Fontes de Informação Especializada Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 26setembro2007
Aula 26set2007 Assuntos de hoje Buscadores da Internet (search engines) Estratégias de busca
Aula 26set2007 (relembrando) o que é a Informação Científica e Tecnológica? Patente Empresas, Universidades, centros de pesquisa
Aula 26set2007 (relembrando) Definição Informação científica e tecnológica “compreende todo tipo de informação que serve de matéria-prima (new material information) ou insumo para a geração de conhecimentos científicos e de tecnologia”. (AGUIAR, 1991)
Aula 26set2007 HIPERINFORMAÇÃO • 1 milhão de livros novos por ano • Mais de 300.000 revistas científicas existentes • 10.000.000 de novos artigos publicados por ano • 1.000.000 de patentes requeridas • 600 bilhões de páginas existentes na Internet, em número crescente • Em 2002 foram produzidos 5 exabytes (equivale a 500 mil Bibliotecas do Congresso Americano) de nova informação. • 92% está armazenado em mídia magnética (grande parte em HD’s) • Estima-se que a quantidade de nova informação produzida nos três últimos anos tenha duplicado.
Aula 26set2007 O cérebro humano pode armazenar cerca de 1.200 páginas de informação por ano. Há cada vez mais informação produzida no mundo Logo..... • Na década de 1930 Ranganathan defendia que: • O livro é para ser lido; • A cada leitor seu livro; • A cada livro o seu leitor; • Poupe o tempo do seu leitor; • A biblioteca é um ambiente em construção
Aula 26set2007 País de origem O país de origem refere-se à posição geográfica da organização, do indivíduo, ou dos indivíduos responsáveis pelo conteúdo intelectual de um Web site de acesso público. Nota: o país de origem não se refere à posição física do servidor web em que o site está sendo disponibilizado. 78% http://www.oclc.org/research/projects/archive/wcp/
Aula 26set2007 Línguas (conteúdos na web) 91%!! http://www.oclc.org/research/projects/archive/wcp/
Aula 26set2007 Internet “DEEP WEB” X “SURFACE WEB” (BERGMAN) A SURFACE WEB é estimada (2001) em 2,5 bilhões de páginas, a DEEP WEB, estima-se 500 vezes maior.
Aula 26set2007 FOLHA de SP (31/08/2005) O Yahoo!anunciou que seu buscador é capaz de pesquisar em cerca de 19,2 bilhões de páginas, O índice é maior que o dos concorrentes MSN (search.msn.com.br), com 5 bilhões de páginas, e Google, com cerca de 8 bilhões de sites. Pesquisadores da Universidade de Illinois e do NCSA, nos EUA, fizeram buscas com 10 mil termos aleatórios e concluíram que o serviço do Yahoo! apresentou apenas 37% dos resultados que o Google mostrou nas mesmas condições. Segundo o estudo (vburton.ncsa.uiuc.edu/indexsize.html), o Google retornou, em média, 202 resultados para cada termo pesquisado, enquanto o Yahoo! retornou apenas 132.
Aula 26set2007 FOLHA de SP (31/08/2005) “Especialistas afirmam que a área de pesquisas do Google é restrita a aproximadamente 1% do total de arquivos da rede. No total, de acordo com números da empresa Connotate Tecnologies (www.connotate.com), existem cerca de 600 bilhões de arquivos na rede, mas o Google acessa apenas cerca de 8 bilhões."
Aula 26set2007 COMO BUSCAR INFORMAÇÕES GENÉRICAS NA WEB??
Aula 26set2007 TIPOS DE MECANISMOS • Diretório • Metasearch • Índice
Aula 26set2007 DIRETÓRIO • Organizados hierarquicamente. • A busca e organização das informações é feita comumente por seres humanos e somente a home page de um site é indexada. • A informação é dividida em categorias. • Ex: encontramos UFPE em • Educação > Universidade e Ensino Superior > Brasil > Pernambuco • Vantagem : probabilidade reduzida dos resultados estarem fora do contexto.
Aula 26set2007 DIRETÓRIOS • Google http://www.google.com.br/dirhp?hl=pt-BR • ODIR http://www.odir.com.br/
Aula 26set2007 METASEARCH • Não possuem índices próprios • Submetem as perguntas formuladas a vários indexadores da Web, coletam os resultados obtidos, fazem uma formatação, eliminando resultados duplicados e geram uma listagem final. • Adotam um mínimo denominador comum na forma como as pesquisas são submetidas.
Aula 26set2007 METASEARCH Dogpile (http://www.dogpile.com) Metacrawler (http://www.metacrawler.com) Buscapé (http://www.buscape.com.br)
Aula 26set2007 ÍNDICE Spiders / Robôs varrem a internet buscando páginas, indexando-as e criando seu próprio banco de dados. Algoritmos de busca que acham e trazem documentos relevantes para a pesquisa do usuário
Aula 26set2007 ÍNDICE Quando fazemos a pesquisa através de um mecanismo de busca NÃO o fazemos "ao vivo" e sim recuperamos as informações gravadas nos banco de dados. Ex: cache do Google Normalmente cobrem todo tipo de assunto possível, não fazem distinção entre os sites que indexam (pesquisa por softwares).
Aula 26set2007 ÍNDICE Exemplos AltaVista (http://www.altavista.com) Excite (http://www.excite.com) FAST (http://www.alltheweb.com) Google (http://www.google.com.br) HotBot (http://www.hotbot.com) Northern Light (http://www.northernlight.com) A9 (http://a9.com)
Aula 26set2007 GOOGLE ACADÊMICO + especializado http://scholar.google.com.br/advanced_scholar_search?hl=pt-BR&lr=
Aula 26set2007 Os sistemas de busca falam nossa língua? COMO ELABORAR UMA ESTATÉGIA DE BUSCA?
Aula 26set2007 • Inicie a idéia partindo do geral para o específico • Artes e Cultura • Música • Rock e Pop • Rock e Pop Nacional • Skank
Aula 26set2007 • Análise conceitual • Destaque os conceitos (idéias) mais importantes contidos no tema da pesquisa; • Escolha as palavras para definir os conceitos Exemplo: USO DE POLIESTIRENO EXPANDIDO EM ISOLAMENTO DE TETOS Conceito 1 - POLIESTIRENO EXPANDIDO Conceito 2 - ISOLAMENTO Conceito 3 - TETOS
Aula 26set2007 • Se você não conhece o assunto, use mecanismos na Internet do tipo diretório para localizar alguns tópicos mais gerais e obter uma visão geral do assunto, além de termos de indexação que possam orientá-lo. • Ex: ESPECTROSCOPIA
Aula 26set2007 METODOLOGIA DA CONSTRUÇÃO DE CENÁRIOS NA ELABORAÇÃO DE POLÍTICAS PÚBLICAS CONCEITO 1 – CONSTRUÇÃO DE CENÁRIOS CONCEITO 2 - METODOLOGIA CONCEITO 3 – POLÍTICAS PÚBLICAS
Aula 26set2007 Em alguns sistemas as aspas “” ou parênteses () são usados para o mesmo propósito: delimitar nomes próprios, conceitos, são os sintagmas. Exemplos Luis Inácio Lula da Silva – “Luís Inácio Lula da Silva” Parada cardíaca – “Dor de cabeça” Evite as “Stopwords” ver algumas em http://www.ranks.nl/stopwords/portugese.html http://linguateca.di.uminho.pt/Paulo/stopwords/
Aula 26set2007 A FISIOTERAPIA APLICADA À OBSTETRÍCIA (ASPECTOS DA NEONATOLOGIA OU GINECOLOGIA) CONCEITO 1 – FISIOTERAPIA CONCEITO 2 - OBSTETRICIA CONCEITO 3 – NEONATOLOGIA CONCEITO 4 – GINECOLOGIA
Aula 26set2007 EQUIPAMENTO PARA SECAGEM DE GARRAFAS PLÁSTICAS CONCEITO 1 – EQUIPAMENTO CONCEITO 2 - SECAGEM CONCEITO 3 – GARRAFAS PLÁSTICAS
Aula 26set2007 • Estratégia de Pesquisa • Construção de expressões lógicas de termos que definem uma questão • Utilizam comumente os operadores booleanos AND (e), OR (ou), NOT (não) • OBS: Sistemas acessados por usuários leigos não costumam disponibilizar inicialmente os operadores booleanos
Aula 26set2007 OPERADORES BOOLEANOS Símbolos usados para a combinação lógica de termos (ou expressões de busca), criado pelo matemático inglês George Boole O operador OR permite a soma lógica (pelo menos um dos termos presentes) Ex: PROFESSOR OR INSTRUTOR OR FACILITADOR O operador AND permite a criação de um produto lógico (exige que estejam presentes todos os termos) Ex: PROFESSOR AND DOUTOR O operador NOT permite a diferença lógica (exige que não contenham determinados termos) Ex: PROFESSOR NOT PRIMÁRIO
Aula 26set2007 USO DE POLIESTIRENO EXPANDIDO EM ISOLAMENTO DE TETOS “poliestireno expandido” AND isolamento AND tetos METODOLOGIA DA CONSTRUÇÃO DE CENÁRIOS NA ELABORAÇÃO DE POLÍTICAS PÚBLICAS “construção de cenários” AND metodologia AND “políticas públicas”
Aula 26set2007 A FISIOTERAPIA APLICADA À OBSTETRÍCIA (ASPECTOS DA NEONATOLOGIA OU GINECOLOGIA). Não quer tocoginecologia fisioterapia AND obstetrícia AND (neonatologia OR ginecologia) NOTTOCOGINECOLOGIA
Aula 26set2007 Assunto: A FISIOTERAPIA APLICADA À OBSTETRÍCIA (ASPECTOS DA NEONATOLOGIA OU GINECOLOGIA) Fisioterapia Neonatologia Obstetrícia OR AND AND • tocologia • ginecologia
Aula 26set2007 Assunto: Equipamento para secagem de garrafas plásticas Equipamento Secagem Garrafa Plástica AND AND AND OR • Equipment • Device • apparatus • Drying • Dryer • dry • Bottle • Packaging • Plastic • thermoplastic
Aula 26set2007 O que vem depois... SETEMBRO OUTUBRO