300 likes | 426 Views
Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de Ciência da Informação. Tópicos Especiais em TI 2. Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 04outubro2007. http://toti2.wordpress.com. Aula 04out2007. Assunto de hoje Bases de dados
E N D
Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de Ciência da Informação Tópicos Especiais em TI 2 Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 04outubro2007 http://toti2.wordpress.com
Aula 04out2007 Assunto de hoje Bases de dados Na próxima aula entregar um ensaio sobre Bases de Dados! - Uma página tamanho A4, Fonte Arial 12, Espaçamento simples.
Aula 04out2007 • Em sentido amplo, as Bases de Dados são produtos resultantes de dados estruturados (organizados) armazenados em meios específicos. • Uma coleção de registros similares entre si e que contém determinadas relações entre esses registros. • Qualquer coleção de informações agrupadas segundo um interesse comum e mantidas eletronicamente (em computadores. • Fontes de informação automatizada que podem ser pesquisadas de diversos modos.
Aula 04out2007 EVOLUÇÃO • 1951 - Bases de dados numéricos • 1960 - Bases de dados bibliográficos • 1970 - 10 Bases disponíveis (acesso online) • 1986 - Bases em suporte de CD-ROM • 1990 - 3.200 Bases hospedadas • 2000 - Milhões de computadores ligados em rede.
Aula 04out2007 USO CRIAÇÃO/ ALIMENTAÇÃO
Aula 04out2007 USO
Aula 04out2007 CLASSIFICAÇÃO DAS BASES DE DADOS Bases de dados referenciais remetem às fontes primárias Bases de dados de fontes contém os dados originais e textos completos; constituem um tipo de documento eletrônico. REFERENCIAIS • Bibliográficas - Incluem citações bibliográficas acompanhadas ou não dos resumos dos trabalhos publicados. Ex.: LICI/IBICT; MEDLINE; ERIC • Catalográficas - Representam o acervo de uma biblioteca ou de uma rede de bibliotecas, sem indicação do conteúdo dos documentos. Ex.: UNIBIBLI; OPACS (Online Public Access Catalogs) • Diretórios - informações ou dados sobre pessoas, instituições e outros dados característicos de guias e cadastros. Ex.: Plataforma Lattes, Diretório de Grupos de Pesquisa
Aula 04out2007 CLASSIFICAÇÃO DAS BASES DE DADOS Bases de dados referenciais remetem às fontes primárias Bases de dados de fontes contém os dados originais e textos completos; constituem um tipo de documento eletrônico. FONTES Contém os dados originais e textos completos; constituem um tipo de documento eletrônico. • Numéricos - Incluem dados numéricos e estatísticos. Ex.: SIDRA/Fundação IBGE • Texto Completo - contém notícias de jornal, especificações técnicas, artigos de periódicos, dicionários. • Ex.: Portal da pesquisa • Textuais e Numéricos - mistura de dados textuais e numéricos. Ex.: Relatórios Anuais de Empresas. • Gráficos - apresentam fórmulas químicas, imagens, logotipos. Ex.: INPI (marcas comerciais)
Aula 04out2007 TRAJETÓRIA
Aula 04out2007 TRAJETÓRIA
Aula 04out2007 RECUPERAÇÃO DA INFORMAÇÃO EM BASE DE DADOS • Linguagem de busca: controlada, natural, livre • Lógica de busca (booleana): combinação de termos enunciados com operadores: AND, OR, NOT.. • Passos da recuperação: definir os termos; relacionar os termos; mostrar estratégias • Recursos de recuperação: básicos (help, janelas, comandos); seleção de termos de busca (índice de palavras); entrada de termos de busca (vocabulário controlado); combinação de termos; escolha de campos; truncamentos; expressões de proximidade; limitações de amplitude; opções avançadas de exibição (texto completo); busca de múltiplos arquivos; exibição de tesauro; hipertextos (links com outros registros).
Aula 04out2007 É IMPORTANTE PARA UMA BASE.. Não ser redundante, ou seja, possuir o mínimo de duplicidade de dados idênticos, de preferência nenhuma. Essa duplicidade dificulta o mantenimento da consistência de dados e acarreta desperdício de espaço no armazenamento. Ser independente de determinado software, de modo que os dados possam ser transferidos ou reestruturados sem a necessidade de fazer alterações radicais nos programas; Incluir o maior número possível de inter-relações de dados; Possuir um método comum de recuperação, inserção e correção de dados.
Aula 04out2007 CRIAÇÃO/ MANUTENÇÃO
Aula 04out2007 O sucesso das Bases de Dados se deve em parte à adoção de padrões (protocolos)de comunicação e organização de dados em sistemas de gerenciamento de informações. O Z39.50 e SR são normas relativas a recuperação da informação, sendo a primeira um protocolo nacional norte-americano desenvolvido pelo ANSI (American Nacional Standards Institute), enquanto a SR é internacional, oriunda da ISO(International Standards Organisation) por isso também chamada de ISO 10162/3. Ambas são compatíveis, mas a Z39.50 é utilizada com mais freqüência devido à sua maior funcionalidade. Vamos conhecê-la melhor.
Aula 04out2007 Z39.50 • Permite a usuários de diferentes produtos de software se comunicarem entre si e intercambiar dados. • É utilizada em vários sistemas de gerenciamento de bibliotecas (inclusive recomendado pelo MEC) e nos serviços de buscas online oferecidos pelo Mead data Central, Dialog, SilverPlatter.
Aula 04out2007 Z39.50 • Mantido pela Library of Congress que trabalha de forma estreita com o ZIG (Z39.50 Internet Group), grupo de companhias e organizações que usam o protocolo em seus sistemas e aplicações. • Define uma forma de comunicação entre computadores em um ambiente cliente/servidor distribuído com o propósito de recuperação de informações. • Permite que a informação possa ser pesquisada e recuperada independentemente de qual servidor que opera a base de dados, qual o gerenciador de base de dados ou de qual programa de interface do cliente.
Aula 04out2007 Z39.50 • O protocolo apenas descreve como a informação é intercambiada e organizada, deixando o resto com os implementadores; • Envolve um servidor (local onde estão armazenados os registros), uma ou mais bases de dados, e um cliente (a máquina do usuário). • Quando uma conexão é feita entre um cliente e um servidor, são trocadas algumas informações, relacionadas com tamanho de registro, número de versão, e características suportadas pelo sistema. • O servidor não está pronto para receber buscas do cliente. O usuário monta a expressão no formato nativo do programa cliente que a transforma no padrão do Z39.50, antes de enviá-la para o servidor.
Aula 04out2007 Z39.50 • A expressão recebida pelo servidor é processada e o resultado é convertido no padrão Z39.50 antes de ser enviado para o cliente. O cliente mostra na tela o resultado ao usuário que, se desejar ver os registros, indica ao cliente um comando que será enviado ao servidor. • O servidor por sua vez envia as informações ao cliente no padrão definido pelo Z39.50. • Para que serve: • - Possibilitar a criação de sistemas de busca multi-base • - OPACs • - Empréstimo entre Bibliotecas
Aula 04out2007 METADADOS (dados que descrevem dados) Antes havia a dificuldade para organizar e disseminar informações coletadas de diferentes fontes, por isso surgiu o Common Communication Format (CCF). Depois surgiram outros como o do UNISIST proposto pela UNESCO voltado a Informação Científica e Tecnológica. Atualmente os metadados se destacam na compatibilização de sistemas na Web.
Aula 04out2007 METADADOS (dados que descrevem dados) Entre algumas vantagens dos metadados destacam-se: Estabelecimento de padrões de dados diante da heterogeneidade de informações na rede; Facilidade e maior precisão na recuperação das informações desejadas; Troca de informações entre aplicações e entre organizações.
Aula 04out2007 METADADOS (dados que descrevem dados) Vejamos dois formatos bem conhecidos: MARC – Um dos primeiros projetos de intercâmbio bibliográfico, era baseado na AACR e originou outros formatos, todos baseados na ISO 2709. O USMARC, desenvolvido pela Online CCOmputer Library Center’s (OCLC) direcionou-se mais a cooperação de dados via Internet. Dublin Core – Surgiu em 1995 e conta com boa aceitação mundial (inclui o Brasil) e no seu desenvolvimento, baseado no protocolo Z39.50, estabeleceram 15 elementos de descrição para metadados
Aula 04out2007 Formato MARC • Machine Readable Cataloguing Record (registro catalográfico legível por computador) • LCMARC, USMARC, UKMARC, CanMARK • Adota: • ISO2709 para estruturar o arquivo • AACR2R para descrever dados
Aula 04out2007 Formato MARC • Catalogação Cooperativa - união de bibliotecas que visa o aproveitamento dos registros de material bibliográfico para diminuir custos e tempo de processamento por meio da adoção de padrões de registro e intercâmbio de dados.
Aula 04out2007 Catalogação Cooperativa Registro Copiado Registro Copiado RegistroOriginal Registro Copiado Registro Copiado
Aula 04out2007 MARC - Uso • Catalogação Coletiva: • Os catálogos coletivos indicam onde existem exemplares de cada referência nos locais cobertos pelo catálogo. • Referências são transferidas das bases locais para base central.
Aula 04out2007 Catalogação Coletiva Registro Local Produtos Coletivos Registro Local RegistroCentral Registro Local Registro Local
Aula 04out2007 Padrão Dublin-Core • ELEMENTOS DESCRITORES PARA CONTEÚDO • Título • Nome dado ao documento • Palavras-chave • Assuntos de que se trata o documento • Descrição • Resumo do documento • Tipo • Definir categoria como texto, imagem, som,... • Fonte • Documento do qual o presente documento foi derivado • Cobertura • Delimitação espacial ou temporal do recurso
Aula 04out2007 Padrão Dublin-Core • ELEMENTOS DESCRITORES PARA PROPRIEDADE INTELECTUAL • Autor ou Criador • Pessoa ou instituição responsável pela criação do conteúdo intelectual do documento • Publicador • Responsável pela publicação do documento na presente forma • Colaborador • Responsável por parte significativa do conteúdo • Direitos autorais • Definição dos direitos de propriedade sobre o recurso
Aula 04out2007 Padrão Dublin-Core • ELEMENTOS DESCRITORES PARA INSTANCIAÇÃO DO DOCUMENTO • Data • Data no qual o presente recurso se tornou disponível • Identificador • Referência, código ou número que identifica o documento de forma única • Formato • Formato do documento (ex.: doc, pdf,...) • Idioma • Principal idioma do conteúdo do documento • Relação • Documentos relacionados
Aula 01out2007 O que vem depois... OUTUBRO