510 likes | 625 Views
Bibliotecas Digitais. Justificativas. Explosão da informação Tempo para encontrar a informação Sobrecarga de informação (EUA 150Kg papel/estudante/ano + inf. eletrônica. Definição. Uma BIBLIOTECA DIGITAL é um espaço virtual para dar suporte à pesquisa em alguma área de conhecimento.
E N D
Justificativas • Explosão da informação • Tempo para encontrar a informação • Sobrecarga de informação(EUA 150Kg papel/estudante/ano + inf. eletrônica
Definição Uma BIBLIOTECA DIGITAL é um espaço virtual para dar suporte à pesquisa em alguma área de conhecimento
Por Que Bibliotecas Digitais • A biblioteca digital traz a biblioteca para o usuário • A capacidade do computador é usado para pesquisar e mostrar • A informação pode ser compartilhada e copiada • A informação é facilmente atualizada • A informação está sempre disponível • Novas formas de informação tornam-se possível • Menor custo de manutenção
Características Uma BIBLIOTECA DIGITAL é um Sistema de informação com: • suporte a colaboração • preservação e recuperação de documentos digitais (SGBDDig) • suporte a Hipertexto, Hiperdocumentos, Multimídia • filtragem e indexação da informação • Módulos instrucionais • Direitos de propriedade intelectual • Inteface e processamento de consultas • descoberta de recursos • disseminação da informação
Características apresentado OBJETO DIGITAL armazenado disseminado Representada por • livros, monografias • artigos, periódicos • Imagens, etc. • e-mails, programas,.. • papel • papel digitalizado • híbrido • eletrônico puro tipo OBRA meio
Características Pesquisador USUÁRIO editora livraria Bibliotecário
Modelo 5S • Sociedades (pessoas, componentes de HW e de SW) ajudam a satisfazer as necessidades dos usuários(administradores, usuários, relacionamentos entre atores) • Cenários(provêm serviços de informação) serviços, atividades, tarefas, operações (diagramas de sequência UML) • Espaços localizam e apresentam informação de forma adequada = {objetos, operações} (visões lógicas e de apresentação de diversos componentes) • Estruturas organizam informação de forma adequada (grafos dirigidos com labels descrevendo metadados, hipertextos, taxonomias, esquemas XML, RDF) • Streams comunicam informação com usuários e máquinas (estáticos: sequências de bits, caracteres, imagens,.. dinâmicos: fluxo de informação, animação, sicronização)
Z39.50 • MARC/IBICT • DC – Dublin Core FORMATOS de Intercâmbio (Metadados): • PDF, PS • DOC, TXT • HTML, XML, etc. • MP3, MPEG, etc. FORMATOS dos Documentos Indexação catalogação • CDU, CDD, CR • MeSH • LCSH. • semântica X surrogate • ISBN, URL, URN • SICI – Serial Item and Contributor Id. Identificação
Sistema de Biblioteca (Digital) resposta consultas cadastro REFERÊNCIAS Cópias ASSUNTOS indexação DOCUMENTOS sugestões de aquisição USUÁRIOS
Bi Di Global Uma Federação de Bibliotecas Digitais • TECNOLOGIAS • Interfaces • Recuperação Multilíngue • Indexação Multimídia (textos, análise de discursos, músicas, vídeos, imagens, gráficos) • Recuperação da Informação Multimídia • Novas Publicaçoes Eletrônicas • Digitalização • INTEROPERABILIDADE • Técnica (hardware, redes, protocolos) • De Informação (escopo, linguagem, metadados, convenções, semânticas) • Social (direitos e responsabilidades pessoais e de organizações)
Biblioteca Digital Federada BD-1 I N T E R F A C E cadastro resposta consultas indexação BD-n
Digital Libraries Initiative DLI1 (1994-1998) DLI2 (1999-) Coordenação de projetos de: • University of California at Berkeley - informação digital no trabalho - [3.5 TB de dados, Consultas baseadas em imagens, ling. Natural, OCR, OR Postgres • University of California at Santa Barbara- informação espacial em mapas –[Bib. Alexandria, mapas, fotos aéreas, múltiplas resoluções, OR Postgres • Carnegie Mellon University- análise de videos por conteúdo – [200HS de gravações da TV pública, reconh. voz, reconh. rostos humanos, ling. Natural]
Digital Libraries Initiative • University of Illinois - coleções federadas de publicações científicas - [200.000 documentos digitais; Internet, rec. semântica, groupware] • Stanford University (Garcia-Molina)- interoperabilidade –[Pub. Cienc. Computação; protocolos, agentes, interfaces) InterLib • University of Michigan- agentes inteligentes para localização da informação – [Agentes, interfaces, busca distribuida, aprendizagem colaborativa]
EU 6th Framework (2002-2006) €12 billion • genomics and biotechnology for health; • information society technologies; • nanotechnologies and nanosciences; • aeronautics and space; • food safety; • sustainable development; and • economic and social sciences.
EU 6th Framework (2002-2006) advance the techniques for evaluation of networked systems • bibliotecas digitais • sistemas baseados em agentes, • grid computing, e • Web semântica COMBINA:
DL ABS Common Metrics Grid SW EU 6th Framework
EU 6th Framework • Issues of scale and scalability; • Interoperability among heterogeneous sources and systems challenge; • usability of these systems by a broad range of individuals; • information content, computational tools, and user needs. • evaluation standards and measures.
PROJETOS • DIPPO: Federação de dados estatísticos governamentais; • Maeda et.al. Documentos Multiliguais (MHTML viewer) • Klavans&Schäuble NSF_EU Multilingual Information access • Endres&Fuhr MeDoc – Multimedia Electronic Documents. • Gonçalves&Medeiros Disseminação Científica (BD Tropicais+EMBRAPA+GEOLIB. • NCSTRL-Networked Computer Science Technical Reports Library Biblioteca Digital Distrribuída na Europa Central • NEW ZEALAND DIGITAL LIBRARY
PROJETOS • NEW ZEALAND DIGITAL LIBRARY • Múltiplas línguas (Inglês, Francês, Alemão, Arábico, Maori, Português, Swahili) • Múltiplas midias (Local Oral History Collection Interiews and photographs), Musik Library (10 000 folk tunes) • Sistema MG para textos • Sistema MR para músicas
Bibliotecas Digitais Federadas } USP- DEDALUS • Bibliotecas setoriais • Bibliotecas integradas } UNIBIBLI • USP + • Unicamp + • UNESP
EVENTOS NSF Post Digital Library Futures Workshop 15-17 Junho 2003 – Massachusetts (http://www.sis.pitt.edu/%7Edlwkshop/papers.html) • DELOS (Projeto ESPRIT, part of ERCIM DL Initiative) Workshops: • - "Information Seeking, Searching and Querying in Digital Libraries", 11-12 December 2000, Zurich, Switzerland. • - "Personalisation and Recommender Systems in Digital Libraries", 18-20 June 2001, Dublin, Ireland. • "Interoperability and Mediation in Heterogeneous Digital Libraries", 8-9 September 2001, Darmstadt, Germany • Evaluation of Digital Libraries: Testbeds, Measurements, and Metrics 6-7 June 2002 Budapest, Hungary
Topicos de pesquisa • Modelos de objetos • interfaces e interação • descoberta da informação (browsing+IR) • Metadados: catalocação e indexação • Processamento linguagem (multi-)lingual • material não textual (metadados e pesquisa) • armazenamento e gerência de coleções • conversão: físico -> digital • interoperabilidade (interfaces, identificação (URN), • formatos, metadados, pesquisa distrib., • comunicação e transmissão ) • Autenticação e segurança (direitos autorais)
REFERÊNCIAS • E. Fox & G. Marchionini (eds.) Towards a Worldwide Digital Library + diversosArtigos sobre Interoperability, Special types of Digital Libraries; Multilingual Support; National Efforts, Special Issue on DL, CACM 41(4) 1998 • E. Fox Overview of Digital Library Components and Developments • M. Gonçalves, E. Fox et.al. Streams, Strtuctures, Spaces, Scenarios, Societies (5S): A Formal Model for Digital Libraries • W. Arms Digital Libraries, MIT Press, 2000 • N. Adami et. al, ToCAI: a Framework for Indexing and Retrieval of Multimedia Documents • E. Bertino, A. Elmagarmid & Hacid Quality of Services in Multimidia Digital Libraries, ACM SIGMOD Record 30(1), 2001 • L. Feng, M. Jeusfeld & J. Hoppenbrowers Towards Knowledge Based Digital Libraries, ACM SIGMOD Record 30(1):41-46, 2001 • IEEE Computer – Special Issue on Digital Libraries, February 1999 • Franciska de Jong & Thijs Westerveld MUMIS: multimedia indexing and searching EU Founded project • Alfredo Sánchez Bibliotecas Digitales: Introducción, ENC,1997
SISTEMAS • DIALOG Corporation • Cobre mais de 500 bancos de dados. Recupera informações bibliográficas e textos integrais • LEXIS-NEXIS • banco de dados de textos integrais sobre assuntos jurídicos e de negócios • OCLC (Online Computer Library Center) • 70 bancos de dados com 1,5 milhões de textos integrais • H.W.Wilson • 40 bancos de dados com informação colegial (versões eletrônicas, CD-ROM e Web dos dados)
SISTEMAS • DIALOG Corporation • Alguns bancos de dados: • Chemical abstracts (20 milhões, + 11.000/semana); • MEDLINE (12 milhões + 7.700/semana); • NYT full text desde 1981; • Psych. Abstracts (2 milhões + 5000/mês);..
Cada sistema tem sua linguagem • Tentativas de standard: • CCL (Common Command Language) • NISO Z39.58 • ISO 8777 SISTEMAS • Tipos de pesquisas comuns: • Termo simples • Frases • Combinações Booleanas • Proximidades (‘A’ adjacente/perto-de ‘B’) • Colocações (‘A’ no título ou no resumo, etc.) • Caminhar por relações entre termos (no thesaurus) • funções de BDs específicos (p.ex. químico) • Consultas são iterativas • Pesquisas cross-databases
Acesso a bibliotecas – Ficha catalográfica Autoria Título da tese inicia-se abaixo da 4º letra do sobrenome Imprenta Subtítulo Sobrenome do autor, Nome Título da tese: subtítulo / Nome completo do autor. - - Rio de Janeiro: UFRJ / Nome ou sigla da Unidade, ano. x, 90 f. : il. ; 31 cm. Orientador: Nome Tese (doutorado) – Universidade Federal do Rio de Janeiro, Nome ou sigla da Unidade, Nome do Programa de Pós-graduação, ano. 1. Assunto. 2. Área de concentração – Tese. I. Sobrenome do orientador, Nome. II. Universidade Federal do Rio de Janeiro, Nome da Unidade, Nome do Programa de Pós-graduação. III.Título. Descrição Física Notas Pista Assunto(s) Tamanho: 12,5 cm x 7,5 cm
Acesso a bibliotecas – Ficha catalográfica • Pastura, Patrícia Souza Valle Cardoso • Infecção suspeita em crianças com neoplasia hematológica e neutropenia / Patrícia Souza Valle Cardoso Pastura. -- Rio de Janeiro: UFRJ / Faculdade de Medicina, 2003. • xi, 110 f. : il. ; 31 cm. • Orientadores: Guilherme Santoro Lopes e Marcelo Gerardin • Poirot Land • Dissertação (mestrado) – UFRJ / Faculdade de Medicina / DIP, • 2003. • Referências bibliográficas: f. 88-104 • 1. Neutropenia. 2. Neoplasias hematológicas. 3. Leucemia linfocítica aguda L1. 4. Infecção. 5. Febre. 6. Criança. 7. Prognóstico. 8. Estudos prospectivos. 9. Doenças Infecciosas e Parasitárias - Tese. I. Lopes, Guilherme Santoro. II. Land, Marcelo Gerardin Poirot. III.Universidade Federal do Rio de Janeiro, Faculdade de Medicina, DIP. IV. Título.
Acesso a bibliotecas – Ficha BibTex • @Book{abramowitz+stegun, • author = "Milton Abramowitz and Irene A. Stegun", • title = "Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables", • publisher = "Dover", • year = 1964, address = "New York", • edition = "ninth Dover printing, tenth GPO printing" • __________________________________________________________________________ • @proceeding{646491, • editor = {Alberto H. F. Laender and Arlindo L. Oliveira}, • title = {SPIRE 2002: Proceedings of the 9th International Symposium on String Processing and Information Retrieval}, • year = {2002}, • isbn = {3-540-44158-1}, • publisher = {Springer-Verlag}, • address = {London, UK}, }
Acesso a bibliotecas – Ficha MARC Autoria:Setzer, Valdemar Waingort, 1940- Título:Curso de Fortran IV, básico. Imprenta:São Paulo, E. Blucher, Ed. da U.S.P. [1972] Descrição física:102 p. il. Notas:Registro Pré-MARCAssuntos:Fortran (Linguagem de programação)Programação, Linguagens de.Autorias secundárias:Simon, Imre, 1943- Kowaltowski, Tomasz, 1942-Classificação Decimal de Dewey:651.8 LDR005840000000002170004500 0012003083004544984914 003Br 00520030830045449.8 035__ |a 155489 082__ |a 651.8 092__ |a II-1,7,11 100__ |a Setzer, Valdemar Waingort, 1940- 245__ |a Curso de Fortran IV, básico. 260__ |a São Paulo, E. Blucher, Ed. da U.S.P. [1972] 300__ |a 102 p. il. 590__ |a Registro Pré-MARC 650__ |a Fortran (Linguagem de programação) 650__ |a Programação, Linguagens de. 700__ |a Simon, Imre, 1943- 700__ |a Kowaltowski, Tomasz, 1942- 856__ |a 142703
Acesso a bibliotecas – Ficha MARC 00001017cam a22002654a 450 00113216768 00520031008121527.0 008030529s2004 maua b 001 0 eng 906__ |a 7 |b cbc |c orignew |d 1 |e ocip |f 20 |g y-gencatlg 9250_ |a acquire |b 2 shelf copies |x policy default 955__ |a pc21 2003-05-29 to ASCD |c jf05 2003-06-02 to subj.; |d jf04 2003-06-02 to S.L. |e jf12 2003-06-02 to Dewey |a aa05 2003-06-03 |a ps07 2003-08-21 1 copy rec’d., to CIP ver. |a jf00 2003-08-28 |f jf05 2003-10-08 to sl |e jf12 2003-10-08 to BCCD 010__ |a 2003052442 020__ |a 0321197844 040__ |a DLC |c DLC |d DLC 042__ |a pcc 05000 |a QA76.9.D3 |b D3659 2003 08200 |a 005.74 |2 21 1001_ |a Date, C. J. 24513 |a An introduction to database systems / |c C.J. Date. 24630 |a Database systems 250__ |a 8th ed. 260__ |a Boston : |b Pearson/Addison Wesley, |c 2004. 300__ |a xxvii, 983, 22 p. : |b ill. ; |c 24 cm. 504__ |a Includes bibliographical references and index. 650_0 |a Database management.
Acesso a bibliotecas – Registro MARC 01099cam 2200289 a 4500001000800000005001700008008004100025035002100066906004500087955012800132010001700260020001500277040001800292050002600310082001500336100001600351245005400367250001200421260005500433300003600488440004600524504005100570650002500621920004100646991005200687991007000739‑3012967‑20010731111512.0‑940201s1995 maua b 001 0 eng ‑ 9(DLC) 94003187‑ a7bcbccorignewd1eocipf19gy-gencatlg‑ apc03 to ja00 02-01-94; jf06 to subj 02-02-94; jf11 to sl 02-02-94; jf12 02-02-94; recd. je00 2Sept94; CIP ver je25 09-19-94‑ a 94003187 ‑ a020154329X‑ aDLCcDLCdDLC‑00aQA76.9.D3bD3659 1995‑00a005.74220‑1 aDate, C. J.‑13aAn introduction to database systems /cC.J. Date.‑ a6th ed.‑ aReading, Mass. :bAddison-Wesley Pub. Co.,cc1995.‑ axxiii, 839 p. :bill. ;c24 cm.‑ 0aAddison-Wesley systems programming series‑ aIncludes bibliographical references and index.‑ 0aDatabase management.‑ a** LC HAS REQ'D # OF SHELF COPIES **‑ bc-GenCollhQA76.9.D3iD3659 1995tCopy 1wBOOKS‑ bc-GenCollhQA76.9.D3iD3659 1995p00023608856tCopy 2v54329wCCF‑
Acesso a bibliotecas : DC – Dublin Core <rdf:Description rdf:about="http://www.ieee.org"> <dc:title>Proceedings of the 13th International Workshop on Research Issues on Data Engineering: Multi-lingual Information Management-RIDE-MLIM</dc:title> <dc:creator> CROFT W. Bruce </dc:creator> <dc:creator> SANGAL Rajeev </dc:creator> <dc:subject>Workshop</dc:subject> <dc:subject>Management</dc:subject> <dc:subject>Multilingual</dc:subject> <dc:publisher>IEEE</dc:publisher> <dc:date>2003</dc:date> <dc:type>Proceedings</dc:type> <dc:format> <dc:medium>text</dc:medium> <dc:extent pages>420</dc:extent pages> </dc:format> <dc:source>IEEE Computer Society</dc:source> <dc:identifier>ISBN 0-7803-7868-7</dc:identifier> </rdf:Description>
Acesso a bibliotecas - Catálogos • Fichas de papel, • Livros catalográficos, microfilmes, microfichas • On-Line (gerações de Hildreth): • pesquisa por autor, título, Palavras-chave • Visualização simples, detalhada e diálogos personalizados • Assistência na pesquisa; texto livre ou com vocabulário controlado; cross-database; correção de erros sensível aocontexto
Acesso a bibliotecas – Catálogos on-line OPAC-Online Public Acess Catalog • PROBLEMAS: • Interface amigável para catálogos MARC ou assuntos LCSH. • Consequências: • retorno vazio ou retorno excessivo.Estudo MELVYL: 82% de retornos vazios, 25% dos retornos não continham a informação procurada • Borgman’86: “porque catálogos on-line são difíceis de serem usados?” • Borgman’96: “porque catálogos on-line ainda são difíceis de serem usados?”
Acesso a bibliotecas – Catálogos on-line OPAC-Online Public Acess Catalog • SISTEMAS: • Comerciais: Voyager (EIS); INNOPAC; EOSi; OrtoDocs; Aleph • Acadêmicos: • MARIAN (Virginia Tech).(http://www.dlib.vt.edu/products/marian.html) • Okapi (City University-London) • Biblioteca Nacional (http://www.bn.br/site/default.htm) • MINIBLIO (http://buchada.dsc.ufcg.edu.br/miniblio/) • Biblioteca Nacional da Alemanha (Deutsche Nationalbibliothek) (http://dispatch.opac.ddb.de/DB=4.1/SET=1/TTL=8/START_WELCOME) • Biblioteca do Congresso (Library of Congress) (http://catalog.loc.gov/) • USP-DEDALUS (http://dedalus.usp.br:4500/ALEPH/por/USP/USP/DEDALUS/START) • UNIBIBLI (USP+UNESP+UNICAMP) (http://bibliotecas-cruesp.usp.br/scripts/odwp502k.dll?t=dfb&pr=cruesp_profile&db=cruesp_catalogo&sm=b&sort=on)
Bibliotecas Digitais • TIPOS DE DOCUMENTOS • Documentos Multilínguescrescimento de documentos não-inglês • Documentos Multimídia(streams sincronizados) • Documentos estruturados(streams estruturados) • Coleções distribuídas
Bibliotecas Digitais Distribuidas Sistema BioKleisli Publications = [title: string, authors; {[name string, initial string]}, journal: <uncontrolled: string, controlled <medline-jta: string, %Medline journal title abbreviation isso-jta: string, %ISO journal title abbreviation journal-title: string, %Full journal title issn: string>> %ISSN number volume string, issue string, year int, pages string, abstract string, keywd: {string}]}
Sistema BioKleisli CPL – Collection Programming Language {[title = p.title, authors = p.authors] \p <- DB, p=“Date, C.”} seleciona título e autor do banco de dados DB
Sistema BioKleisli – BDs Fonte • SGBD: • Sybase; ASN.1-Entrez, ACeDB e OPM • comunidade de archival nucleic acid (GenBank, EMBL, DDBJ e GSDB) • Genome Database (GDB) de Sybase para OPM • BLAST Software de comparação entre sequências de proteinas com um BD de sequêncais