110 likes | 192 Views
XML Schema do Harvest. João Lima. OAI-PMH - Nodos. Fluxo de Informações. PD. AD. PS. Mod. Relacional. Lucene (Solr XTF). Resolver. Search. Resolver. Nodos PD e AD. Registro_Item Log / Erro 1 XML Profile Provedor de Dados Publicador. Nodo PS. Registro – Header - Id. <header>
E N D
XML Schema do Harvest João Lima
Fluxo de Informações PD AD PS Mod. Relacional Lucene (Solr XTF) Resolver Search Resolver
Nodos PD e AD • Registro_Item • Log / Erro • 1 XML • Profile • Provedor de Dados • Publicador
Registro – Header - Id <header> <identifier>oai:ssinf.senado.gov.br:njur/102415</identifier> <datestamp>2008-07-08-10:20:20:002221</datestamp> </header> "oai:" [ orgao .] domínio ":" sistema "/" identificador interno [ ";" detalhe ]
Metadado (LexML) • Cada registro contém • 1 URL (Item) • 1 URN (Documento Individual) • Epigrafe • Apelido • Ementa • Relacionamentos (URNs) • Caso um Item possua o conteúdo de mais de um Documento Individual, deve ser gerado um novo registro.
Coleta de Metadado (Norma) <LexML> <Item formato=“text/html”> http://www6.senado.gov.br/legislacao/ListaPublicacoes.action?id=102415 </Item> <DocumentoIndividual> urn:lex:br:federal:lei:1990-09-11;8080@1990-09-12!1990-09-12~texto;pt-BR </DocumentoIndividual> <Epigrafe>Lei nº 8.080, de 11 de setembro de 1990</Epigrafe> <Apelido>Código de Defesa do Consumidor</Apelido> <Apelido>Código de Proteção e Defesa do Consumidor</Apelido> <Ementa>Dispõe sobre a proteção do consumidor e dá outras providências</Ementa> <Relacionamento tipo=“publicacao.oficial”> urn:lex:br:imprensa.nacional:publicacao.oficial;diario.oficial.uniao;secao.1:1990-09-12;145:pag1 </Relacionamento> </LexML>
application/mpeg4-generic application/mp4 application/msword application/ogg application/pdf application/postscript application/rtf application/sgml application/xhtml+xml application/xml application/zip audio/ac3 audio/mp4 audio/mpeg audio/mpeg4-generic audio/ogg image/gif image/png image/jpeg image/tiff image/bmp text/plain text/html text/xml text/sgml text/rtf Crítica do Mimetype
Relacionamentos • publicacao.oficial • sucessor.logico.de • Permite criar o rastreamento entre diferentes documentos complexos • ex.: recurso entre tribunais • equivalente.a • O atribuidor do segundo identificador de um mesmo documento complexo cria a relação com o identificador existente. • ex.: Projeto de lei na CD e SF
Coleta de Metadado (Pub. Oficial) <LexML> <Item formato=“application/pdf” paginas=“149”> http://www.in.gov.br/imprensa/jsp/jsp/jornaiscompletos/visualizacao/pdf/visualiza_pdf.jsp?jornal=do&secao=1&pagina=$pag&data=10/01/2007 </Item> <DocumentoIndividual> urn:lex:br:imprensa.nacional:publicacao.oficial;diario.oficial.uniao;secao.1:2007-01-10;231 </DocumentoIndividual> </LexML>