530 likes | 619 Views
O Ciclo de Tratamento Informático das Histórias de Vida: da recolha à disponiblização a experiência do Núcleo Português do MP. Pedro Rangel Henriques Jorge Gustavo Rocha Universidade do Minho Braga - Portugal. Motivação.
E N D
O Ciclo de Tratamento Informático das Histórias de Vida: da recolha à disponiblizaçãoa experiência do Núcleo Português do MP Pedro Rangel Henriques Jorge Gustavo Rocha Universidade do Minho Braga - Portugal "Memória, Rede, Mudança Social" / SP, Brasil
Motivação Para transformar um conjunto de Histórias de Vida num Museu Virtual,acessível pela Internet,onde o acervo possa ser explorado interactivamente nas suas múltiplas vertentes É necessário : • Proceder à anotação (estruturação) dos documentosusando uma notação normalizada • Analisar o problema: Identificar os Requisitos; Sistematizar o Processo de Transformação dos documentos • Desenvolver as Ferramentas adaptadas à Anotação escolhida "Memória, Rede, Mudança Social" / SP, Brasil
Objectivo da Comunicação À luz da experiência do NPMP, Propor uma abordagem Ciclo de Vida dos documentos, Sistema de Anotação (para representação dos doc.s) Conjunto de Ferramentas para criar automaticamente e manter um acervo dinâmico que possa ser explorado, com eficácia, em diferentes perspectivas e com fins diversos, satisfazendo um conjunto vasto de requisitos "Memória, Rede, Mudança Social" / SP, Brasil
Plano da Comunicação • Enquadramento / Contexto de trabalho • Histórias de Vida: caracterização • Museu da Pessoa: o conceito • O Núcleo Português do MP • Requisitos Funcionais dum Museu Virtual • Ciclo de Vida dos Documentos (HV) • Anotação das HV em XML • Ferramentas de Suporte "Memória, Rede, Mudança Social" / SP, Brasil
Caracterização do contexto de trabalhoHistória de Vida As Histórias de Vida são vistas como documentos que contêm depoimentos, na 1ª ou 3ª pessoa, de Contadores de Histórias; ao reportarem as suas vidas, os Narradoresevocam eventos exteriores e outros temas sócio-culturais. "Memória, Rede, Mudança Social" / SP, Brasil
Caracterização do contexto de trabalhoHistória de Vida Assim, em cada história, para além doperfil pessoal, háumconjunto de representaçõesque a pessoa faz do meio e época em causa, que podem servir para identificação de algumas problemáticas e reconstrução de um universo social e como tal tem de ser destacadas "Memória, Rede, Mudança Social" / SP, Brasil
Caracterização do contexto de trabalhoMuseu da Pessoa - A ideia base A partir do registo de depoimentos em audio ou vídeo criar um espaço virtual que congregue um infindável número de histórias de vida para disponibilizar informações na Internet; produzir Bases de Dados, CD-ROM’s, Publicações em papel e Documentários em vídeo.. "Memória, Rede, Mudança Social" / SP, Brasil
Caracterização do contexto de trabalhoMuseu da Pessoa - A ideia base Assim um Museu da Pessoa é: MP = Projs + Thesaurus + Gloss + etc. Projs = conj( Projecto ) Projecto = Sinopse + Projs + HVs + Anexos HV = FichId + MBio + Historia + Anexos Historia = conj( Episodio ) "Memória, Rede, Mudança Social" / SP, Brasil
NPMP: Núcleo Português do Museu da Pessoa - constituição O Núcleo Português do Museu da Pessoa (NPMP): • envolve um grupo de docentes do Departamento de Informática da Universidade do Minho (onde está sediado) • conta com a colaboração de docentes do Departamento de Comunicação Social "Memória, Rede, Mudança Social" / SP, Brasil
NPMP: Núcleo Português do Museu da Pessoa - actividades Além de se empenhar em solidificar e alargar a sua actividade base (cerca de 5 proj’s) com novos projectos e iniciativas (EV,etc.) , juntou-se ao Museu da Pessoa Brasileiro para formar uma rede de núcleos, o Instituto Museu_da_Pessoa.Net "Memória, Rede, Mudança Social" / SP, Brasil
NPMP: Núcleo Português do Museu da Pessoa - princípios Assente num sólido conjunto de convicções e objectivos, o NPMP traçou os seguintes princípios de trabalho e linhas de acção: • tornar o acervo o mais acessível possível: Internet, CD-ROMs, livros, etc.; • criar vários mecanismos eficientes que facilitem a captação e registo de novas histórias; • definir e usar formatos comuns (adoptando normas internacionais), de modo a facilitar intercâmbio de histórias e de ferramentas; • manter, a nível dos formatos e das ferramentas, independência de plataformas e de aplicações; • ……… "Memória, Rede, Mudança Social" / SP, Brasil
NPMP: Núcleo Português do Museu da Pessoa - princípios ...... • construir e partilhar ferramentas que facilitem o trabalho; • construir estruturas classificativas comuns; • manter o maior número possível de ligações entre documentos, para que a riqueza exploratória seja máxima. "Memória, Rede, Mudança Social" / SP, Brasil
Plano da Comunicação • Enquadramento / Contexto de trabalho • Requisitos Funcionais dum Museu Virtual • Ciclo de Vida dos Documentos (HV) • Anotação das HV em XML • Ferramentas de Suporte "Memória, Rede, Mudança Social" / SP, Brasil
Requisitos Funcionais dum Museu Virtual(Tradicionais) • Captação / Aquisição do acervo, • Arquivo • Classificação / Catalogação • Armazenamento e Conservação • Exibição / Divulgação • Pesquisa (elementar) e Navegação por percursos (limitada) "Memória, Rede, Mudança Social" / SP, Brasil
Requisitos Funcionais dum Museu Virtual(Próprias – nível da Divulgação) • Disponível 24h/dia, 8dias/semana • Possível em suporte digital • Na Internet (usando Browsers WWW) • CD-ROM • Documentário Vídeo • Outros formatos • Possível em suporte papel • Livros • Almanaques • Calendários • Outros formatos "Memória, Rede, Mudança Social" / SP, Brasil
Requisitos Funcionais dum Museu Virtual(Próprias – nível Exploração na Internet) • pesquisa por termos • navegação seguindo links, ou conceitos • enriquecimento dinâmico do acervo: • inserção de comentários diversos nas HV • inserção de histórias em linha • reconfiguração automática do museu (geral ou personalizada): • ranking de HV (orig. nos leitores) • outras estratégias (orig. nos conservadores) eventual/. baseadas no historial das visitas "Memória, Rede, Mudança Social" / SP, Brasil
Requisitos Funcionais duma Rede de Museus • Mapeamento de conceitos, via Thesaurus multi-língua • Procuras Distribuídas • Partilha automática da Informação sobre os Leitores registados • Mecanismos de Reunião/Síntese de Informação "Memória, Rede, Mudança Social" / SP, Brasil
Plano da Comunicação • Contexto de trabalho • Requisitos Funcionais dum Museu Virtual • Ciclo de Vida dos Documentos: tratamento das HV • Anotação das HV em XML • Ferramentas de Suporte "Memória, Rede, Mudança Social" / SP, Brasil
Ciclo de Vida dos Documentos (tratamento das HV) Cada Depoimento (Documento Multimedia) passa, depois de recolhido, por uma série de etapas de tratamento/transformação, até se tornar num texto classificado, resumido, cronologicamente referenciado e devidamente ligado a outros textos e materiais com ele relacionados "Memória, Rede, Mudança Social" / SP, Brasil
Ciclo de Vida dos Documentos (tratamento das HV) Fases do processamento das Histórias de Vida: F1) Captação F2) Tratamento F3) Divulgação "Memória, Rede, Mudança Social" / SP, Brasil
Ciclo de Vida dos Documentos (tratamento das HV) F1) Captação 1.1 Criação da Ficha de Identificação da HV (meta-informação) 1.2 Registo do depoimento a) Gravação vídeo b)Gravação áudio c) Digitação directa "Memória, Rede, Mudança Social" / SP, Brasil
Ciclo de Vida dos Documentos (tratamento das HV) F2) Tratamento do Depoimento 2.1 Tratamento da História 2.2 Tratamento do Som 2.3 Tratamento dos Fotos e Doc.’s 2.4 Tratamento do Vídeo "Memória, Rede, Mudança Social" / SP, Brasil
Ciclo de Vida dos Documentos (tratamento das HV) F2.1) Tratamento da História 2.1.1 Transcrição 2.1.2 Revisão do texto transcrito 2.1.3 Edição, Anotação e Classificação 2.1.4 Redacção da Mini-biografia 2.1.5 Indexação da História+MBio anotada "Memória, Rede, Mudança Social" / SP, Brasil
Ciclo de Vida dos Documentos (tratamento das HV) F2.2) Tratamento do Som 2.2.1 Conversão para MP3 2.2.2 Marcação (opc.) 2.2.3 Indexação "Memória, Rede, Mudança Social" / SP, Brasil
Ciclo de Vida dos Documentos (tratamento das HV) F2.3) Tratamento das Fotos e anexos 2.4.1 Digitalização (JPEG ou outro) 2.4.2 Limpeza e processamento de Imagem 2.4.3 Legendagem legenda e meta-informação para Catalogação 2.4.4 Indexação "Memória, Rede, Mudança Social" / SP, Brasil
Ciclo de Vida dos Documentos (tratamento das HV) F2.4) Tratamento do Vídeo 2.4.1 Digitalização/Conversão (AVI ou outro) 2.4.2 Marcação (opc.) 2.4.3 Indexação "Memória, Rede, Mudança Social" / SP, Brasil
Ciclo de Vida dos Documentos (tratamento das HV) Arquivo resultante: • Ficha de Identificação da HV (XML) • História de Vida original • História de Vida editada (XML) • Mini-Biografia (XML) • Fotos e Anexos (JPEG + XML) • Som indexado (MP3 + XML) • Vídeo (AVI + XML) "Memória, Rede, Mudança Social" / SP, Brasil
Ciclo de Vida dos Documentos (tratamento das HV) F3) Divulgação 3.1 Publicação em HTML (site www na Internet) 3.2 Publicação em PostScript / PDF Livro de cada HV Livro do Projecto Almanaques, Calendários, etc. 3.3 Publicação em CD-ROM ………. "Memória, Rede, Mudança Social" / SP, Brasil
Plano da Comunicação • Contexto de trabalho • Requisitos Funcionais dum Museu Virtual • Ciclo de Vida dos Documentos (HV) • Anotação das HV em XML • Anotação • Potencialidades • Edição e Validação • Processamento • Ferramentas de Suporte "Memória, Rede, Mudança Social" / SP, Brasil
Anotação das HV em XMLAnotação (conceito) Anotar é “acrescentar” um texto com palavras especiais, as marcas, que: • Definem a sua estrutura (delimitam blocos lógicos) • Dão informação quanto à formatação • Fornecem dados quanto à interpretação Um texto amorfo ganha estrutura podendo ser trabalhado sistematicamente "Memória, Rede, Mudança Social" / SP, Brasil
Anotação das HV em XMLAnotação (conceito) Anotar um texto, para o transformar num documento, implica : • Decidir as classes de marcas a incluir • Definir a estratégia de anotação • Escolher as marcas "Memória, Rede, Mudança Social" / SP, Brasil
Anotação das HV em XMLAnotação (potencialidades) fica-se com uma base documental com os documentos originais independentes de plataforma ou ferramenta disponíveis para formatação (visualização/impressão) pesquisa e criação de índices análises linguísticas e sócio-culturais diversas (ortografia, estilos, análises de assinaturas, etc.) ... "Memória, Rede, Mudança Social" / SP, Brasil
Anotação das HV em XMLAnotação(a linguagem XML) A meta-linguagem XML é um standard para criar Linguagens de Anotação específicas para cada situação (família de documentos): • Estabelece o critério de abertura/fecho de marcas e a forma de aninhamento • Diz como se podem definir novas marcas (os elementos) e seus atributos As definições são expressas através de um DTD ou de um XML-Schema "Memória, Rede, Mudança Social" / SP, Brasil
Anotação das HV em XMLAnotação(a linguagem XML) A Anotação dos Depoimentos requer a criação de um novo dialecto de XML específico para essa família de documentos: o “MP.dtd” que permita anotar as Histórias, as Mini-Biografias, as Fichas de Identificação e vários Catálogos "Memória, Rede, Mudança Social" / SP, Brasil
Anotação das HV em XMLAnotação(a linguagem XML) Para Anotar os Depoimentos foi necessário escolher: • Etiquetas estruturais (Projecto, História, Episódio, FichaId, Foto, etc.) • De meta-informação (entrevistador, entrevistado, data e local da entrevista, etc.) • Interpretativas (nomes, datas, locais, etc.) "Memória, Rede, Mudança Social" / SP, Brasil
Anotação das HV em XMLExemplo 1 (estrutura+meta-info) <bi> <projecto>Memórias do Trabalho</projecto> <depoente>José Vieira</depoente> <biografia>José Vieira nasceu em 1920 em Resende…</biografia> <profissao>lavrador; feitor; jardineiro</profissao> <nascimento local=“Resende” ano=“1920” mes=“10” dia= /> </bi> "Memória, Rede, Mudança Social" / SP, Brasil
Anotação das HV em XMLExemplo 2 (estrutura) <hv> <titulo>José Vieira: de lavrador a jardineiro no Porto</titulo> …………… <ascendencia> <p>Meu pai era José Bonifácio… Minha mãe, Emilia da Silva…</p> </ascendencia> ……………… </hv> "Memória, Rede, Mudança Social" / SP, Brasil
Anotação das HV em XMLExemplo 3 (estrutura+meta-info) <fotos> <foto ficheiro=“004-F-07.jpg”> <onde>Ribeira</onde> <quando>1950</quando> <quem>Ao lado esquerdo, Francisco Lopes… </quem> <facto>As cheias do rio Douro que …</facto> </foto> …………… "Memória, Rede, Mudança Social" / SP, Brasil
Anotação das HV em XMLExemplo 4 (interpretação) Ele foi preso pela <ref tipo = “Instituição”>PIDE</ref> …no tempo da <expressao tipo=“designação cautelosa usada para referir a pide”>outra senhora</expressao> O famoso <ref tipo=“Personalidade”>Cardeal Cerejeira</ref> "Memória, Rede, Mudança Social" / SP, Brasil
Anotação das HV em XMLEdiçãoe Validação Edição – identificação dos Elementos (inserção das “marcas” abertura/fecho) e adição dos Atributos/valores aos elementos (em função do contexto) Fase: • Anotação posterior à introdução do texto • Anotação durante a escrita do texto Ajuda: • Sem declaração do DTD • Com Conhecimento do DTD Validação – verificação da anotação face às regras gerais de XML e do DTD específico "Memória, Rede, Mudança Social" / SP, Brasil
Anotação das HV em XMLEdiçãoe Validação Características desejáveis para um Editor: • Associação fácil do DTD/XML-Schema ao novo documento • Escrita ágil do novo texto base, ou fácil abertura dum existente • Indicação dos Elementos/Atributos que se podem escolher em cada momento • Indicação dos Valores possíveis para cada Atributo • Integração dum Parser (com validação automática ou explícita) "Memória, Rede, Mudança Social" / SP, Brasil
Anotação das HV em XMLProcessamento Uma vez que a Anotação é estática (não produz qq. resultado) O processamento visa transformar o documento anotado: • Formatar para publicação (PS, PDF, HTML, etc.) • Mudar formato • Pesquisar • Extrair informação Existem já disponíveis muitas e boas ferramentas para processar XML "Memória, Rede, Mudança Social" / SP, Brasil
Anotação das HV em XMLProcessamento As ferramentas para processar baseiam-se em Sistemas de Regras de Transformação da forma Padrão Acção em que o padrão se expressa em termos dos Elementos/Atributos XML "Memória, Rede, Mudança Social" / SP, Brasil
Plano da Comunicação • Contexto de trabalho • Requisitos Funcionais dum Museu Virtual • Ciclo de Vida dos Documentos (HV) • Anotação das HV em XML • Ferramentas de Suporte "Memória, Rede, Mudança Social" / SP, Brasil
Ferramentas de Suporte Cada uma das fases do Ciclo de Vida dos Depoimentos tem de ser suportada por ferramentas informáticas que agilizem a sua execução. Essas ferramentas, de domínio público ou desenvolvidas especificamente, devem tirar partido do facto das HV estarem anotadas em XML "Memória, Rede, Mudança Social" / SP, Brasil
Ferramentas de Suporte Ferramentas usadas no NPMP: • Escriba: editor equipado com comandos para auxiliar a transcrição • XML-Spy: editor de XML para fazer a anotação e edição • MP2HTML (DAG): processador que constrói o site www a partir do Arquivo • MP2Book (SmallBook): processador que produz os mini-livros de HV’s a partir do Arquivo "Memória, Rede, Mudança Social" / SP, Brasil
Ferramentas de Suporte Outras ferramentas usadas no NPMP: • Gerador de índices; • MPMiner: analisador de texto com extracção de datas, locais, nomes próprios e outros; • Library::simple: ferramenta de pesquisa para suporte a bibliotecas digitais; • Conversores de formatos: vários, open-source "Memória, Rede, Mudança Social" / SP, Brasil
Conclusão No contexto da Exploração dos Depoimentos (HV) com vista à construção dum Museu Virtual sobre a Internet (integrável numa Rede de Museus), Propôs-se: • o uso de uma linguagem específica XML para armazenamento integral dos documentos • a sistematização do ciclo de tratamento dos documentos visando aumentar a automatização da transformação e as potencialidades de exploração "Memória, Rede, Mudança Social" / SP, Brasil
Evoluçãoa nível tecnológico Reconhecer a Internet como espaço privilegiado para enriquecimento: uso do Wiki como suporte ao novo site Incrementar a automatização do acesso ao acervo: uso de WebServices e Topic-Maps "Memória, Rede, Mudança Social" / SP, Brasil
Evoluçãoa nível de funcionalidades Concluir a implementação • de alguns requisitos singulares • dos requisitos de rede "Memória, Rede, Mudança Social" / SP, Brasil