1 / 31

Projeto species Link

Projeto species Link. Objetivos originais e resultados alcançados . Objetivo (Fase 1) – Concepção 1999. resolver o problema da integração dos dados históricos contidos nas coleções biológicas, tornando-os amplamente disponíveis para a comunidade científica e educacional.

evaline
Download Presentation

Projeto species Link

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Projeto speciesLink Objetivos originais e resultados alcançados

  2. Objetivo (Fase 1) – Concepção 1999 • resolver o problema da integração dos dados históricos contidos nas coleções biológicas, tornando-os amplamente disponíveis para a comunidade científica e educacional. • desenvolver aplicativos que façam uso dos dados integrados, visando criar ferramentas acessíveis a um público mais amplo.

  3. Objetivos principais • Implementar uma rede distribuída de informação sobre biodiversidade para o Estado de São Paulo, explorando as novas tecnologias e melhor conectividade (Internet 2) para a integração de bases de dados heterogêneas e independentes. As bases de dados a serem integradas incluirão 12 coleções biológicas do Estado de São Paulo, a rede Species Analyst e o SinBiota; • A proposta previa a repatriação de dados de subcoleções específicas fora do estado de São Paulo (no Brasil e no exterior)

  4. Objetivos principais • (2) Integrar ferramentas de modelagem de nicho ecológico e de previsão de distribuição geográfica de espécies ao sistema, utilizando dados da rede distribuída descrita no item (1)

  5. Objetivos principais • (3) Desenvolver aplicativos que façam uso dos dados integrados na rede de informação distribuída descrita no item (1) e dos modelos matemáticos de distribuição no item (2) para dar suporte à comunidade científica, educacional, tomadores de decisão e formuladores de políticas ambientais.

  6. Requisitos esperados da rede • Disponibilidade: a rede deve estar disponível, em funcionamento sempre; • Tolerância a falhas: a rede deve ser capaz de operar quando alguns nós não estiverem funcionando; • Desempenho e Robustez: a rede deve ser capaz de processar e responder em um tempo razoável um grande número de solicitações simultâneas; • Descoberta de novos nós: a rede deve ter mecanismos automáticos ou manuais para inclusão de novos nós; • Independência de plataforma: o software deve operar em ambientes computacionais heterogêneos; e, • Escalabilidade: a rede deve ter capacidade para aumentar o número de nós, sem que seja necessário desenvolver novos componentes de software.

  7. Estratégia adotada • software: livre e/ou de código aberto • hardware: intel based • protocolo de comunicação: participar do desenvolvimento do DiGIR • modelo de dados: adotar e participar da discussão do modelo DarwinCore • sistema on-line de acesso livre e aberto • autonomia plena às coleções com relação à escolha do software de gerenciamento e à disponibilização dos dados (entrada, correção, saída e controle de dados sensíveis feitos pela coleção)

  8. Estratégia Coleções: • Pressuposto Inicial: cada coleção dispunha de um software de gerenciamento e o papel do CRIA seria o de entender o sistema e, com a mínima interferência possível, conectá-lo à rede. • Constatação: a grande maioria das coleções não tinha sistema de gerenciamento implementado e nem equipe de apoio para dar suporte a esse trabalho. • Resultado: foi necessário oferecer suporte com relação à escolha do software de gerenciamento do acervo e serviços como importação dos dados, configuração do computador, etc.

  9. Estratégia repatriação de dados • A proposta original previa a implementação de bolsas para a digitalização de acervos no exterior, de interesse do país. • No entanto as grandes coleções no exterior passaram a digitalizar e disponibilizar seus dados na Internet • Optamos por investir mais no desenvolvimento de tecnologia de integração de dados ao invés de "trazer" esses dados para um servidor central. • Deu-se prioridade a bolsas para auxiliar as coleções na digitalização de seus acervos

  10. Modelagem • desenvolvimento do GARP (Genetic Algorithm for Rule-set Production)em colaboração com a Universidade de Kansas • vinda do Town Peterson e Arthur Chapman • produção de alguns trabalhos colaborativos • Com a experiência adquirida durante o projeto a equipe do CRIA concluiu que para tornar a ferramenta de modelagem mais útil e principalmente mais acessível aos pesquisadores, seria necessário o desenvolvimento de um ambiente que automatizasse partes do processo - openModeller

  11. Resultado Fase 1

  12. Proposta para a Fase 2 • Ampliação da rede para 33 coleções biológicas do Estado de São Paulo. • revisão do esquema de metadados do portal DiGIR; • desenvolvimento de ferramentas para o monitoramento da rede; • desenvolvimento de interface para visualização geoespacial dos resultados; • desenvolvimento de ferramentas de apoio à limpeza e correção de dados; e, • disponibilização on-line de dicionários de nomes e bancos de dados de localidade e coletores. • Nota: o desenvolvimento de um ambiente computacional para modelagem não foi aprovado

  13. Padronização • ferramentas de data cleaning • trabalho com coletores (botânica) • houve uma breve discussão sobre padronização de nomes de estados na lista

  14. Resultados • Monitoramento • Data Cleaning • Perfil das Coleções • Informação on-line

  15. Resultados

  16. Respostas ao questionário - Ácaros • Software: Biota (1), Excel (1), Excel-Biota (1) • Plano digitalização: • (1) espécimes já identificados (2) organismos em estudo (pós) na conclusão dos trabalhos • 1o. Organização em fichários • 1o. Material já organizado • Sugestões: • associação parasito – hospedeiro • treinamento biota

  17. Respostas ao questionário - Aranhas • Software: Excel (1) • Plano digitalização: • Não, tendência organização dos lotes por família • Sugestões: • erros na digitação por falta de treinamento, sem uma noção da estrutura de dados = erros (p.ex. falta de padronização dos nomes das localidades) • Bolsista é bom mas o ideal é a existência de um técnico no quadro funcional

  18. Respostas ao questionário - Entomológica • Software: Access, Excel • Plano digitalização: • Não, sim • Problema apontado: • não existe na universidade a função de curador • Sugestões: • ferramenta para gerenciar referências bibliográficas • ferramenta que permitisse pesquisar organismos relacionados a determinadas espécies • ferramentas de distribuição temporal dos espécimes • elaboração de um manual explicando passo-a-passo como configurar o programa que filtra • Estudar junto à Fapesp a possibilidade da criação de bolsas para digitação de acervos para dar continuidade aos trabalhos

  19. Respostas ao questionário - Abelhas • Software: Excel-Access • Plano digitalização: • sim: esquema inicial dos campos,vinculação das tabelas, relacionamento dos campos • Sugestões: • CRIA tivesse uma participação mais efetiva na escolha do software • Elaboração de um programa ‘único’ pelo CRIA • minicurso pré início digitação • Maior flexibilidade para inclusão de novos campos

  20. Respostas ao questionário – Mamíferos, aves, ... • Software: Biota, Access • Plano digitalização: • inclusão seguindo a ordem crescente da numeração • criação de 2 bancos de dados (roedores, aves), definição de prioridades por ‘grupo’ (roedores, peles taxidermizadas, ... • Sugestões: • treinamento Access • extensão do prazo para a digitalização do acervo • cursos temas relacionados ao CRIA e coleções para crescimento profissional dos bolsistas • treinamento bolsistas software de gerenciamento

  21. Respostas ao questionário - Peixes • Software: Biota • Plano digitalização: • sim: plano geral elaborado em 2000 auxílio pesquisa Fapesp • Sugestões: • treinamento prévio do bolsista na rotina da coleção (responsabilidade da coleção)

  22. Respostas ao questionário – Anfíbios e Répteis • Software: Access, Excel-Biota • Plano digitalização: • digitalização do acervo já tombado, correção e refinamento, tombamento de outra coleção, digitalização, ... • reorganização da coleção, substituição de etiquetas apagadas, conferência dos livros de registro, inserção de novos exemplares, digitação, disponibilização no speciesLink • Sugestões: • CRIA poderia contribuir mais com a escolha do software • desenvolvimento de um banco de dados brasileiro, em português • trabalhar mais para aprimorar o gazetteer • Falta visibilidade ao projeto (comunidade científica e sociedade) • ferramenta que organize os dados em gráficos (no. de exemplares e táxons, listas de espécies por tipo de habitat) • Treinamento programa Biota

  23. Respostas ao questionário - Herbários • Software: Excel-Brahms (2), Excel, Brahms • Plano digitalização: • (1) digitalização campos mínimos; (2) imagens digitais de cada espécime; (3) digitação de todos os campos • Banco em dbase para Excel, padronização formato e campos, inclusão de novos campos (coordenadas geográficas) • Digitalização por famílias • Digitalização seguindo a ordem alfabética por famílias com verificação de “ruídos”. Durante o processo a planilha foi simplificada. Os dados serão completados em uma segunda etapa. • Sugestões: • continuar com o suporte CRIA via extensão do projeto ou realização de outro projeto • Ampliar a divulgação da rede speciesLink • Mais treinamento no uso do software de gerenciamento (Brahms) • Ter listas de referência (atualização de nomes e autores de espécies) • Desenvolver outros layers no speciesMapper (hidrografia, vegetação, ...) • Na busca ‘grupo taxonômico’ não está claro – exemplos explicativos poderiam auxiliar o usuário. Gênero é um grupo taxonômico mas tem que ser buscado em nome científico... • Incluir um sistema de ‘help’ e exemplos nas ferramentas

  24. Respostas ao questionário - Herbários • Software: proprietário • Plano digitalização: • Prioridade a materiais recém incluídos e daqueles solicitados para empréstimo (informatização antes de sair do acervo) • Sugestões: • treinamento: uso das ferramentas speciesLink, programa de gerenciamento das coleções, divulgação das experiências na implantação de experiências de informatização com modelos de construção de planilhas, programas para inserção de dados, etc. • ferramenta infoxy: problema de precisão das bases (país, estado, município) • Enriquecer o geoLoc com informações sobre a localização dos rios, serras e outros acidentes geográficos • Treinamento ferramentas speciesLink (openModeller) • Previsão de mais equipamentos de informática para as coleções em projetos futuros

  25. Respostas ao questionário – Herbários, Algas • Software: proprietário, Brahms (2), Lantana-Brahms, Access • Plano digitalização: • contratação de empresa de digitação • escolha de famílias com boa confiabilidade na identificação das espécies • designação de um funcionário para digitação junto com alunos e bolsistas para assegurar uma continuidade mínima • Sugestões: • elaboração de um manual • à Fapesp: a bolsa deveria ser concedida ao orientador ou coordenador e não ao candidato – cada substituição é um processo novo • Treinamento Brahms • Seria importante contar com pessoas fixas e não bolsistas • Problema da bolsa TT onde o tempo é descontado caso o aluno faça pós • O CRIA não deveria ‘esquivar’ do papel de sugerir o melhor software a ser utilizado • Curso software de gerenciamento

  26. Respostas ao questionário - xilotecas • Software: Excel • Plano digitalização: • sim • Problema: • IPT: os projetos que não trazem receita não estão sendo priorizados por causa da necessidade de cumprir metas de desempenho financeiro • Sugestões: • treinamento Brahms

  27. Respostas ao questionário - microrganismos • Software: Excel, proprietário • Plano digitalização: • digitalização de acordo com o número de entrada do microrganismo • Sugestões: • treinamento nas ferramentas speciesLink

  28. Uso de ferramentas • 24 coleções responderam o questionário • 11 não responderam • data cleaning: 20 • speciesMapper: 15 • geoLoc: 13 • spOutlier: 13 • Conversor: 10 • openModeller:0 • Banco de coletores e infoxy: 1 resposta espontânea (não foi incluída nas opções)

More Related