200 likes | 304 Views
Comparação entre diferentes tecnologias em banco de dados para manipulação rápida e ubíqua de dados biológicos. Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação Faculdade Fabrai-Anhanguera. Objetivo.
E N D
Comparação entre diferentes tecnologias em banco de dados para manipulação rápida e ubíqua de dados biológicos Kátia de Paiva Lopes Orientador: Sandro Renato DiasDepartamento de Sistemas de Informação Faculdade Fabrai-Anhanguera
Objetivo • Apresentar uma comparação entre duas diferentes ferramentas para manipulação de dados biológicos, com intuito de facilitar o trabalho dos profissionais de Bioinformática, que por ser uma área multidisciplinar, acolhe profissionais de diferentes formações.
Introdução • Banco de dados (RANMEZ, SHAMKAT, 2006) • repositório computacional • acesso • Recuperação • Bancos de dados biológicos • DNA, • sequências de aminoácidos, • nucleotídeos, • proteínas
Introdução • PDB (Protein Data Bank): • armazena dados biológicos, • flat files • Data Mining • "o cruzamento de vários bancos de dados e a descoberta de conexões impossíveis de se descobrir por outro método.” (EIRAS, 2009).
Introdução • Sistemas de Gerenciamento de Banco de Dados (SGBD’s) • Oracle • MySQL • DB2 • MS SQLServer
Materiais e métodos • Nesse trabalho, para objeto de comparação, foram utilizadas duas diferentes ferramentas: • SGBD MySQL (www.mysql.com) • gratuito, • diferentes sistemas operacionais, • amplamente conhecido e utilizado. • FusionTables(BATERMAN, 2009). • Google (fusiontables.googlelabs.com) • Simplificação das operações de acesso aos dados, • Cloud Computing (Computação nas nuvens)
Materiais e Métodos • O mesmo banco de dados foi criado utilizando as ferramentas Mysql e FusionTables, a partir das tabelas de Dias & Nagem (2009). • Foi criada a mesma estrutura em ambos, e, para geração dos gráficos com o uso do SGBD MySQL foi criada uma aplicação com uso da linguagem PHP.
Fig. 1 – Parte do código da aplicação em PHP. Fig. 2 – Tela inicial da aplicação em PHP.
Em seguida, foram gerados os gráficos a partir da mesma consulta nas duas aplicações: • Fig. 4 – Arquivos PDB por método de resolução da proteína, desconsiderando os métodos: Solution NMR e X-RayDifraction.
Fig. 5 – Número de arquivos PDB por valor de resolução da estrutura. Valores considerados, definidos entre 0.0 e 3.0 (ilegíveis na imagem). • Fig. 6 – Arquivos PDB por identificação do método de resolução da estrutura da proteína.
Resultados e Discussões • FusionTables
Resultados e Discussões • FusionTables
Resultados e Discussão • MySQL
Resultados e Discussão • MySQL
Resultados e Discussão • MySQL x FusionTables, do ponto de vista da usabilidade:
Conclusão • FusionTables é uma boa opção para armazenamento de dados biológicos, porque: • não exige conhecimentos em alguma linguagem específica, • manipulação dos dados é feita através da interface gráfica, • faz uso de Cloud Computing, • interpreta os dados e gera gráficos automaticamente. • MySQL, embora apresente robustez para trabalhar com grande quantidade de dados, requer o uso de SQL, e para gerar gráficos, por exemplo, é necessário que seja utilizada uma aplicação, exigindo assim: • configuração de servidor web, • conhecimentos sobre parametrização de gráficos, • conhecimentos em Linguagem de Programação caso haja necessidade de criação de uma aplicação.
Referências BATERMAN, A., WOOD,M. Cloud Computing. Oxford Journals. 2009,1. DIAS, S. R. ; Nagem, R. A. P. Residue-residue interaction database: use in the modification of proteins. In: International Network of Protein Engineering Centers, 2009, Ubatuba/SP. International Network of Protein Engineering Centers Meeting Abstract Book, 2009. L. Eiras. O amigo do Estado. Revista Fonte - Prodemge, 142, 2009. RANMEZ, E., SHAMKANT B.N. Introdução a Banco de Dados – Sistemas de Banco de Dados . São Paulo, 2006. 28 slides: color. Acompanha texto.
Agradecimentos • Faculdade Fabrai - Anhanguera