460 likes | 544 Views
UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA MESTRADO EM CIÊNCIA DA COMPUTAÇÃO. Model agem, Avaliação, Modificação e Seleção de Estruturas de Proteínas. Projeto de Pós-Graduação. Aluno Erico Souza Teixeira | Orientadora Katia Silva Guimarães. PROTEÍNAS. Conceitos.
E N D
UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA MESTRADO EM CIÊNCIA DA COMPUTAÇÃO Modelagem, Avaliação, Modificação e Seleção de Estruturas de Proteínas Projeto de Pós-Graduação Aluno Erico Souza Teixeira | Orientadora Katia Silva Guimarães
Conceitos Citosina | Guanina Adenina | Timina
Área de Desenvolvimento • BioInformática • Química Computacional • Modelagem Molecular • Descoberta das estruturas 3D
O Problema • Construção de um modelo 3D de uma proteína a partir da seqüência primária
O Problema • >gi|532319|pir|TVFV2E|TVFV2E envelope proteinELRLRYCAPAGFALLKCNDADYDGFKTNCSNVSVVHCTNLMNTTVTTGLLLNGSYSENRTQIWQKHRTSNDSALILLNKHYNLTVTCKRPGNKTVLPVTIMAGLVFHSQKYNLRLRQAWCHFPSNWKGAWKEVKEEIVNLPKERYRGTNDPKRIFFQRQWGDPETANLWFNCHGEFFYCKMDWFLNYLNNLTVDADHNECKNTSGTKSGNKRAPGPCVQRTYVACHIRSVIIWLETISKKTYAPPREGHLECTSTVTGMTVELNYIPKNRTNVTLSPQIESIWAAELDRYKLVEITPIGFAPTEVRRYTGGHERQKRVPFVXXXXXXXXXXXXXXXXXXXXXXVQSQHLLAGILQQQKNLLAAVEAQQQMLKLTIWGVK • ATOM 145 N VAL A 25 32.433 16.336 57.540 1.00 11.92 A1 N • ATOM 146 CA VAL A 25 31.132 16.439 58.160 1.00 11.85 A1 C • ATOM 147 C VAL A 25 30.447 15.105 58.363 1.00 12.34 A1 C • ATOM 148 O VAL A 25 29.520 15.059 59.174 1.00 15.65 A1 O • ATOM 149 CB AVAL A 25 30.385 17.437 57.230 0.28 13.88 A1 C • ATOM 150 CB BVAL A 25 30.166 17.399 57.373 0.72 15.41 A1 C • ATOM 151 CG1AVAL A 25 28.870 17.401 57.336 0.28 12.64 A1 C • ATOM 152 CG1BVAL A 25 30.805 18.788 57.449 0.72 15.11 A1 C • ATOM 153 CG2AVAL A 25 30.835 18.826 57.661 0.28 13.58 A1 C • ATOM 154 CG2BVAL A 25 29.909 16.996 55.922 0.72 13.25 A1 C
O Problema • Importância • Funcionalidade de uma proteína está relacionada com sua estrutura 3D • Desenvolvimento de novos medicamentos • Descobrir estruturas de outras proteínas • Situação atual • 1/6 das seqüências tem estrutura conhecida • Swiss-Prot (155576)X PDB (26403 )
Atacando o problema • Métodos experimentais • Estático • cristalografia de raios-X • Dinâmico • técnicas de ressonância nuclear magnética
Atacando o problema • Aplicações teóricas • métodos físicos • ab initio • métodos empíricos • threading • homologia
Homologia fim avaliação do modelo busca e seleção dos templates alinhamento alvo-template construção do modelo
Atacando o problema • Precisões Experimentais (o.3 - o.5Å ) Empíricos (1.oÅ ) Físicos (3.5Å )
Atacando o problema • Dificuldades • Experimentais • Tempo • Equipamentos e laboratórios especializados • Teóricos • Manuseio com diversos programas (entrada/saída, interfaces) • Precisão
Melhorando a Precisão • Avaliadores • Indicam possíveis regiões problemáticas • Metodologia baseada em conhecimento prévio • Interações não covalentes entre os átomos de C-O-N Freqüências de interações: janela e uma distância • Propriedades estereoquímicas (ângulos e distância de ligação, Ramanchandran Plot, ângulos diedros das cadeias laterais, ...) Morris et al. (1992) e Engh & Huber (1991) • Interações entre os átomos Cálculo de Energia potencial
Melhorando a Precisão • Criando Novas Conformações • Modelos de uma seqüência polipeptídica próximos da estrutura nativa • Coordenadas Cartesianas dos Cα • estágios iniciais da difração de raios-X • seqüências do PDB • Analítica • Baseado em conhecimento • Minimização de energia • Ângulos de torção Φ (phi), ψ (psi) • Construir a geometria ideal da proteínas
Seleção dos Modelos • Métodos • Campos de força • Equações de potenciais de energia • Termos não-ligados (interações de Lennard-Jones e Coulomb ) • Ligados (distância das ligações, ângulos de ligação, ângulos diedros) • Restrições de posição e de distância • Baseados em conhecimento • Ou potenciais estatísticos • Função de pontuação
O Projeto • Definição • eliminação defeitos presentes nas estruturas de proteínas originadas da modelagem por homologia • Construir, avaliar, modificar e selecionas as melhores conformações
Estrutura primária da proteína Estrutura terciária da proteína Modelagem Seleção das regiões defeituosas Avaliação da estrutura Modelo final Construção das conformações Novos modelos O Projeto
Modelagem • MODELLER • Interface da Accelrys • Nenhum estudo de automatização do processo
Avaliadores • 3 tipos de avaliadores • Estereoquímicas • Energia potencial • Propriedades não presentes no processo de modelagem • Não há um projeto de relacionamento
Criando novas conformações • Analítico • 2-3 resíduos • RAPPER e PETRA • Ab initio • FREAD • Baseado em conhecimento prévio • 3-8 resíduos • CODA • Combinação entre o FREAD e PETRA • Não há aplicação em “mundo real”
Seleção de estruturas • Comparação entre • Campos de Força (CHARMM) • Potenciais estatísticos • RMSD Cα • Choque de energia das cadeias laterais • Problemas • Seleção empírica • Sob modelos originados de processos experimentais
Ferramentas Aplicadas • Modelagem • MODELLER • Projeto na graduação • Mais conhecida • Bom material teórico
Ferramentas Aplicadas • Avaliadores • PROCHECK • ANoLEA • ProSa • PROVE
Ferramentas Aplicadas • Criação das conformações • Ab initio • Ângulos de torção Φ (phi), ψ (psi) • Seleção das Conformações • TINKER • Campo OPLSAA
Linguagens de Programação • Perl • Saídas das ferramentas apresentavam um formato ASCII • Projetos em iniciação científica • Java • Orientada o objeto • Não dominava a linguagem C++
CODIGO=<"CODIGO"> MODELLER=<on/off> SEQUENCIA=<"SEQUENCIA"> TEMPLATES= INICIO= FIM= NOME= ORIGEM= SEARCH=<no/yes/only> AVALIADOR3D=<on/off> PDB=default ANOLEA=1 PROCHECK=1 PROSA=1 PROVE=1 WINDOW=5 CONFORMACOES=<on/off> PDB=default ANOLEA=0 PROCHECK=0 PROSA=0 PROVE=0 WINDOW=5 AUTOMATIC=yes/no O Projeto
Modelagem • Search • Tabela de seqüências similares
Modelagem • Download dos arquivos PDB • Alinhamento entre as estruturas e a seqüência alvo • Construção da Árvore de Distância
Modelagem • Construção de 5 modelos • Seleção pela menor energia
Avaliadores • Escolha dos pesos para cada uma das ferramenta • Execução • Cálculo da região de maior pontuação
Sai do algoritmo sim não Retira uma conformação da fila Há 1000 conformações noconjunto final? Conformação recusada Após 25 tentativas Insere o próximo resíduo Insere a nova e a antiga conformação na fila não Tem o tamanho da região – 1? sim Houve choques Aproximação entre o dummy e a penúltima âncora Insere a nova conformação no conjunto final e a antiga na fila Não houve choques Insere a última âncora Construção das estruturas
Seleção da melhor conformação • Construção das cadeias laterais • Validação dos choques • Cálculo da energia sem minimização • Escolha das 50 com menor energia • Cálculo do campo de força com minimização • Seleção daquela que apresenta a menor energia
Modelagem • Construção de interface que permita • Alterar os alinhamentos • Visualizar agrupamentos das seqüências similares • Função de pontuação para a seleção automática ou classificação dos templates
Avaliadores • Clustering da informação • Associar os tipos usados como modelos de cada ferramenta com os templates da homologia • Determinar uma função de pontuação de acordo com as famílias de proteínas
Construção de conformações • Inserir parcelas de campos de força como filtro de construção • Aplicação de análises originados de estruturas representativas do PDB • Ab initio + conhecimento prévio
Seleção das conformações • Aplicação de outros campos de força de acordo com a famílias dos templates
Docking • Aplicação dos campos de força • Busca dos sítios ativos
UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA MESTRADO EM CIÊNCIA DA COMPUTAÇÃO Modelagem, Avaliação, Modificação e Seleção de Estruturas de Proteínas Projeto de Pós-Graduação Obrigado !!!
UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO Análise de um Modelador de Estrutura de Proteínas e seus Componentes Trabalho de Graduação em Teoria da Computação Obrigado !!!