1 / 63

BASES DE DADOS DE ESTRUTURAS DE PROTEÍNAS E OUTRAS BIOMOLÉCULAS

CURSO DE VERÃO EM BIOINFORMÁTICA ESTRUTURAL. BASES DE DADOS DE ESTRUTURAS DE PROTEÍNAS E OUTRAS BIOMOLÉCULAS. Raquel C. de Melo Minardi raquelcm@dcc.ufmg.br. Motivação. Cientistas determinaram a estrutura de milhares de componentes biomoleculares das células

qamar
Download Presentation

BASES DE DADOS DE ESTRUTURAS DE PROTEÍNAS E OUTRAS BIOMOLÉCULAS

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. CURSO DE VERÃO EM BIOINFORMÁTICA ESTRUTURAL BASES DE DADOS DE ESTRUTURAS DE PROTEÍNAS E OUTRAS BIOMOLÉCULAS Raquel C. de MeloMinardi raquelcm@dcc.ufmg.br

  2. Motivação Cientistasdeterminaram a estrutura de milhares de componentesbiomoleculares das células Entendimentodabiologiacelularemnívelatômico Estruturaslevam a respostas a inúmerasquestõesbiológicas, assimcomopermitemaoscientistas a colocação de inúmeras novas questões Raquel C. de Melo Minardi 2/63

  3. Motivação Raquel C. de Melo Minardi 3/63

  4. Estruturas disponíveis livremente É comumencontrar no PDB milhares de estruturas de proteases de HIV com drogas anti-HIV Cientistasusamestruturascomoestaparacompreenderação dos medicamentosexistentes e paraprojetarnovos e maispoderososmedicamentosparalutar contra a resistência. Arquivos de coordenadas de proteínas a ácidosnucleicosestãodisponíveis on-line: robossomos, oncogenes, alvosterapêuticos e atémesmovíruscompletos Desenvolvimento de fármacos: o conhecimentodaestrutura de proteínaspermite o projeto de pequenasmoléculasque se liguem a elas e possam, porexemplo, bloquearsuafunção Raquel C. de Melo Minardi 4/63

  5. Estruturas disponíveis livremente Raquel C. de Melo Minardi 5/63

  6. Estruturas disponíveis livremente Umapequenamutaçãofaz com quehemoglobinas se agreguememlongascadeiasquedistorcem as hemáceas e causamseverosproblemascirculatórios Revelação de detalhesdavida:estruturas de oxi e desoxi-hemoglobinasrevelamcomoocorre o controleparaligação do oxigênio Raquel C. de Melo Minardi 6/63

  7. Estruturas disponíveis livremente Engenhariabiomolecular e bionanotecnologia: Pesquisadoresvisammodificarbiomoléculasparaqueadquiram novas funçõesoumesmoprojetarmoléculasinteiramente novas Raquel C. de Melo Minardi 7/63

  8. PDB Possibilta a exploração das bases atômicasdafunção molecular É um repositório de coordenadasatômicas e anotaçõesdetalhadassobreosdetalhesexperimentais Desafios: Obter o conjunto de moléculas de interesse Utilizar / desenvolvermodelos, algoritmos e ferramentasquepossibilitemobter as propriedades de interesse Raquel C. de Melo Minardi 8/63

  9. PDB: Busca Hámuitasferramentasdisponíveisparabusca no PDB baseadasemdiversaspropriedadescomoporexemplonomes de moléculas e sequências de aminoácidos Háaindadiversasreferênciascruzadas com outras bases como Gene Ontology, SCOP, CATH, EC numbers, etc Háainda a possibilidade de se acessaresterepositório via FTP wget -r ftp://ftp.wwpdb.org/pub/pdb/data/structures/all/pdb/* -nd -nv Raquel C. de Melo Minardi 9/63

  10. PDB: Visualização O PDB utilizacomumente o plug-in do Jmol (desenvolvidoem Java) Háinúmerasoutraspossibilidades de ferramentas de visualização de estruturas no formato PDB comoRasmol e PyMol, porexemplo Infelizmente, cadaferramentautiliza um conjunto de comandosextremamenteespecífico Raquel C. de Melo Minardi 10/63

  11. PDB: Visualização Rasmol Programaleve Simplicidade de aprendizado PyMol Imagens de altaqualidade Raquel C. de Melo Minardi 11/63

  12. PDB: Visualização Jmol Pode ser embutidoempáginas web Raquel C. de Melo Minardi 12/63

  13. Dados do PDB Os arquivos PDB sãoarquivostexto, podendo ser abertosemqualquer editor de textoscomo notepad, vi, etc. Informaçãoprimária: coordenadas (x, y, z), ou seja, lista de átomos que compõem uma proteína e suas localizações no espaço tridimensional Um PDB típicotraz um resumosobre a proteína, informaçõessobrecitações, detalhes dos experimentos de resoluçãoseguido das coordenadas Outrosformatos: mmCIF e XML Raquel C. de Melo Minardi 13/63

  14. Coordenadas Um arquivo PDB podecontercoordenadas de umacoleção de proteínas, pequenasmoléculas, íons e água As informações de cadaátomosãodescritasemumalinhaquecomeça com as palavras-chave “ATOM” ou “HETATM” “ATOM” identificaátomos de proteínas e ácidosnucléicos “HETATM” identificaátomos de pequenasmoléculas Apósestapalavra, chaveháumalista de informações: nome do átomo, seuidentificador no arquivo, nome e número do resíduo de aminoácidosaoqualpertence, umaletraindicandosuacadeia, coordenadas x, y, z e a suaocupância e fator de temperatura Raquel C. de Melo Minardi 14/63

  15. Coordenadas Raquel C. de Melo Minardi 15/63

  16. Cadeias e modelos Um arquivo PDB é sempredivididoemcadeias Cadacadeiapolipeptídicarecebe um identificador de umaletra No caso de experimentos de RNM, ele é divididoemmúltiplosmodelosrepresentandopossíveisconformaçõespara a molécula Raquel C. de Melo Minardi 16/63

  17. Resolução A resolução é umamedidadaqualidade do dado coletado do cristalcontendo a proteína Se todas as proteínasestiveremalinhadas de forma perfeita no cristal, obtem-se informaçõesbastanteprecisassobre a localização dos átomos Casocontrário, se houver, porexemplo, movimentações no interior do cristal, o padrão de difraçãonãoserátãoconfiável Raquel C. de Melo Minardi 17/63

  18. Resolução Raquel C. de Melo Minardi 18/63

  19. Fator de temperatura Se fossemoscapazes de visualizar a nuvemeletrônica de um átomorigidamentefixo, elaseriadensa das proximidades do núcleo e cairia com o aumentodadistância Quandoolhamospara as densidadesexperimentais, provenientes de experimentos de difração de raios-X, pequenasvibraçõesnasposições dos átomosdistorcem um pouco a nuvemquesomoscapazes de visualizar EstasdistorçõessãocaptadasproporcionalmentepeloB-valueoufator de temperatura B-value < 10, modelobastantepreciso B-value > 50, átomosquasenãopodem ser localizados Raquel C. de Melo Minardi 19/63

  20. Fator de temperatura Raquel C. de Melo Minardi 20/63

  21. Ocupância Cristaismacromolecularessãocompostos de muitasmoléculasindividuaisempacotadasem um arranjosimétrico Emalgunscristais, podemhaverdiferenças entre estasmoléculas Umacadeia lateral nasuperfíciepodeestaremdiferentesorientaçõesnosdiferentescristais, um ligantepode se ligaremdiferentesorientaçõesem um sítioativo, um íonpodeestarpresenteemapenasalgumasmoléculas A ocupância é umamedida de cadaconformaçãopresente no cristal De modogeral, a ocupância é 1 para a maioria dos átomosindicandoqueelesestãonamesmaposiçãoemtodas as moléculas Ocupânciasvariam de 0 a 1 Raquel C. de Melo Minardi 21/63

  22. Ocupância Raquel C. de Melo Minardi 22/63

  23. Ocupância Raquel C. de Melo Minardi 23/63

  24. Por que o PDB não é completo? Devido a algumaslimitações das técnicas de resolução, algumaspartesdaproteínapodemestarfaltandocomo: Loops Porções N e/ou C-terminais Hidrogênios Raquel C. de Melo Minardi 24/63

  25. Loops ausentes Esta protease resolvidasemligante e pordifração de raios-X apresentadois loops ausentesdevido a altaflexibilidade A mesma protease resolvida com inibidores, nãoapresentaesteproblemavistoqueos loops apresentamumaconformaçãomaisestávelnestecaso Como a resolução de estruturaspordifração de raios-X é baseadanaposição dos átomosnasdiversasmoléculaspresentes no cristal, posiçõesmuitomóveispodemnãoapresentar um padrãoclaro de difração Raquel C. de Melo Minardi 25/63

  26. Hidrogênios A grandemaioria dos experimentos de difração de raios-X não resolve as posições dos hidrogênios. Estaspodem ser inferidasporprogramasposteriormente Jáosexperimentos de RNM baseam-se em um conjunto de distâncias entre hidrogêniosapresentando as coordenadasparataisátomos Raquel C. de Melo Minardi 26/63

  27. Sequências Cadaarquivo PDB possuiregistroschamados SEQRES quecontém a sequênciaprimária de resíduos de aminoácidosquecompõem a molécula Raquel C. de Melo Minardi 27/63

  28. Sequências É precisotercuidadoaousar a sequênciaproveniente de SEQRES: nemsempreelacorresponde à sequênciadescritanaseção de coordenadas Terminais das cadeias e loops muitomóveisnormalmentenãosãoobtidosnosexperimentos e não tem as coordenadasdescritas no arquivo PDB mesmoestandopresente no experimento e descrita no SEQRES Alémdisto, é comumtrabalharapenas com fragmentos das moléculasentãonormalmenteapenastrechosdamoléculatêmsuascoordenadasdepositadas O número dos aminoácidospodeassumirqualquer valor (negativo, 0, positivo) Raquel C. de Melo Minardi 28/63

  29. Coordenadas atômicas Raquel C. de Melo Minardi 29/63

  30. Seção de coordenadas Raquel C. de Melo Minardi 30/63

  31. Formato PDB http://www.wwpdb.org/documentation/format32/v3.2.html Raquel C. de Melo Minardi 31/63

  32. PDBest PDBest – PDB Enhanced Structures Toolkit D. Pires , C. Silveira, M. Santoro e W. MeiraJúnior. Conjunto de scripts perlque: Separaarquivos PDB emcadeias Separaosarquivos de Difração de Raios-X e RNM Separaemdiferentesmodelos Separaligantes Renumeraosresíduos das cadeias Retiraátomos de hidrogênio Selecionaportipoounome de átomo, nome do resíduo, cadeia, ocupância, intervalor de átomos e resíduos, estruturassecundárias. Raquel C. de Melo Minardi 32/63

  33. PDBest ATOMTYPE = ,ALL, CHAIN = ,ALL, OCCUP = ,ALL, ATOMRANGE = ,ALL, RESRANGE = ,ALL, ATOMNAME = ,NOT-H*, RESNAME = ,ALL, SECONDSTR = ,ALL,    INCREMENTINDEX = ,ALL,`` Raquel C. de Melo Minardi 33/63

  34. Referências cruzadas Raquel C. de Melo Minardi 34/63

  35. Referências cruzadas Raquel C. de Melo Minardi 35/63

  36. SCOP Classificaçãohierárquica de domínios de proteínassegundorelacionamentosevolucionários e estruturais Construídoessencialmenteporinspeção visual Possuiosseguintesníveis: Classe:conjunto de domínioscujacomposiçãoemtermos de estruturassecundárias é a mesma. Ex.: alfa, beta, alfa+beta, alfa/beta,… Fold:conjunto de proteínas das quais o arranjo das estruturassecundárias e suas inter-conexõessãoosmesmos Super-família:proteínas com baixasimilaridadesequencialmascujasestruturas e característicasfuncionaissugeremrelacionamentoesevolucionários Família:conjunto de proteínasquecompartilhampelomenos 30% de identidade de sequênciaouque, apesardabaixasimilaridade de sequência, têmaltaconservaçãoestrutural e funcional Raquel C. de Melo Minardi 36/63

  37. SCOP http://scop.mrc-lmb.cam.ac.uk/scop/ Raquel C. de Melo Minardi 37/63

  38. Pfam http://pfam.sanger.ac.uk/ Raquel C. de Melo Minardi 38/63

  39. Pfam http://pfam.sanger.ac.uk/ Raquel C. de Melo Minardi 39/63

  40. Pfam http://pfam.sanger.ac.uk/ Raquel C. de Melo Minardi 40/63

  41. Pfam http://pfam.sanger.ac.uk/ Raquel C. de Melo Minardi 41/63

  42. STING Sequence To and withINGraphics http://www.cbi.cnptia.embrapa.br/SMS Raquel C. de Melo Minardi 42/63

  43. STING Sequence To and withINGraphics http://www.cbi.cnptia.embrapa.br/SMS Raquel C. de Melo Minardi 43/63

  44. Raquel C. de Melo Minardi 44/63

  45. PDB Ligand Explorer http://www.pdb.org/pdb/Viewers/RCSBViewers/view.jsp?hetId=HEM&viewerType=LX&structureId=1A6M&structIdFromStrutsAction=1A6M Raquel C. de Melo Minardi 45/63

  46. PDB Ligand Expo http://ligand-expo.rcsb.org Raquel C. de Melo Minardi 46/63

  47. PDB Ligand Expo Raquel C. de Melo Minardi 47/63

  48. PubChem http://pubchem.ncbi.nlm.nih.gov/ Raquel C. de Melo Minardi 48/63

  49. PubChem http://pubchem.ncbi.nlm.nih.gov/ Raquel C. de Melo Minardi 49/63

  50. Formatos de moléculas Qual a modelagemmais natural para um cientistadacomputação? Raquel C. de Melo Minardi 50/63

More Related