630 likes | 767 Views
CURSO DE VERÃO EM BIOINFORMÁTICA ESTRUTURAL. BASES DE DADOS DE ESTRUTURAS DE PROTEÍNAS E OUTRAS BIOMOLÉCULAS. Raquel C. de Melo Minardi raquelcm@dcc.ufmg.br. Motivação. Cientistas determinaram a estrutura de milhares de componentes biomoleculares das células
E N D
CURSO DE VERÃO EM BIOINFORMÁTICA ESTRUTURAL BASES DE DADOS DE ESTRUTURAS DE PROTEÍNAS E OUTRAS BIOMOLÉCULAS Raquel C. de MeloMinardi raquelcm@dcc.ufmg.br
Motivação Cientistasdeterminaram a estrutura de milhares de componentesbiomoleculares das células Entendimentodabiologiacelularemnívelatômico Estruturaslevam a respostas a inúmerasquestõesbiológicas, assimcomopermitemaoscientistas a colocação de inúmeras novas questões Raquel C. de Melo Minardi 2/63
Motivação Raquel C. de Melo Minardi 3/63
Estruturas disponíveis livremente É comumencontrar no PDB milhares de estruturas de proteases de HIV com drogas anti-HIV Cientistasusamestruturascomoestaparacompreenderação dos medicamentosexistentes e paraprojetarnovos e maispoderososmedicamentosparalutar contra a resistência. Arquivos de coordenadas de proteínas a ácidosnucleicosestãodisponíveis on-line: robossomos, oncogenes, alvosterapêuticos e atémesmovíruscompletos Desenvolvimento de fármacos: o conhecimentodaestrutura de proteínaspermite o projeto de pequenasmoléculasque se liguem a elas e possam, porexemplo, bloquearsuafunção Raquel C. de Melo Minardi 4/63
Estruturas disponíveis livremente Raquel C. de Melo Minardi 5/63
Estruturas disponíveis livremente Umapequenamutaçãofaz com quehemoglobinas se agreguememlongascadeiasquedistorcem as hemáceas e causamseverosproblemascirculatórios Revelação de detalhesdavida:estruturas de oxi e desoxi-hemoglobinasrevelamcomoocorre o controleparaligação do oxigênio Raquel C. de Melo Minardi 6/63
Estruturas disponíveis livremente Engenhariabiomolecular e bionanotecnologia: Pesquisadoresvisammodificarbiomoléculasparaqueadquiram novas funçõesoumesmoprojetarmoléculasinteiramente novas Raquel C. de Melo Minardi 7/63
PDB Possibilta a exploração das bases atômicasdafunção molecular É um repositório de coordenadasatômicas e anotaçõesdetalhadassobreosdetalhesexperimentais Desafios: Obter o conjunto de moléculas de interesse Utilizar / desenvolvermodelos, algoritmos e ferramentasquepossibilitemobter as propriedades de interesse Raquel C. de Melo Minardi 8/63
PDB: Busca Hámuitasferramentasdisponíveisparabusca no PDB baseadasemdiversaspropriedadescomoporexemplonomes de moléculas e sequências de aminoácidos Háaindadiversasreferênciascruzadas com outras bases como Gene Ontology, SCOP, CATH, EC numbers, etc Háainda a possibilidade de se acessaresterepositório via FTP wget -r ftp://ftp.wwpdb.org/pub/pdb/data/structures/all/pdb/* -nd -nv Raquel C. de Melo Minardi 9/63
PDB: Visualização O PDB utilizacomumente o plug-in do Jmol (desenvolvidoem Java) Háinúmerasoutraspossibilidades de ferramentas de visualização de estruturas no formato PDB comoRasmol e PyMol, porexemplo Infelizmente, cadaferramentautiliza um conjunto de comandosextremamenteespecífico Raquel C. de Melo Minardi 10/63
PDB: Visualização Rasmol Programaleve Simplicidade de aprendizado PyMol Imagens de altaqualidade Raquel C. de Melo Minardi 11/63
PDB: Visualização Jmol Pode ser embutidoempáginas web Raquel C. de Melo Minardi 12/63
Dados do PDB Os arquivos PDB sãoarquivostexto, podendo ser abertosemqualquer editor de textoscomo notepad, vi, etc. Informaçãoprimária: coordenadas (x, y, z), ou seja, lista de átomos que compõem uma proteína e suas localizações no espaço tridimensional Um PDB típicotraz um resumosobre a proteína, informaçõessobrecitações, detalhes dos experimentos de resoluçãoseguido das coordenadas Outrosformatos: mmCIF e XML Raquel C. de Melo Minardi 13/63
Coordenadas Um arquivo PDB podecontercoordenadas de umacoleção de proteínas, pequenasmoléculas, íons e água As informações de cadaátomosãodescritasemumalinhaquecomeça com as palavras-chave “ATOM” ou “HETATM” “ATOM” identificaátomos de proteínas e ácidosnucléicos “HETATM” identificaátomos de pequenasmoléculas Apósestapalavra, chaveháumalista de informações: nome do átomo, seuidentificador no arquivo, nome e número do resíduo de aminoácidosaoqualpertence, umaletraindicandosuacadeia, coordenadas x, y, z e a suaocupância e fator de temperatura Raquel C. de Melo Minardi 14/63
Coordenadas Raquel C. de Melo Minardi 15/63
Cadeias e modelos Um arquivo PDB é sempredivididoemcadeias Cadacadeiapolipeptídicarecebe um identificador de umaletra No caso de experimentos de RNM, ele é divididoemmúltiplosmodelosrepresentandopossíveisconformaçõespara a molécula Raquel C. de Melo Minardi 16/63
Resolução A resolução é umamedidadaqualidade do dado coletado do cristalcontendo a proteína Se todas as proteínasestiveremalinhadas de forma perfeita no cristal, obtem-se informaçõesbastanteprecisassobre a localização dos átomos Casocontrário, se houver, porexemplo, movimentações no interior do cristal, o padrão de difraçãonãoserátãoconfiável Raquel C. de Melo Minardi 17/63
Resolução Raquel C. de Melo Minardi 18/63
Fator de temperatura Se fossemoscapazes de visualizar a nuvemeletrônica de um átomorigidamentefixo, elaseriadensa das proximidades do núcleo e cairia com o aumentodadistância Quandoolhamospara as densidadesexperimentais, provenientes de experimentos de difração de raios-X, pequenasvibraçõesnasposições dos átomosdistorcem um pouco a nuvemquesomoscapazes de visualizar EstasdistorçõessãocaptadasproporcionalmentepeloB-valueoufator de temperatura B-value < 10, modelobastantepreciso B-value > 50, átomosquasenãopodem ser localizados Raquel C. de Melo Minardi 19/63
Fator de temperatura Raquel C. de Melo Minardi 20/63
Ocupância Cristaismacromolecularessãocompostos de muitasmoléculasindividuaisempacotadasem um arranjosimétrico Emalgunscristais, podemhaverdiferenças entre estasmoléculas Umacadeia lateral nasuperfíciepodeestaremdiferentesorientaçõesnosdiferentescristais, um ligantepode se ligaremdiferentesorientaçõesem um sítioativo, um íonpodeestarpresenteemapenasalgumasmoléculas A ocupância é umamedida de cadaconformaçãopresente no cristal De modogeral, a ocupância é 1 para a maioria dos átomosindicandoqueelesestãonamesmaposiçãoemtodas as moléculas Ocupânciasvariam de 0 a 1 Raquel C. de Melo Minardi 21/63
Ocupância Raquel C. de Melo Minardi 22/63
Ocupância Raquel C. de Melo Minardi 23/63
Por que o PDB não é completo? Devido a algumaslimitações das técnicas de resolução, algumaspartesdaproteínapodemestarfaltandocomo: Loops Porções N e/ou C-terminais Hidrogênios Raquel C. de Melo Minardi 24/63
Loops ausentes Esta protease resolvidasemligante e pordifração de raios-X apresentadois loops ausentesdevido a altaflexibilidade A mesma protease resolvida com inibidores, nãoapresentaesteproblemavistoqueos loops apresentamumaconformaçãomaisestávelnestecaso Como a resolução de estruturaspordifração de raios-X é baseadanaposição dos átomosnasdiversasmoléculaspresentes no cristal, posiçõesmuitomóveispodemnãoapresentar um padrãoclaro de difração Raquel C. de Melo Minardi 25/63
Hidrogênios A grandemaioria dos experimentos de difração de raios-X não resolve as posições dos hidrogênios. Estaspodem ser inferidasporprogramasposteriormente Jáosexperimentos de RNM baseam-se em um conjunto de distâncias entre hidrogêniosapresentando as coordenadasparataisátomos Raquel C. de Melo Minardi 26/63
Sequências Cadaarquivo PDB possuiregistroschamados SEQRES quecontém a sequênciaprimária de resíduos de aminoácidosquecompõem a molécula Raquel C. de Melo Minardi 27/63
Sequências É precisotercuidadoaousar a sequênciaproveniente de SEQRES: nemsempreelacorresponde à sequênciadescritanaseção de coordenadas Terminais das cadeias e loops muitomóveisnormalmentenãosãoobtidosnosexperimentos e não tem as coordenadasdescritas no arquivo PDB mesmoestandopresente no experimento e descrita no SEQRES Alémdisto, é comumtrabalharapenas com fragmentos das moléculasentãonormalmenteapenastrechosdamoléculatêmsuascoordenadasdepositadas O número dos aminoácidospodeassumirqualquer valor (negativo, 0, positivo) Raquel C. de Melo Minardi 28/63
Coordenadas atômicas Raquel C. de Melo Minardi 29/63
Seção de coordenadas Raquel C. de Melo Minardi 30/63
Formato PDB http://www.wwpdb.org/documentation/format32/v3.2.html Raquel C. de Melo Minardi 31/63
PDBest PDBest – PDB Enhanced Structures Toolkit D. Pires , C. Silveira, M. Santoro e W. MeiraJúnior. Conjunto de scripts perlque: Separaarquivos PDB emcadeias Separaosarquivos de Difração de Raios-X e RNM Separaemdiferentesmodelos Separaligantes Renumeraosresíduos das cadeias Retiraátomos de hidrogênio Selecionaportipoounome de átomo, nome do resíduo, cadeia, ocupância, intervalor de átomos e resíduos, estruturassecundárias. Raquel C. de Melo Minardi 32/63
PDBest ATOMTYPE = ,ALL, CHAIN = ,ALL, OCCUP = ,ALL, ATOMRANGE = ,ALL, RESRANGE = ,ALL, ATOMNAME = ,NOT-H*, RESNAME = ,ALL, SECONDSTR = ,ALL, INCREMENTINDEX = ,ALL,`` Raquel C. de Melo Minardi 33/63
Referências cruzadas Raquel C. de Melo Minardi 34/63
Referências cruzadas Raquel C. de Melo Minardi 35/63
SCOP Classificaçãohierárquica de domínios de proteínassegundorelacionamentosevolucionários e estruturais Construídoessencialmenteporinspeção visual Possuiosseguintesníveis: Classe:conjunto de domínioscujacomposiçãoemtermos de estruturassecundárias é a mesma. Ex.: alfa, beta, alfa+beta, alfa/beta,… Fold:conjunto de proteínas das quais o arranjo das estruturassecundárias e suas inter-conexõessãoosmesmos Super-família:proteínas com baixasimilaridadesequencialmascujasestruturas e característicasfuncionaissugeremrelacionamentoesevolucionários Família:conjunto de proteínasquecompartilhampelomenos 30% de identidade de sequênciaouque, apesardabaixasimilaridade de sequência, têmaltaconservaçãoestrutural e funcional Raquel C. de Melo Minardi 36/63
SCOP http://scop.mrc-lmb.cam.ac.uk/scop/ Raquel C. de Melo Minardi 37/63
Pfam http://pfam.sanger.ac.uk/ Raquel C. de Melo Minardi 38/63
Pfam http://pfam.sanger.ac.uk/ Raquel C. de Melo Minardi 39/63
Pfam http://pfam.sanger.ac.uk/ Raquel C. de Melo Minardi 40/63
Pfam http://pfam.sanger.ac.uk/ Raquel C. de Melo Minardi 41/63
STING Sequence To and withINGraphics http://www.cbi.cnptia.embrapa.br/SMS Raquel C. de Melo Minardi 42/63
STING Sequence To and withINGraphics http://www.cbi.cnptia.embrapa.br/SMS Raquel C. de Melo Minardi 43/63
PDB Ligand Explorer http://www.pdb.org/pdb/Viewers/RCSBViewers/view.jsp?hetId=HEM&viewerType=LX&structureId=1A6M&structIdFromStrutsAction=1A6M Raquel C. de Melo Minardi 45/63
PDB Ligand Expo http://ligand-expo.rcsb.org Raquel C. de Melo Minardi 46/63
PDB Ligand Expo Raquel C. de Melo Minardi 47/63
PubChem http://pubchem.ncbi.nlm.nih.gov/ Raquel C. de Melo Minardi 48/63
PubChem http://pubchem.ncbi.nlm.nih.gov/ Raquel C. de Melo Minardi 49/63
Formatos de moléculas Qual a modelagemmais natural para um cientistadacomputação? Raquel C. de Melo Minardi 50/63