210 likes | 288 Views
Java Protein Dossier-JPD. Arquivo de coordenadas pdb. HEADER COMPLEX(SERINE PROTEINASE-INHIBITOR) 04-MAR-88 1CHO COMPND ALPHA-CHYMOTRYPSIN (E.C.3.4.21.1) COMPLEX WITH TURKEY SOURCE BOVINE (BOS $TAURUS) PANCREAS AND TURKEY (MELEAGRIS
E N D
Java Protein Dossier-JPD http://www.cbi.cnpia.embrapa.br
Arquivo de coordenadas pdb • HEADER COMPLEX(SERINE PROTEINASE-INHIBITOR) 04-MAR-88 1CHO • COMPND ALPHA-CHYMOTRYPSIN (E.C.3.4.21.1) COMPLEX WITH TURKEY • SOURCE BOVINE (BOS $TAURUS) PANCREAS AND TURKEY (MELEAGRIS • AUTHOR M.FUJINAGA,A.R.SIELECKI,R.J.READ,W.ARDELT,M.LASKOWSKI • REVDAT 1 16-JUL-88 1CHO 0 • JRNL REF J.MOL.BIOL. V. 195 397 1987 • REMARK 2 RESOLUTION. 1.8 ANGSTROMS. • REMARK 3 REFINEMENT. BY THE RESTRAINED LEAST SQUARES PROCEDURE OF 1CHO 22 • REMARK 3 THE R VALUE IS 0.168 FOR 19178 REFLECTIONS • SEQRES 1 E 245 CYS GLY VAL PRO ALA ILE GLN PRO VAL LEU SER GLY LEU 1CHO 61 • SEQRES 2 E 245 EXC EXC ILE VAL ASN GLY GLU GLU ALA VAL PRO GLY SER 1CHO 62 • SEQRES 5 I 56 PHE GLY LYS CYS 1CHO 84 • FTNOTE 1 LYS E 36 - POOR DENSITY FOR ALL ATOMS BEYOND CG. 1CHO 86 • FTNOTE 2 GLY E 74 THROUGH SER E 77 - POOR DENSITY FOR BOTH SIDE 1CHO 88 • SCALE1 0.022262 0.000000 0.005509 0.00000 1CHO 153 • SCALE2 0.000000 0.018342 0.000000 0.00000 1CHO 154 • SCALE3 0.000000 0.000000 0.018016 0.00000 1CHO 155 • ATOM 1 N CYS E 1 -15.451 30.900 -6.779 1.00 19.02 1CHO 156 • ATOM 2 CA CYS E 1 -15.185 29.544 -7.307 1.00 17.58 1CHO 157 • ATOM 3 C CYS E 1 -14.777 29.619 -8.768 1.00 17.23 1CHO 158 • ATOM 4 O CYS E 1 -15.105 30.601 -9.455 1.00 16.79 1CHO 159 • ATOM 5 CB CYS E 1 -16.428 28.675 -7.320 1.00 16.57 1CHO 160 • ATOM 6 SG CYS E 1 -17.883 29.299 -8.170 1.00 19.13 1CHO 161 • ATOM 7 N GLY E 2 -14.110 28.558 -9.177 1.00 16.79 1CHO 162 • ATOM 8 CA GLY E 2 -13.678 28.296 -10.503 1.00 15.13 1CHO 163 • ATOM 9 C GLY E 2 -12.640 29.105 -11.184 1.00 17.48 1CHO 164 • ATOM 10 O GLY E 2 -12.427 28.886 -12.414 1.00 16.69 1CHO 165 • ATOM 11 N VAL E 3 -11.950 29.979 -10.481 1.00 18.30 1CHO 166 http://www.cbi.cnpia.embrapa.br
Parâmetros Seqüência de Resíduos (ResBoxes) Na linha ResBoxes a seqüência de resíduos relatada no arquivo PDB é apresentada utilizando-se o código de uma letra para resíduos. Os resíduos para os quais a densidade eletrônica no experimento de difração por raio X não permitiu sua visualização são apresentados como gaps ou indeterminados. http://www.cbi.cnpia.embrapa.br
Parâmetros • Contatos Internos (ITC) • Contatos intramoleculares ou internos são aqueles entre resíduos de uma mesma cadeia protéica. Os contatos são apresentados em forma de um gráfico de barras onde a altura corresponde à quantidade de contatos e um código de cores é utilizado para distinguir entre os diversos tipos de contatos: • Hidrofóbicos; • Eletrostática atrativas; • Eletrostática repulsivas; • Ligação de hidrogênio cadeia principal – cadeia principal; • Ligação de hidrogênio cadeia principal – água – cadeia principal; • Ligação de hidrogênio cadeia principal – água – água – cadeia principal; • Ligaçãode hidrogênio cadeia principal – cadeia lateral; • Ligação de hidrogênio cadeia principal – água – cadeia lateral; • Ligaçãode hidrogênio cadeia principal – água – água – cadeia lateral; • Ligaçãode hidrogênio cadeia lateral – cadeia lateral; • Ligação de hidrogênio cadeia lateral – água – cadeia lateral; • Ligação de hidrogênio cadeia lateral – água – água – cadeia lateral; • Interação aromática; • Pontes de sulfeto. http://www.cbi.cnpia.embrapa.br
Parâmetros • Contatos na Interface (IFC) • Quando o arquivo PDB possui mais de uma cadeia protéica, formando um complexo molecular, o JPD apresenta uma linha referente a contatos intermoleculares. Nasão apresentados, para cada resíduo de cada cadeia, a quantidade de contatos intermoleculares em que o resíduo está envolvido. • Interface (IFR - Interface Forming Residues) • Em um complexo (proteína/proteína, proteína/DNA) a região de interação entre duas cadeias é denominada Interface . • Definição IFR: resíduos para os quais a área acessível por solvente calculada para as cadeias inseridas no complexo é menor que aquela calculada para as cadeias isoladas. Esta perda de área após a formação do complexo indica que o resíduo se encontra muito próximo da outra cadeia. • Extended Interface, identificada pelos resíduos grifados em azul. A Extended Interface é formada por resíduos que não perderam área acessível por solvente quando em complexo, mas possivelmente fazem contatos com resíduos que se encontram na outra cadeia. http://www.cbi.cnpia.embrapa.br
Parâmetros Prosite O Prosite (Hofmann,1999) é um banco de dados que identifica padrões de sítios que possuem funções importantes em proteínas conhecidas. Nesta linha, o JPD identifica se o resíduo pertence a algum padrão descrito no Prosite. • Estrutura Secundária • O JPD apresenta três diferentes fontes de determinação de estruturas secundárias. • SS_PDB: estruturas secundárias relatadas pelo autor no arquivo PDB. • SS_DSSP: SS extraídas do banco de dados HSSP – (Homology-Derived Secondary Structure of Proteins) • SS_Stride: SS calculadas de acordo com o método STRIDE – secondary STRucture IDEntification LP (Ligand Pocket forming residues): aminoácidos que têm átomos a uma distância de até 4 A do ligante. WC(Water Pocket forming residues): resíduos que estão a uma distância de até 4.0 A de moléculas de água cristalográficas. SF ( surface forming residues): amino ácidos que estão na superfície http://www.cbi.cnpia.embrapa.br
Parâmetros • Fator de Temperatura (Temp. Factor) 0 100 • O Fator de Temperatura indica o grau de mobilidade dos átomos no cristal. • Na linha Temp. Factor, apresentada pelo JPD, estão coloridos o fator de temperatura do carbono alfa, o valor médio, e o valor máximo do resíduo. Posicionando-se o mouse sobre esta linha para um determinado resíduo, os valores aparecem. • Acessibilidade (Acessibility) • Indica a quantidade de área acessível por solvente. Os valores são calculados através do programa Surfv. • Acessibilidade de resíduos para cadeias em complexo: 0 214 • Área acessível ao solvente para a situação em que a cadeia a que o resíduo pertence participa de um complexo de moléculas. • Acessibilidade de resíduos para cadeia isolada: 0 214 • Área acessível ao solvente quando a cadeia a que o resíduo pertence está isolada. • Acessibilidade relativa de resíduos: 0 1 • Razão entre valor de área acessível ao solvente quando a cadeia está isolada e valor máximo possível para o resíduo. Indica o percentual da área do resíduo exposta ao solvente. http://www.cbi.cnpia.embrapa.br
Parâmetros Entropia Relativa (baixa alta) A Entropia Relativa é uma medida do grau de conservação em uma determinada posição da seqüência protéica. Se a entropia relativa é baixa, há uma indicação de que o resíduo tende a permanecer o mesmo durante a evolução. Se e entropia relativa é alta, naquela posição a natureza promoveu diversas mudanças que não alteraram nem a estabilidade e nem a função da proteína. Confiabilidade (Reliability): um indicador de confiança para a entropia relativa. É a razão entre o número de seqüências que participam do alinhamento utilizado para cálculo da entropia relativa e o número total de seqüências utilizadas no alinhamento. 0 1 Se o valor de reliability é baixo, isto indica que a informação de entropia relativa para aquela posição é pouco confiável; se o valor de confiabilidade é alto, pode-se dizer que a informação sobre a entropia relativa para aquela posição é mais relevante. http://www.cbi.cnpia.embrapa.br
Parâmetros Entropia Relativa e Confiabilidade são informações extraídas do HSSP– Homology-Derived Secondary Structure of Proteins. # SEQUENCE PROFILE AND ENTROPY SeqNo PDBNo V L I M F W Y G A P S T C H R K Q RELENT 1 1 E 0 0 0 0 0 0 0 0 0 0 0 0 100 0 0 0 0 0 2 2 E 0 0 0 0 0 0 0 100 0 0 0 0 0 0 0 0 0 0 3 3 E 100 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 19 23 E 7 4 2 1 0 0 1 2 7 6 9 8 0 2 9 12 4 88 20 24 E 5 5 14 0 2 0 0 1 6 33 1 1 0 1 6 9 3 76 21 25 E 0 1 0 0 0 0 2 40 3 0 6 3 0 20 1 1 1 63 22 26 E 0 1 0 0 0 0 0 0 8 0 40 2 0 0 3 6 10 65 23 27 E 5 1 3 0 21 25 5 0 7 0 3 1 3 7 9 0 9 75 24 28 E 0 0 0 0 0 0 0 1 1 95 0 0 0 0 1 0 0 10 25 29 E 0 0 0 0 6 59 28 0 0 0 2 0 0 4 0 0 0 36 http://www.cbi.cnpia.embrapa.br
Parâmetros Ângulos de torsão e (Dihedral Angles) Indica a região em que o resíduo se encontra no Diagrama deRamachandran. O Diagrama de Ramachandran mostra se o amino ácido tem uma conformação permitida para uma macromolécula. Posicionando-se o mouse sobre esta linha, os valores dos ângulos de torsão calculados para o resíduo são apresentados. Legenda JPD região mais favorável região permitida região generosamente permitida região não permitida http://www.cbi.cnpia.embrapa.br
Superfície: onde a ação acontece Um aspecto elementar da biologia envolve o reconhecimento entre moléculas. As interações entre macromoléculas biológicas dependem fortemente das características das superfícies que interagem. Mapear as propriedades nas superfícies moleculares http://www.cbi.cnpia.embrapa.br
Parâmetros Potencial Eletrostático (E.Potential)-180.0 180.0 • O Potencial eletrostático na superfície da proteína • é calculado utilizando-se o programa Grasp. • Pode ser usado como ferramenta na análise • da estrutura e função da proteína. • Interações eletrostáticas governam as • interações entre proteínas e ligantes, • são importantes na determinação da estabilidade • das proteínas, mapeamento de canais, etc. • Demonstra a afinidade de determinadas • regiões da superfície da proteína por • determinados tipos de carga – positiva ou negativa. http://www.cbi.cnpia.embrapa.br
Parâmetros Curvatura na Superfície (Curvature) A superfície de uma proteína não é plana, ela possui regiões côncavas e convexas. Cavidades ou saliências na superfície protéica são um primeiro indicativo de que estas regiões constituem-se em sítios importantes para interação com outras moléculas. http://www.cbi.cnpia.embrapa.br
Parâmetros Curvatura na Superfície (Curvature) Importância: Docking = Processo de encaixar duas moléculas em três dimensões. Em aplicações de docking, a condição de complementaridade das superfícies das interfaces determina que a curvatura média das superfícies que interagem sejam opostas em sinal e iguais em magnitude. Estrutura alvo Ligante Droga líder http://www.cbi.cnpia.embrapa.br
Parâmetros Curvatura na Superfície (Curvature)-1 1 O cálculo da curvatura é feito utilizando-se o programa SurfRace e considerando-se os LHAs (Last Heavy Atoms) de cada aminoácido. http://www.cbi.cnpia.embrapa.br
Parâmetros Hidrofobicidade -9 5 Amino ácidos hidrofóbicos, por não terem afinidade com a água, tendem a se agrupar no interior. Resíduos hidrofílicos, que têm afinidade com água, tendem a ficar na parte exterior da molécula. Valores de hidrofobicidade de acordo com a escala de hidrofobicidade, determinada experimentalmente por Radzicka & Wolfenden Importância: Folding Uma importante força que parece dominar o processo de enovelamento das proteínas envolve a exclusão de moléculas de água do interior da proteína. Procura-se saber quais partes da superfície da proteína tem mais chances de interagir entre si. http://www.cbi.cnpia.embrapa.br
Parâmetros Dupla Ocupância • 4ltz.pdb • ATOM 667 N SER 85 -1.980 3.118 19.736 1.00 13.21 • ATOM 668 CA SER 85 -2.647 2.881 18.465 1.00 13.32 • ATOM 669 C SER 85 -2.234 3.900 17.377 1.00 12.08 • ATOM 670 O SER 85 -1.894 5.006 17.680 1.00 13.09 • ATOM 671 CB ASER 85 -4.162 2.927 18.700 0.37 13.29 • ATOM 672 CB BSER 85 -4.157 3.018 18.734 0.63 14.08 • ATOM 673 OG ASER 85 -4.703 4.129 19.233 0.37 13.07 • ATOM 674 OG BSER 85 -4.728 2.368 17.625 0.63 24.41 Na etapa de interpretação da densidade eletrônica, algumas vezes, o cristalógrafo depara-se com a situação em que os átomos de um resíduo parecem ocupar diferentes posições no espaço para as diferentes moléculas de proteína no cristal. Diz-se nestes casos que o resíduo apresenta conformação dupla e todas as coordenadas atômicas são relatadas. Estes resíduos são apresentados na linha Double Occupancy http://www.cbi.cnpia.embrapa.br
Funções • Esta função permite o mapeamento e a visualização de resíduos ou parâmetros apresentados na estrutura tridimensional da proteína. Isso permite, por exemplo, a identificação na estrutura das áreas mais conservadas na proteína. Função Sting It http://www.cbi.cnpia.embrapa.br
No seu modo de operação normal, o JPD exibe todas as cadeias da proteína em um único painel com uma barra de rolagem vertical. No modo Split, a tela é dividida em dois painéis, cada um apresentando os parâmetros referentes a uma cadeia/proteína com barras de rolagem horizontal. Para a iteratividade necessária no processo de modelagem por homologia, pode-se usar a função Two PDBs, que permite comparar o modelo com a estrutura que está sendo utilizada como template. Funções Funções Split e Two PDBs http://www.cbi.cnpia.embrapa.br
Funções Função Map Contacts on Sequence • Permite que se verifique rapidamente todos os potenciais contatos para um determinado resíduo. • Quando ativada, marca o resíduo de interesse com a cor branca e todos os resíduos que são potenciais contatos na cor azul. • As barras correspondentes são apresentadas de forma intermitente. Também é possível mapear os contatos de Interface entre duas cadeias de maneira similar. http://www.cbi.cnpia.embrapa.br
Funções Função Select Residues Em geral, as proteínas contém alguns resíduos que tem uma importância maior para a estabilidade de sua estrutura ou a realização de sua função. Um dos objetivos do JPD é exatamente apresentar um conjunto de parâmetros capaz de fornecer subsídios para a identificação destes resíduos. Por exemplo, resíduos conservados (baixa entropia relativa) na superfície pode ser indicativo de um sítio ativo. A função Select Residues permite que resíduos sejam selecionados especificando um conjunto de restrições baseadas nos parâmetros apresentados pelo JPD. http://www.cbi.cnpia.embrapa.br