400 likes | 522 Views
ABC do Folding de Proteínas Globulares. O Problema do Folding. Um dos grandes desafios atuais da Biologia Estrutural. Física Biológica Departamento de Física e Química FFRP – USP A. Caliri. Porque o Problema do Folding é importante?.
E N D
ABC do Folding de Proteínas Globulares O Problema do Folding Um dos grandes desafios atuais da Biologia Estrutural. Física Biológica Departamento de Física e Química FFRP – USP A. Caliri
Porque o Problema do Folding é importante? 1)- Admite-se que a estrutura 3-D de muitas moléculas biológicas seja determinante para o funcionamento pleno. 1TSK – Toxina de escorpião 35 aminoácidos; 518 átomos 2)- Já se conhece a constituição básica de cerca de 300.000 proteínas (tarefa rápida e cada vez mais barata), mas somente 10% delas tem sua estrutura 3-D determinadas experimentalmente por difração de R-X e NMR (processos lentos e caros). . . . ARQUIVO MORTO !!!
Do que se trata, afinal, o Problema do Folding ? Em resumo: Previsão da estrutura tridimensional de uma (macro)molécula biológica, dado que sua constituição atômica básica seja conhecida. Especificando para uma Proteína
Estrutura Primária(Seqüência de aminoácidos) Estrutura 3-D REPRESENTAÇÃO ESQUEMÁTICA
elementos básicos, singelos In vivo Leo / 2001
Como uma proteína é fabricada? A maquinaria biológica envolvida no encadeamento de aminoácidos
A MaquinariaBiológica O código genético Cada terno de bases nitrogenadas (U, C, A e G), chamado códon, corresponde a um aminoácido. Tabala dos tripletes
Um gene Uma proteína? Porém, as proteínas a serem produzidas dependem das circunstâncias. Potencialmente temos que (possibilidades combinatoriais): 2 genes 2 + 1 = 3 proteínas; 3 genes 3 + 3 + 1 = 7 proteínas; ... n genes { n + n (n - 1) / 2! + n (n - 1) (n - 2) / 3! + ... + n + 1} proteínas Seq A + Seq B Seq AB; sempre ??
Brain Problemas biológicos são, em geral muito complexos; pelo menos a primeira vista. MAS ... de fato, através da análise, e do método tem-se abarcado, e de certa forma resolvido, muitos problemas antes tidos mesmo como impensáveis. Apesar de que nem todos os problemas sejam suscetíveis à análise: a soma das partes nem sempre resulta no todo. Porem, hoje contamos com uma ferramenta adicional: O COMPUTADOR ELETRÔNICO (... depois, o ótico, o quântico, ...)
ABC do Folding de Proteínas Globulares MÉTODO INTUITIVO PARA ABARCAR PROBLEMAS COMPLEXOS 1)- Iniciar com o caso mais simples do problema em foco. Exemplo: Se o objeto de estudo é uma aeronave, escolhemos inicialmente um ultra-leve, ao invés de um Jumbo. 2)- Focar especificidades do problema (todo problema é redutível até um certo grau). Exemplo: O tópico “aerodinâmica” pode ser focado especificamente num determindo tópico; todos os outros aspectos do problema (a eletrônica por exemplo) pode ser isolado. 3)- Simplificar o problema, evitando detalhes desnecessários (mas nem sempre é fácil: arte!)Exemplo: Poder das pontas (eletrostática):
Como simplificar o problema do folding de proteínas, no sentido de melhorar o entendimento do processo? Fração de 3% de uma única molécula de DNA constituinte de um dos 46 cromossomos presentes na célula humana.
... seguimos os três passos enunciados: consideramos o caso das proteínas pequenas de s20 a s100 aminoácidos; focamos tópicos específicos do problema; e procuramos simplificar o problema.
Um tipo de abordagem: Usar Modelos Computacionais simplificados
Diversas representações simplificadas de uma mesma proteína O tópico é: Saber relacionar a seqüência de aminoácidos da proteína com sua Estrutura 3-D. Será que conseguimos criar um sistema simplificado para o qual posso encontrar a solução para o tópico isolado acima?
20 aminoácidos (especificidades estereoquímicas) Moléculas do solvente Cadeia com 27 unidades
Esquema do processo de folding Representação Esquemática de uma cadeia Representação Esquemática do processo de folding Representação Esquemática de uma cadeia Representação Esquemática do processo de folding
SINTAXE: Dada uma estrutura nativa, qual a seqüência de aminoácidos? C B B C C A B C F D A A R D D A A C B B B C A C F B C r(0): R r(3): C r(1,1): A r(1,2): H r(2,1): B r(2,2): G r(2,3): F r(2,4): I r(2,5): E r(2,6): D Idéia: HIDROFÓBICO DENTRO Design para a estrutura nativa:ADADA DAFCB CBCBC BCBCB CBCFARA
Uma das questões atuais : Taxa de Folding kf (“velocidade” com que as proteínas se enovelam) Existe correlação entre parâmetros topológicos da nativa e log kf de pequenas proteínas e quando a cinética do folding pode serdescrita como a cinética de sistemas de dois estados: N e U)
RESULTADOS EXPERIMENTAIS E TEÓRICOS Kaya, Chan Proteins, 52, 524, 2003 Plaxco, Simons, Baker J.Mol.Biol, 287, 985,1998 Maritan, Micheletti, BanavarPRL 84, 3009, 2000 Silva, dos Reis, Caliri To apper in JCP - 2005 32/41
Taxa de Folding kf O MODELO Modelo utilizado não é nativa-dirigido: possui um alfabeto de dez letras e provê uma regra (sintaxe) para o design da seqüência. Para Estrutura Nativa são efetuadas 15 simulações independentes, com janela de tempo pré-estabelecida: tw = 3107 passos MC (sucesso: se ti < tw) Taxa de Folding: representada pelo inverso do tempo médio < ti > requerido para a primeira passagem pela nativa. Alternativamente, utilizou-se a média geométrica dos tempos {ti}para encontrar a nativa.
PROTEÍNAS PEQUENAS: distribuição dos tempos { ti} de enovelamento Para um conjunto {ti} grande suficiente, < ti> pode ser aproximado pela média aritmética O logaritmo comum da taxa de enovelamento é então log kf =< ti >-1
Propriedade matemática útil Daí então: Utilidade? a função logarítmica aplicada no conjunto de simulações reduz o efeito das flutuações para amostragens pequenas
CaracterizaçãoTopológica das estruturas nativas Padrões estruturais [*STTS*] [*TTTT*] [*TT*] [*STS*] Snail Staple
0,494709 0,238095 Caracterização Topológica das estruturas nativas ORDEM DE CONTATO RELATIVO: separação média entre os monômeros contatantes, normalizado pelo tamanho da cadeia. n = 90, 91, ..., 187 n 185 29/41
RESULTADOS Determinantes da taxa de enovelamento e “estruturas tipo-secundárias” Simulação com as especificidades estéricas 31/41
* Determinantes da taxa de enovelamento`: “estruturas tipo-secundárias” 0,2381 0,2725 0,3333 0,3175 0,3280 0,4153 33/41
RESULTADOS * Determinantes da taxa de enovelamento: “estruturas tipo-secundárias” 0,2434 0,2593 0,2619 0,3333 0,4127 0,4524 34/41
RESULTADOS Determinantes da taxa de enovelamento: “estruturas tipo-secundárias” Simulação com as especificidades estéricas 31/41
* Determinantes da taxa de enovelamento e “estruturas tipo-secundárias” 0,2460 0,3307 0,4841 35/41
Determinantes da taxa de enovelamento e “estruturas tipo-secundárias” Simulação com as especificidades estéricas 31/41
* Determinantes da taxa de enovelamento e “estruturas tipo-secundárias” 0,2381 0,2593 0,3175 0,4048 0,4286 0,4788 36/41
0,2381 0,2460 * Determinantes da taxa de enovelamento e “estruturas tipo-secundárias” 37/41
CONCLUSÕES O que seira conteúdo de estruturas tipo-secundária?
Big Blue's SMASHing Blue Gene BigBlue December 8, 1999Web posted at: 10:05 a.m. EST (1505 GMT)by Nancy Weil PRONTO ! (IDG) -- IBM has unveiled plans for "Blue Gene," a $100 million research project to build a supercomputer with 500 times the computing power of today's machines. The new IBM computer, nicknamed "Blue Gene", will be capable of more than one quadrillion operations a second. If the project succeeds, the computer will be able to handle more than 1 quadrillion operations per second, or one petaflop, which is a million billion floating point operations per second. ... The first science project earmarked for Blue Gene is to model folding of human proteins. Better understanding of how proteins fold is likely to give medical researchers clues into diseases and possibly into cures, as they learn how it is that particular diseases attack cells. (kilo, mega, giga, tera, ....peta-flop)
BlueGene Blue Gene/L PRONTO !
A Metáfora da Linguagem(advertência ...) A procura pelo entendimento dos mecanismos da Natureza pode ser comparada a seguinte situação análoga: Imagine um computador cuja interface de comunicação com o ser humano seja apenas o seu Sistema Operacional (Windows, digamos) e mais alguns aplicativos (Office, Fortran,C ...).[S.O. Linguagem.] Problema: Descobrir como funciona o Hardware em todos os seus níveis: processador, os tipos de memórias, o mouse, o monitor, ... o transistor.[Hardware Natureza] Macaco do Léo Leo/2001