220 likes | 365 Views
Predição de interações proteína-proteína e domínio-domínio. Diego Lemos. Roteiro. Introdução Métodos Parsimonious Explanation (PE) Experimento I Experimento II Raciocínio por traz do método PE Conclusão. Introdução.
E N D
Predição de interações proteína-proteína e domínio-domínio Diego Lemos
Roteiro • Introdução • Métodos • Parsimonious Explanation (PE) • Experimento I • Experimento II • Raciocínio por traz do método PE • Conclusão
Introdução • O conhecimento sobre as interações entre as proteína ajuda a fornecer uma visão mais profunda do funcionamento das células. • Muitos estudos na área.
Introdução • Interação entre proteínas tipicamente envolve ligações entre domínios específicos. • Identificar os pares de domínio que interagem é um importante passo para entender as interações entre proteínas.
O que é um domínio? • Definem a estrutura e características das proteínas. • Proteínas geralmente possui dois ou mais domínios.
Métodos • Association Method • Expectation Maximization (EM) • Linear Programming • Support Vector Machines • Probabilistic network Modeling • Domain pair Exclusion Analysis(DPEA)
Association Method • Pontua cada par de domínio com um escore que é a relação entre o número de ocorrências do par numa interação de proteínas e o número de ocorrências independentes desses domínios. • O escore é interpretado como a probabilidade de interação entre os dois domínios.
Expectation Maximization(EM) • Proposto por Deng e colegas. • Aplica a estimativa da máxima esperança para determinar a interação domínio-domínio. • Computa a probabilidade de interação entre os domínios de forma que maximize a esperança da rede.
Domain Pair Exclusion Analysis (DPEA) • Proposto por Riley e colegas. • Executa o EM várias vezes. • Computa um valor E que mede o grau de redução da esperança da interação proteína-proteína causada pelo bloqueio de uma dada interação domínio-domínio. • DPEA supera os métodos Association e EM. • Método muito custoso computacionalmente.
Parsimonious Explanation(PE) • Formulado como um problema de otimização de programação linear, em que cada potencial contato domínio-domínio é uma variável que pode receber um valor ( (LP)-score). • O LP-score estima o potencial de um dado par de domínio em explicar a interação entre proteínas. • Parte do princípio da parcimônia para identificar as interações entre proteínas.
Calculando o LP-Score Para cada par de domínio Di Dj cria a variável xij ≥ 0. i xij Para a rede ao lado temos 6 restrições. j Pm Pn Para cada interação de proteínas Pm Pn Cria-se uma restrição: xij 1 xij{Pm, Pn}
PW-Score • Utilizado para filtrar as predições. • Derivado de duas observações: • Interações que tem muitas testemunhas são mais prováveis de serem corretas do que as que apresenta poucas ou nenhuma testemunha. • Promíscuas interações domínio-domínio que tem sua pontuação relacionada com à freqüência de sua aparição. • PW-score compensa interações de domínio que têm muitas testemunhas e penaliza interações promíscuas. pw-score(i,j) = min (p-value (i,j), (1-r)w(i,j) )
Experimento I • Aplicou-se o método PE sobre dados de interação proteína-proteína compreendendo 26032 interações subjacentes de 11403 proteínas de 69 organismos.
Experimento I • O papel do pw-score é permitir algum controle sobre os fatores de confiabilidade na testemunha. • Escolhendo um menor pw-score leva à previsão com precisão mais elevada. • Foi feito um estudo sobre a performance do PE em relação aos demais métodos. • Utilizou-se interações domínio-domínio do conjunto padrão ouro, que são pares confirmados que se interagem. • Utilizou-se um pw-score com valores 0.01 e 0.05
Pm Pn Experimento II • Existe o problema em que dado um par de proteínas predizer o par de domínios que media a interação entre as proteínas. Foi feito um estudo comparativo entre os resultados do método PE em relação aos demais sobre determinado problema.
Conclusão • O estudo das interações entre proteínas ajuda a entender o funcionamento das células. • Interação de domínio-domínio podem ser preditos identificando o mínimo de pares de domínio que podem justificar uma determinada rede de interação de proteína-proteína. • O método PE que utiliza uma programação linear superou os demais métodos.