360 likes | 529 Views
Capturando el i nteractoma : creación y análisis de bases de datos de interacciones moleculares. Pablo Porras Millán , scientific curator pporras@ebi.ac.uk. ¿ Por qué estudiar el interactoma ?. Lazebnik , Biochemistry ( Mosc ). 2004, PMID : 15627398. Really Important Component.
E N D
Capturando el interactoma: creación y análisis de bases de datos de interacciones moleculares Pablo PorrasMillán, scientific curator pporras@ebi.ac.uk
¿Porquéestudiar el interactoma? Lazebnik, Biochemistry (Mosc). 2004, PMID: 15627398
Really Important Component Undoubtedly Most Important Component Most Important Component Serendipitiously Recovered Component
El modelo del biólogo Un modeloque se ajusta a la realidad
Tipos de datosregistrados en el EBI Bibliografía Genomas Secuencias de proteínas Proteomas Secuencias de nucleótidos Estructura de proteínas Expresióngénica Familias, motivos y dominiosproteicos Sustanciasquímicas Interaccionesproteína-proteína Sistemas Rutasbiológicas
Un par de definiciones… Interaccionesproteína-proteína (IPPs): contactosfísicos y selectivosqueocurren entre pares de proteínas en determinadasregionesmolecularesy en un contextobiológicodefinido. Interactoma: Conjunto de interaccionesproteína-proteínaquetienenlugar en la célula / en un organismo / en un contextobiológicodeterminado… Red de interaccionesproteína-proteína: Representacióngráfica de un conjunto de IPPs en la quelasproteínas se representan en forma de nodos y lasinteracciones en forma de aristas.
¿Porquéestudiarinteraccionesproteína-proteína (IPPs)? Nivel gen Nivelproteína ADN ARN 1 proteína = nfunciones = nredes 1 proteína = 1 función ¡MAL! • Para predecir la funciónbiológica de la proteína • “culpable porasociación” • Proteínas con funcionessimilaresdeberíanagruparse • Para mejorar la caracterización de complejosproteicos y víasbiológicas • Las redes de interacciónfuncionancomo un mapa-borrador en el queensamblar los elementosqueformanlasvíasbiológicas
Culpable porasociación Kinasaciclina-dependiente Regulación de la transcripción Proto-oncogén Factor de transcripción Mediador de la actividad de la ARN-polimerasa Regulación de la transcripción Histonametiltransferasa Papel en desarrollotemprano y hematopoyesis Ciclina Regulación de ciclina-kinasa, regulacióntranscripción y ciclocelular Moduladortranscripcional Regulación de la transcripción dependiente de kinasas Algoquever con transcripción y control del ciclocelular Moduladortranscripcionalactivadopor receptor Modulación de la transcripción, transducción de señales, activadoporkinasas Papel en la inhibición de la curación de heridas Posibleoncoproteína Implicado en la regulación de la transcripción Posibleoncoproteína Activación de la transcripción
Tipos de interaccionesproteína-proteína • Interaccionesbinarias – Dos participantes • Colocalización– Proximidad de dos o másparticipantes • Ints. n-arias (asociaciones) – Purificación de complejos • Ints. funcionales / directas – Ej. Ints. enzimáticas
Interacciones n-arias (asociaciones) Schleiff et al., Nat Rev Mol Cell Biol. 2011. PMID: 211396380
Interaccionesfuncionales / directas • Generalmenteensayosin vitro • Los participantessuelenconocerseporadelantado (predeterminados) • Ejs.- ensayosenzimáticos, SPR, cristalografía, métodosqueusanproteínaspurificadas… Imágenestomadas de Wikipedia: http://en.wikipedia.org/wiki/X-ray_crystallography http://en.wikipedia.org/wiki/Surface_plasmon_resonance http://en.wikipedia.org/wiki/Protein_adsorption_in_the_food_industry
Métodos de detección de PPIs Doble híbrido (Y2H) Purificación por afinidad en tándem + espectrometría de masas (TAP-MS) Ningúnmétodopuedereproducirunaverdaderainteracciónbinariaobservada en condicionesfisiológicas – todaslasinteraccionesdetectadasexperimentalmente son esencialmenteartefactos Alto rendimiento Difracción de rayos X Bajorendimiento
Dominios de interacción Solapamiento de rangos en la secuencia: Representando IPPs: dominios de interacción
Representando IPPs: El problema de los complejos • Algunosmetodosexperimentalesgenerandatos de tipocomplejo: Ej. Purificaciónporafinidad en tándem(TAP) • Cuando se debeconvertirestainformación en datosbinarios, hay 2 algoritmosdisponibles:
Bases de datos de interacciones: tipos De Las Rivas & Fontanillo, PLoS Computational biology, PMID: 20589078.
Bases de datosprimarias: niveles de curación Curación superficial BioGRID – curaciónactiva, númerolimitado de organismosmodelo HPRD – curaciónactiva, centrada en humanos, predicción de interacciones MPIDB – curaciónactiva, interacciones en microbios InnateDB – curaciónactiva– interaccionesrelacionadas con inmunidadinnata Curación a fondo IntAct – curaciónactiva, ampliacobertura de especies, todotipo de moléculas MINT – curaciónactiva, ampliacobertura de especies, sólo IPPs DIP – curaciónactiva, ampliacobertura de especies, sólo IPPs MPACT – actualmente sin curación, cobertura de especieslimitada, sólo IPPs MatrixDB – curaciónactiva, sólomoléculas de la matrizextracelular BIND – detuvo la curacción en 2006/7, ampliacobertura de especias, todotipo de moléculas– la informaciónestáquedandodesfasada I2D – curaciónactiva– IPPs implicadas en cáncer CURACIÓN SUPERFICIAL CURACIÓN A FONDO
Bases de datosprimarias: cobertura Cobertura de IPPs humanas en lasprincipales bases de datospúblicas De Las Rivas & Fontanillo, PLoS Computational biology, PMID: 20589078.
Un estándarpara la representación de interacciones: el consorcioiMEX www.imexconsortium.org Orchard et al., Nature Methods, PMID: 22453911.
Cliente de consultaunificada: PSICQUIC www.ebi.ac.uk/Tools/webservices/psicquic/view/main.xhtml PSI-MI MIQL Interacciones Consulta Entrada Salida PSICQUIC PSICQUIC ServicioA PSICQUIC ServicioB PSICQUIC ServicioC PSICQUIC Registro
IntAct: Esquema de almacenamiento de datos Entrada Publicación [A] Nivelpublicación (entrada) Experimento1 Experimento2 [B] Nivelexperimento Interacción1 [C] Nivelinteracción Interacción 2 Interacción 3 Interacción 4 … … … Participante1 Participante2 [D] Nivelparticipante Características Características [E] Nivelcaracterística
IntAct: El trabajo del “curator” (curador) PROPUESTAS DIRECTAS PAQUETES DE DATOS DE PROYECTOS DE DETECCIÓN DE INTERACCIONES A GRAN ESCALA DATOS DE INTERACCIONES MOLECULARES PUBLICADOS CURACIÓN
PAQUETES DE DATOS DE PROYECTOS DE DETECCIÓN DE INTERACCIONES A GRAN ESCALA PROPUESTAS DIRECTAS Gene Ontology FUNCIÓN UniProtKB SECUENCIAS PROTEÍNA DATOS DE INTERACCIONES MOLECULARES PUBLICADOS ChEBI REFERENCIAS CRUZADAS MOLÉCULAS PEQUEÑAS CURACIÓN Ensembl SECUENCIAS GENOMA InterPro FAMILIAS Y DOMINIOS Otros ESTRUCTURA, ORGANISMO, TEJIDO, ETC…
Búsqueda web en IntAct www.ebi.ac.uk/intact copia y pega
Resultados de la búsqueda Enlace a UniProtKB o a Dasty Detalles de la interacción
Másinformaciónsobre IntAct: cursos “on-line” en el EBI www.ebi.ac.uk/training/online/course/intact-molecular-interactions-ebi
Desafíos en representación e integración de datos en lasredes de IPPs Blisson et al., 2011, Nature Biotechnology, PMID: 21706016.
Mas informaciónsobre el análisis del interactoma • Nuestro grupo ha escrito un tutorial dentro de un programa de la Human ProteinOrganization (HUPO) tratando la importancia del análisis de las redes de interacciones moleculares y que presenta un ejemplo de análisis guiado para el lector: Koh, Porras, Aranda, Hermjakob, & Orchard, 2012, Journal of ProteomeResearch, PMID: 22385417. • Una buena revisión general acerca de conceptos básicos en el estudio del interactoma: De Las Rivas & Fontanillo, 2010, PLoSComputationalBiology, PMID: 20589078. • Otra revisión general, centrada en el estudio del interactoma en relación a enfermedades humanas: Vidal, Cusick, & Barabási, 2011, Cell, PMID: 21414488. • Una revisión reciente sobre biología de redes diferencial, el estudio de las diferencias entre situaciones biológicas distintas en contraste con el interactoma estático: Ideker & Krogan, 2012, Molecular SystemsBiology, PMID: 22252388. • Asignar puntuaciones en función de la confianza a interacciones moleculares requiere usar estrategias paralelas y complementarias. En este artículo de evalúa la fiabilidad de distintos métodos de detección experimental con respecto a un set de interacciones de referencia: Braun et al., 2008, NatureMethods, PMID: 19060903. • Para terminar, un buen ejemplo de análisis usando datos que proceden de bases de datos primarias. Los autores construyen una red de alta calidad usando datos de interacciones binarias en las que hay información acerca de las superficies de interacción a resolución atómica, integran información relativa a mutaciones causantes de enfermedad y encuentran que existe una correlación entre la posición de dichas mutaciones en las superficies de interacción y su predisposición a causar enfermedad: X. Wang et al., 2012, NatureBiotechnology, PMID: 22252508.
Agradecimientos Jefe de grupo Henning Hermjakob Coordinadora Equipo de curación Sandra Orchard Margaret Duesbury JyotiKhadake Equipo de desarrolladores Rafael Jiménez Marine Dumousseau Noemí del Toro John Gómez