350 likes | 445 Views
Quelques d é finitions. Arbre = réseau connexe non cyclique. noeud. branche. Réseau connexe non cyclique. Réseau connexe cyclique. Réseau non connexe non cyclique. Jeong et al, Nature 2001. Qualit é du r é seau d ’ interactions.
E N D
Quelques définitions Arbre = réseau connexe non cyclique noeud branche Réseau connexe non cyclique Réseau connexe cyclique Réseau non connexe non cyclique
Qualité du réseau d’interactions Très nombreuses interactions protéine/protéine détectées par différentes méthodes • Pourquoi ? • Les méthodes sont prévues pour détecter des interactions différentes (binaire pour le double hybride, interactions fortes pour la protéomique, etc.) • Les méthodes se trompent (faux positifs, faux négatifs) Nécessité de valider les résultats
Qualité du réseau d’interactions Construction d’un ensemble d’interactions validées manuellement 10 907 interactions impliquant 1308 protéines de la levure Saccharomyces cerevisiae (http://mips.gsf.de/proj/yeast/catalogues/complexes/index.html) • Coverage (couverture) : fraction des interactions de référence analysées par une méthode donnée • Accuracy (précision) : fraction des interactions de référence retrouvées par une méthode donnée Von Mering et al, Nature (2002) 417:399-403
Qualité du réseau d’interactions Von Mering et al, Nature (2002) 417:399-403
Qualité du réseau d’interactions Von Mering et al, Nature (2002) 417:399-403
Qualité du réseau d’interactions Von Mering et al, Nature (2002) 417:399-403
Qualité du réseau d’interactions Filtrage : interactions détectées trois fois pour le double-hybride, par exemple Von Mering et al, Nature (2002) 417:399-403
http://string.embl.de/ Von Mering et al. (2005) Nucleic Acids Research, 33:D433–D437
Distance et Distance caractéristique d’un réseau • la distanced(u,v) est la longueur du plus court chemin connectant deux noeuds, c-à-d le nombre minimal de noeuds qu’il faut traverser pour se rendre d’un noeud u à un noeud v • la distance caractéristiqueL = meanu,v d(u,v) d’un graphe est la longueur moyenne du plus court chemin connectant deux noeuds http://mathworld.wolfram.com/GraphDistance.html
Diamètre d’un réseau 3 4 5 7 • le diamètreD = maxu,v d(u,v) d’un graphe est la longueur du plus long des plus courts chemins connectant deux noeuds, c’est-à-dire le nombre maximal de noeuds qu’il faut traverser pour se rendre d’un noeud u à un noeud v lorsque les retours, détours et boucles sont interdits http://mathworld.wolfram.com/GraphDiameter.html
Réseaux « Small-World » • dans un réseau Small-World, la plupart des noeuds sont voisins les uns des autres, c-à-d qu’il faut traverser un petit nombre de noeuds pour se rendre d’un noeud u à un noeud vex : WWW ; liens sociaux entre les êtres humains formellement, on dit que son diamètre est petit (D ≤ 6) • ces réseaux ont des distances caractéristiques faibles http://en.wikipedia.org/wiki/Small-world_network
Connectivité d’un réseau • la connectivité K d’un réseau est le nombre minimal de liens connectant deux noeuds u et v • formellement, c’est le nombre minimal de noeuds qu’il faut supprimer pour déconnecter le réseau http://web.hamline.edu/~lcopes/SciMathMN/concepts/cevcon.html
la connectivité K d’un noeud (protéine i) est le nombre de liens émanant du noeud i Connectivité d’un noeud Exponential Scale-free HUB Jeong et al, Nature 2000
Une autre représentation du réseau 6 3 7 4 8 2 5 1 9
Après un algorithme de clustering 6 3 7 4 8 2 5 1 9
Modular organization of cellular networks D 0 1 P - polarity R - Ras related pathway H - Highly osmotic conditions M - Mating/filamentation Rives AW et al. PNAS, 2003
Modular organization of cellular networks - Modules - Intermodular connections Rives AW et al. PNAS, 2003
Recherche de modules Gavin et al. (2006) Nature, doi:10.1038/nature04532
Recherche de modules A(i,j) : indice de socio-affinité ni;j|i=bait : nombre of fois où protéines i et j sont retrouvées quand I est étiquettée : nombre of proies récupérées quand i est un appât : nombre de fois où protéines i and j sont copurifiées avec d’autres appâts. Gavin et al. (2006) Nature, doi:10.1038/nature04532
Recherche de modules Gavin et al. (2006) Nature, doi:10.1038/nature04532
Recherche de modules Gavin et al. (2006) Nature, doi:10.1038/nature04532
Essentialité des gènes Yu et al (2004) Trends in Genetics 20:227-231
Essentialité des gènes Hubs : 1061 protéines qui ont le plus grand nombre d’interactions Yu et al (2004) Trends in Genetics 20:227-231
Robustesse du réseau aux mutations Jeong et al, Nature 2000
Robustesse du réseau aux mutations Freeland et al. (2000) Mol. Biol. Evol. 17:511–518
Perspectives : combiner les réseaux Kelley & Iteker (2005) Nature Biotechnology23:561-566
AD B A Reporter gene DBD Large-scale experimental methods for revealing protein-protein interactions: Yeast Two Hybrid Assay DNA Uetz P, et al.A comprehensive analysis of protein-protein interactions in Saccharomyces cerevisiae. Nature. 2000 Feb 10;403(6770):623-7.( 981 interactions, 1044 proteins ) Ito T, et al.A comprehensive two-hybrid analysis to explore the yeast protein interactome. Proc Natl Acad Sci U S A. 2001 Apr 10;98(8):4569-74.( 4393 interactions, 3278 proteins )
Large-scale experimental methods for revealing protein-protein interactions: Tandem Affinity Purification- MassSpectrometry Gavin AC, et al.Functional organization of the yeast proteome by systematic analysis of protein complexes. Nature. 2002 Jan 10; 415, 141-147. ( 31304 interactions, 1361 proteins )
Large-scale experimental methods for revealing protein-protein interactions: Tandem Affinity Purification- MassSpectrometry Gavin AC, et al.Nature. 2006 ( ~ 500 complexes, involving ~ 60% of yeast genes )
Large-scale experimental methods for revealing protein-protein interactions: • Yeast Two Hybrid ~6,400 interactions • Pull-down ~42,000 interactions • Overlap: • ~400 interactions detected by all experiments • ~2500 interactions detected by more than one experiment • Small overlap is due to: • incomplete coverage of yeast interactome by large-scale screens • limitations of experimental techniques (high false positive rates, inability to capture interactions between certain classes of genes)
PCA (Protein fragment Complementation Assays) Screening A B Quantitation Pharmacology A B Localization Trafficking Screening Dynamics Pharmacology Localization Trafficking
Requirements for Network Visualization • Molecular interactions are detected directly. • Extremely high dynamic range • Genes are expressed in a relevant cellular context, in which components of the underlying pathway exist. • Events induced by any pathway perturbation can be detected, linking specific interactions to specific pathways. • Subcellular locations of protein complexes can be determined unambiguously. • Can be scaled and require no specialized detection technology.
I/Io Or Ic/ In Time B A P1 Assay1 P1 Assay2 Module 3 A Module 1 Module 2 Module 1 Module 2 Module 3 P3 P1 P2 Assays Module 1 Module 2 Module 3