330 likes | 479 Views
Concepts biologiques et prédiction fonctionnelle. 14 Décembre 2006 Carry-le-Rouet Anthony LEVASSEUR. EA 3781 - Evolution Biologique Laboratoire de Phylogénomique UP - Case 19, Pl. V. Hugo 13331 Marseille - France.
E N D
Concepts biologiques et prédiction fonctionnelle 14 Décembre 2006 Carry-le-Rouet Anthony LEVASSEUR EA 3781 - Evolution BiologiqueLaboratoire de PhylogénomiqueUP - Case 19, Pl. V. Hugo 13331 Marseille - France UMR 1163 INRA de Biotechnologie des Champignons Filamenteux ESIL-163 av. de Luminy 13288 Marseille - France Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Plan de la présentation Introduction générale I Etude d’un cas : la famille lipase/féruloyl estérase A II Exemple d’un outil de détection du shift évolutif II.1 Exploitation des données pour la prédiction fonctionnelle II.2 Conclusion III Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
I. Introduction générale Objectif : tenter de répondre aux questions suivantes Comment exploiter l’information phylogénétique pour l’annotation fonctionnelle ? Comment les concepts de l’évolution pourraient-ils apporter de nouvelles informations ? Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Un exemple de reconstruction phylogénétique Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Recherche données fonctionnelles (expérimentales) Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Annotation par encadrement Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Intégration du shift évolutif pour l’annotation Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
II. Etude d’un cas : la famille fongique lipase/féruloyl estérase A Reconstruction phylogénétique: Protéine d’entrée: FAEA Swissprot: locus FAEA_ASPNG, accession O42807 Utilisation de la plateforme FIGENIX (http://www.up.univ-mrs.fr/evol/figenix/index.html) Pipeline : CASSIOPE_PHYLO+M Production d’un arbre consensus fusionné Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Unknown protein: gris, lipase: vert, FAEA: jaune Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Arbre obtenu après intégration des données fonctionnelles (experimental data) FAEA Lipase Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Exemple d’un outil de détection du shift évolutif II.1 PAML inclut plusieurs programmes, dans notre exemple nous avons exploité codeml pour : Estimer le taux de substitutions synonymes et non synonymes et détecter la sélection positive Comparer différents modèles pour la validation d’hypothèses (Likelihood ratio tests) Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Modèles & analyses Théorie générale: Le ratio du taux de substitutions non-synonymes sur synonymes (ω)fournit une mesure de la sélection naturelle à l’échelle protéique dans laquelle: D(N)/D(S) <1 signifie que la séquence évolue sous sélection conservatrice D(N)/D(S)=1 … sous la neutralité D(N)/D(S) >1 … sous sélection positive La description détaillée des modèles est disponible sur les sites suivants : Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Différents modèles: Le shift évolutif peut se produire pendant une période brève & sur certains acides aminés uniquement… D’où le développement de différents modèles prenant en compte ces observations. 1. Modèles branches Les modèles dits par branches permettent au ratio ω de varier parmi les branches dans une phylogénie et sont utiles pour détecter la sélection positive se produisant sur des lignées particulières 2. Modèles par sites Ces modèles dits par sites permettent au ratio ω de varier parmi les sites de la séquence protéique Plusieurs modèles ont été développés. Il apparaît que les modèles M1a (Nearly Neutral) et M2a (Positive selection) sont particulièrement utiles pour la détection de la sélection positive et sont fortement recommandés pour les tests de données réelles. Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
3. Modèles Sites + Branches 1 Yang et Nielsen (2002) ont développé un modèle (model A) qui autorise ω à varier parmi les sites et parmi les lignées. Ce modèle tente de détecter la sélection positive sur plusieurs classes de sites et se focalise sur une branche donnée. 1. Yang Z, Nielsen R. 2002. Mol Biol Evol. 19:908-917. Sélection positive La validation de la sélection positive s’effectue par un test LRT (Likelihood Ratio Test). En supposant que le modèle le plus simple (null model) ait p0 paramètres, le modèle alternatif p1 paramètres et les valeurs log likelihood sous ces deux modèles soient l0 et l1, respectivement La différence 2Δl = 2(l1-l0) a une distribution χ2 avec df= p1-p0 si le null model est vrai. 2 Δl peut être comparé à une distribution χ2 pour tester si le modèle null est rejeté contre le modèle alternatif. Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Codeml ML analysis of protein-coding DNA sequences using codon substitution models (e.g., Goldman and Yang 1994) Données d’entrées nécessaires: 1/ Alignement (ClustalW) 2/ Arbre parenthèse Fichier de contrôle ctl. : Tableau de bord permettant de cibler le modèle appliqué, divers paramètres d’analyse… Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Exploitation des données pour la prédiction fonctionnelle II.2 Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Likelihood Ratio Tests Détection de la sélection positive confirmée Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Cartographie évolutive Utilisation des sites évoluant sous sélection positive pour la prédiction fonctionnelle 17M, 19T, 22Q, 29C, 51W, 63T, 70G, 71D, 74L, 75Q, 76L, 103G, 126A, 163S 209G, 226V, 248T, 257A La prédiction fonctionnelle s’est basée sur le « profil évolutif » et à permis de compléter l’annotation de cette famille Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Lipase FAEA Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Résultats 33 sites évoluent sous sélection positive (seuil de probabilité >95%) Détection de la sélection positive confirmée Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Alignement et conservation des sites: Une majorité des sites positivement sélectionnés est conservée dans le groupe féruloyl estérase A mais pas dans le groupe des lipases Confirme le rôle essentiel des ces sites pour la fonction enzymatique La présence de sites évoluant sous sélection positive a été démontrée. Est-ce que les sites positivement sélectionnés sont impliqués dans le changement fonctionnel Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Sites sous sélection positive et implication fonctionnelle 1. Asp71 et Tyr80 dans la région du « clapet » (69-80) 2. Tyr100et le site catalytique La mutagénèse dirigée permet de connecter les sites positivement sélectionnés au changement fonctionnel Lien entre changements évolutif et fonctionnel FaeA Aspergillus niger (1USW) Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Conclusion III. Une relation entre shift évolutif et shift fonctionnel a été établie Les sites sous sélection positive représentent des « sondes évolutives » exploitables pour la prédiction fonctionnelle Pour plus d’infos… sur ces travaux : Levasseur et al. BMC Evolutionary Biology 2006, 6:92(8 November 2006) sur la détection de la sélection positive : http://workshop.molecularevolution.org/people/faculty/files/codon.html Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Remerciements EA 3781 - Evolution BiologiqueLaboratoire de PhylogénomiqueUP - Case 19, Pl. V. Hugo 13331 Marseille - France UMR 1163 INRA de Biotechnologie des Champignons Filamenteux ESIL-163 av. de Luminy 13288 Marseille - France http://www.up.univ-mrs.fr/evol/ http://umrbcf.esil.univ-mrs.fr/ Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Un point sur les définitions 1.Shift fonctionnel : Changement de la « fonction » d’un produit de gène pouvant s’opérer à diverses échelles biologiques (protéine… compartiment cellulaire… organes…organismes…population etc…) • Quelques causes du shift fonctionnel : • Micro-mutations: substitutions, délétions, insertions… • Gene shuffling • Duplications (Évolution divergente des duplicats) Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Acquisition de nouvelles caractéristiques biochimiques, colonisation de nouvelles niches écologiques… Adaptation à l’environnement • Devenir & Conséquence du shift fonctionnel : • Contre-sélection • Evolution sous la neutralité • Sélection : nouveauté conférant un avantage sélectif par rapport au milieu environnemental, reproduction… ? Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Shift évolutif: • Accélération (épisodique) du taux de substitutions d’une séquence Origine : Sélection positive Relâche de contraintes fonctionnelles Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Exemple d’un modèle statistique de prédiction fonctionnelle basé sur l’exploitation des informations phylogénétiques Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
La famille lipase/feruloyl esterase A FERULOYL ESTERASES A LIPASES Lignocellulolyse Metabolisme Cette famille possède deux types d’activité enzymatique malgrè un pourcentage de similarité de séquences élevé. Comment expliquer une telle divergence fonctionnelle au sein de cette famille ? & Quelles sont les forces conduisant à de tels événements ? Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Koseki et al., Biochim Biophys Acta, 1722: 200-8 Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006