980 likes | 1.1k Views
Gene and genome history. Equipe Evolution Biologique Modélisation UMR 6632 http://www.up.univ-mrs.fr/evol/. Somes Concepts in evolutionary biology Informatisation. Arthropods. Gastrotrichs. Nematodes. ECDYSOZOANS. Onychophorans. Tardigrades. Kinorhynchs. PROTOSTOMES. Priapulids.
E N D
Gene and genome history. Equipe Evolution Biologique Modélisation UMR 6632 http://www.up.univ-mrs.fr/evol/
Somes Concepts in evolutionary biology Informatisation
Arthropods Gastrotrichs Nematodes ECDYSOZOANS Onychophorans Tardigrades Kinorhynchs PROTOSTOMES Priapulids Molluscs Rotifers Urbilateria Annelids Gnathostomulids Sipunculans BILATERIA Nemerteans Pogonophorans LOPHOTROCHOZOANS Platyhelminthes Entoprocts Bryozoans Brachiopods Phoronids ?? Vertebrates Cephalochordates Urochordates DEUTEROSTOMES Hemichordates Echinoderms Ctenophorans Cnidarians Poriferans Metazoan Phylogeny ( Adoutte et al. 2000)
URBILATERIA : The hypothetical Metazoan Ancestor Geoffroy de St Hilaire ( XIX th Century) URBILATERIA Genome evolved by the fixation of : • Nucleotide substitution • Gene loss • Gene shuffling • Genic duplication • Gene duplication • Genome region duplication • Whole genome duplication • Chromosomal rearrangement • ……..
Ce que l’on veut • Retracer l’histoire des gènes en prenant en compte tous les événements génétiques • Lier les mutations à un shift fonctionnel • Biochimique, transcriptionnel • Physiologique, anatomique • Lier les mutations à un shift environnemental
Survol du génome • Attention il n’y a pas que les séquences codantes.
De l’ADN à la protéine ORF Région promotrice +1 5’ 3’ transcription intron1 intron2 intron3 5‘ UTR 3‘ UTR exon1 exon2 exon3 exon4 Start stop préARNm GT GT AG GT AG AG Site donneur Site accepteur épissage ARNm AAAAAA traduction Protéine
Phylogénie Construite avec des modèles évolutifs basés sur les positions … Seules les mutations ponctuelles sont prises en compte Les gap sont éliminés Distance évolutive entre les séquences: détection des orthologues et paralogues Duplication Spéciation A A A B B C B C D C D d’autres événements génétiques existent support
Les autres événements • Je n’en citerai que quelques uns • Pour les autres on réfléchira ensemble
apparition d’un nouveau site accepteur AG ORF 5’ 3’ intron1 intron2 intron3 5‘ UTR 3‘ UTR exon1 exon2 exon3 exon4 start stop préARNm GT GT AG AG GT GT AG AG AG Épissage alternatif tissu spécifique Protéine isoforme2 Protéine isoforme1
Mutation ponctuelle sur site accepteur: perte d’exon ORF 5’ 3’ intron1 intron2 intron3 5‘ UTR 3‘ UTR exon1 exon2 exon3 exon4 start stop préARNm GT GT AG GT AG AG Perte de l’exon 2 Protéine isoforme2 Protéine isoforme1 ancestrale
Perte puis apparition d’un site donneur GT ORF 5’ 3’ intron1 intron2 intron3 5‘ UTR 3‘ UTR exon1 exon2 exon3 exon4 start stop préARNm GT GT AG GT AG AG GT Élongation d’exon ou stop
Perte du codon stop ORF 3’ intron1 intron2 intron3 5‘ UTR 3‘ UTR exon1 exon2 exon3 exon4 start stop GT GT AG GT AG stop stop AG Élongation d’exon
A1 A2 A3 A1 A2 A3’ A3” A1 A2 A3 URBILATERIA Speciation A1/2 A3 Duplication A Orthologs and paralogs HUMAN multigenic family DROSOPHILA multigenic family A1, A2, B Paralogs
Retracer l’histoire des gènes • Lier les mutations à un shift fonctionnel • Biochimique, transcriptionnel • Physiologique, anatomique
Retracer l’histoire des gènes en prenant en compte tous les événements précédents • Lier les mutations à un shift fonctionnel • Biochimique, transcriptionnel • Physiologique, anatomique • Lier les mutations à un shift environnemental
La phylogénie • Reconstruction de l'histoire évolutive d'un gène (ou produit de gène) dans un ensemble d'espèces. • Évolution du gène dans plusieurs lignées représentée par un arbre phylogénétique.
Évolution des séquences (ADN ou protéines) • Mutations ponctuelles (substitutions, indels): • Méthodes: • Distances : mesure de distance ou de similarité afin de regrouper (en anglais : clustering) des séquences proches. (ex: Neighbor Joining: minimise la longueur totale de l’arbre)
Évolution des séquences (ADN ou protéines) • Mutations ponctuelles (substitutions, indels): • Méthodes: • Distances • Maximum Parcimonie: basée sur les caractères, recherche du meilleur arbre possible :
Évolution des séquences (ADN ou protéines) • Mutations ponctuelles (substitutions, indels): • Méthodes: • Distances • Maximum Parcimonie • Maximum de Vraisemblance:
Évolution des séquences Une fois l’arbre phylogénétique obtenu : Rajouter les autres événements pouvant se produire dans le génomes (duplications, exon shuffling, perte d’exon, élongation des introns, shift transcriptionnel…).
Comment se fixe les mutations • Processus populationnel
Allele A fixation and accumulation of new mutations A B C D POP 1 split in 2 autonomous populations A1 A2 POP 1A A B C D Allele B fixation and accumulation of new mutations Population : POP 1 A B C D B1 B2 POP 1B From alleles to orthologs Points mutations I
POP 1A split in 2 autonomous populations Allele A1 fixation and accumulation of new mutations A11 A12 POP 1A1 A1 A2 Allele A2 fixation and accumulation of new mutations POP 1A A21 A22 POP 1A2 A1 A2 POP 1Bsplit in 2 autonomous populations Allele B1 fixation and accumulation of new mutations B11 B12 POP 1B1 Allele B2 fixation and accumulation of new mutations B1 B2 B1 B2 POP 1B B21 B22 POP 1B2 From allelesto orthologspoints mutations
A.1.1 A.1.2 A.2.1 A.2.2 B.1.1 B.1.2 B.2.1 B.2.2 Alleles Orthologs Alleles Alleles Alleles From allelesto orthologs
From Gene History To Gene Function
Fonction: une notion imprécise. • La façon dont les mutations se fixent peuvent renseigner sur la fonction.
A Orhologs under purifying selection HUMAN Ancestral Function DROSOPHILA Ancestral Function A A Purifying Selection Purifying Selection Speciation URBILATERIA
A Ortholog functional switch HUMAN New Function ? DROSOPHILA Ancestral Function A A2 Positive selection Or relaxed Purifying Selection Speciation URBILATERIA
A Co-ortholog Sub Functionalization DROSOPHILA Ancestral Function HUMAN Sub-Function HUMAN Sub-Function A A’ A” Duplication Purifying Selection Speciation URBILATERIA
A Co-ortholog Neo Functionalization HUMAN Ancestral Function HUMAN New Function DROSOPHILA Ancestral Function A A A2 Positive or relaxed selection Duplication Purifying Selection Purifying Selection Speciation URBILATERIA
Speciation Duplication Orthology/ Paralogy Orthologs : 2 genes on different species Which come from a common ancestor and separated by a speciation event. A1 HUMAN A1 DROSO A1/2 A2 HUMAN Paralogs : 2 genes resulting from a duplication event in a genome. A2 DROSO A A3’ HUMAN A3” HUMAN Co-Orthologues A3 A3 DROSO
Evolutionary shift (due to positive or relaxed selection) could be linked to functional shift .
Example developed in our team : The lipase esterase FERULOYL ESTERASES A LIPASES Lignocellulolyse Metabolisme Cette famille possède deux types d’activité enzymatique malgrè un pourcentage de similarité de séquences élevé. Comment expliquer une telle divergence fonctionnelle au sein de cette famille ? & Quelles sont les forces conduisant à de tels événements ?
Sites sous sélection positive et implication fonctionnelle 1. Asp71 et Tyr80 dans la région du « clapet » (69-80) 2. Tyr100et le site catalytique La mutagénèse dirigée permet de connecter les sites positivement sélectionnés au changement fonctionnel FaeA Aspergillus niger (1USW) Lien entre changements évolutif et fonctionnel
Detection of Evolutionary constraint relaxation and functional shift • (Dykhuizen- Hartl effect" Kimura (1983))
A Co-ortholog Neo Functionalization HUMAN Ancestral Function HUMAN New Function DROSOPHILA Ancestral Function A A A2 Duplication Purifying Selection Purifying Selection Speciation URBILATERIA
Paralogue replacement PSMB5 PSMB8 (LMP 7) PSMB6 PSMB9 (LMP 2) PSMB7 PSMB10 (LMP Z) Constitutive Proteasome Immuno-Proteasome • New function (specialization) (Specific size protein or peptide degradation – used by MHC system) • Only found in vertebrates • Ancestral function : Protein degradation • Present in all Metazoans, therefore present in Urbilateria (Metazoan ancestor). Constitutive proteasome β-subunits replacement after Interferon-γ stimulation Paralogue = duplicated gene
Large scale gene duplication in vertebrate lineage Amniota (Human) 360 450 Vertebrates Lisamphibia 528 ImmunoProteasome Actinopterygii (Zebrafish) Chondrichthyes (shark) Deutérostomata 564 Cephalaspidomorphi (lamprey) 751 Myxini (Hagfish) Proteasome >751 Céphalochordata (amphioxus) <833-993 Urochordata (Ciona) Echinodermata PROTEASOME Insects (Drosophila) 833-993 Protostomata Nématod (c. elegans)
58 59 * 52 PSMB7 Mus 69 91 80 99 PSMB7 Ratt 91 100 95 PSMB7 Bos 98 * PSMB7 Homo 62 Duplication 88 PSMB7 Gall 75 PSMB7 Xeno * 93 * * PSMB7 Zebra * 95 59 58 PSMB7 Fugu PSMB10 Zebra 95 78 99 PSMB10 Fugu 74 100 * PSMB10 Bos 93 100 * PSMB10 Mus 100 * PSMB10 Homo 62 80 PSMB7/10 Bran * PSMB7/10Ci-zeta Cionai 78 76 PSMB7/10 Bombyx * PSMB7/10Prosbeta2 * 95 * PSMB7/10CG18341 Drosophila 44 0.1
The study genes and genomes HISTORY. Help to find evidences for gene FUNCTION.
On sait « bien modéliser » l’histoire des substitutions mais pas ou peu les autres événements (quelques travaux sur les indels par exemple)