580 likes | 765 Views
Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes Architecture génétique des caractères quantitatifs - cartographie génétique et détection de QTL - Pierre-François Bert ( pfbert@bordeaux.inra.fr ). I - Introduction. Définitions
E N D
Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes Architecture génétique des caractères quantitatifs- cartographie génétique et détection de QTL - Pierre-François Bert (pfbert@bordeaux.inra.fr)
I - Introduction Définitions * Locus (pl: locus; loci en anglais) : Un locus définit l'emplacement d'un allèle ou d'un gène sur un chromosome ou la carte le représentant. * Allèle : on nomme allèle une variante donnée d’un locus (nucléotide ou par extension gène) au sein d'une espèce. * Polymorphisme : Les mutations modifient la séquence nucléotidique de la molécule d'ADN. Pour de nombreux locus (gènes ou marqueurs génétiques), il existe plusieurs allèles répandus dans les populations constituant l'espèce : c'est le polymorphisme génique ou polyallélisme. * Une carte génétique est un alignement linéaire de la position relative de locus (gènes et marqueurs génétiques) sur un chromosome et les distances entre eux, basé sur les fréquences de recombinaison.
I - Introduction Définitions * Un locus à effets quantitatifs ou de caractère quantitatif (abrégé en QTL pour quantitative trait locus) est un locus où la variation allélique est associée à la variation d’un caractère quantitatif (= caractère polygénique). * Génotype : ensemble des gènes d‘un individu. * Phénotype : caractéristiques d'un individu dans un milieu donné. -> Résultat du dialogue génotype - milieu * Milieu : Ensemble des causes non génétiques de la variation (contrôlés = macro milieu et non contrôlés = micro milieu) * Pléiotropie : Un simple allèle peut induire plusieurs effets phénotypiques apparemment indépendants. * Epistasie : phénomène au cours duquel un gène altère l'effet d'un autre.
I - Introduction Pourquoi s’intéresse-t-on aux variations génétiques ? -> Peuvent servir pour l’identification génétique par empreintes génétiques (identification, sélection, traçabilité …) ->Peuvent servir pour décrire les caractéristiques génétiques d’une population (Niveau de diversité, Structure de la diversité, Flux de gènes, Sélection…) ->Peuvent servir à la gestion des ressources génétiques -> Peuvent être à l’origine de la variation phénotypique de caractères d’intérêts agronomiques, de maladies génétiques simples ou complexes
I - Introduction Distinction entre les caractères dits "quantitatifs" et les caractères "qualitatifs"
I - Introduction Distinction entre les caractères dits "quantitatifs" et les caractères "qualitatifs". • Variations discrètes : Nombre fini de modalités différentes souvent faible • Ex : Groupe sanguin ABO • Aspect lisse ou ridé des grains • Couleur de pelage animal, de pétales de fleurs • Résistance à des maladies • Caractère qualitatif quand regroupement en classes génotypiques • Relation phénotype/génotype simple • Effet allélique : phénotype "sauvage"/phénotype "mutant" • (cf. Lois de Mendel)
I - Introduction Distinction entre les caractères dits "quantitatifs" et les caractères "qualitatifs" • Variations continues : Répartition continue dans une gamme de valeurs (mesures) • Ex : Taille, poids, • Diabète de type 2 • Pression sanguine • Quantité de lait produit • Résistance à des maladies • Caractère dit quantitatif quand risques d‘erreur de classification • Relation phénotype/génotype ambiguë • La génétique quantitative rend compte de l‘hérédité de ces caractères
I - Introduction Bases génétiques de la variation continue La Plupart des caractères d’intérêt agronomique sont quantitatifs GENETIQUE QUANTITATIVE La génétique quantitative traite avec les phénotypes et fait la déduction des bases génétiques sous-jacentes Étudie des bases génétiques (hérédité) de la variation des caractères quantitatifs
I - Introduction Bases génétiques de la variation continue
I - Introduction 600 400 15 200 0 10 151-160 161-170 171-180 181-190 191-200 5 0 151 200 Bases génétiques de la variation continue 5 classes 18 classes 200 nombre 100 50 0 … … 196-200 151-154 155-158 159-161 taille Valeurs individuelles -> Distribution continue -> Distribution normale -> transformation mathématique Taille de 1 000 étudiants. Source : Castel, 1916
I - Introduction La distribution de la variation suit une loi normale Bases génétiques de la variation continue
II- Mise en évidence des facteurs de la variation génétique Longueur de la corolle de N. langiflora – East 1915) 150 n P2 Sx = 2.2 P1 Sx = 1.5 Individus P1, P2 etF1génétiquement Identiques 100 50 0 Variance d’origine environnementale n F1 Sx = 2.8 100 50 0 Variance en F2 évoque une ségrégation de plusieurs gènes n F2 Sx = 6.4 100 Ségrégation à plusieurs locus 50 150 n Résultats théoriques attendus pour un polymorphisme à 1 seul locus ( ¼ P1; ½ F1; ¼ P2) 100 50 34 40 46 52 58 64 70 76 82 88 94 100 mm
II- Mise en évidence des facteurs de la variation génétique Taux de survie à une dose de DDT chez la drosophile. Les individus observés comportent diverses combinaisons de chromosomes, décrites pour les chromosomes X, 2 et 3, respectivement : c = chromosome originaire de la lignée de contrôle s = chromosome originaire de la lignée sélectionnée pour la résistance au DDT. -> Les locus responsables des variations des caractères quantitatifs ont des effets qui se cumulent. Source : Crow, 1957.
II- Mise en évidence des facteurs de la variation génétique Poids à 60 jours (en g) de 50 souris mâles issues d’une lignée sélectionnée pour de faibles poids. -> L’existence d’un gène majeur n’exclut pas celle d’autres gènes induisant des variations pour le caractère étudié. Source : King, 1950.
II- Mise en évidence des facteurs de la variation génétique Nombre de génotypes possibles selon les nombres de locus et d’allèles par locus. * Nombre de génotypes différents pour 1 locus et K allèles * Nombre de génotypes différents pour L locus et K allèles
II- Mise en évidence des facteurs de la variation génétique Distribution des valeurs selon le nombre de locus La valeur d’un génotype est la somme des valeurs apportées par chaque allèle. A chaque locus, 2 allèles de même fréquence, l’un apportant une valeur nulle et l’autre une valeur de 1 : la valeur des génotypes va donc de 0 (homozygotes « 0 » à tous les locus) à 2 fois le nombre de locus (homozygotes « 1 » à tous les locus). On ne considère pas ici d’effet de milieu.
II- Mise en évidence des facteurs de la variation génétique Pas d'entorses à la génétique mendélienne en supposant 1. Influence de plusieurs locus en ségrégation 2. et des effets du milieu contribuant à la variation. 150 1 gène 2 gènes 0.5 n P1 Sx = 1.5 P2 Sx = 2.2 0.4 Fréquences génotypiques 100 0.3 0.2 50 0.1 0 Valeurs phénotypiques Valeurs phénotypiques 34 40 46 52 58 64 70 76 82 88 94 100 150 4 gènes 6 gènes 0.4 n Fréquences génotypiques F1 Sx = 2.8 0.3 100 0.2 50 0.1 0 Valeurs phénotypiques Valeurs phénotypiques 34 40 46 52 58 64 70 76 82 88 94 100 150 n Ces facteurs peuvent alors être traités comme des locus génétique simple c‘est à dire des QTL Transgressifs 100 F2 Sx = 6.4 50 0 34 40 46 52 58 64 70 76 82 88 94 100 mm
II - Mise en évidence des facteurs de variation génétique L’ hypothèse multifactorielle "les variations observées des caractères quantitatifs sont imputables aux ségrégations à plusieurs locus et aux facteurs du milieu". 1 locus + effets non génétiques 1:2:1 2 locus 4 locus plusieurs locus Hypothèse multifactorielle concilie la nature discontinue de l’hérédité mendélienne et la continuité des caractères quantitatifs et la normalité de leur distribution.
III - Mise en évidence des facteurs de la variation liés au milieu L’action du génotype et du micro-milieu • Le phénotype présente une distribution continue… sous entends l’effet sur le caractère de nombreux gènes et de facteurs de l’environnement • P = G + E + G×E • Le milieu • - environnement (climat, traitements, alimentation ...) • - état physiologique (poids, age, grossesse ...) • - observateur (protocole, précision, erreurs ...) • * Facteurs de milieu : • - macro milieu (contrôlé) • fortes variations sur l'ensemble des individus (engrais , traitement pharmaco, lieu de test... ) • - micro milieu (non contrôlé) • faibles variations entre les individus (micro hétérogénéité du sol, fertilité... ).
III - Mise en évidence des facteurs de la variation liés au milieu Héritabilité Action du micro-milieu L’héritabilité au sens large est donc une proportion : c’est la part de variance phénotypique qui est d’origine génétique.
III - Mise en évidence des facteurs de la variation liés au milieu Interactions génotype x milieu P Valeur phénotypique P Valeur phénotypique G1 G2 G1 G3 G2 G3 1 2 3 milieu 1 2 3 milieu Absence d’effet milieu Additivité des effets milieux et génotypes G1 P Valeur phénotypique P Valeur phénotypique G2 G2 G3 G3 G1 1 2 3 1 2 3 milieu milieu Interaction G x E modification des classements Interaction G x E avec effet d’échelle Variations importantes sur les caractères Conséquences pour l’amélioration des espèces domestiques : -> Quel est le meilleur génotype dans un milieu donné ? -> Dans quel milieu pratiquer la sélection ?
IV - Mise en évidence des QTL Années 1920: Fisher et Wright naissance de la génétique quantitative : branche statistique de la génétique basée sur les principes fondamentaux de Mendel. "Existence d’un grand nombre de gènes à effets faibles" Années 50: Premières applications pratiques Années 60 et 70: Développement sur pedigree complexes Années 1980: La cartographie des QTL a pu devenir une réalité principalement grâce à la disponibilité de marqueurs moléculaires et de l’informatique. Années 1990: Mort de la génétique quantitative ? En fait l’idée simple que ces caractères étaient contrôlés par un nombre infini de gènes à effet faible et cumulatif est abandonnée.
IV - Mise en évidence des QTL La première expérience de détection de QTL: SAX (1923) VARIETY A VARIETY B quantitative trait : 280 mg 560 mg mean weight of the seeds Colored seed coat qualitative trait : seed coat color Uncolored see coat F1 hybrid with colored seed cot selfing colored 3/4 frequency in the F2 uncolored 1/4 mean weight (mg) 390 338
IV - Mise en évidence des QTL QTL QUANTITATIVE QUALITATIVE weight locus C pourpre chromosome QTL = Quantitative Trait Locus Gelderman, 1975 « locus controling part of the phenotypic variation of a quantitative traits» Payne (1918) : chromosome X in drosophila contains genetic factors controlling bristle number. Lindstrom (1924) : linkage between a locus controling tomato fruit color and a genetic factor controling fruit size. Smith (1937) : color of the flower and size of the corolla in tobacco
IV - Mise en évidence des QTL Rappel : Qu’est ce qu’un QTL? Un QTL (quantitative trait locus) est un locus génétique qui affecte un caractère qui est mesuré sur une échelle quantitative. Les caractères quantitatifs sont typiquement affectés par plus d’un gène et aussi par l’environnement. Les QTL correspondent à des segments plus ou moins grands qui peuvent contenir plusieurs gènes.
V - Principes et méthodes de détection de QTL Il y a-t-il une association entre le génotype au marqueur et le phénotype du caractère quantitatif ? La mise en évidence et la localisation des QTL se fait par rapport à des marqueurs génétiques (moléculaires): on relie le polymorphisme des marqueurs aux variations d’un caractère quantitatif à travers une descendance en ségrégation de parents de génotype connu. si co-ségrégation entre les allèles à certains marqueurs et les valeurs observées pour le caractère quantitatif détermination de locus dont le polymorphisme induit des variations sur le caractère étudié (des QTL)
V - Principes et méthodes de détection de QTL Individuals number performance Et dans la pratique ? Pour chaque individu de la descendance il faut : . déterminer le génotype d’un ensemble de marqueur distribués sur le génome cf. cartographie génétique . mesurer la valeur du caractère quantitatif étudié pour chaque individu Morphologic markers Molecular markers Mesures du caractère
V - Principes et méthodes de détection de QTL Et dans la pratique ? 1 2 …...n 1 2 3 4 Matrice de données Il faut rechercher par méthodes statistique les locus marqueurs dont le génotype est corrélé au caractère et estimer les paramètres génétiques de l’action des QTL détectés. Ceci -> soit en analyse marqueur par marqueur -> soit en prenant en compte conjointement 2 ou plusieurs marqueurs
V - Principes et méthodes de détection de QTL Analyse sur simple marqueur a QTL1 A QTL2 a QTL1 A QTL2 a QTL1 F1 A QTL2 a QTL1 a QTL1 A QTL2 F2 a QTL1 A QTL2 A QTL2 Tri des individus pour leur génotype (aa; aA; AA) au QTL Si différence significative entre moyennes phénotypiques observées Effets des 2 allèles au QTL sont suffisamment différents pour avoir des conséquences détectables.
V - Principes et méthodes de détection de QTL Analyse sur simple marqueur Relation entre le polymorphisme de chaque locus marqueur et la valeur du caractère quantitatif considéré chez les descendants de parents de génotype connu (ici F2) Comparaison des moyennes phénotypiques entre les classes génotypiques M2M2 M1M1 M1M2 Pas de QTL un QTL un QTL Une corrélation entre la dose d’allèles M2 et la valeur du caractère indique l’existence d’un QTL du caractère au voisinage du marqueur
V - Principes et méthodes de détection de QTL • Analyse sur simple marqueur • Analyse de variance (ANOVA) ou test de Student • Relation entre le génotype de chaque locus marqueur et la valeur du caractère quantitatif considéré • Classifie la descendance par marqueur génotypique • Compare les moyennes phénotypiques entre classes alléliques (test t ou test F) • Test significatif = marqueur lié au QTL • Différence entre les moyennes = estimation de l’effet du QTL • Conditions d’application d’une ANOVA : • Normalité intra-classe et homogénéité des variances
V - Principes et méthodes de détection de QTL Mise en évidence des liaisons marqueur / QTL Les individus d’un même génotype marqueur suivent une loi normale aa aA AA Le test de liaison consiste à savoir si les moyennes des 3 classes sont différentes entre elles. Si différences significatives le locus affecte le caractère quantitatif : il y a un QTL. La détection dépend : -> de l’ampleur des différences entre moyennes de classes -> de la variation intra-classe qui dépend - de l’effet du milieu - de l’effectif par classe - de la variation due aux autres locus intervenant
V - Principes et méthodes de détection de QTL Analyse sur simple marqueur si la valeur Fobs > Fthéo Ho rejetée "effet significatif du facteur génotype au marqueur" Présence d’un QTL * Nombre de classes génotypiques du marqueur : - 3 classesen F2 - marqueur codominant ANOVA 1 - 2 Classes en BC, HD, RIL ou F2 - dominant Test t (r – 1) (N – r)
V - Principes et méthodes de détection de QTL Avantages et inconvénients de l’analyse sur marqueur unique • Avantages : Ne nécessite pas de carte de liaison génétique Utilise des programmes statistiques simples (Excel , SAS…) Méthode "robuste" aux écarts à la normalité • Inconvénients : Si 1 QTL n’est pas localisé exactement au marqueur alors entre moyennes SCEF R² • A l’intérieur de chaque catégorie de marqueur, il y a toujours une forte proportion de variance – sans cette variance l’effet des QTL serait mieux estimé • Une part de cette variance peut résulter de l’effet d’autres QTL qui ségrègent dans d’autres régions du génome
V - Principes et méthodes de détection de QTL Méthode d’analyse multi locus • nécessite une carte génétique • Cartographie d'intervalle : • - "Simple Interval mapping ou SIM„ • Méthode des LOD score et de régression linéaire • - "Composite interval mapping ou CIM" • Méthode des LOD score et de régression linéaire faisant intervenir des co facteurs
V - Principes et méthodes de détection de QTL La cartographie d’intervalle simple (Simple Interval Mapping) La cartographie d’intervalle est similaire en forme à l’analyse sur l’association à un seul locus, le locus cible est remplacé par une position dans un intervalle cible Basée sur l’hypothèse qu’il au + 1 QTL dans l’intervalle entre les 2 marqueurs G et D liés avec un taux de recombinaison r. L’effet attendu d’un QTL hypothétique à cette position est estimée à partir des génotypes aux locus marqueurs flanquant l’intervalle. G R1 Q R2 D R Modèle d’Intervalle Mapping
V - Principes et méthodes de détection de QTL ^ ^ ^ ^ L (µ, a, d, ²) ^ ^ L (µ, 0, 0, ²) La méthode du LOD score (Lander et Botstein, 1989) Calcule en chaque position du groupe de liaison, sur une fenêtre de n cM, le logarithme décimal du rapport de vraisemblance LOD = log10 = où µ, a, d et ² représentent les estimations des paramètres de moyenne, d’additivité, de dominance et de variance * LOD seuil = correction de la valeur du risque α en fonction du nombre d’intervalles entre deux marqueurs (M), suivant la relation α’=1-(1-α)1/M * I.C = LOD max - 1 fonction de vraisemblance sous l’hypothèse de présence d’un QTL fonction de vraisemblance sous l’hypothèse d’absence de QTL (où a et d sont nulles) ^ ^ ^ ^
V - Principes et méthodes de détection de QTL Courbe de LOD en fonction de la position sur le groupe de liaison Intervalle de confiance = LODmax- 1 I.C de position du QTL = 15cM
V - Principes et méthodes de détection de QTL La cartographie d’intervalle composite (Composite Interval Mapping) Cofacteur : - marqueurs du génome - QTL préalablement détectés Permet de contrôler le bruit de fond (genetic background) Réduit la probabilité de détecter des QTL “fantôme”
V - Principes et méthodes de détection de QTL La méthode de régression linéaire (Haley et Knott, 1992) À chaque position dans un intervalle donné, la meilleure estimation est celle qui minimise le CMR Présence d’un QTL testée par : F(x) = CMQ / CMR F(x) = loi Fisher F (1, N-2) ; N nb d’individus . CMQ Carré moyen associé à l’effet du marqueur (1 ddl) . CMR Carré moyen résiduel (N – 2 ddl) Équivalente en terme de puissance / méthode EMV Estimation des paramètres du modèle par la méthode des moindres carrés :
V - Principes et méthodes de détection de QTL Paramètres influençant la détection des QTL * Choix des parents pour la population - Distance génétique si distance détection des QTL à effets faibles * Taille de la population analysée si N , puissance de test (QTL à effets faibles détectables) I.C. sur la position du QTL * Nombre de marqueurs si distance moyenne entre 2 marqueurs est faible (<10cM) I.C. du QTL * Précision de l’expérimentation = part de la variabilité phénotypique d’origine génétique h²SL= ²g /²p -> si h²SL QTL à effets faibles détectables
VI - Paramètres définissant l’action d’un QTL Mesure de l’effet d’un QTL Chaque QTL en ségrégation contribue à une part de la variation phénotypique totale Part de la variation expliquée quantifiée par le R² R² = SCEF / SCET = SCEF / (SCEF +SCER) Ex : si R² = 0.2 20% de la variation phénotypique due au QTL Rq : * si marqueur non lié strictement au QTL La entre moyennes La SCEF (variation due au génotype au marqueur) Le R²
VI - Paramètres définissant l’action d’un QTL Effet allélique I. La dominance: Détectée dans les populations F2 et Calculée par: Heterozygous – [(P1+P2)/2] Une valeur positive reflète une valeur des hétérozygotes qui dépasse la valeur moyenne des parents Une valeur négative reflète une valeur des hétérozygotes qui est inférieure à la valeur moyenne des parents II. L’additivité : effet des homozygotes Calculée par : (Homozygotes P1 – HomozygotesP2)/2 Un effet positif reflète une augmentation de la valeur du caractère de l’homozygote P1 Un effet négatif reflète une augmentation de la valeur du caractère de l’homozygoteP2 Signe de a allèle favorable
VI - Paramètres définissant l’action d’un QTL Effet additif a et degré de dominance d Valeur du caractère m22 m22 a a d m11 + m22 m11 + m22 2 2 additivité |d/a| = 0 dominance partielle 0 < |d/a| > 1 m11 m11 Génotype (dose d’allèle M2) 0 1 2 0 1 2 M1M1 M1M2 M2M2 M1M1 M1M2 M2M2 m22 m22 d a d a m11 + m22 m11 + m22 2 2 dominance complète |d/a| = 1 superdominance |d/a| > 0 m11 m11 0 1 2 0 1 2 M1M1 M1M2 M2M2 M1M1 M1M2 M2M2
VI - Paramètres définissant l’action d’un QTL Comment décrire un QTL ? a c d 2 e Trait Interval Chr Length Positi on Allelic effect LOD R (%) QTL b RRL RG406 - RZ252 1 6.5 6.0 0.100 (O) 2.4 9.0 QAlRr1.1 CDO1395 - RG391 3 0.6 0.0 0.167 (O) 8.3 24.9 QAlRr3.1 RZ629 - RG650 7 29.8 18.0 0.126 (O) 5.4 22.5 QAlRr7.1 RG28 - RM223 8 31.0 18.0 0.104 (O) 2.5 20.8 QalRr8.1 RM201 - WALI7 9 10.0 8.0 0.109 (O) 2.6 9.9 QAlRr9.1 R² total 70.8
VI - Caractéristiques sur les analyses QTL Distribution du nombre de QTL détectés dans un croisement 176 combinaisons expérience/caractère 4 QTL détectés en moyenne dans un croisement pour un caractère Le nombre de QTL que l’on peut détecter dans une population est limité par la taille de la population puissance de détection Kearsey et Farquhar, 1998
VI - Caractéristiques sur les analyses QTL Distribution des effets des QTL Kearsey et Farquhar, 1998 Du fait des variations environnementales et de l’échantillonnage d’un nombre fini d’individus par population : Les QTL de faible effet ne sont pas détectés Les effets des QTL détectés sont surestimés
Application de l’utilisation des marqueurs en génétique quantitative: SELECTION ASSISTEE PAR MARQUEURS Construction de génotypes Prédiction de la valeur d’amélioration
Nombre d’individus performance Marker allele Recherche de QTL impliqués dans la hauteur 1 2 …...n 1 2 3 4 + Association entre les allèles aux marqueurs et les variation du caractère No Yes 01 01 Marker allele