900 likes | 1.34k Views
Génétique des Maladies Multifactorielles. Stéphanie Debette MCU-PH Epidémiologie – Neurologie Lariboisière stephanie.debette@lrb.aphp.fr. Génétique des maladies multifactorielles. Approche épidémiologique Epidémiologie génétique =
E N D
Génétique des Maladies Multifactorielles Stéphanie Debette MCU-PH Epidémiologie – Neurologie Lariboisière stephanie.debette@lrb.aphp.fr
Génétique des maladies multifactorielles • Approche épidémiologique • Epidémiologie génétique = • Branche de l’épidémiologie qui étudie le rôle de facteurs génétiques et de leur interaction avec des facteurs environnementaux dans la survenue de maladies Khoury et al., Fundamentals of GeneticEpidemiology, Oxford UniversityPress 1993
Génétique des maladies multifactorielles: pourquoi? • Physiopathologie: • Meilleure compréhension des mécanismes moléculaires conduisant à la maladie • Prédiction de risque: • Identification de populations à risque de développer maladie, en fonction de patrimoine génétique • Prévention ciblée (ou « Médecine personnalisée ») • Pharmacogénétique: • Identification de meilleurs répondeurs à traitement ou d’individus à risque accru d’effets secondaires • « Traitement personnalisé » McCarthy, Nat Rev Med 2008
Génétique des maladies multifactorielles: pourquoi? • Physiopathologie: • Meilleure compréhension des mécanismes moléculaires conduisant à la maladie • Prédiction de risque: • Identification de populations à risque de développer maladie, en fonction de patrimoine génétique • Prévention ciblée (ou « Médecine personnalisée ») • Pharmacogénétique: • Identification de meilleurs répondeurs à traitement ou d’individus à risque accru d’effets secondaires • « Traitement personnalisé » McCarthy, Nat Rev Med 2008
Epidemiologie génétique Physiopathologie Identification de facteurs de susceptibilité génétique Meilleure compréhension de biologie sous-jacente Nouvelles Cibles thérapeutiques Biomarqueurs Prévention ex: monitorer évolution maladie ex: mise en évidence FDR environnemental McCarthy, Nat Rev Genet 2008
Epidemiologie génétique Physiopathologie Identification de facteurs de susceptibilité génétique Meilleure compréhension de biologie sous-jacente Nouvelles Cibles thérapeutiques Biomarqueurs Prévention ex: monitorer évolution maladie ex: mise en évidence FDR environnemental McCarthy, Nat Rev Genet 2008
Exemple de la maladie de Crohn… • Découverte gènes de susceptibilité maladie de Crohn a révélé rôle central autophagie etexposition à microbes intestinaux Abraham, NEJM 2009; Feero, NEJM 2010 Yano & Kurata, Nat Immunol 2009 GèneNOD2: détecteurintracellulaire de peptidoglycanesbactériens GèneATG16L1: dirigecomposantsintracellulaires (microbes) vers lysosomes Nouvelles voies pour approches thérapeutiques Targeting the humanmicrobiomewithantibiotics, probiotics, and prebiotics: gastroenterologyenters the metagenomicsera. Preidis, Gastroenterology 2009
Epidemiologie génétique Physiopathologie Identification de facteurs de susceptibilité génétique Meilleure compréhension de biologie sous-jacente Nouvelles Cibles thérapeutiques Biomarqueurs Prévention ex: monitorer évolution maladie ex: mise en évidence FDR environnemental McCarthy, Nat Rev Genet 2008
Identification de FDR environnementaux par la génétique… • Tabac ↗ risque de polyarthriterhumatoïde de 1.5 en population générale, mais d’un facteur > 20 sicertains variants génétiquessurHLA et PTPN22sontprésents! Klareskog, ArthritisRheum 2006 • Amish porteurs de variant génétique sur gène FTO ↗ risqueobésitésont protégés de obésité par activité physique Rampersaud, ArchIntern Med 2008; Kilpeläinen, PLOS Med 2011
Génétique des maladies multifactorielles: pourquoi? • Physiopathologie: • Meilleure compréhension des mécanismes moléculaires conduisant à la maladie • Prédiction de risque: • Identification de populations à risque de développer maladie, en fonction de patrimoine génétique • Prévention ciblée (ou « Médecine personnalisée ») • Pharmacogénétique: • Identification de meilleurs répondeurs à traitement ou d’individus à risque accru d’effets secondaires • « Traitement personnalisé » McCarthy, Nat Rev Med 2008
Epidemiologie génétique Prédiction de risque? • Décevant jusqu’ici, car variants génétiques identifiés jusqu’ici = associés à augmentation modeste de risque (OR < 1.5) • Même quand risque relatif plus élevé, pour l’instant pas d’application clinique dans majorité des cas: • Allèle Epsilon4 de l’Apolipoprotéine E pour maladie d’Alzheimer • Allèles HLA pour maladies autoimmunes • Combiner • Différents variants génétiques (« scores de risque ») • Variants génétiques + autres biomarqueurs (circulants, imagerie…) Cho & Gregersen, NEJM 2011 Ripatti, Lancet 2010
Génétique des maladies multifactorielles: pourquoi? • Physiopathologie: • Meilleure compréhension des mécanismes moléculaires conduisant à la maladie • Prédiction de risque: • Identification de populations à risque de développer maladie, en fonction de patrimoine génétique • Prévention ciblée (ou « Médecine personnalisée ») • Pharmacogénétique: • Identification de meilleurs répondeurs à traitement ou d’individus à risque accru d’effets secondaires • « Traitement personnalisé » McCarthy, Nat Rev Med 2008
Pharmacogénétique, Exemple • CYP2C19 = enzyme impliquée dans bioactivation du clopidogrel • Allele CYP2C19*2 du variant génétique rs4244285 = associé à risque ↑ d’évènements cardiovasculaires Utilisation du Clopidogrel en fonction de génotype rs4244285 CYP2C19 chez patients traités par angioplastie pour syndrome coronarien aigu FDA / AHA: « boxed warning », évaluer au cas par cas Scott, Clin Pharmacol Ther 2011
Génétique des maladies multifactorielles • Maladies complexes/multifactorielles vs. mendéliennes • Etudes d’association génétique vs. analyses de liaison • Quelques rappels • Variation génétique • Equilibre de Hardy-Weinberg • Déséquilibre de liaison • Etudes d’association génétique (EAG) • Etudes d’association sur « gènes candidats » • Etudes d’association génétique pangénomiques • Analyse et interprétation des EAG • Tests multiples • Hétérogénéité de population • Réplication • Caractérisation des signaux identifiés, perspectives
Génétique des maladies multifactorielles • Maladies complexes/multifactorielles vs. mendéliennes • Etudes d’association génétique vs. analyses de liaison • Quelques rappels • Variation génétique • Equilibre de Hardy-Weinberg • Déséquilibre de liaison • Etudes d’association génétique (EAG) • Etudes d’association sur « gènes candidats » • Etudes d’association génétique pangénomiques • Analyse et interprétation des EAG • Tests multiples • Hétérogénéité de population • Réplication • Caractérisation des signaux identifiés, perspectives
Maladies mendéliennes • Maladies mendéliennes (ou monogéniques) = causées par mutation dans un seul gène • Trois modes de transmission: • Autosomique dominant • Autosomique récessif • Récessif lié à l’X
Maladies complexes ou multifactorielles • Maladies ayant de multiples facteurs de susceptibilité génétiques et facteurs de risque environnementaux • Ne suit pas un mode de transmission mendélien • Différentesfaçon de mesurer contribution de facteursgénétiques: • Héritabilité: proportion de variance phénotypique due à effetsgénétiques • Risque de récurrence: compare proportion d’apparentés de cas qui sontatteints par maladie versus proportion d’individusatteints en population générale
Génétique des maladies multifactorielles • Maladies complexes/multifactorielles vs. mendéliennes • Etudes d’association génétique vs. analyses de liaison • Quelques rappels • Variation génétique • Equilibre de Hardy-Weinberg • Déséquilibre de liaison • Etudes d’association génétique (EAG) • Etudes d’association sur « gènes candidats » • Etudes d’association génétique pangénomiques • Analyse et interprétation des EAG • Tests multiples • Hétérogénéité de population • Réplication • Caractérisation des signaux identifiés, perspectives
Outils en épidémiologie génétique • Analyses de liaison (familles): Examiner la co-transmission d’unegénération à l’autre du phénotype et des allèles de marqueursgénétiques • Etudes d’association génétique (population générale, cas/témoins): Comparer fréquence des variants génétiques, entre patients et témoins Courtesy Dr. Dupuis
Outils en épidémiologie génétique • Analyses de liaison (familles): Examiner la co-transmission d’unegénération à l’autre du phénotype et des allèles de marqueursgénétiques • Etudes d’association génétique (population générale, cas/témoins): Comparer fréquence des variants génétiques, entre patients et témoins • plus puissant pour maladies complexes Risch, Science 1996
Etudes d’association génétique Single nucleotide polymorphism (SNP) T G A/C T C A T Copie 1 T G A/C T C A T Copie 2 1000 patients avec AVC: CC: n= 50 AC: n= 250 AA: n= 700 1000 témoins: CC: n= 10 AC: n= 180 AA: n= 810
Phénotype Association indirecte (observée) Association directe (non observée) Déséquilibre de liaison chromosome A Variant génotypé B Variant causal non observé Etudes d’association génétique • Un allèle est associé à un phénotype si sa fréquence diffère plus entre cas et témoins que par le simple hasard. Cela n’implique PAS nécessairement un lien de causalité
Génétique des maladies multifactorielles • Maladies complexes/multifactorielles vs. mendéliennes • Etudes d’association génétique vs. analyses de liaison • Quelques rappels • Variation génétique • Equilibre de Hardy-Weinberg • Déséquilibre de liaison • Etudes d’association génétique (EAG) • Etudes d’association sur « gènes candidats » • Etudes d’association génétique pangénomiques • Analyse et interprétation des EAG • Tests multiples • Hétérogénéité de population • Réplication • Caractérisation des signaux identifiés, perspectives
Quelques chiffres… • ~3 milliards de paires de bases (nucléotides) dans séquence d’ADN humain • 20,000 – 25,000 gènes: • 1.5% du génome (reste contient ADN non-codant, dont introns et séquences régulatrices) • Taille variable, de x100 bases à > 2 millions de bases • 99.9% de la séquence d’ADN est identique d’un individu à l’autre • Portion variable fait la différence…
Types de variation génétique • Single Nucleotide Polymorphism (SNP) = polymorphisme mononucléotidique • Variation individuelle dans séquence nucléotidique • Plusieurs millions de SNPs, fréq >1% (<1% = mutation ou SNV) T G A/C T C A T Copie 1 Chr (brin+) T G A/C T C A T Copie 2 Chr (brin+) 2 Allèles possibles: C ou A 3 Génotypes possibles: CC, CA, AA
Types de variation génétique • Single NucleotidePolymorphism (SNP) = polymorphisme mononucléotidique • Variation individuelle dans séquence nucléotidique • Plusieurs millions de SNPs, fréq >1% (<1% = mutation ou SNV) • Conséquences: • Neutre: • Séquence non codante, non régulatrice • Séquence codante mais « synonyme »: • exemple: ACC ou ACA même acide aminé (thréonine) • Modification taux d’expression de gène • Séquence régulatrice (non codante) • Modification composition protéine: • Séquence codante «non-synonyme» ou «missense» • Séquence codante «non-sense» (induit codon stop) • Intron, site d’épissage (non codante)
Types de variation génétique • « Copy number variants » = CNV: segment d’ADN ou gène présent en nombre variable de copies d’un individu à l’autre • Perte ou gain • Taille variable (10,000 – 5,000,000 bases) • Découverte plus récente que SNPs • Intra- ou intergénique • Polymorphismes de répétition • Répétition de séquences en tandem, en nombre variable • Taille variable: Microsatellites, STR, VNTR • Intra- ou intergénique
Calcul de fréquences alléliques pour un SNP Quelle est la fréquence de l’allèle A?
Calcul de fréquences alléliques pour un SNP Quelle est la fréquence de l’allèle A? Freq (A) = (200x2 + 500) / 2000 = 0.45 Quelle est la fréquence de l’allèle G?
Calcul de fréquences alléliques pour un SNP Quelle est la fréquence de l’allèle A? Freq (A) = (200x2 + 500) / 2000 = 0.45 Quelle est la fréquence de l’allèle G? Freq (G) = (300x2 + 500) / 2000 = 0.55
Génétique des maladies multifactorielles • Maladies complexes/multifactorielles vs. mendéliennes • Etudes d’association génétique vs. analyses de liaison • Quelques rappels • Variation génétique • Equilibre de Hardy-Weinberg • Déséquilibre de liaison • Etudes d’association génétique (EAG) • Etudes d’association sur « gènes candidats » • Etudes d’association génétique pangénomiques • Analyse et interprétation des EAG • Tests multiples • Hétérogénéité de population • Réplication • Caractérisation des signaux identifiés, perspectives
Equilibre de Hardy-Weinberg Dans une population dont l'effectif est infini (très grand), panmictique (mariages au hasard), en l'absence de mutation et de sélection, les fréquences alléliques et génotypiques restent constantes d’une génération à l’autre: Fréquence du génotype aa = p2 Fréquence du génotype aA = 2pq Fréquence du génotype AA = q2 oùp = fréquence de l’allèlea q = fréquence de l’allèleA
Conditions de Hardy-Weinberg (HW) ne sont généralement pas strictement remplies dans la plupart des populations, mais généralement les génotypes suivent assez bien l’équilibre de HW • En l’absence d’équilibre de HW on doit se poser la question des causes potentielles • Par exemple lors de génotypage sur plateformes à haut débit, l’absence d’équilibre de HW dans une population témoin est considéré un signe de génotypage de mauvaise qualité Equilibre de Hardy-Weinberg
Comment tester si équilibre de Hardy-Weinberg est présent? Equilibre de Hardy-Weinberg • Test de « Goodness of Fit » • où Oi = effectif observé pour génotype i • Ei = effectif attendu pour génotype i si équilibre de HW • X2 suit une loi de Chi-2 à 1 degré de liberté • En effet, normalement pour un test de chi-2 de 2 x 3 classes (observé/attendu, aa/aA/AA) il y a 2 degrés de liberté, mais ici on retire un degré de liberté supplémentaire, car on estime les fréquences alléliques à partir des génotypes observés • Si équilibre de HW, alors test de Chi-2 est non significatif
Déséquilibre de liaison • Soit 2 variants génétiques sur même chromosome • Variant 1: Alleles “a” et “A”, fréquences = p(a), p(A) • Variant 2: Alleles “b” et “B”, fréquences = p(b), p(B) • On a 4 combinaisons (ou haplotypes) possibles: • AB Ab aB ab • Si les deux variants sont indépendants, i.e. en « équilibre de liaison », alors: • p(AB)=p(A) x p(B) A/a B/b
Déséquilibre de liaison • Soit 2 variants génétiques sur même chromosome • Variant 1: Alleles “a” et “A”, fréquences = p(a), p(A) • Variant 2: Alleles “b” et “B”, fréquences = p(b), p(B) • On a 4 combinaisons (ou haplotypes) possibles: • AB Ab aB ab • Si les deux variants ne sont pas indépendants, ils sont dits en déséquilibre de liaison, i.e. • p(AB)≠p(A) x p(B) • Fréquence de AB dépend non seulement de p(A) et p(B) mais aussi du degré de déséquilibre de liaison (r2, D’) A/a B/b
Recombinaison A/a B/b Indépendants
Recombinaison A/a B/b Dépendants
Phénotype Association indirecte (observée) Association directe (non observée) Déséquilibre de liaison chromosome A Variant génotypé B Variant causal non observé Etudes d’association génétique • Un allèle est associé à un phénotype si sa fréquence diffère plus entre cas et témoins que par le simple hasard. Cela n’implique PAS nécessairement un lien de causalité
Génétique des maladies multifactorielles • Maladies complexes/multifactorielles vs. mendéliennes • Etudes d’association génétique vs. analyses de liaison • Quelques rappels • Variation génétique • Equilibre de Hardy-Weinberg • Déséquilibre de liaison • Etudes d’association génétique (EAG) • Etudes d’association sur « gènes candidats » • Etudes d’association génétique pangénomiques • Analyse et interprétation des EAG • Tests multiples • Hétérogénéité de population • Réplication • Caractérisation des signaux identifiés, perspectives
Etudes d’association génétique • Etudes d’association sur “gènescandidats”: • Tester association de phénotype avec polymorphismesgénétiquescandidats • Basésurhypothèsesa priori surphysiopathologie • Centainesd’étudesd’associationgènecandidatpubliéessur AVC, HSB, infarctus: peu de loci répliqués de façonconvaincante • Principauxproblèmesméthodologiques • Petitseffectifs • Absence de réplicationpré-planifiée • Mauvaiscandidat ...
Etudes gène candidat • Exemples d’hypothèses a priori conduisant à la sélection d’un gène candidat: • Expérimentation animale: Variants génétiques dans LRP1 = associés aux anévrysmes aorte chez l’homme? Inactivation gène LRP1 dans cell. Musculaires lisses souris Anévrysmes Boucher, Science 2003
Etudes gène candidat • Exemples d’hypothèses a priori conduisant à la sélection d’un gène candidat: • Association connue avec d’autres maladies qui sontcorrélées avec la maladied’intérêt Alzheimer AVC Variants génétiques associés: ? Lambert, 2009; Seshadri, 2010; Naj, 2011; Hollingsworth, 2011
Etudes gène candidat • Exemples d’hypothèses a priori conduisant à la sélection d’un gène candidat: • Fonction du gène laisse supposer que pourrait être impliqué dans physiopathologie maladie Gène de coagulation, hémostase ? AVC Debette & Seshadri, CircCardiovasc Genet 2009
Etudes gène candidat • Choix des SNPs: • 1-100 par gènes, en fonction de coût et taille gène • SNPs « indépendants » si possible, i.e. pas en déséquilibre de liaison • SNPs potentiellement fonctionnels: • Codant non-synonyme • Dans région régulatrice (promoteur, 3’UTR, site de fixation facteur transcription) • Dans intron, site épissage
Etudes d’association génétique • Etudes d’associationgénétiquepangénomiques = GWAS (genome-wide association study) • Génotyper un très grand nombre (500,000-5,000,000) de variants génétiquesdistribuéssurl’ensemble des chromosomes PAS d’hypothèse a priori sur les loci d’intérêt • Récemment possible grâce au projetHapMapet aux technologies de génotypage à haut débit • HapMap = projet international décrivant les variations génétiquesfréquentesdansdifférentsgroupesethniques • Génotypage automatisé et rapide de milliers d’échantillons, pour des x100,000 SNPs. Zeggini, Nature Genet 2005
Hybridisation d’ADN « marqué » Création micropuce Interpretation informatisée Détection de fixation « séquence-spécifique » Feero, NEJM 2010
GWAS – présentation résultats GWAS visant à identifier FDR génétiques d’AVC (accident vasculaire cérébral) • Population: 19,602 individus d’origine européenne • Phénotype: AVC, 1,544 cas incidents • SNPs: 2.5 Millions, sur les 22 autosomes « Manhattan plot »
GWAS – présentation résultats GWAS visant à identifier FDR génétiques d’AVC (accident vasculaire cérébral) • Population: 19,602 individus d’origine européenne • Phénotype: AVC, 1,544 cas incidents • SNPs: 2.5 Millions, sur les 22 autosomes « Manhattan plot » rs11833579 rs12425791 NINJ2 (chr12p13) p = 5 x10-8
GWAS – présentation résultats GWAS visant à identifier FDR génétiques d’AVC (accident vasculaire cérébral) • Population: 19,602 individus d’origine européenne • Phénotype: AVC, 1,544 cas incidents • SNPs: 2.5 Millions, sur les 22 autosomes Zoom « Manhattan plot » rs11833579 rs12425791 NINJ2 (chr12p13) p = 5 x10-8