610 likes | 802 Views
Cours 4. III. Altérations des proportions de Hardy Weinberg suite. Anémie falciforme et Plasmodium falciparum. Ixodes ricinus. Schistosoma. III. Altérations des proportions de Hardy Weinberg 2. Excès d'hétérozygotes. Superdominance. Hétérogamie. MHC ou HLA. Clonalité.
E N D
Anémie falciforme et Plasmodium falciparum Ixodes ricinus Schistosoma III. Altérations des proportions de Hardy Weinberg 2. Excès d'hétérozygotes Superdominance Hétérogamie MHC ou HLA Clonalité Candida albicans Trypanosoma brucei Sexes séparés et petites populations Biais de dispersion sexe spécifique Hétérosis Bandes echo Loci dupliqués
Superdominance Panmixie, grande population de taille N, pas de mutation ni de migration, fécondité de f (>1) 2 allèles, A et a de fréquence pt et1-pt à la génération t
Superdominance 2 allèles, A et a de fréquence pt et1-pt à la génération t
Superdominance 2 allèles, A et a de fréquence pt et1-pt à la génération t Equilibre quand Δp=pt+1- pt=0 s≤1
peq=0, A éliminé peq=1, A fixé peq=1/2, équilibre polymorphe stable Superdominance 2 allèles, A et a de fréquence pt et1-pt à la génération t
Superdominance 2 allèles, A et a de fréquence pt et1-pt à la génération t s<1 =A2*(1-A2)*(1-2*A2)
Superdominance Fardeau génétique
Hétérogamie BC AB AC ACt BCt ABt Donc l’équilibre est atteint quand ABeq=ACeq=BCeq=1/3
Allèle D? Hétérogamie AB AC BC ACt BCt ABt
Clonalité Pas de mutation ni de migration, grande population, pas de sélection proportion c investie en reproduction clonale et 1-c en panmixie AA Aa aa Dt Ht Rt A l’équilibre Ht=Ht+1=Heq et donc: Convergence vers HW mais forts désequilibres de liaison attendus
Clonalité +Dérive +Mutation AA Aa aa Dt Ht Rt Aa Heq~1
2.A l'intérieur des individus par rapport à leur sous-population: FIS AA Aa aa Do Ho Ro H: probabilité de tirer deux allèles différents, dans un individu d’une sous-population (HI) dans deux individus de la même sous-population (HS), dans deux individus de sous-populations différentes (HT) Chesser & Nei
3.A l'intérieur des sous-populations par rapport à la population totale: FST H: probabilité de tirer deux allèles différents, dans un individu d’une sous-population (HI) dans deux individus de la même sous-population (HS), dans deux individus de sous-populations différentes (HT) Chesser & Nei Wright, pour un modèle en îles avec deux allèles Les F de Wright sont aussi des rapports de variance
4.A l'intérieur des individus par rapport à la population totale: FIT H: probabilité de tirer deux allèles différents, dans un individu d’une sous-population (HI) dans deux individus de la même sous-population (HS), dans deux individus de sous-populations différentes (HT) Chesser & Nei
5.Définitions selon les hétérozygoties Chesser & Nei (1-FIT)=(1-FIS)(1-FST) FIS: Déficit en hétérozygote du à la non-panmixie dans les sous-populations FST: Déficit en hétérozygotes du à la non-panmixie entre sous-population FIT: Déficit global en hétérozygotes résultant des deux précédents FIS=-1 (un seul type d'hétérozygotes) FIS=0 (panmixie locale) FIS=1 (que des homozygotes) FIS<0 => excès d'hétérozygotes (par ex. clonalité) FIS>0 => excès d'homozygotes (par ex. autofécondation) FST=0 => pas de variation entre sous-populations (par ex. migration libre) FST>0 => différenciation entre sous populations FST=1 => chaque sous-population fixée pour l'un ou l'autre des allèles présents (absence de migration) FIT<0 => excès d'hétérozygotes (par ex. clonalité) FIT=0 => panmixie globale ou clonalité + effet Wahlund FIT>0 => excès d'homozygotes (par ex. autofécondation et/ou Wahlund))
6.Définitions selon les consanguinités FIS: Consanguinité des individus relative à la consanguinité des sous-populations FST: Consanguinité des populations relative à la consanguinité totale FIT: Consanguinité des individus relative à la consanguinité totale Q=1-H: probabilité de tirer deux allèles identiques, dans un individu QI, dans deux individus de la même sous-population QS et dans deux sous-populations différentes QT Weir Rousset Formulations plus conforme au sens initial de ces indices (1-FIT)=(1-FIS)(1-FST)
FST FIT FIS F IS l 7.Récapitulation
7.Récapitulation FIS: Consanguinité des individus relative à la consanguinité des sous-populations FST: Consanguinité des populations relative à la consanguinité totale FIT: Consanguinité des individus relative à la consanguinité totale FIS=-1 (un seul type d'hétérozygotes) FIS=0 (panmixie locale) FIS=1 (que des homozygotes) FIS<0 => déficit d'homozygotes (par ex. clonalité) FIS>0 => excès d'homozygotes (par ex. autofécondation) FST=0 => pas de variation entre sous-populations (par ex. migration libre) FST>0 => différentiation entre sous populations FST=1 => chaque sous-population fixée pour l'un ou l'autre des allèles présents (absence de migration) FIT<0 => déficit d'homozygotes (par ex. clonalité) FIT=0 => panmixie globale ou clonalité + effet Wahlund FIT>0 => excès d'homozygotes (par ex. autofécondation et/ou Wahlund)
Jour 3 Cours 5
1. Autofécondation AA Aa aa Dt Ht Rt A l’équilibre, Ht=Ht+1=Heq Formule généralisée de Wright
2. Dispersion en modèle en îles de Wright avec beaucoup d'îles et beaucoup d'allèles Modèle en îles de Wright, n grand, m et u petit, K grand: QT~0 panmixie locale: QI=QS
Modèle en îles de Wright, n grand, m et u petit, K grand: QT~0 panmixie locale: QI=QS Evolution de QS, probabilité de tirer deux fois le même allèle dans une sous-population, entre les générations t et t+1 Parce qu'ils l'étaient déjà en t ou Parce qu'ils le sont devenus en t+1 Les deux allèles sont autochtones et non-mutants et identiques A l’équilibre migration/mutation/dérive
Modèle en îles de Wright, n grand, m et u petit, K grand: QT~0 panmixie locale: QI=QS A l’équilibre migration/mutation/dérive N>0
Modèle en îles de Wright, n grand, m et u petit, K grand: QT~0 panmixie locale: QI=QS A l’équilibre migration/mutation/dérive On néglige les termes en m et u devant 1 ainsi que les termes en mu devant m
Inférence de la migration Modèle en îles de Wright, n grand, m et u petit, K grand: QT~0 panmixie locale: QI=QS; FST=QS A l’équilibre migration/mutation/dérive si u<<m FST_max si m=0 FST_max ≈QS=1-HS Hedrick Ou méthode de Meirmans par AMOVA FST’ =FST/FST_max
3. Dispersion en modèle en îles fini (n petit), avec homoplasie (K petit) et autofécondation locale (s) Impact de l'homoplasie Microsatellites Microsatellites
1 D 2 D 3 D 4. Dispersion dans d'autres modèles de populations, Stepping stone (en pas Japonais) et Voisinage
1 D 2 D Les F-Statistiques de Wright Autres modèles de populations Stepping stone (en pas Japonais) et Voisinage QT QS QS QS QT QS QS QS QS QS QS Rousset
1 D Stepping stone (en pas Japonais) et Voisinage Rousset Pente b Voisinage=1/b De: Densité efficace d’individus (/m ou /m²) σ: distance entre adultes reproducteurs et leurs parents
2 D Stepping stone (en pas Japonais) et Voisinage Rousset Voisinage=1/b Pente b De: Densité efficace d’individus (/m ou /m²) σ: distance entre adultes reproducteurs et leurs parents
5. Estimations d’effectifs efficaces Différenciation génétiques entre échantillons séparés dans le temps Ne:Waples Dans l’espace et le temps Neet m:Wang & Whitlock Déséquilibres de liaisons Ne: Bartley et al., Waples & Do Excès d’hétérozygotes (dioïques ou autoincompatibles) Ne: Balloux Déséquilibresinter et intra loci sur données spatiales Neet m: Vitalis & Couvet Et bien d'autres…
FST FIT Estimations RAPPEL: Variance: s² = [1/n].Si[(xi-x)²] ; s² = [1/(n-1)].Si[(xi-x)²] Estimateurs f et θ de Weir & Cockerham FIS F IS l 6. Estimateurs non biaisés des F-Statistiques de Wright Taille de sous-échantillons Ns=1
Estimateurs des F de Wright pour K allèles noté de A=1 à K Robertson & Hill biaisés variance d’estimation faible (meilleure « statistique ») Weir & Cockerham non biaisés variance d’estimation forte FIS FST FIT
>>0 ~0 ~0 ~0 7. F-statistiques pour plus de trois niveaux hiérarchiques Yang
8. F-statistiques chez les clones Que des hétérozygotes => QI=0 Si n grand et m petit QT~0 Si m~0 Si n=2 et m petit
C=1, Nm pas petit C=1, Nm petit FST~0.5 Fst<<0.5 Fis Fis Fis Fis 0 0 0 0 -1 -1 -1 -1 Loci Loci Loci Loci C=[0.999-0.99], Nm petit C=[0.99-0.95], Nm pas petit Fst>>0.5 Génétique des populations des diploïdes clonaux ou partiellement clonaux Phylloxera Trypanosoma brucei gambiense Candida albicans
1. Définitions On recherche avec quelle probabilité, appelée P-value, le hasard permet d'expliquer nos données si ces dernières suivent l'hypothèse nulle H0. Le test, défini a priori, peut être: -bilatéral: dans ce cas l'hypothèse alternative H1 est que les valeurs observées sont trop extrêmes pour être expliquées par le hasard; -unilatéral "plus grand": dans ce cas H1 est que les valeurs observées sont plus grandes qu'attendue par hasard sous H0; -unilatéral "moins grand": dans ce cas H1 est que les observations ont des valeurs plus petites qu'attendues sous H0. Par convention on a choisi arbitrairement la limite 0.05 pour la P-value seuil au dessous de laquelle un test est dit significatif. Mais, selon les circonstances ont peut choisir d'être plus ou moins sévère. La décision statistique ne dépend que du manipulateur. Erreur de première espèce, α: probabilité de se tromper en rejetant H0 (P-value); Erreur de seconde espèce, β: probabilité de se tromper en acceptant l'hypothèse nulle. Un test est puissant si on rejette facilement H0; Un test est robuste s'il ne rejette pas trop souvent H0.
2. Calculs d’intervalles de confiance (IC) des F-statistiques Bootstrap (e.g. sur les loci): on rééchantillonne aléatoirement k fois (e.g. 5000) avec remise. On peut donc tirer plusieurs fois le même item (e.g. locus) et on calcule F à chaque tirage.
2. Calculs d’intervalles de confiance (IC) des F-statistiques Jackknife (e.g. sur les sous-échantillons): on retire un item à la fois (e.g. un sous-échantillon) et on recalcule Fsur ceux qui restent. On obtient autant de valeurs qu’il y a d’items dont on tire une moyenne et une variance pour F qui sert au calcul d’une erreur standard du F. Sous l’hypothèse de normalité on peut estimer un IC qui correspond à F±StdErr(F)tα,γ, où t se trouve dans une table du t ou peut être calculé sous Excel, oùα correspond au seuil désiré (0.05 pour un CI à 95%, 0.01 pour 99%) etγ au degré de liberté (i.e. nombre d’items-1)
Procédures statistiques: IC 95% du Jackknife Table du t FIS=0.2 10 loci StdErr(FIS)=0.01 l’IC 95% sera 0.2-2.2620.01 et 0.2+2.2620.01 soit 95% IC=[0.177, 0.223]
3. Tests de significativité par randomisation Tests de randomisations: Simuler H0 un très grand nombre de fois; la P-value du test = la proportion des valeurs simulées qui sont aussi extrêmes ou plus extrêmes que celle observée dans l’échantillon Il est important de bien appréhender ce qu’il y a derrière H0 et H1: que cherche-t-on à tester exactement? Nombre de randomisations: 10000 si permutations, au moins 1 000 000 si chaine de Markhov
Fis Procédures statistiques Tests de significativité des F par randomisation Significativité du FIS= tester la panmixie locale Tester si FIS> 0 P-value P1 ou < 0 P-value P2 ou ≠ 0 P-value P3 P3=min(P1,P2)+[1-max(P1,P2)] FIS≠ 0 (bilatéral) Utilisation d’autres estimateurs (Robertson & Hill) comme statistique Tests exacts de Haldane (pas de test global sur les sous-échantillons et loci)
FST Procédures statistiques Tests de significativité des F par randomisation Tester si FST> 0
Procédures statistiques Tester si la répartition des allèles est aléatoire à l’aide de la statistique G H0: le G observé n’est pas plus grand que ceux générés par randomisation des individus entre sous-échantillons Statistique G:logarithme du rapport de maximum de vraisemblance des fréquences alléliques dans les différents sous-échantillons. Propriété additive du G permet de tester globalement sur les loci