420 likes | 602 Views
PARTIE IV. Affinement du modèle. Clonage, expression, purification. Analyse bioinformatique. Macromolécules de grande pureté. Interprétation biologique. Question biologique. Cristallisation. Structure atomique = MODELE. Cristaux. Affinement cristallographique.
E N D
PARTIE IV Affinement du modèle
Clonage, expression, purification Analyse bioinformatique Macromolécules de grande pureté Interprétation biologique Question biologique Cristallisation Structure atomique = MODELE Cristaux Affinement cristallographique Collecte et intégration des données Carte de densité électronique Données de diffraction Phasage des réflexions 1. Principales Etapes
1. Principales Etapes • Phasage des réflexions avec l’une des méthodes décrites • Calcul d’une première carte de densité électronique • Construction d’un premier modèle dans cette carte de densité • AFFINEMENT : dernière étape avant validation et publication du modèle • PRE-REQUIS : modèle doit être correct
Structure dans le cristal expérience Données de diffraction Fobs calcul Modèle x,y,z,fj Fcalc, calc Transformée de Fourier 2. Rappels Densité électronique Facteurs de Structure diffraction (r) Fh Transformation de Fourier Espace réel Espace réciproque
3. Objectifs • L’affinement du modèle est un processus cyclique dont le BUT est l’optimisation du modèle issu de l’interprétation de cartes de densités électronique • Objectif : le modèle construit doit refléter le mieux possible l’ensemble des données expérimentales Interprétation de la densité électronique Affinement de la structure (module et phase) Construction d'un modèle atomique MODELE FINAL
(x,y,z,B) modifiés 4. Principes Minimisation de l’écart entre: - le modèle (xyz) Fcalc - les données de diffraction Fobs Plus Fcalc est proche de Fobs Plus le modèle est proche de la structure réelle OR Fobs = constantes C’est Fcalc qui est modifié
4. Principes • L’affinement est un problème délicat : • Nombre de données expérimentales mesurées est souvent faible par rapport au nombre de paramètres à optimiser (x, y, z, B) • Ex FdhD: 1900 Atomes / Xtal Diffracte à 2.8Å • 7600 paramètres à définir / 8950 Réflexions uniques • Le nombre important de paramètres à affiner • Le modèle initial peut être de qualité médiocre, importance de la phase • La fonction à optimiser est complexe, non linéaire et peut comporter plusieurs minima séparés par des barrières énergétiques • Trouver une pondération adéquat entre les données cristallographiques et non-cristallographiques
4. Principes • Considérations générales • Importance de la résolution dans les paramètres à affiner: • 3.8 – 3.2Å : Coordonnées, Groupes de B, pas de solvant, importance de NCS et d’acalc si possible; Utilisation des angles de torsion pour diminuer N • 3.2 – 2.7Å : Bon modèle, Construction-reconstructions importantes, Groupes de B • 2.7 – 2.2Å : Construction du modèle facile, B individuel, quelques molécules de solvant • 2.2 – 1.4Å : Construction automatique, B individuel, bcp de solvant • <1.2Å : B anisotrope, Hydrogènes
4. Principes Fobs acalc, aobs Cartes de densité électronique « Nouvelles » valeurs des Fcalc et des phases Interprétation de la densité électronique Optimisation des paramètres Modèle x+Δx, y+Δy, z+Δz Construction, d'un modèle atomique (x,y,z) MODELE FINAL
5. Observations et paramètres • Observations : tout ce qui est connu sur la cristal avant l’étape d’affinement • Paramètres cristallins • Modules des Fobs (nombre fixé) • Stéréochimie des macromolécules • Paramètres : à améliorer pendant le processus • Positions atomiques (x,y,z) des atomes du modèle • Paramètres de déplacements atomiques
5. Observations et paramètres • Les paramètres de déplacements atomiques : • Ils traduisent le désordre statique et dynamique • Désordre dynamique Vibration d’un atome autour de sa position d’équilibre, l’amplitude de ce mouvement est une fonction de la température • Facteur d’agitation thermique w = exp (-Bj(sin θ/λ)2) • Désordre statique Un atome ou un groupe d’atomes n’occupent pas la même position dans chaque maille • Facteur d’occupation qj
5. Observations et paramètres • Rappels : Facteurs de diffusion atomique 53 fj en fonction de sin / à 0 K sin / = 0 fj = Z fj diminue lorsque sin / augmente iode carbone 8 6 résolution
5. Observations et paramètres • Facteurs d’agitation thermique La taille du nuage électronique est indépendante de la température diffraction par un cristal indépendante de la température ? En fait, les atomes vibrent autour d’une position d’équilibre position des atomes différente dans les mailles du cristal « pseudo-taille » des atomes Plus la vibration thermale est grande, plus « la pseudo-taille » de l’atome est grande • Conséquences L’intensité des rayons diffractés diminue lorsque augmente fj doit être multiplié par un facteur dépendant de la température
8 5. Observations et paramètres • Facteurs d’agitation thermique - Les facteurs d’agitation thermique (B) traduisent la vibration d’un atome autour de sa position d’équilibre - L’amplitude du mouvement dépend de la température - Définition d’un facteur de diffusion atomique dépendant de la température : Les valeurs élevées de B entraînent un affaiblissement rapide des intensités diffractées pour des valeurs croissantes de S B = 20 Å2 B = 99 Å2 B = 0 Å2 B = 0 Å2
5. Observations et paramètres • Facteurs d’agitation thermique anisotrope isotrope Protéine Molécule organique Valeurs faibles (cœur hydrophobe) Valeurs élevées (boucles flexibles) Agitation anisotrope (différente dans les 3 directions de l ’espace) : ellipse d’agitation (50 % de probabilité) Agitation isotrope En général 5 Å2 < B < 50 Å2
Safety factor 5. Observations et paramètres • Paramètres variables • Les coordonnées (x,y,z) • Les facteurs de température (B) désordre dynamique • Les facteurs d’occupation (q) désordre statique Nécessité d'ajouter des informations supplémentaires Exemple:ArgRS – ARNt P212121 a = 210.2 Å b = 146.2 Å c = 86.1 Å (12 000 atomes, 170 kDa dans l’ua) • Résolution Réflexions Obs/ paramètres • 3.0 51 300 1.1 • 2.7 70 410 1.5 • 2.5 88 700 2.8 • 2.0 173 200 3.6
5. Observations et paramètres Le rapport observations/paramètres est amélioré par ajouts d’informations supplémentaires : • Diminuer Npar : affinement avec contraintes - Contrainte de certains paramètres à des valeurs fixes - Utilisation d’angle de torsion au lieu de positions x, y et z • Augmenter Nobs : affinement restreint - Permet à certains paramètres de varier autour d’un idéal: • Géométrie - Longueur liaisons covalentes • - Angles liaisons covalentes • - Angles de torsion • - Contacts Van der Waals • Symétries non cristallographiques • Corrélation entre atomes liés
5. Observations et paramètres Distance Angle de liaison Angle dihédral
6. Procédures d’affinement Comment ? Définir une fonction d’énergie et trouver le minimum de cette fonction • 3 types d’algorithmes: • - Moindres carrés • Dynamique moléculaire • Maximum de vraisemblance minimum local E minimum DE Espace conformationnel
6. Procédures d’affinement • Méthode des moindres carrés Déterminer le minimum de la fonction Avec Fobs facteurs de structure observés = données de diffraction Fcalc facteurs de structure calculés = modèle K’ facteur d’échelle whkl poids affecté à chaque réflexion
6. Procédures d’affinement • Méthode des moindres carrés • Ces méthodes ne permettent d’atteindre qu’un minimum local • Leur rayon de convergence est faible Col +150
6. Procédures d’affinement • Méthode des moindres carrés • Ces méthodes ne permettent d’atteindre qu’un minimum local • Leur rayon de convergence est faible Col +150
= - E w ( F K' F ) å hkl hkl 2 cryst hkl obs calc h, k, l 6. Procédures d’affinement • Méthode de dynamique moléculaire Le modèle est artificiellement chauffé à 3000°K puis refroidi progressivement à 300°K (attribution d’une vitesse initiale aléatoire à chaque atome) = technique du « recuit simulé » exploration d’une plus grande gamme de conformations Fonction d’énergie totale de la molécule CNS EPOT dépend de la géométrie de la molécule ETOT = EPOT + w Ecryst
6. Procédures d’affinement • Méthode dynamique moléculaire • Obtention d’un minimum « vrai » • Le rayon de convergence est plus important Col +150
6. Procédures d’affinement • Méthode dynamique moléculaire • Obtention d’un minimum « vrai » • Le rayon de convergence est plus important Col +150
6. Procédures d’affinement • Maximum de vraisemblance • Méthode utilisée dans REFMAC5 (CCP4), Phenix,… • Des programmes plus récents construisent une fonction de vraisemblance avec les paramètres à affiner • Les paramètres à définir sont décrits par des distributions de probabilités • Le maximum de vraisemblance utilise le théorème de Bayes
6. Procédures d’affinement • Théorème de Bayes p(A;B) = probabilité que A soit vrai si B est vrai = 50% = 0.1/0.2 = p(A,B)/p(A) De la même manière: p(B;A)=p(B,A)/p(B) Théorème de Bayes: p(B)=25% p(A)=20% p(A,B) = 10%
6. Procédures d’affinement • Méthode du maximum de vraisemblance • C’est une technique qui, sous l’hypothèse que les variables ont une distribution connue • usuellement la distribution normale ou gaussienne • permet d’estimer les paramètres d’un modèle • d’une équation ou d’un système, linéaire ou non linéaire • avec des restrictions sur ces paramètres ou non • coefficients, matrice de variances et covariances • Plus spécifiquement la technique consiste à construire une fonction appelée fonction de vraisemblance • construite à partir de la fonction de distribution • et à maximiser son logarithme par rapport aux paramètres inconnus
7. Stratégies • Plusieurs cycles affinement par recuit simulé Calcul de nouvelles cartes (2Fobs-Fcalc) et (Fobs-Fcalc) Correction manuelle du modèle Addition du solvant (eau, ions, ligands)
7. Stratégies, TLS • Affinement de type TLS (Translation/Libration/Screw) • Permet d’ajouter des éléments de descriptions intermédiaire sans ajouter de nombreux paramètres • Description de domaines rigides • Nombre de domaines au choix de l’utilisateur • 20 paramètres / domaine • Peut être utilisé à partir de 2Å de résolution (>2Å dans le cas de NCS)
7. Stratégies, TLS • http://skuld.bmsc.washington.edu/~tlsmd/
8. Suivie de l’affinement • Les étapes de l’affinement sont suivies par le facteur d’accord R atomes au hasard R = 60 - 50 % modèle de départ R = 40 – 50 % affinement à 2.5 Å R = 20 % affinement à 1.5 Å R = 15 % affinement petite molécule R = 4 - 8 % composé minéral R = 1 – 2 %
8. Suivie de l’affinement • Utilisation d’un facteur d’accord Rfree • Même définition que le facteur R mais utilise environ 1000 réflexions (1-5%; dépend de la résolution) qui sont prisent au hasard* et qui ne sont JAMAIS utilisées lors de l’affinement • Permet le bon suivie d’un affinement • Rfree > R: • 5-7% à basse résolution • <1% à très haute résolution • Règle +/- générale: Rfree ≈ (Résolution en Å)/10 • *Sauf dans le cas de Twinning
8. Suivie de l’affinement • Tableau synthétique après affinement: Collection de données R/Rfree RMSD Longueurs de liaison RMSD Angles de liaison
9. Pratique / Refmac5 Restrained refinement Unrestrained Rigid body Structure idealisation TLS & Restrained refinement A tester en fin d’affinement
9. Pratique / Refmac5 FreeR NCS
9. Pratique / Phenix <4.5Å de résolution 2 - 3Å en début d’affinement Refinement Target Weights: - Optimize Xray/Stereochemistry - A utiliser! A utiliser à des résolutions modérées: 2 - 3 Å
Un fichier pdb Numéro d’atome Numéro de résidu Résidue Chaine Type X Y Z Occ B ATOM 4217 N PRO B 265 24.846 -10.676 50.273 1.00 27.45 N ATOM 4218 CA PRO B 265 25.497 -11.345 51.398 1.00 29.70 C ATOM 4219 C PRO B 265 27.029 -11.331 51.363 1.00 30.61 C ATOM 4220 O PRO B 265 27.648 -10.957 50.353 1.00 31.31 O ATOM 4221 CB PRO B 265 24.970 -12.783 51.286 1.00 30.01 C ATOM 4222 CG PRO B 265 23.648 -12.613 50.698 1.00 30.57 C ATOM 4223 CD PRO B 265 23.905 -11.584 49.610 1.00 27.97 C ... ATOM 4225 N AGLU A 302 15.152 -18.914 10.502 0.50 26.16 N ATOM 4226 N BGLU A 302 12.994 -20.474 10.131 0.50 20.40 N ATOM 4227 CA AGLU A 302 13.786 -18.984 9.961 0.50 28.63 C ATOM 4228 CA BGLU A 302 14.025 -19.938 11.034 0.50 23.96 C ATOM 4233 CB AGLU A 302 12.738 -19.272 11.031 0.50 28.05 C ATOM 4234 CB BGLU A 302 13.943 -18.424 11.242 0.50 23.64 C ATOM 4235 CG AGLU A 302 12.865 -20.600 11.598 0.50 30.67 C ATOM 4236 CG BGLU A 302 14.204 -17.609 10.058 0.50 26.18 C ATOM 4237 CD AGLU A 302 14.041 -20.678 12.508 0.50 30.01 C ATOM 4238 CD BGLU A 302 13.205 -17.894 8.993 0.50 27.17 C ATOM 4239 OE1AGLU A 302 14.351 -19.670 13.194 0.50 29.80 O ATOM 4240 OE1BGLU A 302 12.000 -17.756 9.273 0.50 24.71 O ATOM 4241 OE2AGLU A 302 14.661 -21.746 12.513 0.50 32.25 O ATOM 4242 OE2BGLU A 302 13.645 -18.264 7.891 0.50 29.49 O ATOM 4229 C AGLU A 302 13.398 -17.758 9.186 0.50 28.71 C ATOM 4230 C BGLU A 302 14.003 -20.591 12.381 0.50 23.41 C ATOM 4231 O AGLU A 302 12.365 -17.149 9.487 0.50 28.75 O ATOM 4232 O BGLU A 302 13.996 -19.917 13.418 0.50 24.41 O
Bibliographie Intermédiaire Intermédiaire
Bibliographie facile facile méthodologique
Bibliographie Cristallisation des protéines - Crystallization of Biological macromolecules (1999). A. McPherson, CSHL Press - Crystallization of Nucleic acids and Proteins (1992). A. Ducruix, R. Giegé, The Practical approach series, IRL Press, Oxford University Press - Crystallization of Membrane proteins (1991). H. Michel, Boca Raton, CRC Press Cristallographie des protéines Facile - Crystallography made crystal clear (1993). G. Rhodes. Academic Press - Outline of crystallography for biologist(2002) D. Blow, Oxford University Press - Crystal structure analysis (1992). Glusker et Trueblood, Oxford University Press
Bibliographie Théorie - Protein crystallography (1976). T.L. Blundell, L.N. Johnson, Academic Press - X-ray structure determination (1989). G.H. Stout, L.H. Jensen, Wiley & Sons - Methods in Enzymology, volumes 276 et 277, Academic Press Intermédiaire - Macromolecular crystallography (1997). C.W. Carter, R.M. Sweet - Introduction to macromolecular crystallography (2003). A. McPherson Wiley-Liss - Principles of protein X-ray crystallography (1994). J. Drenth, Springer-Verlag Méthodologique - Practical protein crystallography (1997). C. Carter, R. Sweet. Academic Press