740 likes | 833 Views
La cristallographie en biologie structurale R. Fourme Univ. Paris-Sud et SOLEIL roger.fourme@synchrotron-soleil.fr tel. 0608258675. 1. Cristallisation.
E N D
La cristallographie en biologie structurale R. Fourme Univ. Paris-Sud et SOLEIL roger.fourme@synchrotron-soleil.fr tel. 0608258675
Cristallisation Goutte de solution saturée de protéine Réservoir de solution avec proportion accrue de précipitant Méthode de cristallisation dite de la goutte pendante
Des cristaux aux propriétés très remarquables • Des cristaux biphasiques mi-solides, mi-liquides (de 30 à 80% de liquide). L’arrangement du cristal est du à l’empilement des molécules, les parties vides étant comblées par la solution. • Assez rigides pour présenter un ordre à très grande distance. La perfection de l’arrangement est attestée par la grande finesse des profils de diffraction, qui peut parfois atteindre quelques millièmes de degré. • Assez plastiques pour supporter des réarrangements importants (déshydratation, amélioration de la qualité cristalline par recuit thermique, compression > 10% sous haute pression….) • Peuvent être trempés à basse température (éventuellement en ajoutant de l’antigel à la solution ) mais ne supportent pas un refroidissement lent au-dessous de 0° (la glace doit rester amorphe, et non cristalliser).
Montage d’un cristal dans une mini-boucle de nylon. Cet échantillon est trempé dans de l’azote liquide puis conservé dans un jet de gaz froid pendant l’enregistrement des données pour diminuer les dommages secondaires sous irradiation X.
Les cristaux biologiques supportent bien une compression hydrostatique. La cristallographie sous haute pression (HPMX) est une méthode mature. Les enregistrements sont effectués sur les lignes de lumière CRISTAL (SOLEIL), ID27 et ID09 (ESRF). Coupe d‘une cellule haute-pression à diamants de grande ouverture, avec génération de force pneumatique. Dimensions du cylindre : 59 mm x 30 mm
1 2 Cristal frais de la protéine urate oxydase comprimé dans la cellule à diamants. Diamètre de la cavité dans le joint 350 mm Cristal de la protéine lysozyme après irradiations successives et translations. 3 Fragment de diamant utilisé pour combattre l’orientation préférentielle du cristal par rapport aux culots des diamants La gamme utile de pression est limitée par la pression de dénaturation de la macromolécule, 0,1-2 GPa (1000 à 20000 atmosphères).
-1 = T.F. 2 La diffraction X 2 I ~ F cristal hkl hkl diffraction = T.F. RX équivalence reconstruction z Le calcul par TF-1de la densité électronique en chaque point (x,y,z) donne une « image » du cristal. y x 1 -2i(hx+ky+lz) (x,y,z) = F e V k l h hkl Coefficients = facteurs de structure = nombres complexes. (modules |F| connus à partir des intensités, mais lesphases restent inconnues) i |F| |F| I r hkl hkl C'est le problème des phases !
3 F = facteur de structure (nb. complexe) = contribution des atomes à la diffraction n Fhkl = fi e2i(hxi+kyi+lzi) n atomes en {xi, yi, zi} : 1 Facteur de diffusion du ième atome La densité r est calculable si la position des atomes est connue (donc si … le problème est résolu) Un facteur de structure Fhkl est la somme des contributions de tous les atomes |F| f • Tous les atomes interviennent pour établir la densité électronique en chaque point de l'espace et vice-versa. Technique globale
Variation du facteur de diffusion atomique f de quelques atomes avec l’angle de Bragg (unité: nombre d’électrons). f est la TF de la densité électronique de l’atome à symétrie sphérique. Pour un angle de Bragg nul, f = Z. f diminue rapidement aux grands angles, car l’extension du diffuseur (cortège électronique) n’est pas négligeable devant la longueur d’onde du rayonnement comme dans le cas des neutrons. Cette diminution est encore plus rapide si la densité est étalée par du désordre statique ou dynamique.
17 facteur d'atténuation dû à l’agitation thermique (et au désordre). 2 f = foe-Bsin q l2 fo = facteur de diffusion B = facteur d'agitation thermique (unité : Å2) (ou facteur de Debye-Waller) 1 0 Atome "ponctuel" ( à 0 K), B =0 Atome très peu agité (B~5Å2) Atome peu agité (B~10Å2) Atome assez agité (B>15Å2) 10 20 30 q (°) d (Å) 1 Å 5,7 Å 1,5 Å 2,8 Å Équivalence entre angle de Bragg et résolution pour l = 1 Å. basse haute (rare pour les macromolécules) moyenne U diffracte 8500 fois plus que H I ~ Z2 f ~ Z
11 Paires de Friedel et réflexions équivalentes par symétrie • Pour la diffusion « normale », • les deux membres d’une • paire de Friedel ont la même intensité • I(hkl) = I(-h –k -l), • les intensités des réflexions équivalentes par • symétrie sont également identiques. • Ex: pour une maille orthorhombique • I(hkl) = I(-h k l) = I(h –k l) = I(h k –l) = I(-h -k l)… i Fh,k,l Ah,k,l fh,k,l = -f-h,-k,-l |Fh,k,l|= |F-h,-k,-l| Bh,k,l fh,k,l r B-h,-k,-l F-h,-k,-l
Notion de résolution Relation de Bragg: 2d sin q = l Les réflexions de Bragg aux « grands angles » (de Bragg), donc associées à des distances interréticulaires d petites, véhiculent l’information à haute résolution. Ces réflexions sont de faible intensité compte tenu du déclin des facteurs de diffusion aux grands angles, aggravé par de gros (10-60 Å2) facteurs de Debye-Waller. En cristallographie des macromolécules, la valeur moyenne des intensités est faible (la diffusion se partage entre un très grand nombre de réflexions) et le désordre statique et dynamique est important. L’art du cristallographe est d’améliorer le signal sur bruit: détecteur sans bruit propre, taches de Bragg petites (faisceau X parallèle et monochromatique, bon cristal), combattre la dégradation du cristal. Le RS est essentiel. On appelle résolution utile du diagramme de diffraction la valeur minimale dmin de d pour laquelle le signal de diffraction est supérieur au bruit. dmin correspond sensiblement à la distance minimale pour laquelle deux points de la structure sont vus séparément. La résolution «atomique» (rare) est obtenue pour dmin < 1,3 Å. La meilleure résolution jamais atteinte est autour de 0,5 Å.
24 Application et visualisation des densités électroniques -2i(hx+ky+lz)+fhkl 1 (x,y,z) = |F | e V h k l hkl En 2D : x etc... z=n+1 z=n y
25 En 3D : Structure de la pénicilline (sel de K+) x z y Dorothy Hodgkin-Crawfoot, 1949
26 Autre présentation en 3D ("TURBO", "O"…)
20 FONCTION de PATTERSON Phase inconnue Fourier : 1 -2i(hx+ky+lz) +fhkl (x,y,z) = |F|e V hkl h k l Modules connus à partir des intensités Noté : {|F|,f} 2 Ihkl = Fhkl F*hkl Ihkl~ |F|hkl j=n i=n Ihkl = fi e2i(hxi+kyi+lzi) fj e-2i(hxj+kyj+lzj) j=1 i=1 Ihkl = fi fje2i [ h(xi-xj) + k(yi-yj) +l(zi - zj) ] i j Vecteur différence entre les deux atomes i et j facteurs de diffusion de la paire i-j • Le facteur de structure F est la somme des contributions des • positions atomiques • L'intensité I (ou F2) est la somme des contributions des • différences des positions atomiques (vecteurs différences) • pondérées par le produit des facteurs de diffusion de la paire i-j.
FONCTION de PATTERSON • Si r(x,y,z), calculée avec F, dépend de la position • des atomes, la même fonction, calculée avec F2 • dépendra des différences entre atomes. On l'appelle P(u,v,w) • Si r(x,y,z) dépend d'une origine qui doit être connue • ( vecteurs 0 -> atomes), P(u,v,w) ne dépend plus que • des vecteurs-différence {u,v,w}, donc pas de l'origine. • Ce Fourier (noté {|F|2,0} ) est appelé Patterson -2i(hu+kv+lw) 1 P(u,v,w) = |F|2e V hkl h k l • P(u,v,w) calculable en tout point à partir de l’expérience. • P(u,v,w) a la même périodicité que r(x,y,z) • Autres propriétés : • Analogue à une densité mais les pics correspondent à des • vecteurs-différences entre atomes. (n atomes n(n+1) pics • Intensité des pics ~ SZ2. Beaucoup plus compliquée ! 21 • Symétrie initiale : les différences entre positions symétriques • entraîneront des positions spéciales : sections de Harker. • Symétrie du Patterson = celle du groupe de Laue (P2/m pour • monoclinique, etc..). Donc centro-symétrique. • Pic à l'origine = somme des distances entre atomes identiques (coord. zéro). • Élargissement des pics recouvrements importants.
<Z> - Bsinq2/l2 F0 e 28 Autres types de Patterson's -2i(hu+kv+lw) 1 P(u,v,w) = coef 2e V hkl h k l Patterson différence Coef2 =(|Fo|-|Fc|)2 Pour les protéines : Coef2 =(|Fderivé|-|Fnative|)2 Patterson ponctualisé Coef2 =F2point Fpoint = facteur de structure ponctualisé Fpoint=Fréel. Suppression du pic à l'origine si coef2= (F2point-Sfi2 ) Patterson anomal Coef2 = DF±2
Des détecteurs à localisation de surface haut de gamme
Détecteur MARResearch à plaque photosensible («imaging plate»). Diamètre utile 345 mm. La lecture est faite par mesure de la luminescence excitée par laser, avec un balayage en spirale assurant un temps de mesure constant par point. (principe: le faisceau laser se déplace radialement à vitesse constante; la vitesse angulaire de la plaque varie continûment avec w = k/r. La plaque tourne donc de plus en plus vite à mesure que le faisceau laser se rapproche du centre). Temps de lecture: environ 60 sec (pour le diamètre maximal et des pixels de 140 mm). Pixels de 100 mm possibles.
Détecteur ADSC avec matrice de 9 grands CCD. Surface active : carré de 315 mm de côté. Conversion photons X-visible par phosphore. Chaque CCD est couplé à l’écran par fibres optiques assurant une démagnification de l’image. Temps de lecture de l’ordre de la seconde. Utilisé sur la ligne de lumière PROXIMA I de SOLEIL
Détecteur MARResearch à conversion directe photons X-électrons dans une couche mince de sélénium. Dimensions 420 x 320mm. Les charges sont détectées sur une surface pixelisée. Temps de lecture de l’ordre de la seconde. Efficacité de détection correcte dans un domaine de longueurs d’onde étendu, notamment à courte longueur d’onde.
Pilatus 6M de DECTRIS. Compteur de photons X à pixels hybrides.
Number of modules 5 x 12 = 60 Sensor Reverse-biased silicon diode array Sensor thickness 320 µm Pixel size 172 x 172 µm2 Format 2463 x 2527 = 6,224,001 pixels Area 431 x 448 mm2 Intermodule gap x: 7 pixels, y: 17 pixels, 8.4% of total area Dynamic range 20 bits (1:1,048,576) Count rate per pixel > 2 x 106 photons/s Energy range 3 – 30 keV Calculated DQE 3 keV: 80%; 8 keV: 99%; 15 keV: 55% Energy resolution 500 eV Adjust. threshold range 2 – 20 keV Threshold dispersion 50 eV Readout time 3.6 ms Framing rate 12 Hz Point-spread function 1 pixel Data formats Raw data, TIF, EDF, CBF External trigger/gate 5V TTL, 3 different modes Software interface Through socket connection; clients for EPICS, SPEC and stand-alone operation are available Cooling Close-circuit cooling unit for temperature stabilization Power consumption 350 W Dimensions (WHD) Approx. 600 x 600 x 550 mm Weight Approx. 95 kg Caractéristiques du Pilatus 6M
Image obtenue avec le détecteur à CCD. La gradation des couleurs (+ chaud = + intense) image la gradation des intensités.
De l’intensité Ihkl au module du facteur de structure Fhkl 34 I - Polarisation - Correction de Lorentz - Dépendance angulaire 2 Io I Intensité |F| = c L p Facteur d’échelle Polarisation Facteur de Lorentz I Io • Polarisation P 1+cos22 p = 2
I2 I1 35 • Correction de Lorentz L Une sphère d’Ewald non-idéale a une certaine « épaisseur » Les réflexions ne traversent pas toutes la sphère d’Ewald à la même vitesse Pour deux « équivalentes » : Sens de rotation tangente directe S2 S1 >> S2 S1 I ~ aire S Géométrie de rotation : correction L~ 1/sin pour que S1 = S2 I = n S<Ii>hkl Ihkl = • Moyenne : I = 1 n (Si n équivalentes pour Ihkl)
36 • Facteur d’échelle c Comparaison de jeux de données Fhkl de : • Cristaux différents • Enregistrements à différentes Pour une maille qui contient n atomes, l’intensité totale théorique (absolue) est : I = n Iabs= fi2 (f = facteur de diffusion de l’atome) I = 1 I = n 2 2 Iabs= fio e-2B(sin )/ 2 Approximation : B ~ le même pour tous I = 1 I = n 2 2 Iabs= e-2B(sin )/ . fio 2 I = 1 I = n 2 2 Iréel= ce-2B(sin )/fio 2 I réel = c I abs I = 1 Iréel 2 Iréel 2 2 2 ln ( ) = ln c -2B(sin )/ ce-2B(sin )/ I = n = 2 fio I = n 2 fio I = 1 I = 1 = équation d’une droite (droite de Wilson)
Iréel ln ( ) I = n 2 fio I = 1 37 • Facteur d’échelle c Droite de Wilson Iréel : moyennes des Ihkl par tranche de résolution ln c Pente = -2B 2 2 (sin )/ c = facteur d’échelle global B = facteur d’agitation thermique global
Masque = « cristal fictif » Laser fentes masque « molécule » Interférences « cristal » écran 4 Importance des phases dans le calcul de la densité Analogie en lumière visible (conte du canard et du chat) Réalisation d’une expérience de diffraction optique :
5 Importance des phases dans le calcul de la densité FT-1 FT ..Un canard basse résolution FT-1 Un canard... 100 50 0 Sa transformée de Fourier.. Un chat .. FT Échelle d’intensités FT-1 Sa transformée de Fourier..
Variantes autour des données de diffraction Si on « coupe » en résolution : On voit un canard flou (mal résolu) Si on n’utilise que la haute résolution : on voit seulement les bords du canard
6 Importance des phases dans le calcul de la densité calculer un canardchat ou un chatcanard ? FT-1 Phases ?? Amplitudes Cartes composites FT-1 Phases ?? Les termes les plus important dans la transformée de Fourier sont les phases (inconnues) et non les amplitudes (connues) ! Kevin Cowtan's book of Fourier : http://www.ysbl.york.ac.uk/~cowtan/fourier/fourier.html
Si on omet une région (secteur) des données, la reconstruction perpendiculaire sera déformée : Si on supprime des petites (10 %) zones aléatoirement distribuées : on retrouve une image « correcte » mais avec du bruit
Résolution de la structure cristalline : Approches expérimentales
Données de diffraction Carte de densité électronique De la diffraction à la carte de densité électronique
Remplacement moléculaire Structure 3D connue maille Il faut placer au mieux la modèle dans la maille. La connaissance d’un fragment de la structure peut suffire à amorcer le phasage. Programme AMORE de J. Navaza
Principe du phasage de novo • Chaque facteur de structure Fhkl est une somme d’ondes planes. En traduction vectorielle, c’est un nombre complexe somme de nombres complexes. • On détermine successivement la phase de chacun des Fhkl. On travaille donc réflexion par réflexion. • Supposons que la structure totale puisse se décomposer en deux sous-ensembles: • - La structure principale, complexe et inconnue, constituée d’atomes de Z petits (C, N, O, H…) ou moyens (S) • - Une structure relativement simple (dite structure de référence) constituée d’atomes qui diffusent d’une manière remarquable : • - soit des atomes lourds (à Z élevé) • - soit des atomes lourds ou mi-lourds en situation de diffusion anomale • La contribution de la diffusion de la structure de référence à chaque Fhkl est calculable (module et phase) car la position de tous ses atomes est connue (la structure a été «résolue» au préalable). • Cette onde peut donc être utilisée comme onde de référence. • L’expérience ne permet de mesurer que les amplitudes des ondes. Il faut donc transformer l’information sur les amplitudes en information sur les phases. • Il faut en général faire trois mesures d’intensités pour déterminer une phase sans ambiguïté. On fait en effet une triangulation. • Problèmes à résoudre dans l’ordre: • - Fabriquer la structure de référence • - Déterminer les coordonnées de ses atomes • Déterminer la phase de la structure complexe en s’appuyant sur la (ou les) • structure(s) de référence.
Interférence constructive 39 Comment résoudre en principe les phases de novo Principe : utiliser comme pivot une structure de référence qui émet un contribution calculable à chaque facteur de structure L'onde de référence vient d'un ou plusieurs atomes diffusant de manière remarquable (atome lourd ou diffuseur anomal) placés à des positions connues dans le cristal. I protéine Hg Interférence constructive I Interférence destructive Ainsi, une information (inconnue) de phase a été transférée en amplitude (donc mesurable)
Remplacement isomorphe dérivée native Diffusion anomale à différentes longueurs d’onde λ1 λ2
Méthode MIR • La méthode MIR pure et dure exige trois mesures de l’intensité du facteur de structure Fhkl • Une mesure venant du cristal natif • Une mesure venant d’un cristal dérivé I • Une mesure venant d’un cristal dérivé II • Avec deux mesures seulement, il y a 2 solutions pour la phase de la structure principale • L’ambiguïté est levée par la 3ème mesure • Avantages • A ouvert la cristallographie des protéines (Max Perutz, Hb) • Forts signaux, applicable à de très grosses structures. • Difficultés: • Fabriquer plusieurs dérivés • Les mesures ne sont pas effectuées sur le même cristal Perte de temps et cause d’erreurs. • Et surtout, les structures dérivées doivent être strictement identiques à la structure native (aux atomes lourds près). Ceci n’est que rarement réalisé Phases imprécises. • La structure principale et les sous-structures ne sont pas complètement séparables (c’est à dire Fh1, Fh2… tirés des mesures sont approximatifs) • ne structure de référence • qui émet un contribution calculable à chaque facteur de structure
41 La référence des phases Atome lourd : (Xh,Yh,Zh) Phases fh Fh(hkl) = fh e 2i(hXh + kYh + l Zh) fh condition d'isomorphisme : Fph = Fp + Fh Fph Fp L'atome lourd ne doit pas perturber le réseau cristallin Fh • |Fh| connu (approximativment) à partir de la variation Iph- Ip
Remplacement isomorphe fabrication de dérivés d’atomes lourds Protéine + liqueur-mère + sel d’atome lourd Pt, Hg, U, Sm, Yb, Pb, Au,… sous forme de sel Par trempage de cristaux natifs Par co-cristallisation Acétate d'uranyle UO22+ 92 Fluoro-uranatede potassium UO2F53- 92 Sodium hexachloroplatinate Pt(Cl)62- 78 Chlorure de mercure Hg2+ 80 Triméthyl acétate de plomb Pb(CH3) 3+ 82 Chlorure de plomb Pb2+ 82 Xénon Xe 54
crystal Quartz capillary Xenon input 1- 60 bar M. Schiltz et al. (1994) J. Appl. Cryst. 27, 950
First structure solved using xenon binding under pressure 2 Xe sites with 100% occupancy LURE W32 beamline Ligand binding domain of the human nuclear receptor RXR W. Bourguet, M. Ruff, P. Chambon, H. Gronemeyer & D. Moras (1995), Nature 375, 377
42 • Pour une sous-structure simple, calculer la Patterson-différence {||Fph|-|Fp||2,0} pour localiser les atomes lourds Site secondaire Site principal
Fh = facteur de structure d'un atome lourd-2 |Fph|2 = module du dérivé 2 fp o” Fh |Fph| 2 Deux dérivés Une seule phase ! 44 Comment déterminer les phases de la protéine ? = construction de Harker Fh = facteur de structure d'un atome lourd-1 Pour chaque hkl : |Fph|1 = module du dérivé 1 |Fp| = module de la native imaginaire A Plan complexe Fh o' |Fp| A” o réel |Fph| 1 A' Un seul dérivé = 2 phases valident la relation: Fph = Fp + Fh
27 Autres "densités » utiles pour améliorer la structure. Fo - Fc • Visualisation des densités résiduelles • Recherche des atomes d’hydrogène • Mise en évidence des défauts • Valable si fcalc@ fréel -2i(hx+ky+lz)+fcalchkl 1 D(x,y,z)= ||Fcalc|-|Fobs||e V h k l hkl • avec phases : fcalchkl 2Fo - Fc -Pour amélioration des détails « Omit" maps On "enlève" la contribution d'une partie douteuse de la molécule dans le calcul des Fcalc. Une carte (Fo-Fc) ne montrera que la partie soustraite, sans biais du modèle initial.