760 likes | 938 Views
Méthode Monte Carlo appliquée à l’Indexation des Diagrammes de Poudre et à la Solution de Structure. A. Le Bail Université du Maine Laboratoire des Fluorures CNRS – UMR 6010. Contenu de l’exposé - Plantage du décor : Le labyrinthe de la méthode des poudres
E N D
Méthode Monte Carlo appliquée à l’Indexation des Diagrammes de Poudre et à la Solution de Structure A. Le BailUniversité du MaineLaboratoire des FluoruresCNRS – UMR 6010
Contenu de l’exposé • - Plantage du décor : Le labyrinthe de la méthode des poudres • Lancement des démonstrations du logiciel McMaille • Etat de l’art en indexation • Résultats des démonstrations du logiciel McMaille • Lancement des démonstrations du logiciel ESPOIR • Etat de l’art des méthodes de solution de structure par essai-erreur • Résultats des démonstrations du logiciel ESPOIR • Conclusions
Plantage du décor Détermination de structure par diffractométrie des poudres Histogramme du nombre cumulé des structures déterminées< 1000 - à comparer aux ~ 400000 structures sur monocristal –anecdotique mais essentiel pour certains problèmes
Cette sous-discipline fait déjà l’objet d’une monographie de l’Union Internationale de cristallographie,publiée en 2002
Entre l’échantillon et la structure finale, la méthode des poudres est un labyrinthe Mais l’exposé d’aujourd’hui s’intéresse uniquement aux méthodes d’indexation et de solution de structure. Et plus spécifiquement aux algorithmes de type Monte- Carlo.
Autre façon d’illustrer ce labyrinthe :empiler les noms de méthodes et de logiciels… Que choisir (liste très incomplète) ???Dix ou quinze ans de créativité débordante !
Une partie de l'histoire de cette activité est consignée dans les archives de la liste de discussion SDPD qu'il vous est recommandé de rejoindre: http://groups.yahoo.com/group/sdpd/
Lancement des démonstrations du logiciel McMaille http://www.cristal.org/McMaille/ Objectif : Indexer les diagrammes de poudre des échantillons 1, 2 et 3 du SDPD (Structure Determination by Powder Diffractometry) Round Robin-2. Quelques millions de tests de paramètres de maille par Monte-Carlo vont être effectués.
Logiciels d’Indexation des Diagrammes de Poudre- Etat de l’Art -L’Embarras du Choix ? • Les « trois gros » individuels : TREOR, ITO, DICVOL • Les autres • Il faut les positions des pics – quels logiciels ? • Les suites logicielles contenant souvent les « trois gros » et éventuellement d’autres : CRYSFIRE, POWDER v2.00, POWDERX, PROSZKI, WINPLOTR • Les derniers-nés : INDEX, X-Cell, SVD-Index, McMaille • Quels logiciels ont participé (avec succès) au SDPD Round Robin 2 offrant pour la première fois une compétition sur 8 diagrammes de poudre, incluant l’indexation fin 2002 ? • UPPW et « indexing benchmarks »
WERNER, PE; ERIKSSON, L; WESTDAHL, M - TREOR, A SEMI-EXHAUSTIVE TRIAL-AND-ERROR POWDER INDEXING PROGRAM FOR ALL SYMMETRIES - JOURNAL OF APPLIED CRYSTALLOGRAPHY, 1985, Vol 18, pp 367-370 .
VISSER JW - A FULLY AUTOMATIC PROGRAM FOR FINDING THE UNIT CELL FROM POWDER DATA - JOURNAL OF APPLIED CRYSTALLOGRAPHY, 1969, Vol 2, pp 89-95 .
BOULTIF, A; LOUER, D - INDEXING OF POWDER DIFFRACTION PATTERNS FOR LOW-SYMMETRY LATTICES BY THE SUCCESSIVE DICHOTOMY METHOD JOURNAL OF APPLIED CRYSTALLOGRAPHY, 1991, Vol 24, pp 987-993 .
D’autres logiciels d’indexation • Taup (=Powder) ; Lzon ; Kohl (=TMO) ; Fjzn • Losh ; Mmap (dans Crysfire) ; Supercell (incommensurables) • Scanix ; Autox • Et pour les positions des pics ? Quelques logiciels gratuits : • CMPR • DRXWin • EFLECH • GPLSFT • pearson.xls • Rawplot (avec GSAS) • SHADOW • Powder v2.00 • PowderX • Winfit • Winplotr (avec Fullprof) • XFIT • + les commerciaux : EVA, JADE, XPERT-Highscore, etc.
Faut-il créer d’autres logiciels d’indexation ? L’indexation est plus un art qu’une science Disposer de plusieurs programmes complémentaires favorise la réussite de l’entreprise. Quel est le taux de réussite de ces logiciels ? Difficile à estimer… Faible dit le SDPD Round Robin 2 (2002).
SDPD Round Robin 2 – 2002 8 diagrammes de poudre à indexer100 participants ayant téléchargé les données6 réponses dans les temps (1 mois) 2 réponses hors limites CRYSFIRE (P1, P3), DICVOL (P2), ITO (P4), Index (P5) et X-Cell (P6).
L’indexation ne serait donc pas si facile… Les seuls logiciels à proposer des indexations pour les échantillons les plus complexes (4-8) du SDPD Round Robin sont récents : Index (Joerg Bergmann) X-Cell (Commercial - Accelrys) McMaille (utilisé par les organisateurs du Round Robin) Etant récents, peut-être avaient-il plus de raisons de chercher à démontrer leur efficacité dans ce Round Robin ? Il n’est pas question de conclure à l’inefficacité des autres logiciels, pourtant…
Exemple : échantillon 3 du Round Robina priori simple : cubique • Organisateurs: 18.881 18.881 18.881 90 90 90 (vol 6734 Å3) • P1: 13.349 13.349 9.439 90 90 90 (Tetragonal - 1638Å3) • P2: 18.878 18.878 18.878 90 90 90 • P3: 13.354 13.354 9.442 90 90 90 (Tetragonal - 1638Å3) • P4: pas de solution • P5: 18.878 18.878 18.878 90 90 90 • P6: 18.88 18.88 18.88 90 90 90 50% de réussite ! Où en sont les calculs d’indexation lancés en début d’exposé ?
Utilisation du logiciel McMaille McMaille est distribué sous licence publique GNU. Il peut être téléchargé à l'URL : http://www.cristal.org/McMaille/ Les cristallographes veulent des solutions rapidement. Est-ce possible avec un logiciel comme McMaille ? Oui, si vous considérez que 5 à 15 minutes est rapide. La première approche recommandée avec McMaille est d'utiliser le mode automatique. La démonstration suivante fait appel au logiciel WinPlotr pour extraire les positions et intensités des réflections. WinPlotr est configuré pour créer directement un fichier d'entrée pour McMaille en mode automatique.
Démarrer WinPlotr, ouvrir le fichier du diagramme de poudre, sélectionner « automatic peak search »
Sélectionner les conditions appropriées(doublet Cu-Kalpha1/2), cliquer sur OK
WinPlotr établit une liste de positions de pics et d'intensités
Donner quelques détails : un titre, la longueur d'onde du rayonnement, le décalage de zéro, c'est tout !
La préparation est terminée, le fichier pour McMaille est créé.
Il vous faut ensuite lancer l'exécution du programme McMaille, et donner le nom du fichier d'entrée :
Le mode automatique dans McMaille est un "système expert" qui examine toutes les symétries dans un domaine restraint de volumes et de paramètres de mailles (pas de contrainte en cubique cependant) :
Il s'ensuit la nécessité d'explorer d'autres intervalles de volumes et de paramètres de maille si le mode automatique échoue, ou bien si l'utilisateur souhaite y regarder de plus près. Dans ce but, McMaille prépare un fichier prêt pour un calcul en mode manuel à la fin d'un examen en mode automatique. Le fichier créé pour le mode manuel est le suivant :
Le lancement de McMaille en mode manuel avec ce fichier produit :
Un fichier .prf généré par McMaille pour cette indexation peut être affiché par WinPlotr :
Pendant les calculs, il est temps d'examiner de plus près tous les "secrets" du logiciel McMaille Ci-dessous l'organigramme explicite où Ni est le nombre de pics indexés, N le nombre total de pics, N' le nombre de pics non indexés tolérés, R la reliabilité de profil, R1, R2, R3 des valeurs limites de R définissant un comportement particulier du programme de calcul :
Le plus gros problème du logiciel McMaille est le temps de calcul. Une économie de temps est réalisée avec les listes des indices de Miller hkl qui sont préétablies. De 400 à 1000 triplets hkl pour chaque système cristallin sont lus dans des fichiers une seule fois au départ du logiciel et gardés en mémoire pour usage ultérieur. Dans la version 3 de McMaille, la forme idéalisée des pics se résume à une simple colonne. Cette hyper-simplification a conduit à multiplier la vitesse par 20, soit 20000 tests par seconde en symétrie cubique et 6000 en maille triclinique. Ce qui fait la majeure part du gain de vitesse c'est qu'un ajustement d'intensité n'est plus nécessaire, les colonnes observées et calculées ont la même hauteur et la même largeur fixée au départ. La reliabilité de profil RP est fonction du pourcentage de chevauchement entre colonnes observées et calculées.
Grossissement sur les dernières réflexions : La largeur des colonnes, en modes automatique, est calculée par la formule :0.3 x / 1.54056elle dépend du choix de l'utilisateur en mode manuel.
Un des deux cas qui conduisent à "affiner" les paramètres d'une proposition de maille est quand Ni > N-N' Un pic observé est considéré comme indexé si un chevauchement existe avec un pic calculé. Le deuxième cas qui conduit à affiner les paramètres d'une proposition de maille est lorsque R < R1 (il est recommandé de choisir R1 proche de 50%).
Pour en dire plus au sujet de l'affinement des paramètres de maille d'une proposition retenue par McMaille : si R < R1 mais que R1 est de l'ordre de 50%, un affinement classique par moindre carrés serait difficile. C'est donc par Monte Carlo que sont "affinés" les paramètres des mailles retenues si R < R1. Un petit changement de paramètre est testé et conservé si R s'améliore, et on tire au sort quel sera le paramètre modifié. Ceci est effectué 200 fois en symétrie cubique et jusqu'à 5000 fois en triclinique. L'amplitude du changement de paramètre est elle-même tiré au sort avec |delta maximum| = 0.02 Å. Pour le tout meilleur résultat ( à R < R3 ~ 5%) les paramètres de mailles sont finalement soumis à un réel affinement par moindres carrés et les figures de mérite classiques (M20, F20) sont calculées. Pour ce résultat sélectionné, des pseudo diagrammes "observés" et calculés sont simulés avec des formes de pics gaussiennes, un fichier de type .prf affichable par le logiciel WinPLOTR est créé. D'autres logiciels compatibles avec certains fichiers en sortie de McMaille sont CHEKCELL et CRYSFIRE.
Un problème qui se pose dans la plupart des calculs de type Monte Carlo est celui de se retrouver bloqué dans un faux minimum de R. Pour l'éviter, il convient d'accepter de temps à autre un changement de paramètre de maille qui n'améliore pas la reliabilité R. La meilleure probabilité P d'accepter un nouveau paramètre de maille malgré une reliabilité non-améliorée est de l'odre de 15%, comme le montre le tableau ci-dessous qui donne le nombre de bonnes réponses obtenues pour un même nombre de tirages au sort Monte Carlo en fonction de P: P (%) 0 15 30 45 60 75 100 Test 1 – orthorhombique 41 45 32 27 15 6 1Test 2 – rhombohédrique 28 41 40 28 17 10 6Test 4 – monoclinique 47 60 46 45 25 19 2Test 6 – triclinique 36 42 36 24 18 12 12 P : une valeur de 15 signifie que dans 15% des tests, un changement des paramètres sera accepté même si ce changement n'améliore pas R ou bien ne fait pas s'améliorer le nombre de réflections indexées P = 100 : un changement de paramètre sera toujours accepté P = 0 : un changement de paramètre ne sera pas accepté si il n'améliore pas R.
McMaille est un logiciel d'indexation relativement insensible à la présence d'impuretés. L'utilisateur décide du degré d'insensibilité au moyen de deux paramètres ajustables : N’ : le nombre toléré de pics non-indexés, R2 : une reliabilité qui permet de ne garder que des solutions pour lesquelles R < R2. Fixer R2 à 15% signifie que des propositions de maille expliquant au moins 85% de l'intensité totale du diagramme seront conservées dans la liste finale des possibilités. Il est donc considéré qu'une impureté ne devrait pas concerner plus de 15% de l'intensité totale du diagramme. Cependant, le nombre des pics de faible intensité, appartenant à l'impureté, pourrait bien être élevé, ce qui obligerait à choisir N' assez grand (si l'on décide d'incorporer beaucoup de pics de faible intensité dans la liste des données).
Les conclusions d'une étude systématique à propos des pics appartenant à une impureté sont les suivantes pour McMaille. A condition que l'intensité associée aux pics supplémentaires reste inférieure à 15% de l'intensité totale : - pour un nombre de pics supplémentaire inférieur à 30% du nombre total des pics, McMaille parvient généralement à retrouver la bonne indexation en tête de liste, cependant les figures de mérite diminuent (R augmente); - pour un nombre de pics supplémentaire compris entre 35 et 50% du nombre total des pics, McMaille peut encore parvenir à proposer la bonne indexation mais pas toujours en tête de liste. Il est alors plus difficile de conclure.
Exemple d'une phase orthorhombique indexée en dépit de la présence de 12 petits pics d'impureté additionnés à 20 pics (soit 37,5% en nombre mais moins de 15% en intensité)
Au-delà de ce problème des impuretés, il est envisageable de tenter d'indexer des diagrammes multiphasés (obtenir en même temps plusieurs mailles indexant la totalité du diagramme). Voyons le coût d'une telle tentative sur l'organigramme de McMaille :
Ce coût se traduit essentiellement en temps de calcul prohibitif parce que le nombre de propositions de mailles qui doivent être examinées de plus près (ajustement par Monte Carlo si R < R1) devient rapidement énorme dans la mesure où R1 doit être fixé très au-dessus de 50% (vers 75%). De même, la limite R2 doit être similaire à R1, et R3 également doit être largement supérieur à 50%. Une série de tests avec des mélanges de phases permet de fournir quelques conclusions en ce qui concerne l'usage de McMaille pour des échantillons biphasés. A la condition que 30 pics sont examinés et que 13 à 17 pics appartiennent à l'une ou l'autre des deux phases, et que 40 à 60% de l'intensité totale appartienne à l'une ou l'autre des deux phases, alors McMaille apparait capable de produire des solutions correctes dans des temps raisonnables (moins d'une heure) pour des combinaisons de deux phases qui ne seraient ni l'une ni l'autre monoclinique ou triclinique. Pour ces dernières basses symétries, les temps de calcul deviennent prohibitifs.
Exemple d'indexation d'un mélange de 2 phase (20 minutes de calcul) : l'une est quadratique et l'autre est orthorhombique. McMaille combine les propositions de mailles deux par deux et détecte les meilleures combinaisons indexant le plus grand nombre de pics :
Pour plus de détails sur le Round Robin, voir : Site Web du SDPD Round Robin : http://sdpd.univ-lemans.fr/sdpdrr2/results/ IUCr - CPD – Newsletter N°29
Sample 1 - Al2F10[C6N4H20] Sample 2 - Sr5V3(F/O/OH/H2O)22 Sample 3 - C61Br2
Lancement des démonstrations du logiciel ESPOIR http://www.cristal.org/sdpd/espoir/ Objectifs : 1- trouver 9 atomes d’oxygène d’après le diagramme de diffraction de neutrons de La2W2O9, connaissant les positions des atomes de La et W déterminées par diffraction X de poudre (méthodes directes). Toutes autres méthodes (Fourier différence, etc), ayant échoué à localiser les oxygènes. ESPOIR fait cheminer au hasard 9 atomes d’oxygène dans la structure où les 2 La et 2 W sont fixes, jusqu’à obtenir la meilleure reliabilité. 100 tests indépendants de 200 000 mouvements d’atomes vont être effectués par Monte Carlo, soit 20 millions de mouvements. 2- trouver la position de la molécule de bethanechol et d’un atome de Cl dans la maille du chlorure de bethanechol.
Logiciels de Solution de Structure sur Poudre- Etat de l’Art -L’Embarras du Choix ? - Méthodes Directes ou de Patterson classiques ou améliorées (EXPO, SHELXS, etc) - Méthodes dans l’espace direct utilisant des connaissances préalables de la chimie du composé telles que la formule moléculaire, la composition, l’existence probable de polyèdres définis, etc (ENDEAVOUR, DASH, ESPOIR, TOPAS, POWDERSOLVE, FOX, EAGER, OCTOPUS, PSSP, FOCUS, SAFE, SIMULATED ANNEALING, etc). Ces méthodes fonctionnent par tirage au sort de nombres compris entre 0 et 1. (Monte Carlo, recuit simulé, trempe parallèle, algorithme génétique…).
ENDEAVOURK. Brandenburg and H. Putz, Crystal Impact, Bonn, Allemagne - Optimisation globale combinée de facteur R et d’énergie potentielle par recuit simulé - Intensités intégrées J.Appl.Cryst.32, 864 (1999) Ag2NiO2– structure typique Schreyer and Jansen,Sol. State Sci.3, 25, (2001). 15 atomes dans l’u.a., P1. 45 Degrés de liberté. Disponible chez Crystal Impact à prix réduit pourutilisateurs académiques.
DASHW.I.F. David and K. Shankland Rutherford Appleton Laboratory, développements ultérieurs par J. Cole and J. van de Streek CCDC, UK - Recuit Simulé - Intensités intégrées corrélées (Pawley) - Chem. Commun. 931 (1998) - Capsaicin - plus complexe structure en termes de nombre de variables Chem. Commun. 931 (1998) - 16 degrés de libertés, dont 10 angles de torsion. Telmisartan, formes A et B – structure typique J. Pharm. Sci.89, 1465 (2000) 13 degrés de liberté dont 7 angles de torsion. Commercial, avec réduction de 95% pour le secteur académique
ESPOIRA. Le Bail, Université du Maine, France Monte Carlo Intensités intégrées ou pseudo diagramme reconstitué à partir des |Fobs| extraits. Mat. Sci. Forum378-381, 65 (2001). Souzalite/Gormanite Le Bail, Stephens and Hubert, European J. Mineralogy 15 (2003) 19 atomes dans l’u.a. en P-1. Fe en 0,0,0; 54 Degrés de liberté. Gratuit et ouvert – entièrement disponiible : executable + Fortran et Visual C++ code source (GPL - GNU Public Licence).Site Web : http://www.cristal.org/sdpd/espoir/