480 likes | 581 Views
Etalonnage et modélisation. 11ème MIEC - 21ème JIREC Multimédia et Informatique dans l'Enseignement de la Chimie Journées pour l'innovation et la Recherche dans l'Enseignement de la Chimie 1er, 2 et 3 Juin 2005 à Autrans. Standards de calibration: Fonction réponse.
E N D
Etalonnage et modélisation 11ème MIEC - 21ème JIRECMultimédia et Informatique dans l'Enseignement de la Chimie Journées pour l'innovation et la Recherche dans l'Enseignement de la Chimie1er, 2 et 3 Juin 2005 à Autrans
Standards de calibration: Fonction réponse Contrôle qualité: Linéarité,Répétabilité, fidélité intermédiaire, exactitude Etalonnage/modélisation en sciences analytiques Impuretés Produits de dégradation • OBJECTIFS • Déterminer une procédure d’étalonnage inverse adapté. • 1a. Intervalle de dosage • 1b. Fonction réponse • Evaluation des limites de détection et de quantification • Prédire une incertitude de mesure à l’aide de QC (exactitude et précision) • Simulation du travail de routine à l'aide d'échantillons de concentrations connues. signal domaine
Réponse analytique Détermination de la borne supérieure du domaine linéaire LOQ LOD Teneur Estimation LOD/LOQ Gamme linéaire Gamme dynamique Permission J. Vial – Paris Domaine d’analyses
Y Y Ajustement linéaire Ajustement polynomial Sinon un polynôme de degré convenable. Une droite si Y varie linéairement avec X. Y = f(X) avec un Modèle Y= b1X + b0 polynôme de degré convenable Modèle X X Modélisation Modéliser : utiliser des données expérimentales pour prévoiruneinformation quantitative inconnue Y à partir de mesures de X via une certaine « fonction mathématique » : Le modèle mathématique postulé peut être :
Etalonnage/Relation linéaire Dans le cas les plus simple il existe une relation linéaire entre : la grandeur à quantifier X (ici la teneur de l’échantillon en un composant donné) et une seule grandeur physique Y généralement donnée par un appareil. Y = b1X + b0
la concentration X de l’analyte n’est pas considérée comme variable aléatoire puisqu’elle est connue avec précision. mais aussi de l’aléa de l’erreur expérimentale. Régression Quand on trace la courbe d’étalonnage d’une méthode d’analyse à partir d’étalons choisis par l’expérimentateur, En revanche, la réponse Y obtenue est une variable aléatoire dans la mesure où elle dépend non seulement de X, Conclusion : les deux variables X et Y ne jouent pas le même rôle.
Régression linéaire X représente une teneur connue en analyte Y représente le résultatobservé, On peut disposer de n couples[xi,yi] pour deux variables X et Y que l’on suppose liées : à chaque valeur de X est associée une valeur de Y avec la relation : (Y = ß1X + ß0) Mais, expérimentalement, à chaque valeur xi de X, on obtient une valeur yientachée de l’erreur expérimentaleεi. On a en réalité : yi = ß1xi + ß0 + εi
Analyse Quantitative et Etalonnage Ces données sont toujours en nombre limité, elles ne représentent donc qu’un échantillon de la population de toutes les mesures de la teneur en analyte de l’étalon que l’on pourrait effectuer. X représente une teneur connue en analyte Y représente le résultatobservé, la relation linéaire postulée devient : Y = b1X + b0 Avec uniquement une « estimation » des coefficientsa et b du modèle postulé. Y = ß1X + ß0
on ne va pas obtenir des points “idéalement alignés”, mais un«nuage» de points plus ou moins écartés de cette droite idéale. Régression linéaire A cause de cette erreurεiassociée à chaque couple [xi,yi], si on représente graphiquement yi en fonction de xi,
Modèle linéaire Y= b0 + b1 X + r Avec une seule variable X le modèle s ’écrit : Y Y5 Y4 Y2 Y3 Y1 X1 X2 X3 X4 X5 X
^ Y1 Ajustement linéaire Y= b0 + b1 X + r Avec une seule variable X le modèle s ’écrit : Y Y5 r5 r4 Y4 On mesure la somme des carrés des écarts ri(écarts appelés "résidus") entre la valeur vraie et la valeur estimée ŷnsur la courbe. r2 Y2 r3 Y3 r1 Y1 Faire un ajustement c'est minimiser la "distance" S = [Yi -f( Xi)]2 = r i2 X1 X2 X3 X4 X5 X
Droite des moindres carrés et efficacité d’un ajustement La somme S des carrés des écarts entre les valeurs expérimentales et les valeurs calculées par le modèle s’écrit : S =Σ [yi - (b0 + b1xi )]2est une fonctiondeb0etb1. Pour minimiser S, il suffit d'annuler les dérivées partielles de S par rapport àb0et àb1 : S/b0 = S/b1= 0.
N° des essais Conc. X en nM Unités de Fluoresc. Y 0 1 2 3 4 5 6 0,1 3,8 10,0 14,4 20,7 26,9 29,1 1 2 3 4 5 6 7 Régression linéaire exemple : Fluorescence Soit un jeu de calibration dans la gamme de 0 à 6 nanomoles (les unités de fluorescence mesurées sont exprimées dans une échelle arbitraire dépendante de la gamme de concentration).
Droite d’étalonnage 30 20 Unité de fluorescence 10 0 0 1 2 3 4 5 6 7 nM Régression linéaire exemple : Fluorescence La droite des moindres carrés correspondant aux données a donc pour équation : Y = 5,139 X – 0,418
S(yi - y)(xi - x) ^ ^ et b0 = b0 = y - b1 X b1 = b1 = S (xi - x)2 Estimation des coefficients Dans ce système les bi sont les inconnues que nous devons estimer : (bi est l ’estimation calculée de bi ). 1. Au sens des moindres carrés (résolution algébrique) : 2. Au sens des moindres carrés (résolution matricielle) :
Régression linéaire • Avec Excel: • Fonction graphique : courbe de tendance • Fonctions algébriques (pente, ordonnee.origine) • Fonction matricielle : Droitereg Y = 5,139 X – 0,418
Ŷi = b1Xi + b0 Analyse de la régression linéaire Les variations observées pour Y sont-elles dues globalement, aux variations de X ou bien ne sont-elles que du bruit expérimental ? Quelle confiancepeut-on avoir : • d’une part globalement pour la régression, • Analyse de variance / coefficients • Examen des résidus • Manque d’ajustement (Lack of fit) • d’autre part individuellement pour les estimateurs ? • Simplification du modèle • Pertinence quadratique (global)
SCET SCEL SCER = + Variation totale Variation résiduelle ^ S(yi - yi)2 S(yi - y)2 r5 r4 - Y r3 r2 Variation due à la liaison ^ ^ ^ S(yi - y)2 = S(yi - y)2 r1 Analyse globale : Analyse de variance
Toute dispersion d’une série de données étant exprimée par la somme des carrés des écarts à la moyenne, on démontre la relation suivante sur laquelle est basée l’analyse de variance : SCET = SCEL + SCER Variation due à la liaison ^ S(yi - yi)2 ^ ^ ^ Variation résiduelle S(yi - y)2 = S(yi - y)2 Variation totale S(yi - y)2 Analyse globale : Analyse de variance Base de l’analyse de variance
Sommes des Carrés des Ecarts Degrés de lib. Carrés moyens Sources de variation 2-1=1 SCEL = 739,56 Régression 739,56 7-2=5 Résidus SCER = 6,175 1,235 7-1=6 Total SCET = 745,72 Fluorescence : Analyse de la variance
s12 = F (n12 ,n22) s22 Test de comparaison des variances Pour savoir si les variances des deux échantillons sont identiques ou différentes, il faut effectuer un test de comparaison de variances. Loi de Fisher (dite aussi de Fisher-Snedecor) Si deux échantillons de tailles n1 et n2 proviennent de lois normales de même variance, le rapport Fdes variances estimées suit une loi de Fisheravec ν1 = n1 – 1 et ν2 = n2 – 1 qui sont les degrés de liberté pour chacun des échantillons
estimée avecν1 degrés de liberté Variance s21 Fcalculé= Variance s22 estimée avec ν2degrés de liberté Test de comparaison des variances Les distributions de la loi F sont caractérisées par une dissymétrie gauche. S21 > S22 la plus grande variance au numérateur On détermine la probabilité pour qu’une valeur de F soit inférieure à la valeur Fi portée en abscisse
Sommes des Carrés des Ecarts Degrés de lib. Carrés moyens Sources de variation 2-1=1 SCEL = 739,56 Régression 739,56 Signif. 7-2=5 Résidus SCER = 6,175 1,235 2,12.10-6 7-1=6 Total SCET = 745,72 F 1;5;0,05 = 6,608 Fluorescence : Analyse de la variance Fcalc 598,8
ou sous une autre forme SCEL/SCET =1 Analyse globale : coefficients de régression La mesure de l'efficacité de l'ajustement peut être exprimée par un coefficient appelé “coefficient de détermination” ou “coefficient de régression multiple”. Si le modèle expliquait “idéalement” les résultats expérimentaux, nous aurions SCET = SCEL SCET = SCEL + SCER Pour un modèle parfait : SCER = 0 (il n'y a pas de différence entre valeurs expérimentales et valeurs calculées).
SCER R2 = 1 - SCET Coefficient de détermination R² SCEL=SCET – SCER R2 = SCEL / SCET R2 = (SCET–SCER)/ SCET R2 est la part de la dispersion expliquée par le modèle. Pour un modèle parfait, R2 = 1 car SCER = 0 (il n'y a pas de différence entre valeurs expérimentales et valeurs calculées).
Fonction réponse : R² R2 = 0.820 R2 = 0.820 R2 = 0.820 R2 = 0.820
SCER /(n-p) 1- R2a = SCET /(n-1) Coefficient de détermination ajusté R²a Le rapport R2 n’est pas une garantie de la qualité d’un modèle (dépendance du nombre d’essais et du modèle choisi) Ex. Avec deux points, droite; R2 = 1 Avec trois points , droite; R2 < 1 mais 2ème degré R2 = 1 Pour tenir compte du nombre d'essais, c'est à dire du nombre de degrés de liberté, il existe un coefficient de régression "ajusté" symbolisé par R2aet défini par :
Fluorescence : coefficients de régression R2 = 1 – (6,175/745,72) = 0,9917 R2a= 1 – ((6,175/5)/(745,72/6) = 0,9900
Résidus = écarts entre les points expérimentaux et la droite de régression Analyse globale : examen des résidus Les résidus devraient suivre une loi normale centrée sur 0. Un examen visuel permet généralement de déceler un problème de modèle (homoscédasiticité, courbure, ordre supérieur, etc.).
Une symétrie par rapport à l’axe x = x, Deux points d’inflexion à une distance dexégale àσ. Propriétés de la loi Normale Moyenne Variance Le graphe de la Loi Normale est caractérisé par : Une courbe en cloche asymptotique à l’axe des x, dont le maximum est pour x = x ,
0,9545 0,6827 Probabilité = 95,45% pour que x soit compris dans l’intervallex 2 s Probabilité = 68,27% pour que x soit compris dans l’intervallex 1 s 0,9973 Probabilité = 99,73% pour que x soit compris dans l’intervallex 3 s Propriétés de la loi Normale
o l’espérance mathématique E(ri) =0. s -2 2 -3 -1 1 3 68,27 % ou par l’écart-type s. 95,45 % 99,73 % Caractéristiques de l’erreur expérimentale ri Distribution de Gauss centrée sur zéro (échelle des abscisses en unités d’écart-type) En moyenne, l’erreur est nulle : La dispersion de « ri" est mesurée par sa variance : var(ri) = s2
Ŷi = b1Xi + b0 Analyse de la régression linéaire Les variations observées pour Y sont-elles dues globalement, aux variations de X ou bien ne sont-elles que du bruit expérimental ? Quelle confiancepeut-on avoir : • d’une part globalement pour la régression, • Analyse de variance / coefficients • Examen des résidus • Manque d’ajustement (Lack of fit) • d’autre part individuellement pour les estimateurs ? • Simplification du modèle • Pertinence quadratique (global)
x2 s2exp. 1 [ ] et + s2 Var(b0) = Var(b1) = n S(xi - x)2 S(xi - x)2 cette dispersion va se répercuter sur les variances de b0 et b1. Significativité des coefficients b0 estimation de β0 de moyenneβ0 et de variance var(b0) b1 estimation de β1 de moyenne β1 et de variance var(b1) Comme la variable Y qui intervient dans ces calculs est une variable aléatoire de variance σ2exp.
S ri2 ^ s2 = n-2 S (yi-b0 -b1xi)2 ^ s2 = s2 = n-2 Estimation de la variance expérimentale La variance expérimentale peut être obtenue par 1. la répétition des essais ou 2. « estimée » à partir des résidus, selon la relation suivante : On appelle cette estimation variance de la régression ou variance résiduelle
var(b1) = σ2résid . * (1/28) = 1,235 * 0,036 = 0,044 Coefficient Ecart-type var(b0) = σ2résid . * (1/7 + 3*3/28) = 1,235* 0,464 = 0,574 b0 -0,418 0.757 b1 5,139 0.21 Fluorescence : Significativité des coefficients Calcul de la variance des estimateurs (coefficients) (en utilisant la variance résiduelle comme estimation de σ2exp. )
Moyenne = b i pour n = n-2 -tc tc bi tc e.t.(bi) Intervalle de confiance pour bi : Significativité des coefficients Le coefficient bi est distribué selon une distribution de Student de moyenne bi, d'écart-type e.t.(bi) et (n-2) degrés de liberté.
b0 ± tc e.t. (b0) b1 ± tc e.t. (b1) Il s’agit ici du tthéorique avec ν= 5 Pour le risque choisi (0,05) t = 2,57) 5,139 ± 2,57*0,21 -0,418 ± 2,57*0,757 Fluorescence : Significativité des coefficients Intervalles de confiance des bi : -2,36 < b0< 1,53 4,98 < b1< 5,30 Si l’intervalle inclus le zéro, le coefficient n’est pas significatif (au risque choisi)
bi bi - β0i t = t = é.type (bi) é.type (bi) Significativité des coefficients D’où le test suivant : la différencebi - βi0suit une statistique de Student à ν = (n-2) degrés de liberté avec : La significativité va être déterminée en prenant βi0 = 0 d’où :
coefficients écart-type significativité tcalculé 0,757 0,210 -0,552 24,41 0,6046 0,0036 b0 -0,418 5,139 b1 Fluorescence : Significativité des coefficients Etalonnage de la méthode d’analyse de traces par fluorescence, avec un risque a=0,05et avec n=7-2=5 degrés de liberté, t5, 0.05 =2,57 (calculé avec LOI.STUDENT.INVERSE d'EXCEL).
Régression linéaire • Avec Excel: Outil, Utilitaire d’analyse Régression linéaire • Coefficients de régression • Analyse de variance (test de F1) • Calcul, significativité et intervalles de confiancesdes coefficients • Analyse des résidus
Résolution matricielle Coefficients du modèle B =(X'X)-1X'Y Matrice de variance-covariance des coefficients C'est une matrice où les variances sont disposées sur la diagonale et les covariances de part et d'autre de cette diagonale (matrice carrée symétrique) :
yi - y y yi - y x,y Variance-covariance Variance de x x Variance de y Covariance xy
var (b0) cov (b1,b0) var (b1) var (B) = Var(B) =s2(X'X)-1 Variance expérimentale Matrice de variance-covariance des coefficients Conséquence: le choix des points expérimentaux conditionne la qualité de l’estimation la meilleure estimation consiste à annuler la covariance et minimiser les variances sur les coefficients Plan d’expériences
Définitions LOD/LOQ LOD = 1) Plus petite quantité d’analyte dont on puisse dire avec un niveau de confiance donné qu’il est présent dans l’échantillon 2) Plus petite quantité de l’élément à analyser pouvant être détectée, mais non quantifiée par une valeur précise (ICH). 3) …, mais non quantifiée par une valeur exacte (SFSTP 1997). LOQ = 1) Plus petite quantité d’analyte qui peut être quantifiée avec un niveau de confiance donné. 2) Plus faible concentration de l’analyte dans l’échantillon qui puisse être déterminée quantitativement avec une justesse et une précision convenables (ICH). 3) Plus petite quantité à examiner dans un échantillon pouvant être dosé dans des conditions expérimentales décrites avec une fidélité et une exactitude définies (SFSTP 1997)