730 likes | 935 Views
METHODOLOGIE DE LA RECHERCHE EXPERIMENTALE. Roger Phan-Tan-Luu Université Paul Cézanne - France. Méthodologie de la Recherche Expérimentale. Une mesure nous donne un résultat.
E N D
METHODOLOGIE DE LA RECHERCHE EXPERIMENTALE Roger Phan-Tan-Luu Université Paul Cézanne - France Méthodologie de la Recherche Expérimentale
Une mesure nous donne un résultat * L’information ainsi obtenue doit être de bonne qualité, pour que nous puissions, à partir de celle-ci, prendre une décision avec un risque minimum * Ce résultat doit nous apporter une information qui correspond bien à l’information demandée Utilisable Utile
Cas ideal : il n’y a pas d’erreur expérimentale Le résultat de la mesure nous donne Cas normal : l’erreur expérimentale existe Le résultat de la mesure ne nous donne que y yi = I + ei yi est une estimation dei précision, justesse, exactitude, ..
mesure associée à un modèle mesure individuelle * Pour améliorer la qualité de l’information obtenue à partir du modèle, en plus de la qualité apportée par la mesure,il faudra aussi compter avec les conditions d’expérimentations * Pour améliorer la qualité de l’information obtenue, il suffit d’augmenter le nombre d’essais
mesure individuelle * Pour améliorer la qualité de l’information obtenue, il suffit d’augmenter le nombre d’essais Soit N essais répétés (honnêtement) y1, y2, …, yN Ymoyen = yi/N Var (ymoyen) = s2 / N
mesure associée à un modèle * Pour améliorer la qualité de l’information obtenue à partir du modèle, en plus de la qualité apportée par la mesure,il faudra aussi compter avec les conditions d’expérimentations
b1= 1+ (e2 – e1) / (x2 – x1) Cas normal : l’erreur expérimentale existe yi = i+ ei= 0+1xi+ ei y2 = 0 + 1 x2 + e2 y1 = 0 + 1 x1+ e1 (y2 - y1) / (x2 – x1) = (2+ e2 - 1 – e1) / (x2 – x1) = (2 - 1 + e2 – e1) / (x2 – x1) = (2 -1) / (x2 – x1) + (e2 – e1) / (x2 – x1)
La qualité de l’information obtenue dépend de la position des points expérimentaux. b1= 1+ (e2 – e1) / (x2 – x1) Pour obtenir une bonne estimation de 1 : b1 1 Il faut et il suffit que : (e2 – e1) / (x2 – x1) 0 (x2 – x1) doit être le plus grand possible
Y y6 y7 S. C. E = (yexp, i - ycalc, i )2 y5 y4 y3 yexp, 3 - ycalc, 3 y2 y1 X x1 x2 x3 x4 x5 x6 x7 yexp, 3 ycalc, 3
L = (yi – b0 – b1xi )2 Nb0 + b1 xi = yi b0 xi + b1 xi 2 = yi xi
Sxy = yi (xi - x moyen )2 Sxx = (xi - x moyen )2 b1 = Sxy / Sxx b0 = y moyen – b1 x moyen Var(b1) = Var (Sxy / Sxx) = Var (Sxy) / S2xx Var(b1) = Var ( yi (xi - x moyen )2 ) / S2xx Var ( yi (xi - x moyen )2 ) = s2 (xi - x moyen )2 Var (b1 ) = s2 / Sxx Var (b0 ) = s2 [ 1/N + x moyen 2 / Sxx ]
REPRESENTATION VECTORIELLE Définitions : Y : vecteur colonne de la réponse expérimentalesyi Y' : { y1, y2,…… yN } h: vecteur colonne de la réponse théoriquesh i h ' : { h1, h2, ….. hN}
REPRESENTATION VECTORIELLE (suite) b: vecteur colonne des coefficients du modèle à estimerbib' : { b0 , b1 , b2 , …. bp} B: vecteur colonne des estimateursbi B' : {b0 , b1 , b2 , …. bp} e: vecteur colonne des erreurs expérimentalesei e ' : {e1 , e2 , ..... eN} Notation matricielle classique h = Xby = Xb + e
METHODE DES MOINDRES CARRES La méthode des moindres carrés ne nécessite aucune hypothèse sur la distribution des erreurs expérimentales L = (Y– Xb) ‘(Y– Xb) X'X B = X'Y B = (X'X)-1 X'Y si det (X'X) 0
METHODE DES MOINDRES CARRES Si la matrice (X’X) n’est pas singulière, nous obtenons le vecteur des estimations : B = (X'X)-1 X'Y X’X: matrice d’information (X’X)-1: matrice de dispersion Si le modèle y = Xb + e est correct, B est une estimation non biaisée de b,
MATRICE DE VARIANCE – COVARIANCE DE B Var [B ] = (X’X)-1s2 Var [B ]: matrice de variance-covariance deB (X’X)-1: matrice de dispersion : {c ij} cjj : coefficient de variance La variance de l’estimateur bj est obtenue en multipliant la variance de l’erreur expérimentale s2 par le terme diagonal correspondant cjjde la matrice de dispersion var [bj ] = cjjs2 covar [bj , bi] = cji s2
modèle matrice d’expériences matriced’ information x X X'X N matrice du modèle plan d’expérimentation matrice de dispersion expérimentation (X'X)-1 Y s2 Var (B) = (X'X)-1 facteurs d’inflation B = (X'X)-1X'Y fonctions de variance tests statístiques R E G R E S S I O N M UL TILINE AI R E - - 1
La variance et la covariance d’un estimateur dépendent seulement de: - la variance de l’ erreur expérimentale s2 -des éléments de la matrice de dispersion (X’X)-1, * donc des éléments de la matrice d’information(X’X), * donc de la structure de la matrice d’expériences et de la forme analytique du modèle, La qualité des estimateurs est indépendante de la valeur des résultats expérimentaux (éléments du vecteur Y),
Un modèle ! Pourquoi faire ? * Le modèle doit nous permettre de faire, dans tout le domaine expérimental défini, une prévision de bonne qualité * Le modèle doit représenter au mieux l’ensemble des résultats expérimentaux critères a priori critères a posteriori
critères a posteriori Quelques critères a posteriori R2 : coefficient de détermination multiple R2 = 1 – (yi – ycalc,i)2 / (yi – ymoyen)2 R2A : coefficient de détermination multiple adjusté R2A = 1 – [ (yi – ycalc,i)2 / (N – p)] / [ (yi – ymoyen)2 / (N – 1)]
Analyse des résidus Résidus ei = yi - y calc, i analyse graphique
ri = ei / s Résidus normés s : écart-type de la réponse ei : résidu au point i Les résidus normés ont une moyenne nulle et une variance approximativement égale à 1. Si ri > 3 la valeur de la réponse au point i doit être examinée avec soin (erreur de transcription, artéfact, validité du modèle en ce point,…)
Student-R Au point i y calc, i = XB y calc, i = X(X’X)-1X’Y H = X(X’X)-1X’(hat matrice) y calc, i = HY E : {ei, ei, ..., eN} E = Y - Ycalc E = Y – XB = Y – HY = (I - H)Y ei = (1 – di) yi Var (E) = Var [(I - H)Y] = (I – H) Var(Y) (I – H)’ Var (E) = s2 (I – H) Var (ei) = s2 (1 – di) = (1 – di) s2 ri = ei / s(1 - di)
R-student s2(i) = [(N – p) s2 - ei2 / (1 - di) ] / (N - p -1) ti = ei / s2(i)(1 - di) si tiest très différent de ri, alors le point i a une grande influence sur le calcul des coefficients du modèle
PRESS (Prediction Error Sum of Square) On fait la régression en enlevant le point i et en chacun des (N – 1) points on calcule Y calc, (i) au point i e (i) = yi - y calc, i La procédure est répétée pour chaque point (i : 1,., N) e(1), …e(i), … e(N) PRESS = e(i)2 = [ei /(1 - di)]2 ri = ei / s(1 - di)
R2Prédiction R2prédiction = 1 – PRESS / yi2
critères a priori Ces critères permettent de choisir, de construire, un ensemble d’expériences qui nous apporteront les informations désirées avec une qualité acceptable. OBJECTIFS
Elaborer une stratégie expérimentale choisir une stratégie expérimentale adéquate OBJECTIFS
Une expérience apporte toujours une information Mais, cette information est-elle utile ? C’est une droite Est-ce une droite ?
C’est une droite Dominio de validación
Est-ce une droite ? N = 2 N = 2 N = 2 Dominio de validación Et si nous faisions 50 points ? N = 50 25 25
Est-ce une droite ? N = 2 N = 2 N = 2 Dominio de validación N = 3 Toute l’information se trouve dans la distribution des points expérimentaux
C’est une droite Dominio de validación
1 j n var (b1) =s2 / S(xi – xmoyen)2 S(xi–xmoyen)2 = (x1–xmoyen)2 + 5 (xj–xmoyen)2 + (xn–xmoyen)2
Critères de type II Modéles linéaires, … * Nous voulons connaître les estimations des coefficients du modèle avec une qualité acceptable * Nous voulons connaître en n’importe quel point du domaine expérimental d’intérêt, la valeur de la réponse étudiée avec une qualité acceptable Facteurs d'inflation Fonction de variance maximale
Critères de type II Modéles linéaires, … * Nous voulons connaître les estimations des coefficients du modèle avec une qualité acceptable * Nous voulons connaître en n’importe quel point du domaine expérimental d’intérêt, la valeur de la réponse étudiée avec une qualité acceptable facteurs d'inflation Fonction de variance maximale
Objectif Le criblage des facteurs ðrechercher rapidement, parmi un ensemble de facteurs potentiellement influents, ceux qui le sont effectivement dans un domaine expérimental fixé. Les études quantitatives des facteurs ðétudier les effets principaux et les effets d’interaction des facteurs.
Objectif Le criblage des facteurs Les études quantitatives des facteurs Nous voulons connaître les estimations des coefficients du modèle : poids des facteurs, effets principaux et effets d’intéraction,.. avec une qualité acceptable. Facteurs d’inflation
Critères de type II Modéles linéaires, … * Nous voulons connaître les estimations des coefficients du modèle avec une qualité acceptable * Nous voulons connaître en n’importe quel point du domaine expérimental d’intérêt, la valeur de la réponse étudiée avec une qualité acceptable Facteurs d'inflation Fonction de variance maximale
Objectif Les études quantitatives des réponses Connaître en n'importe quel point du domaine expérimental d'intérêt la valeur d'une ou plusieurs réponses expérimentales . Les mélanges Connaissance d'une ou plusieurs propriétés, dépendant de la proportion de chaque constituant dans le mélange étudié.
Que voulons-nous ? Connaître en n'importe quel point du domaine expérimental d'intérêt la valeur d'une ou plusieurs réponses expérimentales Trouver, s’il existe, le domaine dans lequel toutes les réponses expérimentales respectent les contraintes imposées par le cahier des charges zone de compromis acceptable
Quelles doivent être les qualités du modèle ? Le modèle doit bien représenter le phénomène étudié dans le domaine expérimental d’intérêt Si cela est vérifié, il doit permettre de prévoir, en n’importe quel point de ce domaine expérimental d’intérêt, la valeur de la réponse expérimentale étudiée avec une bonne qualité prévisionnelle
Que voulons nous ? Si le modèle est vérifié, il doit permettre de prévoir, en n’importe quel point de ce domaine expérimental d’intérêt, la valeur de la réponse expérimentale étudiée avec la même qualité que celle que nous aurions eue si nous avions fait l’expérience en ce même point.
360 sec Var (y exp ,A) = s2 Var (y calc ,A) = dAs2 A 270 sec 2500 g 180 sec 2500 g 2750 g 3000 g
Que voulons nous ? Si le modèle est vérifié, il doit permettre de prévoir, en n’importe quel point de ce domaine expérimental d’intérêt, la valeur de la réponse expérimentale étudiée avec la même qualité que celle que nous aurions eue si nous avions fait l’expérience en ce même point. d Max 1
Objectif Les études quantitatives des réponses Les mélanges Connaître, en n’importe quel point du domaine expérimental d’intérêt, la valeur de la réponse expérimentale étudiée avec une qualité acceptable. Fonction de variance maximale dans tout le domaine d’intérêt dMax
et en plus, ne sont pas importantes Les expériences coûtent cher, prennent du temps, consomment des produits, de l’énergie ....
Il n’y a aucune information dans le résultat d’une expérience ! Toute l’information se trouve dans la distribution des points expérimentaux
mesure réponse expérimentale Comment savoir si l’objectif est atteint ?