610 likes | 1.08k Views
Utilisation des modèles à équations structurelles en analyse sensorielle. Michel Tenenhaus. Exemple des Jus d’orange (J. Pagès). X 1 = Instrumental, X 2 = Sensoriel, Y = Hédonique. Modélisation de relations structurelles sur variables latentes.
E N D
Utilisation des modèles à équations structurelles en analyse sensorielle Michel Tenenhaus
Exemple des Jus d’orange (J. Pagès) X1 = Instrumental, X2 = Sensoriel, Y = Hédonique
Modélisation de relations structurellessur variables latentes • Etude d’un système de relations linéaires entre variables latentes (non observables). • Chaque variable latente est décrite par des variables manifestes (observables). • Les données sont quantitatives ou qualitatives (la normalité n’est pas obligatoire). • Le nombre d’observations peut être limité par rapport au nombre de variables.
Modèle de mesure Modèle structurel Variable latente exogène Variable latente endogène Variable manifeste Exemple jus d’orangesur un groupe de juges homogènes Glucose Fructose Saccharose Pouvoir sucrant pH brut pH après centrifugation Titre Acide citrique Vitamine C Physico-chimique w11 1 w12 21 w19 w32 Juge 2 Juge 3 Juge 96 2 w33 1 w396 Intensité odeur Typicité odeur Caractère pulpeux Intensité du goût Caractère acide Caractère amer Caractère sucré w21 Hédonique 22 1 w22 w27 Sensoriel
SEM Component-based SEM (Score computation) Covariance-based SEM (CSA) (Model validation) H. Hwang Y. Takane GSCA (2004) K. Joreskog (LISREL, 1970) Herman Wold NIPALS (1966) PLS approach (1975) H. Hwang VisualGSCA 1.0 (2007) J.-B. Lohmöller LVPLS 1.8 (1984) Svante Wold Harald Martens PLS regression (1983) R. McDonald(1996) M. Tenenhaus (2001) W. Chin PLS-Graph C. Ringle SMART-PLS Chatelin-Esposito Vinzi Fahmy-Jäger-Tenenhaus XLSTAT-PLSPM (2007) SIMCA-P The Unscrambler A SEM tree Generalized Structured Component Analysis (ALS)
w11 w12 w19 w32 w33 w396 w21 w22 w27 Algorithme PLS (Mode A, Schéma centroïde) Z1=Y2+Y3 (estimation interne) Glucose Fructose Saccharose Pouvoir sucrant pH brut pH après centrifugation Titre Acide citrique Vitamine C Y1=Xw1 (estimation externe) w11= Cor(glucose,Z1) 1 w12= Cor(fructose,Z1) 21 Juge 2 Juge 3 Juge 96 w19= Cor(vitamine C,Z1) w32= Cor(juge2,Z3) 2 1 w33= Cor(juge3,Z3) w3,96= Cor(juge96,Z3) Intensité odeur Typicité odeur Caractère pulpeux Intensité du goût Caractère acide Caractère amer Caractère sucré Y3=Xw3 w21= Cor(int. odeur,Z2) 22 1 Z3=Y1+Y2 w22= Cor(typ. odeur,Z2) w27= Cor(Sucré,Z2) Itérer jusqu’à convergence. Y2=Xw2 Z2=Y1+Y3
LES CAS PARTICULIERS DE LA METHODE PLS • Analyse en composantes principales • Analyse factorielle multiple • Analyse canonique • Analyse des redondances (ACPVI) • Régression PLS • Analyse canonique généralisée (Horst) • Analyse canonique généralisée (Carroll) • Analyse de la co-inertie multiple (Chessel & Hanafi) • etc.…
Utilisation de XLSTAT-PLSPM Variables latentes =========================================================== Physico-chimique Sensorielle Hédonique ----------------------------------------------------------- Fruivita réfrigéré 0.917 0.964 1.253 Tropicana réfrigéré 0.630 1.378 0.946 Tropicana ambiant 1.120 0.462 0.742 ----------------------------------------------------------- Pampryl réfrigéré -0.176 -0.570 -0.747 Joker ambiant -1.680 -0.852 -0.991 Pampryl ambiant -0.810 -1.381 -1.203 ===========================================================
Modèle estimé par PLS : modèle interne et corrélations Fructose Saccharose Glucose Pouvoir sucrant Vitamine C .93 -.89 -.89 .1 pH brut .95 -. 19 pH après centrifugation .94 x .306 (t = .28) 1 -. 97 Titre Juge 2, >0 -. 98 M Juge 3, x >0 .820 Acide citrique 3 (t = 3.17) >0 Intensité odeur Juge 96 .41 .713 (t = .67) . 98 Typicité odeur 2 R = 0.96 x .71 Caractère pulpeux .97 2 -.64 Intensité du goût - .93 Caractère sucré -.95 Caractère acide Caractère amer Variables non significatives en rouge
Estimation du modèle interne par régression PLS On peut prendre en compte la corrélation entre les variables instrumentales et sensorielles en utilisant la régression PLS : R2 = 0.936
Covariance-based Structural Equation Modeling Variables latentes : Modèle structurel (modèle interne) : Ici :
VM VM VL Structural Equation Modeling Modèle de mesure (modèle externe) : VL Exogène Endogène
Structural Equation Modeling Intégration des modèles structurel et de mesure : Forme réduite Les matrices de covariance des résidus sont diagonales.
Variance des résidus structurels Variance des résidus mesure Cov. des VL exo. Modèle externe Modèle interne Structural Equation Modeling Matrice de covariance des variables manifestes :
Généralisation de l’ACP Covariance-based SEM Algorithme ULS (Unweighted Least Squares) : S = Matrice de covariance observée pour les VM Goodness-of-fit Index (Jöreskog & Sorbum):
First Roderick McDonald’s idea (1996) Measurement residual variances are canceled: This is a computational trick: Residual variances are passed to errors and can always be computed afterwards. Use of AMOS 6.0 Method = ULS
Covariance-based SEM ULS algorithm with the McDonald’s constraints: S = Observed covariance matrix for MV Goodness-of-fit Index (Jöreskog & Sorbum):
Use of AMOS 6.0 - Method = ULS - Measurement residual variances = 0
PLS estimate of LV: • Mode A • LV inner estimate = theoretical LV • LV inner estimate computation is useless. Results GFI = .903 Outer LV Estimates: 2nd McDonald’s idea
Modèle estimé par SEM-ULS : modèle interne et coefficient de régression Fructose Saccharose Glucose Pouvoir sucrant Vitamine C .89 -.76 -.77 .22 pH brut 1 -. 08 pH après centrifugation 1.00 x .22 (P = .35) 1 -. 87 Titre Juge 2, >0 -. 88 M Juge 3, x >0 .79 Acide citrique 3 (P = .01) >0 Intensité odeur Juge 96 .26 .64 (P = .05) . 94 Typicité odeur 2 R = 0.96 x .66 Caractère pulpeux 1 2 -.56 Intensité du goût - .94 Caractère sucré -.97 Caractère acide Caractère amer Variables non significatives en rouge. Poids fixé a priori en bleu.
Utilisation de SEM-ULSEstimation des variables latentes (McDonald) Variables latentes =========================================================== Physico-chimique Sensorielle Hédonique ----------------------------------------------------------- Fruivita réfrigéré 0.915 0.866 1.141 Tropicana réfrigéré 0.526 1.270 0.868 Tropicana ambiant 0.832 0.422 0.672 ----------------------------------------------------------- Pampryl réfrigéré -0.158 -0.526 -0.686 Joker ambiant -1.740 -0.774 -0.867 Pampryl ambiant -0.375 -1.258 -1.127 ===========================================================
Second particular case : Multi-block data analysis
3 Appellations 4 Soils 4 blocks of variables X3 Illustrative variable Sensory analysis of 21 Loire Red Wines (J. Pagès) X1 X2 X4 X1 = Smell at rest, X2 = View, X3 = Smell after shaking, X4 = Tasting
PCA of each block: Correlation loadings
PCA of each block: Correlation loadings GFI = .301
VIEW SMELL AT REST SMELL AT REST SMELL AFTER SHAKING TASTING Multi-block data analysis = Confirmatory Factor Analysis GFI = .849
First dimension Using MV with significant loadings
First global score 2nd order CFA GFI = .973
Validation of the first dimension Correlations Rest1 View Shaking1 Tasting1 Rest1 1 View .621 1 Shaking1 .865 .762 1 Tasting1 .682 .813 .895 1 Score1 .813 .920 .942 .944
2nd global score GFI = .905
Validation of the second dimension Correlations Rest2 Shaking2 Tasting2 Rest2 1 Shaking2 .789 1 Tasting2 .782 .803 1 Score2 .944 .904 .928
Score 2 unrelated with quality Score 1 related with quality Mapping of the correlations with the global scores
Correlation with global quality New result. Not obtained with other multi-block data analysis methods, nor with factor analysis of the whole data.
Wine visualization in the global score space Wines marked by Appellation
Wine visualization in the global score space Wines marked by Soil
Visualization of wine variability among the blocks Star-plot of the “best wine” – 2DAM SAUMUR 3,0 2,8 2,6 2,4 2DAM GLOBAL SCORE Tasting 2,2 Smell after shaking View 2,0 Smell at rest 2,25 2,50 2,75 3,00 3,25 3,50 DAM = Dampierre-sur-Loire
A soft, warm, blackberry nose. A good core of fruit on the palate with quite well worked tannin and acidity on the finish; Good length and a lot of potential. DECANTER (mai 1997) (DECANTER AWARD ***** : Outstanding quality, a virtually perfect example) Cuvée Lisagathe 1995
Conclusion 1: SEM-ULS > PLS • When mode A is chosen, outer LV estimates using Covariance-based SEM (ULS or ML) or Component based SEM (PLS) are always very close. • It is possible to mimic PLS with a covariance-based SEM software (McDonald,1996, Tenenhaus, 2001). • Covariance-based SEM authorizes to implement constraints on the model parameters. This is impossible with PLS.
Conclusion 2: PLS > SEM-ULS • When SEM-ULS does not converge or does not give an admissible solution, PLS is an attractive alternative. • PLS offers many optimization criterions for the LV search (but rigorous proofs are still to be found). • PLS still works when the number of MV is very high and the number of cases very small (for example 60 MV and 6 cases). • PLS allows to use formative LV in a much easier way than SEM-ULS.
Final conclusion « All the proofs of a pudding are in the eating, not in the cooking ». William Camden (1623)