1 / 50

Utilisation des modèles à équations structurelles en analyse sensorielle

Utilisation des modèles à équations structurelles en analyse sensorielle. Michel Tenenhaus. Exemple des Jus d’orange (J. Pagès). X 1 = Instrumental, X 2 = Sensoriel, Y = Hédonique. Modélisation de relations structurelles sur variables latentes.

tokala
Download Presentation

Utilisation des modèles à équations structurelles en analyse sensorielle

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Utilisation des modèles à équations structurelles en analyse sensorielle Michel Tenenhaus

  2. Exemple des Jus d’orange (J. Pagès) X1 = Instrumental, X2 = Sensoriel, Y = Hédonique

  3. Modélisation de relations structurellessur variables latentes • Etude d’un système de relations linéaires entre variables latentes (non observables). • Chaque variable latente est décrite par des variables manifestes (observables). • Les données sont quantitatives ou qualitatives (la normalité n’est pas obligatoire). • Le nombre d’observations peut être limité par rapport au nombre de variables.

  4. Modèle de mesure Modèle structurel Variable latente exogène Variable latente endogène Variable manifeste Exemple jus d’orangesur un groupe de juges homogènes Glucose Fructose Saccharose Pouvoir sucrant pH brut pH après centrifugation Titre Acide citrique Vitamine C Physico-chimique w11 1 w12 21 w19 w32 Juge 2 Juge 3 Juge 96 2 w33 1 w396 Intensité odeur Typicité odeur Caractère pulpeux Intensité du goût Caractère acide Caractère amer Caractère sucré w21 Hédonique 22 1 w22 w27 Sensoriel

  5. SEM Component-based SEM (Score computation) Covariance-based SEM (CSA) (Model validation) H. Hwang Y. Takane GSCA (2004) K. Joreskog (LISREL, 1970) Herman Wold NIPALS (1966) PLS approach (1975) H. Hwang VisualGSCA 1.0 (2007) J.-B. Lohmöller LVPLS 1.8 (1984) Svante Wold Harald Martens PLS regression (1983) R. McDonald(1996) M. Tenenhaus (2001) W. Chin PLS-Graph C. Ringle SMART-PLS Chatelin-Esposito Vinzi Fahmy-Jäger-Tenenhaus XLSTAT-PLSPM (2007) SIMCA-P The Unscrambler A SEM tree Generalized Structured Component Analysis (ALS)

  6. w11 w12 w19 w32 w33 w396 w21 w22 w27 Algorithme PLS (Mode A, Schéma centroïde) Z1=Y2+Y3 (estimation interne) Glucose Fructose Saccharose Pouvoir sucrant pH brut pH après centrifugation Titre Acide citrique Vitamine C Y1=Xw1 (estimation externe) w11= Cor(glucose,Z1) 1 w12= Cor(fructose,Z1) 21 Juge 2 Juge 3 Juge 96 w19= Cor(vitamine C,Z1) w32= Cor(juge2,Z3) 2 1 w33= Cor(juge3,Z3) w3,96= Cor(juge96,Z3) Intensité odeur Typicité odeur Caractère pulpeux Intensité du goût Caractère acide Caractère amer Caractère sucré Y3=Xw3 w21= Cor(int. odeur,Z2) 22 1 Z3=Y1+Y2 w22= Cor(typ. odeur,Z2) w27= Cor(Sucré,Z2) Itérer jusqu’à convergence. Y2=Xw2 Z2=Y1+Y3

  7. LES CAS PARTICULIERS DE LA METHODE PLS • Analyse en composantes principales • Analyse factorielle multiple • Analyse canonique • Analyse des redondances (ACPVI) • Régression PLS • Analyse canonique généralisée (Horst) • Analyse canonique généralisée (Carroll) • Analyse de la co-inertie multiple (Chessel & Hanafi) • etc.…

  8. Utilisation de XLSTAT-PLSPM

  9. Poids externe w

  10. Poids externe w

  11. Corrélation VM-VL

  12. Corrélation VM-VL

  13. Utilisation de XLSTAT-PLSPM Variables latentes =========================================================== Physico-chimique Sensorielle Hédonique ----------------------------------------------------------- Fruivita réfrigéré 0.917 0.964 1.253 Tropicana réfrigéré 0.630 1.378 0.946 Tropicana ambiant 1.120 0.462 0.742 ----------------------------------------------------------- Pampryl réfrigéré -0.176 -0.570 -0.747 Joker ambiant -1.680 -0.852 -0.991 Pampryl ambiant -0.810 -1.381 -1.203 ===========================================================

  14. Utilisation de XLSTAT-PLSPM

  15. Modèle estimé par PLS : modèle interne et corrélations Fructose Saccharose Glucose Pouvoir sucrant Vitamine C .93 -.89 -.89 .1 pH brut .95 -. 19 pH après centrifugation .94 x .306 (t = .28) 1 -. 97 Titre Juge 2, >0 -. 98 M Juge 3, x >0 .820 Acide citrique 3 (t = 3.17) >0 Intensité odeur Juge 96 .41 .713 (t = .67) . 98 Typicité odeur 2 R = 0.96 x .71 Caractère pulpeux .97 2 -.64 Intensité du goût - .93 Caractère sucré -.95 Caractère acide Caractère amer Variables non significatives en rouge

  16. Estimation du modèle interne par régression PLS On peut prendre en compte la corrélation entre les variables instrumentales et sensorielles en utilisant la régression PLS : R2 = 0.936

  17. Covariance-based Structural Equation Modeling Variables latentes : Modèle structurel (modèle interne) : Ici :

  18. VM VM VL Structural Equation Modeling Modèle de mesure (modèle externe) : VL Exogène Endogène

  19. Structural Equation Modeling Intégration des modèles structurel et de mesure : Forme réduite Les matrices de covariance des résidus sont diagonales.

  20. Variance des résidus structurels Variance des résidus mesure Cov. des VL exo. Modèle externe Modèle interne Structural Equation Modeling Matrice de covariance des variables manifestes :

  21. Généralisation de l’ACP Covariance-based SEM Algorithme ULS (Unweighted Least Squares) : S = Matrice de covariance observée pour les VM Goodness-of-fit Index (Jöreskog & Sorbum):

  22. First Roderick McDonald’s idea (1996) Measurement residual variances are canceled: This is a computational trick: Residual variances are passed to errors and can always be computed afterwards. Use of AMOS 6.0 Method = ULS

  23. Covariance-based SEM ULS algorithm with the McDonald’s constraints: S = Observed covariance matrix for MV Goodness-of-fit Index (Jöreskog & Sorbum):

  24. Use of AMOS 6.0 - Method = ULS - Measurement residual variances = 0

  25. PLS estimate of LV: • Mode A • LV inner estimate = theoretical LV • LV inner estimate computation is useless. Results GFI = .903 Outer LV Estimates: 2nd McDonald’s idea

  26. Modèle estimé par SEM-ULS : modèle interne et coefficient de régression Fructose Saccharose Glucose Pouvoir sucrant Vitamine C .89 -.76 -.77 .22 pH brut 1 -. 08 pH après centrifugation 1.00 x .22 (P = .35) 1 -. 87 Titre Juge 2, >0 -. 88 M Juge 3, x >0 .79 Acide citrique 3 (P = .01) >0 Intensité odeur Juge 96 .26 .64 (P = .05) . 94 Typicité odeur 2 R = 0.96 x .66 Caractère pulpeux 1 2 -.56 Intensité du goût - .94 Caractère sucré -.97 Caractère acide Caractère amer Variables non significatives en rouge. Poids fixé a priori en bleu.

  27. Utilisation de SEM-ULSEstimation des variables latentes (McDonald) Variables latentes =========================================================== Physico-chimique Sensorielle Hédonique ----------------------------------------------------------- Fruivita réfrigéré 0.915 0.866 1.141 Tropicana réfrigéré 0.526 1.270 0.868 Tropicana ambiant 0.832 0.422 0.672 ----------------------------------------------------------- Pampryl réfrigéré -0.158 -0.526 -0.686 Joker ambiant -1.740 -0.774 -0.867 Pampryl ambiant -0.375 -1.258 -1.127 ===========================================================

  28. Comparaison des scores PLS vs SEM-ULS

  29. Second particular case : Multi-block data analysis

  30. 3 Appellations 4 Soils 4 blocks of variables X3 Illustrative variable Sensory analysis of 21 Loire Red Wines (J. Pagès) X1 X2 X4 X1 = Smell at rest, X2 = View, X3 = Smell after shaking, X4 = Tasting

  31. PCA of each block: Correlation loadings

  32. PCA of each block: Correlation loadings GFI = .301

  33. VIEW SMELL AT REST SMELL AT REST SMELL AFTER SHAKING TASTING Multi-block data analysis = Confirmatory Factor Analysis GFI = .849

  34. First dimension Using MV with significant loadings

  35. First global score 2nd order CFA GFI = .973

  36. Validation of the first dimension Correlations Rest1 View Shaking1 Tasting1 Rest1 1 View .621 1 Shaking1 .865 .762 1 Tasting1 .682 .813 .895 1 Score1 .813 .920 .942 .944

  37. Second dimension

  38. 2nd global score GFI = .905

  39. Validation of the second dimension Correlations Rest2 Shaking2 Tasting2 Rest2 1 Shaking2 .789 1 Tasting2 .782 .803 1 Score2 .944 .904 .928

  40. Score 2 unrelated with quality Score 1 related with quality Mapping of the correlations with the global scores

  41. Correlation with global quality New result. Not obtained with other multi-block data analysis methods, nor with factor analysis of the whole data.

  42. Wine visualization in the global score space Wines marked by Appellation

  43. Wine visualization in the global score space Wines marked by Soil

  44. Visualization of wine variability among the blocks Star-plot of the “best wine” – 2DAM SAUMUR 3,0 2,8 2,6 2,4 2DAM GLOBAL SCORE Tasting 2,2 Smell after shaking View 2,0 Smell at rest 2,25 2,50 2,75 3,00 3,25 3,50 DAM = Dampierre-sur-Loire

  45. A soft, warm, blackberry nose. A good core of fruit on the palate with quite well worked tannin and acidity on the finish; Good length and a lot of potential. DECANTER (mai 1997) (DECANTER AWARD ***** : Outstanding quality, a virtually perfect example) Cuvée Lisagathe 1995

  46. Conclusion 1: SEM-ULS > PLS • When mode A is chosen, outer LV estimates using Covariance-based SEM (ULS or ML) or Component based SEM (PLS) are always very close. • It is possible to mimic PLS with a covariance-based SEM software (McDonald,1996, Tenenhaus, 2001). • Covariance-based SEM authorizes to implement constraints on the model parameters. This is impossible with PLS.

  47. Conclusion 2: PLS > SEM-ULS • When SEM-ULS does not converge or does not give an admissible solution, PLS is an attractive alternative. • PLS offers many optimization criterions for the LV search (but rigorous proofs are still to be found). • PLS still works when the number of MV is very high and the number of cases very small (for example 60 MV and 6 cases). • PLS allows to use formative LV in a much easier way than SEM-ULS.

  48. Final conclusion « All the proofs of a pudding are in the eating, not in the cooking ». William Camden (1623)

More Related