220 likes | 369 Views
Sous-projet 1 Spécification d’un entrepôt de données pour la sécurité alimentaire. La sécurité alimentaire L’existant Objectifs du sous-projet et réalisations Conclusion. L’analyse des risques. Création de l’OMC en 1994 Accords de Marrakech
E N D
Sous-projet 1Spécification d’un entrepôt de données pour la sécurité alimentaire • La sécurité alimentaire • L’existant • Objectifs du sous-projet et réalisations • Conclusion
L’analyse des risques • Création de l’OMC en 1994 • Accords de Marrakech • SPS agreement (mesures sanitaires et phytosanitaires) • commerce international de la nourriture, protection de la santé des humains • analyse des risques • L ’analyse des risques nécessite des données de qualité • systèmes efficaces de collecte d’informations (n’existent pas) • données nécessaires : contaminations initiales de matières premières, contaminations de produits finis, informations sur l’effet de facteurs, informations sur l’exposition du consommateur • Le but est de pouvoir • réagir rapidement à une crise • prévenir une crise au lieu de simplement réagir
Les risques alimentaires • Risques physico-chimiques • présence de métaux lourds (ou de dioxyne...) dans les matières premières • Risques microbiologiques • présence de bactéries pathogènes (ex. Listeria monocytogenes) • dans les matières premières, les usines, le réfrigérateur du consommateur • facteurs qui influencent le comportement des bactéries • température, pH, aW (activité de l’eau)
Les bases de données existantes • En France • bases sur les contaminations chimiques (DGCCRF) et les consommations (INSEE) • bases microbiologiques • spécialisées (charcuterie/CTSCCV) • privées (viande/Bigard) • Dynacard (Danone, integré dans Sym’Previus) • Dans le monde • bases européennes sur les contaminations (projets) • bases microbiologiques • Grande-Bretagne (Combase) et Etats-Unis (PMP) : données de croissance sur des milieux de culture • Nouvelle-Zélande, Australie et Danemark : dédiées à un type de produit (poisson...) ou une bactérie
Le projet Sym’Previus • Début en novembre 99 / version 1 en 2004 • Outil d’aide à l’expertise en hygiène et sécurité alimentaire • pour les industriels de l’agro-alimentaire, les instituts techniques, de recherche et les pouvoirs publics (DGAL) • originalité : résultats sur aliments • Objectif : combiner • Base de données expérimentales sur aliment • Logiciel de simulation du développement des micro-organismes
Les objectifs de Sym ’Previus • Constituer une base de connaissances qui contient • des données bibliographiques validées et saisies par des experts • des données expérimentales acquises dans le cadre du projet • des données industrielles (contamination initiales…) • Créer des requêtes « consolidées », synthèses du comportement d’un micro-organisme • Caler les modèles de simulation et confronter les résultats des simulations avec des données expérimentales • Quel utilisateur : utilisation sous « contrôle » d’expert
Caractéristiques de la base Sym’Previus • 2 types d’information • niveaux de contamination d’aliments par des germes pathogènes • impact de différents facteurs (température, process...) sur le comportement des germes (stabilité, croissance, décroissance) • Sources • plus de 550 articles de la bibliographie internationale, sélectionnés par des experts en microbiologie • données industrielles anonymées • Structure • schéma relationnel (environ 80 tables) • complexité due à l’hétérogénéité des données • sources d ’information variées • nombreuses requêtes des membres du groupe de travail qui a validé le schéma
Quelques caractéristiques des données • 1) Données incomplètes • 2) Données imprécises • [Zwietering 92] : On products with a low water activity, spore-forming microorganisms can be present (no growth) • [Augustin 96] : Decimal reduction time of Listeria monocytogenes in skimmed milk at 63.3°C is between [25.8, 28.2] (in sec) • [Rangasamy,1993] : Le niveau de contamination du lait cru par Bacillus cereus est inférieur à 10 CFU/ml • 3) De nature très différentes • ne « matchent » pas toujours avec la structure de la BDR
Système d’interrogation unifiée : MIEL Stockage structuré en tables : Base de données relationnelle Stockage faiblement structuré : Graphes conceptuels Information correspondant à la structure de la BD Information en marge de la structure de la BD
Langage d’interrogation du MIEL • Requête Q = {V, a1, …, an, <an+1, vn+1>, …, <am, vm>} • Réponse A = {<a1, v1>, …, <an, vn>}
Requêtefloue MIEL Donnéesimprécises Données incomplètes et imprécises sous-ensembles flous 1) Interrogation élargie • par l’utilisateur : représentation de préférences pour les critères de sélection • par le moteur d ’interrogation : relation de similarité entre valeurs Res(Whole egg, Egg + salt/sugar) = 0.33 2) Représentation de données imprécises
Q = {V, a1, …, an, <an+1, vn+1>, …, <am, vm>} Génération de GC requêtes A1 = {w1, …, wn} A2 = {x1, …, xn} A3 = {y1, …, yn} A4 = {z1, …, zn} Projection Base GC Interrogation de la base de GC
Objectifs du sous-projet 1 • Quelques questions auxquelles le sous-projet 1 doit répondre • quels types de données utiles pour l’entrepôt trouve-t-on sur le Web ? • comment faire cohabiter données trouvées sur le Web et données déjà stockées ? • quels traitement veut-on faire sur les données provenant du Web (monitorage) ? Intégration explicite des données aux tables préexistantes ? Interrogation via un schéma global ? • quelles connaissances relatives à la fiabilité des données ?
Objectifs du sous-projet 1 • Détail des réalisations • analyse des besoins • détermination avec experts des manques prioritaires dans la base Sym’Previus • analyse du contenu d’autres bases • identification des éléments que l’on peut trouver sur le Web • production • liste de spécifications • listes de mots-clés permettant de guider la recherche sur le Web
Réunion du 27 janvier 2003 • Présentation de l’existant • BD relationnelle • BK graphes conceptuels • Ce que l’on peut trouver sur le Web • présentation de quelques sites intéressants • Discussion sur la suite • caractériser les infos intéressantes, caractériser les sites ou pages intéressants, réfléchir à l’extraction des informations intéressantes • CR disponible sur le site e.dot
Réunion du 11 février 2003 présence de Benoît Leporq, IR INRA • Point sur l’avancement du sous-projet 2 • Informations que l’on aimerait ajouter dans l’entrepôt • informations concernant le pH, l’aw et la teneur en acides gras des aliments • informations extraites de sites bibliographiques • Critères de choix ou de rejet d’une page • titre de revues, description du protocole expérimental, noms des auteurs, noms des bactéries, mots-clés • Critères de validité des infos • réputation de certains sites, présence de références bibliographiques, redondance, confrontation
Documents produits Hiérarchie de germes pathogènes (158 germes + 104 liens) Lactobacillus>Lactobacillus plantarum Listeria>Listeria innocua Listeria>Listeria monocytogenes Liste d’auteurs (1107 noms) Amaro-Lopez;M. Ammar;M.S. Ammendolia;M.G. Andersen;J.K. Anderson;J.G. Hiérarchie de produits génériques (420 noms + traduction + 414 liens) Fromage à pâte molle>Camembert Poisson fumé>Carpe fumée Fruits et légumes frais>Betterave Liste de « synonymes » (604 synonymes) Poulet: blanc et aile;blanc et aile de poulet Fromage frais;Cottage cheese Fromage frais;Mozarella
Documents produits Combinaisons recherchées {cinétique, croissance, décroissance, survie, kinetic, growth, decrease, survival, inactivation} Liste des germes {"pH", "aw", "acide gras", "acides gras", "fatty acid"} Liste des produits Liste des auteurs
Conclusion • Des documents permettant le crawling du Web ont été produits • L’avis d’un expert français financé par l’INRA a pu être recueilli • afin de déterminer le type d’informations utiles pour l’entrepôt • MAIS • la troisième réunion prévue le 2 avril a été annulée (impossibilité de financer le déplacement et les honoraires d’un expert Hollandais) => RETARD