230 likes | 386 Views
Panorama des réseaux et projets base de données G*E. Panorama. Besoins et outils Ontologies Données brutes et élaborées Exemple de Projets Réseau d’outils. Quels outils et quels besoins. Outils d’acquisition de données Outils de gestion de production de données Outils d’intégration
E N D
Panorama • Besoins et outils • Ontologies • Données brutes et élaborées • Exemple de Projets • Réseau d’outils.
Quels outils et quels besoins • Outils d’acquisition de données • Outils de gestion de production de données • Outils d’intégration • Outils d’analyse
Paradigme Parcelle Environnement Bloc Phenotype … Plante Itinéraire tech. Organe
Growth chambers Controlled environment Whole field phenotyping Aerial imaging Outils d’acquisition • Associés Base de données technique • Lemnatech • Adonis • … • Fichiers bruts • Nettoyage • Validation • Spécifique • Besoins d’un format d’échange générique (XML)? Field, basic acquisition Environment acquisition
Controlled environment Outils de gestion de donnéesBesoins • Outil local, quotidien • Utilisé par les équipes en charges des expérimentations • Intégration depuis BD ou fichiers de données brutes des outils d’acquisition • Données phénotypes, environnement, ITK, … • Analyse • Validation • Valorisation et production de données élaborées Whole field phenotyping Aerial imaging Basic acquisition Environment acquisition
Controlled environment Outils de gestion de donnéesBesoins Essais • Plante annuelles • Essais en conditions contrôlées • Essais plein champs • Plantes pérennes • Essai multiannuel • Réutilisation des mêmes plantes • Cinétiques multi annuelles • Contraintes forestières Whole field phenotyping Aerial imaging Basic acquisition Environment acquisition
Controlled environment Outils de gestion de donnéesBesoins, Echelles • Différentes échelles spatiales : • Dispositifs champs • Structure hétérogène • Parcelle, bloc, microparcelle, placette • Parcelle, microparcelle, plante • Parcelle, Plante • Différentes échelles temporelles • Mesure unique • Date de récolte • Mensuelle • Série temporelle • Journalière • Horaire • Minute • Cinétiques Whole field phenotyping Aerial imaging Basic acquisition Données Multi Echelles (P. Neveu) Environment acquisition
Outils de gestion de donnéesBesoins SIG • Phénotypage plein champs • Pech Rouge • Diaphen : Garic • Référence coordonnées spatiale • Remplace plante/parcelle, … • Forestier : EFPA / Plantacomp • CATI Ecoinformatique (géomatique) • Alain Benard • Liste de diffusion 'géomatique'
Outils de gestion de donnéesSolutions • LEPSE / MISTEA • Phenodyn • Phenopsys • Cincalli • Phenoarch • Vigne : VitSeq, réutilisation des bases existantes • Vinotech : orienté parcelle à Pech rouge • Diaphen / Garic • SI environnementaux • Infosol • Agroclim • Phenec (annuel)/ Phenoclim (pérenne) : impact changement climatique
Outils de gestion de donnéesSolutions • PIC : Système de cultures (V. Cellier, R. Rau) • Phenomics Ontology Driven Data repository(PODD) • The Australian Plant Phenomics Facility • En cours de dévelopement, open source • Orienté projet • Evalué dans le cadre de Phénome • Collaboration : Interopérabilité ou réutilisation.
Outils d’intégration • Thalia • Moulon, Phénotype + Génotype • Intégration données phénotype et environnement • Ephesis : intégration de plusieurs sources par • Centralisation de données • Interrogation distribuées par Web Services • Intégration données Génotypage, Expression et génétique • GnpIS • Données parcellaire / lot données liées au génotype pour la génétique • Intégration passe par la capacité à gérer des données multiéchelles.
Ephesis • Projet • Communauté Genotype * Environnement • Base de données intégrative / portail • Attendus • Pérennisation, archivage, organisation et tri • Intégration par Insertion ou par Web Services • Traçabilité génotype (RG), phénotype, environnement, dispositif expérimental. • Favoriser la visibilité nationale et internationale (Données et Unités) • Réorganisation dynamique et exportation des données pour analyse • Interopérabilité avec les outils d’analyses. • Coopération avec les projets existants
Ephesis • Périmètre • Données plante/parcellaires dans un dispositif expérimental • Données génotype : autres projets GnpIS • Dispositif multigénotype. • Données brutes et élaborées • Même structure technique • Limite volume • Données brutes ont besoin de métadonnées très fines pour être exploitable ailleurs que sur le site de production. • Pour qui • INRA • Partenaires académiques (EPST, universités, EPIC, …) • Partenaires projets internationaux • Privés
Ephesis • Beta publique disponible http://urgi.versailles.inra.fr/ephesis • Intégration d’essais • Prévisualisation et export. • Recherche multi essais multicritères • Générique : Ontolgy Driven • Structures des dispositifs • Variables • Environnementales • Phénotypique • Itinéraires techniques
Ephesis • Intégration multi essais • Interrogation • Export • Réagencement : datamart, galaxy
Qu’est ce qu’une ontologie • Biologiste • Vocabulaire contrôlé et structuré • Définitions • Hiérarchie • Ordonnancement • Informaticien • modèle de données représentatif d'un ensemble de concepts dans un domaine, ainsi que des relations entre ces concepts (Wikipedia) • Relations très riche • Plus qu’une simple hiérarchie
A quoi sert une ontologie • Biologiste • Qualité • Exhaustif • Eviter • les redondance de données • Les synonymes : plant height vs height of the plant • Permet le croisement et la cohérence des données • Dans un laboratoire • Entre partenaires • Mappingentre vocabulaires • Informaticien • Base d’outils d’analyse très puissants • Raisonneurs • Contrôle sémantique des données
Ontologies, initiatives • Plant ontology consortium • Plant ontology, Trait ontology • Très généraliste • Basées sur riz, mais, arabidopsis • Phenotype RCN • Ouverts • Recommandent ontologies spécialisées liées aux leurs • Projets • DROPS, … • Optimisées espèces et problématique • Besoins INRA • Vigne, … • Construites en interne • Optimisées espèces et problématique • A partir référence internationale (OIV, …)
Ontologies, Perspectives • Promouvoir les ajouts à l’existant • Promouvoir création de nouvelles ontologies • Groupes espèces • Projets • Promouvoir amélioration qualitative • Xref vers des ontologies internationales • Collaboration • Fusion et Réutilisation • INRA • Projets Européens ou plus • Améliorer la visiblité des ontologies existantes à l’INRA • Ontologylookup URGI : http://urgi.versailles.inra.fr/ontology-lookup/ • …
Données pérenisables et/ou valorisables • Données élaborées • Élaborées pour une question scientifique précise • A partir de données brutes • Nettoyées • Homogène ou hétérogène • normalisation (effet années) • Différents types • Phénotypes • Environnement • … • Forte valeur ajoutée • Analyse et croisement de données • Volumétrie raisonnable • Partenariats • Données brute • hétérogènes • Alphanumériques • Images • … • Ré exploitable pour de nouveaux questionnement • Analysables • Par le producteur et partenaires • Non producteur • Métadonnées Riches • En fonction du type de données brutes • Images hyperspectrales • Irremplaçables Péreniser
Panorama Projets • Collaborations • Plantacomp URGI • Ephesis • Projets Espèce • Breedwheat, Amazing • Peamust, VitisNext, Sorgho, Rapsodyn (Colza), Aker, Tournesol, Betterave • Projets Plateforme • Phenome • Eve equipex vigne et changement climatique • Metaprogramme • Acaf changement climatique : projet acav vigne • Selgen Sélection génomique
International Databases Environmental Information Systems Controlled environment Climatic data Ground Web interface DataMarts Data interoperability exchangeCross references exchange International visibility Phenotype and environment databases network Phenotyping and environment Ontologies, GenotypeID Whole field phenotyping GnpIS Data integration Maps GnpMap Aerial imaging Expression GnpArray Genomes Basic acquisition PhenotypesEphesis GenotypeGnpSNP, Siregal Environment acquisition Analysis Web Services and file exchange