200 likes | 381 Views
Arnaud Felten – M2.1 Bioinfo. Conception et réalisation d’un environnement logiciel pour l’exploration et l’analyse phylogénétique des microbiomes. Présentation du projet de mission professionnelle. Encadrant : Catherine Dauga Tuteur universitaire : Josselin Bodilis . Mardi 27 Mars 2012.
E N D
Arnaud Felten – M2.1 Bioinfo Conception et réalisation d’un environnement logiciel pour l’exploration et l’analyse phylogénétique des microbiomes Présentation du projet de mission professionnelle Encadrant : Catherine Dauga Tuteur universitaire : Josselin Bodilis Mardi 27 Mars 2012
Objectifs • Comparer la performance des technologies 454 et Illumina pour le séquençage de microbiome • Evaluer différentes méthodes d’analyses : logiciel et banque • Proportion d’artefacts et de chimères • Proportion des OTUs rares • Qualité de l’identification taxonomique • Efficacité du filtrage • Concevoir une stratégie d’analyse des microbiomes • utilisant les meilleurs outils testés et leurs paramètres • intégrés dans un système de Workflow Janvier 2012
Méthodologie Seq 16S Synthetic data Serveur NCBI/RDPII ptaxoptimizer pblastall Best hit Silva/Greengenes NCBI/RDPII script Optimisation du fichier de sortie tabulation taxonomique script Silva/Greengenes traitement des résultats et représentations graphiques
Analyse et représentation des données avec R • Bibliothèque de fonction • lecture csv • dénombrement de la taxonomie • calcule sensibilité/spécificité Script modèle « à trous » Création d’un script adapté aux données à partir de la technologie et du domaine utilisé ainsi que de la nature des séquences initiales • Scripts représentations graphiques • histogramme • nuage de points • (radar plot) • ajout des légendes/titres… • production d’un PDF
Automatisation NGS readsimulators : MetaSim, ART, … Seq 16S Synthetic data Serveur NCBI/RDPII ptaxoptimizer pblastall Best hit Silva/Greengenes NCBI/RDPII script script Silva/Greengenes
Simulation : “Mono bacteria” • Mockcommunities : “mono bacteria” • Une seule espèce d’un seul genre bactérien • Acinetobacter, • Helicobacter, • Enterococcus, • (Akkermansia) • 454 / Illumina • ARNr16S : complet / régions V5-V6 • 1000 reads par échantillon • Temps d’analyse : 1h pour 1 bactérie / 1 technologie / 1 domaine • 11/2 semaines pour répétitivité X100 (400 000 BLAST) • Analyse sur la base de données RDP II
Simulation “multi-phyla” Mockcommunities • Plusieurs espèces d’un ou plusieurs phyla • Protéobacteria, • Firmicutes, • Bacteroidetes, • Actinobacteria, • Fusabacteria • 454 / Illumina • ARNr16S : complet / régions V5-V6 (V4) • 5 000 reads
Bases de données ARNr 16S 16S Microbial SSURef 11/11 108 Mothur 2011 BLAST RDPII SSURef Ref Souche type 10.28 05/11 10.28
Analyse « multi-phyla»Rapport faux positifs et NA sur correctement identifiés
Simulations “microbiote cryptes souris” Mockcommunities • Plusieurs espèces venant d’un même phylum • Proteobacteria, • 454 / Illumina • ARNr16S : complet / régions V5-V6 (V4) 50 000 reads
Composition microbiote cryptes souris (données réelles) Pseudomodales
Composition et phylogénie des données synthétiques 90% 0,5% 0,5% 2,5% 1,5% 2,5% 2,5%
Analyse des résultats de la simulation crypte sourisIllumina
Analyse des résultats de la simulation crypte sourisIdentification à l’espèce
Perspectives à court et moyen terme Poursuite des simulations de données: • Simulation et analyse crypte souris : Firmicutes • Simulation d’un microbiote complet de souris • 37 bactéries provenant de 5 phyla • Génération de données avec ART et évaluation des méthodes de filtrage (qualité) • Evaluation des détecteurs de chimères sur les données réelles • Autres méthodes (MEGAN, RDP classifier) Analyse des séquences : Analyse des OTUs : • Uclust, QUIME, Mothur, TreePhyler, ARB