1 / 20

Présentation du projet de mission professionnelle

Arnaud Felten – M2.1 Bioinfo. Conception et réalisation d’un environnement logiciel pour l’exploration et l’analyse phylogénétique des microbiomes. Présentation du projet de mission professionnelle. Encadrant : Catherine Dauga Tuteur universitaire : Josselin Bodilis . Mardi 27 Mars 2012.

xanto
Download Presentation

Présentation du projet de mission professionnelle

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Arnaud Felten – M2.1 Bioinfo Conception et réalisation d’un environnement logiciel pour l’exploration et l’analyse phylogénétique des microbiomes Présentation du projet de mission professionnelle Encadrant : Catherine Dauga Tuteur universitaire : Josselin Bodilis Mardi 27 Mars 2012

  2. Objectifs • Comparer la performance des technologies 454 et Illumina pour le séquençage de microbiome • Evaluer différentes méthodes d’analyses : logiciel et banque • Proportion d’artefacts et de chimères • Proportion des OTUs rares • Qualité de l’identification taxonomique • Efficacité du filtrage • Concevoir une stratégie d’analyse des microbiomes • utilisant les meilleurs outils testés et leurs paramètres • intégrés dans un système de Workflow Janvier 2012

  3. Méthodologie Seq 16S Synthetic data Serveur NCBI/RDPII ptaxoptimizer pblastall  Best hit Silva/Greengenes NCBI/RDPII script Optimisation du fichier de sortie  tabulation taxonomique script Silva/Greengenes traitement des résultats et représentations graphiques

  4. Analyse et représentation des données avec R • Bibliothèque de fonction • lecture csv • dénombrement de la taxonomie • calcule sensibilité/spécificité Script modèle « à trous » Création d’un script adapté aux données à partir de la technologie et du domaine utilisé ainsi que de la nature des séquences initiales • Scripts représentations graphiques • histogramme • nuage de points • (radar plot) • ajout des légendes/titres… • production d’un PDF

  5. Automatisation NGS readsimulators : MetaSim, ART, … Seq 16S Synthetic data Serveur NCBI/RDPII ptaxoptimizer pblastall  Best hit Silva/Greengenes NCBI/RDPII script script Silva/Greengenes

  6. Simulation : “Mono bacteria” • Mockcommunities : “mono bacteria” • Une seule espèce d’un seul genre bactérien • Acinetobacter, • Helicobacter, • Enterococcus, • (Akkermansia) • 454 / Illumina • ARNr16S : complet / régions V5-V6 • 1000 reads par échantillon • Temps d’analyse : 1h pour 1 bactérie / 1 technologie / 1 domaine • 11/2 semaines pour répétitivité X100 (400 000 BLAST) • Analyse sur la base de données RDP II

  7. Analyse « mono-bacteria » 454/illumina

  8. Analyse « mono-bacteria »V5-V6/full length

  9. Simulation “multi-phyla” Mockcommunities • Plusieurs espèces d’un ou plusieurs phyla • Protéobacteria, • Firmicutes, • Bacteroidetes, • Actinobacteria, • Fusabacteria • 454 / Illumina • ARNr16S : complet / régions V5-V6 (V4) • 5 000 reads

  10. Bases de données ARNr 16S 16S Microbial SSURef 11/11 108 Mothur 2011 BLAST RDPII SSURef Ref Souche type 10.28 05/11 10.28

  11. Analyse « multi-phyla » 454

  12. Analyse « multi-phyla »Illumina

  13. Analyse « multi-phyla»Rapport faux positifs et NA sur correctement identifiés

  14. Simulations “microbiote cryptes souris” Mockcommunities • Plusieurs espèces venant d’un même phylum • Proteobacteria, • 454 / Illumina • ARNr16S : complet / régions V5-V6 (V4)  50 000 reads

  15. Composition microbiote cryptes souris (données réelles) Pseudomodales

  16. Composition et phylogénie des données synthétiques 90% 0,5% 0,5% 2,5% 1,5% 2,5% 2,5%

  17. Analyse des résultats de la simulation crypte souris454

  18. Analyse des résultats de la simulation crypte sourisIllumina

  19. Analyse des résultats de la simulation crypte sourisIdentification à l’espèce

  20. Perspectives à court et moyen terme Poursuite des simulations de données: • Simulation et analyse crypte souris : Firmicutes • Simulation d’un microbiote complet de souris •  37 bactéries provenant de 5 phyla • Génération de données avec ART et évaluation des méthodes de filtrage (qualité) • Evaluation des détecteurs de chimères sur les données réelles • Autres méthodes (MEGAN, RDP classifier) Analyse des séquences : Analyse des OTUs : • Uclust, QUIME, Mothur, TreePhyler, ARB

More Related