Présentation du projet de mission professionnelle

Preview:

DESCRIPTION

Arnaud Felten – M2.1 Bioinfo. Conception et réalisation d’un environnement logiciel pour l’exploration et l’analyse phylogénétique des microbiomes. Présentation du projet de mission professionnelle. Encadrant : Catherine Dauga Tuteur universitaire : Josselin Bodilis . Mardi 27 Mars 2012. - PowerPoint PPT Presentation

Citation preview

1

Présentation du projet de mission professionnelle

Conception et réalisation d’un environnement logiciel pour l’exploration

et l’analyse phylogénétique des microbiomes

Mardi 27 Mars 2012

Encadrant : Catherine Dauga

Tuteur universitaire : Josselin Bodilis

Arnaud Felten – M2.1 Bioinfo

2

Objectifs

Janvier 2012

① Comparer la performance des technologies 454 et Illumina pour le séquençage de microbiome

② Evaluer différentes méthodes d’analyses : logiciel et banque Proportion d’artefacts et de chimères Proportion des OTUs rares Qualité de l’identification taxonomique Efficacité du filtrage

③ Concevoir une stratégie d’analyse des microbiomes utilisant les meilleurs outils testés et leurs paramètres intégrés dans un système de Workflow

3

Méthodologie

pblastall Best hit

ptaxoptimizer

Serveur

Seq 16S

Syntheticdata

traitement des résultats et représentations graphiques

Optimisation du fichier de sortie tabulation taxonomique

script

script

NCBI/RDPII

Silva/Greengenes

NCBI/RDPII

Silva/Greengenes

Analyse et représentation des données avec R

4

Bibliothèque de fonction

lecture csv dénombrement de la taxonomie calcule sensibilité/spécificité

Script modèle « à trous »

Création d’un script adapté aux données à partir de la technologie et du domaine

utilisé ainsi que de la nature des séquences initiales

Scripts représentations graphiques

histogramme nuage de points (radar plot) ajout des légendes/titres… production d’un PDF

5

pblastall Best hit

ptaxoptimizer

Serveur

Seq 16S

Syntheticdata

script

script

NCBI/RDPII

Silva/Greengenes

NCBI/RDPII

Silva/Greengenes

Automatisation

NGS read simulators :

MetaSim, ART, …

Simulation : “Mono bacteria”

6

Mock communities : “mono bacteria”

Une seule espèce d’un seul genre bactérien

Acinetobacter, Helicobacter, Enterococcus, (Akkermansia)

454 / Illumina ARNr 16S : complet / régions V5-V6

1000 reads par échantillon Temps d’analyse : 1h pour 1 bactérie / 1 technologie / 1 domaine

11/2 semaines pour répétitivité X100 (400 000 BLAST)

Analyse sur la base de données RDP II

7

Analyse « mono-bacteria » 454/illumina

8

Analyse « mono-bacteria »V5-V6/full length

Simulation “multi-phyla”

9

Plusieurs espèces d’un ou plusieurs phyla Protéobacteria, Firmicutes, Bacteroidetes, Actinobacteria, Fusabacteria

454 / Illumina ARNr 16S : complet / régions V5-V6 (V4)

5 000 reads

Mock communities

10

Bases de données ARNr 16S

16S Microbial SSURef

Mothur

SSURef Ref Souche type

RDPII

BLAST2011

10.28

10.28

11/11

05/11

108

11

Analyse « multi-phyla » 454

12

Analyse « multi-phyla »Illumina

Analyse « multi-phyla »Rapport faux positifs et NA sur correctement identifiés

13

Simulations “microbiote cryptes souris”

14

Plusieurs espèces venant d’un même phylum Proteobacteria,

454 / IlluminaARNr 16S : complet / régions V5-V6 (V4)

Mock communities

50 000 reads

Composition microbiote cryptes souris (données réelles)

15

Pseudomodales

Composition et phylogénie des données synthétiques

16

90%

0,5%

0,5%

2,5%

2,5%

2,5%

1,5%

Analyse des résultats de la simulation crypte souris454

17

Analyse des résultats de la simulation crypte sourisIllumina

18

Analyse des résultats de la simulation crypte sourisIdentification à l’espèce

19

Perspectives à court et moyen terme

20

Simulation et analyse crypte souris : Firmicutes

Simulation d’un microbiote complet de souris 37 bactéries provenant de 5 phyla

Génération de données avec ART et évaluation des méthodes de filtrage (qualité)

Evaluation des détecteurs de chimères sur les données réelles

Autres méthodes (MEGAN, RDP classifier)

Analyse des séquences :

Analyse des OTUs :

Uclust, QUIME, Mothur, TreePhyler, ARB

Poursuite des simulations de données:

Recommended