Synténie bactérienne : aide pour lannotation de Cenibacterium arsenoxydans Laurent Labarre AGC -...

Preview:

Citation preview

Synténie bactérienne : aide pour l’annotation de Cenibacterium arsenoxydans

Laurent Labarre

AGC - UMR 8030 - Génoscope

labarre@genoscope.cns.fr

Plan

• Génomique comparative avec les mains• Détection de groupes de synténie• Détection de régions spécifiques• Les synténies dans MaGe

Régions conservées

Escherichia coli k12

Ba

cil

lus

su

bti

lis

Comparaison de génomes éloignés

Escherichia coli k12

Es

ch

eri

ch

ia c

oli

O1

57

H7

Région spécifique

Comparaison de génomes proches

Génomique comparative : remarques

• Aspect multi-génome– Comparaison toujours par rapport à …

• Présence / absence de gènes– orthologie/paralogie/gènes spécifiques ?– correspondance fonctionnelle ?

• Conservation de l’organisation des gènes– groupes de synténie, groupes de gènes spécifiques ?– couplage fonctionnel ?

La synténie : pourquoi ?

Applications

Opérons

RégulationTranscriptionelle

AttributionFonctionnelleContextuelle

?

Similitude Familles de gènes"Universels"

Voies Métaboliques

Génome A

Génome B

"correspondance"

"co-localisation"

"co-localisation"

Les gènes sont les nœuds du graphe et sont connectés par deux types d’arêtes :Relation de "correspondance" (inter génomes)

principalement résultats de comparaisons de séquences (avec contraintes restrictives sur la similitude)mais aussi classifications fonctionnelles ou conservation de domaines protéiques

Relation de "co-localisation" (intra génome)paramètre de gap qui autorise tous types de réarrangements

=> L’algorithme développé recherche les groupes de gènes (‘syntons’) qui vérifient ces deux relations.

Nous utilisons le formalisme des graphes pour modéliser les groupes de synténie.

Synténie bactérienne : modélisation

Génome A

Génome B

Synton #1

Réarrangement Fusion Duplication Insertion Inversion

Synton #2

gap <= 2

=> Correspondances multiples, réarrangements et insertions autorisés

Synténie bactérienne : modélisation

On détecte aussi ce groupe de gènes chez Y. pseudotuberculosis, S. typhi, S. typhimurium et E. coli O157.

Ce groupe n’a pas d’équivalent chez E coli

Cet exemple montre quels types de groupes de synténie peuvent être détectés.

Le système de sécrétion de type III :

Synténie bactérienne : un exemple

Génome A

Génome B

"co-localisation"

"absence de correspondance"

Comme pour les synténies, nous utilisons les graphes pour modéliser les régions spécifiques avec deux types d’arêtes :

Relation d’ "absence de correspondance" (inter génomes) représentée explicitement

Relation de "co-localisation" (intra génome) paramètre de gap qui autorise les insertions

=> Détecter les régions spécifiques revient à rechercher les gènes qui vérifient ces deux relations (trivial)

Régions spécifiques : modélisation

Région spécifiquegap <= 2

Insertion

Génome A

Génome B

=> Insertions autorisés

Régions spécifiques : modélisation

=> Statuer sur l’absence de correspondance n’est pas simple !

"Orthologue putatif"

"Absence de correspondant"

Critère decorrespondanceinter-génomes

?!

Régions spécifiques : remarque

Algorithme (1/2)

?

c1 c2 c3 c4 c5 c6 c7 c8

1 4

2 2

4

2

c2c1 c3 c4 c5 c6 c7 c8

2

11

2

c2c1 c3 c4 c5 c6 c7 c8

2

4

c2c1 c3 c4 c5 c6 c7 c8

11

ccA1 ccA2

ccB1 ccB2 ccB3

gap <= 1c2c1 c3 c4 c5 c6 c7 c8

ccA1/ccB1 ccA2/ccB2 ccA2/ccB3

Algorithme (2/2)

=> Raffinement de partition de l’ensemble des couples de gènes correspondant suivant leur co-localisation sur les deux génomes

• Représentation cartographique• Détails de syntons• Recoupement de synténies

Les synténies dans Mage

Un outil dédié au calcul et à l’exploration des synténies bactériennes• Calcul dynamique• Différents types de correspondances (Blast, COG, EC, Pfam)

Le Syntonizer

Recommended