17
1 Plan GC 1. Présence/absence de gènes 2. Organisation chromosomique - synténie 3 Evolution des séquences génomiques 3. Evolution des séquences génomiques Organisation chromosomique comparer les chromosomes dans leur ensemble Organisation comparer les chromosomes dans leur ensemble entre espèces proches => identifier : les réarrangements majeurs les régions conservées => zone de synténie Synténie : conservation de l’ordre des gènes les mécanismes impliqués dans les réarrangements identifier des gènes co-localisés dans de nombreux génomes application : prédiction de liens fonctionnels

gc2.ppt [Mode de compatibilité] - lbgi.frlecompte/cours/gc2.pdf · cas d’une hydrogenase P. abyssi E. coli 0.1 P P57254 99 Q9X0U3 PFUR1442 O59117 Q9V0S5 96 100 100 O28445 Q980H3

  • Upload
    dothuy

  • View
    214

  • Download
    0

Embed Size (px)

Citation preview

Page 1: gc2.ppt [Mode de compatibilité] - lbgi.frlecompte/cours/gc2.pdf · cas d’une hydrogenase P. abyssi E. coli 0.1 P P57254 99 Q9X0U3 PFUR1442 O59117 Q9V0S5 96 100 100 O28445 Q980H3

1

PlanGC

1. Présence/absence de gènes

2. Organisation chromosomique - synténie

3 Evolution des séquences génomiques3. Evolution des séquences génomiques

Organisation chromosomique

• comparer les chromosomes dans leur ensemble

Organisation

comparer les chromosomes dans leur ensemble entre espèces proches => identifier :

– les réarrangements majeurs

– les régions conservées => zone de synténieSynténie : conservation de l’ordre des gènes

– les mécanismes impliqués dans les réarrangements

• identifier des gènes co-localisés dans de

nombreux génomes– application : prédiction de liens fonctionnels

Page 2: gc2.ppt [Mode de compatibilité] - lbgi.frlecompte/cours/gc2.pdf · cas d’une hydrogenase P. abyssi E. coli 0.1 P P57254 99 Q9X0U3 PFUR1442 O59117 Q9V0S5 96 100 100 O28445 Q980H3

2

OrganisationMéthodes de comparaison

• Alignements de séquences génomiques– MUMmer (Delcher et al, NAR, 1999)MUMmer (Delcher et al, NAR, 1999)

– BlastZ (Schwartz et al, Genome Research, 2003)

– MultiZ (Blanchette et al, Genome Research, 2004)

– …

• Identification de gènes orthologues entre 2 génomes et localisation physiquegénomes et localisation physique– ex : GenePlot au NCBI :

• best hit réciproque au niveau protéique

• localisation des orthologues sur une matrice de points

Types d’événements

• Délétions• Duplications

en tandem

Organisation

– en tandem– inversées

Page 3: gc2.ppt [Mode de compatibilité] - lbgi.frlecompte/cours/gc2.pdf · cas d’une hydrogenase P. abyssi E. coli 0.1 P P57254 99 Q9X0U3 PFUR1442 O59117 Q9V0S5 96 100 100 O28445 Q980H3

3

Pertes/acquisitions spécifiquesOrganisation

lineage-specific interspersed repeats

ancestral sequencedeleted in the two other species

Lindblad-Toh et al, Nature 2005

Lengths (MBs) of aligned and unique sequences in the euchromatic portions of genomes

Pertes/acquisitions spécifiquesOrganisation

Cumulative numbers of protein-coding gene duplication events on the human and mouse lineages since their divergence

Church et al. Plos Biol. 2009

Page 4: gc2.ppt [Mode de compatibilité] - lbgi.frlecompte/cours/gc2.pdf · cas d’une hydrogenase P. abyssi E. coli 0.1 P P57254 99 Q9X0U3 PFUR1442 O59117 Q9V0S5 96 100 100 O28445 Q980H3

4

Types d’événements

• Délétions• Duplications

en tandem

Organisation

– en tandem– inversées

• Acquisitions par transfert horizontal

Héritage vertical / transfert horizontal

Organisation

Transfert horizontal Héritage vertical avec duplication et perte différentielle

HGT: Horizontal Gene Transfer Gogarten & Townsend, Nature reviews Microbiology, 2005

Page 5: gc2.ppt [Mode de compatibilité] - lbgi.frlecompte/cours/gc2.pdf · cas d’une hydrogenase P. abyssi E. coli 0.1 P P57254 99 Q9X0U3 PFUR1442 O59117 Q9V0S5 96 100 100 O28445 Q980H3

5

f

Q978D6

Q97ZA7100

Q10884

P31895

O59656

PFUR1434

O59107

Q9V0R8100

100

74

37

68

P abyssi

Biais en GC et dans l’usage des

codons

TransfertsOrganisation

Number of proteinsPABY1394

P77329

P16431100

100

Q58433

O27306

Q9V2X7100

100

Q9UXP4

Q57935100

80

77

P95178

Q9I0J9

33599100

98

85

64PABY1394

Transfert horizontal:cas d’une hydrogenase

P. abyssi

E. coli

0.1

P33599

P5725499

Q9X0U3

PFUR1442

O59117

Q9V0S596

100

100

O28445

Q980H3

Q9YC2973

100

67

99

Transfert horizontal chez les procaryotesOrganisation

transformation (certaines bactéries): fixation d’ADN libre puis pénétration et recombinaison avec ADN cellulaire

transduction:transfert de gènes par l’intermédiaire d’un bactériophage. Le phage incorpore de l’ADN de la cellule hôte au moment de l’encapsidation et l’injecte dans une autre cellule.

j iconjugaison:transfert de gènes nécessitant un contact entre les cellules. Il y a appariement, mise en place d’une structure d’échange (ex : pili) et transfert d’ADN (plasmide le plus souvent) à la cellule acceptrice. L’ADN peut alors s’intégrer au chromosome ou se répliquer de manière indépendante.

Page 6: gc2.ppt [Mode de compatibilité] - lbgi.frlecompte/cours/gc2.pdf · cas d’une hydrogenase P. abyssi E. coli 0.1 P P57254 99 Q9X0U3 PFUR1442 O59117 Q9V0S5 96 100 100 O28445 Q980H3

6

The net of life…

Kunin et al. Genome research 2005

BactériesArchées

Transfert horizontal

Evolution « réticulée »Organisation

D’après Doolittle, 1999

Page 7: gc2.ppt [Mode de compatibilité] - lbgi.frlecompte/cours/gc2.pdf · cas d’une hydrogenase P. abyssi E. coli 0.1 P P57254 99 Q9X0U3 PFUR1442 O59117 Q9V0S5 96 100 100 O28445 Q980H3

7

Duplications Acquisitions par transferts horizontauxPertes différentielles Archaea

Plasticité des génomes Organisation

Pertes différentielles

Cyanobacteria

Pyrococcus

Methanogenes Halophiles

Thermo-plasma

Spirochetes

Flavobacteria

Purple bacteria Gram-positiveAnimals

Entamoeba

Deinococci

Green non

Chlamydiae

Ciliates

Plants

Fungi

T i h d

Flagellates

ArchaeaEukarya

Archaeoglobales

Aeropyrum

DiplomonadsAquifex

Thermotogales

Green nonsulfurbacteria

Microsporidia

Trichomonads

Bacteria

Transferts

Pertes

Disparité de l’histoire évolutive des gènes au sein d’un génome

Types d’événements

• Délétions• Duplications

en tandem

Organisation

– en tandem– inversées

• Acquisitions par transfert horizontal• Inversions• Translocations :

– translocations réciproques : 2 régions non-homologues « échangent » leur localisation

– transposition : 1 fragment unique se déplace• Fusion chromosomique :

2 chromosomes fusionnent en 1 chromosome– 2 chromosomes fusionnent en 1 chromosome• Fission chromosomique :

– 1 chromosome donne 2 chromosomes• Polyploïdie :

– autopolyploïdie : le génome se duplique (1 ou plusieurs fois) à l’intérieur d’une même espèce

– allopolyploïdie : le génome se duplique suite à l’hybridation entre 2 espèces proches

Page 8: gc2.ppt [Mode de compatibilité] - lbgi.frlecompte/cours/gc2.pdf · cas d’une hydrogenase P. abyssi E. coli 0.1 P P57254 99 Q9X0U3 PFUR1442 O59117 Q9V0S5 96 100 100 O28445 Q980H3

8

Comparaison de génomes procaryotes

• Génomes « très proches »Identification des régions divergentes : zones de plasticité hot spots

Organisation

Identification des régions divergentes : zones de plasticité, hot spots de recombinaison, îlots de pathogénicité, zones d’intégration d’éléments mobiles…

Comparaison de génomes procaryotes très proches

2 souches de Chlamydia trachomatis→ identification d’un ilôt lié à la pathogénicité

Organisation

C. trachomatis Ser D

Genome sequences of Chlamydia trachomatis MoPn and Chlamydia pneumoniae AR39. Read et al. Nucleic Acids Research 28, 1397-1406, 2000

C. trachomatis MoPn

Page 9: gc2.ppt [Mode de compatibilité] - lbgi.frlecompte/cours/gc2.pdf · cas d’une hydrogenase P. abyssi E. coli 0.1 P P57254 99 Q9X0U3 PFUR1442 O59117 Q9V0S5 96 100 100 O28445 Q980H3

9

Comparaison de 2 souches de Staphylococcus aureus

Comparaison de génomes procaryotes très prochesOrganisation

MSSA476(2598 protéines) transposition

(et inversion)

MRSA252 (2656 protéines)GenePlot (NCBI)

(et inversion)

Staphylococcus aureus

Comparaison de génomes procaryotes très prochesOrganisation

MRSA : methicillin-resistant Staphylococcus aureusMSSA : methicilin-susceptible Staphylococcus aureus

Page 10: gc2.ppt [Mode de compatibilité] - lbgi.frlecompte/cours/gc2.pdf · cas d’une hydrogenase P. abyssi E. coli 0.1 P P57254 99 Q9X0U3 PFUR1442 O59117 Q9V0S5 96 100 100 O28445 Q980H3

10

méthicillin résistancehospital-acquired MRSA

Comparaison de génomes procaryotes très prochesOrganisation

Staphylococcal Chromosomal Cassette (SCC)

résistant à la pénicilline et acide fusidiquesensible à methicilline

fusidic acid-resistance determinant

restriction modificationsystem

bleomycin and kanamycin resistance

erythromycin and spectinomycin resistance

hospital-acquired MRSA

Holden et al, PNAS, 2004

recombinasesinverted repeats

community-acquired MRSA

Comparaison de génomes procaryotes

• Génomes « très proches »Identification des régions divergentes : zones de plasticité hot spots

Organisation

Identification des régions divergentes : zones de plasticité, hot spots de recombinaison, îlots de pathogénicité, zones d’intégration d’éléments mobiles…

• Génomes « proches »Identification des éléments responsables de la plasticité

Page 11: gc2.ppt [Mode de compatibilité] - lbgi.frlecompte/cours/gc2.pdf · cas d’une hydrogenase P. abyssi E. coli 0.1 P P57254 99 Q9X0U3 PFUR1442 O59117 Q9V0S5 96 100 100 O28445 Q980H3

11

Comparaison de génomes procaryotesOrganisation

P. horikoshii genome

P. abyssi genome

P. furiosus genome

Ori

Ori

Ori

Kb

• Zone de terminaison de la réplication (Procaryotes)

Eléments impliqués dans la plasticitéOrganisation

• Zone de terminaison de la réplication (Procaryotes)

• Eléments “répétés”– éléments répétés simples (notamment centromères et télomères chez eucaryotes)

– gènes d’ARNt et d’ARNr

– transposons, séquences d’insertions chez Procaryotes A C C AG-CG-CG TC-GC-GG-CG-C T A

C G C C C A| | | | | AT

tRNAAlatRNAAla

3’ end

integrase

21,6 Kb

P. horikoshii

| | | | |G C G G G CC T T

G C G

G AC-GC-GG-CC-GC-G

C AT AC G C

TT C AG C T C G

| | | |G G A G CG A

tRNAAla

Page 12: gc2.ppt [Mode de compatibilité] - lbgi.frlecompte/cours/gc2.pdf · cas d’une hydrogenase P. abyssi E. coli 0.1 P P57254 99 Q9X0U3 PFUR1442 O59117 Q9V0S5 96 100 100 O28445 Q980H3

12

Comparaison de génomes procaryotes

• Génomes « très proches »Identification des régions divergentes : zones de plasticité hot spots

Organisation

Identification des régions divergentes : zones de plasticité, hot spots de recombinaison, îlots de pathogénicité, zones d’intégration d’éléments mobiles…

• Génomes « proches »Identification des éléments responsables de la plasticité

• Génomes « éloignés »Identification des blocs de synténie :

ensemble de gènes co-localisés dans plusieurs génomes

=> prédiction de liens fonctionnels

Plasticité génomiqueOrganisation

Comparaisons chez Bacillus

Similarity plots comparing the distribution of orthologs on the

chromosomes of B. licheniformis, B.subtilis and B. halodurans

(Blast E> 1e-50)

Rey et al. Genome Biology 2004

Réarrangements très nombreux Chute très rapide de la synténie(conservation de l’ordre des gènes)

PLASTICITE importante

Page 13: gc2.ppt [Mode de compatibilité] - lbgi.frlecompte/cours/gc2.pdf · cas d’une hydrogenase P. abyssi E. coli 0.1 P P57254 99 Q9X0U3 PFUR1442 O59117 Q9V0S5 96 100 100 O28445 Q980H3

13

Exemples d’opérons conservés

La synténie ne concerne qu’un petit nombre de gènes

Organisation

Mt RPOB1 RPOA1 RPOA2 RPL30E NusA RPS12PRPOH RPS7PRPOB2

RPOA1 RPOA2 RPL30E NusA RPS12PRPOH RPS7P

RPOA1 RPOA2 RPL30E NusA RPS12PRPOH RPOD RPL18P RPL13P RPS9P RPONPy

RPOB1 RPOA1 RPOA2 RPL30E NusA RPS12PRPOH RPS7PRPOB2 EF2Mk, Af, Mj

EF2

Pa, Ph, Pf

RPOA1 RPOA2 RPL30E NusA RPS12PRPOH RPS7P EF1a RPS10PAp

RPOA1 RPOA2 RPL30E NusA RPS12PRPOH RPS7PRPOB EF1a RPS10PHypSt

RPOA1 RPOA2 RPL30E NusA RPS12P RPS7P EF1a RPS10PHypRPOB1RPOH RPOB2Ss

EF1a RPS10P

RPOB

RPOB

RPOB

Pa, Ph, Pf

Mt

RPL39E RPL31E EIF6 RPLX PFDA

Ap, Ss, St, Af, Mk RPL39E RPL31E EIF6 RPLX PFDA DPAPDCD5RPS19E

RPL31E EIF6 RPLX PFDA DPARPL39EPDCD5RPS19EPy

RPL39E RPL31E EIF6 RPLX PFDA DPAPDCD5RPS19E Hyp

Prédiction de liens fonctionnels : méthode du contexte génomique

Constat : la synténie est très faible entre génomes éloignés

Organisation

Constat : la synténie est très faible entre génomes éloignés observée pour des opérons ou des clusters de gènes reliés fonctionnellement

(même voie métabolique, même complexe macromoléculaire...)

Méthode : recherche des gènes co-localisés dans les génomes procaryotes pour prédire la fonction de gènes inconnus

Colocalisation conservéeau cours de l’évolution(Procaryotes)

?

?

Exploitation du contexte génomique

Page 14: gc2.ppt [Mode de compatibilité] - lbgi.frlecompte/cours/gc2.pdf · cas d’une hydrogenase P. abyssi E. coli 0.1 P P57254 99 Q9X0U3 PFUR1442 O59117 Q9V0S5 96 100 100 O28445 Q980H3

14

Contexte génomique

Archaea :

Organisation

Isopropylmalate dehydrogenaseou

isocitrate dehydrogenase ?

Bacterial isopropylmalate dehydrogenases

Génomique

from Huynen et al. Trends in Microbiology (1999)

Bacterial isopropylmalate dehydrogenasesBacterial isocitrate dehydrogenasesArchaeal proteins

gène localisé dans l’opéron leucine chez :

OrganisationContexte génomique

gène localisé dans l opéron leucine chez : P. abyssi, P. horikoshii, A. fulgidus, M. thermoautotrophicum

Gène de l’isopropylmalate dehydrogenase

Page 15: gc2.ppt [Mode de compatibilité] - lbgi.frlecompte/cours/gc2.pdf · cas d’une hydrogenase P. abyssi E. coli 0.1 P P57254 99 Q9X0U3 PFUR1442 O59117 Q9V0S5 96 100 100 O28445 Q980H3

15

Prédiction de liens fonctionnels : méthode de la pierre de RosetteOrganisation

Principe:les gènes impliqués dans le même complexe ou dans la même voie peuvent fusionner au cours de l’évolution Détection de liens fonctionnels impliquant un partenaire inconnu

?

Avantage : applicable aux eucaryotes

Inconvénient :les domaines ubiquitaires doivent être éliminés

Enright et al. (1999) Nature

Comparaison chez les EucaryotesOrganisation

Rat Genome Sequencing Project consortium Nature 2004

Page 16: gc2.ppt [Mode de compatibilité] - lbgi.frlecompte/cours/gc2.pdf · cas d’une hydrogenase P. abyssi E. coli 0.1 P P57254 99 Q9X0U3 PFUR1442 O59117 Q9V0S5 96 100 100 O28445 Q980H3

16

Comparaison chez les EucaryotesOrganisation

A most parcimonious scenario

16 segments orthologues ≥ 300 kb entre les 3 espèces (outgroup data from cat, cow, dog)Rat Genome Sequencing Project consortium Nature 2004

Réarrangements chromosomiques

0.85Initial sequence and comparative analysis of the

Organisation

0.96

2.25

2 37

2.00

p ycat genome Pontius et al. Genome research 2007

Légende :Nb de réarrangements par million d’ é (f t 500Kb)2.37

1.27

1.09

0.63

0.96

d’années (fragments ≥ 500Kb)

intrachrom. interchrom.

Page 17: gc2.ppt [Mode de compatibilité] - lbgi.frlecompte/cours/gc2.pdf · cas d’une hydrogenase P. abyssi E. coli 0.1 P P57254 99 Q9X0U3 PFUR1442 O59117 Q9V0S5 96 100 100 O28445 Q980H3

17

Comparaison chez les Eucaryotes

Comparaison du chromosome 5 humain avec d’autres génomes de vertébrés

Organisation

Schmutz et al. Nature 2004

Comparaison de bras chromosomiques entre Anopheles gambiae (AG) et D. melanogaster

Sdobvnov et al. Science 2002Séparation : 250 millions d’années