1
Dynamique et évolution desgénomes
Bernard Dujon
Cours BIM 3 novembre 2009
Charles Robert Darwin(1809-1882)
Les séquences des homologues divergent Les cartes génétiques se réarrangent
2
Les lots de gènes ne se chevauchent que partiellement,même entre espèces voisines
Espèce 1 Espèce 24867 85127
Lot communde gènes
Gènesspécifiques àl'espèce 1
Gènesspécifiques àl'espèce 2
Les organismes vivants n'évoluent pas, ils se reproduisent. Ce sont les populationsqui évoluent.
Principes généraux de l'évolution des génomes
Les génomes ne sont que des instantanés de structures en évolution constante àchaque génération. Les génomes des individus d'une même espèce ne sont pas strictement identiques.
Divergence de séquences
Horloges moléculairesGénérations successives
Dérive génétique Sélection
Erreurs de réplication
Perte de gènes
Duplication degènes
Redondance des génomesGénérations successives
Formation degènes
Nouveaux gènes
Perte de gènes
Générations successives
Réarrangements chromosomiques
Délétiona b c d e f h j k l m n o p q r s t a b c d e f h j k l p q r s t
a b c d e f h j k l m n o p q r s t Inversion a b c d e f h j k l q p o n m r s t
Duplicationa b c d e f h j k l m n o p q r s t a b c d e c d e f h j k l m n o p q r s t
Δ m n o
intrachromosomique
a b c d e f h j k l m n o p q r s t
z w k c d e v y x g i u … interchromosomique
Nouvelles jonctions, possibilité d'altération ou de fusion de gènes
Réarrangements chromosomiques (suite)
z w k l m n v y x g i u …. interchromosomique
Translocationsimplea b c d e f h j k l m n o p q r s t a b c d n m l e f h j k o p q r s t
intrachromosomique
a b c d e f h j k o p q r s t
a b c d e f h j k l m n o p q r s t
interchromosomique
Translocationréciproque
intrachromosomique
t r s q d e f h j k l m n o p c b a
a b c d e f h j k l m n o p v k w z
t s r q y x g i u …
3
Duplication des gènes et conséquences
Gèneancestral
Un génome n'est qu'un instantané d'un processus continuel de duplicationet perte de gènes au cours des générations successives.
Susumu Ohno, 1970mutations
Copiesparalogues
Nouvelle fonction:néo-fonctionalisation
paralogues
Copiesparalogues
Gèneancestral
Spécialisation des fonctions:sub-fonctionalisation
paralogues
Gèneancestral
X
Copiesparalogues
Perte d'une copie:non-fonctionalisation
Perte de gènes
Délétion: un seul gène ouquelques gènes adjacents
Dégénérescence mutationelle:formation de pseudogènes
Trios parents-enfant normaux:Génotypage SNPComparaison avec carte HapMapCGH sur tiling-arrays
--> dans la population humaine, chaque individu porte dans son génome30-50 délétions de plus de 5kb à l'état hémizygote (total de 550 -750 kbmanquant)
Intrachromosomique
Interchromosomique
Duplications segmentaires
Instable au cours desgénérations ultérieures
Stable au cours desgénérations ultérieures
unassembled sequence reads
interchromosomique
intrachromosomique
Example: rat
Total duplications segmentaires récentes: 2.9 % du génome (rat)
1-2% du génome (souris)5-6% du génome (homme)
Lachancea thermotolerans
Kluyveromyces lactis
Saccharomyces cerevisiae
Candida glabrata
Zygosaccharomyces rouxii
Saccharomyces castellii
Eremothecium gossypii
Vanderwaltozyma polymorpha
Duplicationdu génome
Duplication totale du génome: exemple de la levure
Double synténie
Mewes et al. Nature (1997) 387 suppl: 7-65
régions dupliquées imparfaitesWolfe and Shields (1997) Nature 387, 708–713
Duplication suivie de délétions nombreuses (90 % chez S. cerevisiae, 95 % chez C. glabrata)
4
Tetraodon negroviridis
Duplicationtotale dugénome
Hypothèsedes 2R
DUPLICATION TOTALE DU GENOME (TETRAODON)Jaillon et al. 2004 Nature 431: 946-957
Blocs de synténieappariés deux à deux
Double synténie(homme-Tetraodon)
DUPLICATION TOTALE DU GENOME (TETRAODON)
Aury et al., (2006) Nature 444: 171-178
Paramecium tetraurelia
49 000 gènes
DUPLICATIONS TOTALES SUCCESSIVESDU GENOME (PARAMECIE)
25 000 gènes
13 000 gènes
7 000 gènes ?
CONSEQUENCES DES DUPLICATIONS DE GENOME
Polyploïdie intégrale (initiale)
Perte des gènes dupliqués
Déséquilibre du dosage génique
Divergence des séquences (asymétrie: une copie reste proche de la copieancestrale, l'autre diverge vite en séquence et/ou régulation)
Réarrangement massif des cartes génétiques
Incompatibilité génétique et spéciation
5
Les surprises des ARN
micro ARNs 2002 Caenorhabditis elegans
D. Baltimore R. Dulbecco H. M. Temin
Transcription réverse1970 Chicken virus
cDNARNA
gene
retrogene
Richard J. RobertsPhilip A. Sharp
introns1977 Mammalian virus, rabbit globin gene
Intron Intron
Precursor RNA mRNA+
retrotransposons1985 yeast
Jef D. Boeke mobileelement
cDNARNA
mobile element
Interférence ARNearly 1980 then 2000 petunias, fungi, Caenorhabditis elegans
Andrew Z. Fire Craig C. Mello
Sydney AltmanThomas R. Cech
Catalyse par l'ARNEdition de l'ARN
1983 Tetrahymena nuclear intron, E. coli RNAse P
Trypanosoma RNA novel RNA sequence
ADN
ARN
Protéine
Transcription
Traduction
Réplication
1970-1980
Transcriptionreverse
EpissageEdition
1953-1961
ARN
Protéine
Réplication
Transcription
Traduction
ADN
Le dogme central de la biologie moléculaire
Gène
Fonction
GèneADN
ARN précurseurtranscrit du gène
Intron 2 Intron 3Intron 1
Exon 1 Exon 2 Exon 3 Exon 4
Qu'est-ce qu'un gène ? Epissage des ARNs
protéine
dégradation
+ Introns excisés
Phase codante
Jonctions des exons
régulation5' UTR 3' UTR
ARN épissé
Deux classes de mécanismes de transposition
reconnaît les«pieds du
transposon»
Transposase
1- choisit un site dans le génome2- coupe les deux brins de l’ADN3- insère le transposon excisé ou sa copie ADN
ARN
ADN
ARN Transcriptase inverse Intégrase
reconnaît lesextrémités de
l'ADNcADNc
copie l'ARNen ADN
1- choisit un site dans le génome2- coupe les deux brins de l’ADN3- insère l'ADNc Rétrotransposon
6
McClintock, B. 1951 Cold Spring Harbor Symp. Quant. Biol. 16: 13-57
Eléments de contrôle du maïs (élément Ac pour activateur).
3 ’5 ’ ARN transcrit
AAAAAAAA 3 ’5 ’ ARN maturé
4 introns, 5 exons
3,5 kb
4,6 kbCAGGGATGAAA TTTCATCCCTA
répétitions terminales inversées imparfaites(pieds du transposon )
Transposase
Exemple historique de transposon
gag pol
protéase, intégrasetranscriptase inverse
LTR LTR
décalage +1 decadre de lecture
6 kb
Transposon de levure (élément Ty1 pour transposon of yeast)
Exemple historique de transposonBoeke, J. D. et al. 1985. Cell 40: 491-500
AAAAAAAA 3 ’5 ’ ARN transcrit
Transcriptase inverseIntégrase
GAG
polyprotéine
protéase
Eléments de classe I actifs dans le génome humain Mills et al., 2007 Trends in Genetics 23: 183-191
TSD: target site duplication
SINE 7SL
LINE
LTR
Modèle de retrotransposition des éléments Alu
La fixation de l’ ARN Alu sur le ribosome en train de traduire l’ORF2 de l’élément LINE L1 luipermet de capturer la protéine naissante ORF2p. ==> La transcription inverse est initiée surl’ARN Alu et non plus sur l’ARN LINE L1.
On pense que la fixation se ferait par l’intermédiaire d’interactions avec SRP9p-SRP14p(tache jaune) comme pour l’ARN 7SL (car Alu en dérive).
L’ARN SVA (orange) se comporterait de même manière.
7
Conséquences de l’activité des éléments mobilessur le génome et l'expression des gènes
➥ activation de l ʼexpression dʼun gène voisin (ex. certaines tumeurs)
➥ induction de cassures chromosomiques (ex. les transposons non duplicatifs laissentdes cicatrices)
➥ dysgénèse hybride (ex. deux lignées de Drosophile qui diffèrent par leur lotde transposons P ou I ne peuvent plus se croiser entre elles, formationd ʼespèces nouvelles)
➥ induction de réarrangements chromosomiques (ex. translocations réciproques entre copies du même élément, cascades de « ponts cassures - fusions »)
➥ inactivation dʼun gène (exemple historique: le mutant white de la Drosophile)ex. d ʼinsertions délétères de l ʼélément LINE-1:
gène du facteur VIII: naissance de garçons hémophiles (le gène est sur le chromosome X)gène APC: cancer du colongène de la dystrophine: myopathies
Exon shuffling
~ 19 % des exons desgénomes eucaryotesproviennent de ce processus
exon
Exon 1 Exon 2Intron
nouvelexon
Nouvel épissage ou pertede l'intron
~ 4 % des nouveauxexons du génomehumain proviennent dece processus
Insertion d'un élément mobile
élement
mobile
Exon 1 Exon 2Intron
Formation de nouveaux sitesd'épissage ou perte des introns
Nouvelexon
Formation de rétrogènes
1 % des gènes humains, plusde nombreux pseudogènes,sont issus de ce processus
ADNc
rétrogene
fusion de gène
ou
ARN
gène ancestral
Conséquences de l’activité des éléments mobilessur l'évolution des génomes
Exemple d'exon shuffling
Long and Langley (1993) Science 260: 91-95 Long et al. (2003) Nature Genetics Reviews 4: 865- 875
Exonisation d'éléments mobiles
Gène humain RPE2-1 1 2 3 4 5 6
3' UTR5' UTR Alu J
exon 3
Partie de séquenceAlu J devenant unexon codant
intron
Ribulose-5-phosphate-3-épimerase
SaguinusLemur Eulemur Tarsius Saimiri Macaca Colobus Hylobates Pongo Pan HomoRéversion
Alu J insertion / fixation
Alu J exonisationStrepsirrhini
Tarsioidea
Platyrrhini
CercopithecoideaHominoidea
ca. 10 MYr
Mutations au site 3' d'épissage
Krull et al., (2005) Mol. Biol. Evol. 22, 1702-1711
8
Formation de rétrogènes chez la levure
Nuclear export
XX ∆Nucleus
Accidentalencapsidation ofmRNA
Template switching of RTNuclear import
Cytoplasm
Ty1 andURA2
mRNAs
XX ∆mRNA
Schacherer et al., (2004) Genome Res. 14: 1291-1297
[ATCase - ]
[ATCase + ]
Gal promoter TySubstrate relative freq.
revertants
Glucose OFF 1Galactose ON 1000
X non-sense mutation
∆ deletion with frameshift
X ∆XATCaseURA2 15-30-72
Génomes riches et pauvres en capacité d'innovationlevure homme
Gènes (codant des protéines) 5 770 ~ 23 000
Introns 280 > 100 000
Pseudogènes 10 > 25 000
Éléments mobiles ~ 50 > 1 100 000
Nombre de familles de protéines ~ 4 100 ~10 000
Redondance (gènes paralogues) 1,4 x 2,3 x
Exons codants
Introns, UTR, pseudogènes
Eléments mobiles
Autres régions
régulationsévolution
fonctions
Le génome et son évolution
1953
RNA
Protéine
Réplication
Transcription
Traduction
ADN
2009
ADN
ARN
ProtéineS
Transcriptionmultiple
Traduction(code génétique)
Réplication
Transcriptionréverse
EpissageEditionRégulation
EvolutionOrigine des gènesEpigénèse
GenBankEMBL
UniProt
Le dogme central de la biologie moléculaire
ADN
ARN
Protéine
Transcription
Traduction(code génétique)
Réplication
1970-1980
Transcriptionréverse
EpissageEdition