99
Génétique des Génomes Bactériens http://www.pasteur.fr/recherche/unites/REG/ CE QUE NOUS APPREND LA STRUCTURE DES GÉNOMES BACTÉRIENS DE L’ORIGINE DE LA VIE À LA BIOLOGIE SYNTHÉTIQUE 唐善安東 Cours de Mastère I, Ecole Normale Supérieure 7 janvier 2008

CE QUE NOUS APPREND LA STRUCTURE DES GÉNOMES …adanchin//lectures/ENS_070108fin.pdf · trop de molÉcules structurellement voisines agit comme le font les POISONS, EN INACTIVANT

  • Upload
    dangnhi

  • View
    218

  • Download
    0

Embed Size (px)

Citation preview

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

CE QUE NOUS APPREND LA STRUCTUREDES GÉNOMES BACTÉRIENS DE L’ORIGINE

DE LA VIE À LA BIOLOGIE SYNTHÉTIQUE

唐善安東

Cours de Mastère I, Ecole Normale Supérieure7 janvier 2008

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

LA MÉTHODE CRITIQUE GÉNÉRATIVE

Autresmodèles

Statuette

Simulation

...

Idées reçues Langue

Axiomes et Définitions

Prédictions Théorème(conjecture)

Postulats

Existentielles Réfutables

interprétation

interprétation

instanciation

abstraction

démonstration

Modèle formel

- - - - - T H É O R I E - - - - -

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

VIE ET CALCUL LE PLAN DE LA CELLULE EST DANS LE CHROMOSOME DE LA SOUPE À LA SURFACE DES PIERRES LA TRANSFORMATION HOMÉOTOPIQUE DES ACIDES AMINÉS AUX NUCLÉOTIDES LE MONDE DES ARN UNIVERSAUX DANS LES GÉNOMES LE CŒUR DU GÉNOME : CE QUI PERSISTE EXPLORATION DE L’ENVIRONNEMENT : LE CÉNOME

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

CONTEXTE : LE“PROGRAMME GÉNÉTIQUE”

Physique : matière, énergie, tempsPhysique statistique : Physique + informationBiologie : Physique + information, codage, contrôle...Arithmétique : suites d’entiers, récursivité, codage…Calcul : Arithmétique + programmes + machine...

La métaphore du « programme génétique » rend explicite un certainnombre de points communs entre le calcul et le fonctionnementcellulaire : pouvons-nous pousser la métaphore jusqu’à sesconséquences ultimes ?

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

Trois entités constituent la vie :

Métabolisme |une machineCompartimentation |(principe : “substrat”,

|reproduction

Transfert d’information |un “programme” |(déclaratif, non |prescriptif, principe :|“matrice”, réplication)

La cellule est l’atome de vie

CE QU’EST LA VIE

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

VISION PHYLOGÉNÉTIQUE DU MONDE

Produire une descendance suppose faire du neuf avec duvieuxLes systèmes évoluent par mutations (parfois de simplesréarrangements, sans changement du « texte »génomique)La réplication ne peut qu’accumuler les erreurs et courir àla catastrophe (sauf échanges avec l’extérieur)Il faut distinguer la reproduction (d’un état métabolique)de la réplication (Freeman Dyson)La reproduction peut faire du neuf avec du vieux

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

Deux entités sont nécessaires au calcul :

Une machine capable de lire et écrire

Un programme sur un support physique(typiquement, une bande perforée oumagnétique illustre la suite séquentielledes symboles qui forment leprogramme), séparé (en pratique, maispas conceptuellement) en deux entités :

Programme (fournissant l’objectif)Données (fournissant le contexte)

QU’EST-CE QUE CALCULER ?

La machine est distincte du programme

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

CELLULES ET ORDINATEURS

La génétique repose sur la description des génomes comme textes écrits avec unalphabet de quatre lettres : mais les cellules se comportent-elles comme desordinateurs ?

Transfert Génétique HorizontalVirusGénie génétiqueTransplantation d’un chromosome d’une espèce dans une autre espèce (2007)

tout indique une séparation entre

« Machine » (l’usine cellulaire)et

Données + programme

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

VUE ALGORITHMIQUE DESACTIONS BIOLOGIQUES

Réplication, transcription, traduction : parallélisme élevé

“Début, Routine répétitive et Points de contrôle, Fin”

L’action est toujours orientée, avec un début et une fin

Les processus de contrôle temporel (check points) sontrarement pris en compte (excepté pour les processus deréplication/division), mais leur rôle est essentiel pourpermettre la coordination de multiples actions en parallèle

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

TROIS NIVEAUX DEL’INFORMATION

Ce que voit la réplication => Information à laShannon

Ce que voient la transcription et la traduction =>complexité algorithmique

Ce que voit l’évolution => profondeur logique

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

CE QUE VOIT LARÉPLICATION

Au cours de la réplication la séquence de l’ADN est recopiéeexactement. La copie ne se soucie nullement de la significationde la séquence

L’enveloppe génétique (la collection des séquences recopiées)peut être étudiée à un premier niveau de l’information qui luicorrespond. Typiquement on utilise à ce stadel’« information » de Shannon

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

COMPLEXITÉ ALGORITHMIQUE

L’« entropie » de Shannon ne se soucie pas de lasignification (réplication)

Kolmogorov et d’autres ont proposé de définir un autreniveau d’information, qui donne une définition de l’aléatoire,la longueur du plus petit programme définissant exactementune suite de symboles : la complexité algorithmique

Cela nous fournit un programme de recherche : afind’approcher la complexité algorithmique d’une séquence, ons’intéresse à la façon dont elle a été engendrée (au cours del’évolution, au cours des biosynthèses, etc)

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

PROCARYOTES ET EUCARYOTES

Procaryotes : une seule enveloppe, plusou moins compliquée ; génome « aléatoire »

Eucaryotes : multiplication des membraneset des peaux ; génome riche en répétitions

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

MISE EN GARDE

« Les poules du couvent couvent »

La métaphore alphabétique prise aupremier niveau est insuffisante :Même les répétitions ont un sens

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

LA PROFONDEUR LOGIQUE

Un programme très court (faible complexitéalgorithmique) peut décrire une simple séquencerépétée, mais aussi une figure fractale comme le floconde Koch

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

PROPRIÉTÉS INATTENDUESDES SUITES DE SYMBOLES

Le texte de l’ADN peut être considéré comme une suite desymbolesCette suite est transposée via un code, ce qui lui permet larécursivitéEn utilisant l’arithmétique Gödel a montré que le codagepermettait de créer une imprévisibilité de principe via leretour sur soi

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

LA PROFONDEUR LOGIQUE

Une conséquence : pour un programme suffisammentcompliqué (branché et récursif), il devient impossible deprédire son comportement dans un temps raisonnable.La seule façon de le faire est de dérouler programme…

Au cours de l’évolution l’ADN vient de l’ADN, vient del’ADN, etc… chaque base a donc une certaine« profondeur », qui fait que les organismes vivants sont,par construction, destinés à être imprévisibles…

Il s’en suit que, dans la descendance, certains individusseront aptes à survivre dans un futur imprévisible (etqu’il n’y a pas d’ADN « poubelle » (junk DNA)

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

PHYLOGENÈSE

1

1

4

1

7

4

1

21

11

Purple Firmicutes(Gram+)

CyanobacteriaFlavobacteria

Thermotoga

Aquifex

Methanopyrus

Thermoplasma

HalobacteriumMethanobacteriumMethano-coccus

Thermo-coccus

Thermoproteus

Pyrodictium

(Woese, 1990)

???

??????

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

VIE ET CALCUL LE PLAN DE LA CELLULE EST DANS LE CHROMOSOME DE LA SOUPE À LA SURFACE DES PIERRES LA TRANSFORMATION HOMÉOTOPIQUE DES ACIDES AMINÉS AUX NUCLÉOTIDES LE MONDE DES ARN UNIVERSAUX DANS LES GÉNOMES LE CŒUR DU GÉNOME : CE QUI PERSISTE EXPLORATION DE L’ENVIRONNEMENT : LE CÉNOME

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

ONTOGENÈSE: Y A-T-IL UNE IMAGE DE LACELLULE DANS LE CHROMOSOME?

Si la machine doit non seulement se comporter comme un ordinateur maisaussi construire la machine, on doit trouver un programme géométriquequelque part dans la machine (J. von Neumann)

Cette réflexion, appliquée dans un contexte où elle ne peut l’être (lefonctionnement cérébral) est-elle applicable dans le cas de lacellule et du programme génétique ?

L’ordre des gènes est-il aléatoire dans les génomes?

Beaucoup d ’organismes sont multicellulaires: ils passent d’un œuf à unadulte. Comment est-ce organisé si l’on retient la métaphore « alphabet -ordinateur »?

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

Drosophiloculus,

Homunculus?

Celluloculus?

LE MYSTÈRE DEL’ORIGINE DESHOMÉOGÈNES

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

FORME DE LA CELLULE

Construire une cellule synthétique doit prendre encompte cette conjecture, et respecter en pratiquel’ordre des gènes dans le génomes synthétiques

Qu’apprenons-nous des génomes bactériens ?

Y trouvons-nous des principes organisateurs ?

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

ORDRE DES GÈNES ETFORME DES BACTÉRIES

Tamames J, Gonzalez-Moreno M, Mingorance J, Valencia A, Vicente MBringing gene order into bacterial shapeTrends in Genetics (2001) 17: 124-126

L’îlot mur-fts

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

UNE MACHINE RÉCURSIVE

Réplicateur : l’ADN spécifie des protéines quirépliquent l’ADN

Constructeur : l’ADN spécifie des protéinesqui forment la machine qui construit la cellule

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

FONCTIONS PREMIÈRES

occuper le milieu environnant

vivreperpétuer la vie

Du grec κοινος,commun, cf« biocénose »

Du grec παλαιος,ancien

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

VIE ET CALCUL LE PLAN DE LA CELLULE EST DANS LE CHROMOSOME DE LA SOUPE À LA SURFACE DES PIERRES LA TRANSFORMATION HOMÉOTOPIQUE DES ACIDES AMINÉS AUX NUCLÉOTIDES LE MONDE DES ARN UNIVERSAUX DANS LES GÉNOMES LE CŒUR DU GÉNOME : CE QUI PERSISTE EXPLORATION DE L’ENVIRONNEMENT : LE CÉNOME

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

Il N’Y A PAS DE GÉNÉRATION SPONTANÉE

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

LA SOUPE PRÉBIOTIQUE IMPLIQUE LA PRODUCTION D’UN NOMBRE ÉLEVÉ DEVARIANTS D’UN PETIT ENSEMBLE DE MOLÉCULES.

OR IL FAUT METTRE EN PLACE D’ABORD UN MÉCANISME SÉLECTIF POURCOMPRENDRE L’ORIGINE DE LA CHIMIE DU VIVANT.

TROP DE MOLÉCULES STRUCTURELLEMENT VOISINES AGIT COMME LE FONT LESPOISONS, EN INACTIVANT LES PROCESSUS CATALYTIQUES SÉLECTIONNÉS DANSUN PREMIER TEMPS ET EN BLOQUANT L’ÉVOLUTION.

CELA IMPLIQUE :— UNE CONCENTRATION SUFFISANTE DES MOLÉCULES EN CAUSE— L’EXISTENCE D’UNE LIMITE À LA VARIÉTÉ DES MOLÉCULES PRODUITES À UNINSTANT DONNÉ— POUR CHAQUE TYPE, UNE MESURE DE SON ADÉQUATION— QUE LA DESCENDANCE DES TYPES LES PLUS ADÉQUATS S’ACCROISSE AVEC LETEMPS— QUE TANT QU’UN TYPE N’EST PAS SUR LE POINT DE DISPARAÎTRE IL PRODUISEDES DESCENDANTS DONT CERTAINS SONT LÉGÈREMENT MIEUX ADAPTÉS QUELEURS PARENTS.

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

UNE EXPÉRIENCE DE MILLER

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

PREMIÈRE ÉTAPE

MÉTABOLISME DE SURFACE PERMETTANT LA CONCENTRATION LOCALE DEMOLÉCULES À SQUELETTE CARBONÉ, LEUR MODIFICATION ET LEURPOLYMÉRISATION

QUELLES PROPRIÉTÉS CES MOLÉCULES DOIVENT-ELLES AVOIR ?

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

QUELQUES RÉFÉRENCES

GRAHAM CAIRNS-SMITH GENETIC TAKEOVER AND THE MINERALORIGIN OF LIFE CAMBRIDGE UNIVERSITY PRESS 1982ANTOINE DANCHIN UNE AURORE DE PIERRES LE SEUIL 1990CHRISTIAN DE DUVE BLUEPRINT FOR A CELL PATTERSON 1990FREEMAN DYSON ORIGINS OF LIFE CAMBRIDGE UNIVERSITYPRESS 1985GUNTER WACHTHERSHAUSER BEFORE ENZYMES AND TEMPLATES:THEORY OF SURFACE METABOLISM. MICROBIOL REV 1988, 52:452-484

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

VIE ET CALCUL LE PLAN DE LA CELLULE EST DANS LE CHROMOSOME DE LA SOUPE À LA SURFACE DES PIERRES LA TRANSFORMATION HOMÉOTOPIQUE DES ACIDES AMINÉS AUX NUCLÉOTIDES LE MONDE DES ARN UNIVERSAUX DANS LES GÉNOMES LE CŒUR DU GÉNOME : CE QUI PERSISTE EXPLORATION DE L’ENVIRONNEMENT : LE CÉNOME

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

ANABOLISME ETCATABOLISME

LE MÉTABOLISME ACTUEL MONTRE UNE CHIMIE TRÈSDIFFÉRENTE POUR L’ANABOLISME ET LE CATABOLISME.

CE DERNIER EST SOUVENT FACILE À COMPRENDRE ALORS QUEL’ANABOLISME MET EN JEU DES GROUPEMENTS CHIMIQUES« INUTILES »

LA PLUPART DES MÉTABOLITES QUI SERVENT À LACONSTRUCTION DES CELLULES (ANABOLISME) SONT CHARGÉSNÉGATIVEMENT, SOUVENT EN APPARENCE « INUTILEMENT »

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

SYNTHÈSEDE LASÉRINE

sérine

gâchis apparent !

GLYCOLYSE

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

LES MOLÉCULES À TROIS ATOMES DE CARBONE ET LESACIDES AMINÉS SONT TRÈS FACILES À OBTENIR

ON PEUT IMAGINER LA SYNTHÈSE SYSTÉMATIQUE DEPEPTIDES ET D’ISOPEPTIDES

LE MÉTABOLISME ACTUEL DE LA SYNTHÈSE DESNUCLÉOTIDES ET DES COENZYMES UTILISE DES ACIDESAMINÉS. IL S’AGIT DONC PEUT-ÊTRE DE LA TRACE DE CEPASSÉ PRIMITIF

SOUVENT, UNE « VARIATION SUR UN THÈME » OU UN SOCLECOMMUN RECOIT DES ACCEPTEURS DIVERS : IL S’AGIT LÀDE « TRANSFORMATION HOMÉOTOPIQUE »

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

PREMIÈRE ÉTAPE

MÉTABOLISME DE SURFACE DE MOLÉCULES À SQUELETTE CARBONÉ ETPORTEUSES DE GROUPEMENTS CHARGÉS NÉGATIVEMENT

CES MOLÉCULES COMPRENNENT UN CERTAIN NOMBRE D’ACIDES AMINÉS« SIMPLES » (GLYCINE, ALANINE, SÉRINE, CYSTÉINE, ASPARTATE,GLUTAMATE...) ET LE CŒUR DE CE QUI CONSTITUE AUJOURD’HUI LAGLYCOLYSE

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

VIE ET CALCUL LE PLAN DE LA CELLULE EST DANS LE CHROMOSOME DE LA SOUPE À LA SURFACE DES PIERRES LA TRANSFORMATION HOMÉOTOPIQUE DES ACIDES AMINÉS AUX NUCLÉOTIDES LE MONDE DES ARN UNIVERSAUX DANS LES GÉNOMES LE CŒUR DU GÉNOME : CE QUI PERSISTE EXPLORATION DE L’ENVIRONNEMENT : LE CÉNOME

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

(ISO)PEPTIDE

(ISO)PEPTIDE

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

LA SYNTHESE « NON RIBOSOMIQUE » DES ANTIBIOTIQUES OU LASYNTHÈSE DES ACIDES GRAS EST UNE HOMÉOTOPIE RÉCURSIVE.

LES GÈNES DE CES DEUX TYPES DE SYNTHÈSES SONTPHYLOGÉNÉTIQUEMENT APPARENTÉS.

LA FORMATION DES PEPTIDES EST CATALYSÉE PAR UN PEPTIDEPHOSPHORYLÉ (PHOSPHOPANTÉTHÉINE)

IL EST DONC PLAUSIBLE DE CONSIDÉRER DES PEPTIDES OU DESANALOGUES DANS LA SYNTHÈSE PRÉBIOTIQUE DES COENZYMES ET DESNUCLÉOTIDES.

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

IL EN RÉSULTE LA SYNTHÈSE DE MEMBRANES LIPIDIQUES, DECOENZYMES ET DE NUCLÉOTIDES.

LA POLYMÉRISATION DE CES DERNIERS, EN PRÉSENCE DEPEPTIDES, CONDUIT À DES ARN (ENCHAÎNEMENT 5’-3’) ET AUMONDE ARN OU L’ANCÊTRE DE L’ARN DE TRANSFERT SESUBSTITUE AUX SURFACES SOLIDES, EN PARTICULIER VIA LAPRÉSENCE D’ATOMES DE SOUFRE.

LA DÉCOUVERTE DU RÔLE POSSIBLE DE MATRICE PLUTÔTQUE DE SUBSTRAT VA DONNER LIEU À L’INVENTION DU CODEGÉNÉTIQUE.

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

DANS TOUS LES CAS SE POSE LA QUESTION DE L’ORIGINEDES NUCLÉOTIDES, CAR CES MOLÉCULES SONT TRÈSINSTABLES, CE QUI SUPPOSE UNE PRODUCTION CONTINUE.

UN COENZYME SOUFRÉ (QUI SE LIE DONC FACILEMENT À DESSURFACES FER-SOUFRE), LA MOLYBOPTÉRINE, DONNE UNEIDÉE D’UN SCÉNARIO D’ORIGINE, EN INVERSANT LEMÉTABOLISME ACTUEL QUI À PARTIR DU GTP DONNE LESPTÉRIDINES.

LES PTÉRIDINES ÉTAIENT OBTENUES AU COURS D’UNPROCESSUS PRIMITIF DE FIXATION DE L’AZOTE, ET LACYCLISATION SOUS FORME DE GMP ÉTAIT UNE « FUITE »ACCIDENTELLE DE CE PROCESSUS.

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

VIE ET CALCUL LE PLAN DE LA CELLULE EST DANS LE CHROMOSOME DE LA SOUPE À LA SURFACE DES PIERRES LA TRANSFORMATION HOMÉOTOPIQUE DES ACIDES AMINÉS AUX NUCLÉOTIDES LE MONDE DES ARN UNIVERSAUX DANS LES GÉNOMES LE CŒUR DU GÉNOME : CE QUI PERSISTE EXPLORATION DE L’ENVIRONNEMENT : LE CÉNOME

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

LES ARN PEUVENT AVOIR UNE ACTIVITÉ ENZYMATIQUEAUTONOME, ILS PEUVENT AUSSI LIER SPÉCIFIQUEMENT DESPETITES MOLÉCULES (APTAMÈRES), ILS PEUVENT ENFINJOUER LE RÔLE DE MATRICE POUR L’ADAPTATION D’ARNCOMPLÉMENTAIRES

LES « INTRONS » ILLUSTRENT, AUJOURD’HUI ENCORE, LACAPACITÉ DES ARN À CATALYSER LEUR PROPRE EXCISION,AVEC L’ÉPISSAGE DE FRAGMENTS ADJACENTS

LE MONDE DES ARN

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

LES ARN SONT TRÈS INSTABLES, EN RAISON DE LA NATUREFRAGILE DU RIBOSE.

LA POSITION 2’OH DU RIBOSE REND DIFFICILE LAPOLYMÉRISATION CORRECTE (5’-3’) DES ARN (EN FAIT IL FAUTL’ÉCRANTAGE DE PEPTIDES POUR QUE CE SOIT POSSIBLE).

LA RÉDUCTION DE CETTE POSITION, SOUS LA FORME DEDÉSOXYRIBONUCLÉOTIDES, A PERMIS DE FIGER LA MÉMOIREHÉRÉDITAIRE. LES ENZYMES CORRESPONDANTES (3 CLASSES,D’UNE MÊME ORIGINE) SUPPOSENT L’ABSENCE D’OXYGÈNE ETLA PRÉSENCE INITIALE D’UN NOYAU FER-SOUFRE.

L’INVENTION DE L’ADN

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

UN SCENARIO DE L’ORIGINE DE LA VIE

LA SURFACE DE SOLIDES CHARGÉS COMME LA PYRITE DE FER (FE-S)PERMET LA SÉLECTION ET UNE COMPARTIMENTATION PRIMITIVE DEMOLÉCULES CHARGÉES ; LA POLYMÉRISATION AVEC ÉLIMINATIOND’EAU EST FAVORISÉE PAR EFFET ENTROPIQUE

UNE FOIS COMPARTIMENTÉ, LE MÉTABOLISME CRÉE DES SUBSTITUTSDES SURFACES (LE MONDE ARN)

LES ACIDES NUCLÉIQUES SONT STABILISÉS PAR L’INVENTION DESDÉSOXYRIBONUCLÉOTIDES, AU MOMENT OU S’ÉTABLIT L’ENSEMBLEDES RÈGLES DES TRANSFERTS D’INFORMATION, D’ABORD AU SEIN D’UNMONDE ARN OU DES VÉSICULES PORTEUSES DES ANCÊTRES DESGÈNES SE SCINDENT ET FUSIONNENT TOUR À TOUR, AVANT QUE SEFORMENT LES PREMIERS GÉNOMES

causeries/causeries.html

A Danchin Une Aurore de Pierres. Aux origines de la vie, Le Seuil 1990

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

VIE ET CALCUL LE PLAN DE LA CELLULE EST DANS LE CHROMOSOME DE LA SOUPE À LA SURFACE DES PIERRES LA TRANSFORMATION HOMÉOTOPIQUE DES ACIDES AMINÉS AUX NUCLÉOTIDES LE MONDE DES ARN UNIVERSAUX DANS LES GÉNOMES LE CŒUR DU GÉNOME : CE QUI PERSISTE EXPLORATION DE L’ENVIRONNEMENT : LE CÉNOME

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

0

t

....... .... . ..... ........ .

.... ....... ....

. ..... ...

.... .. ....

. . .. .

. ..........

. .... . ...

.. .. ... . ... ... ....... ... . . .

.... ..... ...

.

. ....... .... ..

. . ... .. . ... ..

. ..... .. .. .. . . .

......

.. .... .Benjamin Crowell, licensed under the CreativeCommons Attribution-ShareAlike license

S = k log Ω

UNE IDÉE REÇUE (FAUSSE) ASSIMILEL’ENTROPIE AU DÉSORDRE

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

0

tJun S, Mulder B. Entropy-driven spatial organization of highly confined polymers: lessonsfor the bacterial chromosome .Proc Natl Acad Sci U S A. 2006 103:12388-12393

Danchin A, Guerdoux-Jamet P, Moszer I, Nitschke P. Mapping the bacterial cell architectureinto the chromosome. Philos Trans R Soc Lond B Biol Sci 2000, 355:179-190

L’AUGMENTATION D’ENTROPIE SUFFITÀ SÉPARER LES CHROMOSOMES !

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

CONCEPTS ET « RUSTINES »

Les processus formant la vie s’analysentconceptuellement. Ils doivent cependant être réaliséspar des objets concrets, qui ont des propriétésidiosynchratiques. La séquence physique de l’ADN nepeut pas être une double hélice régulière, simplementen raison de la nature chimique des nucléotides ; elleest tordue, surenroulée et son axe est gauche. Elledoit aussi être reconnue par des objets spécifiques.Comment ces contraintes opposées sont-ellesréalisées simultanément ?

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

MODÉLISATION RÉCURSIVE

Modèle réaliste 1 <=> Séquence réelle

Prédiction 1

Modèle réaliste 2 <=> Séquence réelle

Prédiction 2

Modèle réaliste 3 <=> Séquence réelle

Prédiction 3

…..

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

L’évolution optimise la réplication, alors que l’ADN doitaussi coder les gènes

Cela est révélé par : Une période 3, signature de la succession des

codons dans les gènes (constrainte par la règle ducode génétique)

A période 10-11.5 de fonction inconnue ...

CONTRAINTES DE LA SÉQUENCE

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

PÉRIODICITÉ DANS LES GÉNOMES

motifs

ON OBSERVE UNE LONGUECORRÉLATION ENTRE LESPAIRES DE BASESRÉPARTIES SELON UNEPÉRIODE DE TROIS

SI L’ON DÉCONVOLUECETTE PÉRIODE, DUE AUXCONTRAINTES DU CODEGÉNÉTIQUE (MAIS MALIDENTIFIÉES DE FACONEXPLICITE) IL RESTE UNEPÉRIODE FLOUE DE 10 À11,5 PAIRES DE BASES

Eskesen et coll. BMC Molecular Biology Volume 5, 12, 2004

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

UN CARACTÈRE UNIVERSEL DU TEXTE DU PROGRAMME : LA PÉRIODE 10-11,5

motifs

0 10 20 30 40 50 60 70 80 90 100bp

0 10 20 30 40 50 60 70 80 90 100bp

ffss(G(G--))-0.01

0

0.01

0 10 20 30 40 50 60 70 80 90 100bp

réel

modèle

différence

Helicobacter pylori

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

MOTIFS FLEXIBLES DE TYPE A

methods

1- 1-xxAAxxxxxxxxTTxxxxxxxxAAxxxxxxxxTTTTxxxxxxxxxxAAxxxxxxxxTTxxxxxxxxAAxxxxxx: : Tous règnesTous règnes 2-2-xxxxxxxxxxxxxxxxxxxxxxGGxxxxxxxxTTTTxxxxxxCCxxxxxxxxxxTTxxxxxxxxxxxxxxxxxx:: ProteobacteriaProteobacteria 4- 4-xxxxxxxxxxxxTTxxxxxxxxAGAGxxxxxxTTTTxxxxxxxxxxxxxxxxTTxxxxxxxxxxxxxxxxxxxx:: ArchaeaArchaea 55''--xxxxxx-10xxxxxxxxx0xxxxxxxx10xxxxxx-10xxxxxxxxx0xxxxxxxx10xxxxxxbp-3bp-3''

TTTTxxxxxxGGxxxxxxTTxxxxxxxxxxxxxxxxxxxxTTTT

Les nucleotides composant cette classede motifs sont pleinement accessiblesde ce côté mais les dinucléotides setrouvent dans le petit sillon

Les nucleotides composant cette classede motifs sont pleinement accessiblesde ce côté et les dinucléotides setrouvent dans le grand sillonTTTT

GG TT TTTT

AAAACC

AA AAAA

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

UNE RÈGLE UNIVERSELLE : LESMOTIFS FLEXIBLES DE TYPE A

La flexiblilité de ces motifs permet à l’ADN de prendreen compte les supertours et les courbures locales

Larsabal E, Danchin A.Genomes are covered with ubiquitous 11 bp periodic patterns, the "class A flexible patterns »BMC Bioinformatics. 2005 6:206

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

EXISTE-T-IL DES BIAIS DUS À LA RÉPLICATION ?

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

Les gènes ont tendance à préférer le brinprécoce de la réplication chez les Bactéries. Onobserve cependant une très grande variation,qui dépend de l’organisme : les bactéries àcoloration de Gram positive et dont l’ADN estriche en A+T ont un biais particulièrementimportant

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

180

90

0

270

55% leading

Escherichia coli

Ori

Ter

90270

65% leading

Treponema pallidum

Ori

Ter

180

9027075% leading

Bacillus subtilis

Ori

Ter

90270

87% leading

Thermoanaerobactertengcongensis

Ori

Ter

densité des gènesdensité des gènesdans le brin direct(précoce)

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

TÔT OU TARD...

Est-il possible de voir s’il y a une différencedans la composition en nucléotides, entre lebrin précoce et le brin retardé ? Est-ce que celainfluence le biais d’usage du code ? Est-ce quecela a une influence sur la composition enacides aminés des protéines ?

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

Prenant une originearbitraire pour laréplication et unepropriété du brin(composition enbases, en codons,composition enacides aminés de laprotéine codée…)l’analysediscriminante linéairepermet de découvrirs’il y a une origine, ets’il y a un biais entreles brins

TÔT OU TARD ...

E. Rocha, A. Danchin & A. Viari Universal replication biases in bacteria. Mol. Microbiol. (1999) 32: 11-16

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

C’EST LA QUESTION…

.

0,450,5

0,550,6

0,650,7

0,750,8

0,85

0 20 40 60 80 100

Bacillussubtilis

accu

racy

Borreliaburgdorferi

0,4

0,5

0,6

0,7

0,8

0,91

0 20 40 60 80 100 0,4

0,5

0,6

0,7

0,8

0,91

Chlamydiatrachomatis

0 20 40 60 80 100

0,45

0,5

0,55

0,6

0,65

0,7

0,75

0 20 40 60 80 100

Escherichiacoli

accu

racy

0,45

0,5

0,55

0,6

0,65

0,7

0,75

0 20 40 60 80 100

Haemophilusinfluenzae

0 20 40 60 80 100

Helicobacterpylori

0,4

0,45

0,5

0,55

0,6

0,65

0,7

0,40,45

0,50,55

0,60,65

0,70,75

0,8

0 20 40 60 80 100

Methanobacteriumthermoautotrophicum

position (%) position (%) position (%)

accu

racy

0,45

0,5

0,55

0,6

0,65

0,7

0,75

0 20 40 60 80 100

Mycobacteriumtuberculosis

0,4

0,5

0,6

0,7

0,8

0,9

1

0 20 40 60 80 100

Treponemapallidum

Nucléotides

Acides aminés

Codons

Dinucléotides

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

VISIBLE DANS LES PROTÉINES…

GT dans le brin précoce, CA dans le brin retardé....

0

5

10

15

0 5 10 15

% V

% T

Borreliaburgdorferi

0

5

10

15

0 5 10 15

% V

% T

Chlamydiatrachomatis

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

LES GÈNES ESSENTIELS SONTDANS LE BRIN PRÉCOCE

highlyexpressed

0%

25%

50%

75%

100%

non-highlyexpressed

gènes essentiels gènes non-essentiels

retardé

précoce

non-highlyexpressed

highlyexpressed

Rocha EP, Danchin A.Essentiality, not expressiveness, drives gene-strand bias in bacteriaNature Genetique. 2003 34:377-378.

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

COLLISION DES POLYMÉRASES

DNAPdécélération

Fin de latranscription

Arrêt de la ARNP & ADNP

Transcriptionabortive

Co-orientées FrontaleConséquences:1. Ralentissement de la

réplication

2. Perte des transcrits

Conséquences:1. Transcrits

interrompus

2. Protéines essentiellestronquées

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

VIE ET CALCUL LE PLAN DE LA CELLULE EST DANS LE CHROMOSOME DE LA SOUPE À LA SURFACE DES PIERRES LA TRANSFORMATION HOMÉOTOPIQUE DES ACIDES AMINÉS AUX NUCLÉOTIDES LE MONDE DES ARN UNIVERSAUX DANS LES GÉNOMES LE CŒUR DU GÉNOME : CE QUI PERSISTE EXPLORATION DE L’ENVIRONNEMENT : LE CÉNOME

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

VARIATION / SÉLECTION / AMPLIFICATION STABILISATION

ÉVOLUTION CRÉE

FONCTION CAPTURE (RECRUTE)

STRUCTURE CODE

SÉQUENCE

UNE CONTRAINTEUNIVERSELLE, L’ÉVOLUTION

LE LIVRE « PRESSE-PAPIERS » cf A DANCHIN La Barque de Delphes, Odile Jacob 1998

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

ANALYSES MULTIFACTORIELLES

A l’opposé de la génétique habituelle, la génomique analyse degrandes collections de gènes et de produits de gènes

Les analyses multivariées cherchent à extraire l’information enréduistant le plus possible les descripteurs des objets étudiés

L’Analyse en Composantes Principales qui utilse la valeur centréeréduite des caractères étudiés est une méthode de base

L’Analyse Factorielle des Correspondances est de la même famille,mais utilise la mesure du χ2 comme distance. Cela permet nonseulement d’étudier des objets dont les descripteurs sont hétérogènes,mais aussi de travailler sur l’espace des descripteurs et sur l’espacedes objets simultanément

L’Analyse en Composantes Indépendantes utilise le caractère nongaussien de la répartition des valeurs, etc

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

LES BIAIS DE L’USAGE DU CODESONT LIÉS AUX FONCTIONS

Gènes échangés

horizontalement

Métabolisme

central

Classe I :métabolismecentralClasse II : forte expressionen croissanceexponentielleClasse III :transferthorizontal

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

BIAIS LOCAUX DE L’USAGE DUCODE

L’Analyse Factorielle des Correspondances montre que lesgènes qui ont un biais similaire dans l’usage des codonssont apparentés fonctionnellement. Comment cela serépartit-il dans le chromosome ?

Une méthode de groupage fondée sur l’analyse des biaisd’usage des codons au moyen d’une théorie de l’informationregroupe les gènes en familles homogènes, qui ne serépartissent pas au hasard dans le chromosome. Laméthode permet à la fois d’identifier des biais cohérents etde trouver le nombre pertinent de classes à considérer (4pour E. coli et 5 pour B. subtilis)

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

Les gènes qui ont un biais similairesont organisés en régions plusétendues que les opérons, ce quidémontre un rôle de la traductiondans la structuration du chromosomebactérien

Une part importante de lacontribution à cette effet vient durecyclage des ARN de transfert rares

ÎLOTS GÉNOMIQUES

M. Bailly-Béchet

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

ÎLOTS GÉNOMIQUES

Un groupe correspond auniveau d’expression(bleu). Les autresgroupes sontfonctionnellementcohérents : gènes dutransfert horizontal(rouge), motilité (jaune)et métabolismeintermédiaire (vert) M. Bailly-Béchet

M Bailly-Bechet, A Danchin, M Iqbal, M Marsili, M VergassolaCodon usage domains over bacterial chromosomesPLoS Computational Biology (2006) 2: april 20th

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

En 1991, à la réunion de l’UE sur les programmes génomes à Elounda, en Grèce, laprésentation du chromosome III de la levure et des premiers 100 kb du génome deBacillus subtilis a révélé que, au contraire de ce qu’on pensait jusqu’alors, au moins lamoitié des gènes découverts étaient totalement inconnus, que ce soit par leurfonction ou la structure de leur produit

Plusieurs raisons rendent compte de ce fait, toujours vrai aujourd’hui ; d’une part notreconnaissance du métabolisme est très imparfaite, d’autre part nous ne savons pascomment se créent de nouveaux gènes ; enfin, l’évolution procède par la sélection defonctions, en recrutant des structures dont l’adaptation va s’accroître en parallèle avecl’adéquation de l’individu à sont environnement (évolution acquisitive)

S’il y a tant de nouveaux gènes, existe-t-il cependant un socle commun ?

LA PREMIÈRE DÉCOUVERTE DELA GÉNOMIQUE

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

GÈNES PERSISTANTS

Les gènes essentiels en laboratoire sont situés dans le brin précoce.Ils sont aussi conservés dans une majorité de génomes

A l’inverse les gènes qui sont conservés et se trouvent dans le brinprécoce forment une catégorie supplémentaire, qui double celle desgènes essentiels

Ces gènes forment des universaux ; 400-500 gènes persistent dansun grand nombre de génomes ; ils sont impliqués non seulementdans les trois processus nécessaires à la vie, mais dans lamaintenance et dans l’adaptation aux phénomènes transitoires ; unefraction gère l’évolution de l’organisme

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

PERSISTANCE DES GÈNES

Stress, Maintenance et Réparation

Gènes persistants

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

PHYLOGÉNIE DE LAPERSISTANCE

Quelques uns des gènes essentiels absents de la liste ontévolué particulièrement rapidement

Pour mesurer la contribution de cet effet, on la met enparallèle avec l’évolution de l’ARN ribosomique 16S

Deux scénarios distincts apparaissent : dans la moitié descas une évolution linéaire, et dans l’autre moitié uneévolution erratique

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

La moitié (A) des gènes persistants deB. subtilis (resp. E. coli) ont un coefficientde corrélation >0.9 entre la similitude deséquence des paires d’orthologues etl’ARN 16S

Certains gènes (B) évoluent de façonerratique. Ce peut être dû au transfertgénétique horizontal, à des adaptationsparticulières, ou tout simplement à deserreurs dans l’attribution de l’orthologie

PERSISTANCE DES GÈNES

G Fang, EPC Rocha, A DanchinHow essential are non-essential genes?Mol Biol Evol (2005) 22: 2147-2156

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

LES GÈNES PERSISTANTS SONTREGROUPÉS

Avec l’analyse de 228 génomes codant chacun plus de 1500gènes et des annotations « correctes », on identifie lesgènes persistants ; ils tendent à rester à proximité les unsdes autres ; cette « attraction mutuelle » constitue un réseauremarquable fait de trois cercles concentriques quiregroupent les fonctions identifiées dans ce scénario del’origine de la vie : un métabolisme compartimenté (à lasurface des pierres) suivi de l’invention d’un substitut dessurfaces, l’ARN, puis de l’usage des acides nucléiques pourgérer les interactions avec l’environnement au travers del’information correspondante

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

LES GÈNES PERSISTANTS RÉCAPITULENTL’ORIGINE DE LA VIE

Le réseau externe (gènes dumétabolisme intermédiaire,nucléotides et coenzymes,lipides), est très fragmenté ; leréseau médian est formé autourdes ARNt synthétases de classeI, et le réseau intérieur, presquecontinu, est organisé autour duribosome, de la transcription etde la réplication gère lestransferts d’information

G. Fang

35

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

« ETRE » IMPLIQUE LEREGROUPEMENT

Pourquoi les gènes persistants sont-ils regroupés ? Unmodèle simple montre que si, pour compenser le transferthorizontal des gènes, les gènes tendent à disparaître engroupes, alors tout gène contribuant à l’adéquation del’organisme à son environnement assez fréquemmenttendra à se regrouper avec les gènes ayant la mêmepropriété. Cela explique le regroupement des gènesessentiels, mais peut-être aussi celui des gènes derésistance aux antibiotiques...

En conséquence le regroupement précède et ne résulte pasde la co-transcription ou des interactions protéine-protéine !

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

L’EXISTENCE IMPLIQUE LEREGROUPEMENT

G Fang, EPC Rocha, A Danchin Persistence drives gene clustering BMC Genomics (2008) sous presse

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

LE GÉNOME MOSAÏQUE

Une séparation conceptuelle suppose l’existence de deuxparties du génome, codant la machine et l’”objectif” de lamachine. Cela implique la distinction entre lereplicateur/constructeur et des fonctions secondaires

Les génomes réels doivent donc coder des fonctionsubiquistes (pas des gènes ubiquistes !) qui correspondentau premier génome (appelé ici le paléome) et desfonctions spécifiques à l’environnement de l’organisme(constituant ici le cénome — comme dans “biocénose” —pour exprimer le fait qu’il s’agit de fonctions spécifiques àl’occupation d’une niche particulière)

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

Fréquence deregroupement

Fréquencedans lesgénomes+fréquent + rare

Connu Inconnu

PenicillinVancomycin

Isoniazide

Rifampicin

Streptomycin

Tetracycline

Cœur du génome<2000 gènes

Gènes variablesdéjà > 50000 gènes

Le cénome(du Grec κοινος,commun)

Le paléome(du Grec παλαιος,ancien)

LE CÉNOME

Antibiotiques Virulence

Génétique des Génomes Bactérienshttp://www.pasteur.fr/recherche/unites/REG/

FAIRE UNE CELLULE : DU PALÉOME AUCÉNOME

La vie se manifeste par lacroissance et la luttecontre le vieillissement: legénome correspondant estle paléome. L’explorationde l’environnement est uneconséquence inévitable del’existence, elle résulte duflux constant d’entrée etde sortie des gènes quiforment le cénome.