18

Click here to load reader

ACADEMIE DE GRENOBLE · Web viewACADEMIE DE GRENOBLE Version du 2 avril 2003 SCIENCES DE LA VIE ET DE LA TERRE JOURNEE ACADEMIQUE TICE EN SVT CDDP de Valence ATELIER 13 : MODELISATION

Embed Size (px)

Citation preview

Page 1: ACADEMIE DE GRENOBLE · Web viewACADEMIE DE GRENOBLE Version du 2 avril 2003 SCIENCES DE LA VIE ET DE LA TERRE JOURNEE ACADEMIQUE TICE EN SVT CDDP de Valence ATELIER 13 : MODELISATION

ACADEMIE DE GRENOBLE Version du 2 avril 2003SCIENCES DE LA VIE ET DE LA TERRE

JOURNEE ACADEMIQUE TICE EN SVTCDDP de Valence

ATELIER 13 : MODELISATION MOLECULAIREEric Lavis, IA-IPR de SVT

Sources :"La Cellule" - Durand et Favard (Hermann 1974)"Structures et fonctions des molécules biologiques" INRP 1997Entretien avec Dominique Housset, Institut de biologie structurale

Thème de l'atelier :Utilisation du logiciel de modélisation moléculaire Rastop et de fichiers tirés de la "Protein data bank" au lycée : objectifs visés, démarche pédagogique, modules techniques et activités conseillés, réflexion sur le statut de l'outil (place des faits et des idées), évaluation des capacités expérimentales.

Thèmes d'application pédagogiquesIntroductionExtrait de "Structures et fonctions des molécules biologiques" INRP 1997

Les programmes de biologie des lycées ont intégré depuis longtemps les séquences des molécules et leurs caractéristiques spatiales. Ainsi, dans le programme de Première Scientifique on relève : « les propriétés de la molécule d'ADN sont liées à sa structure [ ] c'est la séquence des acides aminés qui détermine la structure spatiale d'une protéine indispensable à son activité [ ] les protéines structurales et enzymatiques, produits de l'expression des gènes, sont à l'origine du phénotype de l'individu, [ ] ».

Pour illustrer ces concepts, on trouve dans les manuels de nombreux documents qui donnent une idée de l'allure globale de la molécule, mais se prêtent difficilement à l'appréhension des dimensions spatiales. Il existe également quelques modèles moléculaires qui rendent compte de la forme. Ces modèles partiels ne sont pas aisés à manipuler. Les changements d'angle d'observation, de style de représentation (pour mettre en évidence l'ensemble des constituants ou uniquement certaines liaisons), les mesures ou les calculs sont indispensables pour faire ressortir les propriétés des molécules.

Pour que les visualisations spatiales ne restent pas de simples illustrations, il est nécessaire de donner progressivement aux élèves une capacité à la lecture et à l'interprétation de tels documents. Cette maîtrise peut passer par le traitement réel des données qui sont à l'origine des modèles de structure concernés. Le logiciel RASMOL comporte un grand nombre de fonctions permettant la visualisation et l'analyse des coordonnées tridimensionnelles des molécules. En disposant des données appropriées, on peut mettre l'élève en situation active dans l'étude des problèmes évoqués dans les programmes. En s'appuyant sur des exemples biologiques simples, les premières séances permettront aux élèves de maîtriser les fonctionnalités principales du logiciel et d'acquérir ainsi un savoir-faire qui sera réinvesti ensuite sur d'autres thèmes. La plupart des fonctions du logiciel sont sous-tendues par des notions fondamentales en particulier celles qui sont relatives aux caractéristiques des acides aminés. On peut donc utiliser RASMOL pour étudier la structure des acides aminés, identifier leur variété, comprendre leur mode de liaison et initier les élèves à la lecture des différents modes de représentation spatiale. Après, on pourra aborder des thèmes plus complexes tels que les relations entre la structure spatiale et la fonction d'une molécule, les aspects évolutifs à travers l'étude de structures tridimensionnelles dans une famille multigénique, l'illustration du polymorphisme génique, etc.

Ces exploitations de la visualisation tridimensionnelle s'ancrent souvent sur une connaissance ou une comparaison préalable des séquences primaires pour introduire un problème ou franchir quelques étapes dans sa résolution. C'est pourquoi l'utilisation d'un outil de visualisation en 3D peut être associée à celle d'autres logiciels qui exploitent les séquences primaires (SEQAID II, ANAGÈNE ou ÉVOLUTION MOLÉCULAIRE).

Ces utilisations s'insèrent également à la suite d'approches plus classiques mettant en jeu d'autres techniques : mesures calorimétriques ou oxymétriques pour la catalyse enzymatique par exemple, réalisation d'électrophorèses et d'immunodiffusions pour approcher le complexe antigène-anticorps, etc. Ainsi, le logiciel peut être sollicité dans différentes occasions qui émaillent l'enseignement de la Première à la Terminale. Il est donc utile d'en planifier l'utilisation à long terme : introduit dès le début de la Première, et pourquoi pas en Seconde, on hésitera moins à y faire appel par la suite, l'élève ayant déjà acquis les savoir-faire nécessaires. Ceci implique que la banque de données soit suffisamment riche.

Les approches et les démarches proposées ici constituent quelques illustrations de ce qu'il est possible de faire avec les données actuellement disponibles. Elles ont été testées dans les classes -, les stages académiques de formation ont été l'occasion de les mettre à l'épreuve et de les améliorer. D'autres approches peuvent être pertinentes en fonction du contexte de la classe et des stratégies de l'enseignant.

Utiliser les données scientifiques et les outils du chercheur doit permettre à l'élève, sur du matériel biologique non manipulable (les molécules biologiques) de mener des activités pratiques et d'atteindre des objectifs méthodologiques. En exploitant les résultats des traitements qu'il applique, il peut tester des hypothèses et proposer des explications. Grâce à la visualisation, il « observe » comme devant son microscope. avec des angles de vue différents, des grossissements différents , il procède à des marquages et à des colorations. Ceci débouche sur des activités plus classiques dans leur nature mais très formatrices : repérage, schématisation, mesures, comparaisons, etc. La richesse des données et la facilité d'accès favorise la travail sur des exemples diversifiés et contribue à l'établissement du caractère général de tel ou tel concept que l'on veut fonder.

Chaque exemple est structuré en deux parties : quelques rappels d'informations scientifiques sont d'abord donnés sur la ou les molécules à étudier ; ces informations sont destinées à l'enseignant et non aux élèves. Ensuite, l'approche proposée est décomposée par étapes, en essayant à chaque fois de mettre en évidence les problèmes biologiques ou les questions qui se posent, et de montrer pratiquement de quelle manière on peut essayer d'y répondre en utilisant les fonctionnalités du logiciel.

Comme toutes les autres activités pédagogiques qui reposent sur des logiciels laissant beaucoup d'initiative, il est indispensable avec RASMOL que les élèves procèdent de manière ordonnée en gardant une trace écrite de leur travail. Les images de molécules incluses dans cette publication sont fournies sous une forme légendée, mais en suivant les étapes indiquées il est aisé de produire et d'imprimer toutes ces illustrations.

Il convient de souligner enfin que, s'agissant des relations entre structures et fonctions des molécules biologiques, la visualisation en trois dimensions ne révèle que l'aspect structural d'une molécule, les informations sur la fonction venant d'autres sources. Aussi, l'étape d'analyse structurale est rappelée dans chaque exemple. Cette analyse est rapide à réaliser, mais il appartient à l'enseignant d'évaluer l'opportunité d'y recourir systématiquement ou de mettre en place les raccourcis éventuels qui mènent plus directement à l'étude de la relation structure-fonction.

- page 1 -

Page 2: ACADEMIE DE GRENOBLE · Web viewACADEMIE DE GRENOBLE Version du 2 avril 2003 SCIENCES DE LA VIE ET DE LA TERRE JOURNEE ACADEMIQUE TICE EN SVT CDDP de Valence ATELIER 13 : MODELISATION

LES OUTILS SCIENTIFIQUES ET LES DEMARCHESQUI SOUS-TENDENT LA MODELISATION MOLECULAIRE

CRISTALLOGRAPHIE

Compte tenu de leur petite taille, il est impossible d'observer directement la plupart des molécules biologiques (sauf exceptions). Pour tourner la difficulté, on réalise des cristaux dans lesquels les molécules, toutes identiques, se disposent de la même façon, permettant une "observation globale" rendant compte de l'état de l'ensemble des molécules. Dans un cristal, les molécules (par exemple protéiques) sont ainsi agencées sous forme d'un réseau régulier constitué par la répétition du même motif.Pour obtenir un cristal, on place sur une lame une goutte de solution de la protéine à une concentration proche de la sursaturation (environ 2µL de solution saturée et 2µL de solvant), en présence d'agents cristallisants (polyéthylène glycol, sulfate d'ammonium…) qui font diminuer la solubilité de la protéine. Par échange de vapeur entre la solution et l'atmosphère qui l'entoure, la solution franchit progressivement et très lentement la courbe de saturation. Si l'opération réussit, les molécules s'organisent en réseau sous forme d'un cristal qui se dépose sur la lame ; sinon, elles précipitent sous forme d'un amas amorphe. Un cristal n'est pas "sec" ; il peut contenir, en fonction des cas, de 30 à 80% de solvant (notamment de l'eau : la plupart des molécules d'eau sont observables avec une résolution inférieure ou égale à 2,6 ). La formation d'un cristal peut durer de une heure à quelques heures, voire quelques mois (en général, l'expérimentateur se lasse au bout de trois à six mois d'attente ! Des lames ainsi abandonnées ont pu être réutilisées après deux ans, la cristallisation s'étant déroulée dans l'intervalle…). Un cristal de 80 µm permet des observations correctes ; l'observation est impossible en dessous de 20 µm ; des cristaux mesurent parfois 1 mm.La question est souvent de savoir si, dans un cristal, la protéine conserve ou non sa forme "naturelle". C'est le cas pour les protéines globulaires : l'empilement cristallin est représentatif de la molécule libre. C'est moins certain pour les protéines disposant de nombreuses parties flexibles : les domaines globulaires s'organisent en réseau entre les mailles duquel les domaines flexibles (souvent des boucles) se placent dans une position variable en fonction des molécules. Si elles restent exposées au solvant, les parties flexibles montrent une agitation thermique forte témoignant de leur flexibilité.Il faut probablement envisager deux aspects de la flexibilité de certains domaines : Celle qui est liée au fonctionnement de la protéine, donc à des zones à contrainte fonctionnelle forte, par exemple au

niveau du site actif d'une enzyme : la catalyse est étroitement liée à la nature des acides aminés du site ; la flexibilité peut être à l'origine du bon fonctionnement de la molécule (par exemple, la protéase du HIV comporte une poche centrale qui se referme par deux boucles qui se rabattent sur le substrat). Une grande rigidité peut aussi traduire une interaction très spécifique avec un substrat.

Celle qui n'est pas directement liée au fonctionnement de la protéine, dans des zones aux contraintes fonctionnelles faibles : boucles de liaison entre domaines, radicaux d'acides aminés …

Comment cristalliser ensemble des molécules qui doivent interagir ?Il y a plusieurs façon d'obtenir une observation de molécules au moment de leur interaction (enzyme et de son substrat avant réaction ; anticorps et l'antigène reconnu…) : Les cristalliser ensemble, mais cela pose problème lorsqu'on a affaire à une enzyme car on obtient très rapidement les

produits de la réaction. Faire diffuser le substrat dans le cristal. Travailler avec un analogue structural du substrat, voire un bloquant.

DIFFRACTION AUX RAYONS X

Extrait de « La Cellule » Durand et Favard (Hermann 1974)

L'étude de la structure tertiaire [des protéines] est effectuée à l'aide des diagrammes de diffraction des rayons X, technique perfectionnée par Kendrew et Perutz qui ont obtenu, en 1962, le prix Nobel de chimie pour leurs découvertes sur la structure de la myoglobine et de l'hémoglobine.Dans les protéines cristallisables, les plans dans lesquels se situent les atomes, et qui se répètent à distances données, se comportent comme des surfaces réfléchissant le rayonnement X, lorsque celui-ci les attaque sous un certain angle d'incidence. Renvoyés sur une plaque photographique, ils y produisent un diagramme de diffraction. En faisant tourner le cristal sur lui-même, les spots du diagramme apparaissent aux angles d'un réseau géométrique qui reflète le plan d'organisation des molécules dans ce cristal. L'étude de ces diagrammes permet finalement de calculer, en chacun de ses points, la densité du nuage électronique des molécules du cristal. La résolution de cette technique est, pour les énormes édifices moléculaires que sont les protéines, de l'ordre de 2 . Encore, à ce niveau, faut-il pouvoir prendre des points de repère à partir desquels sont reconstitués, plan par plan, les secteurs de densité électronique différente. Ces repères sont constitués par des atomes de métaux lourds substitués en des points connus de la molécule. Le nombre des calculs exigés pour chaque point du diagramme croît en proportion du cube du pouvoir de résolution. Pour avoir une image utilisable de la molécule, on doit ainsi calculer la densité électronique de 100000 points, ce qui n'est faisable qu'à l'aide de calculatrices électroniques à haut rendement. Les résultats sont représentés sous forme de courbes reliant les points de même densité électronique (figure a) tracées sur des plaques de plexiglas puis empilées les unes sur les autres. On voit alors apparaître, peu à peu, la forme et les contours de chaque polypeptide. Vue sous un certain angle, une hélice de type alpha apparaît comme un cylindre creux (figure b).

- page 2 -

Page 3: ACADEMIE DE GRENOBLE · Web viewACADEMIE DE GRENOBLE Version du 2 avril 2003 SCIENCES DE LA VIE ET DE LA TERRE JOURNEE ACADEMIQUE TICE EN SVT CDDP de Valence ATELIER 13 : MODELISATION

a

Figure : structure tertiaire des protéines.a) Carte de la répartition des densités électroniques (voir dans le texte) d'une chaîne polypeptidique, telles qu'elles sont révélées par l'analyse des diagrammes de diffraction des rayons X avec une résolution de l'ordre de 1,5 A.b) Principe de la reconstitution tridimensionnelle de la structure tertiaire : les cartes sont réalisées sur des feuilles de plexiglas et empilées, ce qui fait apparaître les contours de la molécule étudiée. L'axe d'une hélice alpha se présente comme un cylindre creux.

Ces documents permettent de construire des modèles moléculaires fidèles mais statiques. Comme on le verra plus loin, les protéines assument au cours de leur fonctionnement, de continuelles modifications de conformation, locales ou globales. Lorsque la résolution atteint 1,5 , on peut se dispenser de connaître la structure primaire, le tracé des lignes de même densité électronique laissant peu de doute sur la nature de l'acide aminé qui les produit. Lorsqu'elle est inférieure à 3 , la reconstitution de la structure tertiaire exige que soient simultanément employées l'analyse chimique des séquences et l'analyse physique des cristaux. En effet, les distances interatomiques étant de l'ordre de 2 , l'étude cristallographique seule ne donne qu'un contour assez flou du trajet des chaînes polypeptidiques. L'expérience ayant montré que la configuration, la réactivité et la fonction des protéines sont précisément fonctions de la présence de tel ou tel acide aminé à telle ou telle position au voisinage de tel ou tel autre, la combinaison des deux approches est celle qui donne les résultats les plus significatifs.Il paraît certain que ces maquettes fixes donnent une idée assez juste de la structure tertiaire des protéines qui ne sont cependant que très rarement cristallisées dans le milieu intracellulaire. A l'état cristallin, les enzymes conservent leur activité catalytique et leur aptitude à l'autorégulation de fonctionnement. Les cristaux protéiques sont très hydratés et formés de molécules non jointives. Un tiers au moins de leur volume est occupé par le solvant. Il n'y a donc pas de problème de diffusion pour les petites molécules solubles avec lesquelles l'enzyme doit réagir.On constate cependant que les vitesses de réaction des enzymes cristallisées sont inférieures à la normale. Les raisons de ce freinage ne sont pas entièrement connues. Il est possible de l'attribuer à la rigidification par l'état cristallin de structures qui n'ont plus la liberté de modifier leur conformation et on en tire argument pour penser que des modifications conformationnelles sont indispensables au fonctionnement.

« La Cellule » Durand et Favard (Hermann 1974)

Les techniques d'exploration des moléculesExtrait de "Structures et fonctions des molécules biologiques" INRP 1997 :

Plusieurs techniques fournissent les données de base à partir desquelles on calcule les images des molécules.En spectroscopie par RMN, on place une solution concentrée de la molécule dans un champ magnétique intense. Chaque

noyau atomique réémet un ensemble d'ondes dont les fréquences révèlent son environnement atomique : on en déduit les distances entre atomes.

La microscopie a sonde locale consiste, à l'aide d'une aiguille très fine, à balayer la surface de la molécule à étudier. La forme de la face étudiée de la molécule apparaît à l'issue du balayage.

La principale technique est la cristallographie aux rayons X. L'objectif est de trouver la manière dont les atomes ou groupes d'atomes sont arrangés dans l'espace. La lumière visible a une trop grande longueur d'onde pour résoudre des détails aussi fins. Il faut une radiation dont la longueur d'onde soit du même ordre de grandeur que la distance entre les atomes c'est-à-dire environ 0,1 nm (soit 1 Angstrom, symbole ). Seuls les rayons X remplissent cette condition. Cependant, pour une molécule le rayonnement réémis est très faible et elle est détruite par l'irradiation. Au lieu d'une seule molécule on utilise donc un cristal regroupant quelques 1015 molécules identiques. L'intensité du rayonnement diffusé est plus important et l'effet de dégradation est ainsi réduit.

Un objet à caractère périodique comme un cristal ne diffuse la lumière que dans certaines directions privilégiées : c'est la diffraction. Une source lumineuse, observée à travers un rideau de tulle, semble entourée de points lumineux régulièrement disposés et qui sont en fait les rayons diffusés par le tissu. Le même phénomène se produit quand le cristal est placé dans un faisceau monochromatique de rayons X.

- page 3 -

Page 4: ACADEMIE DE GRENOBLE · Web viewACADEMIE DE GRENOBLE Version du 2 avril 2003 SCIENCES DE LA VIE ET DE LA TERRE JOURNEE ACADEMIQUE TICE EN SVT CDDP de Valence ATELIER 13 : MODELISATION

Lorsqu'on veut explorer la structure d'une macromolécule protéique ou nucléique, la première opération est donc la cristallisation. Le problème majeur concerne l'extraction d'une protéine suffisamment isomorphe pour que le cristal soit de taille raisonnable (la présence de molécules polymorphes interrompt la croissance du cristal). Actuellement, l'utilisation de protéines recombinantes permet de disposer d'une meilleure homogénéité des protéines à étudier.

Dans la protéine cristallisée, les plans dans lesquels se situent les atomes se comportent comme des surfaces réfléchissant le rayonnement X, les centres diffractants étant les atomes constitutifs de la molécule.

Principe de la diffraction aux rayons X : un faisceau fin de rayons X est envoyé sur le cristal sous un certain angle. Une partie des rayons est diffractée et impressionne une plaque photographique.

On enregistre systématiquement la réflexion en faisant tourner le cristal par rapport au faisceau incident. On obtient un diagramme qui contient un grand nombre de taches arrangées régulièrement sur le film.L'analyse de ce diagramme révèle la répartition des électrons au sein de chaque molécule du cristal.Les spots correspondent aux angles d'un réseau géométrique qui reflète le plan d'organisation des molécules dans le cristal.

À partir de ce diagramme, on calcule à chaque point la densité du nuage électronique correspondant à la molécule. À ce stade, il faut disposer de repères, c'est pourquoi on compare les diagrammes obtenus sur des cristaux natifs et sur des cristaux dans lesquels on a substitué à certains atomes des atomes de métaux lourds.

L'objectif est d'obtenir une image de la molécule ; il faut calculer la densité électronique d'un très grand nombre de points (> 1 00 000). Les résultats sont représentés sous forme de courbes reliant les points de même densité et ceci dans les différents plans explorés successivement. La superposition de ces plans fait apparaître la forme et les contours de la molécule à la manière d'un relief figuré en courbes de niveau.

La finesse de l'image est liée à la résolution utilisée. A basse résolution (0,3 nm et plus), on obtient une image grossière de la molécule étudiée : dans les protéines, la structure quaternaire (sous-unité) et les éléments structuraux les plus importants comme les hélices apparaissent dès ce stade de l'étude. À haute résolution (0,15 nm par exemple) les silhouettes atomiques peuvent être distinguées. Des logiciels permettent maintenant d'obtenir des visualisations tridimensionnelles des régions de forte densité électronique le plus souvent sous forme d'un treillis. Autrefois il s'agissait de maquettes construites à la main.

- page 4 -

Page 5: ACADEMIE DE GRENOBLE · Web viewACADEMIE DE GRENOBLE Version du 2 avril 2003 SCIENCES DE LA VIE ET DE LA TERRE JOURNEE ACADEMIQUE TICE EN SVT CDDP de Valence ATELIER 13 : MODELISATION

Il reste à construire le modèle atomique de la molécule. Pour cela, il faut déterminer la nature et la position dans l'espace de chacun des atomes qui la composent. L'information de départ est contenue dans la séquence des acides aminés qui doit être connue. Pour construire la représentation de la molécule, on dispose de modèles des acides aminés.

On recherche la meilleure coïncidence entre la carte des densités électroniques et un modèle d'acide aminé, ici une chaîne latérale de tyrosine, à résolution moyenne(0.25 nm à gauche) et à résolution élevée(0. 15 nm à droite).

On utilise actuellement des systèmes graphiques pilotés par ordinateur qui permettent le plus souvent, à l'aide de dispositifs appropriés, une visualisation stéréoscopique. Le résultat final sera donc un modèle atomique complet de la molécule. Il reste imprécis mais on l'affinera en calculant certains facteurs de structure et en minimisant l'écart entre les positions calculées et les positions mesurées sur le modèle. La précision dépend de la résolution : sur de petites molécules, à haute résolution, on considère que la position peut être connue à 0,001 nm près. Sur les grosses molécules (protéines), la précision est à 0,01 nm.

Mais la cristallographie aux rayons X permet aussi de réunir des informations sur les changements de conformation des molécules biologiques. Tout d'abord on peut détecter les fluctuations de faible amplitude des atomes autour de leur position moyenne (ces mouvements sont liés à l'agitation thermique). On peut également appréhender des mouvements de forte amplitude de certains domaines de la molécule : ainsi on a montré qu'une molécule d'immunoglobuline G comporte des régions charnières dont la flexibilité permet à l'un des fragments d'être très mobile même dans le cristal.

On constate également que certaines enzymes, par exemple le lyzozyme, sont très rigides alors que d'autres changent considérablement de conformation lors de la fixation du substrat (par exemple l'alcool-déshydrogénase). On a pu mesurer aussi l'activité catalytique d'enzymes. Cette mesure suppose qu'on puisse enregistrer le diagramme de diffraction en un temps comparable à la durée de la réaction (ce qui est possible avec un rayonnement synchrotron).

Une des applications les plus intéressantes concerne l'ingénierie des protéines. L'exemple de la xylose-isomérase est très démonstratif : elle agit normalement sur le xylose, mais présente un intérêt dans l'industrie des boissons pour transformer le glucose en fructose. Pour en faire une véritable glucose-isomérase, il faut identifier la manière dont le glucose et le xylose se fixent sur l'enzyme et connaître la structure tridimensionnelle du site. En combinant ces connaissances avec les calculs d'énergie de conformation, on proposera des modifications de la séquence des acides aminés réalisables à travers des synthèses in vitro. Beaucoup d'autres applications telles que l'immunologie (étude des protéines impliquées dans le SIDA, mise au point de vaccins de synthèse) sont actuellement parmi les domaines les plus actifs de la cristallographie.

"Structures et fonctions des molécules biologiques" INRP 1997

Un réseau cristallin comporte de 1013 à 1016 mailles, chacune mesurant de l'ordre de 100 de côté. En diffraction on ne peut voir, sous forme d'une densité électronique stable, que ce qui est constant et répété dans le réseau cristallin. Ce qui est flexible, par exemple le long radical d'une arginine, ne forme pas de densité électronique suffisamment localisée et dense pour être observé. Un résidu qui a un mouvement (agitation thermique) supérieur à 0,5 n'est pas observable.

- page 5 -

Page 6: ACADEMIE DE GRENOBLE · Web viewACADEMIE DE GRENOBLE Version du 2 avril 2003 SCIENCES DE LA VIE ET DE LA TERRE JOURNEE ACADEMIQUE TICE EN SVT CDDP de Valence ATELIER 13 : MODELISATION

La gageure apparaît de la manière suivante : Les zones fonctionnelles sont souvent les zones flexibles. Leur flexibilité "s'exprime" quand elles restent en contact avec le solvant, mais alors on les "observe" mal en diffraction. On les observe bien en diffraction lorsqu'elles sont immobiles, mais alors rien ne dit qu'elles sont figées dans une

position "naturelle", correcte du point de vue fonctionnel.Lorsqu'une molécule comporte des zones trop flexibles pour être correctement vues dans les conditions de l'observation, l'observateur propose une conformation "raisonnable" et le précise dans l'en-tête du fichier "pdb".Ces difficultés expliquent qu'il y ait peu d'anticorps dans la banque de fichiers pdb : la grande flexibilité de la molécule au niveau de la liaison partie constante / partie variable rend extrêmement hypothétiques les "observations" réalisées (on ne dispose, en ce qui concerne les anticorps, que de quelques fichiers relatifs à des fragments "Fab").

RESONANCE MAGNETIQUE NUCLEAIRE

La RMN permet de faire des observations de molécules en solution, disposant donc de toutes leurs possibilité de flexibilité. Le ficher pdb correspondant comporte soit toutes les structures différentes de la même molécule, soit une structure moyenne tirée de l'ensemble des observations.La résolution des observations RMN (au mieux 3 ) est moins grande que celle des observations par diffraction.

MODELE MOLECULAIRE

La représentation moléculaire obtenue est un modèle construit progressivement affiné par aller-retour avec les observations réalisées.La fiabilité des molécules de la protein data bank est devenue bonne à partir des années 1990, en raison de la rigueur des protocoles de validation et de contrôle des publications.Pour déposer une structure, un laboratoire doit passer au crible des contrôles et exigences, comme dans le cadre d'une publication scientifique. Une structure déposée est également passée au crible des laboratoires de recherche travaillant sur la même molécule, ou sur des molécules voisines (molécules disposant de modules structuraux et / ou fonctionnels communs).

Dans certains cas, une publication trop rapide a pu conduire à des erreurs "grossières" de structure. Par exemple, malgré un très gros travail de l'équipe qui l'a publiée, la première structure déposée en 1989 pour la protéase du HIV comportait une erreur au niveau d'une boucle de fermeture du site actif. Comme il s'agit d'une des premières molécules sur laquelle on a testé de nombreux médicaments anti-VIH, les conséquences auraient pu être très négatives dans la lutte contre la maladie.

FICHIER "PROTEIN DATA BANK"Les exemples sont tirés de la molécule du fichier FAB_LYSO.pdb

Les fichiers de la "protein data bank" peuvent avoir quatre origines : Cristallographie et diffraction aux rayons X Résonance magnétique nucléaire Microscopie électronique Modèle théorique construit par analogie avec des molécules connues disposant de domaines communs (ces fichiers ne

font pas l'objet d'un "dépôt").Le fichier pdb précise toujours dans son en-tête la technique ayant permis de l'obtenir.

JRNL TITL CRYSTALLOGRAPHIC REFINEMENT OF THE 1FDL 11JRNL TITL 2 THREE-DIMENSIONAL STRUCTURE OF THE 1FDL 12JRNL TITL 3 FAB*D1.3-*LYSOZYME COMPLEX AT 2.5-*ANGSTROMS 1FDL 13JRNL TITL 4 RESOLUTION 1FDL 1

RESOLUTION : caractérise la finesse de l'observation réalisée.Résolution supérieure à 3 : observation de qualité moyenne ; la chaîne principale est bien vue, de même que les hélices alpha et les feuillets bêta ; les chaînes latérales sont peu précises.Résolution entre 2,5 et 3 : l'observation est correcte, le modèle est fiable ; les atomes sont tous vus, les chaînes latérales sont correctement positionnées.Résolution de 1,8 à 2,5 : la carte de densité électronique est très précise ; la mobilité des atomes, l'agitation thermique (flexibilité), sont précisément caractérisées.Lorsque la résolution est divisée par 2 (par exemple quand on passe de 3 à 1,5 ) on dispose de 8 fois plus d'informations (variation selon le cube de la résolution).

REMARK 2 RESOLUTION. 2.5 ANGSTROMS. 1FDL 1

SOLVENT : quantité de solvant présente dans le cristal

- page 6 -

Page 7: ACADEMIE DE GRENOBLE · Web viewACADEMIE DE GRENOBLE Version du 2 avril 2003 SCIENCES DE LA VIE ET DE LA TERRE JOURNEE ACADEMIQUE TICE EN SVT CDDP de Valence ATELIER 13 : MODELISATION

FACTEUR B : facteur d'agitation thermique. Il s'agit d'une valeur moyenne pour l'ensemble de la molécule.Va généralement de 10 2, très stable (molécule globulaire à structure tertiaire développée), à 60 2, très flexible (molécule peu globulaire).L'agitation thermique est en principe indiquée pour chacun des atomes de la molécule étudiée. C'est la comparaison de l'agitation thermique de l'atome et de l'agitation thermique moyenne du modèle qui indique son niveau de stabilité.NB : Rastop est capable de colorer les atomes de manière différente en fonction de l'agitation thermique.

FACTEUR R : indique le niveau de désaccord entre les structures observées en diffraction et les calculs effectués à partir du modèle moléculaire construit ; il s'agit de l'écart entre l'intensité des tâches de diffraction obtenues et ce qu'elles devraient être si le modèle moléculaire était correct.Un niveau de désaccord inférieur ou égal à 0,2 (20%) est considéré comme satisfaisant.

REMARK 3 THE R VALUE IS 0.184. THE RMS DEVIATION FROM IDEALITY OF 1FDL 23REMARK 3 THE BOND DISTANCES IS 0.013 ANGSTROMS. THE RMS DEVIATION 1FDL 24REMARK 3 FROM IDEALITY OF THE BOND ANGLES IS 3.3 DEGREES. 1FDL 2

FREE R VALUE : critère de désaccord "objectif" obtenu de la manière suivante : 10% des données de diffraction (densités électroniques) sont a priori mises de côté. Le modèle moléculaire est construit et affiné progressivement à partir des 90% restants (à terme, le modèle rend compte

de 100% de ces données). En fin de travail, on applique le modèle aux 10% mis de côté pour obtenir le critère de désaccord objectif : 0,2 signifie

que le modèle rend compte de 80% des données mises de côté.Le Free R toléré (considéré comme satisfaisant) dépend de la résolution de l'observation.

AUTRES INFORMATIONS : SHEET : feuillets bêta. HELIX : hélices alpha. SS-BOND : ponts disulfures. Indication sur les acides aminés en conformation CIS (le plus souvent la proline). HOH : molécules d'eau du solvant NAG : N-Acétyl-glucosamine, résidus glucidiques d'une protéine glycosylée.

FTNOTE 1 RESIDUES PRO L 8, PRO L 95, PRO L 141, PRO H 150, PRO H 152 1FDL 75FTNOTE 1 AND PRO H 192 ARE CIS PROLINES. 1FDL 76SSBOND 1 CYS L 23 CYS L 88 1FDL 77SSBOND 2 CYS L 134 CYS L 194 1FDL 7

SEQUENCE EN ACIDES AMINES

Précédée d'une information sur les chaînes.

REMARK 4 CHAIN "L" REPRESENTS ANTIBODY LIGHT CHAIN RESIDUES. CHAIN 1FDL 27REMARK 4 "H" REPRESENTS ANTIBODY HEAVY CHAIN RESIDUES. CHAIN "Y" 1FDL 28REMARK 4 REPRESENTS LYSOZYME. 1FDL 2

SEQRES 1 L 214 ASP ILE GLN MET THR GLN SER PRO ALA SER LEU SER ALA 1FDL 30SEQRES 2 L 214 SER VAL GLY GLU THR VAL THR ILE THR CYS ARG ALA SER 1FDL 3[…]SEQRES 1 H 218 GLN VAL GLN LEU LYS GLU SER GLY PRO GLY LEU VAL ALA 1FDL 47SEQRES 2 H 218 PRO SER GLN SER LEU SER ILE THR CYS THR VAL SER GLY 1FDL 48[…]SEQRES 1 Y 129 LYS VAL PHE GLY ARG CYS GLU LEU ALA ALA ALA MET LYS 1FDL 64SEQRES 2 Y 129 ARG HIS GLY LEU ASP ASN TYR ARG GLY TYR SER LEU GLY 1FDL 65[…]

- page 7 -

Page 8: ACADEMIE DE GRENOBLE · Web viewACADEMIE DE GRENOBLE Version du 2 avril 2003 SCIENCES DE LA VIE ET DE LA TERRE JOURNEE ACADEMIQUE TICE EN SVT CDDP de Valence ATELIER 13 : MODELISATION

POSITION DES ATOMES :

ATOM7

245 CB ALA L 34 0.627 18.438 19.831 1.00 10.63 1FDL 33

ATOM8

246 N TRP L 35 -1.521 20.584 19.140 1.00 26.21 1FDL 33

Agitation thermiqueFacteur d'occupation (1 / 0,5 / 0)

Coordonnée ZCoordonnée Y

Coordonnée XNuméro de l'acide aminé dans la chaîne

Chaîne à laquelle appartient l'acide aminéAcide aminé auquel appartient l'atome

Nom de l'atome (CB = carbone bêta)Numéro de l'atome

Les nom des atomes composant les acides aminés font référence à une nomenclature précise :- La première lettre indique la nature de

l'atome (N, C, O, S, H) ;- La deuxième lettre indique sa position par

rapport au carbone alpha (ou CA), qui est l'atome de carbone de la chaîne principale sur lequel vient se fixer la chaîne latérale. La nomenclature spécifie cette position par des lettres grecques (alpha, bêta, gamma, delta, epsilon, zêta, êta) ou leur équivalent dans l'alphabet latin (A,B,G,D,E,Z,H, informatique oblige!) :

- le carbone B (CB) est lié de façon covalente au CA ;- le carbone G (CG) est lié de façon covalente au CB ;- le CD est lié de façon covalente au CG ...

- Le chiffre permet de différencier deux atomes ayant la même position par rapport au carbone alpha.

LIAISONS :Aux résolutions habituelles (entre 3 et 1 Å), la nature de la liaison est déduite de la distance entre les atomes (1.52 Å pour une liaison simple C-C, ...). Aux résolutions sub-atomiques (au dessous de 0.5 Å, accessible essentiellement pour les petites molécules), on peut observer les électrons de valence et la déformation du nuage électronique et ainsi quantifier le nombre d'électrons mis en commun dans la liaison. C'est la nature des atomes, leur distance et l'orientation du donneur de proton qui permettent d'identifier la liaison hydrogène ; c'est la distance S-S (2.02 Å) qui permet d'identifier un pont disulfure.

Extrait de "Structures et fonctions des molécules biologiques" INRP 1997Un fichier de molécule (lisible avec un logiciel de traitement de textes) comporte trois parties- la première partie est une entête comportant la désignation de la molécule avec son origine (ex : IG*GL Fab Fragment

Mouse), l'auteur et la date de dépôt dans la banque, les références des publications relatives au sujet, des indications sur la résolution, les techniques et les incertitudes concernant l'identification et la position de certains atomes

- la deuxième décrit les séquences des différentes chaînes et leur désignation ainsi que le détail des structures secondaires (hélice, feuillets) et des liaisons inter et intrachàînes (ponts disulfure)

- dans la troisième partie, chaque atome est décrit par son type (atome, ou hétéro-atome pour désigner les molécules d'eau ou les ions associés à la molécule organique), son numéro d'ordre dans la séquence, son nom, le motif élémentaire (acide aminé ou nucléotide) auquel il appartient, la position du motif dans la séquence, les coordonnées de l'atome dans un système d'axes Ox, Oy, Oz.. Certaines connexions entre atomes sont parfois décrites.

Exemple:ATOM 1 CA GLU1 -0.021 -1.321 -0.079ATOM 2 O GLU1 1.149 -1.996 -0.079

../..CONECT 1 2 6 7CONECT 2 1 4Dans cet exemple, CA désigne le carbone alpha.

- page 8 -

Page 9: ACADEMIE DE GRENOBLE · Web viewACADEMIE DE GRENOBLE Version du 2 avril 2003 SCIENCES DE LA VIE ET DE LA TERRE JOURNEE ACADEMIQUE TICE EN SVT CDDP de Valence ATELIER 13 : MODELISATION

Les fichiers contenus dans les banques de données internationales sont des documents scientifiques souvent très volumineux. Ils doivent être aisément transmissibles. Ils ne renferment donc que l'information indispensable au chercheur. On ne doit donc pas s'étonner de trouver des molécules dans lesquelles les doubles et triples liaisons n'apparaissent pas. De plus les atomes d'hydrogène sont systématiquement absents (ainsi une molécule d'eau sera ramenée à son seul atome d'oxygène, un groupement N-H à N, etc.). En effet ceux-ci ne sont pas visibles par la diffraction des rayons X.

Sur de petites molécules, ces caractéristiques peuvent poser problème pour les élèves. C'est pourquoi, dans la banque à usage pédagogique, de nombreuses molécules sont pourvues de leurs hydrogènes.

"Structures et fonctions des molécules biologiques" INRP 1997

LA BANQUE DE DONNEES "PDB"

Extraits de "Structures et fonctions des molécules biologiques" INRP 1997La principale banque de données pour les protéines est la Protein Data Bank (PDB Brookhaven, Etats-Unis). Elle regroupe actuellement près de 1200 molécules. On y trouve :- des enzymes seules ou souvent complexées avec leur produit d'hydrolyse ou des molécules d'inhibiteurs susceptibles de

se fixer sur leur sites. La même molécule existe souvent sous la forme de plusieurs fichiers correspondant à des dates de publication différentes, avec différentes résolutions et degrés d'affinement de la structure. Certaines molécules (par exemple le lysozyme) existent sous de nombreuses formes résultant de mutagenèses dirigées (remplacement d'un acide aminé par un autre). On trouve aussi quelques enzymes de restriction

- des acides nucléiques sous forme de fragments courts souvent synthétiques et à un seul brin. Sont disponibles également quelques ARN de transfert et ARNM ,

- en immunologie, quelques exemples d'anticorps dont un seul est lié à son antigène : une immunoglobuline G de souris liée à une molécule de lysozyme de blanc d'oeuf de poule. Toutefois on trouve également des molécules de HLA (de Classe 1) liées ou non à de petits peptides, des molécules d'interleukines et d'interféron ;

- de nombreuses molécules fonctionnelles telles que des globines (myoglobine et hémoglobine) appartenant à différentes espèces ainsi que l'hémoglobine normale ou pathologique (sicklémique) et des cytochromes ,

- peu de molécules d'hormones : l'insuline et l'hormone de croissance (GH) seule molécule hormonale en association avec son récepteur.

En rapport avec l'enseignement actuel de la biologie, ces fichiers sont utilisables pour aborder les thèmes suivants : les acides nucléiques, porteurs d'une information génétique (avec des molécules d'ADN, d'ARNm), les protéines, leur structure, les rapports structure - fonction (avec l'insuline, l'hémoglobine oxydée et réduite, normale et drépanocytaire), les enzymes et la catalyse enzymatique (avec la carboxypeptidase ou d'autres enzymes), les rapports hormonerécepteur (avec l'hormone de croissance.), l'immunologie (avec les HLA et peptides du soi ou non soi), les protéines et l'évolution (avec les globines, notamment).

"Structures et fonctions des molécules biologiques" INRP 1997

Insistons sur le fait que la banque de données "pdb" est beaucoup plus qu'un simple lieu de stockage de fichiers. Il s'agit d'un dispositif de validation et de contrôle des publications scientifiques que constituent les modèles moléculaires.

QUE FAIT LE CHERCHEUR AVEC UN LOGICIEL DE MODELISATION MOLECULAIRE ?(exemple fourni par Dominique HOUSSET, Institut de biologie structurale)

Le chercheur compare la molécule observée avec d'autres molécules connues ayant des fonctions proches, avec des mutants de la même molécule, avec des substrats potentiels, des inhibiteurs…

Dominique Housset travaille sur le récepteur T pour comprendre comment celui-ci distingue des fragments peptidiques viraux présentés par le CMH.La séquence des gènes à l'origine des récepteurs T étant connue, il faut travailler sur des récepteurs T donnés et déterminer : Leur séquence et structure spatiale. L'interaction entre récepteur T / complexe CMH-antigène.

A l'écran (et maintenant en observation stéréoscopique), il s'agit de comparer les interactions correspondant à plusieurs récepteurs T pour savoir quelles sont les parties qui sont reconnues. On constate actuellement qu'un même CMH peut présenter deux peptides différents à un même récepteur T… (il semble d'ailleurs qu'un même récepteur T puisse reconnaître de manière spécifique… plusieurs centaines de peptides viraux différents !!!).

- page 9 -

Page 10: ACADEMIE DE GRENOBLE · Web viewACADEMIE DE GRENOBLE Version du 2 avril 2003 SCIENCES DE LA VIE ET DE LA TERRE JOURNEE ACADEMIQUE TICE EN SVT CDDP de Valence ATELIER 13 : MODELISATION

ANNEXESExtraits de "Structures et fonctions des molécules biologiques" INRP 1997

INTRODUCTIONNos conceptions actuelles sur les protéines remontent aux années 50 quand Pauling et Corey proposèrent pour la chaîne

polypeptidique des structures régulières répétitives ou périodiques comme l'hélice alpha et le brin bêta, modèles qu'ils publieront en 195 1, et quand Sanger détermina la séquence de l'insuline en 1953. Ce travail établira qu'à chaque protéine correspond une séquence unique d'acides aminés. Suivront la détermination des premières structures de protéines par Kendrew et Perutz, la myoglobine et l'hémoglobine publiées en 1959-1960, démontrant qu'une protéine possède une structure spatiale bien définie, comme l'avaient prédit Pauling, et non une multitude de structures désordonnées. En 1953 Watson et Crick publient leur modèle de double hélice pour la structure des acides désoxyribonucléiques.

C'est à Cyrus Levinthal que revient l'idée d'utiliser un ordinateur pour représenter un modèle de molécule et il jouera un rôle précurseur dans ce domaine. À cette époque, vers les années 60, les ordinateurs, impressionnantes machines installées dans des salles climatisées, étaient employés déjà pour les calculs scientifiques en particulier pour l'analyse des taches de diffraction des rayons X par les cristaux de protéines. Cependant on était encore loin de pouvoir représenter une molécule de plusieurs milliers d'atomes à partir des coordonnées de chaque atome, x, y, et z, et qui plus est de les faire tourner en temps réel sur un écran cathodique en couleur. Il faut en effet pouvoir recalculer les nouvelles coordonnées correspondant à l'angle de rotation que l'on a commandé, problème classique de géométrie analytique, en un minimum de 1/25 ème de seconde pour que l'oeil ait l'impression d'un mouvement continu. Depuis, la technologie des ordinateurs a beaucoup évolué et continue encore d'évoluer : on considère qu'actuellement la vitesse de calcul des processeurs est multipliée par 2 tous les ans, leur prix divisé par deux pendant la même période ainsi que celui des disques mémoires. Ce sont des instruments de travail qui se démodent vite !

Les ordinateurs sont maintenant devenus indispensables pour le traitement et la diffusion des donnés expérimentales en Biologie en raison de leur nombre et des calculs que ces données nécessitent. Grâce à eux on peut avoir accès par le réseaux Internet aux diverses bases de données : séquences d'acides nucléiques, d'acides aminés, structures de protéines même pour les plus récentes. Le nombre de séquences de protéines a été multiplié par 15 lors de la dernière décennie et celui des structures par 5 pendant la même période.

Pour qui se rappelle la période de lente acquisition des donnés cristallographiques - il a fallu près de 20 ans à Kendrew pour établir celle de la myoglobine, plus de 30 ans à Dorothy Hodgkin pour obtenir la structure de la première hormone, l'insuline - la détermination d'une structure de protéine tient encore du merveilleux. Pourtant nous ne devons pas nous laisser abuser par ce merveilleux et perdre de vue que ce sont des modèles.

Un modèle est une représentation symbolique simplifiée d'un objet ou d'un ensemble d'objets, d'un processus, afin d'en étudier les propriétés, et pour les molécules invisibles à nos yeux, de les voir, un point si essentiel pour nous. Cette représentation est forcément approximative, pensons au plan d'une maison par exemple que l'on fait avant de la construire, cela permet d'en évaluer les proportions relatives, les espaces disponibles pour chaque pièce selon leur destination, mais, attention, ce n'est pas la maison, le dessinateur peut faire des erreurs, l'architecte peut se tromper sur l'harmonie des proportions ou plus simplement les négliger pour satisfaire à d'autres besoins techniques ou économiques.

La modélisation d'une protéine par exemple dépend de la qualité des données expérimentales fournies par les rayons X et toutes les parties de la molécule ne sont pas connues avec la même précision. Des erreurs sont possibles, la première structure de la protéase du SIDA, était fausse, les auteurs s'étaient trompés dans le trajet de la chaîne polypeptidique à travers le canevas de la densité électronique. Bien sûr cette erreur a été rapidement corrigée par d'autres laboratoires.

Enfin, la modélisation pour être perceptible à nos sens implique l'utilisation d'une symbolique pour la représentation, des traits pour les murs d'une maison, un trait joignant deux petites sphères pour une liaison covalente entre deux atomes. Quelle différence avec la représentation des atomes uniquement par des sphères dont le rayon, dit de Van der Waals, correspond approximativement à la zone d'exclusion des électrons des autres atomes ! Pourtant cette représentation « plus réaliste » que celle en bâtonnets et petites sphères, nous empêche de voir la connectivité entre atomes et entre résidus d'acides aminés. La symbolique de modélisation est donc très marquée par notre capacité de voir et de comprendre, cela doit nous rendre modestes devant nos modèles.

Les modèles sont fabriqués non pour les contempler, bien que les modèles de protéines et d'acides nucléiques aient une certaine esthétique si les couleurs sont bien choisies, mais pour nous permettre de prédire des propriétés. Par exemple de la structure d'un enzyme avec un inhibiteur, on déduira la nature et la position des acides aminés en contact avec l'inhibiteur, donc du substrat de l'enzyme. Ces prédictions doivent être confrontées aux propriétés de l'enzyme en solution, comme la nature de la catalyse, acide-base par exemple, ou l'effet des mutations ponctuelles de remplacement d'acides aminés sur la spécificité et la vitesse enzymatique.

On peut alors s'apercevoir que des remplacements éloignés du site actif peuvent aussi perturber l'activité enzymatique, leur interprétation peut conduire à modifier l'idée d'un site actif rigide (modèle de la clé et de la serrure) pour y introduire d'autres propriétés de la protéine comme ses propriétés dynamiques ou ses propriétés de repliement. Quand un modèle n'est pas assez prédictif, alors il faut le modifier, le compléter le plus souvent, c'est comme cela que progresse l'analyse et la maîtrise du réel sans oublier qu'en dernier ressort la démarche scientifique repose toujours sur des modèles, si élaborés soient-ils.

La biologie structurale est actuellement en plein essor, elle fournit de nombreuses clés pour comprendre le vivant, l'origine de ses dysfonctions et heureusement parfois elle permet de leur apporter un remède. On peut ici citer la mise au point récente d'un nouveau médicament contre le SIDA : un inhibiteur de la protéase qui est responsable de l'activation des protéines du virus. Cela a été acquis grâce à la structure connue de la protéase et aux simulations

- page 10 -

Page 11: ACADEMIE DE GRENOBLE · Web viewACADEMIE DE GRENOBLE Version du 2 avril 2003 SCIENCES DE LA VIE ET DE LA TERRE JOURNEE ACADEMIQUE TICE EN SVT CDDP de Valence ATELIER 13 : MODELISATION

numériques d'amarrage au site actif de nombreux dérivés d'inhibiteurs conçus par ordinateur (méthode quantitative de relation entre structure et activité ou QSAR en anglais) afin de choisir les dérivés les plus actifs pour les essais in vitro puis in vivo.

Sans l'outil informatique on n'aurait pas pu arriver si vite à une telle mise au point, qui a demandé deux ou trois ans à peine. Comme pour la conception des voitures ou des avions, les industries pharmaceutiques mettent au point des produits où l'outil informatique joue un rôle de plus en plus essentiel et incontournable.

C'est ainsi une toute nouvelle technologie qui se met en place -, souhaitons qu'elle nous aide à mieux participer aux processus de l'évolution en inventant par exemple des protéines encore inconnues à activités thérapeutiques ou biotechnologiques. Je pense ici au projet récemment rapporté par le directeur scientifique d'une société de biotechnologie, de synthétiser par voie chimique un enzyme d'oxydoréduction constitué uniquement d'acides aminés de la série D en prenant comme modèle l'enzyme naturel constitué d'acides aminés de la série L. Cet enzyme sera insensible aux enzymes protéolytiques naturels tout en conservant ses propriétés de catalyse, comme par exemple l'élimination des radicaux libres en cas de choc septique ou de complications liées à la transfusion sanguine. Ceci n'est qu'un exemple parmi d'autres et il faut s'attendre à bien des innovations qui ne manqueront pas de modifier notre manière de vivre.

Jean GARNIERProfesseur invité à l'Université de Boston et au National Institute of Health Bethesda, Juin 1996

Extraits de "Structures et fonctions des molécules biologiques" INRP 1997 (suite)

Première partieQuelques repères

1. La marche des idéesLa science moderne traite d'objets invisibles tels que les molécules dont les détails atomiques et l'organisation ne peuvent

être révélés par les microscopes électroniques les plus puissants. Or, la compréhension de nombreux mécanismes biologiques passe par l'établissement de représentations précises de leur structure. Ce n'est qu'en 1959-1960, grâce au perfectionnement des techniques permettant l'exploration des molécules, notamment la diffraction des rayons X, que Kendrew décrit la première structure détaillée d'une protéine (myoglobine du cachalot) avec une résolution de 0,2 nm, et que Perutz propose celle de l'hémoglobine. Ce sont les premiers modèles de structure tertiaire qui leur valent à tous les deux le Prix Nobel de Chimie en 1962.

Il faut remonter jusqu'à 1953 pour que, avec Sanger, on ne considère plus les protéines comme des « particules colloïdales », mais comme de grosses molécules chimiquement définies. Etudiant l'insuline, rare protéine obtenue à l'époque dans un état de pureté satisfaisant, il pose par hypothèse qu'elle doit son activité biologique à sa nature polypeptidique. En appliquant des techniques d'hydrolyse ménagée, de marquage de l'acide aminé situé à l'extrémité NH2 des petits polypeptides obtenus, puis les techniques de la chromatographie, il identifie la séquence des deux chaînes et met un an pour localiser les trois ponts disulfure il obtient le Prix Nobel de Physiologie en 1958.

L'idée est alors de considérer que toutes les protéines comportent une séquence définie et stable de leurs acides aminés et que deux protéines peuvent différer par leurs propriétés biologiques si leurs séquences sont différentes.

Or, par des mesures et des calculs, on se rend compte que la protéine n'est pas un simple alignement d'acides aminés. De plus, elle est cristallisable (l'hémoglobine a été la première protéine cristallisée en 1864) et sa forme de cristallisation est constante. Ceci suppose que sa molécule n'est pas désordonnée et que sa configuration est très stable.

C'est en 1950 que Pauling montre l'importance des liaisons hydrogène dans cette stabilité. En 1951 Astbury, Pauling et Corey font l'hypothèse que le nombre de configurations possibles est restreint. Ils proposent des modèles pour une chaîne de L-acides aminés : une conformation hélicoïdale d'une part, la structure en feuillet bêta d'autre part. Ces structures furent toutes deux trouvées plus tard dans de nombreuses protéines.

Par ailleurs, en 1953, exploitant les figures de diffraction aux rayons X obtenues par Franklin et Wilkins, Crick et Watson proposent le modèle de l'ADN en double hélice. En 1966, Philips décrit la structure du lysozyme, première enzyme a être analysée en détail. À partir de cette période, de nombreuses molécules biologiques, surtout de nature protéique, seront explorées.

On arrive ainsi à l'idée que la fonction biologique d'une molécule protéique résulte non seulement de sa séquence mais aussi de sa structure tridimensionnelle. La séquence peut d'ailleurs varier mais conduire à une même structure spatiale. Ainsi, les chaînes alpha et bêta de l'hémoglobine chez les mammifères ont jusqu'à 70 % de différences au niveau de leur séquence et présentent des conformations quasiment superposables. En fait, les formes adoptées par les chaînes polypeptidiques dans l'espace amènent au voisinage les uns des autres un petit nombre d'acides aminés, parfois très éloignés dans la séquence, et qui constituent à eux seuls les sites essentiels de l'activité moléculaire.

- page 11 -