43
1 Détermination de la structure 3D d'une protéine à partir de données de RMN B.

1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

Embed Size (px)

Citation preview

Page 1: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

1

Détermination de la structure 3D d'une protéine à partir de données de RMN

B.

Page 2: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

2

B. Détermination de la structure 3D d'une protéine à partir de données de RMN

I. Contraintes RMN utilisées pour les calculsII. Les méthodes de modélisation moléculaire appliquées aux peptides et

protéinesIII. Evaluation de la qualité des structures

Plan du Cours

A. Principes de la modélisation moléculaireI. GénéralitésII. Représentation empirique de l'énergie moléculaireIII. Les méthodes de calculs empiriques

1. Algorithmes de minimisation d'énergie2. Dynamique moléculaire

Page 3: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

3

I.Contraintes RMN utilisées pour les calculs

B.

Page 4: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

4

1. Contraintes de distances déduites des NOEs

Intensités des pics NOEs obtenues à partir des spectres NOESY

Intensité NOE (ij)= interactions dipôle-dipôle entre deux protons i et j où d(ij) ≤ 5 Å

ij j

i

ij

ijij= vitesse de relaxation croiséeij= vitesse de relaxation longitudinalei, j = rapports gyromagnétiques des protons i et j

La vitesse de relaxation croisée est reliée à la distance interproton rij par:

ij

0

4

224

10

6c

1 42c2

rij

6

Intensité des pics NOE proportionnelle à

1

rij6

Page 5: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

5

1. Contraintes de distances déduites des NOEs

-temps de corrélation (c) moyenné-phénomène de diffusion de spin

Imprécision sur les distances déduites du volume des NOEs

Solutions

2. Contraintes de distances introduites avec une marge d'erreur(20-25%) par rapport aux valeurs déterminées.

d ± d

1. Définition de classes de contraintes

Exemple :

Fort 1.8 -> 2.6 Å Moyen 2.6 -> 3.8 Å Faible 3.8 -> 5.0 Å

Introduction d'intervalles de valeurs possibles [dmin-dmax]

Page 6: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

6

2. Contraintes angulaires déduites des constantes de couplage

Différents jeux de coefficients (A, B, C) ont été proposés dans la littérature :

Les coefficients (A = 6.4, B = 1.4 et C = 1.9) proposés par Pardi et al. sont habituellement utilisés pour les peptides et les protéines

Page 7: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

7

Imprécision sur la mesure des constantes de couplage

Imprécision sur l'angle de torsion

Solution

Contraintes angulaires introduites sous la forme d'un intervalle d'angles limites déterminés à partir des mesures de constantes de couplage

2. Contraintes angulaires déduites des constantes de couplage

± (°)

J ± J (Hz)

Page 8: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

8

Vitesse d'échange 1H/2D des protons amides+ détermination des éléments de structures secondaire

Localisation possible des liaisons H

3. Autres contraintes

a. Liaison Hydrogène

Introduction sous forme de contraintes de distance :

N H O C

dHN-O = 2 Å

dHN-O

dN-O = 3 Å

dN-O

Page 9: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

9

Certains programmes ne considèrent pas les ponts disulfure comme une structure covalente

3. Autres contraintes

b. Ponts disulfure

Introduction sous forme de contraintes de distance :

dS-S = 2,1 Å

dS-S

H2C S S CH2

dC1-S2 = dC2-S1 = 3,1 Å

dC1-S2

dC2-S1

Page 10: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

10

4. Prise en compte des contraintes RMN

Introduction sous forme de termes énergétiquess'ajoutant à ceux du champ de forces

Lorsque l'intervalle autorisé d'une contrainte n'est pas respecté,augmentation du terme énergétique auquel appartient la contrainte violée

Etotal = Eliés + Enon_liés+ Edistances + EPHI

Page 11: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

11

4. Prise en compte des contraintes RMN

a. Termes énergétiques des contraintes de distances

Potentiel carré ("square")

Utilisation d'un intervalle de distances limites [dmin-dmax] :si dmin < d < dmax

si d < dmin alors d0 = dmin

ou d > dmax alors d0 = dmax

dmin,dmax = limites inférieures et supérieures de l'intervalle de distancede la contrainte imposée

Edistancesquare 0

Edistancesquare kdistance d d0 2

Potentiel carré adouci ("soft-square")

Utilisé lorsque la distance risque d'êtrelargement en-dehors de l'intervalle autorisé

a, b = constantes déterminées automatiquementc = pente du potentiel asymptotiqueen général softexp = 1

Edistancesoft a

b

d d0 soft exp

c d d0

Page 12: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

12

4. Prise en compte des contraintes RMN

b. Termes énergétiques des contraintes angulaires

• Potentiel carré

si intervalle angulaire respecté

si intervalle angulaire non respecté

EPHIsquare0

EPHI

squarekPHI 0 2

Page 13: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

13

II.Les méthodes de modélisation

moléculaireappliquées aux peptides et protéines

B.

Page 14: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

14

2 grandes familles :

1. Méthodes dites de "géométrie des distances"

Objectif:déterminer rapidement un jeu de structures qui

satisfassent les données expérimentales

2. Méthodes de dynamique sous contraintesObjectifs: optimiser les structures d'une façon plus efficace

Les méthodes de modélisation appliquées aux peptides et protéines

Page 15: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

15

1. Méthodes dites de "géométrie des distances"

Méthodes de géométrie des distances= méthodes permettant de calculer les positions dans l'espace d'un ensemble de pointsà partir d'un jeu de distances mesurées entre ces points

2 types de méthodes :a. Méthode de la matrice métrique (utilisant les coordonnées cartésiennes)b. Méthode de la fonction cible (utilisant les angles dièdres)

Page 16: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

16

1. Méthodes dites de "géométrie des distances"

a. Méthode de la matrice métrique

Problématique

Si on connaît les coordonnées cartésiennes des atomesTrouver l'ensemble des distances= problème solvable

Si on n'a qu'un jeu de distances données (souvent incomplet)Remonter aux coordonnées cartésiennes= problème non trivial

Car pour N atomes: 3N coordonnées et N(N-1)/2 distances

Ex. pour 10 atomes: 30 coordonnées et 45 distances

Pour décrire correctement la structure, il faudrait connaître les 45 distances

algorithme mathématique (algorithme "d'embedding")permettant le passage d'un ensemble de distancesà un objet tridimensionnel représenté en coordonnées cartésiennes

Page 17: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

17

1. Méthodes dites de "géométrie des distances"

a. Méthode de la matrice métrique

Principe

Calcul des valeurs propres de la matrice de distances (matrice métrique)Gij = ri.rj

où ri, rj : vecteurs position des atomes i et j

Un ensemble de distances correspond à un objet tridimensionnelssi la matrice métrique est de rang 3= elle possède 3 valeurs propres non nulles

Théorème fondamental

Page 18: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

18

1. Méthodes dites de "géométrie des distances"

a. Méthode de la matrice métrique

Mise en oeuvre

1ère étape: construction de la matrice de distances

en pratique, on ne dispose pas de toutes les distances entre atomes introduction des informations sur la géométrie covalente:

- longueurs de liaison = distances entre atomes consécutifs- angles de valence = distances entre atomes séparés par 2 liaisons

2ème étape: L'ensemble de ces informations est représenté sous forme de 2 matrices de valeurs possibles :

-Lij : matrice de limites inférieures-Uij : matrice de limites supérieures

pour les distances inconnues, on fixe:- une limite supérieure = 999 Å - une limite inférieure = somme des rayons de van der Waals (1.8 Å)

introduction des distances H…H déduites des NOEs

Page 19: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

19

1. Méthodes dites de "géométrie des distances"

a. Méthode de la matrice métrique

Mise en oeuvre

3ème étape: ajustement des valeurs des matrices ("bond smoothing")

application de principes géométriques (inégalités triangulaires)

4ème étape: construction d'une 3ème matrice par tirage aléatoireentre les bornes des intervalles définis par les 2 matrices précédentes

Lij ≤ Dij ≤ Uij

5ème étape: application de l'algorithme d'"embedding"pour construire la structure tridimensionnelle

plus de 3 valeurs propres non nulles

les 3 valeurs propres les plus élevées sont sélectionnéespour obtenir les coordonnées cartésiennes

distances non exactes

les structures obtenues ne ressemblent que de façon très lointaineà des structures de protéines (violations structurales)

Page 20: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

20

1. Méthodes dites de "géométrie des distances"

a. Méthode de la matrice métrique

Mise en oeuvre

6ème étape: phase d'optimisation

= minimisation d'une fonction cible

E = O si Lij ≤ Dij ≤ Uij

dans le cas contraire

Remarque

plusieurs tirages aléatoires effectués

obtention d'une famille de structures tridimensionnelles

ajout possible de termes supplémentaires-pour tenir compte des informations sur les angles PHI-pour fixer la chiralité des groupements chiraux

E kij Bij

2 Dij2

2

ij

Page 21: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

21

1. Méthodes dites de "géométrie des distances"

a. Méthode de la matrice métrique

Exemples de programmes

DISGEO (Havel, 1984)DSPACE (Nerdal, 1986)EMBED, VEMBED (Kuntz, 1989)DGEOM (Blaney, 1990)DGII (Havel, 1991)XPLOR/DG (Brünger, 1992)

Page 22: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

22

1. Méthodes dites de "géométrie des distances"

a. Méthode de la matrice métrique

Avantage

Inconvénients

permet de calculer rapidement un grand nombre de structuresqui satisfont aux données expérimentales

violations observées= données précises (ex. longueurs de liaison)= données incertaines (contraintes issues de la RMN) imperfections au niveau de la géométrie covalente

inversion locale ou globale du repliement possible pour une partie des structures analyse fine des structures acquisition d'un plus grand nombre de donnéespour trancher entre les 2 familles

1ère génération de logiciels (DSPACE, DGEOM)= biais dans le tirage aléatoire des distances espace conformationnel mal exploré2ème génération de logiciels (DGII, XPLOR/DG)= meilleur échantillonnage de l'espace conformationnel

Page 23: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

23

1. Méthodes dites de "géométrie des distances"

b. Méthode de la fonction cible

Principe

Faire évoluer la structure 3D d'une moléculed'une conformation aléatoire vers une conformation satisfaisant l'ensemble des données RMN

longueurs de liaison, angles de valence, angles plans peptidiques = fixesseuls degrés de liberté = angles dièdres (, , 1, … n)

Mise en oeuvre

1ère étape: tirage aléatoire d'un jeu d'angles dièdres (, , 1, … n)avec possibilité de restriction dans zones de structure secondaire connues(choix de couples (, ) avec valeurs caractéristiques)

Page 24: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

24

1. Méthodes dites de "géométrie des distances"

b. Méthode de la fonction cible

Mise en oeuvre

•Dij : matrice des distances•Lij : matrice de limites inférieures•Uij : matrice de limites supérieures•Rij : matrice de la somme de van der Waals des atomes i et j

où (x) = 0 si x < 0 et (x) = 1 si x > 0

•2ème étape: calcul d'une fonction cible :

T tient compte- des contraintes issues de la RMN- des rayons de van der Waals

T Dij Uij Lij Dij

i j Lij Dij Rij Dij

i j Rij Dij

Page 25: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

25

1. Méthodes dites de "géométrie des distances"

b. Méthode de la fonction cible

Mise en oeuvre

•3ème étape: minimisation de la fonction cible

structures respectant à la fois les données de RMN et les contraintes de vdw

= détermination des jeux d'angles dièdres pour avoir des valeurs minimales de T

Lors de la minimisation, contraintes expérimentales introduites progressivement :1. effets intrarésiduels2. effets séquentiels3. effets à longue distance

on construit d'abord les structures locales puis le repliement global

Remarque

ajout possible de termes supplémentairespour tenir compte des informations sur les angles PHI

plusieurs tirages aléatoires effectués

obtention d'une famille de structures tridimensionnelles

Page 26: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

26

1. Méthodes dites de "géométrie des distances"

b. Méthode de la fonction cible

Exemples de programmes

DISMAN (Braun, 1985)DIANA (Günter, 1991)

Avantage

Inconvénients

permet de calculer rapidement un grand nombre de structuresqui satisfont aux données expérimentaleset dont la géométrie covalente est respectée

méthodes efficacessi jeu de données = grand nombre de contraintes précises de courte distancesinon diminution du % de structures satisfaisantes (structures avec violations)

utilisation d'une géométrie fixe biais dans l'échantillonnage de l'espace conformationnel

Page 27: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

27

1. Méthodes dites de "géométrie des distances"

c. Comparaison des deux méthodes

Avec un même jeu de données, résultats similaires résultat remarquablecar méthodes travaillant dans des directions opposées :

Conclusion

méthodes de matrice métrique= génèrent la structure globalementavec les contraintes prises simultanément

caractéristiques générales des structures obtenuesindépendantes des procédures de calcul

méthodes de fonction cible= construisent la structure localementen intégrant progressivement les effets

Page 28: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

28

1. Méthodes dites de "géométrie des distances"

d. Exemple de structures issues du programme DIANA

Page 29: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

29

2. Méthodes de dynamique moléculaire sous contraintes

Principe

Introduction de termes supplémentairesdans la fonction d'énergie potentielle du champ de forcespour prendre en compte les données expérimentales

Apport de ces méthodes

contrainte entre deux atomes= force qui les éloigne ou les rapprochepour que distance les séparant dans l'intervalle déterminé expérimentalement

amélioration de la qualité de l'espace conformationnel défini par le champ de forces= meilleur description des interactions interatomiques(liaisons, angles, vdw, …) amélioration de la distribution des angles dièdres

amélioration de la qualité de l'exploration de l'espace conformationnel rectification possible d'un mauvais repliement

Page 30: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

30

2. Méthodes de dynamique moléculaire sous contraintes

Mise en oeuvre

application directe de ces techniques à la détermination de la structure de protéines= approche longue et coûteuse en temps de calcul1. génération d'un premier jeu de structures par les méthodes de géométrie des distances2. raffinement des structures par dynamique moléculaire

méthodes se distinguant par-l'utilisation de différentes températures-le poids relatif géométrie covalente/contraintes expérimentales-la nature du champ de forces utilisé

3 types d'approches :a. dynamique moléculaire à basse t°b. dynamique moléculaire à haute t°c. recuit simulé

Page 31: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

31

2. Méthodes de dynamique moléculaire sous contraintes

a. Dynamique moléculaire à basse t°

premières dynamiques moléculaires :T = 300 Kpoids faible des contraintes expérimentales (/géométrie covalente)

dynamiques longues (50 à 100 ps) espace conformationnel mal exploré bonne prise en compte des fluctuations des atomes autour de leur position d'équilibre

Page 32: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

32

2. Méthodes de dynamique moléculaire sous contraintes

Protocole en 3 phases:1. chauffage2. équilibration à haute t°

= recherche de la conformation la plus favorable3. refroidissement lent

bons résultats si repliement des structures de départ correct !

b. Dynamique moléculaire à haute t°

Augmentation de la température à T = 600 ou 1000 K= augmentation de Ecinétique des atomesmeilleure exploration de l'espace conformationnelnécessité d'augmenter les constantes de force sur la structure covalente(liaison peptidique)

Page 33: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

33

2. Méthodes de dynamique moléculaire sous contraintes

c. Recuit simulé

même principe que précédemment+ fonctions des termes d'énergie simplifiées :

- plus de terme électrostatique- terme de vdw simplifié (terme répulsif) :

si r < rmin

dans le cas contraire

= champ de forces ne décrit plus les forces s'exerçant sur les atomesmais maintient juste la géométrie covalente

Evdw

rep krep r rmin 2

Evdwrep 0

Page 34: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

34

2. Méthodes de dynamique moléculaire sous contraintes

c. Recuit simuléExemple de protocole:

temps (ps)0

T(°K)

1000

4 8 12 16 20 24 28 32

Minimisation

Exploration conformationnelle

krep = 0.01 kcal

temps (ps)

Chauffage

0

kNOE

E(kcal)

32

4 8 12 16 20 24 28 32

4

E(kcal)

krep

Augmenta° vdwkrep -> 4 kcal Refroidissement Minimisation

Page 35: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

35

2. Méthodes de dynamique moléculaire sous contraintes

c. Recuit simulé

exploration de l'espace conformationnel beaucoup plus poussée

rectification possible d'inversions topologiques

= méthode générale pour le raffinement des structures(RMN ou RX)

Page 36: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

36

d. Exemple de structures DIANA raffinées avec X-PLOR

2. Méthodes de dynamique moléculaire sous contraintes

Page 37: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

37

III.Evaluation de la qualité des

structures

B.

Page 38: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

38

1. Energie intramoléculaire

L'énergie intramoléculaire (ETOT) doit être la plus basse possible(négative, en principe)

Vérifier que Ebond, Eangle et Etorsion sont faibles= géométrie covalente correcte

Exemple:

Energies liées à la géométrie (kcal.mol-1) struc. DIANA struc. X-PLOREliaison

359.6 ± 188.8 10.4 ± 0.6Eangles 157.3 ± 36.5 153.8 ± 4.8Edièdres 378.0 ± 20.8 85.4 ± 3.2Eimpropres 6.02 ± 0.04 2.2 ± 0.2Evdw 103 ± 569.7 -332.6 ± 5.3

(-92.3; 2379.4)Eélec. 0.3 ± 0.25 -0.1 ± 0.3

Energies liées aux contraintes expérimentales (kcal.mol-1)ENOE 3841 ± 697 24.7 ± 4.0EPHI 25.9 ± 11.2 2.0 ± 0.6

Page 39: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

39

2. Respect des contraintes expérimentales

Les structures doivent respecter au mieux les contraintes expérimentales

Ne sont conservées que les structures présentant- des violations de distances inférieures à 0.5 Å (voire 0.2 Å)- des violations d'angles inférieures à 10°

par rapport aux intervalles fixés

Page 40: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

40

3. Diagramme de Ramachandran

La distribution des couples (PHI, PSI) ne doit pas trop s'écarterdes zones stériques permises

en particulier pour les éléments de structure secondaire bien définis

feuillet

hélice d

Conformations les plus observées

Conformations permises

Page 41: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

41

4. Convergence des structures

Calcul de l'écart quadratique moyen(RMSD : Root Mean Square Deviation)

de chaque structurepar rapport à une structure moyenne

Valeur globale de RMSD < 1 Å = bonne convergence des structures

Valeurs faibles de RMSD= bonne structuration du squelette= orientation privilégiée des chaînes latérales

Valeurs élevées de RMSD = régions flexibles ou mal définies

RMSD

xi xmoy 2

N

Page 42: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

42

4. Convergence des structures

Exemple :

Page 43: 1 Détermination de la structure 3D d'une protéine à partir de données de RMN B

43

5. Calculs en retour

impossible d'obtenir tous les NOEs erreur sur l'intensité de ces NOEs à cause de

- la diffusion de spin- mouvements de la protéine en solution)

programmes de recalcul du spectre NOESYà partir des distances interprotons mesurées sur la structureen tenant compte

- de la diffusion de spin- d'approximations sur les mouvements de la protéine

Exemples de programmes

CORMA (Keepers, 1984)IRMA (Boelens, 1988)MARDIGRAS (Borgias, 1990)X-PLOR (Brünger, 1990)

comparaison cartes expérimentale/simulée amélioration du jeu de données nouvelle modélisation