Download pdf - Modélisation Multi-échelle: Modélisation des

1

Modélisation Multi-échelle:

Modélisation des Macromolécules biologiques

Séance 2 (1H30)

Cours de Master M2 Isabelle Navizet

[email protected] Laboratoire Modélisation et Simulation Multi-Echelle

(MSME)

2

Résumé du cours 1: La Modélisation Moléculaire :

Pourquoi ?

•  Déterminer la configuration atomique d’un système.

•  Évaluer des propriétés physico-chimiques du

système étudié.

•  Pour les protéines: interactions avec des ligands

(médicaments, polluants, poisons, chromophores…)

•  Prédiction

•  Visualisation des protéines (VMD TP1)

3

Phase condensée réelle Modèle

Résultats expérimentaux

Propriétés calculées

Prédictions théoriques

Expériences Simulations numériques

Théories: solutions analytiques

Analyse de spectres

complexes

Comparaison Comparaison Ajustement des potentiels d’interaction

Test des modèles Affinement des théories

Modélisation

•  Description microscopique des molécules en phase condensée •  Calculs de propriétés inaccessibles par l’expérience •  Simulation d’expériences et de réactions chimiques et biologiques •  Visualisation des structures et de leur dynamique

4

Les différentes étapes des études de Modélisation

Moléculaire

•  Le choix du système de coordonnées •  Le choix de la description des

interactions •  Le choix de la méthode de calcul •  L’analyse des résultats

5

Le système de coordonnées

•  Coordonnées cartésiennes : x, y, z •  Coordonnées internes : longueurs des

liaisons, angles de valence et angles de torsion.

•  Réseau granulaire : carbones α

Résidu i i+1 i-1

χ

6

Descriptions des interactions •  Mécanique Quantique (résolution de

l’équation de Schrödinger) - Traite les électrons d’un système: résolution de l’équation de

Schrödinger

- Limitée à des systèmes comportant un faible nombre d’atomes

•  Mécanique Moléculaire (méthode à champ de forces), méthode dite « classique »

- Détermination de la fonction d’énergie potentielle ou champ de forces qui décrit les interactions atomiques inter- et intramoléculaires

7

Mécanique moléculaire - Ignore le mouvement des électrons - Calcule l’énergie d’un système comme une fonction des positions

des noyaux uniquement. - Ne peut pas casser ou créer de liaisons covalentes

- Dédiée aux systèmes comportant un grand nombre d’atomes

- Basée sur une fonction d’énergie potentielle empirique (ou champ de force)

- Basée sur - L’approximation de Born-Oppenheimer (adaptation instantanée des e- aux mouvements des noyaux)

- Modèles d’interactions simples

Energie potentielle d’interaction:

•  De façon générale, l’énergie potentielle d’interaction total de N particules :

•  r représente la position de la particule i, •  u1 représente l’énergie potentielle due à un champ extérieur au système de

particules, comme la gravité, un champ électrique …, •  u2 correspond aux interactions d’une paire de particules •  u3 représente les interactions d’un triplet de particules et ainsi de suite.

⇒ approximation à 2 corps : énergie potentielle effective les forces dérivent de l’énergie potentielle Ui,

8

!

!

Energies potentielles polyatomiques

•  Termes d’énergie liée : liaison entre les atomes

•  Termes d’énergie non liée : pas de liaison entre les atomes

9

Molécules rigides •  Si petite molécule : structure considérée comme rigide •  Exemple de l’eau: TIP3P, TIP4P:

3 points pour TIP3P (1 oxygène et 2 atomes d’hydrogène) 4 points pour TIP4P (1 O, 2 H et un point M fictif sur la médiane entre les deux H) •  Pour TIP3P, la charge partielle négative localisée sur O est contrebalancée par

les charges partielles positives localisées sur les H. •  Pour TIP4P, la charge localisée sur M est contrebalancée par les charges

localisées sur les H. •  Les interactions de van der Waals entre deux molécules d’eau sont calculées

comme des interactions de Lennard-Jones (cf interaction intermoléculaires) entre les oxygène. Aucune interaction de van der Waals n’est prise en compte faisant intervenir les H.

(https://fr.wikipedia.org/wiki/Modèle_d'eau) 10

Champsdeforcepourl’eau

h1p://www1.lsbu.ac.uk/water/water_models.html

Anexample:TIP3PmodelkC,theelectrostaCcconstant:332.1Å·kcal/molqiaretheparCalchargesrijisthedistancebetweentwoatomsorchargedsites;AandBaretheLennard-Jonesparameters.ThelenghtO-HandangleHOHarefixed.Differentmodels:Thechargedsitesmaybeontheatomsorondummysites(suchaslonepairs).Inmostwatermodels,theLennard-JonestermappliesonlytotheinteracConbetweentheoxygenatoms

Molécule flexible •  L’énergie intramoléculaire d’une molécule flexible provient

de quatre termes : -l’énergie de liaison (élongation) -l’énergie due à l’angle de pliage -l’énergie due à l’angle dièdre (entre deux plans) -l’énergie de longue portée entre atomes voisins (potentiel effectif de type Lennard-Jones ). •  Ainsi, lorsque l’on s’attache à décrire des molécules

articulées il est important d’intégrer ces degrés de liberté interne représentés par l’élongation, la flexion et la torsion.

12

1) L’élongation

!

13

!

2) Le pliage Uθ= ½ kθ ( θ - θo)2

!

14

3) La torsion

!15

!Uϕ =

Vn,ϕ2[1+ cos(nϕ +γ )]

n=0

N

∑

• Vn donne une idée sur la hauteur de la barrière (il manque les termes non liés 1,4 qui contribuent aussi à la hauteur de la barrière). • n est la multiplicitée : il donne le nombre de minima de la fonction entre 0 et 2π. • γ est le facteur de phase : il donne la valeur de φ pour laquelle la fonction est maximale.

Energie de torsion

• Ethane CH3-CH3 n=3, γ=0°,

• VHCCH= V (1+cos(3φ)) Ethylène CH2=CH2 n=2, γ=180°, VHCCH= V (1+cos(2φ-180))

•  CH2X-CH2X VXCCX= V1+V2+V3

Torsion impropre

•  Parfois, il est également nécessaire d’introduire un autre potentiel lié à la torsion dite impropre (mouvement d’un atome dans un plan formé par trois autres).

17

!

202

1 )( www -= kEimpropres

4) Potentiel longue porté

L’énergie de longue portée est introduite en utilisant un potentiel effectif (de type Lennard-Jones par exemple) entre atomes séparés par plus de trois liaisons

18

Potentiel intermoléculaire •  Forces répulsives : forces répulsives dues au recouvrement des nuages électronique, dont l’énergie potentielle décroît en r-1 à courte distance et exponentiellement à plus grande distance exp(-2r/a0). On l’appelle aussi interaction stérique. •  Forces attractives : On les décompose souvent en trois termes, qui des plus fortes aux plus faibles sont :

les interactions ioniques (200-500 kJ/mol) (en r-1), les liaisons hydrogène (»20 kJ/mol) et les forces de van der Waals (0.5-3 kJ/mol):

-les forces de dispersion (ou forces de London) attractives (interactions dipôle induit -dipôle induit). Le potentiel associé est en r-6. -les forces d’induction (forces de Debye) (interactions dipôle – dipôle induit). Le potentiel correspondant est en r-6. -les forces dipolaires (forces de Keesom) (interactions dipôle – dipôle). Le potentiel, directionnel, associé est en en r-3, et se ramène à un potentiel en en r-6 lorsque les molécules sont en rotation rapide (non directionnel).

19

Modélisation des interactions non polaires: Potentiel sphère dure (à gauche) et potentiel sphère

molle (à droite) pour α=12.

Potentiel carré (à gauche) ou σ 2=1,5σ1 et potentiel de Lennard-Jones 12-6 (à droite).

les valeurs attribuées la majorité du temps aux paramètres sont fonctions de l’état thermodynamique et de la propriété que l’on veut simuler.

Simple troncature

Troncature et déplacement

Problème à longue portée

Troncature et switch

Interactions électrostatiques

!

24

où les q sont les charges sur les sites i et j et ε0 est la permittivité du vide.

Calculs pour les longues portées car décroissance en r -1 : sommation d’Ewald

Remarques: Des facteurs correcteurs dans les interactions LJ et électrostatique sont pris en compte pour les interactions de type 1-4 (j=i+ 3, 3 liaisons entre i et j) pour compenser le fait que une partie est déjà prise en compte dans les angles dièdres et impropres. Pour inter 1-4: Dans les autres paires, ces facteurs sont égaux à 1.

25

ELJ = fijLJ eij

* rij*

rij

!

"##

$

%&&

12

− 2rij*

rij

!

"##

$

%&&

6!

"

##

$

%

&&

i< j∑ Eelec = fij

el qi qjε riji< j

∑

fijLJ =1/1.2 fij

el =1/ 2

26

Traitement du solvant

•  Solvant explicite : toutes les molécules de solvant sont modélisées

•  Solvant implicite : Generalized Born (GB) (contribution électrostatique du solvant

dans le terme énergétique)

∑ ⎟⎟⎠

⎞⎜⎜⎝

⎛−−

−

ji GB

jif

fqqe GB

,21 1 ε

κ

27

Champ de force ou potentiels d’interaction empirique

∑∑∑ +++−+−=φ

φ

θθ γφθθ

dièdres

n

anglesliaisonsl n

VkllkE )]cos(1[

2)()( ,2

02

0

∑< ⎟

⎟

⎠

⎞

⎜⎜

⎝

⎛⎟⎠

⎞⎜⎝

⎛−⎟

⎠

⎞⎜⎝

⎛+

ji ij

ij

ij

ijij

LJij r

rrref

6*

12*

* 2

∑<

+ji ij

jielij r

qqfε ∑ ⎟⎟

⎠

⎞⎜⎜⎝

⎛−−

−

ji GB

jif

fqqe GB

,21 1 ε

κ

Exemple du champs de force AMBER

28

20)( ωωω −=kEimpropres

∑ −=liaisons

lliaisons llkE 20)(

∑< ⎟

⎟

⎠

⎞

⎜⎜

⎝

⎛⎟⎟⎠

⎞⎜⎜⎝

⎛−⎟⎟

⎠

⎞⎜⎜⎝

⎛=

ji ij

ij

ij

ijij

LJijLJ r

rrrefE

6*

12*

* 2

∑<

=ji ij

jielijelec r

qqfEε

∑ ++=φ

φ γφdièdres

ndièdres n

VE )]cos(1[

2,

∑ −=θ

θ θθangles

angles kE 20)(

29

Paramétrisation d’un champ de forces champ de force = forme fonctionnelle + paramètres

Géométries obtenues par spectro. IR, micro-ondes ou par cristallo. R-X à basse température

→ liaisons l, angles θ, impropres ω

Potentiels de torsion et énergies conformationnelles relatives obtenus par différentes techniques expérimentales ou par calculs ab initio (MQ)

→ angles dièdres ϕ

Géométries et propriétés thermodynamiques (chaleurs latentes) obtenues par analyse de l’empilement cristallin

Propriétés thermodynamiques (densités, enthalpies de vaporisation) obtenues par simulation de liquides

→ paramètres de van der Waals σi σj

Potentiel électrostatique calculé en MQ en différents points autour de la molécule.

→ charges électrostatiques qi qj

D’autres données (fréquences de vibration, propriétés thermo.) peuvent aussi être utilisées

Les paramètres sont affinés graduellement de manière à reproduire de mieux en mieux les données.

30

Propriétés générales des champs de forces • Concept du type atomique : pour chaque atome, on décrit

- le numéro atomique

- le type d’hybridation (carbone sp3, sp2, …) → influence sur les paramètres géométriques

- l’environnement local (voisins) → influence sur les charges partielles

• "Transférabilité" Un champ de forces peut être utilisé pour toute une série de molécules

→ Non spécifique, généralisable → Évite d’avoir à redéfinir un champ de forces pour chaque molécule

• Un champ de force est empirique

→ Il n’existe pas de forme ‘correcte’ pour un champ de forces → C’est un compromis entre précision et efficacité de calcul

Modèle de l’atome unifié

!

31

Il est assez usuel de ne pas représenter l’ensemble des atomes d’une molécule, dit modèle tout atome, et de représenter un groupement d’atomes par un unique pseudo-atome « équivalent »

32

Représentation granulaire

Cα rc γ

Tout atome Trace Cα = sites Réseau élastique

33

Champ de force : réseau élastique

∑ −=ijressorts

ijij rrE 20)(21γ

i j

rij

rij0 : état natif

Cas des Protéines •  Pour pouvoir faire la modélisation des protéines et

appliquer un champs de force, il faut donc les coordonnées de l’ensemble des atomes de la protéine (et du ligand).

•  Dans la PDB, les atomes d’hydrogène ne sont pas marquer: il faut les rajouter.

•  Plusieurs logiciels existent pour cela: –  H++ (http://biophysics.cs.vt.edu/) –  Molprobity : http://molprobity.biochem.duke.edu/ Molprobity utilise Reduce pour ajouter les hydrogènes –  reduce

34

Protonation d’une protéine •  La protonation dépend du pH •  Les résidus acido/basiques (besoin des

pKa):

•  Le cas de l’histidine:

35

Fin cours 2, TP champs de force et

protonation des protéines

36

Pour aller plus loin: sommation d’Ewald

•  Difficile de prendre correctement en compte l'électrostatique à longue distance(convergence très lente avec r)

•  Calculs pour des systèmes périodiques (cristaux ou MD): V = Vdir + Vrec + V0

•  Description Physique: -Entourer chaque ion avec une distribution gaussienne de charges de signe opposé et de magnitude égale pour écranter les interactions -> convergence rapide à courte distance : Vdir -Ajouter une distribution de charge qui annule la précédente pour que le potentiel global soit identique à l'original -Cette distribution est sommée dans l'espace réciproque où elle est très rapidement convergeante : Vrec

37

38

39

• Les vecteur de l'espace réciproque ne sont pas sommés directement • Les charges sont repositionnée sur une grille tridimensionnelle par interpolation. • Cette grille subit une transformée de Fourier par un algorithme 3D FFT, le terme d'énergie réciproque est obtenu par sommation dans l'espace réciproque • Le potentiel sur chaque points de la grille est calculé par une transformation inverse, et en utilisant un facteur d'interpolation on obtient la force sur chaque atome.