1
Modélisation Multi-échelle:
Modélisation des Macromolécules biologiques
Séance 2 (1H30)
Cours de Master M2 Isabelle Navizet
[email protected] Laboratoire Modélisation et Simulation Multi-Echelle
(MSME)
2
Résumé du cours 1: La Modélisation Moléculaire :
Pourquoi ?
• Déterminer la configuration atomique d’un système.
• Évaluer des propriétés physico-chimiques du
système étudié.
• Pour les protéines: interactions avec des ligands
(médicaments, polluants, poisons, chromophores…)
• Prédiction
• Visualisation des protéines (VMD TP1)
3
Phase condensée réelle Modèle
Résultats expérimentaux
Propriétés calculées
Prédictions théoriques
Expériences Simulations numériques
Théories: solutions analytiques
Analyse de spectres
complexes
Comparaison Comparaison Ajustement des potentiels d’interaction
Test des modèles Affinement des théories
Modélisation
• Description microscopique des molécules en phase condensée • Calculs de propriétés inaccessibles par l’expérience • Simulation d’expériences et de réactions chimiques et biologiques • Visualisation des structures et de leur dynamique
4
Les différentes étapes des études de Modélisation
Moléculaire
• Le choix du système de coordonnées • Le choix de la description des
interactions • Le choix de la méthode de calcul • L’analyse des résultats
5
Le système de coordonnées
• Coordonnées cartésiennes : x, y, z • Coordonnées internes : longueurs des
liaisons, angles de valence et angles de torsion.
• Réseau granulaire : carbones α
Résidu i i+1 i-1
χ
6
Descriptions des interactions • Mécanique Quantique (résolution de
l’équation de Schrödinger) - Traite les électrons d’un système: résolution de l’équation de
Schrödinger
- Limitée à des systèmes comportant un faible nombre d’atomes
• Mécanique Moléculaire (méthode à champ de forces), méthode dite « classique »
- Détermination de la fonction d’énergie potentielle ou champ de forces qui décrit les interactions atomiques inter- et intramoléculaires
7
Mécanique moléculaire - Ignore le mouvement des électrons - Calcule l’énergie d’un système comme une fonction des positions
des noyaux uniquement. - Ne peut pas casser ou créer de liaisons covalentes
- Dédiée aux systèmes comportant un grand nombre d’atomes
- Basée sur une fonction d’énergie potentielle empirique (ou champ de force)
- Basée sur - L’approximation de Born-Oppenheimer (adaptation instantanée des e- aux mouvements des noyaux)
- Modèles d’interactions simples
Energie potentielle d’interaction:
• De façon générale, l’énergie potentielle d’interaction total de N particules :
• r représente la position de la particule i, • u1 représente l’énergie potentielle due à un champ extérieur au système de
particules, comme la gravité, un champ électrique …, • u2 correspond aux interactions d’une paire de particules • u3 représente les interactions d’un triplet de particules et ainsi de suite.
⇒ approximation à 2 corps : énergie potentielle effective les forces dérivent de l’énergie potentielle Ui,
8
!
!
Energies potentielles polyatomiques
• Termes d’énergie liée : liaison entre les atomes
• Termes d’énergie non liée : pas de liaison entre les atomes
9
Molécules rigides • Si petite molécule : structure considérée comme rigide • Exemple de l’eau: TIP3P, TIP4P:
3 points pour TIP3P (1 oxygène et 2 atomes d’hydrogène) 4 points pour TIP4P (1 O, 2 H et un point M fictif sur la médiane entre les deux H) • Pour TIP3P, la charge partielle négative localisée sur O est contrebalancée par
les charges partielles positives localisées sur les H. • Pour TIP4P, la charge localisée sur M est contrebalancée par les charges
localisées sur les H. • Les interactions de van der Waals entre deux molécules d’eau sont calculées
comme des interactions de Lennard-Jones (cf interaction intermoléculaires) entre les oxygène. Aucune interaction de van der Waals n’est prise en compte faisant intervenir les H.
(https://fr.wikipedia.org/wiki/Modèle_d'eau) 10
Champsdeforcepourl’eau
h1p://www1.lsbu.ac.uk/water/water_models.html
Anexample:TIP3PmodelkC,theelectrostaCcconstant:332.1Å·kcal/molqiaretheparCalchargesrijisthedistancebetweentwoatomsorchargedsites;AandBaretheLennard-Jonesparameters.ThelenghtO-HandangleHOHarefixed.Differentmodels:Thechargedsitesmaybeontheatomsorondummysites(suchaslonepairs).Inmostwatermodels,theLennard-JonestermappliesonlytotheinteracConbetweentheoxygenatoms
Molécule flexible • L’énergie intramoléculaire d’une molécule flexible provient
de quatre termes : -l’énergie de liaison (élongation) -l’énergie due à l’angle de pliage -l’énergie due à l’angle dièdre (entre deux plans) -l’énergie de longue portée entre atomes voisins (potentiel effectif de type Lennard-Jones ). • Ainsi, lorsque l’on s’attache à décrire des molécules
articulées il est important d’intégrer ces degrés de liberté interne représentés par l’élongation, la flexion et la torsion.
12
1) L’élongation
!
13
!
2) Le pliage Uθ= ½ kθ ( θ - θo)2
!
14
3) La torsion
!15
!Uϕ =
Vn,ϕ2[1+ cos(nϕ +γ )]
n=0
N
∑
• Vn donne une idée sur la hauteur de la barrière (il manque les termes non liés 1,4 qui contribuent aussi à la hauteur de la barrière). • n est la multiplicitée : il donne le nombre de minima de la fonction entre 0 et 2π. • γ est le facteur de phase : il donne la valeur de φ pour laquelle la fonction est maximale.
Energie de torsion
• Ethane CH3-CH3 n=3, γ=0°,
• VHCCH= V (1+cos(3φ)) Ethylène CH2=CH2 n=2, γ=180°, VHCCH= V (1+cos(2φ-180))
• CH2X-CH2X VXCCX= V1+V2+V3
Torsion impropre
• Parfois, il est également nécessaire d’introduire un autre potentiel lié à la torsion dite impropre (mouvement d’un atome dans un plan formé par trois autres).
17
!
202
1 )( www -= kEimpropres
4) Potentiel longue porté
L’énergie de longue portée est introduite en utilisant un potentiel effectif (de type Lennard-Jones par exemple) entre atomes séparés par plus de trois liaisons
18
Potentiel intermoléculaire • Forces répulsives : forces répulsives dues au recouvrement des nuages électronique, dont l’énergie potentielle décroît en r-1 à courte distance et exponentiellement à plus grande distance exp(-2r/a0). On l’appelle aussi interaction stérique. • Forces attractives : On les décompose souvent en trois termes, qui des plus fortes aux plus faibles sont :
les interactions ioniques (200-500 kJ/mol) (en r-1), les liaisons hydrogène (»20 kJ/mol) et les forces de van der Waals (0.5-3 kJ/mol):
-les forces de dispersion (ou forces de London) attractives (interactions dipôle induit -dipôle induit). Le potentiel associé est en r-6. -les forces d’induction (forces de Debye) (interactions dipôle – dipôle induit). Le potentiel correspondant est en r-6. -les forces dipolaires (forces de Keesom) (interactions dipôle – dipôle). Le potentiel, directionnel, associé est en en r-3, et se ramène à un potentiel en en r-6 lorsque les molécules sont en rotation rapide (non directionnel).
19
Modélisation des interactions non polaires: Potentiel sphère dure (à gauche) et potentiel sphère
molle (à droite) pour α=12.
Potentiel carré (à gauche) ou σ 2=1,5σ1 et potentiel de Lennard-Jones 12-6 (à droite).
les valeurs attribuées la majorité du temps aux paramètres sont fonctions de l’état thermodynamique et de la propriété que l’on veut simuler.
Simple troncature
Troncature et déplacement
Problème à longue portée
Troncature et switch
Interactions électrostatiques
!
24
où les q sont les charges sur les sites i et j et ε0 est la permittivité du vide.
Calculs pour les longues portées car décroissance en r -1 : sommation d’Ewald
Remarques: Des facteurs correcteurs dans les interactions LJ et électrostatique sont pris en compte pour les interactions de type 1-4 (j=i+ 3, 3 liaisons entre i et j) pour compenser le fait que une partie est déjà prise en compte dans les angles dièdres et impropres. Pour inter 1-4: Dans les autres paires, ces facteurs sont égaux à 1.
25
ELJ = fijLJ eij
* rij*
rij
!
"##
$
%&&
12
− 2rij*
rij
!
"##
$
%&&
6!
"
##
$
%
&&
i< j∑ Eelec = fij
el qi qjε riji< j
∑
fijLJ =1/1.2 fij
el =1/ 2
26
Traitement du solvant
• Solvant explicite : toutes les molécules de solvant sont modélisées
• Solvant implicite : Generalized Born (GB) (contribution électrostatique du solvant
dans le terme énergétique)
∑ ⎟⎟⎠
⎞⎜⎜⎝
⎛−−
−
ji GB
jif
fqqe GB
,21 1 ε
κ
27
Champ de force ou potentiels d’interaction empirique
∑∑∑ +++−+−=φ
φ
θθ γφθθ
dièdres
n
anglesliaisonsl n
VkllkE )]cos(1[
2)()( ,2
02
0
∑< ⎟
⎟
⎠
⎞
⎜⎜
⎝
⎛⎟⎠
⎞⎜⎝
⎛−⎟
⎠
⎞⎜⎝
⎛+
ji ij
ij
ij
ijij
LJij r
rrref
6*
12*
* 2
∑<
+ji ij
jielij r
qqfε ∑ ⎟⎟
⎠
⎞⎜⎜⎝
⎛−−
−
ji GB
jif
fqqe GB
,21 1 ε
κ
Exemple du champs de force AMBER
28
20)( ωωω −=kEimpropres
∑ −=liaisons
lliaisons llkE 20)(
∑< ⎟
⎟
⎠
⎞
⎜⎜
⎝
⎛⎟⎟⎠
⎞⎜⎜⎝
⎛−⎟⎟
⎠
⎞⎜⎜⎝
⎛=
ji ij
ij
ij
ijij
LJijLJ r
rrrefE
6*
12*
* 2
∑<
=ji ij
jielijelec r
qqfEε
∑ ++=φ
φ γφdièdres
ndièdres n
VE )]cos(1[
2,
∑ −=θ
θ θθangles
angles kE 20)(
29
Paramétrisation d’un champ de forces champ de force = forme fonctionnelle + paramètres
Géométries obtenues par spectro. IR, micro-ondes ou par cristallo. R-X à basse température
→ liaisons l, angles θ, impropres ω
Potentiels de torsion et énergies conformationnelles relatives obtenus par différentes techniques expérimentales ou par calculs ab initio (MQ)
→ angles dièdres ϕ
Géométries et propriétés thermodynamiques (chaleurs latentes) obtenues par analyse de l’empilement cristallin
Propriétés thermodynamiques (densités, enthalpies de vaporisation) obtenues par simulation de liquides
→ paramètres de van der Waals σi σj
Potentiel électrostatique calculé en MQ en différents points autour de la molécule.
→ charges électrostatiques qi qj
D’autres données (fréquences de vibration, propriétés thermo.) peuvent aussi être utilisées
Les paramètres sont affinés graduellement de manière à reproduire de mieux en mieux les données.
30
Propriétés générales des champs de forces • Concept du type atomique : pour chaque atome, on décrit
- le numéro atomique
- le type d’hybridation (carbone sp3, sp2, …) → influence sur les paramètres géométriques
- l’environnement local (voisins) → influence sur les charges partielles
• "Transférabilité" Un champ de forces peut être utilisé pour toute une série de molécules
→ Non spécifique, généralisable → Évite d’avoir à redéfinir un champ de forces pour chaque molécule
• Un champ de force est empirique
→ Il n’existe pas de forme ‘correcte’ pour un champ de forces → C’est un compromis entre précision et efficacité de calcul
Modèle de l’atome unifié
!
31
Il est assez usuel de ne pas représenter l’ensemble des atomes d’une molécule, dit modèle tout atome, et de représenter un groupement d’atomes par un unique pseudo-atome « équivalent »
32
Représentation granulaire
Cα rc γ
Tout atome Trace Cα = sites Réseau élastique
33
Champ de force : réseau élastique
∑ −=ijressorts
ijij rrE 20)(21γ
i j
rij
rij0 : état natif
Cas des Protéines • Pour pouvoir faire la modélisation des protéines et
appliquer un champs de force, il faut donc les coordonnées de l’ensemble des atomes de la protéine (et du ligand).
• Dans la PDB, les atomes d’hydrogène ne sont pas marquer: il faut les rajouter.
• Plusieurs logiciels existent pour cela: – H++ (http://biophysics.cs.vt.edu/) – Molprobity : http://molprobity.biochem.duke.edu/ Molprobity utilise Reduce pour ajouter les hydrogènes – reduce
34
Protonation d’une protéine • La protonation dépend du pH • Les résidus acido/basiques (besoin des
pKa):
• Le cas de l’histidine:
35
Fin cours 2, TP champs de force et
protonation des protéines
36
Pour aller plus loin: sommation d’Ewald
• Difficile de prendre correctement en compte l'électrostatique à longue distance(convergence très lente avec r)
• Calculs pour des systèmes périodiques (cristaux ou MD): V = Vdir + Vrec + V0
• Description Physique: -Entourer chaque ion avec une distribution gaussienne de charges de signe opposé et de magnitude égale pour écranter les interactions -> convergence rapide à courte distance : Vdir -Ajouter une distribution de charge qui annule la précédente pour que le potentiel global soit identique à l'original -Cette distribution est sommée dans l'espace réciproque où elle est très rapidement convergeante : Vrec
37
38
39
• Les vecteur de l'espace réciproque ne sont pas sommés directement • Les charges sont repositionnée sur une grille tridimensionnelle par interpolation. • Cette grille subit une transformée de Fourier par un algorithme 3D FFT, le terme d'énergie réciproque est obtenu par sommation dans l'espace réciproque • Le potentiel sur chaque points de la grille est calculé par une transformation inverse, et en utilisant un facteur d'interpolation on obtient la force sur chaque atome.