Master 1 Biochimie Isabelle MILAZZO UMR CNRS 6014 Equipe de Chimie Organique Biologique et...

Preview:

Citation preview

Master 1 Biochimie

Isabelle MILAZZOUMR CNRS 6014

Equipe de Chimie Organique Biologique et Structurale

Modélisation

à partir de données expérimentales de RMN

ModélisationMoléculaire

Stratégie générale de la détermination de la structure 3D de polypeptides

Attribution des fréquences de résonanceMesure des paramètres structuraux RMN

Structure secondaireContraintes de distancesContraintes angulaires

Calcul de structures initialesGéométrie des distances

Raffinement des structuresDynamique Moléculaire

(recuit simulé)Structures finales

Analyse RMN

A. Principes de la modélisation moléculaireI. GénéralitésII. Représentation empirique de l'énergie moléculaireIII. Les méthodes de calculs empiriques

1. Algorithmes de minimisation d'énergie2. Dynamique moléculaire

B. Détermination de la structure 3D d'une protéine à partir de données de RMN

I. Contraintes RMN utilisées pour les calculsII. Les méthodes de modélisation moléculaire appliquées aux peptides et

protéinesIII. Evaluation de la qualité des structures

Plan du Cours

I.Généralités

Modélisation Moléculaire = regroupement de différentes techniques pour

Qu'est-ce que la Modélisation Moléculaire ?

calcul graphisme

construire visualiser manipuler

analyser

des molécules

Calculs

Les calculs peuvent être effectués :

-soit sur une station de travail en local (calculs courts)

- soit sur un cluster de processeurs ou un CRAY (calculs longs)

• Visualisation infographique et dessin de moléculesà partir de données structurales et par l'utilisation d'un système informatique

• Utilisation de champs de forces empiriques pour déterminer les propriétés moléculaires ainsi que les distances intra- et inter-atomiques

• Corrélation entre des propriétés moléculaires et une structure moléculaire donnée

• Evaluation de la validité d'une structure moléculaire

• Obtention d'informations sur les mouvements dynamiques des molécules et sur leurs énergies

• Utilisation de banques de donnéespour identifier des systèmes moléculaires avec des points communs

• Application de la représentation infographique à la reconnaissance de molécules issues de chimie organique, bio-organique et médicale ainsi que des sciences des matériaux

Objectifs de la Modélisation Moléculaire

• Simuler une réaction chimique

• Simuler le mouvement des atomes d'hydrogène avec précision

• Simuler le comportement d'une molécule à très basse température

Ce que la Modélisation Moléculaire ne peut pas faire …

Principe Général de la Modélisation Moléculaire

molécule

Environnement(solvant, macromolécule, ...)

Etat d'équilibre molécule-environnement = minimum d'énergie E

E contient 3 termes :1- Einterne (molécule)2- Einteractions (molécule-environnement)3- Esolvant (environnement)

1. Méthodes quantiques ab initio

Molécules concernées : petites molécules ou fragments moléculaires

Nb d'atomes : ~ 10

Objectif : déterminer l'énergie et la distribution électronique-> Energies moléculaires calculées avec l'équation de Schrödingeravec le formalisme des orbitales moléculaires.

Principe :- on ne traite que des électrons : les noyaux sont considérés comme fixes(approximation de Born-Oppenheimer)-résolution de l'équation de Schrödinger sans approximation

Méthodes de calcul

2. Méthodes quantiques semi-empiriques

Molécules concernées : molécules de taille moyenne

Nb d'atomes : ~ 100

Objectif : déterminer l'énergie et la distribution électronique

Principe :- idem méthodes ab initiomais on ne regarde que les électrons de valence-résolution de l'équation de Schrödinger avec approximations

Méthodes de calcul

3. Méthodes empiriques

Molécules concernées : molécules de grande tailleType de molécules : Hydrocarbures, Polymères, Protéines, Acides nucléiques, Membranes, Polysaccharides, ...

Nb d'atomes : > 100 et < 10 000

Objectif : déterminer les minimas de l'énergie globale d'interaction (réduite à Einterne)

Principe :- Molécule = billes + ressorts (forces harmoniques)associés à une série de fonctions de potentiel :

Etot = Eparam1 + Eparam2 + Eparam3 + Eparam4 + ...

La somme de ces fonctions est exprimée sous la forme d'un champ de forces moléculaire ("force field")

Méthodes de calcul

II.Représentation empirique de l'énergie moléculaire

Notions de Structure Moléculaire

Etotal = Eliés + Enon_liés

1. Energies d'interactions entre atomes liés

a. Déformation du squelette

Elongation des liaisons Ebond kb(b b0)2

liaisons

C=C, kb = 570 kcal/mol.Å2, b0 = 1.229 Å

C-C, kb = 310 kcal/mol.Å2, b0 = 1.526 Å

0

50

100

150

200

250

300

0 0,5 1 1,5 2 2,5

longueur de liaison (Å)

E (

kcal/m

ol)

1. Energies d'interactions entre atomes liés

a. Déformation du squelette

Distorsion des angles de valence

Eangle k( 0 )2

anglesvalence

1. Energies d'interactions entre atomes liés

b. Energie de torsion

Etorsion k 1 cos(n ) angletorsion

0

0,5

1

1,5

2

2,5

0 60 120 180 240 300 360

E

ici, k=1, n=3 et =0

1. Energies d'interactions entre atomes liés

c. Energie des angles impropres

Eimpropres k ( 0)2

impr

0,0E+00

2,0E+04

4,0E+04

6,0E+04

0 60 120 180 240 300 360

°

E (

kca

l/m

ol)

atome A de type sp2, =0

AX

Y

Z

atome A de type sp3, =35.26°

2. Energies d'interactions entre atomes non liés

a. Energie d'interactions électrostatiques

Eélec 1

40r

qiqj

riji, j Loi de Coulomb

0 = permittivité du vide (0 = 1)r = permittivité relative

qiqi

0

0

-600

-400

-200

200

400

600

1 2 3 4

distance interatomique (Å)

E (

kcal/m

ol)

qiqj > 0

qiqj < 0

2. Energies d'interactions entre atomes non liés

a. Energie d'interactions électrostatiques

Calcul des charges qi et qj

À partir de méthodes ab initio ou semi-empiriques

• Del Ré:calcul des charges sur les liaisons de type (sigma)

• Gasteiger-Marsili:calcul des charges sur les liaisons de type (sigma) et (pi)fait appel à la notion d'électronégativité

• Hückel:calcul des charges sur les liaisons de type fait appel à la notion d'électronégativité

• Gasteiger-Hückel:associe le calcul des charges par la méthode de Gasteiger-Marsiliet celui des charges par Hückel

• Pullman:associe le calcul des charges par la méthode de Del Réet celui des charges par la méthode de Hückelplus adapté pour les peptides et les protéines

2. Energies d'interactions entre atomes non liés

b. Energie d'interactions de van der Waals

Evdw A ij

rij12

Bij

rij6i,j

Potentiel de Lennard-Jones

terme répulsif terme attractif

att

ract

ion

répu

lsio

n

r

E

3. Notion de champ de forces

Champ de forces = ensemblefonctions d'énergie potentielle+ paramètres numériques (constantes de forces, valeurs d'équilibre, etc.)obtenus expérimentalement ou évalués théoriquement

Exemples de champs de forces pour les molécules biologiques:

AMBER (Kollman, 1981) peptides, acides nucléiques SYBYL, ...(Assisted Method Building and Energy Refinement)CHARMM (Karplus, 1983) mo. biologiques, macromo., QUANTA, X-PLOR, CNS

interactions petites mo.-macromo.(Chemistry at HARvard Macromolecular Mechanics)ECEPP (Scheraga, 1983) peptides et protéines INSIGHT(Empirical Conformational Energy Program for Peptides)CVFF (Hagler, 1985) INSIGHT(Consistent Valence ForceField)

3. Notion de champ de forces

Extraits du champ de forces CHARMM

BOND CT1 C 250.000 {SD= .034} 1.490 ! ALLOW ALI PEP POL ARO ! Ala Dipeptide ab initio calc's (LK) fixed from 10/90 (5/91) BOND CT1 CT1 222.500 {SD= .036} 1.500 ! ALLOW ALI ! alkane update, adm jr., 3/2/92 BOND CT2 C 250.000 {SD= .034} 1.490 ! ALLOW ALI PEP POL ARO ! Ala Dipeptide ab initio calc's (LK) fixed from 10/90 (5/91) BOND CT2 CT1 222.500 {SD= .036} 1.538 ! ALLOW ALI ! alkane update, adm jr., 3/2/92 BOND CT2 CT2 222.500 {SD= .036} 1.530 ! ALLOW ALI ! alkane update, adm jr., 3/2/92 BOND CT3 C 250.000 {SD= .034} 1.490 ! ALLOW ALI PEP POL ARO ! Ala Dipeptide ab initio calc's (LK) fixed from 10/90 (5/91) ...

ANGLE CT1 CT1 C 52.00 {SD= .075} 108.0000 ! ALLOW ALI PEP POL ARO ! Alanine Dipeptide ab initio calc's (LK) ANGLE CT1 CT1 CT1 53.35 {SD= .074} 111.0000 UB 8.000 2.561 ! ALLOW ALI ! alkane update, adm jr., 3/2/92 ANGLE CT1 CT2 CT1 58.35 {SD= .071} 113.5000 UB 11.160 2.561 ! ALLOW ALI ! alkane frequencies (MJF), alkane geometries (SF) ANGLE CT2 CT1 C 52.00 {SD= .075} 108.0000 ! ALLOW ALI PEP POL ARO ! Alanine Dipeptide ab initio calc's (LK) ...

DIHEDRAL C CT1 NH1 C .20 {SD= 1.217} 1 180.0000 ! ALLOW PEP ! ala dipeptide update for new C VDW Rmin, adm jr., 3/3/93c DIHEDRAL C CT2 NH1 C .20 {SD= 1.217} 1 180.0000 ! ALLOW PEP ! ala dipeptide update for new C VDW Rmin, adm jr., 3/3/93c DIHEDRAL CT1 C NH1 CT1 MULTIPLE= 2 1.60 1 .0000 ! ALLOW PEP ! Revised to adjust NMA cis/trans energy difference. (LK) 2.50 2 180.0000 ! ALLOW PEP ! Gives appropriate NMA cis/trans barrier. (LK) DIHEDRAL CT1 CT1 NH1 C 1.80 {SD= .406} 1 .0000 ! ALLOW PEP ! ala dipeptide update for new C VDW Rmin, adm jr., 3/3/93c ...

IMPROPER NH1 X X H 20.00 {SD= .122} 0 .0000 ! ALLOW PEP POL ARO ! NMA Vibrational Modes (LK) IMPROPER NH2 X X H 4.00 {SD= .272} 0 .0000 ! ALLOW POL ! adm jr., 8/13/90 acetamide geometry and vibrations IMPROPER O CT1 NH2 CC 45.00 {SD= .081} 0 .0000 ! ALLOW PEP POL ! adm jr., 8/13/90 acetamide geometry and vibrations IMPROPER O CT2 NH2 CC 45.00 {SD= .081} 0 .0000 ! ALLOW PEP POL ! adm jr., 8/13/90 acetamide geometry and vibrations IMPROPER O CT3 NH2 CC 45.00 {SD= .081} 0 .0000 ! ALLOW PEP POL ! adm jr., 8/13/90 acetamide geometry and vibrations IMPROPER O NH2 CT1 CC 45.00 {SD= .081} 0 .0000 ! ALLOW PEP POL ! adm jr., 8/13/90 acetamide geometry and vibrations IMPROPER O NH2 CT2 CC 45.00 {SD= .081} 0 .0000 ! ALLOW PEP POL ! adm jr., 8/13/90 acetamide geometry and vibrations ...

3. Notion de champ de forces

Extraits du champ de forces CHARMM

Représentation des états d'énergie

= puits d'énergie

III.Les méthodes de calculs

empiriques

2 grandes familles :

1. Mécanique moléculaire (minimisation de l'énergie)Objectif:- déterminer les minimas de l'énergie globale d'interaction(réduite à Einterne)

2. Dynamique moléculaireObjectifs: - simuler les mouvements intramoléculaires- optimiser les structures d'une façon plus efficace

Les méthodes de calcul empiriques

III.1.Algorithmes de

minimisation d’énergie

déterminer les minimas de l'énergie globale d'interaction

(réduite à Einterne)

Algorithmes de minimisation d’énergie

coor. arbitraire

unit

é d

'énerg

ie a

rbit

rair

e

Objectif

Algorithmes de minimisation d’énergie

PrincipeEtant donné une fonction (une ou plusieurs variables indépendantes),trouver la valeur de la (ou des) variables(s) pour lesquelles la valeur de la fonctionest la plus faible= si la fonction est continue ou dérivable :

- dérivée première nulle

Deux types de mimima possibles :

Remarque

Pas de méthode de minimisation pour déterminer le minimum global détermination uniquement du minimum local le plus proche

coor. arbitraire

unit

é d

'énerg

ie a

rbit

rair

e- minimum global : valeur la plus faible de la fonction

- minima locaux : valeur minimum de la fonction dans un voisinage fini

F(xi )

xi

0

2F(xi)

xi2

0

- dérivée seconde positive

Principe

Soit une fonction F(x,y,z)Il s'agit de trouver un nouveau jeu de coordonnées (x',y',z') tel que

F(x',y',z') < F(x,y,z)

algorithmes itératifs qui, à chaque étape, déterminent un pointoù la fonction a une valeur plus faible

Différents types de méthodes :1. Méthodes directes

(Simplex - Random Search - Grid)2. Méthodes des dérivées premières (utilisent uniquement la pente de la surface)

(Steepest Descent - Conjugate Gradient - Powell)3. Méthodes des dérivées secondes (utilisent la pente et la courbure de la surface)

(Newton-Raphson)

Algorithmes de minimisation d’énergie

Méthode Simplex

X2

X1

Principe

simplex = figure géométrique à N+1 sommets dans un espace à N dimensionsEx. 1: dans un plan, simplex = triangleEx. 2: dans un espace à 3 dim., simplex = tétraèdre

1

2

3

4

5

6

78

9

10 Problème !

Méthode Simplex

Avantage

méthode robuste (minimisation même de fonctions non continues)

Inconvénients

nombre important d'évaluations de la fonction taille mémoire prop. à N2 si N variables méthode peu efficace

utilisation pour rectifier une mauvaise géométrie de départ

Méthode de la plus grande pente ("Steepest Descent")

Principe

A chaque étape de l'itération, recherche la direction de descente maximale(ou plus grande pente)

On déplace x de x et on cherche F(x+x)

F(x x) F(x)

x

1!

dF(x)

dx

La direction x est dite direction de descente si x. F(x) < 0

Si x est suffisamment petit, F(x+x) écrite sous forme d'une série de Taylor :

F(x) x.F(x) F(x) = gradient de F(x)

Méthode de la plus grande pente ("Steepest Descent")

Avantage

Convergence rapide pour des structures loin du minimum

Inconvénient

Convergence lente autour du minimum (oscillation des directions)

utilisation sur les structures initiales dans les premières étapes de minimisationpour rectifier les mauvais contacts

Méthode du gradient conjugué

Principe

Même principe que méthode de Steepest Descentmais utilise l'information issue des itérations précédentespour définir plus finement la direction et le pas

Avantages

Accélère la convergenceEvite les oscillations autour du minimum

Inconvénient

Plus coûteuse en temps de calcul (x2 comparé à Steepest Descent)Inutilisable pour des structures présentant de mauvais contacts

Méthode de Powell

Principe

Même principe que méthode de Gradient Conjuguémais avec règles d'avancement supplémentaires

III.2.Dynamique moléculaire

Principes de base de la dynamique

Objectif

Simuler les mouvements des atomes à l'intérieur d'une molécule pour regarder les fluctuations autour d'un minimum

description thermodynamique du système étudié(entropie, énergie libre, chaleur spécifique, etc.)

pour passer d'un minimum d'énergie à un autre optimiser les structures de façon plus efficace

coor. arbitraire

unit

é d

'énerg

ie a

rbit

rair

e

T (Ec)

Principes de base de la dynamique

Remarque

ps ns s ms sEchelle de temps

Mouvements détectableslocaux

Dynamique moléculaire

globaux

repliementmouvements de domaines

Principe

Déplacement des atomes les uns par rapport aux autressous l'action d'un champ de forces reproduisant au mieuxl'ensemble de leurs interactions

Chaque atome est considéré comme une masse ponctuelledont le mouvement dépend et est déterminépar l'ensemble des forces exercées par tous les atomes en fonction du temps

Principes de base de la dynamique

Principe

Au temps t, chaque atome i, de vecteur position ri et de masse mi

obéit aux équations de mouvements de Newton :

dri(t)

dtvi(t)

Fi miai mi

dvi(t)

dtmi

dri2(t)

dt

La force Fi exercée sur l'atome i par les autres atomes est donnée par

Fi

V r1(t),r2(t),...,rN(t) ri(t)

où V = fonction de l'énergie potentielle totale d'interactionsauxquelles est soumise la molécule

Intégration de ces équations de mouvement évolution de chaque atome en fonction du temps = trajectoiresous forme d'une série de positions et de vitesses dans l'espace

Principes de base de la dynamique

Déroulement d'une dynamique

3 étapes :1. thermalisation2. équilibration 3. production

Types de dynamique

Dynamique dans le vide

Avantages

Plus grande simplicitéPlus grande rapidité de calculPermet un temps de dynamique plus long

Inconvénients

Simulation d'une molécule hors de son contexte normalAugmentation des interactions électrostatiques dans la moléculeImpossibilité de simuler les effets hydrophobes

Types de dynamique

Dynamique en présence de solvant

Avantages

Meilleure prise en compte de l'effet électrostatiquePossibilité de formation de liaison H avec le solvantPrise en compte (partielle) de l'effet hydrophobeMeilleure stabilité du système

Inconvénients

Evaluation de tous les termes plus longuesNe permet pas de longue dynamique

Exemple d'analyse d'une dynamique

Fluctuations

Calcul de l'écart quadratique moyen(RMSD : Root Mean Square Deviation)

de chaque structurepar rapport à une structure de référence

RMSD(x) xi xmoy 2

i1,N

N

Structure de référence :structure moyenne de la dynamique structure expérimentalestructure de départ

Exemple d'analyse d'une dynamique

Fluctuations

Exemple : Fluctuations lors d'une dynamique de 60 ps de la bactériorhodopsine

Recommended