PARTIE IV

PARTIE IV

Affinement du modèle

1. Principales EtapesClonage, expression,

purification

Cristaux

Données de diffraction

Interprétation biologique

Collecte et intégrationdes données

Phasage des réflexions

Affinementcristallographique

Cristallisation Questionbiologique

Analyse bioinformatique

Macromolécules de grande pureté

Structure atomique= MODELE

Carte de densité électronique

1. Principales Etapes

Phasage des réflexions avec lPhasage des réflexions avec l’’une des une des méthodes décritesméthodes décrites

Calcul dCalcul d’’une première carte de densité une première carte de densité électroniqueélectronique

Construction dConstruction d’’un premier modèle dans un premier modèle dans cette carte de densitécette carte de densité

AFFINEMENTAFFINEMENT : dernière étape avant : dernière étape avant validation et publication du modèlevalidation et publication du modèle

PRE-REQUISPRE-REQUIS : modèle doit être correct : modèle doit être correct

2. Rappels

(r) Fh

Facteurs de Structure

Transformation de Fourier

diffractiondiffraction

Transformée de Fourier

calculcalculModèlex,y,z,fj

Fcalc, calc

Structure dans le cristal

Fobs

expérienceexpérience Données de diffraction

Espace réelEspace réel Espace réciproqueEspace réciproque

Densité électronique

3. Objectifs

L’affinement du modèle est un processus cyclique L’affinement du modèle est un processus cyclique dont le BUT est l’optimisation du modèle issu de dont le BUT est l’optimisation du modèle issu de l’interprétation de cartes de densités électroniquel’interprétation de cartes de densités électronique

ObjectifObjectif : le modèle construit doit refléter le mieux : le modèle construit doit refléter le mieux possible l’ensemble des données expérimentalespossible l’ensemble des données expérimentales

Interprétation de la densité électronique

Construction d'un modèle atomique Affinement de la structure(module et phase)MODELE FINALMODELE FINAL

4. Principes

Minimisation de l’écart entre: Minimisation de l’écart entre:

- le modèle (xyz)- le modèle (xyz)

Fcalc

- les données de diffraction

Fobs

Plus Fcalc est proche de Fobs

Plus le modèle est proche de la structure réelle

C’est FC’est Fcalc calc qui est qui est modifiémodifié

(x,y,z,B) (x,y,z,B) modifiésmodifiés

OR FOR Fobs obs = constantes= constantesOR FOR Fobs obs = constantes= constantes

4. Principes

L’affinement est un problème délicatL’affinement est un problème délicat : : Nombre de données expérimentales mesurées est Nombre de données expérimentales mesurées est

souvent faible par rapport au nombre de paramètres à souvent faible par rapport au nombre de paramètres à optimiser (x, y, z, B)optimiser (x, y, z, B)

Ex FdhD: 1900 Atomes / Xtal Diffracte à 2.8ÅEx FdhD: 1900 Atomes / Xtal Diffracte à 2.8Å 7600 paramètres à définir / 8950 Réflexions uniques7600 paramètres à définir / 8950 Réflexions uniques

Le nombre important de paramètres à affinerLe nombre important de paramètres à affiner Le modèle initial peut être de qualité médiocre, Le modèle initial peut être de qualité médiocre,

importance de la phaseimportance de la phase La fonction à optimiser est complexe, non linéaire et La fonction à optimiser est complexe, non linéaire et

peut comporter plusieurs minima séparés par des peut comporter plusieurs minima séparés par des barrières énergétiquesbarrières énergétiques

Trouver une pondération adéquat entre les données Trouver une pondération adéquat entre les données cristallographiques et non-cristallographiquescristallographiques et non-cristallographiques

4. Principes

Considérations générales Importance de la résolution dans les

paramètres à affiner: 3.8 – 3.2Å : Coordonnées, Groupes de B, pas de solvant,

importance de NCS et d’calc si possible; Utilisation des angles

de torsion pour diminuer N

3.2 – 2.7Å : Bon modèle, Construction-reconstructions importantes, Groupes de B

2.7 – 2.2Å : Construction du modèle facile, B individuel, quelques molécules de solvant

2.2 – 1.4Å : Construction automatique, B individuel, bcp de solvant

<1.2Å : B anisotrope, Hydrogènes

4. Principes

Interprétation de la densité électroniqueInterprétation de la densité électronique

Construction, d'un modèle atomiqueConstruction, d'un modèle atomique(x,y,z)(x,y,z)

Optimisation des Optimisation des paramètresparamètresModèle x+Modèle x+ΔΔx, y+x, y+ΔΔy, z+y, z+ΔΔzz

MODELE FINALMODELE FINAL

Cartes de densité électroniqueCartes de densité électronique

FFobsobs calccalc, , obsobs

« Nouvelles » « Nouvelles » valeurs des Fvaleurs des Fcalccalc et et des phasesdes phases

5. Observations et paramètres

ObservationsObservations : tout ce qui est connu sur la : tout ce qui est connu sur la cristal avant l’étape d’affinementcristal avant l’étape d’affinement Paramètres cristallinsParamètres cristallins Modules des FModules des Fobsobs (nombre fixé) (nombre fixé) Stéréochimie des macromoléculesStéréochimie des macromolécules

ParamètresParamètres : à améliorer pendant le : à améliorer pendant le processusprocessus Positions atomiques (x,y,z) des atomes du Positions atomiques (x,y,z) des atomes du

modèlemodèle Paramètres de Paramètres de déplacements atomiquesdéplacements atomiques


Les paramètres de déplacements Les paramètres de déplacements atomiquesatomiques : :

Ils traduisent le désordre statique et dynamique Ils traduisent le désordre statique et dynamique

Désordre dynamiqueDésordre dynamiqueVibration d’un atome autour de sa position Vibration d’un atome autour de sa position d’équilibre, l’amplitude de ce mouvement est une d’équilibre, l’amplitude de ce mouvement est une fonction de la températurefonction de la température

Facteur d’agitation thermique w = exp (-Facteur d’agitation thermique w = exp (-BBjj(sin (sin θθ//λλ))22))

Désordre statiqueDésordre statiqueUn atome ou un groupe d’atomes n’occupent pas la Un atome ou un groupe d’atomes n’occupent pas la même position dans chaque maillemême position dans chaque maille

Facteur d’occupation Facteur d’occupation qqjj


Rappels : Facteurs de diffusion atomique

iode

53 fj en fonction de sin / à 0 Kfj en fonction de sin / à 0 K

sin / = 0 fj = Zfj diminue lorsque sin / augmente

86

carbone

résolution


Facteurs dFacteurs d’’agitation thermiqueagitation thermique

La taille du nuage électronique est indépendante de la La taille du nuage électronique est indépendante de la température température diffraction par un cristal indépendante de la diffraction par un cristal indépendante de la température ?température ?

En fait,En fait, les atomes vibrent autour d les atomes vibrent autour d’’une position dune position d’’équilibre équilibre position des atomes différente dans les mailles du cristal position des atomes différente dans les mailles du cristal « pseudo-taille » des atomes« pseudo-taille » des atomes

Plus la vibration thermale est grande, plus « la pseudo-taille » de Plus la vibration thermale est grande, plus « la pseudo-taille » de ll ’’atome est grandeatome est grande

ConséquencesConséquences

LL ’’intensité des rayons diffractés diminue lorsque intensité des rayons diffractés diminue lorsque augmente augmente

ffjj doit être multiplié par un facteur dépendant de la doit être multiplié par un facteur dépendant de la températuretempérature


Facteurs dFacteurs d’’agitation thermiqueagitation thermique- Les facteurs d- Les facteurs d’’agitation thermique (B) traduisent la vibration agitation thermique (B) traduisent la vibration dd ’’un atome autour de sa position dun atome autour de sa position d’’équilibreéquilibre- L- L’’amplitude du mouvement dépend de la températureamplitude du mouvement dépend de la température- Définition d- Définition d’’un facteur de diffusion atomique dépendant de la un facteur de diffusion atomique dépendant de la température :température :

8 B = 20 Å2

B = 0 Å2

B = 99 Å2

B = 0 Å2

Les valeurs élevées de B entraînent un affaiblissement rapide des intensités diffractées pour des valeurs croissantes de S


Facteurs dFacteurs d’’agitation thermiqueagitation thermique

Valeurs faibles(cœur hydrophobe)

Valeurs élevées(boucles flexibles)

Protéine

En généralEn général 5 5 ÅÅ22 < B < 50 < B < 50 ÅÅ22

Agitation isotrope

Molécule organique

Agitation anisotrope (différente dans les 3 directions de l ’espace) : ellipse

d’agitation (50 % de probabilité)

anisotropeanisotrope

isotropeisotrope


Paramètres variables Paramètres variables Les coordonnées (x,y,z)Les coordonnées (x,y,z) Les facteurs de température (B) désordre dynamiqueLes facteurs de température (B) désordre dynamique Les facteurs d’occupation (q) désordre statiqueLes facteurs d’occupation (q) désordre statique

Nécessité d'ajouter des informations Nécessité d'ajouter des informations supplémentairessupplémentaires

Résolution Réflexions Obs/ paramètres

3.0 51 300 1.12.7 70 410 1.52.5 88 700 2.82.0 173 200 3.6

ExempleExemple : ArgRS – ARNt P212121 a = 210.2 Å b = 146.2 Å c

= 86.1 Å (12 000 atomes, 170 kDa dans l’ua)

SafetSafety y factorfactor


Le rapport observations/paramètres est amélioré par ajouts Le rapport observations/paramètres est amélioré par ajouts d’informations supplémentaires :d’informations supplémentaires :

Diminuer Npar : affinement avec contraintesDiminuer Npar : affinement avec contraintes- Contrainte de certains paramètres à des valeurs fixes- Contrainte de certains paramètres à des valeurs fixes- Utilisation d’angle de torsion au lieu de positions x, y et z- Utilisation d’angle de torsion au lieu de positions x, y et z

Augmenter Nobs : affinement restreintAugmenter Nobs : affinement restreint- Permet à certains paramètres de varier autour d’un idéal:- Permet à certains paramètres de varier autour d’un idéal:

• Géométrie Géométrie - Longueur liaisons covalentes- Longueur liaisons covalentes- Angles liaisons covalentes- Angles liaisons covalentes- Angles de torsion- Angles de torsion- Contacts Van der Waals- Contacts Van der Waals

• Symétries non cristallographiquesSymétries non cristallographiques• Corrélation entre atomes liésCorrélation entre atomes liés


Distance Angle de liaison Angle dihédral

6. Procédures d’affinement

Comment ?Comment ? Définir une fonction d’énergie et trouver le Définir une fonction d’énergie et trouver le minimum de cette fonctionminimum de cette fonction

Espace conformationnel

E

E

minimumlocal

3 types d’algorithmes:

- Moindres carrés- Dynamique moléculaire- Maximum de vraisemblance

3 types d’algorithmes:

- Moindres carrés- Dynamique moléculaire- Maximum de vraisemblance

minimum


Méthode des moindres carrésMéthode des moindres carrés

Déterminer le minimum de la fonctionDéterminer le minimum de la fonction

AvecAvec

FFobsobs facteurs de structure observés = facteurs de structure observés = données de diffractiondonnées de diffraction FFcalccalc facteurs de structure calculés = facteurs de structure calculés = modèlemodèleK’ K’ facteur d’échellefacteur d’échelle wwhklhkl poids affecté à chaque réflexionpoids affecté à chaque réflexion

2) F K' F (w ψ hklcalc

lk,h,hklobs hkl



Ces méthodes ne permettent d’atteindre qu’un minimum localCes méthodes ne permettent d’atteindre qu’un minimum local Leur rayon de convergence est faibleLeur rayon de convergence est faible

Col+150



Ces méthodes ne permettent d’atteindre qu’un minimum localCes méthodes ne permettent d’atteindre qu’un minimum local Leur rayon de convergence est faibleLeur rayon de convergence est faible

Col+150


Méthode de dynamique moléculaireMéthode de dynamique moléculaireLe modèle est artificiellement chauffé à 3000°K puis Le modèle est artificiellement chauffé à 3000°K puis refroidi progressivement à 300°K (attribution d’une refroidi progressivement à 300°K (attribution d’une vitesse initiale aléatoire à chaque atome)vitesse initiale aléatoire à chaque atome)

= technique du = technique du « recuit simulé »« recuit simulé »

exploration d’une plus grande gamme de exploration d’une plus grande gamme de conformationsconformations

Fonction d’énergie totale de la moléculeFonction d’énergie totale de la molécule

EETOT TOT = E= EPOT POT + w E+ w EcrystcrystEETOT TOT = E= EPOT POT + w E+ w Ecrystcryst

EPOT dépend de la géométrie de la molécule

CNSCNS

2) F K' F ( w E hklcalc

lk,h,hklobs hklcryst


Col+150

Méthode dynamique moléculaireMéthode dynamique moléculaire

Obtention d’un minimum « vrai »Obtention d’un minimum « vrai » Le rayon de convergence est plus importantLe rayon de convergence est plus important


Col+150

Méthode dynamique moléculaireMéthode dynamique moléculaire

Obtention d’un minimum « vrai »Obtention d’un minimum « vrai » Le rayon de convergence est plus importantLe rayon de convergence est plus important


Maximum de vraisemblanceMaximum de vraisemblance

Méthode utilisée dans REFMAC5 (CCP4), Méthode utilisée dans REFMAC5 (CCP4), Phenix,… Phenix,…

Des programmes plus récents construisent une Des programmes plus récents construisent une fonction de vraisemblance avec les paramètres à fonction de vraisemblance avec les paramètres à affineraffiner

Les paramètres à définir sont décrits par des Les paramètres à définir sont décrits par des distributions de probabilitésdistributions de probabilités

Le maximum de vraisemblance utilise le Le maximum de vraisemblance utilise le théorème de théorème de BayesBayes


Théorème de BayesThéorème de Bayes

p(A;B) = probabilité que A soit vrai si B est vrai = 50% = 0.1/0.2 = p(A,B)/p(A)

De la même manière:p(B;A)=p(B,A)/p(B)

Théorème de Bayes:

p(B)=25%p(A)=20% p(A,B) = 10%


Méthode du maximum de vraisemblanceMéthode du maximum de vraisemblanceCC ’’est une technique qui, sous lest une technique qui, sous l’’hypothèse que les hypothèse que les

variables ont une distribution connuevariables ont une distribution connueusuellement la distribution normale ou gaussienneusuellement la distribution normale ou gaussienne

permet dpermet d’’estimer les paramètres destimer les paramètres d’’un modèle un modèle dd ’’une équation ou dune équation ou d’’un système, linéaire ou non linéaireun système, linéaire ou non linéaire

avec des restrictions sur ces paramètres ou nonavec des restrictions sur ces paramètres ou noncoefficients, matrice de variances et covariancescoefficients, matrice de variances et covariances

Plus spécifiquement la technique consiste à construire Plus spécifiquement la technique consiste à construire une fonction appelée fonction de vraisemblance une fonction appelée fonction de vraisemblance

construite à partir de la fonction de distributionconstruite à partir de la fonction de distribution et à maximiser son logarithme par rapport aux et à maximiser son logarithme par rapport aux

paramètres inconnus paramètres inconnus

7. Stratégies

Plusieurs cycles

affinement par recuit simuléaffinement par recuit simulé

Calcul de nouvelles cartes (2Fobs-Fcalc) et (Fobs-Fcalc)

Calcul de nouvelles cartes (2Fobs-Fcalc) et (Fobs-Fcalc)

Correction manuelle du modèleCorrection manuelle du modèle

Addition du solvant (eau, ions, ligands)

Addition du solvant (eau, ions, ligands)

7. Stratégies, TLS

Affinement de type TLS (Translation/Libration/Screw)Permet d’ajouter des éléments de

descriptions intermédiaire sans ajouter de nombreux paramètres

Description de domaines rigidesNombre de domaines au choix de l’utilisateur20 paramètres / domainePeut être utilisé à partir de 2Å de résolution (>2Å

dans le cas de NCS)

7. Stratégies, TLS

http://skuld.bmsc.washington.edu/~tlsmd/

8. Suivie de l’affinement

Les étapes de lLes étapes de l’’affinement sont suivies par le facteur affinement sont suivies par le facteur d’accord R d’accord R

atomes au hasard atomes au hasard R = R = 60 - 50 %60 - 50 % modèle de départmodèle de départ R = 40 – 50 %R = 40 – 50 % affinement à 2.5 Åaffinement à 2.5 Å R = R = 20 %20 % affinement à 1.5 Åaffinement à 1.5 Å R = R = 15 %15 % affinement petite moléculeaffinement petite molécule R = 4 - 8 %R = 4 - 8 % composé minéralcomposé minéral R = 1 – 2 %R = 1 – 2 %


Utilisation d’un facteur d’accord Rfree

Même définition que le facteur R mais utilise environ 1000 réflexions (1-5%; dépend de la résolution) qui sont prisent au hasard* et qui ne sont JAMAIS utilisées lors de l’affinement

Permet le bon suivie d’un affinement

Rfree > R: 5-7% à basse résolution <1% à très haute résolution

Règle +/- générale: Rfree ≈ (Résolution en Å)/10

*Sauf dans le cas de Twinning


Tableau synthétique après affinement:Tableau synthétique après affinement:

Collection de données

R/Rfree

RMSD Longueurs de liaison RMSD Angles de liaison

9. Pratique / Refmac5

Restrained refinementUnrestrainedRigid bodyStructure idealisationTLS & Restrained refinement

A tester en fin d’affinement

9. Pratique / Refmac5

FreeR

NCS

9. Pratique / Phenix

2 - 3Å en début d’affinement

<4.5Å de résolution

Refinement Target Weights:- Optimize Xray/Stereochemistry- A utiliser!

A utiliser à des résolutions modérées: 2 - 3 Å

Un fichier pdb

ATOM 4217 N PRO B 265 24.846 -10.676 50.273 1.00 27.45 N ATOM 4218 CA PRO B 265 25.497 -11.345 51.398 1.00 29.70 C ATOM 4219 C PRO B 265 27.029 -11.331 51.363 1.00 30.61 C ATOM 4220 O PRO B 265 27.648 -10.957 50.353 1.00 31.31 O ATOM 4221 CB PRO B 265 24.970 -12.783 51.286 1.00 30.01 C ATOM 4222 CG PRO B 265 23.648 -12.613 50.698 1.00 30.57 C ATOM 4223 CD PRO B 265 23.905 -11.584 49.610 1.00 27.97 C... ATOM 4225 N AGLU A 302 15.152 -18.914 10.502 0.50 26.16 N ATOM 4226 N BGLU A 302 12.994 -20.474 10.131 0.50 20.40 N ATOM 4227 CA AGLU A 302 13.786 -18.984 9.961 0.50 28.63 C ATOM 4228 CA BGLU A 302 14.025 -19.938 11.034 0.50 23.96 C ATOM 4233 CB AGLU A 302 12.738 -19.272 11.031 0.50 28.05 C ATOM 4234 CB BGLU A 302 13.943 -18.424 11.242 0.50 23.64 C ATOM 4235 CG AGLU A 302 12.865 -20.600 11.598 0.50 30.67 C ATOM 4236 CG BGLU A 302 14.204 -17.609 10.058 0.50 26.18 C ATOM 4237 CD AGLU A 302 14.041 -20.678 12.508 0.50 30.01 C ATOM 4238 CD BGLU A 302 13.205 -17.894 8.993 0.50 27.17 C ATOM 4239 OE1AGLU A 302 14.351 -19.670 13.194 0.50 29.80 O ATOM 4240 OE1BGLU A 302 12.000 -17.756 9.273 0.50 24.71 O ATOM 4241 OE2AGLU A 302 14.661 -21.746 12.513 0.50 32.25 O ATOM 4242 OE2BGLU A 302 13.645 -18.264 7.891 0.50 29.49 O ATOM 4229 C AGLU A 302 13.398 -17.758 9.186 0.50 28.71 C ATOM 4230 C BGLU A 302 14.003 -20.591 12.381 0.50 23.41 C ATOM 4231 O AGLU A 302 12.365 -17.149 9.487 0.50 28.75 O ATOM 4232 O BGLU A 302 13.996 -19.917 13.418 0.50 24.41 O

Numér

o d’

atom

e

Type

Résid

ue

Chain

e

Numér

o de

résid

u

X Y Z Occ B

IntermédiaireIntermédiaire IntermédiaireIntermédiaire

Bibliographie

Bibliographie

facile facile

méthodologique

Cristallisation des protéinesCristallisation des protéines

- - Crystallization of Biological macromolecules (1999). A. McPherson, Crystallization of Biological macromolecules (1999). A. McPherson, CSHL PressCSHL Press

- Crystallization of Nucleic acids and Proteins (1992). A. Ducruix, R. Giegé, The - Crystallization of Nucleic acids and Proteins (1992). A. Ducruix, R. Giegé, The Practical approach series, Practical approach series, IRL Press, Oxford University PressIRL Press, Oxford University Press

- Crystallization of Membrane proteins (1991). H. Michel, Boca Raton, - Crystallization of Membrane proteins (1991). H. Michel, Boca Raton, CRC PressCRC Press

Cristallographie des protéinesCristallographie des protéines

FacileFacile

- - Crystallography made crystal clear (1993). G. Rhodes. Crystallography made crystal clear (1993). G. Rhodes. Academic PressAcademic Press

- - Outline of crystallography for biologistOutline of crystallography for biologist (2002) D. Blow, (2002) D. Blow, Oxford University PressOxford University Press

- Crystal structure analysis (1992). Glusker et Trueblood, - Crystal structure analysis (1992). Glusker et Trueblood, Oxford University PressOxford University Press

Bibliographie

ThéorieThéorie

- - Protein crystallography (1976). T.L. Blundell, L.N. Johnson, Protein crystallography (1976). T.L. Blundell, L.N. Johnson, Academic PressAcademic Press

- X-ray structure determination (1989). G.H. Stout, L.H. Jensen, - X-ray structure determination (1989). G.H. Stout, L.H. Jensen, Wiley & SonsWiley & Sons

- Methods in Enzymology, volumes 276 et 277, - Methods in Enzymology, volumes 276 et 277, Academic PressAcademic Press

IntermédiaireIntermédiaire

- - Macromolecular crystallography (1997). C.W. Carter, R.M. SweetMacromolecular crystallography (1997). C.W. Carter, R.M. Sweet

- Introduction to macromolecular crystallography (2003). A. McPherson - Introduction to macromolecular crystallography (2003). A. McPherson Wiley-LissWiley-Liss

- Principles of protein X-ray crystallography (1994). J. Drenth, - Principles of protein X-ray crystallography (1994). J. Drenth, Springer-VerlagSpringer-Verlag

MéthodologiqueMéthodologique

- - Practical protein crystallography (1997). C. Carter, R. Sweet. Practical protein crystallography (1997). C. Carter, R. Sweet. Academic PressAcademic Press

Bibliographie

Documents

PARTIE IV