Upload
buzz
View
27
Download
0
Embed Size (px)
DESCRIPTION
PARTIE IV. Affinement du modèle. Clonage, expression, purification. Analyse bioinformatique. Macromolécules de grande pureté. Interprétation biologique. Question biologique. Cristallisation. Structure atomique = MODELE. Cristaux. Affinement cristallographique. - PowerPoint PPT Presentation
Citation preview
PARTIE IV
Affinement du modèle
1. Principales EtapesClonage, expression,
purification
Cristaux
Données de diffraction
Interprétation biologique
Collecte et intégrationdes données
Phasage des réflexions
Affinementcristallographique
Cristallisation Questionbiologique
Analyse bioinformatique
Macromolécules de grande pureté
Structure atomique= MODELE
Carte de densité électronique
1. Principales Etapes
Phasage des réflexions avec lPhasage des réflexions avec l’’une des une des méthodes décritesméthodes décrites
Calcul dCalcul d’’une première carte de densité une première carte de densité électroniqueélectronique
Construction dConstruction d’’un premier modèle dans un premier modèle dans cette carte de densitécette carte de densité
AFFINEMENTAFFINEMENT : dernière étape avant : dernière étape avant validation et publication du modèlevalidation et publication du modèle
PRE-REQUISPRE-REQUIS : modèle doit être correct : modèle doit être correct
2. Rappels
(r) Fh
Facteurs de Structure
Transformation de Fourier
diffractiondiffraction
Transformée de Fourier
calculcalculModèlex,y,z,fj
Fcalc, calc
Structure dans le cristal
Fobs
expérienceexpérience Données de diffraction
Espace réelEspace réel Espace réciproqueEspace réciproque
Densité électronique
3. Objectifs
L’affinement du modèle est un processus cyclique L’affinement du modèle est un processus cyclique dont le BUT est l’optimisation du modèle issu de dont le BUT est l’optimisation du modèle issu de l’interprétation de cartes de densités électroniquel’interprétation de cartes de densités électronique
ObjectifObjectif : le modèle construit doit refléter le mieux : le modèle construit doit refléter le mieux possible l’ensemble des données expérimentalespossible l’ensemble des données expérimentales
Interprétation de la densité électronique
Construction d'un modèle atomique Affinement de la structure(module et phase)MODELE FINALMODELE FINAL
4. Principes
Minimisation de l’écart entre: Minimisation de l’écart entre:
- le modèle (xyz)- le modèle (xyz)
Fcalc
- les données de diffraction
Fobs
Plus Fcalc est proche de Fobs
Plus le modèle est proche de la structure réelle
C’est FC’est Fcalc calc qui est qui est modifiémodifié
(x,y,z,B) (x,y,z,B) modifiésmodifiés
OR FOR Fobs obs = constantes= constantesOR FOR Fobs obs = constantes= constantes
4. Principes
L’affinement est un problème délicatL’affinement est un problème délicat : : Nombre de données expérimentales mesurées est Nombre de données expérimentales mesurées est
souvent faible par rapport au nombre de paramètres à souvent faible par rapport au nombre de paramètres à optimiser (x, y, z, B)optimiser (x, y, z, B)
Ex FdhD: 1900 Atomes / Xtal Diffracte à 2.8ÅEx FdhD: 1900 Atomes / Xtal Diffracte à 2.8Å 7600 paramètres à définir / 8950 Réflexions uniques7600 paramètres à définir / 8950 Réflexions uniques
Le nombre important de paramètres à affinerLe nombre important de paramètres à affiner Le modèle initial peut être de qualité médiocre, Le modèle initial peut être de qualité médiocre,
importance de la phaseimportance de la phase La fonction à optimiser est complexe, non linéaire et La fonction à optimiser est complexe, non linéaire et
peut comporter plusieurs minima séparés par des peut comporter plusieurs minima séparés par des barrières énergétiquesbarrières énergétiques
Trouver une pondération adéquat entre les données Trouver une pondération adéquat entre les données cristallographiques et non-cristallographiquescristallographiques et non-cristallographiques
4. Principes
Considérations générales Importance de la résolution dans les
paramètres à affiner: 3.8 – 3.2Å : Coordonnées, Groupes de B, pas de solvant,
importance de NCS et d’calc si possible; Utilisation des angles
de torsion pour diminuer N
3.2 – 2.7Å : Bon modèle, Construction-reconstructions importantes, Groupes de B
2.7 – 2.2Å : Construction du modèle facile, B individuel, quelques molécules de solvant
2.2 – 1.4Å : Construction automatique, B individuel, bcp de solvant
<1.2Å : B anisotrope, Hydrogènes
4. Principes
Interprétation de la densité électroniqueInterprétation de la densité électronique
Construction, d'un modèle atomiqueConstruction, d'un modèle atomique(x,y,z)(x,y,z)
Optimisation des Optimisation des paramètresparamètresModèle x+Modèle x+ΔΔx, y+x, y+ΔΔy, z+y, z+ΔΔzz
MODELE FINALMODELE FINAL
Cartes de densité électroniqueCartes de densité électronique
FFobsobs calccalc, , obsobs
« Nouvelles » « Nouvelles » valeurs des Fvaleurs des Fcalccalc et et des phasesdes phases
5. Observations et paramètres
ObservationsObservations : tout ce qui est connu sur la : tout ce qui est connu sur la cristal avant l’étape d’affinementcristal avant l’étape d’affinement Paramètres cristallinsParamètres cristallins Modules des FModules des Fobsobs (nombre fixé) (nombre fixé) Stéréochimie des macromoléculesStéréochimie des macromolécules
ParamètresParamètres : à améliorer pendant le : à améliorer pendant le processusprocessus Positions atomiques (x,y,z) des atomes du Positions atomiques (x,y,z) des atomes du
modèlemodèle Paramètres de Paramètres de déplacements atomiquesdéplacements atomiques
5. Observations et paramètres
Les paramètres de déplacements Les paramètres de déplacements atomiquesatomiques : :
Ils traduisent le désordre statique et dynamique Ils traduisent le désordre statique et dynamique
Désordre dynamiqueDésordre dynamiqueVibration d’un atome autour de sa position Vibration d’un atome autour de sa position d’équilibre, l’amplitude de ce mouvement est une d’équilibre, l’amplitude de ce mouvement est une fonction de la températurefonction de la température
Facteur d’agitation thermique w = exp (-Facteur d’agitation thermique w = exp (-BBjj(sin (sin θθ//λλ))22))
Désordre statiqueDésordre statiqueUn atome ou un groupe d’atomes n’occupent pas la Un atome ou un groupe d’atomes n’occupent pas la même position dans chaque maillemême position dans chaque maille
Facteur d’occupation Facteur d’occupation qqjj
5. Observations et paramètres
Rappels : Facteurs de diffusion atomique
iode
53 fj en fonction de sin / à 0 Kfj en fonction de sin / à 0 K
sin / = 0 fj = Zfj diminue lorsque sin / augmente
86
carbone
résolution
5. Observations et paramètres
Facteurs dFacteurs d’’agitation thermiqueagitation thermique
La taille du nuage électronique est indépendante de la La taille du nuage électronique est indépendante de la température température diffraction par un cristal indépendante de la diffraction par un cristal indépendante de la température ?température ?
En fait,En fait, les atomes vibrent autour d les atomes vibrent autour d’’une position dune position d’’équilibre équilibre position des atomes différente dans les mailles du cristal position des atomes différente dans les mailles du cristal « pseudo-taille » des atomes« pseudo-taille » des atomes
Plus la vibration thermale est grande, plus « la pseudo-taille » de Plus la vibration thermale est grande, plus « la pseudo-taille » de ll ’’atome est grandeatome est grande
ConséquencesConséquences
LL ’’intensité des rayons diffractés diminue lorsque intensité des rayons diffractés diminue lorsque augmente augmente
ffjj doit être multiplié par un facteur dépendant de la doit être multiplié par un facteur dépendant de la températuretempérature
5. Observations et paramètres
Facteurs dFacteurs d’’agitation thermiqueagitation thermique- Les facteurs d- Les facteurs d’’agitation thermique (B) traduisent la vibration agitation thermique (B) traduisent la vibration dd ’’un atome autour de sa position dun atome autour de sa position d’’équilibreéquilibre- L- L’’amplitude du mouvement dépend de la températureamplitude du mouvement dépend de la température- Définition d- Définition d’’un facteur de diffusion atomique dépendant de la un facteur de diffusion atomique dépendant de la température :température :
8 B = 20 Å2
B = 0 Å2
B = 99 Å2
B = 0 Å2
Les valeurs élevées de B entraînent un affaiblissement rapide des intensités diffractées pour des valeurs croissantes de S
5. Observations et paramètres
Facteurs dFacteurs d’’agitation thermiqueagitation thermique
Valeurs faibles(cœur hydrophobe)
Valeurs élevées(boucles flexibles)
Protéine
En généralEn général 5 5 ÅÅ22 < B < 50 < B < 50 ÅÅ22
Agitation isotrope
Molécule organique
Agitation anisotrope (différente dans les 3 directions de l ’espace) : ellipse
d’agitation (50 % de probabilité)
anisotropeanisotrope
isotropeisotrope
5. Observations et paramètres
Paramètres variables Paramètres variables Les coordonnées (x,y,z)Les coordonnées (x,y,z) Les facteurs de température (B) désordre dynamiqueLes facteurs de température (B) désordre dynamique Les facteurs d’occupation (q) désordre statiqueLes facteurs d’occupation (q) désordre statique
Nécessité d'ajouter des informations Nécessité d'ajouter des informations supplémentairessupplémentaires
Résolution Réflexions Obs/ paramètres
3.0 51 300 1.12.7 70 410 1.52.5 88 700 2.82.0 173 200 3.6
ExempleExemple : ArgRS – ARNt P212121 a = 210.2 Å b = 146.2 Å c
= 86.1 Å (12 000 atomes, 170 kDa dans l’ua)
SafetSafety y factorfactor
5. Observations et paramètres
Le rapport observations/paramètres est amélioré par ajouts Le rapport observations/paramètres est amélioré par ajouts d’informations supplémentaires :d’informations supplémentaires :
Diminuer Npar : affinement avec contraintesDiminuer Npar : affinement avec contraintes- Contrainte de certains paramètres à des valeurs fixes- Contrainte de certains paramètres à des valeurs fixes- Utilisation d’angle de torsion au lieu de positions x, y et z- Utilisation d’angle de torsion au lieu de positions x, y et z
Augmenter Nobs : affinement restreintAugmenter Nobs : affinement restreint- Permet à certains paramètres de varier autour d’un idéal:- Permet à certains paramètres de varier autour d’un idéal:
• Géométrie Géométrie - Longueur liaisons covalentes- Longueur liaisons covalentes- Angles liaisons covalentes- Angles liaisons covalentes- Angles de torsion- Angles de torsion- Contacts Van der Waals- Contacts Van der Waals
• Symétries non cristallographiquesSymétries non cristallographiques• Corrélation entre atomes liésCorrélation entre atomes liés
5. Observations et paramètres
Distance Angle de liaison Angle dihédral
6. Procédures d’affinement
Comment ?Comment ? Définir une fonction d’énergie et trouver le Définir une fonction d’énergie et trouver le minimum de cette fonctionminimum de cette fonction
Espace conformationnel
E
E
minimumlocal
3 types d’algorithmes:
- Moindres carrés- Dynamique moléculaire- Maximum de vraisemblance
3 types d’algorithmes:
- Moindres carrés- Dynamique moléculaire- Maximum de vraisemblance
minimum
6. Procédures d’affinement
Méthode des moindres carrésMéthode des moindres carrés
Déterminer le minimum de la fonctionDéterminer le minimum de la fonction
AvecAvec
FFobsobs facteurs de structure observés = facteurs de structure observés = données de diffractiondonnées de diffraction FFcalccalc facteurs de structure calculés = facteurs de structure calculés = modèlemodèleK’ K’ facteur d’échellefacteur d’échelle wwhklhkl poids affecté à chaque réflexionpoids affecté à chaque réflexion
2) F K' F (w ψ hklcalc
lk,h,hklobs hkl
6. Procédures d’affinement
Méthode des moindres carrésMéthode des moindres carrés
Ces méthodes ne permettent d’atteindre qu’un minimum localCes méthodes ne permettent d’atteindre qu’un minimum local Leur rayon de convergence est faibleLeur rayon de convergence est faible
Col+150
6. Procédures d’affinement
Méthode des moindres carrésMéthode des moindres carrés
Ces méthodes ne permettent d’atteindre qu’un minimum localCes méthodes ne permettent d’atteindre qu’un minimum local Leur rayon de convergence est faibleLeur rayon de convergence est faible
Col+150
6. Procédures d’affinement
Méthode de dynamique moléculaireMéthode de dynamique moléculaireLe modèle est artificiellement chauffé à 3000°K puis Le modèle est artificiellement chauffé à 3000°K puis refroidi progressivement à 300°K (attribution d’une refroidi progressivement à 300°K (attribution d’une vitesse initiale aléatoire à chaque atome)vitesse initiale aléatoire à chaque atome)
= technique du = technique du « recuit simulé »« recuit simulé »
exploration d’une plus grande gamme de exploration d’une plus grande gamme de conformationsconformations
Fonction d’énergie totale de la moléculeFonction d’énergie totale de la molécule
EETOT TOT = E= EPOT POT + w E+ w EcrystcrystEETOT TOT = E= EPOT POT + w E+ w Ecrystcryst
EPOT dépend de la géométrie de la molécule
CNSCNS
2) F K' F ( w E hklcalc
lk,h,hklobs hklcryst
6. Procédures d’affinement
Col+150
Méthode dynamique moléculaireMéthode dynamique moléculaire
Obtention d’un minimum « vrai »Obtention d’un minimum « vrai » Le rayon de convergence est plus importantLe rayon de convergence est plus important
6. Procédures d’affinement
Col+150
Méthode dynamique moléculaireMéthode dynamique moléculaire
Obtention d’un minimum « vrai »Obtention d’un minimum « vrai » Le rayon de convergence est plus importantLe rayon de convergence est plus important
6. Procédures d’affinement
Maximum de vraisemblanceMaximum de vraisemblance
Méthode utilisée dans REFMAC5 (CCP4), Méthode utilisée dans REFMAC5 (CCP4), Phenix,… Phenix,…
Des programmes plus récents construisent une Des programmes plus récents construisent une fonction de vraisemblance avec les paramètres à fonction de vraisemblance avec les paramètres à affineraffiner
Les paramètres à définir sont décrits par des Les paramètres à définir sont décrits par des distributions de probabilitésdistributions de probabilités
Le maximum de vraisemblance utilise le Le maximum de vraisemblance utilise le théorème de théorème de BayesBayes
6. Procédures d’affinement
Théorème de BayesThéorème de Bayes
p(A;B) = probabilité que A soit vrai si B est vrai = 50% = 0.1/0.2 = p(A,B)/p(A)
De la même manière:p(B;A)=p(B,A)/p(B)
Théorème de Bayes:
p(B)=25%p(A)=20% p(A,B) = 10%
6. Procédures d’affinement
Méthode du maximum de vraisemblanceMéthode du maximum de vraisemblanceCC ’’est une technique qui, sous lest une technique qui, sous l’’hypothèse que les hypothèse que les
variables ont une distribution connuevariables ont une distribution connueusuellement la distribution normale ou gaussienneusuellement la distribution normale ou gaussienne
permet dpermet d’’estimer les paramètres destimer les paramètres d’’un modèle un modèle dd ’’une équation ou dune équation ou d’’un système, linéaire ou non linéaireun système, linéaire ou non linéaire
avec des restrictions sur ces paramètres ou nonavec des restrictions sur ces paramètres ou noncoefficients, matrice de variances et covariancescoefficients, matrice de variances et covariances
Plus spécifiquement la technique consiste à construire Plus spécifiquement la technique consiste à construire une fonction appelée fonction de vraisemblance une fonction appelée fonction de vraisemblance
construite à partir de la fonction de distributionconstruite à partir de la fonction de distribution et à maximiser son logarithme par rapport aux et à maximiser son logarithme par rapport aux
paramètres inconnus paramètres inconnus
7. Stratégies
Plusieurs cycles
affinement par recuit simuléaffinement par recuit simulé
Calcul de nouvelles cartes (2Fobs-Fcalc) et (Fobs-Fcalc)
Calcul de nouvelles cartes (2Fobs-Fcalc) et (Fobs-Fcalc)
Correction manuelle du modèleCorrection manuelle du modèle
Addition du solvant (eau, ions, ligands)
Addition du solvant (eau, ions, ligands)
7. Stratégies, TLS
Affinement de type TLS (Translation/Libration/Screw)Permet d’ajouter des éléments de
descriptions intermédiaire sans ajouter de nombreux paramètres
Description de domaines rigidesNombre de domaines au choix de l’utilisateur20 paramètres / domainePeut être utilisé à partir de 2Å de résolution (>2Å
dans le cas de NCS)
7. Stratégies, TLS
http://skuld.bmsc.washington.edu/~tlsmd/
8. Suivie de l’affinement
Les étapes de lLes étapes de l’’affinement sont suivies par le facteur affinement sont suivies par le facteur d’accord R d’accord R
atomes au hasard atomes au hasard R = R = 60 - 50 %60 - 50 % modèle de départmodèle de départ R = 40 – 50 %R = 40 – 50 % affinement à 2.5 Åaffinement à 2.5 Å R = R = 20 %20 % affinement à 1.5 Åaffinement à 1.5 Å R = R = 15 %15 % affinement petite moléculeaffinement petite molécule R = 4 - 8 %R = 4 - 8 % composé minéralcomposé minéral R = 1 – 2 %R = 1 – 2 %
8. Suivie de l’affinement
Utilisation d’un facteur d’accord Rfree
Même définition que le facteur R mais utilise environ 1000 réflexions (1-5%; dépend de la résolution) qui sont prisent au hasard* et qui ne sont JAMAIS utilisées lors de l’affinement
Permet le bon suivie d’un affinement
Rfree > R: 5-7% à basse résolution <1% à très haute résolution
Règle +/- générale: Rfree ≈ (Résolution en Å)/10
*Sauf dans le cas de Twinning
8. Suivie de l’affinement
Tableau synthétique après affinement:Tableau synthétique après affinement:
Collection de données
R/Rfree
RMSD Longueurs de liaison RMSD Angles de liaison
9. Pratique / Refmac5
Restrained refinementUnrestrainedRigid bodyStructure idealisationTLS & Restrained refinement
A tester en fin d’affinement
9. Pratique / Refmac5
FreeR
NCS
9. Pratique / Phenix
2 - 3Å en début d’affinement
<4.5Å de résolution
Refinement Target Weights:- Optimize Xray/Stereochemistry- A utiliser!
A utiliser à des résolutions modérées: 2 - 3 Å
Un fichier pdb
ATOM 4217 N PRO B 265 24.846 -10.676 50.273 1.00 27.45 N ATOM 4218 CA PRO B 265 25.497 -11.345 51.398 1.00 29.70 C ATOM 4219 C PRO B 265 27.029 -11.331 51.363 1.00 30.61 C ATOM 4220 O PRO B 265 27.648 -10.957 50.353 1.00 31.31 O ATOM 4221 CB PRO B 265 24.970 -12.783 51.286 1.00 30.01 C ATOM 4222 CG PRO B 265 23.648 -12.613 50.698 1.00 30.57 C ATOM 4223 CD PRO B 265 23.905 -11.584 49.610 1.00 27.97 C... ATOM 4225 N AGLU A 302 15.152 -18.914 10.502 0.50 26.16 N ATOM 4226 N BGLU A 302 12.994 -20.474 10.131 0.50 20.40 N ATOM 4227 CA AGLU A 302 13.786 -18.984 9.961 0.50 28.63 C ATOM 4228 CA BGLU A 302 14.025 -19.938 11.034 0.50 23.96 C ATOM 4233 CB AGLU A 302 12.738 -19.272 11.031 0.50 28.05 C ATOM 4234 CB BGLU A 302 13.943 -18.424 11.242 0.50 23.64 C ATOM 4235 CG AGLU A 302 12.865 -20.600 11.598 0.50 30.67 C ATOM 4236 CG BGLU A 302 14.204 -17.609 10.058 0.50 26.18 C ATOM 4237 CD AGLU A 302 14.041 -20.678 12.508 0.50 30.01 C ATOM 4238 CD BGLU A 302 13.205 -17.894 8.993 0.50 27.17 C ATOM 4239 OE1AGLU A 302 14.351 -19.670 13.194 0.50 29.80 O ATOM 4240 OE1BGLU A 302 12.000 -17.756 9.273 0.50 24.71 O ATOM 4241 OE2AGLU A 302 14.661 -21.746 12.513 0.50 32.25 O ATOM 4242 OE2BGLU A 302 13.645 -18.264 7.891 0.50 29.49 O ATOM 4229 C AGLU A 302 13.398 -17.758 9.186 0.50 28.71 C ATOM 4230 C BGLU A 302 14.003 -20.591 12.381 0.50 23.41 C ATOM 4231 O AGLU A 302 12.365 -17.149 9.487 0.50 28.75 O ATOM 4232 O BGLU A 302 13.996 -19.917 13.418 0.50 24.41 O
Numér
o d’
atom
e
Type
Résid
ue
Chain
e
Numér
o de
résid
u
X Y Z Occ B
IntermédiaireIntermédiaire IntermédiaireIntermédiaire
Bibliographie
Bibliographie
facile facile
méthodologique
Cristallisation des protéinesCristallisation des protéines
- - Crystallization of Biological macromolecules (1999). A. McPherson, Crystallization of Biological macromolecules (1999). A. McPherson, CSHL PressCSHL Press
- Crystallization of Nucleic acids and Proteins (1992). A. Ducruix, R. Giegé, The - Crystallization of Nucleic acids and Proteins (1992). A. Ducruix, R. Giegé, The Practical approach series, Practical approach series, IRL Press, Oxford University PressIRL Press, Oxford University Press
- Crystallization of Membrane proteins (1991). H. Michel, Boca Raton, - Crystallization of Membrane proteins (1991). H. Michel, Boca Raton, CRC PressCRC Press
Cristallographie des protéinesCristallographie des protéines
FacileFacile
- - Crystallography made crystal clear (1993). G. Rhodes. Crystallography made crystal clear (1993). G. Rhodes. Academic PressAcademic Press
- - Outline of crystallography for biologistOutline of crystallography for biologist (2002) D. Blow, (2002) D. Blow, Oxford University PressOxford University Press
- Crystal structure analysis (1992). Glusker et Trueblood, - Crystal structure analysis (1992). Glusker et Trueblood, Oxford University PressOxford University Press
Bibliographie
ThéorieThéorie
- - Protein crystallography (1976). T.L. Blundell, L.N. Johnson, Protein crystallography (1976). T.L. Blundell, L.N. Johnson, Academic PressAcademic Press
- X-ray structure determination (1989). G.H. Stout, L.H. Jensen, - X-ray structure determination (1989). G.H. Stout, L.H. Jensen, Wiley & SonsWiley & Sons
- Methods in Enzymology, volumes 276 et 277, - Methods in Enzymology, volumes 276 et 277, Academic PressAcademic Press
IntermédiaireIntermédiaire
- - Macromolecular crystallography (1997). C.W. Carter, R.M. SweetMacromolecular crystallography (1997). C.W. Carter, R.M. Sweet
- Introduction to macromolecular crystallography (2003). A. McPherson - Introduction to macromolecular crystallography (2003). A. McPherson Wiley-LissWiley-Liss
- Principles of protein X-ray crystallography (1994). J. Drenth, - Principles of protein X-ray crystallography (1994). J. Drenth, Springer-VerlagSpringer-Verlag
MéthodologiqueMéthodologique
- - Practical protein crystallography (1997). C. Carter, R. Sweet. Practical protein crystallography (1997). C. Carter, R. Sweet. Academic PressAcademic Press
Bibliographie