Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
Spectrométrie de masse pour l'étude de systèmes biologiques
Guillaume van der RestLaboratoire des Mécanismes Réactionnels CNRS UMR 7651
Ecole Polytechnique, Palaiseau
Introduction
Causes de l'essor de la spectrométrie de masse en biologie
Protéomique et techniques associées
Méthodes d'analyse structurale
Autres molécules ?
Plan de l'exposé
Causes de l'essor de la spectrométrie de masse en biologie
Protéomique et techniques associées
Méthodes d'analyse structurale
Autres molécules ?
Critères d'intérêt de techniques pour les biologistes
Innovation sur les informations apportées
Travail préparatoire en amont :− Quantité de matériel à obtenir et facilité d'accès à celui-
ci. Par exemple, approche in vitro vs in vivo, ADN plus facile à reproduire (PCR) que protéines.
− Sensibilité peut être un paramètre critique.
Quantité d'informations produites− Débit de la méthode ?− Qualité / reproductibilité des informations obtenues.
Arrivée de la spectrométrie de masse: des modes d'ionisation adaptés
< 1980 : ionisation électronique ou chimique :− Nécessite des composés volatils ou qui ne se dégradent
pas par chauffage.− Possibilité de dérivatisation pour rendre plus volatils.− Encore très utilisé pour métabolites et oligosaccharides.
1980 – 1990 : FAB (fast atom bombardment)− Désorption/ionisation dans une matrice de glycérol.− Premiers travaux sur des peptides ou des petites
protéines. Montre le grand intérêt de la MS en biologie. > 1990 : ESI (et ses variantes) et MALDI
− Point d'entrée réel de la MS en biologie.
Prix Nobel 2002
John FENN Koichi TANAKA
Electrospray MALDI
Ionisation par électronébullisation
Ionisation nanospray
MALI
• Débit de qq nL/min
• Utilisation d’aiguilles remplies de 1-4 μL de solution
• Pas de gaz de nébulisation, température et tensions plus faibles
diamètre de 1-4 μm
picture from http://www.newobjective.com/
Ionisation MALDI
Approches possibles
Désolvatation-désorption/Ionisation permet d'étudier ce qui est initialement présent en solution ou dans la matrice.
− Exposé d'aujourd'hui.
Désolvatation-désorption/Ionisation permet de former des espèces ionisées et d'en étudier les propriétés en phase gazeuse.
− Exposé de Valérie Gabélica demain.
Plan de l'exposé
Causes de l'essor de la spectrométrie de masse en biologie
Protéomique et techniques associées
Méthodes d'analyse structurale
Autres molécules ?
Quelques définitions
● Protéome : ensemble des protéines présentes dans une cellule à un instant donné et dans des conditions données.
● L’analyse du protéome (protéomique) regroupe donc
● L’identification des protéines
● La caractérisation de leurs modifications post-
traductionnelles
● L’analyse des protéines en interaction (interactome)
● La quantification des protéines entre deux états cellulaires
différents
Quelques ordres de grandeur
La protéomique
● De la protéomique descriptive● détermination d’un protéome tissulaire, cellulaire, sub-
cellulaire● protéome complet
● … à la protéomique fonctionnelle● pour pouvoir comparer des protéomes (sain vs
pathologique) et identifier les protéines co-stimulées, co-réprimées…
Contrôle modifié
Protocole général pour identifier des protéines
Homogénéisation des tissus, extraction des protéines
Séparation des protéines sur gelsodium dodecyl sulfate (SDS)–polyacrylamide gel electrophoresis (PAGE)
Excision des spots
LavageRéduction/alkylation
ProtéolyseExtraction des peptides
Analyse des peptides
La séparation sur gel
●Utilisation de gels d’électrophorèse monodimensionnels● séparation des protéines en fonction de leur poids
moléculaire (SDS-PAGE)
La séparation sur gel
● Utilisation de gels d’électrophorèse bidimensionnels● 1ère dimension : séparation en fonction du pH (Iso
Electric Focusing)● 2ème dimension : séparation en fonction du poids
moléculaire (SDS-PAGE)
Exemple de gel 2D
La digestion en pièce de gel
Peptides
Les protéases les plus courantes
● Les protéases sont des enzymes qui clivent le squelette polypeptidique de manière ± spécifique
Endopeptidase Type Spécificité pH T°
chymotrypsine Sérine Y, F, W 1.5 - 8.5 37°C
Trypsine Sérine R et K 7.5 - 9.0 37°C
LysC Sérine K 7.5 - 8.5 37°C
ArgC Sérine R 7.5 - 8.5 37°C
GluC Sérine D, E 7.5 - 8.5 37°C
AspN métallo D (Nter) 6.0 – 8.0 37°C
pepsine Acide F, L, M, W 2.0 - 4.0 4°C
Identification de protéines : stratégies bottom-up
Mesure des masses des peptides trypsiques en
mélange(MALDI/MS)
Séparation HPLC puis fragmentation des peptides
pour déterminer des éléments de séquence
(nanoLC – nanoESI - MS/MS)
comparaison entre ces masses et les masses théoriques obtenues par digestion in silico
des protéines des banques de données
interrogation dans les banques de données à partir de ces éléments de séquence
Identification de la protéine
Analyse par Mass Fingerprinting
20
97
66
45
30
kD
Band 1
Band 6
Tumor Metastasis
Band 8
Gel SDS-PAGE (coloration bleu de Coomassie)
881.2564982.7859
1124.59791271.6904
1424.6335
1523.6963
1598.7613
1707.7801
1765.7445
1934.93372018.0265
2164.0563
2226.1627
800 1000 1200 1400 1600 1800 2000 2200m/z
1270.695
1370.723
1447.700
1614.915
1644.875
1668.872
1799.869
1996.926
2017.014
Liste de massesexpérimentales
Banque protéomiqueMATRSDCVFHTYILLLAFTPKLMPCGTREAQCSDERTAHIPLSDCVFHTYILLLAFTPKHHITSELKKMNVSCCDTHIAQAQDGFHITTRLEPASFTAVCNFTN
GTREAQCSDERTAHIPLSDCVFHTYILLLAFTPKHHITSELKKMNVSCCDTHIAQAQDGFHITTRLEPASFTAVCNFTNMATRSDCVFHTYILLLAFTPKLMP
HIAQAQDGFHITTRLEPASFTAVCNFTNMATRSDCVFHTYILLLAFTPKLMPGTREAQCSDERTAHIPLSDCVFHTYILLLAFTPKHHITSELKKMNVSCCDTHI
812.695
967.854
1001.789
1112.695
1370.723
1447.700
1614.915
1644.875
1668.872
1799.869
1996.926
2017.014
582.687
597.123
1211.789
1432.65
1370.723
1424.789
1635.874
1776.325
1878.943
1987.974
2067.672
A B
digestion
in silicoA
BC Listes de masses
théoriques
Comparaison par moteur de recherche
Exemple de recherche dans profound
banque de données
protéiques choisie
taxonomie
gamme de masse
nb de site de coupure ratés autorisé
enzyme
modifications
liste des peptides
Mr ou MH+
précision
Résultat de la recherche
meilleur score
masse moléculaire
couverture de séquence
informations sur la protéine
Informations sur l’identification
liste des peptides utilisés pour
l’identification
précision (ppm)
nb peptides trouvés
localisation des peptides dans la séquence
erreur (ppm)
Limite de l’approche par PMF
● Problème si peu de peptides (protéines membranaires)
● Effet de suppression de signal pour les mélanges complexes (gamme dynamique)
● Problème si l’organisme est non séquencé ou les protéines absentes des banques
Identification de protéines : stratégies bottom-up
Mesure des masses des peptides trypsiques en
mélange(MALDI/MS)
Séparation HPLC puis fragmentation des peptides
pour déterminer des éléments de séquence
(nanoLC – nanoESI - MS/MS)
comparaison entre ces masses et les masses théoriques obtenues par digestion in silico
des protéines des banques de données
interrogation dans les banques de données à partir de ces éléments de séquence
Identification de la protéine
Analyse par nanoLC-MS/MS
● 1ère étape : Séparation des constituants du digestat par chromatographie liquide à nano-débit couplée au spectromètre de masse.
Chromatogramme
Analyse par nanoLC-MS/MS
● 2ème étape : Mesure de la masse des peptides au fur et à mesure de leur élution de la colonne.
Spectre MSm/z
100 300 500 700 900 1100 1300 1500
100
%
(1+)
(2+)
785.75
1570.42
Analyse par nanoLC-MS/MS
● 3ème étape : Isolation d’un ion (multichargé) et fragmentation (MS/MS).
300 500 700900 1100 1300 1500
m/z
NDNEEGF
y''6
y''4y''9
y''8 y''11y''10
y' ’7
y' ’5
284.15
100 300 500 700 900 1100 1300 1500m/z
0
100
%
NDNEEGF
y6
y4y9y8 y10
y7
y5
479.10 284.15
Spectre MS/MS
y11
Informations de séquence
100 300 500 700 900 1100 1300 1500m/z
0
100
%
NDNEEGF
y''6
y''4y''9
y''8 y''11y''10
y' ’7
y' ’5
479.10 284.15
Analyse par nanoLC-MS/MS● Dernière étape : Interrogation dans les banques de données à partir des spectres MS/MS
Listes de masses théoriques
100 300 500 700 900 1100 1300 1500m/z
0
100
%
NDNEEGF
y''6
y''4y''9
y''8 y''11y''10
y' ’7
y' ’5
479.10 284.15
100 300 500 700 900 1100 1300 1500m/z
0
100
%
NDNEEGF
y''6
y''4y''9
y''8 y''11y''10
y' ’7
y' ’5
479.10 284.15
Liste de masses expérimentales
480.10
626.90
813.09
1056.32
942.32
1285.25
1171.35
684.20
1570.42MS
MS/MS
Banque protéomiqueMATRSDCVFHTYILLLAFTPKLMPCGTREAQCSDERTAHIPLSDCVFHTYILLLAFTPKHHITSELKKMNVSCCDTHIAQAQDGFHITTRLEPASFTAVCNFTN
GTREAQCSDERTAHIPLSDCVFHTYILLLAFTPKHHITSELKKMNVSCCDTHIAQAQDGFHITTRLEPASFTAVCNFTNMATRSDCVFHTYILLLAFTPKLMP
HIAQAQDGFHITTRLEPASFTAVCNFTNMATRSDCVFHTYILLLAFTPKLMPGTREAQCSDERTAHIPLSDCVFHTYILLLAFTPKHHITSELKKMNVSCCDTHI
Digestion et fragmentation
in silicoA
BC
Comparaison listes MS et MS/
MS
512.65
912.87
1428.10
1171.35
745.98
1758.87
1002.65
1467.36
Recherche en banques de données
●Moteurs de recherche à partir de données en MS/MS● Mascot ou sequest
En cas d’échec
●Chercher par homologie de séquence● BLAST (Basic Local Alignment Search Tool)http://www.ncbi.nlm.nih.gov/BLAST/
En cas de nouvel échec
●Séquençage de novo !● Analyse approfondie des spectres MS/MS● Logiciels d’aide au séquençage de novo
MassSeq™ (Waters)RapiDeNovo™ (Bruker)
Importance du haut débit…
●Automatisations de toutes les étapes de l’analyse
Spot Picker (automated 2D gel imaging, spot detection and selection from 2D gels into 96 micro well plates).
gel spot digestion and processing
Q-Trap (Applied)
Q-TOF (Waters)
TOF-TOF (Bruker)
Les modifications post-traductionnelles
● Définition : après la traduction d’un ARN messager en protéine, celle-ci subit une maturation au cours de laquelle elle peut être associée à d’autres protéines ou diverses molécules.
● Les plus fréquentes● Ponts S-S● Glycosylations● Phosphorylations
● Et bien d’autres encore…
Fonctions
Stabilité protéique, protection N-terminaleRégulation des interactions protéine-DNA (histones)
Régulation de l’expression des gènes
Ancre Glycosylphosphatidylinositol (GPI). Ancrage aux enzymes et récepteurs membanaires….
Régulation des interactions protéines/protéines -/ligandsModifications chimique artéfactuelle
Stabilité protéique, blocage de l’extrémité N-terminale
Signal de dégradation
Nature des MPT
Acétylation
Méthylation
« Ancre » GPI
Déamidation
Acide Pyroglutamique
Ubiquitine
∆ Masse (Da)
+42
+14
> 1000
+1
-17
> 1000
Stabilité
Réversible, activation/inactivation d’activités enzymatiquesModulation des interactions moléculairesSignalisation
Phosphorylation pTyr pSer, pThr
+80+80
++++/++
+++
+++
Localisation cellulaire, signalisation,Ancrage membranaireInteractions protéines/protéines
Acylation, acides gras farnésyle myristoyle palmitoyle…etc
+204+210+238
+++++++/++
Excrétion des protéinesReconnaissance cellulaire/signalisationO-GlcNAc, réversible, régulation fonctionnelle
Glycosylation N-glycosylation O-glycosylation
> 800
203, > 800
+/+++/++
++
Stabilité des protéines. Interactions protéines-ligandsHydroxyproline +16 +++
Modulation Interactions protéine/protéine, récepteur/ligandSulfatation (sTyr) +80 +
Stabilité protéique, crosslink intra et inter moléculairePont Disulfure -2 ++
+++
+++
+/++
Nitratration des Tyrosines +45 +/++ Oxydation / processus inflammatoire
Les glycosylations
●Glycosylation : attachement covalent de glycannes (sucres) à une protéine (80% des protéines sont glycosylées)
●Différents types de liaison sucre-protéine● N-glycosylation (Asn : site consensus Asp-Xxx-Ser/Thr)● C-glycosylation (Trp : site consensus Trp-Xxx-Xxx-Trp)● O-glycosylation (Ser/Thr/Tyr)
●Rôle de la glycosylation● Intramoléculaire : repliement, solubilité…● Intermoléculaire : antigénique, immunogène, adhésion
cellulaire
Les glycosylations
●Structure des glycannes
●Localisation des sites de glycosylation
glycoprotéine
PNGase F
glycannes
RMN
Exoglycosi-dases + MS
séquenceconfigurationmasse moléculaire
glycoprotéine
trypsine LC/MS
glycopeptides
Nature et site de la glycosylation(intérêt de l’ECD)Exoglycosi-
dases
Les phosphorylations
●Phosphorylation : ajout d’une fonction phosphate● 100 000 sites potentiels de phosphorylation dans le
protéome humain (2 000 connus)● pSer : pThr : pTyr ~ 1800 : 200 : 1
●De nombreux processus cellulaires sont régulés par une phosphorylation
● Croissance cellulaire● Différenciation
Les phosphorylations
● Difficultés pour l’analyse des protéines phosphorylées● Faible taux de phosphorylation● Faible ionisation des peptides phosphorylés (apporte une
charge négative + caractère hydrophile)
Caractérisation par MSApproche top-down sur protéine entière
Après digestion enzymatique : recherche de peptides phosphorylés (perte de H3PO4, formation de m/z 79))
Localisation du site de phosphorylation par MS/MS ou ECD
Enrichissement en peptides phosphorylés IMAC (Immobilized Metal Affinity Chromatography)
La quantification● Approche ICAT (Isotope Coded Affinity Tag)
● Marquage de deux états cellulaires différents par un réactif lourd et un réactif léger
La quantification● Approche ITRAQ
La quantification●Approche ITRAQ
La quantification●Approche ITRAQ
Plan de l'exposé
Causes de l'essor de la spectrométrie de masse en biologie
Protéomique et techniques associées
Méthodes d'analyse structurale
Autres molécules ?
Techniques to study non-covalent interactions in proteins
native PAGE
Circular dichroism
IR spectroscopy
Fluorescence spectroscopy
Size exclusion chromatography
Small angle X-ray scattering
X-ray crystallography
NMR spectroscopy
Electron microscopy
Yeast two hybrid system
Differential scanning calorimetry
Capillary electrophoresis
Isothermal titration calorimetry
Surface plasmon resonance
Equilibrium dialysis
Mass Mass spectrometryspectrometry
mass precision
sensitivity speed
...
stoichiometry protein structure
MS strategies for studying non-covalent interactions
+
solution gas phase
bottom-up
native MS
chemical modification
MS/MS
top-down
Noncovalent complexes: from solution to the gas phase
Apollo ESI source
1 m
bar
0.1
mba
r
10-3 m
bar
2x10
-6 m
bar
ICR cell
CapExit heated glass capillaryhexapole
ESIESI
++
eq
eqeq
[PL][L][P]
Kdiss = ∑∑
+
+
==n (P)
n (PL)
nI[
]nI[
[P][PL]
Rn
n
]/
/
eq
eq
W. Wang, E. N. Kitova, J. S. Klassen, Meth. Enzymol. 362 (2003) 376-397.
[ ] [ ]R
R1RPL
[PL][L][P]
K 00diss
+⋅−==
eq
eqeq
On ne peut pas déterminer On ne peut pas déterminer les concentrations avec la les concentrations avec la spectrométrie de masse… spectrométrie de masse…
PLPL PP ++ LL
Calcul des constantes de dissociation
H/D exchange: basics
CO N
HHC
CH2
C ONH 2
CONHC
H
CH 2
C OOH
CON
HHC
CH 2
OH
CON
HHC
CH 2
SH
CON
HHC
(CH 2)4
NH 2
fast exchange
no exchange
exchange rate compatible with MS observation
HH =O H=O H
H/D exchange: strategy
H/D exchange H/D exchange
proteolysis proteolysis
massspectrometry
massspectrometry
m/zm/zm/zm/z
association
dissociation
H/D exchange: kinetics
621 622 623 624 625 m/z
0 9.3
% Dt / min
5 19.2
15 35.8
60 53.1
90 57.8
120 61.2
Protein
LysNH2NH2
Lys
Bis(Sulfosuccinimidyl)suberate,BS3, spacer arm length = 11.4 Å
O
N
O
OO
O
O
O NO
SO3Na
NaO3S
Bis(Sulfosuccinimidyl)suberate,BS3, spacer arm length = 11.4 Å
O
N
O
OO
O
O
O NO
SO3Na
NaO3S
Reaction principleReaction principle
O
O
NH
NH
CrossCross--Linked ProteinLinked Protein
O
O
NH
NH
CrossCross--Linked ProteinLinked Protein
Cross-linking is the process of joining two or more Cross-linking is the process of joining two or more molecules by a covalent bondmolecules by a covalent bond
Cross-linking
Cross-Cross-linkerlinker
homobifunctionalhomobifunctional
heterobifunctionalheterobifunctional
trifunctionaltrifunctional
zero-lengthzero-length
Cross-linker design principle
Protein NH2
R
Protein
O
O N
O
O
pH > 7
R
NH
O CH3
pH 8-9
ProteinHN
HN
NH
R
O
R
NHS ester
imidoester
Amine-reactive cross-linkers
Protein SH
6,5 < pH < 7,5
pH > 7
N R
O
O
N R
O
O
Protein S
R
I
pH > 7,5Protein S R
NSSR Protein S S R
pyridyl disulfide
active halogen
maleimide
Sulfhydryl-reactive cross-linkers
N C NR1 R2 + Protein1
O
OH
Protein1
O
O
C N R2HNR1
Protein2 NH2+Protein1
O
HN Protein2
+NH
O
HNR1 R2
Zero-length cross-linkers
Protein NH2+
R
N
+NN-
UV light
R
N:
NR
HN Protein
Photoreactive cross-linkers
Pierce Biotechnology, Inc., http://www.piercenet.com/
Crosslinker chemistry
test system: bovine basic fibroblast growth factor (FGF)-2test system: bovine basic fibroblast growth factor (FGF)-2
18 cross-linked peptides identified18 cross-linked peptides identified
15 cross-linked peptides yielded distance constraints15 cross-linked peptides yielded distance constraints
Fold family of FGF-2 correctly identifiedFold family of FGF-2 correctly identified
Young et al., Proc. Natl. Acac. Sci. 97(11) (2000) 5802-5806.
Protein fold analysis
isolationisolation
Cross-linkingCross-linking
isolationisolation
Protein complex analysis
Endoplasmatic reticulum chaperoneEndoplasmatic reticulum chaperonecalreticulin (CRT)calreticulin (CRT)
interactioninteraction
interleukin-12 interleukin-12 αα chain chain
Alloza et al., Anal. Biochem. 324 (2004) 137-142.
Protein complex analysis
α α
α
ββ
β
test system: test system: Helicobacter pyloriHelicobacter pylori urease (( urease ((αβαβ))33))44 dodecamers dodecamers
Detection of cross-linked peptidesDetection of cross-linked peptides
cross-linking between cross-linking between α α and and ββ subunit which is in accordance subunit which is in accordance with the dodecameric urease structurewith the dodecameric urease structure
Carlsohn et al., Int. J. Mass Spectrom. 234 (2004) 137-144.
Higher order structure of protein complexes
Plan de l'exposé
Causes de l'essor de la spectrométrie de masse en biologie
Protéomique et techniques associées
Méthodes d'analyse structurale
ADN, sucres et autres molécules
ADN, ARN
Mesures de masses possibles. Utilisé au début des années 2000 pour la détermination de SNP (single nucleotide polymorphism).
Séquençage en phase gazeuse possible, mais limité.
En compétition avec d'autres techniques (Hybridation sur puces à ADN, RT-PCR) qui sont très sensibles et très précises.
Pour les aspects structuraux : très similaire aux protéines.
Oligosaccharides
Domaine qui aurait mérité un exposé en lui-même.
Plus complexe que celui des protéines :− Pas de base de donnée génomique sur laquelle
s'appuyer.− Enchaînements branchés possibles.− Hétérogénéité des assemblages.− Modes de fragmentations plus nombreux
Métabolome
J.L. Mergny, mardi matin
Métabolome
J.L. Mergny, mardi matin
Multitude de composés de faibles masses moléculaires.
Pour partie peu indicatifs de l'état d'une cellule, sauf en cas de problèmes de désordre enzymatique.
Certains sont très indicateurs de l'état d'une cellule : utilisables comme marqueurs.
Nouvelle approche globale de recherche : « métabolomique »
Conclusion
Spectrométrie de masse apporte des gains importants à l'étude de composés biologiques :
− Sensibilité, rapidité d'analyse, précision− Versatilité
Apports structuraux : moins résolutive que d'autres techniques (RMN, cristallographie R-X), mais analyse directement en solution diluée possible, voire « in vivo » avec préparation de l'échantillon après coup.
Traite que de la moitié (solution) du problème. Voir Valérie demain pour l'approche en phase gaz.
Remerciements
Julia Chamot-Rooke Thorsten Daubenfeld