Upload
michelle-evrard
View
104
Download
0
Embed Size (px)
Citation preview
Laboratoire de Spectrométrie de Masse Bio-Organique ECPM - Université Louis Pasteur - UMR CNRS 7509 25 rue Becquerel 67087 Strasbourg Cedex 2
Etudes protéomiques sur Cenibacter arsenoxidans
Christine Carapito
Réunion du GDR2909-Métabolisme de l'arsenic chez les procaryotes30 mars 2005, Paris
Deux études :
1_ Etude protéomique différentielle : Identification des protéines impliquées dans le mécanisme de résistance à
l’arsenic
2_ Réalisation d’une carte protéomique complète de Cenibacter arsenoxidans
Etudes protéomiques sur Cenibacter arsenoxidans
1_Etude différentielle avec/sans arsenic par gel 2D puis analyse par nanoLC-MS/MS
Comparaison des gels 2D des extraits cytoplasmiques de cultures réalisées en présence/absence d’arsenic :
Sélection de 22 spots différentiellement exprimés
150
15
7Séparation isoélectrique
3
Sép
arat
ion
par
mas
se
Electrophorèse bi-dimensionnelle
Stratégie protéomique
Excision des spots d’intérêts
Identification par homologie de masses MS
nanoLC-MS-MS
Traitement:- Lavage- Réduction/Alkylation des ponts disulfures- Digestion trypsique- Extraction des peptides
Pas d’identification ou ambiguïté
MALDI-TOF-MS(empreinte peptidique massique PMF)
Recherche dans les banques de
donnéesSéquençage de novo,
identification par homologie de séquences
Identification par homologie de masses MS et MS/MS
150
15
7Séparation isoélectrique
3
Sép
arat
ion
par
mas
se
Electrophorèse bi-dimensionnelle
Stratégie protéomique
Excision des spots d’intérêts
Identification par homologie de masses MS
nanoLC-MS-MS
Traitement:- Lavage- Réduction/Alkylation des ponts disulfures- Digestion trypsique- Extraction des peptides
Pas d’identification ou ambiguïté
MALDI-TOF-MS(empreinte peptidique massique PMF)
Recherche dans les banques de
donnéesSéquençage de novo,
identification par homologie de séquences
Identification par homologie de masses MS et MS/MS
Stratégie utilisée lorsque le génome n’est pas séquencé
Le couplage avec la chromatographie liquide
La nanoLC-MS/MS
Nano HPLC (colonne C18 de 75 µm)
Spectre de masse
Spectre MS
Mesure des masses des peptides au fur et à mesure de
leur élution de la colonne
Sélection des peptides les plus intenses isolation
fragmentation
Fragmentation dans la cellule de collision
Spectre MS/MS
Spectre MS/MS
Spectres MS/MS
Liste de masses expérimentale
MS MS/MS
546,45
576,32
678,09
897,98
1002,56
789,67876,43987,49999,12
1018,981342,341597,091678,971987,652202,22
712,43750,09812,34933,66978,55
1207,451327,871387,231505,721678,061835,791944,55
516,90634,79612,75752,93879,89999,78
1134,481368,841596,281675,891888,44
809,89878,78956,56994,83
1059,011166,991234,561345,781423,671624,971777,221878,38
712,43750,09812,34933,66978,55
1207,451327,871387,231505,721678,061835,791944,55
Digestion trypsique et fragmentation in silico
Banque protéique
RFEDDFHEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS
CCFDSDFRGTHTTYIPLMRKMDEASCVNFJRPQSDGHLKITYPMNVCDSDFRAQSDFERTGGHPLMNVFFRDSQACVSDEFRHKITPLFMDLMFPRTEQASSCVFHDNRTIPLYMTIFKGSREFDYAGSRHEYD
DFHEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS
DFFSDFFIRLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD
FDSFIRLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD
IRLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD
IRMLKLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD
VFGNDFHEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS
FGEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS
RFEDDFHEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS
CCFDSDFRGTHTTYIPLMRKMDEASCVNFJRPQSDGHLKITYPMNVCDSDFRAQSDFERTGGHPLMNVFFRDSQACVSDEFRHKITPLFMDLMFPRTEQASSCVFHDNRTIPLYMTIFKGSREFDYAGSRHEYD
DFHEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS
DFFSDFFIRLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD
FDSFIRLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD
IRLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD
IRMLKLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD
VFGNDFHEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS
FGEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS
Comparaison des listes de masses MS et MS/MS
Listes de masses théoriques
Protéine B Protéine CProtéine A756.24854.25956.36998.65
1002.131103.261230.651523.581856.261956.24
785.69859.65899.29958.63989.65
1025.261066.291250.591563.251965.35
895.36958.29999.361002.351125.251254.361633.251785.361985.592015.69
759.26895.32985.36999.25
1012.261203.251259.361526.351965.252015.26
859.35958.36989.36
1025.361123.021256.361523.161952.361999.352015.25
589,36
785,69
898,58
651,48
1001,56
756.24854.25956.36998.65
1002.131103.261230.651523.581856.261956.24
756.24854.25956.36998.65
1002.131103.261230.651523.581856.261956.24
785.69859.65899.29958.63989.65
1025.261066.291250.591563.251965.35
785.69859.65899.29958.63989.65
1025.261066.291250.591563.251965.35
895.36958.29999.361002.351125.251254.361633.251785.361985.592015.69
895.36958.29999.361002.351125.251254.361633.251785.361985.592015.69
759.26895.32985.36999.25
1012.261203.251259.361526.351965.252015.26
759.26895.32985.36999.25
1012.261203.251259.361526.351965.252015.26
859.35958.36989.36
1025.361123.021256.361523.161952.361999.352015.25
859.35958.36989.36
1025.361123.021256.361523.161952.361999.352015.25
589,36
785,69
898,58
651,48
1001,56
756.24854.25956.36998.65
1002.131103.261230.651523.581856.261956.24
785.69859.65899.29958.63989.65
1025.261066.291250.591563.251965.35
895.36958.29999.361002.351125.251254.361633.251785.361985.592015.69
759.26895.32985.36999.25
1012.261203.251259.361526.351965.252015.26
859.35958.36989.36
1025.361123.021256.361523.161952.361999.352015.25
569,36
955,69
996,58
651,48
1561,56
756.24854.25956.36998.65
1002.131103.261230.651523.581856.261956.24
756.24854.25956.36998.65
1002.131103.261230.651523.581856.261956.24
785.69859.65899.29958.63989.65
1025.261066.291250.591563.251965.35
785.69859.65899.29958.63989.65
1025.261066.291250.591563.251965.35
895.36958.29999.361002.351125.251254.361633.251785.361985.592015.69
895.36958.29999.361002.351125.251254.361633.251785.361985.592015.69
759.26895.32985.36999.25
1012.261203.251259.361526.351965.252015.26
759.26895.32985.36999.25
1012.261203.251259.361526.351965.252015.26
859.35958.36989.36
1025.361123.021256.361523.161952.361999.352015.25
859.35958.36989.36
1025.361123.021256.361523.161952.361999.352015.25
569,36
955,69
996,58
651,48
1561,56
546,45
576,32
678,09
897,98
1002,56
789,67876,43987,49999,12
1018,981342,341597,091678,971987,652202,22
712,43750,09812,34933,66978,55
1207,451327,871387,231505,721678,061835,791944,55
516,90634,79612,75752,93879,89999,78
1134,481368,841596,281675,891888,44
809,89878,78956,56994,83
1059,011166,991234,561345,781423,671624,971777,221878,38
712,43750,09812,34933,66978,55
1207,451327,871387,231505,721678,061835,791944,55
Stratégie d’identification des protéines par listes de masses
Liste de masses expérimentale
Spectres MS/MS
MS MS/MS
546,45
576,32
678,09
897,98
1002,56
789,67876,43987,49999,12
1018,981342,341597,091678,971987,652202,22
712,43750,09812,34933,66978,55
1207,451327,871387,231505,721678,061835,791944,55
516,90634,79612,75752,93879,89999,78
1134,481368,841596,281675,891888,44
809,89878,78956,56994,83
1059,011166,991234,561345,781423,671624,971777,221878,38
712,43750,09812,34933,66978,55
1207,451327,871387,231505,721678,061835,791944,55
Digestion trypsique et fragmentation in silico
Banque protéique
RFEDDFHEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS
CCFDSDFRGTHTTYIPLMRKMDEASCVNFJRPQSDGHLKITYPMNVCDSDFRAQSDFERTGGHPLMNVFFRDSQACVSDEFRHKITPLFMDLMFPRTEQASSCVFHDNRTIPLYMTIFKGSREFDYAGSRHEYD
DFHEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS
DFFSDFFIRLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD
FDSFIRLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD
IRLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD
IRMLKLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD
VFGNDFHEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS
FGEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS
RFEDDFHEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS
CCFDSDFRGTHTTYIPLMRKMDEASCVNFJRPQSDGHLKITYPMNVCDSDFRAQSDFERTGGHPLMNVFFRDSQACVSDEFRHKITPLFMDLMFPRTEQASSCVFHDNRTIPLYMTIFKGSREFDYAGSRHEYD
DFHEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS
DFFSDFFIRLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD
FDSFIRLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD
IRLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD
IRMLKLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD
VFGNDFHEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS
FGEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS
Comparaison des listes de masses MS et MS/MS
Listes de masses théoriques
Protéine B Protéine CProtéine A756.24854.25956.36998.65
1002.131103.261230.651523.581856.261956.24
785.69859.65899.29958.63989.65
1025.261066.291250.591563.251965.35
895.36958.29999.361002.351125.251254.361633.251785.361985.592015.69
759.26895.32985.36999.25
1012.261203.251259.361526.351965.252015.26
859.35958.36989.36
1025.361123.021256.361523.161952.361999.352015.25
589,36
785,69
898,58
651,48
1001,56
756.24854.25956.36998.65
1002.131103.261230.651523.581856.261956.24
756.24854.25956.36998.65
1002.131103.261230.651523.581856.261956.24
785.69859.65899.29958.63989.65
1025.261066.291250.591563.251965.35
785.69859.65899.29958.63989.65
1025.261066.291250.591563.251965.35
895.36958.29999.361002.351125.251254.361633.251785.361985.592015.69
895.36958.29999.361002.351125.251254.361633.251785.361985.592015.69
759.26895.32985.36999.25
1012.261203.251259.361526.351965.252015.26
759.26895.32985.36999.25
1012.261203.251259.361526.351965.252015.26
859.35958.36989.36
1025.361123.021256.361523.161952.361999.352015.25
859.35958.36989.36
1025.361123.021256.361523.161952.361999.352015.25
589,36
785,69
898,58
651,48
1001,56
756.24854.25956.36998.65
1002.131103.261230.651523.581856.261956.24
785.69859.65899.29958.63989.65
1025.261066.291250.591563.251965.35
895.36958.29999.361002.351125.251254.361633.251785.361985.592015.69
759.26895.32985.36999.25
1012.261203.251259.361526.351965.252015.26
859.35958.36989.36
1025.361123.021256.361523.161952.361999.352015.25
569,36
955,69
996,58
651,48
1561,56
756.24854.25956.36998.65
1002.131103.261230.651523.581856.261956.24
756.24854.25956.36998.65
1002.131103.261230.651523.581856.261956.24
785.69859.65899.29958.63989.65
1025.261066.291250.591563.251965.35
785.69859.65899.29958.63989.65
1025.261066.291250.591563.251965.35
895.36958.29999.361002.351125.251254.361633.251785.361985.592015.69
895.36958.29999.361002.351125.251254.361633.251785.361985.592015.69
759.26895.32985.36999.25
1012.261203.251259.361526.351965.252015.26
759.26895.32985.36999.25
1012.261203.251259.361526.351965.252015.26
859.35958.36989.36
1025.361123.021256.361523.161952.361999.352015.25
859.35958.36989.36
1025.361123.021256.361523.161952.361999.352015.25
569,36
955,69
996,58
651,48
1561,56
546,45
576,32
678,09
897,98
1002,56
789,67876,43987,49999,12
1018,981342,341597,091678,971987,652202,22
712,43750,09812,34933,66978,55
1207,451327,871387,231505,721678,061835,791944,55
516,90634,79612,75752,93879,89999,78
1134,481368,841596,281675,891888,44
809,89878,78956,56994,83
1059,011166,991234,561345,781423,671624,971777,221878,38
712,43750,09812,34933,66978,55
1207,451327,871387,231505,721678,061835,791944,55
Identification de la protéine B
Stratégie d’identification des protéines par listes de masses
Identification de la protéine impossible avec les recherches classiques par comparaison de listes de masses dans les banques de protéines
90% d'homologie MSASETTSASASRGLSYRDFDVDIEAGDALVDVIKPFAKRTLRENHKM
GIGGFGALFEISKKYQEPVLVSMTDGVGTKLKPAFALNRHDTVGQDLV
ATSVNDILVQGAEPLFFEDYFACGKLDVETAATVIKGIAQGCEAAGCAL
IGGETAEMPSSYPAGEYDQDFFAVGAVEKRKIIDGTTIACGDVVLGCVS
SGAHSNGYSLVRKIIEVSRPDLNADFHGQRLQDAIMAPTRIYVKPLLALI
WKLPVKGMAHITGGGLVENVPRVDRAYVTAVLHQDAWTLPPLFQWLQ
KAGNVADDEYHRVFNCGIGMFDIVSAADAPAAIAHLKDAGETVYCVGEI
Protéine présente dans les banques protéiques
Elongation factor de Cenibacter arsenoxidans
Protéine étudiée absente des banques de données
MSASETPSASASRGLSYRDAGVDIEAGDALVDRIKPFAKRTLREGVLG
GIGGFGALFEISKKYQEPVLVSGTDGVGTKLKLAFALNRHDTVGQDLV
AMSVNDILVQGAEPLFFLDYFACGKLDVDTAATVIKGIAQGCELAGCAL
IGGETAEMPSMYPAGEYDLAGFAVGAVEKRKIIDGTTIACGDVVLGLAS
SGAHSNGYSLVRKIIEVSRPDLNADFHGQRLQDAIMAPTRIYVKPLLALI
DKLPVKGMAHITGGGLVENVPRVLPEGVTAVLHQDAWTLPPLFQWLQ
KAGNVADDEMHRVFNCGIGMIVIVSAADAPAAIAHLKDAGETVYQIGEIRI
Elongation factor de Ralstonia solanacearum
Particularité de cette étude :Le génome de Cenibacter arsenoxidans n’était pas séquencé
les protéines absentes des banques de données
1254.6034 Da
1220.6157 Da
MALDI-MS
Modification de la masse du peptide trypsique
1220.6157 Da
933,66
978,55
1254,60
1327,87
1387,23
1505,72
1678,06
1835,79
1944,55
Ne participe plus à l’identification
Nano-LC-MS-MS
Modification de la masse du parent et de la masse des fragments
Ne participe plus à l’identification
678,09
897,98
1254.60
516,90634,79612,75752,93879,89999,78
1134,481368,841596,281675,891888,44
809,89878,78956,56994,83
1059,011166,991234,561345,781423,671624,971777,221878,38
712,43750,09812,34933,66978,55
1207,451327,871387,231505,721678,061835,791944,55
Ralstonia solanacearum
ELMVIYDSER Modification du peptide
ELPVIYDSER
Cenibacter arsenoxidans
Les protéines étudiées doivent être présentes dans les banques de données
ou au moins présenter de très fortes homologies avec celles présentes
Modification de la masse du peptide trypsique
1220.6157 Da
Identification impossible
Ne participe plus à l’identification
Modification de la masse du parent et de la masse des fragments
ELMVIYDSER Modification du peptide
ELPVIYDSER
Ne participe plus à l’identification
MALDI-MS
933,66
978,55
1254,60
1327,87
1387,23
1505,72
1678,06
1835,79
1944,55
Nano-LC-MS-MS
678,09
897,98
1254.60
516,90634,79612,75752,93879,89999,78
1134,481368,841596,281675,891888,44
809,89878,78956,56994,83
1059,011166,991234,561345,781423,671624,971777,221878,38
712,43750,09812,34933,66978,55
1207,451327,871387,231505,721678,061835,791944,55
1254.6034 Da
1220.6157 Da
Cenibacter arsenoxidans
Ralstonia solanacearum
100 200 300 400 500 600 700 800 900 1000 1100 1200 1300 1400 1500 1600 1700 1800 1900 2000 2100M/z0
100
%
Riz 370q014108fd MaxEnt 3 150 [Ev-65198,It50,En1] (0.050,200.00,0.200,1400.00,2,Cmp) 2: TOF MSMS 981.82ES+
R G D S F L L L A P G D W A E M GQ yMax1962.71(M+H) +
186.07b2
159.08W
1145.51y11
232.12y2
981.79581.19
y5434.13
y4
332.09347.13
y3
517.14;b5
694.28y6
633.22
807.34y7
703.22b6
743.27
818.20b7
1088.51y10
1033.41
1260.54y12
1146.60
1161.53
1446.62y13
1261.45
1944.791777.63y16
1517.71y14 1646.63
y15 1840.00
1963.87
1965.052049.75
Recours à une stratégie de séquençage de novo des spectres MS/MS
Déduction d’un tag de séquence en acides aminés : QGMEAWDGPALLLFSDGR
Séquençage de novo
100 200 300 400 500 600 700 800 900 1000 1100M/z0
100
%
SPOT 6701q011296cc MaxEnt 3 61 [Ev-268747,It50,En1] (0.050,200.00,0.200,1400.00,2,Cmp) 2: TOF MSMS 552.19ES+
E E F A A A Q PL Q bMax Q L P Q A A A F E E yMax
845.44y8627.33
y6556.32y5
459.16357.23
y3
259.08b2
120.07F
102.04a1E
147.10y1
241.07
231.09a2
219.10
191.11 339.21
388.12
423.16
530.19
485.29y4 601.22
698.37y7
628.24 729.28
775.08
1103.47(M+H) +
1085.49
846.341067.48
957.40b9935.36
969.41
1104.33
1109.40
100 200 300 400 500 600 700 800 900 1000 1100 1200 1300 1400 1500 1600M/z0
100
%
SPOT 3007q011292cc MaxEnt 3 6 [Ev-48966,It50,En1] (0.050,200.00,0.200,1400.00,3,Cmp) 2: TOF MSMS 493.55ES+
TT L Y H N P A C GTSR bMax R S T G C A P N H Y L T T yMax
1477.55(M+H) +
580.25y5
175.11a2y1
130.09
110.06H
203.10b2
420.22y4
252.11 414.20
349.15
493.24
487.14
500.25
1275.58a12y11
748.33y7
730.36b6
712.31638.35
999.38y9
862.36y8
839.35985.23
973.50
1162.52y10
1000.301159.60
1145.47
1173.50
1459.60
1276.47 1415.581376.63
y12
1478.70
1495.79
1581.451587.77
100 150 200 250 300 350 400 450 500 550 600 650 700 750 800 850 900 950 1000 1050 1100 1150M/z0
100
%
SPOT 6701q011296cc MaxEnt 3 16 [Ev-36759,It50,En1] (0.050,200.00,0.200,1400.00,2,Cmp) 3: TOF MSMS 543.23ES+
HC F A A A Q P LQ bMax Q LP Q A A A F CH yMax
459.16b4
357.23y3
120.07F
58.12
147.10y1
219.09191.11 315.14241.06
b2
388.11b3
423.16
556.32y5
530.19b5
485.29y4
627.31y6
601.23b6
557.38
845.41y8
698.33y7
628.37
631.18
713.32775.13
827.33
917.14846.51 1085.54(M+H) +969.42
1054.25 1113.51
100 200 300 400 500 600 700 800 900 1000 1100 1200M/z0
100
%
SPOT 3007q011292cc MaxEnt 3 72 [Ev5495,It50,En1] (0.050,200.00,0.200,1400.00,2,Cmp) 2: TOF MSMS 600.30ES+
PS E L V L D V LSK bMax K S L V D L V L E S P yMax
258.01
214.03
185.09b2
129.10
276.02 426.97b4
514.94 853.42b8627.19551.10
674.38y6 1015.62
y9891.64
1103.52 1277.581184.61
Détermination de plusieurs tags de séquence:TYNVLFLCTGNSAR-FVAYSAGSHPGGTVNPFAIEQIK-
STGYALENLR-AVFSKIAK-VNLLNSLPLAMLEKTALK-EMDAIGSSK
+
100 200 300 400 500 600 700 800 900 1000 1100 1200 1300 1400M/z0
100
%
Spot 1q014728cc MaxEnt 3 49 [Ev-122168,It50,En1] (0.050,200.00,0.200,1400.00,2,Cmp) 3: TOF MSMS 698.78ES+
S I M A E A M I N T MGK bMax K G M T N I M A E A M IS yMax
201.12b2
104.09M
1196.53y11332.15
b3
204.13y2
287.13
272.14
865.38y8
794.37y7663.33
y6550.25
y5403.20b4
514.24 585.25
716.33
1065.47y10
994.46y9
866.45
976.48 1066.55
1067.41
1197.62
1378.561198.46
MS/MS spectrum of the parent ion m/z = 698.78 (retention time=28.1min)
Détermination d’un tag de séquence : SIMAEAMINTMGK
Résultat
Soumission au MS-BLAST
Identification par homologie de séquence : tolérance aux variations dans les séquences
Résultats obtenus grâce à l’utilisation de cette stratégie par séquençage de novo
2_ Réalisation d’une carte protéomique complète de Cenibacter arsenoxidans
Gel coloré à l’argent (Evelyne Turlin)Carrotage systématique
Analyse de 437 spots en nanoLC-MS/MS
Possible grâce au séquençage du
génome!
Utilisation du génome brut
-3.424.326 paires de bases
- 1370 pages
- 1 seule séquence
Traduction dans les 6 cadres de lecture
Fragmentation de ce génome et création d’une banque au format Fasta
Fichier d’entrée : genome.txt
Banque au format fasta comprenant des segments de 7500 bases avec des recouvrements de séquence de 2500 bases.
Analyse nanoLC-MS/MS
Protéine identifiée sur le segment
113Spécificité suffisante pour l’identification de
la région codante
Identification de la fonction
Extraction des peptides identifiés et soumission au MS-BLAST
Souvent par homologie chez Ralstonia solanacearum
Identification de la fonction de la protéine
Analyse MALDI-TOF-MS et recherche par « empreinte peptidique massique »
Pas d’identification possible car beaucoup de
faux positifs !
Stratégie par séquençage de novo
= identification des protéines d’intérêt avec 3, 4 ou 5 peptides par protéine
Environ 60 minutes de traitement par analyse
+
Traitement par PEAKS BLAST
Recherche dans le génome complet Séquençage de novo
Comparaison des résultats des 2 stratégies
Lors de la recherche dans le génome complet, on a le maximum d’informations
Comparaison des méthodes de recherche
Méthode classique
Recherche dans les banques protéiques
(SwissProt+TrEMBL+TrEMBLnew)
Pas de résultats dans la plupart des cas ou des résultats sans
grande confiance
Recherche dans le génome
1/ Recherche dans le génome
Identification avec 5 à 15 peptides par protéine
2 / BLAST
Durée : 5 minutes
Identification avec 3, 4 ou 5 peptides par protéine
Stratégie de novo
1/ Traitement avec PEAKS
2 / BLAST
Durée : 60 minutes
3/ Vérification des séquences
4/ BLAST de vérification
Résultats obtenus
384 sur les 437 spots ont été analysés en nanoLC-MS/MS sur deux systèmes :- un systéme CapLC/Q-TOF II de Waters
- un système nanoLC Agilent (1100 series)/trappe ionique HCTPlus (Bruker Daltonics)
250 analyses sont déjà interprétées
Projet DESS de Michael Heymann
Automatisation de ces travaux d’interprétation, lancement des BLASTs en batch, …
Annotation du génome, confrontation des résultats de
l’annotation automatique/résultats protéomiques :
PROTEOGENOMIQUE
Remerciements :
Emmanuelle LEIZE
Alain VAN DORSSELAER
Philippe BERTIN
Daniel MULLER
Marie-Claire LETT
Michael HEYMANN
Evelyne TURLIN
Suite des résultats du différentiel
Stratégie d'identification des protéines par « empreinte peptidique massique » (PMF)
Banque protéiqueCCFDSDFRGTHTTYIPLMRKMDEASCVNFJRPQSDGHLKITYPMNVCDSDFRAQSDFERTGGHPLMNVFFRDSQACVSDEFRHKITPLFMDLMFPRTEQASSCVFHDNRTIPLYMTIFKGSREFDYAGSRHEYD
DFHEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS
DFFSDFFIRLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD
FDSFIRLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD
IRLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD
IRMLKLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD
VFGNDFHEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS
RFEDDFHEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS
FGEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS
Spectre MALDI-TOF
Listes de masses théoriques
Digestion trypsique in silico
789,67876,43987,49999,12
1018,981342,341597,091678,971987,652202,22
A C516,90634,79612,75752,93879,89999,78
1134,481368,841596,281675,891888,44
B712,43750,09812,34933,66978,55
1207,451327,871387,231505,721678,061835,791944,55
F543,89691,86699,88746,92777,49855,38867,32900,99933,73
1116,941269,571424,541532,73
E809,89878,78956,56994,83
1059,011166,991234,561345,781423,671624,971777,221878,38
G------------------------
--546,45676,32678,09897,98
1002,561152.301198.651201.321230,781564,901678,091876,862009,76
Liste de masses expérimentale546,45576,32678,09897,98
1002,561152.301198.651211.321234,781564,901678,091876,862009,76
Comparaison par un moteur de recherche type Mascot
Stratégie d'identification des protéines par « empreinte peptidique massique » (PMF)
Banque protéiqueCCFDSDFRGTHTTYIPLMRKMDEASCVNFJRPQSDGHLKITYPMNVCDSDFRAQSDFERTGGHPLMNVFFRDSQACVSDEFRHKITPLFMDLMFPRTEQASSCVFHDNRTIPLYMTIFKGSREFDYAGSRHEYD
DFHEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS
DFFSDFFIRLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD
FDSFIRLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD
IRLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD
IRMLKLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD
VFGNDFHEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS
RFEDDFHEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS
FGEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS
Spectre MALDI-TOF
Liste de masses expérimentalesDigestion
trypsique in silico
789,67876,43987,49999,12
1018,981342,341597,091678,971987,652202,22
A C516,90634,79612,75752,93879,89999,78
1134,481368,841596,281675,891888,44
B712,43750,09812,34933,66978,55
1207,451327,871387,231505,721678,061835,791944,55
F543,89691,86699,88746,92777,49855,38867,32900,99933,73
1116,941269,571424,541532,73
E809,89878,78956,56994,83
1059,011166,991234,561345,781423,671624,971777,221878,38
G------------------------
--
Listes de masses théoriques
546,45676,32678,09897,98
1002,561152.301198.651201.321230,781564,901678,091876,862009,76
546,45576,32678,09897,981002,561152.301198.651211.321234,781564,901678,091876,862009,76
Identification de la protéine F
Comparaison par un moteur de recherche type Mascot
Le peptide trypsique
NH3+
C
C
R1
O
NH
C
C
NH
R2
O
C
C
R3
O
NH
C
C
OOH
CH2
(CH2)3
NH3+
Se termine par une Lysine ou une Arginine donc 2 sites basiques protonables par peptide : le NH2 terminal et le NH2 de la chaîne latérale de la Lys ou de l’Arg
Lysine
CH
R1
R2
CO NH
a b c
x y z
NH2 CH CO NH CH COOH
R3CH2
v w
d
Règles de fragmentation des peptides Biemann, 1990
Ions de série a, b et c : charge positive portée par la partie N-terminal
Ions de série x, y et z : charge positive portée par la partie C-terminal
Ions de série d, v et w : fragmentation des chaînes latérales
Fragmentations basse énergie
Fragmentations haute énergie
Biemann K., Appendix 5, Nomenclature for peptide fragment ions (positive ions), Methods Enzymol, 1990, 193, 886-7
+ALLLFSDGR+
Fragmentation des peptides : La loi du proton mobile
+ALLLFSDGR+
+ALLLFSDGR+
+ALLLFSDGR+
+ALLLFSDGR+
Fragmentation dans la cellule de collision
Les peptides ne cassent qu'une seule fois pour générer préférentiellement les fragments y et b
+ALLLFSDGR+
+ALLLFSDGR+
Dongré et al., Journal of Mass Spectrometry, Vol. 31, 339-350 (1996)
+A+AL+ALL+ALLL+ALLLF+ALLLFS+ALLLFSD+ALLLFSDG
Fragments b
LLLFSDGR+
LLFSDGR+
LFSDGR+
FSDGR+
SDGR+
DGR+
GR+
R+
Fragments y