84
Développement d'une méthode de prédiction de l'orientation et de l'insertion des protéines dans une membrane modèle Mémoire Andrei Tudor Maîtrise en biochimie Maître ès sciences (M. Sc.) Québec, Canada © Andrei Tudor, 2016

Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

  • Upload
    vutuong

  • View
    215

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

Développement d'une méthode de prédictionde l'orientation et de l'insertion des protéines

dans une membrane modèle

Mémoire

Andrei Tudor

Maîtrise en biochimieMaître ès sciences (M. Sc.)

Québec, Canada

© Andrei Tudor, 2016

Page 2: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames
Page 3: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

Résumé

Les protéines membranaires intégrales jouent un rôle indispensable dans la

survie des cellules et 20 à 30% des cadres de lectures ouverts codent pour cette

classe de protéines. La majorité des protéines membranaires se trouvant sur la

Protein Data Bank n’ont pas une orientation et une insertion connue. L’orientation,

l’insertion et la conformation que les protéines membranaires ont lorsqu’elles

interagissent avec une bicouche lipidique sont importantes pour la compréhension

de leur fonction, mais ce sont des caractéristiques difficiles à obtenir par des

méthodes expérimentales. Des méthodes computationnelles peuvent réduire le

temps et le coût de l'identification des caractéristiques des protéines

membranaires. Dans le cadre de ce projet de maîtrise, nous proposons une

nouvelle méthode computationnelle qui prédit l’orientation et l’insertion d’une

protéine dans une membrane. La méthode est basée sur les potentiels de force

moyenne de l’insertion membranaire des chaînes latérales des acides aminés

dans une membrane modèle composèe de dioléoylphosphatidylcholine.

iii

Page 4: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames
Page 5: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

Abstract

Integral membrane proteins play many important roles, and account for 20

to 30% of the open reading frames code for this class of proteins. Most of the

membrane proteins found on the Protein Data Bank do not have a known

membrane orientation and insertion, and such information is not available from the

standard PDB format. The orientation, insertion and conformation that the

membrane proteins have when interacting with a lipid bilayer are important for

understanding their functions, but they are difficult characteristics to obtain

experimentally. Computational methods can help reduce the cost and time

allocated to determine the characteristics of a membrane protein. In this project,

we propose a new computational method that predicts the orientation and the

insertion of a protein in a lipid bilayer. The method is based on the potential mean

force of the insertion of the amino acid side chain analogs in a

dioleoylphosphatidylcholine lipid bilayer.

v

Page 6: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames
Page 7: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

Table des matières

Résumé ..................................................................................................................... iiiAbstract ...................................................................................................................... vTable des matières ................................................................................................... viiListe des figures ........................................................................................................ ixListe des abréviations .............................................................................................. xiiiRemerciements ........................................................................................................ xvChapitre 1 : Introduction ............................................................................................. 1

1.1 Membranes ...................................................................................................... 11.2 Phospholipides ................................................................................................ 11.3 Membranes modèles ....................................................................................... 31.4 Protéines membranaires ................................................................................. 41.5 Les méthodes expérimentales ......................................................................... 71.6 Les méthodes computationnelles .................................................................. 10

Chapitre 2 : Hypothèse et Objectif ........................................................................... 152.1 Hypothèse ...................................................................................................... 152.2 Objectif ........................................................................................................... 15

Chapitre 3 : Méthodes .............................................................................................. 173.1 Théorie ........................................................................................................... 173.2 Calcul des PMF ............................................................................................. 19

3.2.1 Informations sur les simulations ............................................................. 213.3 Calcul du score .............................................................................................. 223.4 Méthodes utilisées par MemP3 ..................................................................... 253.5 Approximations nécessaires .......................................................................... 283.6 Méthodologie de la validation ........................................................................ 29

Chapitre 4 : Résultats ............................................................................................... 314.1 Peptide modèle .............................................................................................. 324.2 Protéines équilibrées par dynamique moléculaire ........................................ 34

4.2.1 Caveoline 1 ............................................................................................. 344.2.2 Protéine liant le retinol chez le bovin (PDB: 1KT7) ................................ 354.2.3 Src Homology 3 domain (PDB: 1SHG) ................................................. 384.2.4 Canal Potassium KvAP (PDB: 1ORS) ................................................... 394.2.5 Outer membrane protein W (PDB: 2F1V) .............................................. 414.2.5 Synaptotagmine C2B ............................................................................ 444.2.6 Cytochrome P450 3A4 ........................................................................... 464.2.7 Cytochrome P450 2C9 ........................................................................... 484.2.9 OMPLA (PDB: 1QD6) ............................................................................. 50

4.3 Limites de la méthode ................................................................................... 524.3.1 Hémoglobine tronquée (trHbN) - simulations de dynamique moléculaire ......................................................................................................................... 524.3.2 Hémoglobine tronquée (trHbN) - PDB 1IDR .......................................... 534.3.3 Peptide de fusion du virus de l’influenza (FusPept) - simulations de dynamique moléculaire ................................................................................... 544.3.4 Peptide de fusion du virus de l’influenza (FusPept) - PDB 1IBN ........... 55

vii

Page 8: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

Chapitre 5 : Discussion ............................................................................................ 575.1 Précision de la méthode ................................................................................ 585.2 Limites de la méthode ................................................................................... 595.3 Vitesse de prédiction ..................................................................................... 62

Chapitre 6 : Conclusion et Perspectives .................................................................. 636.1 Conclusion ..................................................................................................... 636.2 Perspectives .................................................................................................. 64

Bibliographie ............................................................................................................ 67

viii

Page 9: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

Liste des figures

Figure 1 : Exemple de membrane biologique. La membrane biologique d’une cellule est composée de phospholipides, de protéines membranaires (périphériques et transmembranaires), de cholesterol et d'oligosaccharides. Image adaptée de WikiCommons (https://commons.wikimedia.org/wiki/File: CellMembraneDrawing.jpg).....2

Figure 2 : Structure générale d’un phospholipide. La composition d’un phospholipide dépend de la nature de la molécule liée au groupement phosphate en position R3, ainsi que la nature des chaînes aliphatiques (R1 et R2) qui sont liées au glycérol à l’aide des groupements carbonyles. Image construite à l’aide du logiciel Marvin Sketch, ChemAxon (http://www.chemaxon.com)....................................................3

Figure 3 : Représentation d’une membrane modèle de POPC. En bleu foncé est représentée la phase aqueuse, les sphères rouges représentent les atomes d’oxygène et du glycérol, les sphères orange représentent les atomes de phosphate et les sphères grises représentent les atomes de carbone (les atomes d’hydrogène sont omis pour plus de clarté).............4

Figure 4 : Représentation d’une protéine périphérique et une transmembranaire. Image adaptée de WikiCommons ( https://commons.wikimedia.org/wiki/File:Cell_membrane_scheme.png )....................................................................................................................5

Figure 5 : Graphique du PMF d’insertion membranaire de la chaîne latérale des acides aminés lysine et alanine en fonction de la position en Z. L’énergie d’insertion est représentée selon l’axe X, et la position d’insertion selon lanormale du plan de la membrane est indiquée selon l’axe Z. Une énergie d’insertion positive est défavorable. Le centre de la membrane est situé àZ = 0 Å, et l’interface de la membrane se retrouve à Z ≈ 20Å. Les valeurs de PMF sont tirées des travaux de MacCallum et Tieleman (18)............14

Figure 6: L’acide aminé valine avec l’analogue de sa chaîne latérale. La chaîne latérale de l’acide aminé valine est tronquée au carbone β et la liaison avec le carbone α est remplacée par un proton.......................................20

Figure 7 : Représentation de la surface exposée au solvant (SASA) de la chaîne latérale du résidu LEU3 en présence du squelette protéique et le SASA de la même chaîne latérale seule dans le solvant. (A) La chaîne latérale du résidu LEU3 de la protéine trHbN (PDB: 1IDR) représentée sous forme de bâtonnets (jaune). Les sphères représentent les résidus LEU4 (gauche) et ILE13 (droite) qui influencent le SASA de la chaîne latérale LEU3. Le squelette de la protéine est représenté en cartoon. Les points bleus représentent le SASA de la chaîne latérale du résidu LEU3. (B) Le SASA de la chaîne latérale LEU3 complètement immergée dans le solvant est représenté par les sphères bleues.........................................24

ix

Page 10: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

Figure 8 : Comparaison des prédictions du peptide poly-leucine faites par MemP3 (orange) et par PPM (vert) pour un peptide de poly-leucine formé de 25 résidus. ....................................................................................................33

Figure 9 : Comparaison des prédictions de la calveolin faites par MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu) fournie par Riu et al. (23). La partie A de la figure compare la prédiction de MemP3 avec le positionnement de la structure de référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence...................................................................................................35

Figure 10 : Comparaison des prédictions de la protéine liant le rétinol chez le bovinfaites par MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu) prise sur CGDB (10). La partie A de la figure compare la prédiction de MemP3 avec le positionnement de la structure de référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence............................................37

Figure 11 : Comparaison des prédictions de la protéine Src Homology 3 domain faites par MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu) pris sur CGDB (10). La partie A de la figure compare la prédiction de MemP3 avec le positionnement de la structure de référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence............................................39

Figure 12 : Comparaison des prédictions du canal potassium KvAP faites par MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu) pris sur CGDB (10). La partie A de la figure compare la prédiction de MemP3 avec le positionnement de la structure de référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence...............................................................................41

Figure 13 : Comparaison des prédictions de la protéine Outer membrane protein Wfaites par MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu) pris sur CGDB (10). La partie A de la figure compare la prédiction de MemP3 avec le positionnement de la structure de référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence............................................43

Figure 14 : Comparaison des prédictions de la protéine Synaptotagmine C2B faitespar MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu) fournie par Wu et al. (24). La partie A de la figure compare la prédiction de MemP3 avec le positionnement de la structure de référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence............................................45

Figure 15 : Comparaison des prédictions de la protéine Cytochrome P450 3A4 faites par MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu) fournie par Cojocaru et al. (27). La partie A de la figure

x

Page 11: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

compare la prédiction de MemP3 avec le positionnement de la structure de référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence........................................47

Figure 16 : Comparaison des prédictions de la protéine Cytochrome P450 2C9 faites par MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu) fournie par Berka et al. (26). La partie A de la figure compare la prédiction de MemP3 avec le positionnement de la structure de référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence........................................49

Figure 17 : Comparaison des prédictions de la protéine OMPLA faites par MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu) pris sur CGDB (10). La partie A de la figure compare la prédiction de MemP3 avec le positionnement de la structure de référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence...............................................................................51

Figure 18 : Comparaison des prédictions de la protéine trHbN faites par MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu) fournie par Rhéault et al. (4). La partie A de la figure compare la prédiction de MemP3 avec le positionnement de la structure de référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence...............................................................................53

Figure 19 : Comparaison des prédictions de la protéine trHbN PDB 1IDR faites par MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu) fournie par Rhéault et al. (4). La partie A de la figure compare la prédiction de MemP3 avec le positionnement de la structure de référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence............................................54

Figure 20 : Comparaison des prédictions du peptide de fusion faites par MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu) fournie par Légaré et al. (29). La partie A de la figure compare la prédiction de MemP3 avec le positionnement de la structure de référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence...............................................................................55

Figure 21 : Comparaison des prédictions du peptide de fusion PDB 1IBN faites par MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu) fournie par Légaré et al. (29). La partie A de la figure compare la prédiction de MemP3 avec le positionnement de la structure de référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence............................................56

xi

Page 12: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames
Page 13: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

Liste des abréviations

CD Dichroisme circulaire

CGDB Coarse Grained DataBase

DCLE Dichloroethane

DOPC Dioléoyl phosphatidylcholine

DPPC Dipalmitoyl phosphatidylcholine

DVPC Divaléryl phosphatidylcholine

DVPS Divaléryl phosphatidylsérine

EPR Electron Paramagnetic Resonance

GBSW Generalized Born with simple smoothed SWitching

GLY Glycine

HIS Histidine

HMMM Highly Mobile Membrane Mimetic

ILE Isoleucine

LEU Leucine

MemP3 Membrane Protein Prediction and Positioning

MPEx Membrane Protein EXplorer

MSMS Maximal Speed Molecular Surfaces

NOE Nuclear Overhauser Effect

OCD Dichroisme Circulaire Orienté

OPM Orientation of Proteins in Membranes

ORF Cadres de Lecture Ouverts

OBPC Oléoyl diBromosteroyl Phosphatidylcholine

PDB Protein Data Bank

PMF Potentiel de Force Moyenne

POPC Palmitoyl Oléoyl Phosphatidylcholine

xiii

Page 14: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

PPM Positioning of Proteins in Membranes

PRO Proline

RMN Résonance Magnétique Nucléaire

RMSD Root Mean Square Deviation

SASA Surface Exposée au Solvant

Tcl Tool Command Language

TMDET DETermine TransMembrane planes

VMD Visual Molecular Dynamics

xiv

Page 15: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

Remerciements

J'aimerais remercier en premier mon directeur de recherche Patrick Lagüe.

Il m'a soutenu et conseillé tout le long de ma maîtrise. Il m'a appris l'importance de

la communication et de la rigueur scientifique. Avec son aide je suis devenu un

meilleur écrivain et pour ça je le remercie beaucoup.

Ensuite, je remercie les membres de mon comité aviseur qui sont Stéphane

Gagné et Christian Salesse. Ils m'ont fourni de précieux commentaires lors des

rencontres de ce comité.

Je remercie aussi mes collègues de laboratoire avec lesquels j'ai passé des

merveilleux moments, Xavier Barbeau, Sébastien Légaré, Jean-François Rheault

et Joël Tremblay-Marchand.

Je remercie mes parents, qui ont su me supporter durant mes études et me

pousser toujours plus loin.

J'aimerais remercier ma chère épouse, Andreea Dumitru, qui a toujours été

à mes côtés dans les moments les plus durs et qui comprend mieux que nul autre

le chemin par lequel je suis passé. Je t'aime!

xv

Page 16: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames
Page 17: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

Chapitre 1 : Introduction 

1.1 Membranes

Les membranes biologiques sont des composantes cellulaires complexes

d’une importance capitale pour la fonction et la structure de la cellule (1). En effet,

les membranes cellulaires permettent d’isoler le milieu extracellulaire du milieu

intracellulaire. Par conséquent, elles ont la fonction de contrôler les molécules qui

peuvent passer de l’intérieur vers l’extérieur de la cellule et vice-versa, ainsi

qu’entre l’intérieur de la cellule et l’intérieur de différents organites (1).

Les membranes biologiques sont généralement composées de plusieurs

molécules biologiques (1) : plusieurs types de phospholipides et différentes

protéines (voir Figure 1). Cette composition varie avec le type de tissus duquel la

cellule fait partie, ainsi qu’avec la fonction de la cellule (1). De plus, la composition

membranaire peut aussi varier à l’intérieur de la cellule, d’un organite à un autre

(voir Figure 1).

1.2 Phospholipides

Les membranes eukariotes sont principalement composées d'un type de

lipide appelé phospholipide (Figure 2). Les phospholipides sont des molécules

amphiphiles (1), ce qui leur donne un caractère à la fois hydrophobe et hydrophile

(1). La partie des chaînes aliphatiques (R1 et R2), les acides gras, forme la partie

hydrophobe des phospholipides (1). La partie hydrophile, la tête polaire, est

composée par le groupement R3, le groupement phosphate et le glycérol. Ainsi,

puisque les phospholipides sont composés d’une partie hydrophile et une autre

hydrophobe, ils s’organisent en différentes formes physiques lorsqu’ils sont dans

une solution aqueuse (1). La structure dans laquelle les lipides s’organisent

dépend essentiellement de la forme des lipides, leur type, leur concentration et la

1

Page 18: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

température du mélange. La forme physique employée dans les cellules s'appelle

une bicouche lipidique (1). En effet, en milieu aqueux la partie hydrophile cherche

à être hydratée par les molécules d’eau, tandis que la partie hydrophobe cherche à

fuir les molécules d’eau (1). La formation d’une bicouche lipidique permet aux

parties hydrophiles de rester en contact avec l’eau et aux parties hydrophobes de

rester éloignées de la phase aqueuse (1).

Figure 1 : Exemple de membrane biologique. La membrane biologique

d’une cellule est composée de phospholipides, de protéines membranaires

(périphériques et transmembranaires), de cholesterol et d'oligosaccharides.

Image adaptée de WikiCommons (https://commons .wikimedia.org/wiki/File:

CellMembraneDrawing.jpg)

2

Page 19: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

Figure 2 : Structure générale d’un phospholipide. La composition d’un

phospholipide dépend de la nature de la molécule liée au groupement

phosphate en position R3, ainsi que la nature des chaînes aliphatiques (R1

et R2) qui sont liées au glycérol à l’aide des groupements carbonyles. Image

construite à l’aide du logiciel Marvin Sketch, ChemAxon

(http://www.chemaxon.com)

1.3 Membranes modèles

La membrane modèle est une version simplifiée d’une membrane

biologique. Habituellement, les membranes modèles sont composées d’un seul

type de phospholipide, mais plusieurs types de phospholipides peuvent être

utilisés pour la même membrane. Par contre, plus on ajoute des phospholipides

différents, plus la complexité du système étudié augmente. La structure d’une

3

Page 20: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

membrane modèle composée par le phospholipide palmitoyl oleoyl

phosphatidylcholine (POPC) dans l’état fluide (Lα) est représentée à la Figure 3.

Figure 3 : Représentation d’une membrane modèle de POPC. En bleu foncé

est représentée la phase aqueuse, les sphères rouges représentent les atomes

d’oxygène et du glycérol, les sphères orange représentent les atomes de

phosphate et les sphères grises représentent les atomes de carbone (les

atomes d’hydrogène sont omis pour plus de clarté).

1.4 Protéines membranaires

Pour l'exécution de leur fonction biologique, plusieurs protéines ont besoin

d’être liées à la membrane cellulaire. Ces protéines peuvent être divisées en deux

catégories, soit les protéines intrinsèques, qui traversent la membrane et les

protéines extrinsèques, qui s’accrochent à la surface des membranes cellulaires

(1) (voir Figure 4). Les protéines intrinsèques ou transmembranaires sont des

protéines qui sont fortement liées aux membranes principalement par des forces

hydrophobes. Elles traversent complètement la membrane cellulaire. Les protéines

4

Page 21: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

extrinsèques ou périphériques sont des protéines qui se lient moins fortement aux

membranes que les protéines transmembranaires et lient une seule couche de la

membrane cellulaire.

Figure 4 : Représentation d’une protéine périphérique et une

transmembranaire. Image adaptée de WikiCommons (

https://commons.wikimedia.org/wiki/File:Cell_membrane_scheme.png )

Les protéines transmembranaires représentent seulement 2% des

soumissions de structures sur Protein Data Bank (PDB) (2)

(http://www.rcsb.org/pdb/statistics/holdings.do - consulté le 14 juillet 2015), alors

que 20 à 30 % des cadres de lecture ouverts (ORF) codent pour ces protéines (3).

Comme cette étude (3) ne prend pas en compte les protéines périphériques, on

peut s’attendre que ces pourcentages soient plus élevés. À première vue, on peut

conclure que les protéines membranaires sont sous-représentées dans la banque

PDB. Par contre, il faut considérer la possibilité que des protéines soient présentes

5

Page 22: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

dans la banque PDB qui ne sont pas connues comme étant membranaires. Ceci

peut être dû au manque de connaissance des caractéristiques physiques de

certaines protéines amphipatiques. Dans ce cas, le pourcentage de protéines

membranaires présentes dans la banque PDB pourrait être plus élevé. Par

exemple, il a été récemment démontré que la protéine hémoglobine tronquée

trHbN (PDB 1IDR) est une protéine périphérique (4). Cette protéine était

considérée comme étant soluble avant l’étude de Rhéault et al. (4).

Les membranes influencent la fonction et la structure tridimensionnelle des

protéines membranaires (5, 6), mais il est difficile d’étudier l'interaction entre ces

protéines et les membranes. Compte tenu de la difficulté d’étudier cette interaction

en utilisant des méthodes expérimentales, l’orientation, l’insertion membranaire et

la conformation en présence des lipides d’une partie des structures se trouvant

dans la banque PDB ne sont pas connues. C’est pourquoi le présent projet de

maîtrise consiste à développer un outil pouvant prédire l’insertion et l’orientation

des protéines dans plusieurs membranes modèles. Dans le cadre de ce projetet

dans le but du dévéloppement initial, nous avons utilisé une membrane modèle fait

du phospholypide dioléoyl phosphatidylcholine (DOPC).

Présentement, il existe quelques méthodes computationnelles et

expérimentales qui peuvent être utilisées pour prédire ou déterminer l’orientation et

l’insertion des protéines interagissant avec les membranes. Le texte suivant

présente brièvement les différentes méthodes expérimentales courantes et les

outils computationnels en mettant en évidence leurs forces et leurs faiblesses. Il

sera ensuite question de présenter en détail la théorie et le fonctionnement de

l’outil développé (chapitre 3). Suivra la section des résultats (chapitre 4), la

discussion (chapitre 5) et finalement la conclusion (chapitre 6).

6

Page 23: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

1.5 Les méthodes expérimentales

Les méthodes expérimentales les plus utilisées pour déterminer l’insertion

et l’orientation des protéines membranaires sont la diffraction par rayons X (7), la

résonance magnétique nucléaire (RMN) (8), la fluorescence du tryptophane (8), la

résonance magnétique électronique EPR (8), la spectroscopie infrarouge et le

dichroisme circulaire orienté (8).

La méthode de diffraction par rayons X est utilisée pour déterminer la

structure d’un peptide ou d’une protéine, ainsi que la distribution des lipides les

entourant (7). Essentielement, des faisceaux de rayons X frappent un crystal, ce

qui produit des rayons X diffractés. Ces dérnières frappent un détecteur, ce qui

créé un patron de diffraction. À partir de ce patron, la structure tridimentionelle

d'une protéine peut être calculée. Par exemple, la conformation et l'orientation du

peptide Ac-18A-NH2 dans une bicouche lipidique de type dioléoyl

phosphatidylcholine / oléoyl dibromosteroyl glycero phosphocholine (DOPC/OBPC)

ont été déterminées à l'aide de cette méthode (7). Il a été observé que lorsque le

peptide est présent, il a tendance à être entouré par des lipides de type OBPC

plutôt que DOPC. La méthodologie utilisée consiste dans un premier temps à

déterminer l'orientation des microstructures des lipides ainsi que le niveau

d'hydratation de celles-ci en absence et en présence d'un peptide ou d’une

protéine (7). Dans un deuxième temps, la perturbation de la bicouche lipidique par

le peptide est calculée. Lors de cette étape, la perturbation des lipides est indiquée

par la distribution des liens marqués au brome (Br) (7). Dans un troisième temps,

la position en Z de la paire gaussienne optimale du peptide est calculée. Cette

étape permet de trouver la position du peptide par rapport au centre de la

membrane. La quatrième et dernière étape est la modélisation de la conformation,

la position et l'orientation du peptide. En connaissant la structure du peptide à

l'aide de la diffraction des rayons X et les données qui été obtenues à propos de la

position sur l’axe z et l'orientation du peptide dans la membrane, les scientifiques

ont été capables de positionner, computationnellement, le peptide dans une

7

Page 24: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

membrane (7). La difficultée de la méthode de diffraction par rayons X est l'étape

de la création des crystaux. En effet, dépendant des protéines, la qualitée des

cristaux peut varier, ce qui influence la résolution du modèle atomique résultant du

patron de difffraction.

Les méthodes de RMN peuvent être divisées en deux catégories, soit la

RMN solide et la RMN en solution (8). Les méthodes de RMN solide sont utilisées

pour déterminer la localisation d’un peptide dans une bicouche lipidique (8).

L’orientation peut être calculée indirectement avec des analyses supplémentaires

(8). La bicouche lipidique est orientée avec la normale, donc parallèle à la direction

du champ magnétique. La majorité des peptides étudiés par RMN solide sont des

hélices alpha (8). Les méthodes de RMN liquide permettent de déterminer la

structure d’un petit peptide interagissant avec une micelle, une bicelle ou une

vésicule unilamelaire. La RMN liquide ne permet pas la détermination de

l’orientation et la localisation d’un peptide dans une membrane (8). Pour cela

plusieurs techniques ont été mises au point pour , comme le Nuclear Overhauser

Effect (NOE), Residual Dipolar Couplings et Paramagnetic Relaxation

Enhancement (8).

La méthode de fluorescence du tryptophane profite de la présence du

résidu tryptophane dans les peptides ou les protéines qui se lient aux membranes

pour déterminer leur orientation et leur insertion (8). Le tryptophane agit comme

point d’ancrage entre une protéine et la membrane cellulaire, puisqu’il interagit

avec les molécules d’eau se trouvant à l’interface membranaire (9). Lorsque le

résidu tryptophane s'insère dans une bicouche lipidique, l’émission de

fluorescence se déplace vers des longueurs d’onde plus courtes, ce qui produit

une lumière ultraviolette (8). Le degré d’intensité de la fluorescence peut être

corrélé avec l’insertion du peptide ou de la protéine dans la membrane (8). Comme

cette méthode a besoin de la présence des résidus tryptophane, elle est restreinte

seulement aux peptides et protéines qui en contiennent (8).

La méthode de spectroscopie EPR est utilisée pour observer l’effet d’une

bicouche lipidique sur le temps de relaxation d’un peptide auquel a été ajouté un

8

Page 25: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

marqueue de spin (8). Les résidus du peptide WALP ont été un par un remplacés

par une cystéine, sur laquelle un marqueur de spin est ajouté. Comme l’orientation

de ce peptide est connue, la profondeur d’insertion des résidus peut être calculée

(8). Cette information peut être utilisée pour obtenir l’orientation d’autres peptides.

Les résidus doivent être remplacés un par un par une cystéine (8). Le grand

désavantage de cette méthode est que les peptides étudiés doivent être modifiés,

ce qui est un travail laborieux et les modifications peuvent influencer le

comportement du peptide dans un environnement hydrophobe (8).

La méthode de spectroscopie infrarouge permet de déterminer la présence

de différentes structures secondaires d’un peptide ou d’une protéine,

principalement par l’analyse du groupement carbonyle des lipides (8). En plus de

la structure, l’orientation des éléments de structure secondaire ordonnée dans une

bicouche lipidique peut être déterminée par ATR-IR (Attenuated Total Reflexion

Infrared Spectroscopy) (8).

La méthode de dichroisme circulaire orienté (OCD) est similaire à la

méthode classique de dichroisme circulaire (CD) (8). En effet, dans le cas des

deux méthodes, l’absorption de la lumière polarisée à gauche et à droite est

monitorée. Le CD est utilisé pour déterminer la présence de structures secondaires

d’une protéine ou d’un peptide en fonction des changements de son

environnement (8). Dans le cas de la méthode OCD la lumière polarisée est

envoyée perpendiculairement ou à des angles obliques à la bicouche membranaire

(8). Cela permet d’obtenir des informations non seulement sur la structure de la

protéine, mais aussi sur son orientation et insertion dans la bicouche lipidique.

Ces méthodes expérimentales requièrent un budget important, beaucoup de

temps et ont certaines limitations. Par exemple, les méthodes de RMN solide et

liquide permettent d’obtenir des informations que sur des petits peptides (8). Pour

cela, les méthodes doivent être combinées, ce qui augmente les coûts et le temps

consacré. Pour contrer ce problème et pour étudier les protéines qui sont difficiles,

voire, même impossibles à étudier avec des méthodes expérimentales, des

9

Page 26: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

méthodes de prédiction computationnelles ont été développées.

1.6 Les méthodes computationnelles

Les méthodes computationnelles ont pour objectif de prédire l’insertion et

l’orientation d’une protéine dans une membrane. Les méthodes présentement

disponibles peuvent être séparées en deux catégories : celles qui utilisent la

dynamique moléculaire et celles qui ne l’utilisent pas. Parmi les méthodes utilisant

de la dynamique moléculaire, il y a les simulations tout-atome, les simulations à

gros grains (10) et les simulations de type Generalized Born with simple smoothed

SWitching (GBSW) (11). Parmi les méthodes n’utilisant pas de dynamique

moléculaire il y a la méthode Membrane Protein EXplorer (MPEx) (12), la méthode

Positioning of Proteins in Membranes (PPM) employée par Orientation of Proteins

in Membranes (OPM) (13) et finalement l’algorithme DETermine TransMembrane

planes (TMDET) (14).

La dynamique moléculaire tout-atome permet de calculer toutes les

interactions entre les atomes, étant ainsi la méthode computationnelle la plus

exacte. À cause de la grande quantité de calculs qui doivent être réalisés, cette

méthode est aussi la plus lente. Il est possible d’observer l’insertion d’un peptide

dans une membrane, mais ce processus est très long et requiért des ordinateurs

puissants.

Les modèles à gros grains représentent un petit nombre d’atomes par un

seul objet (15), ce qui permet d’accélérer les calculs. Par exemple, pour

représenter les lipides membranaires, 4 atomes lourds sont groupés en un seul

gros grain (10, 16). En utilisant cette méthode, le nombre d’atomes de la

membrane est diminué considérablement, mais il reste que la puissance de calcul

nécessaire demeure assez grande.

Une troisième méthode utilisant la dynamique moléculaire est le GBSW

10

Page 27: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

(11), qui consiste à remplacer les molécules du solvant (eau et membrane) par un

milieu diélectrique. Avec ces simulations, le temps de calcul peut être plus court

qu’avec le modèle à gros grains, mais cela n’est pas toujours le cas. Un des

désavantages est que la déformation de la membrane causée par la liaison d’une

protéine à une membrane ne peut pas être simulée avec cette méthode (11).

Les méthodes présentées jusqu’ici utilisent la dynamique moléculaire, et

requièrent une puissance de calcul importante, en plus du temps de préparation

des systèmes à simuler, qui requiert beaucoup d’interventions manuelles. Pour

accélérer le processus, des méthodes qui n’utilisent pas la dynamique moléculaire

ont été mises au point. Par contre, ces méthodes ont leurs propres désavantages.

Certaines ne peuvent fonctionner avec des protéines périphériques, comme la

méthode TMDET, alors que d’autres fonctionnent seulement avec un type de

membrane, comme la méthode PPM.

Un premier outil n’utilisant pas de dynamique moléculaire est le logiciel

«Membrane Protein Explorer» (MPEx) (12). Le logiciel offre l’analyse et la

prédiction de structure des protéines transmembranaires contenant des hélices α,

ainsi que des barils β (12). Tout ce que le logiciel nécessite en entrée est la

structure primaire d’une protéine. Dans le cas des hélices α, l’outil calcule

l’hydrophobicité de la protéine et l’énergie libre des hélices, pour déterminer la

portion membranaire. Pour ce qui est des barils β, MPEx utilise l’algorithme de

Wimley (12) pour prédire si des acides aminés formant les feuillets β ou les coudes

font partie de la partie transmembranaire (12). Le plus grand désavantage de cette

méthode est qu’elle fonctionne seulement avec des protéines transmembranaires.

Un autre désavantage est que l’outil ne fournit pas les coordonnées des atomes tel

que prédit.

Il existe aussi la méthode «Positionning of Proteins in Membranes» (PPM).

Cette méthode est utilisée par «Orientation of Proteins in Membranes» (OPM) pour

étudier les protéines membranaires (13). Cette méthode nécessite un fichier PDB

de la structure de la protéine d’intérêt. L’insertion et l’orientation de la protéine sont

obtenues par la minimisation de l’énergie de transfert de ces atomes d’un milieu

11

Page 28: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

aqueux vers un milieu hydrophobe (17). La minimisation emploie la méthode de

minimisation locale Davidon-Fletcher-Powel combinée avec un balayage de grille

(17). Ce balayage permet de déterminer les points de départ de la méthode de

minimisation locale (17). La méthode PPM a été testée avec 24 protéines

transmembranaires qui sont disponibles sur la banque PDB. Leurs résultats sont

plus rapprochés des résultats expérimentaux que ceux des autres méthodes

automatiques présentées ici (13). Cette méthode peut différencier avec une bonne

précision les protéines solubles et celles transmembranaires. Le désavantage de

cette méthode est qu’elle ne tient pas compte de la composition des têtes polaires,

ni la composition des chaînes aliphatiques des lipides.

Une troisième méthode est l’algorithme TMDET (14). Cet outil utilise un

fichier de coordonnés PDB. La première étape est de prédire la surface de la

protéine qui est accessible au solvant. Cela est réalisé par une fonction objective

qui utilise la surface accessible au solvant de la protéine et un vecteur normal pour

définir la membrane. Cette fonction permet de trouver les parties de la protéine qui

se trouvent à l’intérieur de la membrane (14). Ensuite, l’algorithme calcule le

meilleur angle du plan de la membrane cellulaire. Cette méthode a été utilisée pour

analyser toute la base de données PDB et trouver les protéines

transmembranaires, mais elle ne fonctionne pas avec les protéines périphériques.

Ces méthodes rapides (MPEx, PPM et TMDET) ont toutes le même

désavantage, soit l’impossibilité de prédire la conformation des protéines en

présence des lipides. Cela ne peut être prédit qu’avec la dynamique moléculaire.

Lors de ce projet de maîtrise, un outil qui prédit l’orientation et l’insertion des

protéines dans une membrane a été développé. Bien que l’outil développé

n’utilisera pas la dynamique moléculaire, il sera possible de développer une

extension de cet outil qui inclura cette possibilité.

L’outil développé au cours de ce projet de maîtrise est basé sur les PMF

(Potential of Mean Force) d’insertion membranaire des chaines latérales des

acides aminés. Le PMF d’insertion membranaire des chaines latérales des acides

aminés représente la différence d’énergie libre ΔG(z) associée au déplacement

12

Page 29: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

des chaînes latérales des acides aminés entre le solvant et la membrane, selon un

axe normal au plan de la membrane. Dans le cadre de ce projet, les PMF

d’insertion membranaire des chaines latérales des acides aminés calculés dans le

laboratoire du Dr. Peter Tieleman (18) seront utilisées. Un exemple de courbe de

PMF d’insertion membranaire de la chaine latérale de l’alanine se trouve à la

Figure 5. Nous avons nommé l’outil ainsi développé MemP3, qui est une

abréviation de Membrane Protein Prediction and Positionning.

13

Page 30: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

Figure 5 : Graphique du PMF d’insertion membranaire de la chaîne latérale

des acides aminés lysine et alanine en fonction de la position en Z.

L’énergie d’insertion est représentée selon l’axe X, et la position d’insertion

selon la normale du plan de la membrane est indiquée selon l’axe Z. Une

énergie d’insertion positive est défavorable. Le centre de la membrane est situé

à Z = 0 Å, et l’interface de la membrane se retrouve à Z ≈ 20Å. Les valeurs de

PMF sont tirées des travaux de MacCallum et Tieleman (18).

14

Page 31: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

Chapitre 2 : Hypothèse et Objectif 

2.1 Hypothèse

L’utilisation des PMF d’insertion des chaînes latérales des acides aminés

dans les membranes permettra de prédire l’orientation et l’insertion des protéines

lorsqu’elles interagissent avec une membrane. Selon les PMF d’insertion

disponibles, les prédictions pourront être effectuées pour différentes compositions

lipidiques membranaires.

2.2 Objectif

Mettre au point un outil pour déterminer l’orientation et l’insertion d’une

protéine dans une membrane modèle. Cet outil utilisera une structure de protéine

rigide, ainsi que des PMF d’insertion membranaire des chaînes latérales des

acides aminés. De plus, cet outil sera une preuve de concept que l’approche des

PMF fonctionne, et pourra être subséquemment utilisée pour développer une

méthode plus complexe incluant la dynamique moléculaire (cette approche sera

brièvement décrite dans les perspectives, dans le dernier chapitre).

15

Page 32: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames
Page 33: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

Chapitre 3 : Méthodes 

La théorie associée à la méthode développée dans les présents travaux

sera décrite dans la première section du chapitre. Ensuite, tous les détails reliés au

fonctionnement de la méthode seront exposés dans la section suivante.

3.1 Théorie

La méthode de prédiction de l’insertion membranaire des protéines que

nous avons développée est basée sur les PMF d’insertion des chaînes latérales

des acides aminés dans les membranes. En effet, l'hypothèse que nous formulons

est que l’insertion membranaire d’une protéine est dirigée par l’insertion des acides

aminés composant cette dernière. En d’autres mots, l’énergie libre d’insertion

membranaire de la protéine est la somme des énergies libres d’insertion de

chacun des acides aminés la composant, et la position et l’orientation d’équilibre

de la protéine insérée dans la membrane sera celle pour laquelle la somme des

énergies libres de chacun des acides aminés sera minimale. Cette hypothèse

s’apparente à l’hypothèse thermodynamique qui suppose que la séquence des

protéines va diriger naturellement leur repliement dans une configuration native

selon les bases de la thermodynamique (19). De plus, cette approche suppose

aussi une additivité pour laquelle l’énergie effective de liaison membranaire peut

être exprimée selon la somme des énergies individuelles de chacun des acides

aminés. Cette hypothèse d’additivité est couramment utilisée avec succès en

modélisation moléculaire, avec un des exemples les plus éloquents que sont les

champs de forces empiriques (19).

17

Page 34: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

Les différentes étapes de la méthode sont :

1. Calculer le PMF d’insertion membranaire pour chacun des acides aminés

existants. Cette étape n’est effectuée qu’une seule fois, pour une

composition membranaire donnée, et les résultats sont réutilisés à chaque

prédiction réalisée. Suivant cette étape, nous avons une valeur d’énergie

libre d’insertion selon l’insertion membranaire le long de la normale de la

bicouche, pour chacun des acides aminés.

2. Obtenir et préparer le fichier contenant la structure de la protéine.

3. Choisir une position et une orientation de départ relatives à la membrane, et

calculer l’énergie libre d’insertion, soit la somme des énergies libres de

chacun des acides aminés. Cette valeur totale d’énergie libre est associée à

un score. La position de départ de la protéine peut dépendre de l’algorithme

utilisé. Cette variation n’influence aucunement le résultat final.

4. Rechercher la position et l’orientation d'insertion membranaire ayant

l’énergie libre la plus basse, selon les itérations suivantes:

a) Modifier la position et/ou l’orientation d’insertion membranaire de la

protéine.

b) Calculer l’énergie libre d’insertion (ou le score) pour la configuration

actuelle, et la comparer aux configurations précédentes; si la

configuration actuelle possède l’énergie la plus basse, la conserver

en mémoire.

c) Déterminer si la recherche doit être poursuivie ou non.

18

Page 35: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

Les étapes de cette section sont générales et peuvent êtres accomplies en

utilisant différentes méthodes. La prochaine section détaille la méthode utilisée

pour calculer un score associé à l’insertion et l’orientation membranaire d’une

protéine.

Cette section est suivie de deux autres sections, avant de présenter en

détails la méthodologie utilisée par MemP3. Ces deux sections, soit Calcul des

PMF et Calcul du Score, sont nécessaires pour pouvoir expliquer le concept des

potentiels de force moyenne, ainsi que la méthode utilisée pour déterminer la

meilleure position d’une protéine. Par la suite, les méthodes que nous avons

choisies pour accomplir chacune des étapes décrites ci-dessus seront détaillées.

3.2 Calcul des PMF

Le potentiel de force moyenne (PMF) est un type de simulation qui peut être

fait à l’aide des simulations Monte Carlo ou bien à l’aide des simulations de

dynamique moléculaire. Le PMF détermine comment l’énergie libre d'un système

change en fonction d’un paramètre spécifique (20).

Par exemple, le PMF peut déterminer comment l’énergie libre d’un système

varie en fonction de la distance entre deux résidus, ou bien la variation de l’énergie

libre du système au fur et à mesure qu’une protéine est insérée dans une bicouche

lipidique (20). Le PMF peut être calculé en fonction d’une coordonnée

géométrique, ou bien selons la variation d’une donnée énergétique.

Habituellement, les simulations PMF sont exécutées avec une méthode appelée

umbrella sampling, pour pouvoir échantillonner tout l’espace du système, même

lorsque l’énergie libre touche des niveaux qui ne sont pas physiquement possibles

(20).

En utilisant les PMF il est possible de prédire l’orientation et l’insertion d’une

protéine dans une membrane, parce qu’ils représentent toutes les forces étant

19

Page 36: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

appliquées sur un atome à un endroit dans l’espace. Un exemple de PMF de

l’insertion membranaire de la chaîne latérale d’un acide aminé se trouve à la

Figure 5.

Les potentiels de force moyenne (PMF) d’insertion des chaînes latérales

dans une membrane ont été calculés par MacCallum et al. (18) à l’aide des

simulations de dynamique moléculaire, utilisant la méthode appelée umbrella

sampling. Les acides aminés histidine (HIS), glycine (GLY) et proline (PRO) ont été

exclus des calculs de PMF. Les formes neutres et chargées des acides aminés

acide glutamique, acide aspartique, lysine et arginine ont été utilisées pour calculer

les PMF d’insertion membranaire des chaînes latérales.

Les 17 chaînes latérales des acides aminés utilisés ont été tronquées au

carbone β, résultant en des petites molécules analogues. Par exemple, la chaîne

latérale de l’acide aminé valine devient une molécule de propane, montrée à la

Figure 6. GLY et PRO ne sont pas utilisées pour faire les calculs de PMF

d’insertion membranaire des chaînes latérales d’un acide aminé, car GLY et PRO

n’ont pas des petites molécules équivalentes à leurs chaînes latérales. Dans le cas

de l’histidine, il est difficile de faire des calculs de PMF d’insertion membranaire de

sa chaîne latérale, puisque celle-ci a des multiples états de protonation.

Figure 6: L’acide aminé valine avec l’analogue de sa chaîne latérale. La

chaîne latérale de l’acide aminé valine est tronquée au carbone β et la liaison

avec le carbone α est remplacée par un proton.

20

Page 37: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

3.2.1 Informations sur les simulations

La membrane modèle utilisée pour les calculs de PMF par MacCalum et

Tieleman est composée des phospholipides DOPC. Le système simulé contient 64

molécules de DOPC, 32 molécules par couche de la membrane modèle, ainsi que

deux chaînes latérales d’un même résidu (18). Tout dépendant du système, le

nombre d’atomes est d’environs 11 900. Les simulations ont été exécutées avec le

logiciel de dynamique moléculaire GROMACS 3.3.1, avec le champ de forces

Berger pour les molécules de DOPC et le champ de forces OPLS-All Atoms pour

les analogues des chaînes latérales des acides aminés (18). Comme modèle de

molécule d’eau, le Simple Point Charge a été utilisé. La température du système

simulé a été gardée à 298 K pendant toute la durée de la simulation en utilisant un

algorithme de couplage faible, avec une constante de couplage de 0.1 ps. La

pression du système a été gardée constante à 1 bar à l’aide d’un algorithme de

couplage faible semi-isotropique, avec une constante de couplage de 1 ps. La

longueur des liens, ainsi que les angles des molécules d’eau ont été contraints

avec l’algorithme SETTLE (18). Tous les autres liens et angles ont été contraints

avec l’algorithme LINCS. Ce dernier algorithme permet d’utiliser un time-step de 2

fs. Les interactions électrostatiques ont été évaluées avec la méthode de smooth

particle mesh Ewald avec un seuil de 1 nm (18).

Chaque simulation contient 2 copies du même analogue de la même chaîne

latérale d’un acide aminé donné, une de chaque côté de la bicouche lipidique. La

méthode de dynamique moléculaire Umbrella sampling a été utilisée avec une

force constante de 3000 kJ*mol-1*nm-2 appliquée entre le centre de masse de la

chaîne latérale et le centre de la membrane, dans la direction de la normale de la

bicouche lipidique (18). Les deux chaînes latérales ont été ajoutées dans le

système de façon à ce que lorsqu’une est dans l’eau, l’autre se trouve au centre de

la bicouche membranaire. Au total, 38 simulations ont été exécutées pour chaque

chaîne latérale pour environ 30 ns par simulation, pour un total de 20 µs de temps

de simulation (18).

21

Page 38: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

Les simulations de la chaîne latérale du tryptophane ainsi que celles des résidus

chargés ou polaires ont été simulées pendant 80 ns chacune, afin d’obtenir des

marges d’erreur acceptables.

Les valeurs de PMF d’insertion membranaire des chaînes latérales des

acides aminés sont utilisées pour calculer l’énergie globale qui est associée à une

position de la protéine. Ce calcul est détaillé dans la section suivante (Calcul du

score).

3.3 Calcul du score

Le calcul du score associé à une position de la protéine dans la membrane

est un point central de la méthode de prédiction. La valeur du score est en quelque

sorte une valeur d’énergie libre d’insertion membranaire, qui varie en fonction de la

position en z de la protéine et l’orientation � de celle-ci, ce qui est noté ΔGt(z, �).

L’énergie libre ΔGt(z, �) est calculée à l’aide de l’équation 1 :

Équation 1 :

Équation 2 :

Cette énergie libre ΔGt(z, )� correspond à la somme des énergies libres de

chaque chaîne latérale d'acides aminés ΔGi(z) normalisé par la valeur relative de

surface de la chaîne latérale exposée au solvant (Srel,i).

Dans l’équation 1, l’énergie libre d’une chaîne latérale d’un acide aminé

ΔGi(z) est extraite à partir des données PMF d’insertion membranaire des chaînes

latérales des acides aminés en fonction de la position en z du centre de masse de

22

Page 39: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

la chaîne latérale d’un acide aminé, tel que décrit dans la section Calcul des PMF.

Le centre de masse est calculé à l’aide de la commande measure com de VMD

(Visual Molecular Dynamics). Cette commande permet de calculer le centre de

masse d’une sélection d’atomes, et seulement les atomes de la chaîne latérale de

chacun des acides aminés sont utilisés dans le calcul.

Le calcul de la surface relative accessible au solvant (Srel,i) est utilisé par la

fonction du calcul du score pour normaliser la valeur d’énergie libre de tous les

résidus. Pour la méthode de prédiction développée dans les présents travaux,

nous faisons l’hypothèse que les acides aminés, lors de la liaison membranaire,

vont interagir avec la membrane en fonction de leur surface exposée à celle-ci. En

effet, les résidus qui se trouvent à l’intérieur de la protéine ou qui ont leurs chaînes

latérales orientées vers l’intérieur de la protéine n'interagissent pas avec les

lipides. Il est donc important de considérer la surface exposée au solvant dans le

calcul du score, et de normaliser la valeur du PMF d’insertion en proportion de la

surface exposée. Puisque les PMF d’insertion correspondent aux chaînes

latérales, nous avons considéré la surface exposée au solvant (SASA) des

chaînes latérales des acides aminés. La chaîne latérale est composée des atomes

en commençant par le carbone β et en excluant les atomes d’hydrogène.

Srel,i est le rapport entre le SASA de la chaîne latérale du résidu i en

présence de la protéine (SASAi,prot) et le SASA de la chaîne latérale du résidu i

complètement entourée par le solvant (SASAi,solvant). Un exemple de SASAi,prot est

montré à la Figure 7A et un exemple de SASAi,solvant est montré à la Figure 7B. Cette

relation entre les deux types de SASA est représentée à l’aide de l’équation 2. La

valeur que Srel,i peut prendre est comprise entre 0 et 1. Lorsque la chaîne latérale

d’un acide aminé est complètement enfouie dans la protéine, la valeur de Srel,i est

égale à 0. En d’autres mots, la surface accessible au solvant est 0. Dans le cas où

la chaîne latérale d’un acide aminé est complètement entourée du solvant, comme

montré à la Figure 7B, le Srel associé est de 1. En d’autres mots, la surface

accessible au solvant de la chaîne latérale d’un acide aminé est à son maximum

possible, et n’est pas influencé par aucun atome externe.

23

Page 40: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

L’étape de normalisation est accomplie avec l’aide de la commande

measure sasa de VMD. Cette commande permet de calculer le SASA d’une

sélection d’atomes en tenant compte des autres atomes qui l’entourent ou en la

considérant seule dans le vide. Pour calculer le SASA d’une sélection, VMD utilise

l’algorithme Maximal Speed Molecular Surfaces (MSMS) (21). Cet algorithme

calcule le SASA d’un atome en considérant le rayon van der Vaals ce celui-ci avec

le rayon van der Vaals d’une molécule de solvant, soit 1.4 Å pour une molécule

d’eau (21). L’étape de normalisation est exécutée seulement une fois au

démarrage du script de prédiction.

24

Figure 7 : Représentation de la surface exposée au solvant (SASA) de la

chaîne latérale du résidu LEU3 en présence du squelette protéique et le

SASA de la même chaîne latérale seule dans le solvant. (A) La chaîne

latérale du résidu LEU3 de la protéine trHbN (PDB: 1IDR) représentée sous

forme de bâtonnets (jaune). Les sphères représentent les résidus LEU4

(gauche) et ILE13 (droite) qui influencent le SASA de la chaîne latérale LEU3.

Le squelette de la protéine est représenté en cartoon. Les points bleus

représentent le SASA de la chaîne latérale du résidu LEU3. (B) Le SASA de la

chaîne latérale LEU3 complètement immergée dans le solvant est représenté

par les sphères bleues.

Page 41: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

3.4 Méthodes utilisées par MemP3

Cette section expose les détails associés à la réalisation des différentes

étapes de la méthode de prédiction d’insertion membranaire des protéines. La

méthodologie de MemP3 est implémentée dans un script TCL (Tool Command

Language) exécuté par le programme VMD (22). L’utilisation de VMD permet de

profiter des fonctions déjà implémentées, par exemple le chargement de la

protéine, la sélection des atomes et les calculs de centre de masse. Ceci

augmente la vitesse de développement de l’outil.

Voici donc les détails associés à chacune des étapes :

1) Calculer le PMF d’insertion membranaire pour chacun des acides aminés

existants.

Le calcul des PMF d’insertion membranaire pour chacun des acides aminés

existants est une tâche colossale qui équivaut à un projet complet en lui seul. Nous

avons plutôt choisi d’utiliser des résultats déjà publiés dans la littérature, soit les

valeurs calculées par MacCallum et Tieleman. (18). Ces valeurs ont été obtenues

par simulations de dynamique moléculaire en utilisant une bicouche de DOPC. Les

détails du calcul des PMF ont été présentés dans la section Calcul des PMF. Il est

intéressant de noter que les valeurs de PMF d’insertion varient généralement selon

la composition membranaire. Donc, avec MEMP3, il serait possible d’effectuer des

prédictions de liaison pour différentes compositions membranaires selon la

disponibilité des PMF d’insertion.

Pour cette étape, MemP3 charge les données des PMF d’insertion

membranaire des chaînes latérales des acides aminés dans une structure de

données, plus spécifiquement un dictionnaire. Ceci permettra de faire des

recherches rapides dans le dictionnaire à l’aide des noms des acides aminés. Il est

à noter que les prédictions ne considèrent seulement que les états de protonation

à pH physiologique, ce qui implique l’utilisation des PMF correspondant aux états

de protonation normales à pH physiologique sera utilisé. ie. le PMF de l’arginine

chargée positivement est utilisé pour toutes les arginines, le PMF de la lysine

25

Page 42: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

chargée positivement est utilisé pour toutes les lysines, le PMF de l'acide

glutamique chargé négativement est utilisé pour tous les acides glutamiques et

finalement, le PMF de l'acide aspartique chargé négativement est utilisé pour tous

les acides aspartiques.

2) Obtenir et préparer le fichier contenant la structure de la protéine.

La deuxième étape de l’algorithme de prédiction est le chargement du fichier pdb

d’entrée créé par le script de préparation. Le chargement est fait à l’aide de la

commande mol load pdb déjà implémentée dans VMD (22).

Le fichier d’entrée peut être un pdb extrait de la Protein Data Bank (PDB)

(2) ou extrait à partir de simulations de dynamique moléculaire. Ensuite, un script

TCL, différent du celui faisant la prédiction, prépare la structure de la protéine pour

l’étape de prédiction. Deux types de problèmes peuvent être présents dans un

fichier pdb provenant de la banque de données PDB. Premièrement, certaines

protéines trouvées sur la banque de données PDB ne sont pas complètes. En

effet, certains atomes ou même des résidus entiers d’une protéine peuvent parfois

être absents dans le fichier pdb. Dans ce cas, ces résidus seront ignorés par

MemP3, ce qui signifie que le fichier pdb prédit par MemP3 ne contiendra que les

atomes présents dans le fichier pdb d’origine. Dans ce cas, le script de préparation

indique à l'utilisateur quels résidus se retrouvent dans cette situation.

Deuxièmement, il arrive parfois que le fichier pdb initial contient également

des atomes qui n’appartiennent pas à la protéine (par exemple des atomes de

métaux ou des ligands). Dans ce cas, ces atomes ou molécules peuvent être pris

en compte dans le calcul de prédiction lors des calculs de surface accessible au

solvant (plus de détails à ce sujet plus loin). L’utilisateur peut indiquer au script de

prédiction s’il veut garder ou non ces atomes dans le fichier pdb d’entrée.

La protonation des résidus ne sera pas modifié par le script de préparation,

ni par l'algorithme de prédiction. Ces derniers considèrent tous les résidus comme

étant à pH physiologique.

26

Page 43: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

3) Déterminer une position et une orientation de départ relative à la

membrane, et calculer l’énergie libre d’insertion.

La troisième étape de l’algorithme de prédiction utilisé par l’outil MemP3 est

de définir la position de départ et calculer son score. Le score représente la

somme des énergies libres de chacune des chaînes latérales des acides aminés.

Cette dernière valeur est normalisée par la surface relative exposée au solvant de

la chaîne latérale en question.

Une fois le fichier pdb contenant la structure tridimentionnelle de la protéine

est chargé, cette dernière est positionnée à 35 Å du centre de la bicouche

lipidique, le long de la normale. Si une protéine doit être placée plus loin de la

bicouche lipidique, l’usager devra modifier cette valeur de 35 Å avec la bonne.

Cette position est considérée comme étant la position initiale. Le score de cette

position est calculé et puisque pour l’instant c’est le seul score que nous avons, il

est considéré comme étant le meilleur. Plus la recherche systématique avance,

d‘autres positions vont donner un meilleur score, donc le score initial ne sera plus

considéré comme étant le meilleur.

4) Recherche systématique

L’algorithme de minimisation utilisé est une recherche systématique de

l’énergie libre la plus petite, donc le score le plus petit. Cet algorithme applique en

boucle des matrices de rotations en x et y et des translations en z sur la protéine,

afin de changer son orientation. Les rotations sont de l'ordre de 10° autour de

chaque axe, soit x et y et ce jusqu’à atteindre 360°, donc revenir à la position de

départ et les incréments en z sont de l'ordre de 1 Å. Nous avons choisi 10° comme

valeur d’incrément des rotations, puisqu'elle permet d’obtenir une structure avec

l’énergie très près du minimum possible, sans coûter beaucoup de temps. Au

contraire, aller avec des incréments plus petits, ne donne pas un résultat éloigné

de celui trouvé avec des incréments de 10° pour le coût de temps supplémentaire.

Dans le même ordre d’idée, des incréments de 1 Å sur l’axe des z permettent

27

Page 44: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

d’avoir une structure représentative du minimum d’énergie avec un temps de calcul

raisonnable. Après chaque changement de la position de la protéine, que ce les

centres de masse de chaque chaîne latérale sont calculés, comme détaillé dans

au point 3). Ce centre de masse, plus exactement la position en Z de la chaîne

latérale d'un acide aminé, sera utilisé pour chercher l’énergie libre à cette position

à partir des valeurs PMF.

Par la suite, l’énergie libre de chacune des chaînes latérales est multipliée

par la valeur normalisée de la surface exposée au solvant. Ainsi, on considérera

seulement les résidus qui peuvent interagir avec la membrane. La somme de

l’énergie libre de chaque chaîne latérale est calculée. Si l’énergie totale est plus

petite que celle de l’orientation précédente, l’orientation et la position de la protéine

seront sauvegardées. Lorsque toutes les conformations ont été testées, le

programme s’arrête.

3.5 Approximations nécessaires

Les approximations suivantes ont été nécessaires et suffisantes pour

permettre la prédiction de l’orientation et l’insertion d’une protéine dans une

membrane modèle en un temps court :

1. La méthode ne tient pas compte de la déformation possible de la membrane

lors de la liaison d’une protéine.

2. Une protéine est considérée comme un corps rigide, i.e. la méthode ne

pourra prédire un changement de conformation possible de la protéine lors

de la liaison à la membrane.

28

Page 45: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

3.6 Méthodologie de la validation

Pour vérifier la méthode, un jeu de protéines a été sélectionné dont la

structure tridimensionnelle est connue. De plus, l’insertion, l’orientation et la

conformation de ces protéines dans une bicouche lipidique ont été étudiées par

diverses méthodes de dynamiques moléculaires. Il est donc possible de comparer

les prédictions faites par MemP3 avec les résultats des simulations de dynamique

moléculaire. Les prédictions faites par MemP3 seront aussi comparées avec les

prédictions de l’outil Prediction of Proteins in Membranes (PPM) (13).

Les prédictions faites par MemP3 et PPM seront comparées entre elles et

avec les résultats des simulations de dynamique moléculaire. Les comparaisons

seront faites du point de vue qualitatif et quantitatif. Pour la partie quantitative, une

valeur de root mean square deviation (RMSD), une valeur d’insertion et une

déviation angulaire seront utilisées pour comparer la prédiction de MemP3 et PPM

avec la référence. Utiliser un RMSD pour comparer la position des structures

permet de vérifier avec une seule valeur des variations dans l’insertion et dans

l’orientation des prédictions. Le RMSD est calculé à l'aide des atomes formant les

chaines latérales, donc commençant par le carbone β, puisque ce sont seulement

ces atomes qui participent à la prédiction de l'orientation et de l'insertion. La valeur

d’insertion est une distance en Z entre le centre de masse de la protéine et le

centre de la membrane. Ce dernier se situe à 0 Å. La déviation angulaire est

calculée comme étant les valeurs nécessaires d’angle pour superposer les deux

prédictions sur la référence. À l’aide de la commande VMD “measure fit” il est

possible d’obtenir une matrice de rotation qui permet de superposer la prédiction

du premier outil sur la structure de référence. En utilisant la matrice de rotation, il

est possible de calculer les angles d'Euler. Ces derniers sont les angles de rotation

autour de l'axe x, y, z nécessaires pour superposer les deux structures.

29

Page 46: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames
Page 47: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

Chapitre 4 : Résultats 

Le chapitre est divisé en trois sections : la première section présente les

résultats de prédiction pour un peptide modèle. La deuxième section présente les

résultats de prédiction pour plusieurs protéines périphériques et

transmembranaires dont la structure provient de la dynamique moléculaire. La

troisième section présente les limites de la méthode développée à travers le cas

de l’hémoglobine tronquée (trHbN) et celui du peptide de fusion du virus de

l’influenza.

Pour chacune des sections, les résultats de prédiction faits avec MemP3

sont comparés à ceux obtenus avec la méthode PPM et, lorsque disponibles, aux

structures provenant de dynamique moléculaire tout atome ou à gros grains, ces

dernières seront considérées comme des structures de référence. Les résultats de

prédiction faits avec MemP3 et PPM sont comparés avec la structure de référence.

Toutes les images présentées dans cette section suivent le même code de

couleurs. La structure de référence, provenant de simulations de dynamique

moléculaire, est colorée en bleu, la structure prédite avec MemP3 est en orange et

la structure de la prédiction obtenue à l’aide de l’outil PPM est en vert. Les plans

rouge et violet représentent la position de la densité maximale des groupements

phosphates des lipides pour une membrane modèle de DOPC dans la couche

externe et interne de la membrane cellulaire respectivement, comme présenté

dans les travaux de MacCallum et al. (18).

Dans chaque image se trouvent la valeur de RMSD et les valeurs de

déviation angulaire (x, y et z) entre la structure prédite et la structure de référence.

Pour le calcul du RMSD, les protéines sont fixes. De plus, seulement les atomes

lourds des chaînes latérales des acides aminés sont pris en compte dans ce

calcul. Les angles de déviation sont calculés à l’aide de VMD. Avec ce programme,

on peut obtenir la matrice de rotation nécessaire pour superposer la structure

prédite sur la structure de référence. À partir de cette matrice de rotation il est

31

Page 48: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

possible d’obtenir les angles de déviation autour des axes x, y et z. L'insertion,

définie comme la différence entre la valeur en z du centre de masse de la structure

de référence et celle prédite, est aussi indiquée pour chacune des structures

prédites. Ces valeurs sont utilisées pour quantifier les différences et similarités

entre les prédictions.

4.1 Peptide modèle

Les peptides modèles sont des peptides étudiés depuis plusieurs années, et

pour lesquels les propriétés physiques sont connues, celles-ci ayants été

déterminées par plusieurs chercheurs au courant des années.

Le peptide de poly-leucine a été choisi pour le simple fait qu'il est composé

d'un seul type d'acides aminés et il est donc possible de tester l'influence de

l'abscence des PMF des termini sur les prédictions faites par MemP3.

La Figure 8 présente et compare le résultat de MemP3 avec celui de PPM

pour le peptide de poly-leucine.

Le résultat de la prédiction du peptide de poly-leucine permet de montrer

une première limitation de la méthode MemP3. Dans la prédiction de MemP3, le

peptide se trouve au centre de la membrane, parallèle au plan de la membrane.

Quoi que loin de la position perpendiculaire de la poly-leucine, le résultat de PPM

est plus rapproché de ce qui est attendu du point de vue théorique. En théorie, le

peptide de poly-leucine devrait traverser la membrane de bord en bord. Le résultat

de MemP3 est dû au manque de PMF pour les C-terminal et N-terminal chargés.

Par contre, ce manque de PMF influence moins les prédictions de protéines,

puisque celles-ci sont composées de plusieurs résidus différents.

32

Page 49: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

Figure 8 : Comparaison des prédictions du peptide poly-leucine

faites par MemP3 (orange) et par PPM (vert) pour un peptide de

poly-leucine formé de 25 résidus.

33

Page 50: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

4.2 Protéines équilibrées par dynamique moléculaire

Les protéines équilibrées par dynamique moléculaire ont été utilisées pour

tester l'exactitute de la méthode MemP3, ainsi que comparer les prédictions avec

celles de PPM. Les protéines choisies ont été simulées pendant des longues

périodes, ce qui permet d'obtenir des structures équilibrèes.

4.2.1 Caveoline 1

La structure de référence de la protéine Caveoline 1 a été fournie par Riu et

al. (23). La structure et la position de la protéine ont été caractérisées en présence

d’une membrane modèle de dimyristoylphosphatidylcholine (DMPC) par RMN,

fluorescence des résidus tryptophane et par dynamique moléculaire tout atomes

(23). La structure de référence provient de la partie de production des simulations

de dynamiques moléculaire (23).

Dans le cas de cette protéine, MemP3 et PPM ont des prédictions

rapprochées de point de vue qualitatif, mais aucune des méthodes n'a réussi à

faire des prédictions qui se rapprochent de la structure de référence

34

Page 51: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

Figure 9 : Comparaison des prédictions de la calveolin faites par MemP3

(orange) et par PPM (vert) avec la structure de référence (bleu) fournie par

Riu et al. (23). La partie A de la figure compare la prédiction de MemP3 avec le

positionnement de la structure de référence. La partie B de la figure compare la

prédiction de PPM avec le positionnement de la structure de référence.

4.2.2 Protéine liant le retinol chez le bovin (PDB: 1KT7)

La structure de référence de la protéine Retinol-Binding a été prise de la

banque de données Coarse Grained DataBase (CGDB) (10). La structure et la

position de la protéine ont été caractérisées en présence d’une membrane modèle

de dipalmitoylphosphatidylcholine (DPPC) à l’aide d’une simulation de dynamique

moléculaire à gros grains (10). Les phospholipides ont été ajoutés autour de la

35

Page 52: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

protéine. Par la suite, ce système a été simulé pendant 200 ns pour permettre aux

phospholipides de former une bicouche lipidique avec la protéine insérée dedans

(10). La structure de référence provient de la partie de production des simulations

de dynamiques moléculaire (10).

Les deux méthodes, soit MemP3 et PPM ont prédit cette protéine comme

étant périphérique. Par contre, l'insertion de la prédiction faite par MemP3 est

beaucoup plus profonde, avec 7.83 Å de différence par rapport à la position

moyenne des phosphates.

36

Page 53: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

Figure 10 : Comparaison des prédictions de la protéine liant le rétinol chez

le bovin faites par MemP3 (orange) et par PPM (vert) avec la structure de

référence (bleu) prise sur CGDB (10). La partie A de la figure compare la

prédiction de MemP3 avec le positionnement de la structure de référence. La

partie B de la figure compare la prédiction de PPM avec le positionnement de la

structure de référence.

37

Page 54: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

4.2.3 Src Homology 3 domain (PDB: 1SHG)

La structure de référence de la protéine PDB 1SHG a été prise de la

banque de données Coarse Grained DataBase (CGDB) (10). La structure et la

position de la protéine ont été caractérisées en présence d’une membrane modèle

de dipalmitoylphosphatidylcholine (DPPC) à l’aide d’une simulation de dynamique

moléculaire à gros grains (10). Les phospholipides ont été ajoutés autour de la

protéine. Par la suite, ce système a été simulé pendant 200 ns pour permettre aux

phospholipides de former une bicouche lipidique avec la protéine insérée dedans

(10). La structure de référence provient de la partie de production des simulations

de dynamiques moléculaire (10).

La protéine est prédite par les deux méthodes comme étant périphérique.

Par contre, aucune des méthodes n'a pu prédire une orientation semblable à celle

ressortie des simulations de dynamique moléculaire. En effet, pour MemP3 et PPM

les RMSD sont grands, celui de la prédiction de PPM étant le plus grand, soit de

8.88 Å.

38

Page 55: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

Figure 11 : Comparaison des prédictions de la protéine Src Homology 3

domain faites par MemP3 (orange) et par PPM (vert) avec la structure de

référence (bleu) pris sur CGDB (10). La partie A de la figure compare la

prédiction de MemP3 avec le positionnement de la structure de référence. La

partie B de la figure compare la prédiction de PPM avec le positionnement de

la structure de référence.

4.2.4 Canal Potassium KvAP (PDB: 1ORS)

La structure de référence du canal potassium KvAP a été prise de la

banque de données Coarse Grained DataBase (CGDB) (10). La structure et la

position de la protéine ont été caractérisées en présence d’une membrane modèle

39

Page 56: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

de dipalmitoylphosphatidylcholine (DPPC) à l’aide d’une simulation de dynamique

moléculaire à gros grains (10). Les phospholipides ont été ajoutés autour de la

protéine. Par la suite, ce système a été simulé pendant 200 ns pour permettre aux

phospholipides de former une bicouche lipidique avec la protéine insérée dedans

(10). La structure de référence provient de la partie de production des simulations

de dynamiques moléculaire (10).

Dans le cas des deux outils MemP3 et PPM, l'orientation et l'insertion de

cette protéine transmembranaire a été prédite avec précision, ayant des RMSD

plus petits que 3 Å.

40

Page 57: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

Figure 12 : Comparaison des prédictions du canal potassium KvAP faites

par MemP3 (orange) et par PPM (vert) avec la structure de référence

(bleu) pris sur CGDB (10). La partie A de la figure compare la prédiction de

MemP3 avec le positionnement de la structure de référence. La partie B de la

figure compare la prédiction de PPM avec le positionnement de la structure de

référence.

4.2.5 Outer membrane protein W (PDB: 2F1V)

La structure de référence de la protéine PDB 1F1V a été prise de la banque

de données Coarse Grained DataBase (CGDB) (10). La structure et la position de

la protéine ont été caractérisées en présence d’une membrane modèle de

41

Page 58: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

dipalmitoylphosphatidylcholine (DPPC) à l’aide d’une simulation de dynamique

moléculaire à gros grains (10). Les phospholipides ont été ajoutés autour de la

protéine. Par la suite, ce système a été simulé pendant 200 ns pour permettre aux

phospholipides de former une bicouche lipidique avec la protéine insérée dedans

(10). La structure de référence provient de la partie de production des simulations

de dynamiques moléculaire (10).

Comme pour la protéine précédente, les deux méthodes ont pu prédire avec

exactitude la position et l'orientation, encore une fois, les RMSD étant inférieurs à 3

Å.

42

Page 59: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

Figure 13 : Comparaison des prédictions de la protéine Outer membrane

protein W faites par MemP3 (orange) et par PPM (vert) avec la structure de

référence (bleu) pris sur CGDB (10). La partie A de la figure compare la

prédiction de MemP3 avec le positionnement de la structure de référence. La

partie B de la figure compare la prédiction de PPM avec le positionnement de la

structure de référence.

43

Page 60: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

4.2.5 Synaptotagmine C2B

La structure de référence de la protéine synaptotagmin C2B a été fournie

par Wu et al. (24). L’orientation et la conformation de cette structure ont été

charactérisées par dynamique moléculaire en utilisant le protocol highly mobile

membrane mimetic (HMMM) (25). Ceci a pour effet d’augmenter la vitesse

d’insertion d’une protéine dans la membrane HMMM. Wu et al. ont utilisé des

lipides à queue courte divalerylphosphatidylserine (DVPS) et

divalerylphosphatidylcholine (DVPC) sur les couches proximale et distale avec une

couche du solvant organique 1,1-dichloroethane (DCLE) au milieu (24).

Dans le cas de cette protéine, les deux méthodes ont pu la prédire comme

étant périphérique. Par contre, ni MemP3, ni PPM n'ont pu prédire l'orientation

trouvée à l'aide des simulations de dynamique moléculaire.

44

Page 61: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

Figure 14 : Comparaison des prédictions de la protéine Synaptotagmine

C2B faites par MemP3 (orange) et par PPM (vert) avec la structure de

référence (bleu) fournie par Wu et al. (24). La partie A de la figure compare

la prédiction de MemP3 avec le positionnement de la structure de référence. La

partie B de la figure compare la prédiction de PPM avec le positionnement de

la structure de référence.

45

Page 62: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

4.2.6 Cytochrome P450 3A4

La structure de référence de la protéine cytochrome P450 2C9 a été fournie

par Berka et al. (27). L’orientation et la conformation de la protéine en contact avec

une membrane modèle de DOPC ont été déterminés à l’aide de la dynamique

moléculaire tout atome (27). La phase de production de la simulation de

dynamique tout atome a été exécutée pour un total de 100 ns. La structure utilisée

pour les prédictions de MemP3 et PPM provient de la simulation tout atome de la

protéine seule en contact avec la membrane modèle.

Les méthodes MemP3 et PPM ont prédits le domaine périphérique de cette

protéine comme étant périphérique, ainsi que la partie transmembranaire comme

étant transmembranaire. Quoique les deux méthodes présentent des petites

variations par rapport à la structure de référence, les prédictions se rapprochent de

la structure de référence.

46

Page 63: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

Figure 15 : Comparaison des prédictions de la protéine Cytochrome P450

3A4 faites par MemP3 (orange) et par PPM (vert) avec la structure de

référence (bleu) fournie par Cojocaru et al. (27). La partie A de la figure

compare la prédiction de MemP3 avec le positionnement de la structure de

référence. La partie B de la figure compare la prédiction de PPM avec le

positionnement de la structure de référence.

47

Page 64: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

4.2.7 Cytochrome P450 2C9

La structure de référence de la protéine cytochrome P450 2C9 a été fournie

par Cojocaru et al. (26). L’orientation et la conformation de la protéine dans une

membrane modèle de POPC ont été déterminées par des simulations de

dynamique moléculaire à gros grains et tout atome (26). Le système protéine-

lipides gros grains a été simulé pendant une période de 3 µs (26). La structure

équilibrée provenant de la simulation à gros grains a été convertie en résolution

atomique, dans le but de faire des simulations tout atome (26). La structure utilisée

pour les prédictions de MemP3 et PPM provient de la simulation tout atome de la

protéine seule en contact avec la membrane modèle.

Dans le cas du cytochrome P450, le résultat de PPM se rapproche plus de

la structure de référence que la prédiction de MemP3. En effet, même si du point

de vue RMSD la prédiction de PPM semble plus éloignée, il est possible de

remarquer que la partie transmembranaire prédite par MemP3 ne se rapproche pas

de la structure de référence.

48

Page 65: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

Figure 16 : Comparaison des prédictions de la protéine Cytochrome P450

2C9 faites par MemP3 (orange) et par PPM (vert) avec la structure de

référence (bleu) fournie par Berka et al. (26). La partie A de la figure

compare la prédiction de MemP3 avec le positionnement de la structure de

référence. La partie B de la figure compare la prédiction de PPM avec le

positionnement de la structure de référence.

49

Page 66: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

4.2.9 OMPLA (PDB: 1QD6)

La structure de référence de la protéine OMPLA a été prise de la banque de

donnée Coarse Grained DataBase (CGDB) (10). La structure et la position de la

protéine ont été caractérisées en présence d’une membrane modèle de

dipalmitoylphosphatidylcholine (DPPC) à l’aide d’une simulation de dynamique

moléculaire à gros grains (10). Les phospholipides ont été ajoutés autour de la

protéine. Par la suite, ce système a été simulé pendant 200 ns pour permettre aux

phospholipides de former une bicouche lipidique avec la protéine insérée dedans

(10). La structure de référence provient de la partie de production des simulations

de dynamiques moléculaire (10).

Les deux méthodes, soit MemP3 et PPM sont capable de prédire cette

protéine comme étant transmembranaire, ainsi que prédire une orientation et

insertion se rapprochant de la structure de référence.

50

Page 67: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

Figure 17 : Comparaison des prédictions de la protéine OMPLA faites par

MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu)

pris sur CGDB (10). La partie A de la figure compare la prédiction de MemP3

avec le positionnement de la structure de référence. La partie B de la figure

compare la prédiction de PPM avec le positionnement de la structure de

référence.

51

Page 68: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

4.3 Limites de la méthode

Les prochaines prédictions présentent des limitations de la méthode

MemP3, ce qui permet d'évaluer le plein potentiel de cette première version, ainsi

que les améliorations à apporter dans une prochaine version de la méthode.

4.3.1 Hémoglobine tronquée (trHbN) - simulations de dynamique moléculaire

La structure de référence dans les deux figures suivantes a été fournie par

Rhéault et al (4). La structure et la position de la protéine ont été caractérisées en

présence d’une membrane modèle de dioleoylphosphatidylcholine (DOPC) à l’aide

de simulations de dynamique moléculaire tout atomes (4). La protéine en présence

de la bicouche lipidique a été simulée pendant 250 ns et ce pour trois trajectoires

(4). La structure de référence provient de la partie de production de la simulation

de dynamique moléculaire d’une des trois simulations.

Dans cette première figure, les méthodes MemP3 et PPM ont été utilisées

pour prédire l'orientation et l'insertion de la structure provenant des simulations de

dynamique moléculaire. Les deux prédictions ont une orientation qui se rapproche

de la structure de référence. Par contre, du point de vue insertion, les deux

méthodes ont prédit une position plus insérée comparativement à la structure de

référence.

52

Page 69: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

Figure 18 : Comparaison des prédictions de la protéine trHbN faites par

MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu)

fournie par Rhéault et al. (4). La partie A de la figure compare la prédiction de

MemP3 avec le positionnement de la structure de référence. La partie B de la

figure compare la prédiction de PPM avec le positionnement de la structure de

référence.

4.3.2 Hémoglobine tronquée (trHbN) - PDB 1IDR

Dans le cas de cette deuxième figure, les méthodes MemP3 et PMM ont été

utilisées pour prédire l'orientation et l'insertion de la structure tridimentionelle de

trHbN provenant de PDB, donc n'ayant pas subi d'équilibration par simulation de

dynamique moléculaire. Ces prédictions ont été comparées avec la même

structure de référence que la figure précédante.

Les deux méthodes n'ont pas été capable de prédire une bonne orientation

ou insertion de la structure provenant de la banque de données PDB. Ceci est du

principalement aux torsions au niveau des angles du coude qui réunit l'hélice Pre-A

avec le reste de la protéine.

53

Page 70: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

Figure 19 : Comparaison des prédictions de la protéine trHbN PDB 1IDR

faites par MemP3 (orange) et par PPM (vert) avec la structure de référence

(bleu) fournie par Rhéault et al. (4). La partie A de la figure compare la

prédiction de MemP3 avec le positionnement de la structure de référence. La

partie B de la figure compare la prédiction de PPM avec le positionnement de

la structure de référence.

4.3.3 Peptide de fusion du virus de l’influenza (FusPept) - simulations de dynamique moléculaire

La structure de référence dans les deux images suivantes a été fournie par

Légaré et al. (29). La structure et la position du peptide ont été caractérisées dans

une membrane modèle POPC à l’aide des simulations de dynamique moléculaire

tout atoms. Huit trajectoires de 200 ns ont été simulées avec le peptide en

présence de la bicouche lipidique. La structure de référence provient d’une de ces

trajectoires.

Comme dans le cas de trHbN, les prédictions de la structure

tridimensionnelle du peptide de fusion provenant des simulations de dynamique

moléculaire et de la banque PDB ont été comparées avec une structure de

54

Page 71: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

référence provenant des simulations de dynamique moléculaire.

Dans ce premier cas, la structure provenant des simulations dynamique

moléculaire a été utilisée pour les prédictions. La prédiction de MemP3 a une

insertion plus grande que la prédiction de PPM, ainsi que des degrées d'angles

plus importants.

Figure 20 : Comparaison des prédictions du peptide de fusion faites par

MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu)

fournie par Légaré et al. (29). La partie A de la figure compare la prédiction

de MemP3 avec le positionnement de la structure de référence. La partie B de

la figure compare la prédiction de PPM avec le positionnement de la structure

de référence.

4.3.4 Peptide de fusion du virus de l’influenza (FusPept) - PDB 1IBN

Dans le cas de l'utilisation de la structure tridimensionelle provenant de la

banque PDB, l'insertion prédite par MemP3 est plus importante que pour la

structure provenant des simulations de dynamique moléculaire. Ceci peut être dû

au positionnement des chaines latérales, qui bougent lors d'une simulation de

55

Page 72: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

dynamique moléculaire.

Figure 21 : Comparaison des prédictions du peptide de fusion PDB 1IBN

faites par MemP3 (orange) et par PPM (vert) avec la structure de référence

(bleu) fournie par Légaré et al. (29). La partie A de la figure compare la

prédiction de MemP3 avec le positionnement de la structure de référence. La

partie B de la figure compare la prédiction de PPM avec le positionnement de

la structure de référence.

56

Page 73: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

Chapitre 5 : Discussion 

Comme présenté dans le chapitre 1, l’étude expérimentale des protéines

interagissant avec les membranes est plutôt difficile et les informations obtenues

ne sont pas toujours claires. La grande difficulté dans l’étude des protéines

membranaires réside dans la détermination de leur orientation et de leur insertion

dans une bicouche lipidique. Plusieurs méthodes expérimentales existent pour

déterminer ces deux propriétés, mais ces méthodes sont très coûteuses. D’où

l’importance d’étudier l’orientation et l’insertion des protéines dans une membrane

par des méthodes de modélisation moléculaire.

L'objectif du travail présenté dans ce mémoire est de développer un tel outil

de modélisation moléculaire réalisant une prédiction de l’orientation et de l’insertion

dans une membrane des protéines étudiées, affin d'accélérer le démarrage de

simulations de dynamique moléculaire. De plus, MemP3 est une méthode haut

débit, qui peut être utilisée pour la prédiction du positionnement d'une centaine de

protéines en quelques jours seulement.

La méthode présentée dans ce mémoire permet la prédiction de l’orientation

et l’insertion des protéines dans une membrane et se nomme Membrane Protein

Prediction and Positioning (MemP3). Elle utilise un fichier PDB contenant la

position des atomes pour effectuer les calculs. De plus, MemP3 utilise des PMF

d’insertion membranaires des chaînes latérales des acides aminés, mais ceux-ci

ont été obtenues de la littérature (18) pour une membrane modèle de DOPC. Une

recherche systématique de l’orientation et de l’insertion est effectuée affin de

déterminer la position optimale de la protéine. Cette position est estimée à l’aide

d’un système de score qui est déterminé a l’aide des PMF d’insertion

membranaires des chaînes latérales des acides aminés ainsi que du SASA

normalisé.

L'évaluation d’une méthode de prédiction comme MemP3 se fait à l’aide

d’une sélection de structures de références. Pour valider la méthode MemP3, nous

57

Page 74: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

avons choisi des protéines qui ont été équilibrées à l’aide de différentes méthodes

de dynamiques moléculaire. La sélection des protéines de référence inclut une

combinaison de protéines transmembranaires et périphériques, ce qui permet de

tester MemP3 avec ces deux types de protéines.

5.1 Précision de la méthode

La méthode MemP3 permet d’obtenir des prédictions pour les protéines

transmembranaires qui sont en concordance avec les structures de référence. En

effet, du point de vue RMSD, la meilleure prédiction est celle du canal potassium

KvAP (Figure 12) avec un RMSD de 2.26 Å et le résultat avec le plus grand RMSD

est la cytochrome p 450 2C9 (Figure 16), avec un RMSD de 6.33 Å. Même avec

un RMSD de 6.33 Å la position de la structure prédite est semblable avec la

position de la structure de référence. Parmi les protéines transmembranaires, la

prédiction qui s’éloigne le plus de la position de la structure de référence est celle

de la Caveolin-1 (Figure 9) à la fois pour MemP3 et PPM. Par contre, la prédiction

de MemP3 est plus rapprochée de la structure de référence du point de vue RMSD

et de la différence d’insertion que la prédiction de PPM. En effet, le RMSD de la

prédiction de PPM, soit 9.89 Å, est plus que le double du RMSD de la prédiction

faite par MemP3, soit 4.58 Å. La différence d’insertion est la donnée qui influence le

plus la valeur de RMSD. La prédiction de MemP3 ayant une différence d’insertion

de 5.00 Å comparativement à 8.74 Å pour la prédiction de PPM.

Dans le cas des protéines périphériques, certaines prédictions qui sont

rapprochées, alors que d'autres sont éloignés des structures de référence. En

effet, la protéine bovine liant le retinol (Figure 10), l’hémoglobine tronquée (Figure

19) et le peptide de fusion du virus de l’influenza (Figure 21) se rapprochent

beaucoup de la position de leur structure de référence, à la fois pour PPM et

MemP3. Le RMSD de la protéine bovine liant le retinol prédite par MemP3 est de

7.90 Å. Par contre cette valeur est influencée par la différence d’insertion entre la

58

Page 75: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

structure prédite et celle de référence, qui est de 7.83 Å. Du point de vue

orientation, les protéines sont rapprochées avec des angles de rotation autour des

axes x, y et z de 5.58°, -4.36° et -0.34° respectivement. Par contre, les prédictions

des protéines scr homology 3 domain (Figure 11), synaptogamin C2B (Figure 14)

et OSH4 (Figure 17) sont éloignés de la position de leur structure de référence

respective, à la fois pour PPM et MemP3. Ces protéines ont un RMSD de 6.60 Å,

21.62 Å et 17.30 Å respectivement, pour les prédictions faites par MemP3 et 8.88

Å,18.49 Å et 12.16 Å respectivement, pour les prédictions faites par PPM. Toutes

ces protéines ont été prédites comme étant périphériques par MemP3 et PPM.

5.2 Limites de la méthode

Les résultats présentés dans le Chapitre 3 démontrent que la méthode

MemP3 est capable de prédire avec précision l’orientation et l’insertion dans une

membrane modèle DOPC pour toutes les protéines transmembranaires et la

plupart des protéines périphériques. De plus, il apparaît clair que la méthode

MemP3 est capable de différencier entre les protéines périphériques et

transmembranaires. En effet, même dans les cas où l’orientation ou l’insertion

prédites par MemP3 ne sont pas parfaites, l’outil a été capable de bien différencier

entre les protéines périphériques (Figures 10, 11, 14, 17, 19, 20, 21 et 22) et

transmembranaires (Figures 9, 12, 13, 15, 16 et 18). Pour que l’outil différencie

aussi les protéines solubles, la protéine devra avoir des résidus exposés au

solvant qui sont principalement chargés négativement. En effet, si la protéine a

seulement les résidus acide aspartique et acide glutamique exposés au solvant,

MemP3 sera capable de prédire cette protéine comme n’ayant aucune liaison

membranaire.

La méthode MemP3 n'est pourtant pas sans limitations. En effet, quatres

types de limitations sont présentes : celle due à l’absence des PMF pour les

atomes terminaux chargés, celle due à l’absence de paramètres et celle due à la

59

Page 76: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

conformation de départ. De plus, il est nécéssaire de valider les résultats obtenus

avec la méthode MemP3 par des données expérimentales.

Premièrement, le peptide modèle PolyLeucine montre une limitation de la

méthode MemP3, mais surtout avec l’utilisation des PMF d’insertion membranaire

des chaines latérales calculées par MacCallum et al. (18). En effet, MemP3 prédit

le peptide comme étant complètement allongé au milieu de la bicouche lipidique.

Contrairement à cette prédiction, PPM prédit le peptide comme étant orienté près

de la normale de la bicouche lipidique, un résultat qui se rapproche beaucoup plus

de ce qui est attendu en théorie. Le résultat de MemP3 est influencé par le fait qu’il

n’y a présentement pas de PMF disponible pour les atomes terminaux qui sont

chargés. En effet, MacCallum et al. (18) n’ont pas calculé des PMF pour les

atomes chargés se trouvant en C-terminal et N-terminal. Par contre, la prédiction

de MemP3 pour le peptide poly-leucine pourrait être améliorée à l’aide de

l’utilisation des PMF d’insertion membranaire des termini chargés. Le manque de

ces PMF influence moins les prédictions que MemP3 peut faire pour une protéine,

puisque celle-ci est formée par des différents types de résidus.

Deuxièmement, la Figure 21 montre le résultat de la prédiction du peptide

de fusion du virus de l’influenza. Cette prédiction a été faite en utilisant une

structure provenant de la dynamique moléculaire. Les deux outils, MemP3 et PPM,

sont capables de prédire une position qui s’approche de celle de la structure de

référence (Figure 21). Le RMSD de la prédiction de MemP3, pour la structure

provenant de dynamique moléculaire, est de 4.58 Å. La différence majeure entre la

structure prédite et celle de référence provient en majorité de l’insertion du côté N-

terminal. La prédiction est 3.86 Å insérée plus profondément dans la membrane

que la structure de référence. Les carbonyls libres du peptide de fusion participent

à la liaison membranaire, ce qui n’est pas pris en compte dans la prédiction faite

par MemP3, puisqu’il n’y a pas de PMF disponible pour ces groupements. Cela

influence l’insertion du peptide. De plus, lorsque la structure provenant des

données de la banque PDB est utilisée (PDB 1IBN), la prédiction de MemP3 est

moins bonne que la prédiction de PPM (Figure 22). Le RMSD de cette prédiction

60

Page 77: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

est de 6.30 Å avec une différence d’insertion de 6.04 Å. Comme la seule différence

entre les deux structures utilisées pour faire des prédictions est une différence

conformationnelle, il est possible de tirer la conclusion que la structure de départ

influence le résultat de la prédiction, en plus du manque de PMF présenté plus

haut. Une possible amélioration sera présentée dans les perspectives de ce travail.

Troisièmement, la Figure 19 montre le résultat de la prédiction de la protéine

trHbN utilisant une structure à l'équilibre provenant de la dynamique moléculaire.

Comme cette structure a expérimenté un changement conformationnel lorsqu’elle

est entrée en contact avec une bicouche lipidique, la prédiction de MemP3 et celle

de PPM sont proches de la position de la structure de référence. Par contre,

lorsqu’on utilise la structure provenant de la base de données PDB, soit 1IDR pour

faire les prédictions, les résultats sont moins bons. Ces résultats peuvent être vus

à la Figure 20. MemP3 tourne la protéine de 97.27° autour de l’axe des x pour

pouvoir placer l’hélice trouvée en C-terminal à l’interface membranaire. Par contre,

PPM place l’hélice du côté C-terminal complètement dans le solvant. Cette hélice

est un point important dans la liaison de la protéine avec la membrane, comme

montré par Rheault et al. (4), donc elle doit se trouver à l’interface. Toutefois, cela

entraîne un mauvais positionnement de la majeure partie de la protéine, dans le

cas de MemP3.

Quatrièmement, les PMF d’insertion des chaînes latérales des acides

aminés histidine, proline et glycine ne sont pas pris en compte dans le calcul des

prédictions, puisque ces PMF n’ont pas été calculés par MacCallum et al. (18).

61

Page 78: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

5.3 Vitesse de prédiction

La vitesse d'exécution de MemP3 varie en fonction du nombre d’acides

aminés qui forme la protéine. Par exemple, pour la protéine trHbN présentée dans

les résultats (Figures 19 et 20), le temps de calcul est d’environ 10 minutes.

Lorsque la protéine compte autour de 400 résidus, le temps de calcul peut même

atteindre 60 minutes. Même c’est un temps très rapide par rapport aux simulations

de dynamique moléculaire, la méthode peut être améliorée pour être encore plus

rapide, en modifiant l’algorithme de recherche systématique. Cette amélioration

sera détaillée dans le chapitre 6.

62

Page 79: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

Chapitre 6 : Conclusion et Perspectives 

6.1 Conclusion

En conclusion, ce projet de maîtrise a permis l’élaboration d’une méthode

appelée MemP3 permettant la prédiction de l’orientation et l’insertion d’une protéine

dans une membrane modèle.

Pour pouvoir utiliser la méthode MemP3, la structure tridimensionnelle de la

protéine d'interêt doit être connue et un fichier PDB contenant la position des

atomes doit être disponible. De plus, MemP3 utilise des PMF d’insertion

membranaire des chaines latérales des acides aminés qui se trouvent dans la

littérature (18) pour une membrane modèle de DOPC. Ces derniers ont été utilisés

lors du dévelopement et de la validation de MemP3. D’autres PMF pourraient être

utilisées sans modification au code source de MemP3.

Le fichier PDB que MemP3 utilise doit être préparé. Cela implique d’enlever

tous les atomes du fichier PDB sauf ceux de la protéine. Par la suite une recherche

systématique de l’orientation et de l’insertion est réalisée en positionnant cette

structure le long de l’axe des z, soit la normale de la membrane, en variant les

angles de rotations autour des axes x et y. Pour déterminer la meilleure orientation

et insertion, MemP3 utilise un système de score. Ce dernier est calculé à l’aide des

PMF d’insertion membranaire des chaînes latérales des acides aminés et du SASA

normalisé des chaînes latérales des acides aminés.

Il a été démontré que MemP3 est capable de prédire avec précision

l’orientation et l’insertion des protéines transmembranaires et périphériques. Par

contre, la méthode est capable de prédire l'orientation et l'insertion des protéines

transmembranaires avec une meilleure précision que pour les protéines

périphériques.

63

Page 80: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

6.2 Perspectives

Plusieurs améliorations à la méthode ont été identifiées au cours des

travaux. Une première faisant référence aux PMF manquants pour les C-terminal

et N-terminal chargés, une deuxième qui permettrait l'utilisation du concept de

dynamique moléculaire directement à l'intérieur de MemP3, une troisième qui

permettrait de réduire significativement le temps de prédiction de MemP3 et une

quatrième amélioration qui consiste en l'utilisation des PMF calculés avec des

membranes modèles composées d'autres phospholipides que ceux déjà utilisèes.

Une amélioration qui pourrait être apportée à MemP3 consiste à ajouter des

PMF chargés pour les parties C-terminal et N-terminal des peptides. Cette

amélioration permettra de prédire l’orientation et l’insertion des petits peptides

dans une membrane modèle. De plus, les PMF pour les acides aminés histidine,

proline et glycine peuvent être calculés et ainsi augmenter la précision de MemP3.

La méthode MemP3, tel que développée, ne peut être utilisée pour prédire la

conformation d’une protéine en contact avec une bicouche lipidique. Par contre,

une extension pourrait être ajoutée à MemP3 pour ajouter de la flexibilité aux

protéines à l’aide d’une simulation de dynamique moléculaire dans laquelle les

PMF seraient utilisées pour dériver des forces. Lors de cette dynamique

moléculaire, ces forces seraient appliquées en z sur les atomes des chaines

latérales des acides aminés. Ainsi, le système ne contiendrait que les atomes de la

protéine et, en fonction de leur position en z, une force serait appliquée sur eux.

Cette extension pourrait être une solution au problème présenté dans la section

4.2.

Le temps de calcul d’une prédiction varie selon le nombre de résidus qui

forment la protéine. Comme mentionné dans la section 4.3, le temps de calcul peut

être amélioré. En effet, la fonction de recherche systématique décrite dans le

chapitre 3 peut être remplacée par une fonction de minimisation. Une méthode de

minimisation permet de ne pas évaluer toutes les orientations et positions

possibles de la protéine. En effet, le but est de minimiser l’équation 1, en utilisant

64

Page 81: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

un algorithme de minimisation locale. Pour éviter que l’algorithme soit pris dans un

minimum d’énergie local, plusieurs positions de départ devent être utilisées. Dans

ce cas, l’algorithme de minimisation locale sera exécuté pour chaque position de

départ. La position avec l’énergie la plus petite est considérée comme étant la

meilleure prédiction. L’utilisation d’un tel algorithme permet de ne plus calculer le

score pour chacune des positions et orientations de la protéine, ce qui permettrait

de diminuer considérablement le temps de calcul de la méthode. En bref,

l'utilisation d'un algorithme de minimisation plus sophistiqué pourrait effectuer une

recherche en effectuant moins de recherches conformationnelles.

La manière dont MemP3 a été développé permet l’utilisation des PMF de

différents types de membranes modèles. Des PMF d’insertion membranaire des

chaines latérales des acides aminés pour d’autres types de membranes modèle

que celle utilisée ici peuvent être calculés. Ainsi, la méthode pourrait être utilisée

pour comparer l’orientation et l’insertion d’un protéine dans différentes membranes

modèles et évaluer l’impact de ces dernières sur le positionnement de la protéine.

Cette extension permet à MemP3 d'être la première méthode qui peut utiliser des

membranes modèles différentes. Par contre, ces travaux correspondraient au

travail d'un mémoire, voir d'un doctorat.

65

Page 82: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames
Page 83: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

Bibliographie

1. Pedersen, P. L. (1995) Biochemistry, 2nd edit., edited by Donald Voet and Judith G. Voet. New York: Wiley, 1995, 1392 pages, $86.95, Proteins: Structure, Function, and Genetics 23, 613–613.

2. Berman, H. M. (2000) The Protein Data Bank, Nucleic Acids Res. 28, 235–242.

3. Krogh, A., Larsson, B., von Heijne, G., and Sonnhammer, E. L. (2001) Predicting transmembrane protein topology with a hidden Markov model: application to complete genomes, J. Mol. Biol. 305, 567–580.

4. Rhéault, J.-F., Gagné, È., Guertin, M., Lamoureux, G., Auger, M., and Lagüe, P. (2015) Molecular model of hemoglobin N from Mycobacterium tuberculosis bound to lipid bilayers: a combined spectroscopic and computational study, Biochemistry 54, 2073–2084.

5. McIntosh, T. J., and Simon, S. A. (2007) Bilayers as protein solvents: role of bilayer structure and elastic properties, J. Gen. Physiol. 130, 225–227.

6. White, S. H., and Wimley, W. C. (1999) Membrane protein folding and stability:physical principles, Annu. Rev. Biophys. Biomol. Struct. 28, 319–365.

7. Hristova, K., Kalina, H., Wimley, W. C., Mishra, V. K., Anantharamiah, G. M., Segrest, J. P., and White, S. H. (1999) An amphipathic α-helix at a membrane interface: a structural study using a novel X-ray diffraction method, J. Mol. Biol. 290, 99–117.

8. Hohlweg, W., Kosol, S., and Zangger, K. (2012) Determining the Orientation and Localization of Membrane-Bound Peptides, CPPS 13, 267–279.

9. Johnston, A. J., Zhang, Y. R., Busch, S., Pardo, L. C., Imberti, S., and McLain, S. E. (2015) Amphipathic solvation of indole: implications for the role of tryptophan in membrane proteins, J. Phys. Chem. B 119, 5979–5987.

10. Sansom, M. S. P., Scott, K. A., and Bond, P. J. (2008) Coarse-grained simulation: a high-throughput computational approach to membrane proteins, Biochem. Soc. Trans. 36, 27–32.

11. Brooks, B. R., Brooks, C. L., 3rd, Mackerell, A. D., Jr, Nilsson, L., Petrella, R. J., Roux, B., Won, Y., Archontis, G., Bartels, C., Boresch, S., Caflisch, A., Caves, L., Cui, Q., Dinner, A. R., Feig, M., Fischer, S., Gao, J., Hodoscek, M., Im, W., Kuczera, K., Lazaridis, T., Ma, J., Ovchinnikov, V., Paci, E., Pastor, R. W., Post, C. B., Pu, J. Z., Schaefer, M., Tidor, B., Venable, R. M., Woodcock, H. L., Wu, X., Yang, W., York, D. M., and Karplus, M. (2009) CHARMM: the biomolecular simulation program, J. Comput. Chem. 30, 1545–1614.

12. Snider, C., Craig, S., Sajith, J., Kalina, H., and White, S. H. (2009) MPEx: A tool for exploring membrane proteins, Protein Sci. 18, 2624–2628.

13. Lomize, M. A., Lomize, A. L., Pogozheva, I. D., and Mosberg, H. I. (2006) OPM: Orientations of Proteins in Membranes database, Bioinformatics 22, 623–625.

14. Tusnady, G. E., Dosztanyi, Z., and Simon, I. (2004) TMDET: web server for detecting transmembrane regions of proteins by using their 3D coordinates, Bioinformatics 21, 1276–1277.

15. Riniker, S., Sereina, R., Allison, J. R., and van Gunsteren, W. F. (2012) On

67

Page 84: Développement d'une méthode de prédiction de l'orientation ... · Abstract Integral membrane proteins play many important roles, and account for 20 to 30% of the open reading frames

developing coarse-grained models for biomolecular simulation: a review, Phys. Chem. Chem. Phys. 14, 12423.

16. Marrink, S. J., de Vries, A. H., and Mark, A. E. (2004) Coarse Grained Model for Semiquantitative Lipid Simulations, J. Phys. Chem. B 108, 750–760.

17. Lomize, A. L., Pogozheva, I. D., and Mosberg, H. I. (2011) Anisotropic solvent model of the lipid bilayer. 2. Energetics of insertion of small molecules, peptides, and proteins in membranes, J. Chem. Inf. Model. 51, 930–946.

18. MacCallum, J. L., Drew Bennett, W. F., and Peter Tieleman, D. (2008) Distribution of Amino Acids in a Lipid Bilayer from Computer Simulations, Biophys. J. 94, 3393–3404.

19. Schlick, T., and Tamar, S. (2002) Molecular Modeling and Simulation.20. Leach, A. R. (2001) Molecular Modelling: Principles and Applications, Pearson

Education.21. Durham, E., Dorr, B., Woetzel, N., Staritzbichler, R., and Meiler, J. (2009)

Solvent accessible surface area approximations for rapid and accurate protein structure prediction, J. Mol. Model. 15, 1093–1108.

22. Humphrey, W., William, H., Andrew, D., and Klaus, S. (1996) VMD: Visual molecular dynamics, J. Mol. Graph. 14, 33–38.

23. Rui, H., Huan, R., Root, K. T., Jinwoo, L., Glover, K. J., and Wonpil, I. (2014) Probing the U-Shaped Conformation of Caveolin-1 in a Bilayer, Biophys. J. 106, 1371–1380.

24. Wu, Z., Zhe, W., and Klaus, S. (2014) Synaptotagmin’s Role in Neurotransmitter Release Likely Involves Ca2 -induced Conformational Transition, Biophys. J. 107, 1156–1166.

25. Ohkubo, Y. Z., Zenmei Ohkubo, Y., Pogorelov, T. V., Arcario, M. J., Christensen, G. A., and Emad, T. (2012) Accelerating Membrane Insertion of Peripheral Proteins with a Novel Membrane Mimetic Model, Biophys. J. 102, 2130–2139.

26. Cojocaru, V., Balali-Mood, K., Sansom, M. S. P., and Wade, R. C. (2011) Structure and dynamics of the membrane-bound cytochrome P450 2C9, PLoSComput. Biol. 7, e1002152.

27. Berka, K., Paloncýová, M., Anzenbacher, P., and Otyepka, M. (2013) Behavior of human cytochromes P450 on lipid membranes, J. Phys. Chem. B 117, 11556–11564.

28. Rogaski, B., and Klauda, J. B. (2012) Membrane-binding mechanism of a peripheral membrane protein through microsecond molecular dynamics simulations, J. Mol. Biol. 423, 847–861.

29. Légaré, S., and Lagüe, P. (2014) The influenza fusion peptide promotes lipid polar head intrusion through hydrogen bonding with phosphates and N-terminal membrane insertion depth, Proteins 82, 2118–2127.

68