L'utilisation du système CRISPR-Cas9 pour l'étude des

L'utilisation du système CRISPR-Cas9 pour l'étude des protéines non structurales du bactériophage 2972

infectant Streptococcus thermophilus

Mémoire

Ariane Renaud

Maîtrise en microbiologie - avec mémoire

Maître ès sciences (M. Sc.)

Québec, Canada

© Ariane Renaud, 2019

L’utilisation du système CRISPR-Cas9 pour

l’étude des protéines non structurales du

bactériophage 2972 infectant Streptococcus

thermophilus

Mémoire

Ariane Renaud

Sous la direction de :

Sylvain Moineau, directeur de recherche

iii

RÉSUMÉ

Les bactériophages sont des maîtres manipulateurs, prenant le contrôle complet d’une cellule

bactérienne, contournant les systèmes de défense et détournant la machinerie de transcription et de

traduction du génome bactérien pour la réplication virale. Les grandes étapes de la multiplication des

phages sont connues, pourtant les mécanismes intrinsèques de cette prise de contrôle restent un

mystère bien préservé. Malgré la petite taille et la simplicité relative des génomes de phages, seuls

les gènes associés à la structure des virions sont amplement caractérisés. Toutefois, les protéines non

structurales qui sont susceptibles d’être responsables de la prise de contrôle sont rarement étudiées.

C’est effectivement le cas pour le phage modèle 2972, infectant la souche Streptococcus thermophilus

DGCC7710 largement utilisée en industrie laitière. Son génome code pour 44 protéines putatives,

dont 14 protéines sont classées comme étant non structurales et dont aucune fonction n’est encore

associée. Lors de ce projet de maîtrise, le système CRISPR-Cas de type II-A, naturellement présent

chez S. thermophilus, a été utilisé à des fins d’édition du génome de ce phage pour étudier le rôle des

protéines non structurales. Ce système est idéal pour les manipulations génétiques des phages

virulents généralement complexes à modifier. Ainsi, une connaissance approfondie des interactions

entre le phage et son hôte sera un outil indispensable pour développer de meilleures méthodes de

contrôle des phages en industrie laitière.

iv

ABSTRACT

Bacterial viruses are master manipulators of bacterial cells. They are able to take complete control of

a bacterium, bypassing bacterial immune systems, hijacking core transcription and translation

machinery, and typically resulting in lysis of the host. Although the major steps of phage replication

are well understood, very little is known about the mechanisms of the host-cell takeover. Despite

phages having relatively small and ‘simple’ genomes, generally only the structural proteins have been

well characterized. In contrast, non-structural proteins, which include those involved in host cell

takeover, tend to be completely uncharacterized.

This is certainly the case for the model of Streptococcus thermophilus phages, 2972, which infects

the strain DGCC7710 widely used by the dairy industry. Its genome encodes for 44 putative proteins,

14 of which are non-structural and have no known function. In this master thesis, the type II-A

CRISPR-Cas system naturally present in S. thermophilus was used for genome engineering purposes

to investigate the role of non-structural proteins of phage 2972. This natural bacterial immune system

provides an ideal means for genetic manipulation of virulent phages, which are otherwise intractable.

This could lead to potentially valuable discoveries allowing us to further fine-tune the bacteria used

in various biological processes.

v

TABLE DES MATIÈRES

RÉSUMÉ ............................................................................................................................... iii ABSTRACT .......................................................................................................................... iv LISTE DES FIGURES ......................................................................................................... vii

LISTE DES TABLEAUX ................................................................................................... viii REMERCIEMENTS ............................................................................................................ xii Introduction ............................................................................................................................ 1

1.1 Les bactériophages .............................................................................................................. 1 1.1.1 Classification et morphologie ............................................................................................. 1

1.1.2 Mode d’infection ................................................................................................................ 2

1.1.3 Les phages de Streptococcus thermophilus ........................................................................ 7

1.1.4 Le phage 2972 .................................................................................................................... 9

1.2 Les bactéries lactiques ............................................................................................................. 11 1.2.1 Importance industrielle ......................................................................................................... 12

1.2.2 Le genre Streptococcus .................................................................................................... 12

1.2.3 Sensibilité aux phages ...................................................................................................... 14

1.2.4 Les mécanismes de défense .............................................................................................. 15

1.3 Les systèmes CRISPR ............................................................................................................. 17 1.3.1 Composition des systèmes CRISPR-Cas ......................................................................... 18

1.3.2 Classification .................................................................................................................... 19

1.3.3 CRISPR-Cas chez Streptococcus thermophilus ............................................................... 21

1.3.4 Les mécanismes de fonctionnement ................................................................................. 22

1.3.4.1 L’adaptation .................................................................................................................. 23

1.3.4.2 La biogenèse des ARNcr ............................................................................................... 25

1.3.4.3 L’interférence ................................................................................................................ 25

1.4 L’édition de génome................................................................................................................ 27 1.5 Problématique et objectifs de recherche .................................................................................. 30

CHAPITRE 2: Matériel et méthodes .................................................................................... 32 2.1 Souches bactériennes, plasmides et phages utilisés ................................................................ 32

2.1.1 Conditions de culture des bactéries .................................................................................. 34

2.1.2 Propagation, titration et conservation des lysats de phage ............................................... 35

2.1.3 Transformation bactérienne et extraction de plasmides ................................................... 36

2.2 Édition de génome du phage 2972 .......................................................................................... 36 2.2.1 Construction des BIM «sur demande» ............................................................................. 38

2.2.2 Construction des gabarits de recombinaison .................................................................... 40

2.2.3 Génération et purification des phages mutants ................................................................. 45

2.3 Caractérisation des phages mutants ......................................................................................... 46 2.3.1 Courbes de croissance ...................................................................................................... 46

2.3.2 Test d’adsorption .............................................................................................................. 48

2.3.3 Microscopie électronique à transmission ......................................................................... 48

2.3.4 Spectrométrie de masse .................................................................................................... 48

2.3.5 Production de BIM ........................................................................................................... 49

2.4 Caractérisation des protéines sauvages ................................................................................... 50 2.4.1 Choix et synthèse des protéines........................................................................................ 50

vi

2.4.2 Prédictions bio-informatiques .......................................................................................... 50

2.4.3 Dichroïsme circulaire ....................................................................................................... 51

CHAPITRE 3: Résultats ....................................................................................................... 53 3.1 Édition de génome du phage 2972 .......................................................................................... 53

3.1.1 Construction des BIM «sur demande» ............................................................................. 53

3.1.2 Génération et purification des phages mutants ................................................................. 54

3.2 Caractérisation des phages mutants ......................................................................................... 56 3.2.1 Courbes de croissance ...................................................................................................... 56

3.2.2 Test d’adsorption .............................................................................................................. 58

3.2.3 Microscopie électronique à transmission ......................................................................... 59

3.2.4 Spectrométrie de masse .................................................................................................... 60

3.2.5 Production de BIM ........................................................................................................... 61

3.3 Caractérisation des protéines sauvages ................................................................................... 65 3.3.1 Prédictions bio-informatiques .......................................................................................... 65

3.3.2 Dichroïsme circulaire ....................................................................................................... 67

CHAPITRE 4: Discussion .................................................................................................... 72 4.1 Édition de génome du phage 2972 .......................................................................................... 72 4.2 Caractérisation des phages mutants ......................................................................................... 73

4.2.1 Le phage 2972 et 2972 RBP Courte ................................................................................. 73

4.2.2 Le phage 2972Δ22............................................................................................................ 75

4.2.3 Le phage 2972Δ24............................................................................................................ 78

4.2.4 Les phages 2972Δ27 et 2972Δ28 ..................................................................................... 78

4.2.5 Le phage 2972Δ36............................................................................................................ 79

4.2.6 Le phage 2972Δ41............................................................................................................ 80

4.2.7 Le phage 2972Δ43............................................................................................................ 82

4.3 Caractérisation des protéines sauvages ................................................................................... 83 4.3.1 L’ORF32 .......................................................................................................................... 83

4.3.2 L’ORF40 .......................................................................................................................... 83

4.3.2 L’ORF 41 ......................................................................................................................... 84

Conclusion et perspectives ................................................................................................... 85

BIBLIOGRAPHIE ............................................................................................................... 86

vii

LISTE DES FIGURES

Figure 1.1 : Morphologie des trois familles de l'ordre des Caudovirales. .......................................... 2

Figure 1.2 : Le cycle lytique et lysogénique des bactériophages ....................................................... 3

Figure 1.3 : Modèle d’assemblage du bactériophage T4 .................................................................... 6

Figure 1.4 : Arbre phylogénétique montrant la divergence génétique entre le phage 5093 et cinq

phages pour le groupe cos et le groupe pac......................................................................................... 8

Figure 1.5 : Représentation du génome du phage virulent 2972 infectant S. thermophilus ............... 9

Figure 1.6 : Comparaison du génome des phages infectant Streptococcus thermophilus ................ 10

Figure 1.7 : Arbre phylogénétique de 138 espèces du genre Streptococcus .................................... 14

Figure 1.8 : Représentation schématique des différents systèmes de défense bactériens ................ 16

Figure 1.9 : Composition générale des systèmes CRISPR-Cas........................................................ 18

Figure 1.10 : Classification et organisation des types de systèmes CRISPR-Cas et domaines des

protéines effectrices pour les classes 1 et 2 ....................................................................................... 21

Figure 1.11 : Les trois étapes de fonctionnement des systèmes CRISPR-Cas ................................. 23

Figure 1.12 : Applications et outils reliés à l’utilisation de la protéine Cas9 en édition de génome.29

Figure 2.1 : Programmation du système CRISPR-Cas natif………………………………………..39

Figure 2.2 : Schématisation de la méthodologie permettant l’obtention des gabarits de recombinaison

........................................................................................................................................................... 41

Figure 2.3 : Exemple d’un graphique résultant d’une courbe de croissance de phage standard ..... 47

Figure 2.4 : Signaux de dichroïsme circulaire émis par les différents types de structures secondaires

en fonction de la longueur d’onde en nanomètre .............................................................................. 52

Figure 3.1 : Migration des produits PCR des régions délétées et sauvages pour les sept gènes

identifiés comme non essentiels au génome du phage 2972 ............................................................. 55

Figure 3.2 : Courbe de croissance à partir du titre relatif en fonction du temps pour cinq phages .. 57

Figure 3.3 : Photo en microscopie électronique à transmission des phages 2972 et 2972Δ22 ........ 59

Figure 3.4 : Le ratio de la production de BIM avec deux phages mutants (2972Δ22 et CEM22) par

rapport au phage 2972 sauvage en fonction de deux souches testées (DGCC7710 et BIM AR1) .... 62

Figure 3.5 : Le ratio de la production de BIM avec deux phages mutants (2972Δ41 et CEM41) par

rapport au phage 2972 sauvage en fonction de deux souches testées (DGCC7710 et BIM A-35). .. 63

Figure 3.6 : Dispersion des proto-espaceurs visés sur le génome du phage 2972 du système CRISPR-

Cas de S. thermophilus face aux phages ayant diverses mutations dans l’orf22 et l’orf41 ............... 64

Figure 3.7 : Prédiction bio-informatique de la structure secondaire de l’ORF32 réalisée avec le

logiciel I-TASSER ............................................................................................................................ 66


logiciel QUARK (171). ..................................................................................................................... 66


logiciel I-TASSER (171). .................................................................................................................. 67

Figure 3.10 : Analyse par dichroïsme circulaire de la protéine ORF32 ........................................... 68

Figure 3.11 : Courbe de dénaturation de la protéine ORF32. .......................................................... 69

Figure 3.12 : Analyse par dichroïsme circulaire de la protéine ORF40 ........................................... 69

Figure 3.13 : Courbe de dénaturation de la protéine ORF40. .......................................................... 70

viii

LISTE DES TABLEAUX

Tableau 2.1 : Liste des souches bactériennes, des phages et des plasmides utilisés lors de l’étude et

leurs caractéristiques. ........................................................................................................................ 32

Tableau 2.2 : Les orfs prédits du phage 2972 ainsi que leurs fonctions putatives (48).................... 37

Tableau 2.3 : Espaceurs possibles visés lors de la programmation du système CRISPR-Cas. ........ 38

Tableau 2.4 : Informations sur les constructions génétiques pour chaque gène visé ainsi que sur les

domaines conservés chez les protéines résultantes. .......................................................................... 40

Tableau 2.5 : Oligonucléotides utilisés lors cette de recherche ainsi que leur utilisation. ............... 42

Tableau 3.1 : Espaceurs intégrés dans les locus CRISPR1 ou CRISPR3 de la souche S. thermophilus

DGCC7710 suite à la programmation du système CRISPR-Cas natif………………………………53

Tableau 3.2 : EOP du phage 2972 sur les BIM construits suite à la programmation du système

CRISPR-Cas. ..................................................................................................................................... 53

Tableau 3.3 : Information génétique sur les gènes à l’étude du phage 2972. .................................. 54

Tableau 3.4 : Résultats du séquençage Illumina pour les phages 2972, 2972Δ22, 2972Δ28, 2972Δ41

et 2972Δ43. ....................................................................................................................................... 56

Tableau 3.5 : Données correspondantes aux courbes de croissance des phages 2972, 2972 RBP

courte, 2972Δ22, 2972Δ41 et 2972Δ43. ........................................................................................... 58

Tableau 3.6 : Pourcentage d’adsorption après 10 minutes des phages 2972, 2972Δ22 et 2972Δ41 sur

la souche S. thermophilus DGCC7710. ............................................................................................. 58

Tableau 3.7 : Mesure des dimensions de la queue et de la capside du phage 2972 et du phage

2972Δ22. ........................................................................................................................................... 60

Tableau 3.8 : Les protéines du phage 2972 détectées par spectrométrie de masse. ......................... 60

Tableau 3.9 : Capacité de production de BIM avec la souche DGCC7710 et le BIM AR1 contre les

phages 2972, 2972Δ22 et CEM22. .................................................................................................... 62

Tableau 3.10 : Capacité de production de BIM avec la souche DGCC7710 et le BIM A-35 contre les

phages 2972, 2972Δ41 et CEM41. .................................................................................................... 63

Tableau 3.11 : Résultats du calcul des structures secondaires en pourcentage de l’ORF32 à 25 °C

selon différentes bases de données et méthodes de calcul. ............................................................... 70

Tableau 3.12 : Résultats du calcul des structures secondaires en pourcentage de l’ORF40 à 25 °C

selon différentes bases de données et méthodes de calcul. ............................................................... 71

ix

LISTE DES ABRÉVIATIONS

a.a. Acide aminé

Abi Abortive infection mecanism (Mécanisme d’avortement de l’infection)

ADN Acide Désoxyribonucléique

ADNsb ADN simple brin

ARN Acide ribonucléique

ARNcr ARN CRISPR

ARNpré-cr ARN précusseur

ARNtracr ARN transactivateur des ARNcr

ATP Adénosine Triphosphate

BIM Bacteriophage Insensitive Mutant (Mutant résistant aux bactériophages)

Cas CRISPR associated (associé au système CRISPR)

CEM CRISPR Escaping Mutant (Mutant échappant au système CRISPR)

CHUL Centre Hospitalier de l’Université Laval

CRISPR Clustered Regularly Interspaced Short Palindromic Repeats (Agglomération

de courtes répétitions palindromiques espacées par intervalle régulier)

dCas9 Dead Cas9 (Cas9 catalytiquement inactive)

DO600 Densité optique à une longueur d’onde de 600 nm

DSB Double Stranded Break (Bris double brin)

DUF Domain of Unknown Function (Domaine de function inconnu)

EOP Efficiency of Plaquing (Efficacité d’infection)

EPS Exopolysaccharides

GRAS Generally Recognized as Safe (Reconnue comme sécuritaire)

HIF Host Intergration Factor (Facteur d’intégration de l’hôte)

BL Bactérie lactique

MOI Mutiplicity of Infection (Mutiplicité d’infection)

NAG N-acetylglucosamine

NAM Acide N-acetyl muramique

nCas9 Nickase Cas9 (Cas nickase)

NHEJ Non-Homologous End Joining

nm Nanomètre

x

NmCas9 Cas9 de Neisseria meningitidis

nt. Nucléotide

Orf Open Reading Frame (Cadre de lecture ouvert)

PAM Protospacer Adjacent Motif (Motif adjacent au proto-espaceur)

pb Paire de bases

PCR Polymerase Chain Reaction (Réaction en chaine de la polymérase)

RBP Receptor Binding Protein (Protéine liant le récepteur)

RH Recombinaison homologue

rpm Rotation par minute

Sie Super infection exclusion (Exclusion de super-infection)

SpCas9 Cas9 de Streptococcus pyogenes

TALEN Transcription activator-like effectors nuclease (Nucléase semblable aux

activateurs de la transcription)

TMP Tape Measure Protein (Protéine de mesure étalon)

UFP Unité formatrice de plage de lyse

ZFN Zinc Finger Nuclease (Nucléase doigt de zinc)

xi

« Almost all aspects of life are engineered at a molecular level, and

without understanding molecules we can only have a very sketchy

understanding of life itself »

-Francis Crick, 1988

xii

REMERCIEMENTS

Je tiens à remercier mon directeur de recherche, le professeur Sylvain Moineau, de m’avoir donné

l’occasion de travailler dans un laboratoire d’une grande expertise avec une équipe motivante et

soudée. Mon amour pour les phages a commencé lorsque j’étais laborantine et j’ai pu ensuite

découvrir ce monde merveilleux lors d’un stage de recherche et enfin, une maîtrise. Mes années

passées dans le laboratoire du Prof. Moineau m’ont appris à repousser mes limites et à travailler pour

ce qu’on aime. J’aimerais souligner l’appui des professionnelles de recherche Denise Tremblay et

Geneviève Rousseau qui ont répondu à mes millions de questions chaque jour. Grâce aux membres

de l’équipe, plus particulièrement Moïra, Marie-Laurence, Stéphanie, Rachel, Cécile, Alessandra,

Alexander, Witold, Simon, Alice, Cas et Hany, j’ai trouvé ma deuxième famille et c’est avec cette

famille que j’ai pu avancer dans la science !

Je voudrais aussi remercier les membres de mon comité aviseur. D’abord, Alexander Culley pour les

conseils et le soutien lors de mon projet et Stéphane gagné pour son aide précieuse lorsqu’une

microbiologiste s’aventure dans le monde de la détermination de structure des protéines.

Ensuite, j’aimerais remercier toutes les personnes présentes à mes côtés lors de mes études. Plus

particulièrement mes parents et ma sœur, Gabrielle, pour le soutien moral et l’approvisionnement en

café lors de mon écriture. Merci de m’avoir toujours encouragé dans mes projets.

Finalement, je désire remercier le regroupement PROTEO et le Conseil de recherche en sciences

naturelles et en génie pour le soutien financier, ainsi que le Groupe de recherche en écologie buccale

pour les locaux, les équipements et les évènements.

1

Introduction

1.1 Les bactériophages

Les bactériophages sont les entités biologiques les plus variées et nombreuses sur la planète (1). Il est

estimé que le nombre de phages sur terre se situe entre 1030 et 1032, ce qui est dix fois plus que le

nombre de cellules bactériennes (2). Ils ont un impact écologique immense, notamment sur le

recyclage des éléments nutritifs des cycles biogéochimiques et sur le maintien de la diversité

microbienne (3, 4).

En 100 ans de recherche, les phages ont été impliqués dans de nombreuses de découvertes

biologiques, contribuant à l’avancée significative de la génétique et de la biologie moléculaire (5).

Les phages possèdent énormément de diversité morphologique et génétique, leur conférant une

gamme de caractéristiques très diverse et répandue. L’étude des phages a notamment permis de

découvrir que les attributs héréditaires sont transmis par l’ADN et non les protéines, que les phages

sont responsables de conférer des facteurs de virulence à certaines bactéries pathogènes et que le code

génétique est constitué de codons composés de trois nucléotides (5, 6). Les phages sont aussi au cœur

de plusieurs technologies dont la thérapie par les phages et l’exposition sur phage (phage display) (7,

8). Les phages étant les entités biologiques les plus influentes sur Terre, la recherche qui en découle

joue donc un rôle de haut niveau dans les avancées présentes et futures.

1.1.1 Classification et morphologie

Tous les virus sont construits selon le même principe, où une molécule génétique composée d’acide

désoxyribonucléique (ADN) ou d’acide ribonucléique (ARN), sous forme double ou simple brin, est

protégée par une enveloppe protéique. La forme, la taille et la composition de cette enveloppe varient

grandement et elle est souvent constituée de sous-unités identiques qui respectent des règles

géométriques très strictes (9). Les virus infectant les procaryotes peuvent avoir une morphologie

polyédrique, filamenteuse, pléomorphique ou avec une queue (10). La classification de ces particules

virales se fait principalement par la distinction morphologique de l’enveloppe protéique et par la

différence du contenu génétique selon Bradley en 1967 (9). L’ordre le plus nombreux est celui des

Caudovirales où 96,3 % des phages observés peuvent y être assignés, comprenant trois familles, soit

les Myoviridae, les Siphoviridae et les Podoviridae (figure 1.1), ayant une prévalence de

respectivement 24,8%, 57,3% et 14,2% (10). Tous les phages appartenant à cet ordre possèdent une

2

tête icosaédrique, ou capside, formée de capsomères, une queue et un génome d’ADN double brin

(11). Certains phages parmi ceux-ci peuvent être dotés d’appendices supplémentaires tels des fibres

caudales ou des plaques basales. C’est la morphologie de la queue qui permet de distinguer les

différentes familles. Les phages de la famille des Myoviridae ont une queue gainée qui a la capacité

de se contracter et qui est assez large, contrairement à ceux de la famille des Podoviridae qui ont une

queue très courte et non contractile. Pour ce qui est des phages de la famille des Siphoviridae, ils

possèdent une queue plus longue, non contractile et moins large que celle des Myoviridae (11–13).

Figure 1.1 : Morphologie des trois familles de l'ordre des Caudovirales. Adaptée de Ackermann, 2003 (12).

1.1.2 Mode d’infection

Les bactériophages ont plusieurs modes d’infection. En général, ils peuvent être virulents ou

tempérés, et donc compléter respectivement un cycle lytique ou un cycle lysogénique (figure 1.2). Le

cycle lytique comprend six grandes étapes. D’abord, il y a reconnaissance et adsorption du phage à

la surface cellulaire. Ensuite, le phage injecte son ADN à l’intérieur du cytoplasme de la cellule, où

celui-ci prend contrôle de la bactérie pour la réplication de son propre génome. Puis, il y a

transcription et traduction des protéines du bactériophage. Les protéines structurales serviront à

former les composantes nécessaires à l’assemblage des virions. Les éléments de la capside et de la

queue s’associent indépendamment l’un de l’autre pour permettre à l’ADN d’entrer dans la capside.

Le génome sera empaqueté dans la capside vide, puis les virions complets seront assemblés et libérés

par lyse cellulaire (4). Pour ce qui est des bactériophages tempérés, ils vont s’intégrer au génome

bactérien suite à l’entrée de l’ADN dans la cellule pour entamer un cycle lysogénique. Ils pourront

être transmis aux cellules filles sous forme de prophage, jusqu’à ce qu’un stress provoque son excision

et que le cycle lytique soit engagé (3, 4).

Podoviridae

Siphoviridae Myoviridae

3

L’étape initiale de l’adsorption implique les protéines de la queue du phage (fibres, plaque basale,

etc.) qui reconnaîtront un récepteur à la surface bactérienne. Les récepteurs sont variables en fonction

du type de bactérie (Gram positif ou Gram négatif) et sont généralement des protéines membranaires,

des polysaccharides ou des composantes du peptidoglycane, tels les acides téichoïques et

lipotéichoiques (14, 15). Le type de récepteur reconnu est spécifique à chaque phage, ce qui détermine

son spectre lytique. Certains phages vont aussi posséder des enzymes associées à leur queue pour

dégrader les constituants de la paroi cellulaire et permettre une meilleure adsorption (16).

L’attachement initial à la cellule hôte est réversible jusqu’à ce qu’un changement de conformation

des protéines de reconnaissance rendent le lien irréversible, assurant le début du cycle lytique (14).

Figure 1.2 : Le cycle lytique (à gauche) et lysogénique (embranchement à droite) des bactériophages. Adaptée

de Labrie et al., 2010 (17).

Puis, lorsque cet attachement devient irréversible, le cycle lytique peut alors commencer. La queue

du bactériophage va subir un changement de conformation majeur, lui permettant d’injecter son

génome à travers la membrane bactérienne. Les phages appartenant à des familles différentes n’auront

pas les mêmes mécanismes d’injection de l’ADN dû aux composantes de la queue qui sont distinctes

entre ces familles. Les Myoviridae ont deux composantes majeures qui jouent un rôle important lors

de cette étape, soit le tube interne rigide qui connecte la capside du phage au cytoplasme de la bactérie

4

et la gaine contractile qui entoure le tube interne (18). Lors de l’attachement du phage par la plaque

basale ou les fibres caudales, celle-ci va entamer un changement de conformation qui provoque la

contraction de la gaine de la queue. Ensuite, le tube interne, grâce à sa nature rigide, va percer

l’enveloppe cellulaire pour permettre la translocation de l’ADN et des protéines contenues dans la

capside à l’intérieur de la bactérie (19). Les phages appartenant à la famille des Siphoviridae ont une

stratégie plutôt différente. Les détails du mécanisme de translocation de l’ADN n’ont pas encore été

élucidés, en revanche il a été établi que la protéine majeure étalon (TMP) joue un rôle très important.

Suite à la reconnaissance de la surface bactérienne par les fibres de la queue ou les protéines se liant

aux récepteurs (RBP), un changement de conformation de ce complexe protéique force le contact du

tube interne de la queue sur la paroi cellulaire. La liaison de ces deux structures engendre l’éjection

de l’ADN, qui force la sortie de la TMP, contenue à l’intérieur du tube rigide et crée ainsi un tunnel

pour l’ADN jusqu’au cytoplasme (20). Pour ce qui est des Podoviridae, comme cette famille est

définie par une queue très courte, beaucoup de phages ont des RBP qui possèdent une activité

enzymatique permettant au phage de percer un canal jusqu’à la surface bactérienne (21). Il y a souvent

une digestion du récepteur primaire, fréquemment des polysaccharides, pour générer l’accès au

récepteur secondaire. Suite à la liaison irréversible du phage, les protéines internes de la queue qui

forme la machinerie d’éjection complexe vont former un passage à travers la paroi. L’ADN encapsidé

se trouve dans un état énergétique non favorable, créant une extrême pression qui va donc forcer son

éjection dans le cytoplasme (22, 23).

L’ADN contenu dans la capside se trouve sous forme linéaire, toutefois la majorité des génomes de

phages vont prendre une forme circulaire dès l’entrée dans le cytoplasme. La circularisation assure la

transcription des extrémités du génome, cependant plusieurs stratégies ont été développées par les

phages se répliquant de manière linéaire pour contrer ce problème. Par exemple, le phage T7 possède

des extrémités répétées qui seront régénérées lors de l’empaquetage de l’ADN, ce qui empêche la

perte de matériel génétique (24). Quant à eux, les génomes circulaires ont un type de réplication thêta

(θ) ou en cercle roulant.

Ensuite, les différents modules de l’architecture des génomes sont transcrits et traduits selon leur

expression temporelle, soit les gènes précoces, médians et tardifs, en fonction des étapes du cycle

infectieux (figure 1.2). Les gènes précoces et médians codent normalement pour des protéines ayant

un rôle dans la réplication et la transcription virale, ainsi que la régulation des gènes. Comme

l’assemblage des virions est une des dernières étapes, les gènes tardifs, exprimés tard suite à

l’infection formeront les composantes structurales du virion (25, 26).

5

Puis, les protéines de la capside vont s’assembler pour permettre l’empaquetage de l’ADN, où un

minimum de 60 copies de la protéine majeure de la capside est nécessaire pour former une procapside

vide (figure 1.3). Chaque génome est transloqué dans la capside par une ouverture dans celle-ci,

comme une bobine de fil. Le complexe protéique d’empaquetage, composé de plusieurs protéines

structurales, utilise l’hydrolyse de l’ATP pour accomplir cette tâche (27, 28). Enfin, la terminase,

faisant partie de ce complexe et attachée à l’ouverture de la capside, coupe le génome des phages de

différente façon selon le type de phage. Par exemple, le génome des phages de type cos sera coupé

au site portant le même nom, afin d’obtenir une copie du génome par capside et donc une population

de phages identiques. Pour les phages de type pac, la terminase coupe le génome lorsque la capside

est pleine et donc celle-ci contient généralement 102% à 110% du génome total (29). Lorsque l’ADN

est transloqué, le connecteur et les protéines du col vont venir bloquer l’ouverture de la capside et

permettre l’attachement de la queue préalablement assemblée. Finalement, les protéines accessoires

de la queue, s’il-y-a lieu, vont venir se joindre à l’extrémité de la queue pour former un virion mature

(4).

Finalement, les virions matures sont prêts à être libérés dans l’environnement par lyse cellulaire. Les

phages à ADN double brin ont une lyse précisément programmée qui est possible grâce à deux

principales protéines, la holine et l’endolysine. La holine forme des agrégats résultant en un trou dans

la membrane interne, permettant le passage de l’endolysine et l’accès au peptidoglycane. La lyse est

donc dépendante de l’expression de la holine pour contrôler son temps de latence, soit le temps

nécessaire pour compléter un cycle lytique (14). Trois classes de holines sont connues chez les

phages, mais chaque phage ne possède qu’une holine. Les holines de classe I ont trois domaines

transmembranaires et une courte séquence en C-terminal chargée positivement. Les holines de classe

II n’ont que deux domaines transmembranaires dont les extrémités de la protéine sont

cytoplasmiques. Puis, les holines de classe III possèdent un domaine transmembranaire et un large

segment hydrophile en C-terminal. Quant à elle, l’endolysine est responsable de la dégradation du

peptidoglycane et s’accumule dans le cytoplasme généralement durant la transcription et la traduction

tardive du génome (14, 30)

Pour les endolysines, il existe quatre principales classes qui attaquent différents liens de la couche du

peptidoglycane. Encore une fois, un phage ne peut posséder qu’une seule endolysine. Deux types de

lysozymes, les endo-β-N-acetylglucosaminidases et les N-acetylmuraminidases agissent sur deux

liaisons majeures entre le squelette glucosé du N-acetylglucosamine (NAG) et de l’acide N-acetyl

6

muramique (NAM). Les endopeptidases dégradent les liens interpeptidiques et les amidases, la classe

d’endolysine la plus fréquente, hydrolysent les liaisons amides des oligopeptides (14).

Figure 1.3 : Modèle d’assemblage du bactériophage T4. Tirée de Wiley, 2013 (4).

Les phages tempérés sont particuliers du fait qu’ils peuvent prendre la décision d’entrer soit dans le

cycle lytique ou lysogénique. Il y a l’établissement d’une communication, dirigée entre autres par de

petites protéines ou des déterminants génétiques, entre l’hôte et le phage pour coordonner l’un ou

l’autre des cycles (31). Le cycle lysogénique comporte trois grandes étapes, dont les mécanismes

moléculaires varient beaucoup en fonction de la nature du phage. D’abord, il y a l’intégration du

génome viral, où celui-ci va s’intégrer dans le chromosome bactérien au hasard ou par recombinaison

via des sites spécifiques (32, 33). Certains phages vont rester sous forme circulaire ou linéaire sans

intégration au génome bactérien. Puis, il y a l’étape de persistance où le génome viral, alors nommé

prophage, est répliqué avec celui de la bactérie et donc transmis aux cellules filles. Les prophages

extra-chromosomaux codent alors pour des gènes d’origine plasmidique nécessaires à leur transfert

et à leur maintien. Finalement, il y a l’induction du prophage, où il va s’exciser du génome bactérien

7

et entreprendre le cycle lytique. Cet évènement se fait de façon spontanée à très basse fréquence ou

survient suite à un stress externe chez la bactérie (34).

1.1.3 Les phages de Streptococcus thermophilus

Les phages infectant l’espèce Streptococcus thermophilus appartiennent tous à la famille des

Siphoviridae par la présence de leur longue queue fine et non contractile. La plupart de ces phages

ont été isolés à partir d’échantillons de lait ou de fromage, car ceux-ci sont responsables de certains

problèmes dans l’industrie laitière. En effet, comme les phages attaquent les bactéries présentes dans

les ferments, ils peuvent causer un ralentissement de la fermentation laitière (voir section 1.2.1) (35–

38). La classification de ces phages se fait maintenant en quatre groupes en fonction du nombre de

protéines majeures structurales, de leur mécanisme d’empaquetage de l’ADN et de la séquence

génomique (39). Les phages appartenant au groupe cos ont des extrémités génomiques cohésives (site

cos) qui sont reconnues et clivées lors de l’empaquetage de l’ADN dans la procapside, résultant en

une seule copie du génome par virion (29, 40). Les phages de ce type possèdent deux protéines

majeures structurales tandis que les phages de type pac possèdent trois protéines majeures

structurales. Les phages de type pac ne possèdent pas de sites cos et utilisent un mode d’empaquetage

dit «tête pleine» (headful packaging), où l’ADN est transloqué dans la capside et clivé seulement

lorsque celle-ci est pleine (27, 40).

Un autre groupe de phages, nommé 5093, moins prévalent, infecte aussi l’espèce thermophilus (41).

Il affiche certaines similitudes de séquence avec des phages infectant le genre Streptococcus, mais

appartenant à des espèces non utilisées dans l’industrie laitière (S. pyogenes, S. pneumoniae et S.

gordonii), en plus de son incapacité à être détecté par un PCR Multiplex utilisé pour grouper les

phages appartenant aux groupes précédents (37, 42). Ce groupe est distinct par un gène codant pour

la protéine de liaison au récepteur complètement différent, généralement très conservé parmi les

autres groupes et par une plaque basale contenant 6 fibres d’apparence globulaire suggérant que son

mode d’attachement à la cellule bactérienne est différent (41, 42). D’un point de vue évolutif, ce

groupe est divergent des autres et il a emprunté un chemin phylogénétique tout à fait unique des

phages des groupes cos et pac (figure 4).

8

Figure 1.4 : Arbre phylogénétique montrant la divergence génétique entre le phage 5093 et cinq phages pour

le groupe cos et le groupe pac (41).

Récemment, un nouveau groupe de phages infectant S. thermophilus a été découvert, le groupe 987

(43). Ce groupe, détecté en 2016, est le résultat probable d’un évènement d’échange génétique,

puisqu’il présente plusieurs caractéristiques des phages du groupe P335 infectant Lactococcus lactis.

La morphologie de la queue présente de grandes ressemblances avec ces phages, étant

significativement plus petite, soit environ 135 nm contrairement aux phages typiques de S.

thermophilus qui varie entre 220 et 330 nm (35). De plus, la plaque basale est visible en microscopie

électronique et s’apparente à celles observées chez les phages du groupe P335. Ces traits sont le

produit d’un génome hybride, où les modules codant pour les protéines structurales ont un haut

pourcentage d’identité en acides aminés avec les phages du groupe P335 (plus précisément le phage

TP901-1) et où les modules de réplication du groupe 987 présentent de fortes similarités avec les

autres phages de S. thermophilus. De plus, certains des phages provenant de ce groupe ont la capacité

de s’adsorber à la surface des souches de Streptococcus thermophilus et de Lactococcus lactis (43).

Pour ce qui est de la ressemblance génétique entre les phages infectant S. thermophilus, peu de cadres

de lecture ouverts (orf) peuvent être inclus dans le génome de cœur, soit la portion du génome

partagée entre tous les phages. Selon douze séquences complètes des phages de S. thermophilus des

groupes cos ou pac, il est possible d’identifier 26 orfs conservés parmi les phages de type cos et 24

orfs conservés parmi les phages de type pac, pour seulement 5 orfs tous types confondus (44). Les

gènes généralement conservés dans le génome de cœur font partie du module de la lyse cellulaire

(holine et endolysine) et du module d’empaquetage de l’ADN (35). De plus, les phages de S.

9

thermophilus possèdent un gène codant pour la protéine de liaison au récepteur bien conservé (sauf

pour le groupe 5093 décrit ci-dessus). Il est intéressant de noter qu’une région hautement variable

dans ce gène, nommée VR2, est spécifique à chaque phage et que cette région est le principal

déterminant du spectre lytique (45). Alternativement, il est possible de grouper les phages en fonction

de cette région, cependant cette méthode ne permet pas un classement exhaustif, car il a été suggéré

que VR2 n’est probablement pas le seul déterminant de la reconnaissance bactérienne (42, 45, 46).

Bref, il est clair qu’une grande diversité génétique est présente chez les phages infectant S.

thermophilus. Jusqu’à ce jour, quatre groupes de phages ont été découverts et caractérisés. Cette

disparité est due à beaucoup d’évènements de réarrangement génétique et d’échange de modules,

résultant en une gamme variée de phages pouvant infecter les souches utilisées dans l’industrie laitière

(42, 47).

1.1.4 Le phage 2972

Le phage 2972 est un phage virulent, appartenant au groupe de type pac, qui infecte la souche S.

thermophilus DGCC7710. Ce phage de la famille des Siphoviridae possède une capside de 55 nm et

une queue d’une longueur de 260 nm. Il possède un génome d’ADN double brin de 34 704 paires de

base (pb), un des plus petits chez les phages infectant l’espèce thermophilus et code pour 44 orfs

putatifs de 40 codons et plus ayant tous la même orientation (figure 5) (26).

Figure 1.5 : Représentation du génome du phage virulent 2972 infectant S. thermophilus. Les flèches

représentent des orfs. Les orfs en vert indiquent des gènes exprimés tôt suite à l’infection (0-7 minutes post-

infection), les orfs en bleu indiquent des gènes exprimés au milieu de l’infection (7-22 minutes post-infection)

et les orfs en rouge ou jaune indiquent des gènes exprimés tard suite à l’infection (12-27 minutes post-infection).

Les orfs ayant un contour gras codent pour des protéines aux fonctions inconnues. Les flèches noires

représentent les promoteurs putatifs, inspirée de Martel et Moineau, 2014, Duplessis et al., 2005 et Lévesque et

al., 2005 (26, 48, 49).

10

Son génome a un pourcentage G+C de 40,15%, ce qui est semblable au pourcentage présent dans le

génome de son hôte DGCC7710, qui est de 39% (50, 51). Il est divisé en trois groupes de gènes

déterminés selon le profil d’expression temporelle. Les gènes précoces (de l’orf30 jusqu’à l’orf44 et

l’orf1), en vert, sont exprimés au niveau maximal de 0 à 7 minutes suite à l’infection. Les gènes

médians (de l’orf2 à l’orf12), en bleu, sont exprimés au plus haut niveau de 7 à 22 minutes après le

début du cycle lytique. Puis les gènes tardifs (de l’orf13 à l’orf26), en rouge, sont exprimés

majoritairement de 12 à 27 minutes. De plus, les gènes peuvent aussi être divisés en module de

fonction dans le génome : le module d’encapsidation, la morphogénèse de la capside et de la queue,

le module de lyse et le module de réplication de l’ADN et de régulation de la transcription (48, 49).

Figure 1.6 : Comparaison du génome des phages infectant Streptococcus thermophilus. Les orfs sont

représentés par les flèches. Les flèches de la même couleur et reliées en gris si possible ont 70% ou plus

d’identité en acides aminés entre les protéines déduites. Les couleurs de fond représentent les différents modules

des génomes. Le rouge représente le module de morphologie, le jaune est pour le module de lyse cellulaire et

le bleu regroupe les orfs du module de lysogénie. Finalement, le vert représente le module de réplication du

génome et activation de la transcription. Tirée de Martel et Moineau, 2014 (44).

Le génome du phage 2972possède aussi deux introns. Le premier se situe entre les orfs 3 et 4, a une

longueur de 307 pb et interrompt la grande sous-unité de la terminase. Le deuxième se trouve entre

les orfs 26 et 29, a une longueur de 442 pb et coupe le gène de l’endolysine. Ces introns font partie

11

des introns du groupe I. Ils sont auto-épissable et s’excisent de l’ARNm, donc ils n’empêchent pas

l’expression des gènes dans lesquels ils se trouvent (52). Trois promoteurs putatifs ont été déterminés

selon la séquence consensus en position -35 et -10. Le promoteur P1 se trouve à 358 pb en amont de

l’orf2, le promoteur P2 se situe 30 pb en amont de l’orf31 et le promoteur P3 a été localisé à 166 pb

en amont de l’orf39 (26).

Plusieurs régions du génome du phage 2972 sont conservées parmi les phages infectant S.

thermophilus, dont le module de réplication de l’ADN et les modules codant pour les protéines

structurales (figure 6). Toutefois, l’orf25 codant pour la holine possède un pourcentage d’identité

>50% avec des prophages infectant d’autres espèces appartenant au genre Streptococcus. La

prédiction de la topologie a identifié que cette protéine possèderait trois domaines transmembranaires,

ce qui est caractéristique des holines de classe I. L’orf20 a été identifiée comme codant pour la

protéine structurale la plus divergente parmi celles du protéome. Cette protéine possède plusieurs

motifs collagen-like, ce qui est typique des RBP chez les phages infectant des hôtes ayant un faible

pourcentage G+C. Elle a donc été désignée comme étant la RBP, dû aux caractéristiques énumérées

précédemment et sa position dans le génome (26). La plupart des gènes structuraux ont été identifiés

pour ce phage, principalement par analyses bio-informatiques et SDS-PAGE (tableau 2.2). Toutefois,

une grande partie des protéines codées par les gènes précoces dans le module de réplication du

génome et de régulation de la transcription ont encore une fonction inconnue (48).

1.2 Les bactéries lactiques

Les bactéries lactiques (BL) sont des bactéries à Gram positif et catalase négative. Elles sont

majoritairement retrouvées sous forme de coques ou de bâtonnets, ayant un mode de fermentation

anaérobie facultative (53). Le produit final de la fermentation des sucres se trouve à être en grande

partie l’acide lactique. Les BL incluent parmi leur rang les genres Lactobacillus, Lactococcus,

Leuconostoc, Streptococcus, Oenococcus, Pediococcus et Denococcus (54). Les BL ont un

métabolisme homofermentaire ou hétérofermentaire. Les espèces homofermentaires convertissent les

sucres en acide lactique et les espèces hétérofermentaires ont une production d’acide lactique

accompagnée d’acétate, de CO2 et d’éthanol (55).

Les bactéries lactiques sont des organismes commensaux et leurs habitats sont très diversifiés. Elles

peuvent se retrouver dans la cavité orale, vaginale et la voie gastro-intestinale des humains et des

animaux, ainsi que sur les plantes et les produits de fermentation. Certains de ces genres bactériens

12

sont producteurs d’exopolysaccharides (EPS), un polymère de grande masse moléculaire attaché ou

non à la paroi ou la capsule de la bactérie (56, 57).

Ces bactéries sont connues comme étant un groupe hétérogène possédant une diversité énorme de

plasmides (58). Les plasmides sont des modules autoréplicatifs indépendants du chromosome

bactérien, qui confère souvent un avantage évolutif dans un environnement particulier (4). Plusieurs

fonctions importantes pour les bactéries lactiques sont codées par des gènes retrouvés sur ces éléments

génétiques. Par exemple, ils peuvent porter des gènes codant pour l’hydrolyse de protéines, la

production d’exopolysaccharides, la résistance aux antibiotiques et le métabolisme de certaines

molécules. Les souches de BL qui possèdent un plasmide augmentant l’hydrolyse de la caséine,

permettant l’utilisation du lactose, du galactose, ou de tout autre métabolite qui modifie le goût et la

texture des produits de consommation, ont donc des caractéristiques industrielles intéressantes (58).

1.2.1 Importance industrielle

L’industrie laitière est le principal exploitant des ferments composés de ces bactéries lactiques,

productrices ou non d’exopolysaccharides, pour la production de yogourt, fromage, kéfir et autres

produits d’origine laitière. Toutefois, les bactéries lactiques sont aussi utilisées lors du processus de

production de la choucroute, du pain de seigle, de certains types de saucissons et de beaucoup d’autres

produits de fermentation (53). Les ferments de départ utilisés vont contribuer à la saveur du produit

grâce à la diversité des métabolites secondaires produits.

Les bactéries lactiques sont aussi utilisées sous forme de probiotiques. Les probiotiques sont définis

comme une préparation de microorganismes vivants qui sont destinés à la consommation et qui

lorsqu’ils sont consommés en quantité adéquate procurent des bienfaits sur la santé (59). Plusieurs

études ont montré que le microbiote, soit la communauté de bactéries qui colonise le corps humain,

influence la prévalence de plusieurs maladies tels le diabète, l’obésité et quelques problèmes

inflammatoires des intestins. L’administration de probiotiques promeut donc un microbiote équilibré

pour de meilleurs bénéfices sur la santé globale (59).

1.2.2 Le genre Streptococcus

Les bactéries appartenant au genre Streptococcus ont une morphologie en coques sphériques ou

allongées d’une longueur variant entre 0,8 µm et 1,2 µm, en pairs ou chaînes et non motiles (60).

13

Elles ont une respiration anaérobie facultative et un métabolisme homofermentaire, où l’acide

lactique est le seul produit de la fermentation des sucres. Les besoins nutritifs de ce genre sont assez

complexes et variables selon l’espèce et les souches. De plus, la grande production d’acide lactique

chez ce genre bactérien cause une baisse du pH rapide qui inhibe la croissance bactérienne et c’est

pour cette raison qu’il est important de tamponner le milieu de culture. Beaucoup d’espèces présentes

dans ce genre, telles S. pneumoniae et S. pyogenes, sont connues comme des organismes pathogènes

ayant une grande virulence. Leur température optimale de croissance varie de 37 °C à 42°C (55, 61).

Une classification du genre Streptococcus regroupe les espèces en sept distincts groupes nommés par

l’espèce modèle de chacun (figure 1.7). La classification phylogénétique s’est faite selon l’ARN16S.

S. thermophilus, contenu dans le groupe Salivarius, est une espèce ayant une distance phylogénétique

proche des espèces pathogènes, pourtant elle est la seule à être définie comme un organisme

sécuritaire Generally Recognized As Safe (GRAS), ce qui lui permet d’être utilisée dans l’industrie

alimentaire (62).

Effectivement, les gènes codant pour des déterminants génétiques de la virulence sont absents,

inactifs ou sous forme de pseudogènes chez S. thermophilus. Ceci témoigne de l’évolution de cette

espèce à s’adapter à sa niche écologique, le lait. L’acclimatation de Streptococcus thermophilus s’est

fort probablement faite par une pression sélective du milieu et par échange de gènes horizontaux (61).

Plusieurs séquences d’insertions dans certains génomes de cette espèce ont plus de 90% d’identité

avec d’autres bactéries lactiques, telles Lactobacillus bulgaricus, Lactococcus lactis sous-espèce

cremoris et lactis. Ces microorganismes, dont le métabolisme est optimisé pour la croissance dans le

lait, sont fréquemment utilisés en co-culture lors de la fermentation de produits laitiers et donc cela

suggère que leur proximité physique a favorisé l’échange de gènes (62).

C’est grâce à cette évolution que l’espèce S. thermophilus est la plus utilisée pour les ferments de

yogourt, puisqu’elle procure une texture remarquable ayant de grandes propriétés organoleptiques

(56, 63–65). Ceci est dû en partie à son métabolisme homofermentaire et à sa production unique

d’exopolysaccharides. En effet, cette espèce bactérienne à Gram positif et à faible pourcentage G+C,

permet l’obtention d’un ferment avec une plus grande stabilité et viscosité que les autres genres

bactériens, grâce à la capacité de ses EPS à lier les molécules d’eau (1, 54, 66). Les bactéries lactiques

productrices d’EPS font partie de la plus importante application industrielle et sont utilisées partout

à travers le monde (56). L’utilisation des ferments producteurs d’exopolysaccharides est destinée à

augmenter la qualité et la texture des produits de fermentation sans ajout d’additifs alimentaires.

14

Figure 1.7 : Arbre phylogénétique de 138 espèces du genre Streptococcus. Les espèces sont

regroupées en sept groupes en fonction de l’espèce modèle, Pyogenic, Mitis, Anginosus, Bovis,

Mutans, Salivarius et Inconnu (Unknown) selon les points de couleurs différentes (67).

1.2.3 Sensibilité aux phages

Cette espèce bactérienne, comme tant d’autres, est sensible aux bactériophages qui peuvent affecter

les productions (68). Ceci peut mener à un ralentissement de la fermentation et une perte de la qualité

des produits (69). Les phages se retrouvent naturellement dans le lait et résistent à la pasteurisation,

ils sont donc ubiquitaires dans les usines laitières. De plus, ils ont un temps de latence relativement

court et une taille de la progéniture très grande ce qui leur permet de se reproduire rapidement lors

15

d’une production. Les industries peuvent être impactées par plusieurs facteurs, cependant les phages

sont la source majeure de problèmes d’origine biologique. L’observation d’un haut pH, d’un haut

niveau de lactose résiduel et d’un contenu en acide lactique pauvre lors d’une fermentation sont les

indicateurs d’une infection par les phages. Ils proviennent principalement du lait, mais ils peuvent

être dispersés sous forme d’aérosols par le mouvement du personnel ou des équipements, causant la

contamination des zones à risques (36). Une autre source de contamination importante est le recyclage

des sous-produits de la fermentation, telles les protéines de lactosérum. Les producteurs les utilisent

pour augmenter le rendement fromagé, cependant ces protéines ont un effet protecteur sur les phages

lors du traitement thermique. Le début d’une production est donc contaminé par les sous-produits de

la précédente (70).

Plusieurs mesures pour tenter de contrôler les phages et leur dissémination doivent être mises en place

dans une industrie laitière. Les stratégies de contrôle concernent souvent la configuration de l’usine,

l’utilisation de désinfectants appropriés et la gestion des ferments. D’abord, la conception de l’usine

doit séparer les zones à risques et permettre une réception du lait isolée de la production. Une filtration

de l’air appropriée, ainsi qu’une pression atmosphérique positive sont des facteurs pouvant contrôler

le déplacement des phages (36). Puis, l’utilisation d’agents assainissant efficace est très importante.

Toutefois, certains aspects sont à prendre en compte. L’assainissant ne doit pas avoir d’impacts

négatifs sur la production, il doit avoir un mécanisme d’action rapide et stable dans le temps, il ne

doit pas posséder d’effets toxiques et doit pouvoir agir sur les phages et les microorganismes. Les

agents oxydant tels l’acide peracétique, l’acide acétique et le peroxyde d’hydrogène, et les composés

d’ammonium quaternaire sont parmi les agents assainissant les plus efficaces pour le contrôle des

phages infectant les BL (71). Finalement, une bonne gestion des ferments permet de réduire la

fréquence des infections. Il doit y avoir une rotation des cultures pour éviter les infections récurrentes

par le même phage qui devient de plus en plus nombreux. De plus, l’utilisation de ferments

naturellement résistants aux phages est employée par plusieurs compagnies, car les bactéries

possèdent de nombreux mécanismes de résistance (36, 69).

1.2.4 Les mécanismes de défense

Il y a plusieurs mécanismes de résistance aux bactériophages qui visent les différentes étapes du cycle

d’infection (figure 1.8). D’abord, il est possible de bloquer l’adsorption des phages à la surface

cellulaire et ainsi empêcher le cycle lytique de commencer. Les bactéries peuvent accomplir cette

action par une variété de stratégies. Elles peuvent muter le récepteur cellulaire et donc il n’y a plus

16

de reconnaissance moléculaire par la protéine de liaison au récepteur du phage ou alors elles peuvent

bloquer l’accès de ce récepteur par la production d’une matrice extracellulaire (EPS) qui devient alors

une barrière physique contre les phages (17, 72).

Figure 1.8 : Représentation schématique des différents systèmes de défense bactériens. Plusieurs mécanismes

sont présents chez les procaryotes pour lutter contre les éléments d’ADN étrangers, comme les génomes de

bactériophages et les plasmides. Ces systèmes incluent le blocage de l’adsorption en masquant ou en mutant les

récepteurs cellulaires, le blocage de la translocation de l’ADN dans le cytoplasme, les systèmes Abi où la cellule

provoque sa propre mort suite à une infection, les systèmes de restriction/modification et les systèmes CRISPR-

Cas qui clivent l’ADN de façon différente avec ou sans reconnaissance spécifique de l’ADN envahisseur. M :

méthyltransférase, R : endonucléase de restriction, C : Protéine Cas (73).

Ensuite, il est possible de bloquer l’entrée de l’ADN dans la cellule. C’est un phénomène souvent

associé à la présence d’un prophage qui se nomme l’exclusion de surinfection (Sie) et qui va

contrecarrer la réinfection par le même phage ou un phage similaire (74). Ceci va empêcher la

compétition pour les ressources de la bactérie entre plusieurs phages et assurer la survie du prophage

déjà en place (17). Les prophages codent souvent pour des protéines qui vont s’associer à la

17

membrane, avec les éléments qui la composent ou qui interagissent avec le récepteur de la queue des

phages. Celles-ci peuvent bloquer physiquement l’éjection de l’ADN ou bloquer le processus (75). Il

est important de noter que l’exclusion de surinfection ne bloque pas l’adsorption des phages.

Puis, il y a les systèmes d’avortement de l’infection (Abi) qui cause la mort prématurée de la cellule

suite au début de la réplication du phage. Le sacrifice d’une cellule infectée résulte en moins de phages

relâchés pour préserver la population bactérienne (17, 76). Lorsqu’infectés par un phage, les

procaryotes possédant un système Abi ciblent des étapes importantes de la réplication de la cellule

ou clivent les composantes cellulaires majeures. Par exemple, un système Abi peut cliver des

composantes de la membrane et ainsi provoquer une baisse du potentiel membranaire pour arrêter la

production d’ATP, ou alors un autre genre de système Abi va inhiber la synthèse protéique (73, 77).

La cellule peut aussi couper l’ADN étranger qui entre dans le cytoplasme pour inhiber la réplication

de celui-ci. Les systèmes de restriction/modification sont des systèmes très répandus qui coupent

l’ADN non méthylé lors de son entrée dans la cellule (78). Ces systèmes fonctionnent en trois grandes

étapes. D’abord, une séquence nucléotidique présente dans le génome de l’hôte est reconnue par la

méthylase. Puis, un groupement méthyle est ajouté au site de reconnaissance sur l’ADN par cette

enzyme, ce qui protège le chromosome bactérien. Finalement, l’ADN non méthylé qui se retrouve

dans le cytoplasme de la cellule bactérienne sera digéré par une endonucléase de restriction pour

arrêter la propagation de l’infection. (79).

Finalement, les systèmes CRISPR-Cas (CRISPR: Clustered Regularly Interspaced Short Palindromic

Repeats, Cas: CRISPR associated), présents dans un grand nombre de bactéries et d’archées, font

partie des systèmes capables de couper et digérer l’ADN étranger. Ces systèmes fonctionnent par

reconnaissance et clivage spécifique d’une courte séquence d’ADN ou d’ARN (80–83).

1.3 Les systèmes CRISPR

Les structures génétiques CRISPR et leurs gènes Cas sont des systèmes d’immunité adaptative

bactériens observés pour la première fois en 1987 chez Escherichia coli (84). Ces systèmes sont

présents chez près de 90% des archées et près de 50% des procaryotes, sans aucun homologue chez

les eucaryotes (85, 86). Ils jouent un rôle de défense contre les éléments d’ADN envahisseurs parmi

lesquels se trouvent les phages et les plasmides, tout comme le système immunitaire humain joue un

rôle de défense contre les infections (1, 87). Les systèmes CRISPR-Cas sont décrits comme étant

18

adaptatif, car ils ont la capacité d’acquérir leur immunité et de la transmettre aux cellules filles suite

à la division cellulaire.

1.3.1 Composition des systèmes CRISPR-Cas

Les systèmes sont composés de loci d’un nombre variable de courtes séquences nucléotidiques

identiques, nommées répétitions, entrecoupées par des espaceurs uniques de longueurs variables selon

l’espèce (figure 1.9). Les répétitions ont une longueur entre 23 pb et 47 pb et une séquence

généralement partiellement palindromique, ce qui leur confère une structure secondaire nécessaire à

la maturation des ARNcr (85, 86). Les répétitions sont habituellement bien conservées parmi les

espèces proches, toutefois le nombre de répétitions et la séquence des espaceurs varient grandement

en fonction des souches (86). Ces espaceurs, de 21 pb à 72 pb, sont des séquences hypervariables

(85). Les espaceurs ont longtemps été considérés comme de l’ADN insignifiant, jusqu’à la réalisation

qu’ils correspondent à des séquences d’ADN identiques aux génomes des bactériophages ou à

certains plasmides (1, 80). En effet, un espaceur peut souvent être associé à une séquence

complémentaire dans le génome correspondant d’un phage, ou à la séquence d’un plasmide, d’où il

provient (80, 81, 88). Cette séquence correspondante, nommée proto-espaceur, est un élément clé lors

de la reconnaissance de l’ADN envahisseur. Pour certains types, il est obligatoirement adjacent à un

court motif nommé PAM (Protospacer Adjacent Motif) et il est nécessairement absent du

chromosome bactérien pour éviter que le système CRISPR cible son propre génome (1, 80).

Figure 1.9 : Composition générale des systèmes CRISPR-Cas. Les flèches en rouge représentent les gènes cas,

la ligne rose représente la séquence leader suivie du locus CRISPR composé des répétitions (losanges noirs) et

des espaceurs (rectangles de couleurs individuelles). Adaptée de Hille et al. (87).

Les loci CRISPR sont généralement tous adjacents à une séquence leader, riche en adénine et en

thymine qui ne possède pas de cadre de lecture ouvert, donc elle ne code pas pour une protéine. Cette

séquence se situe directement en amont ou en aval du locus CRISPR et elle s’oriente toujours dans le

19

même sens que le locus (86). Il a été montré qu’elle est le point de départ de la transcription du locus

CRISPR et qu’elle joue donc un rôle de promoteur lors de la biogenèse (87).

Puis, les loci CRISPR fonctionnels sont accompagnés de gènes cas qui varient en nombre et en

composition selon le type de système. Ils peuvent se situer en amont ou en aval du locus et ils sont

couramment éloignés de celui-ci par environ une centaine de paires de base. L’orientation de l’opéron

des gènes cas n’est pas obligatoirement identique à celle du locus et il possède habituellement le

même contenu en guanine et en cytosine que le chromosome bactérien (86). Les protéines codées par

les gènes cas ont plusieurs domaines fonctionnels caractéristiques des nucléases, des hélicases et des

protéines liants les polynucléotides. Ces gènes accomplissent quatre rôles distincts au sein des

systèmes CRISPR-Cas en fonction de ces domaines : le module d’adaptation pour l’acquisition de

nouveaux espaceurs, le module d’expression pour la maturation des ARNcr, le module d’interférence

pour le clivage de l’ADN envahisseur et le module auxiliaire pour la régulation ou toute autre fonction

(89).

1.3.2 Classification

La classification des systèmes CRISPR-Cas est une tâche ardue et complexe. Plusieurs classifications

ont été nécessaires avant d’arriver à celle établie à ce jour. En 2011, une première classification des

systèmes a été proposée qui les divisait en trois types en fonction des gènes cas signatures associés

au locus, où tous les systèmes fonctionnels possèdent les gènes cas1 et cas2. Le type I est caractérisé

par la présence de cas3, le type II est caractérisé par la présence de cas9 et le type III possède cas10

(90). L’architecture génomique et la disposition des gènes cas est responsable des différents sous-

types.

Puis, la recherche accrue sur les systèmes CRISPR-Cas, ainsi qu’une augmentation des données

génomiques disponibles, a permis la découverte de nouveaux systèmes ne correspondant pas à la

classification établie. En 2015, la catégorisation a été révisée pour donner le jour à deux classes, cinq

types et seize sous-types, classés en fonction des modules d’interférence (89). Finalement, une

dernière mise à jour a été faite en 2017 pour ajouter un nouveau type, le type VI (figure 1.10). La

classe 1 regroupe les types I, III qui sont les plus fréquents parmi les archaea et le type IV, qui est très

rare et ne possède pas de module d’adaptation. Les types appartenant à cette classe possèdent

beaucoup de petits gènes cas pour former le complexe d’interférence, tandis que les types rattachés à

la classe 2 possèdent une seule grosse protéine, ayant de multiples domaines, capables d’effectuer

20

l’interférence. Le type II, ayant la protéine Cas9, le type V, ayant l’effecteur Cfp-1 et le nouveau type

VI, possédant le gène cas13 font partie de la classe 2 (91). Finalement, l’évolution rapide des systèmes

CRISPR-Cas, son énorme variabilité et l’absence de gènes cas universels démontrent qu’une

classification robuste doit constamment être mise à jour pour permettre la caractérisation précise de

ces systèmes (89, 92).

A

21

Figure 1.10 : Classification et organisation des types de systèmes CRISPR-Cas et domaines des protéines

effectrices pour les classes 1 (A) et 2 (B). Tirée de Koonin, 2017 (93).

1.3.3 CRISPR-Cas chez Streptococcus thermophilus

Chez l’espèce Streptococcus thermophilus, il y a quatre loci CRISPR possibles (1 à 4) identifiés dans

plusieurs génomes. Chez la souche DGCC7710, les loci CR1 et CR3 sont de type II-A, le locus CR2

B

22

est de type III-A et le locus CR4 est de type I-E, où chaque séquence des répétions est propre à chaque

locus (88, 94–96). Il a été démontré que tous les loci CRISPR, ainsi que leurs gènes cas associés,

présents dans cette souche sont transcrits indépendamment lors d’une infection phagique (95, 97). En

effet, une séquence leader a été identifiée pour les loci CR1, CR2 et CR3, toutefois la transcription

du locus CR4 serait probablement une continuation de la transcription des gènes cas (95). Cependant,

seuls les locus CR1 et CR3 sont actifs et confèrent une résistance contre les bactériophages lorsqu’il

y a acquisition de nouveaux espaceurs (96, 98). Ces locus possèdent les protéines Cas1, Cas2 et Csn2

en amont de la séquence répétition-espaceur en plus du gène cas9, qui est le gène signature pour le

type II.

Les répétitions des loci de type II-A, chez la souche DGCC7710, ont une longueur de 36 pb. Les

répétitions et les gènes cas sont spécifiques à chaque locus et ils ne reconnaissent pas le même motif

PAM. Le locus CR1 est associé au motif NNAGAAW et le locus CR3 est associé au motif NGGNG,

où N représente n’importe quel nucléotique de l’ADN et W représente une adénine ou une thymine

(88, 98). Toutes les souches de S. thermophilus possèdent le locus CR1, qui possède en moyenne 23

espaceurs par locus d’une longueur entre 28 pb et 32 pb. Environ 91 % des souches de S. thermophilus

possèdent un locus CR2, avec un maximum de 7 espaceurs, d’une longueur qui varie entre 35 pb et

40 pb. Puis, 80% des souches possèdent le locus CR3 avec environ 13 espaceurs de longueur entre

29 pb et 32 pb. Puisqu’ils sont rares, la fréquence des loci CR4 n’a pas été déterminée. En général, la

grande majorité des espaceurs, tous loci confondus, proviennent de séquences virales (77%), puis de

plasmides (16%) et finalement 7% proviennent du chromosome bactérien (98).

1.3.4 Les mécanismes de fonctionnement

Les systèmes CRISPR-Cas ont tous un mécanisme de fonctionnement propre à leur type et parfois à

leur sous-type, toutefois il y a trois étapes communes à tous (99, 100). Il y a d’abord l’étape

d’acquisition d’un espaceur dans le locus CRISPR, suivi de la biogenèse, ou la maturation, des ARNcr

et finalement l’étape d’interférence (figure 1.11). Ici, les étapes générales seront décrites en soulignant

plus en détail le système de type II-A, présent dans la souche S. thermophilus DGCC7710.

23

Figure 1.11 : Les trois étapes de fonctionnement des systèmes CRISPR-Cas. Lors de l’adaptation, le complexe

Cas1-Cas2 est responsable de la sélection et de l’intégration d’un nouvel espaceur dans le locus. Puis, le locus

est transcrit sous forme d’ARN précurseur et sera traité en ARNcr mature lors de la biogenèse. Finalement, il y

a reconnaissance de l’ADN envahisseur par le module d’interférence et clivage de cet ADN (87).

1.3.4.1 L’adaptation

L’adaptation est le processus par lequel le système CRISPR-Cas acquiert de nouveaux espaceurs dans

son locus, formant ainsi une mémoire moléculaire des infections précédentes. (87). Les protéines

Cas1 et Cas2 sont communes à presque tous les types et semblent jouer un rôle clé lors de l’adaptation

(91). Le processus d’acquisition est accompli en plusieurs étapes complexes, soit la détection de

l’infection, la sélection du proto-espaceur et son intégration dans le locus (87). D’abord, il y a la

détection d’un élément d’ADN étranger qui stimule la machinerie d’adaptation. Ici, il est nécessaire

24

que la machinerie puisse différencier et préférer l’ADN envahisseur de son propre ADN pour éviter

une auto-immunité. Chez E. coli, il a été démontré qu’une source importante de proto-espaceurs

provenait de la dégradation des fragments d’ADN lors de la réparation des bris double brins par le

sentier de réparation RecBCD. Le système de réparation RecBCD déroule et dégrade l’ADN jusqu’à

ce qu’il atteigne un site Chi. Le nombre de sites Chi dans les ADN étrangers étant beaucoup plus

faibles que dans le génome d’E. coli, une plus grande portion de l’ADN étranger est dégradée et

intégrée dans le locus CRISPR, induisant ainsi un biais envers l’ADN envahisseur (101). De plus, un

mécanisme similaire a été décrit chez Streptococcus pyogenes qui possède un CRISPR de type II-A,

utilisant la machinerie AddAB semblable à la voie de réparation RecBCD (102).

Toutefois, la sélection des proto-espaceurs intégrés dans le locus CRISPR n’est pas un processus

laissé au hasard, d’où l’existence des PAM. Les protéines Cas des systèmes de types I et II

sélectionnent des proto-espaceurs adjacents aux PAM compatibles avec la machinerie d’interférence

(1, 87, 103). Dans certains cas, seul le complexe formé de Cas1 et Cas2 est nécessaire à la

reconnaissance du PAM, tel que retrouvé dans le type I-E (104). Cependant, d’autres types nécessitent

des protéines additionnelles à la machinerie d’acquisition, tel le type II-A. Ce type nécessite aussi

l’assistance de Cas9 qui aide à la reconnaissance du PAM, de Csn2 et de l’ARN transactivateur

(ARNtracr) (105). Ainsi, différents mécanismes servent à sélectionner les proto-espaceurs qui seront

intégrés dans le locus. Cette intégration se fait de préférence à l’extrémité 5’ de la séquence répétition-

espaceurs du locus CRISPR et permet d’obtenir un ordre chronologique des infections passées (80).

L’intégration des nouveaux espaceurs peut se faire de cette façon, car la machinerie d’adaptation sera

en mesure de reconnaître la séquence riche en A-T de la région leader. Encore une fois, les

mécanismes d’intégration varient en fonction du type et du sous-type. Par exemple, le type I-E, parmi

les plus étudiés, a besoin entres-autres d’un facteur d’intégration provenant de l’hôte (HIF, Host

Integration factor), tandis que le type II-A nécessite un court site d’encrage nommé LAS présent dans

la séquence leader permettant d’incorporer l’espaceur (106, 107). Cette séquence de 5 pb à l’extrémité

adjacente aux répétitions est directement reconnue par le complexe Cas1-Cas2, jouant le rôle

d’intégrase. Puis, l’espaceur est intégré par deux réactions de «demi-site», où une extrémité 3’OH du

futur espaceur fait une attaque nucléophile à l’extrémité 5’ à proximité de la séquence leader de la

répétition et l’autre extrémité 3’ de l’espaceur ira se lier à l’extrémité 5’ distale de la séquence leader

du brin complémentaire de la répétition. Le clivage de l’ADN ainsi que la ligature des extrémités est

effectuée par transestérification à l’aide de Cas1. Donc l’intégration d’un espaceur duplique une

répétition pour chaque espaceur intégré (108–110).

25

1.3.4.2 La biogenèse des ARNcr

La biogenèse des ARNcr concerne le processus de maturation de ces ARN particuliers qui serviront

de guide lors de l’étape d’interférence. Il y a d’abord la transcription d’un long ARN précurseur

(ARNpré-cr) qui contient les transcrits des répétitions et des espaceurs tels qu’ils sont disposés dans

le locus CRISPR. Cet ARNpré-cr est ensuite clivé et mature en petites unités composées d’une portion

de la répétition et de l’espaceur, formant ainsi l’ARNcr mature. Les systèmes appartenant aux classes

1 et 2 ont différents mécanismes de maturation, qui possèdent quelques subtilités en fonction des

types et des sous-types (87).

Les systèmes de classe 1 utilisent généralement la protéine Cas6 ou certains homologues (111, 112).

Les systèmes de type I ont des répétitions ayant une séquence palindromique, ce qui leur confère une

structure secondaire en tige-boucle reconnue par Cas6. Cette protéine possède une activité nucléase

et donc elle clive la répétition en aval de la structure secondaire résultant en un ARNcr mature (113).

Quelques sous-types n’ont pas de répétitions palindromiques, toutefois il a été suggéré que Cas6

remodèle la répétition pour former une structure secondaire et reconnaître le site de coupure (114).

Quant à eux, les systèmes de classe 2 ont souvent recours à la machinerie d’interférence et même

parfois des facteurs non protéiques pour la maturation des ARNcr. Les systèmes de type II et de type

V-B nécessitent l’assistance d’un ARN transactivateur (ARNtracr) pour la biogenèse et l’interférence

(115, 116). L’ARNtracr, étant complémentaire à la portion des répétitions, celui-ci s’apparie à

l’ARNpré-cr. Ce complexe sera stabilisé par la protéine responsable de l’interférence, par exemple

Cas9 pour le type II-A, puis la RNAseIII de l’hôte est recrutée pour cliver le complexe en duplex

ARNcr:ARNtracr. Un second clivage par une autre RNase inconnue élimine une partie de la répétition

pour former un complexe de surveillance Cas9 lié au duplex ARNcr:ARNtracr mature. Pour les types

V et VI, la protéine effectrice a la capacité de reconnaître la structure secondaire formée par les

répétitions. Son activité nucléase double lui permet de cliver l’ARN précurseur en ARNcr matures,

en plus d’exercer le processus d’interférence (115, 117, 118).

1.3.4.3 L’interférence

L’étape finale est l’interférence, responsable de la reconnaissance et de la destruction de l’ADN

envahisseur (87). Lors de cette étape, le module d’interférence est guidé par l’ARNcr qui ira

26

s’apparier avec le proto-espaceur par complémentarité des bases. De plus, les protéines Cas vont aussi

reconnaître la présence d’un PAM pour éviter de cibler le chromosome bactérien (80, 119).

Les systèmes de classe 1, plus particulièrement le type I, sont parmi les plus répandus dans le monde

bactérien (93). Le module d’interférence de ces systèmes est composé de plusieurs protéines Cas

formant un complexe nommé Cascade, responsable de l’identification de la cible et de la protéine

Cas3, responsable du clivage de la cible (120). La composition du complexe Cascade varie en

fonction des sous-types, par contre la structure est conservée pour garder les similitudes

fonctionnelles (93). Suite à la biogenèse des ARNcr, Cas6, qui a clivé l’ARN précurseur, y reste

attachée et subséquemment le complexe Cascade s’assemble le long de la structure de l’ARNcr (121).

Ce complexe, sous invasion moléculaire, va reconnaître le PAM présent sur l’ADN envahisseur et

les huit nucléotides avoisinants celui-ci iront s’apparier à l’ARNcr. Le brin non ciblé sera lié par une

sous-unité du complexe Cascade pour former une structure en R, ce qui provoque un changement de

conformation permettant le recrutement de Cas3 (122). Ainsi, Cas3 clive le brin d’ADN non ciblé et

le dégrade grâce à son activité hélicase en direction 3’→ 5’ pour créer une région simple brin

d’environ 200 à 300 nt dans le génome (123). Pour les systèmes de type III, le module d’interférence

possède une composition et une structure semblable à celle de type I, toutefois il cible autant l’ADN

que l’ARN pour éliminer la menace des infections (124).

Quant à eux, les systèmes de classe 2 utilisent une large protéine effectrice pour accomplir l’étape

d’interférence, par exemple la protéine Cas9 chez les systèmes de type II (87, 100). Cette protéine se

liera au complexe ARNcr:ARNtracr pour scanner la présence de PAM sur une molécule d’ADN.

Lorsque que Cas9 reconnaît le motif d’un PAM et que par la suite le brin cible est complémentaire à

l’ARNcr, la protéine génère une coupure double brin trois nucléotides en amont du PAM (88, 125).

Cas9 possède une structure bilobée, où le lobe REC est responsable de la liaison de l’ARN et de

l’ADN et le lobe NUC est responsable du clivage de l’ADN et de l’interaction avec le PAM. Le

clivage est généré par deux domaines différents du lobe NUC de la protéine, soit le domaine HNH

qui clive le brin cible et le domaine RuvC qui clive le brin non ciblé (126, 127). Lorsque la protéine

se lie au duplex ARNcr:ARNtracr, un grand changement de conformation se produit permettant à la

protéine de pouvoir lier le PAM et à l’ARNcr de se lier à l’ADN cible pour activer l’interférence et

produire un bris double brin dans cet ADN (125, 128).

Cependant, quelques systèmes de classe 2 ne nécessitent pas d’ARNtracr, tel le système de type V-

A. Les protéines Cas12a et Cas12b reconnaissent le PAM sur les deux brins et clive les deux brins

27

d’ADN se façon non symétrique résultant en une coupure ayant des extrémités cohésives (87, 116,

117). Quant à eux, les systèmes de type VI ciblent et clivent l’ADN simple brin (ADNsb) (129).

Cas13 est stimulé par la reconnaissance de l’ADNsb et de l’ARNcr pour dégrader non seulement le

brin d’ADN ciblé, mais aussi les autres brins d’ADNsb. Ces systèmes ne nécessitent pas non plus

l’utilisation d’ARNtracr pour le processus d’interférence (130, 131).

1.4 L’édition de génome

L’avancée des recherches dans le domaine de la biologie moléculaire durant ces dernières années a

permis le développement de techniques efficaces et rapides pour l’édition de génome. L’édition de

génome est très efficace pour l’étude des gènes inconnus d’un organisme, en partant des virus,

jusqu’aux plantes et à l’humain (132–138). Il a été démontré qu’une coupure double brin de l’ADN

(DSB) en utilisant une nucléase spécifique stimule les voies de réparation de l’ADN par

recombinaison homologue ou par assemblage des brins non homologues (NHEJ), permettant

l’introduction de mutations aux sites spécifiques d’un génome (139–141). Les protéines ayant la

capacité de produire de tels bris dans l’ADN doivent obligatoirement posséder deux domaines

différents, un domaine pour reconnaître et lier l’ADN et un domaine pour le couper (142). Parmi les

premières protéines utilisées pour l’édition de génome se trouvaient les endonucléases, plus

particulièrement les mégas nucléases, les doigts de zinc et les protéines nucléases effectrices de type

activateur de transcription (TALEN) (132, 143, 144). Toutefois, ces nucléases fonctionnent par

interactions entre la protéine et un site spécifique sur le génome, et pouvoir cibler un nouveau site

implique la fabrication d’une nouvelle protéine ce qui représente un travail énorme. Ainsi les cibles

possibles dans un génome sont assez restreintes et limitent les possibilités futures.

Cependant, la découverte de la protéine Cas9 augmente de beaucoup l’efficacité d’édition de génome,

car cette protéine est guidée par une molécule d’ARN interchangeable et la reconnaissance d’un site

spécifique fonctionne par complémentarité des bases selon le principe de Watson-Crick (128, 145).

Cas9 devient donc un outil révolutionnaire dans le domaine des modifications génétiques permettant

l’établissement de systèmes à haut débit. Les variantes de cette protéine, développées au courant des

dernières années, ont permis aux chercheurs d’adapter ce système pour diverses applications

différentes, dont la régulation des gènes et l’imagerie génomique (figure 1.11) (142, 146–148).

L’édition de génome employant Cas9 est quelque peu divergente du système de type II-A, au sens

qu’il nécessite un ARN guide plutôt qu’une molécule ARNtracr:ARNcr. L’ARN guide est en quelque

28

sorte une fusion de ces deux ARN dont la partie complémentaire au proto-espaceur peut

s’interchanger et viser des régions différentes de n’importe quel génome (145). Comme mentionné

précédemment, Cas9 possède deux domaines qui produisent une coupure double brin dans l’ADN

cible lorsqu’il y a une reconnaissance du PAM et du proto-espaceur. Cette coupure stimule les voies

de réparation de l’ADN. La voie de réparation NHEJ cause des mutations diverses, telles des

délétions, des insertions et des mutations ponctuelles, de façon aléatoire au site de coupure ce qui

peut causer l’inactivation d’un gène ou un changement de cadre de lecture (149). Pour engendrer une

mutation précise, il est possible de fournir un gabarit d’ADN qui ira s’insérer par recombinaison

homologue au site de coupure, résultant ainsi en une mutation contrôlée pour accomplir n’importe

quelle tâche (140, 150).

La protéine Cas9 est associée à plusieurs sous-types de systèmes CRISPR-Cas, soit les types II-A, II-

B et II-C. Celle majoritairement utilisée en édition de génome provient du système de type II-A de

Streptococcus pyogenes (SpCas9) et elle a une taille de 1368 acides aminés (145, 151, 152). La

nucléase SpCas9 reconnaît un court PAM NGG, ou plus rarement NAG. De plus, il est possible de

muter les domaines de SpCas9 pour produire une version ayant un seul des deux domaines ou les

deux domaines absents. Lorsqu’un seul domaine est actif, un seul brin d’ADN est coupé et agit

comme une nickase (nCas9). Cette version limite les mutations non prévues (off target activity) et

permet d’augmenter la spécificité du système (142, 153–155). Lorsque les deux domaines sont

inactifs, la protéine est catalytiquement morte, d’où le terme dead Cas9 (dCas9), mais elle peut tout

de même lier l’ADN et être couplée à d’autres facteurs pour générer des mutations épigénétiques ou

réguler la transcription des gènes (146, 156, 157). De plus, dCas9 peut être couplée à plusieurs

protéines fluorescentes permettant l’étiquetage de certaines séquences associées aux maladies

génétiques. Cette méthode est avantageuse, car elle peut être pratiquée sur les cellules vivantes et

permettre l’étude de la dynamique des génomes en temps réel (158–160).

29

Figure 1.12 : Applications et outils reliés à l’utilisation de la protéine Cas9 en édition de génome. Cas9 peut

être utilisé pour causer une coupure double brin et favoriser la réparation de l’ADN par la voie NHEJ, causant

des mutations au hasard ou la recombinaison homologue avec un gabarit d’ADN, pour une mutation précise

(a). Cas9 ayant les sites RuvC et HNH inactifs (dCas9) peut être couplé à certains facteurs de transcription et

influencer la régulation des gènes (b). La protéine dCas9, couplée à une protéine pouvant modifier les histones,

peut servir à l’édition des marqueurs épigénétiques (c). Lorsque dCas9 est couplée à un marqueur fluorescent,

cet outil peut être utilisé pour l’identification de séquence en imagerie génomique. Adaptée de Wang et al.

(142).

Plusieurs autres orthologues de Cas9, provenant d’autres microorganismes, ont aussi été développés

comme outil d’édition génomique. Notamment, la protéine Cas9 de Staphylococcus aureus (SaCas9).

30

L’édition de génome in vivo utilise souvent un vecteur de transfection viral associé aux adénovirus

qui ne peut supporter une charge plus grande que 4,5 kb, toutefois la taille de SpCas9 limite

l’utilisation de ce vecteur à des fins thérapeutiques. En revanche, SaCas9, par sa taille plus petite de

1053 acides aminés, a été optimisée pour ce genre d’application et le rendement d’édition de génome

in vivo est égal à SpCas9. SaCas9 reconnaît un PAM NNGRRT, où R représente une adénine ou une

guanine, et a déjà été développée pour l’édition, en plus de la régulation des gènes (161, 162). Un

autre problème engendré avec l’utilisation de SpCas9, est que cette protéine ne peut effectuer qu’une

seule tâche à plusieurs sites, incapable de médier plusieurs activités différentes à des sites différents

en même temps. Les orthologues Cas9 de Neisseria meningitidis et de S. thermophilus CR1 ont été

développés dans ce but. Il a été démontré que ces protéines peuvent accomplir plusieurs activités

indépendamment l’une de l’autre dans une seule cellule. Par exemple, une version de NmCas9

couplée à un activateur peut réguler un gène, tandis qu’une autre version de NmCas9 édite le génome

simultanément. Ceci permet d’exercer une pression sélective plus forte et plus rapide (98, 163).

Finalement, il est clair que les possibilités employant la protéine Cas9 et ses orthologues sont infinies.

Ces outils moléculaires seront indispensables pour approfondir l’étude de la fonction des gènes, les

modèles thérapeutiques, la thérapie par les gènes et les interactions entre les protéines et le génome.

Le plein potentiel de cette technologie est encore à découvrir et les prochaines années verront

l’exploration et la recherche de nouveaux mécanismes et de nouveaux systèmes augmenter de façon

considérable.

1.5 Problématique et objectifs de recherche

La souche S. thermophilus DGCC7710 est une souche très utilisée pour la production mondiale de

yogourt. C’est une souche très particulière pour ses propriétés organoleptiques, ce pourquoi il s’avère

extrêmement difficile de la remplacer. Malgré les précautions prises par l’industrie laitière, telles la

rotation des ferments, une meilleure hygiène et une ventilation adaptée, les infections par les phages

restent la principale cause de perte de rendements dans la production. C’est pourquoi une meilleure

compréhension de ces phages est nécessaire pour éventuellement en venir à un contrôle efficace.

Cette étude rejoint non seulement le côté industriel, mais aussi un grand volet fondamental.

Dans cette étude, le système CRISPR-Cas9 de S. thermophilus DGCC7710 peut être utilisé pour

l’édition de génome du bactériophage virulent 2972, permettant ainsi l’étude des gènes précoces

nécessaires à la réplication de celui-ci et l’identification du génome minimal. Ce système permettra

31

l’inactivation des gènes précoces inconnus du génome du phage 2972 par une délétion importante à

l’intérieur du cadre de lecture ouvert et ainsi nous fournira un outil pour identifier les gènes essentiels.

De plus, les interactions entre les phages mutants et l’hôte sauvage seront caractérisées pour mesurer

l’impact des délétions. Somme toute, en étudiant les protéines du bactériophage 2972, qui peut servir

de modèle pour l’étude de bien d’autres phages, il sera possible d’approfondir les connaissances en

biologie du phage et ainsi mieux comprendre les mécanismes d’infection et de réplication de ceux-

ci.

32

CHAPITRE 2: Matériel et méthodes

2.1 Souches bactériennes, plasmides et phages utilisés

Toutes les souches bactériennes, les plasmides et les phages utilisés lors de cette recherche ainsi que

les caractéristiques spécifiques les concernant sont regroupés dans le tableau 2.1. Les loci CRISPR1

et CRISPR3 de chaque BIM (Bacteriophage Insensitive Mutant) ont été amplifiés par réaction PCR

(Polymérase Chain Reaction) et séquencés par la méthode Sanger par la Plateforme de séquençage

du Centre Hospitalier de l’Université Laval (CHUL) pour confirmer la séquence des espaceurs

d’intérêts. Les phages mutants ont été vérifiés par réaction PCR et séquençage du produit PCR, ainsi

que par séquençage complet du génome sur la plateforme Illumina© pour vérifier l’absence d’autres

mutations. Finalement, toutes les séquences insérées dans le vecteur de clonage pNZ123 ont aussi été

vérifiées par réaction PCR et séquençage du produit de la réaction.

Tableau 2.1 : Liste des souches bactériennes, des phages et des plasmides utilisés lors de l’étude et leurs

caractéristiques.

Souches

bactériennes, phages

et plasmides

Caractéristiques importantes

Souches bactériennes

Streptococcus

thermophilus

DGCC7710

Aucun plasmide, sensible au phage 2972 (26).

BIM AR1 Dérivée de la souche DGCC7710, espaceur contre l'orf22 du phage 2972

(position 23 600-23 629) intégré dans le locus CRISPR 1.

BIM 307.1 Dérivée de la souche DGCC7710, espaceur contre l'orf23 du phage 2972


BIM 324.2 Dérivée de la souche DGCC7710, espaceur contre l'orf24 du phage 2972




BIM A-135 Dérivée de la souche DGCC7710, espaceur contre l'orf28 du phage 2972




BIM MED-10 Dérivée de la souche DGCC7710, espaceur contre l'orf32 du phage 2972


33





BIM A-35 Dérivée de la souche DGCC7710, espaceur contre l'orf41 du phage 2972


BIM B-185 Dérivée de la souche DGCC7710, espaceur contre l'orf43 du phage 2972




Escherichia coli NEB5α Cellules compétentes à haute efficacité provenant de la compagnie New

England Biolabs® (# Catalogue : C2987H).

Phages

2972 Infecte Streptococcus thermophilus DGCC7710 (26).

2972Δ22 Infecte la souche DGCC7710 et le BIM AR1, Délétion (position 23 546-23

713).

CEM22 Infecte la souche DGCC7710 et le BIM AR1, Mutation ponctuelle (G-23’633-

T).

2972Δ24 Infecte la souche DGCC7710 et le BIM MED 324.2, Délétion (position 24

076-24 201).

2972Δ27 Infecte la souche DGCC7710 et le BIM AR2, Délétion (position 25 359-25

430).

2972Δ28 Infecte la souche DGCC7710 et le BIM A-135, Délétion (position 25 521-25

643).

2972Δ36 Infecte la souche DGCC7710 et le BIM MED-16, Délétion (position 29 499-

29 861).


144).

CEM41 Infecte la souche DGCC7710 et le BIM A-35, Mutation ponctuelle (T-33 137-

A).


891).

Plasmides

pNZ123 Plasmide de 2497 paires de base, haut nombre de copies par cellule (50-100).

Possède un gène de résistance au chloramphénicol (164).

pΔ22 Dérivé de pNZ123, taille de 3586 paires de base et possède le gabarit de

recombinaison pour une délétion de l'orf22 du phage 2972.



34






recombinaison pour une délétion de l'orf28 du phage 2972















2.1.1 Conditions de culture des bactéries

La souche S. thermophilus DGCC7710 a été utilisée comme hôte pour le phage virulent 2972 (26).

Cette souche bactérienne et ses dérivés ont été cultivés dans le milieu LM17 (M17 Oxoid + 0,5% de

lactose), sans agitation, à température optimale de 42 °C (165). Les incubations de 18 heures et plus

ont été faites à une température à 37 °C et non 42 °C pour éviter une plus grande production d’acide

lactique. Les souches possédant un plasmide dérivé du vecteur de clonage pNZ123 ont été cultivées

dans le milieu LM17 décrit précédemment, supplémenté de chloramphénicol à une concentration de

5 µg/ml (164). Les cellules compétentes à haute efficacité Escherichia coli NEB 5-alpha de la

compagnie New England Biolabs® (# Catalogue : C2987I) ont également été utilisées pendant cette

étude. Celles-ci ont été cultivées dans le milieu LB (Lysogeny Broth,) à 37 °C avec agitation à 200

rotations par minute (166). Une concentration de 20 µg/ml de chloramphénicol a été ajoutée pour

permettre la sélection des clones contenant les plasmides.

35

2.1.2 Propagation, titration et conservation des lysats de phage

La propagation des phages a été utilisée pour augmenter la concentration de ceux-ci jusqu’à

idéalement 109 unités formatrices de plages de lyse (ufp) par millilitre. D’abord, les souches de S.

thermophilus ont été incubées toute la nuit à 37 °C sans agitation dans 10 ml de milieu LM17. Pour

la première amplification, 100 µl de cette culture et 50 µl de phages ont été ajoutés à 10 ml de milieu

LM17 supplémenté de CaCl2 à une concentration de 10 mM et incubés à 42 °C jusqu’à lyse complète,

soit l’obtention d’un tube de milieu de culture clair. L’amplification a ensuite été filtrée sur filtre 0,45

µm. Lors de la deuxième amplification, 100 µl de la culture incubée pendant toute la nuit ont été

ajoutés à 10 ml de milieu LM17 et incubés à 42 °C jusqu’à l’obtention d’une densité optique à une

longueur d’onde de 600 nm (DO600) de 0,1. Ensuite, le CaCl2 (10 mM) et 50 µl de la première

amplification ont été ajoutés, le tout a été incubé à 42 °C jusqu’à lyse complète et filtré sur filtre 0,45

µm.

Pour vérifier la concentration précise, soit le titre du phage suite à l’amplification, il faut procéder à

une titration en milieu solide. La souche hôte a été incubée à 37 °C toute la nuit dans 10 ml de milieu

LM17. Ensuite, une dilution en série du lysat à titrer a été effectuée dans du tampon de phage 1X

(Tris-HCl 50 mM pH 7,5, NaCl 100 mM et MgSO4 8mM). Pour la dilution 10-1, 100 µl du lysat ont

été ajoutés à un microtube contenant 900 µl de tampon de phage stérile et mélangé délicatement en

pipettant de haut en bas avec un embout filtré. Puis, 100 µl de la dilution 10-1 ont été ajoutés à un

autre microtube contenant 900 µl de tampon de phage pour faire la dilution 10-2. Le tout a été répété

jusqu’à la dilution 10-6. Après, 100 µl de la dilution 10-1 et 300 µl de la culture ont été ajoutés à 3 ml

de gélose molle LM17 (LM17 + 0,75 % agar) supplémentée de CaCl2 à 10 mM gardée à 55 °C.

Ensuite, la gélose molle a été rapidement versée sur une boîte de Pétri contenant une gélose solide

LM17 (LM17 + 1 % agar) supplémentée de CaCl2 à 10 mM. Ceci a été exécuté en triplicata pour

chaque dilution et incubé à 42 °C pendant 18 à 24 heures (167). Suite à l’incubation, le triplicata

contenant entre 30 et 300 plages de lyse a été utilisé pour estimer le nombre d’ufp par millilitre de

lysat. La moyenne du nombre de plages de lyse de chaque triplicata a été divisée par le volume du

phage étalé, puis ceci a été multiplié par 1 sur le facteur de dilution.

(Moyenne des UFP/Volume d’étalement) * (1/Facteur de dilution) = UFP/ml

36

Les lysats peuvent se garder à 4 °C pendant quelques mois au réfrigérateur. Pour une conservation à

long terme, 850 µl du lysat ont été ajoutés à 150 µl de glycérol stérile dans un tube de 1,5 ml vissé et

gardé dans un congélateur à -80 °C.

2.1.3 Transformation bactérienne et extraction de plasmides

Les cellules chimiocompétentes E. coli NEB5α ont été transformées selon le protocole fourni par la

compagnie New England Biolabs®. Les plasmides construits lors de cette étude ont toujours été

extraits à partir des clones de la souche NEB5α à l’aide de la trousse «QIAprep® Spin Miniprep Kit»

de la compagnie Qiagen© selon les recommandations du manufacturier.

La souche S. thermophilus DGCC7710 et ses dérivés ont été transformés par électroporation (168).

D’abord, la souche a été incubée à 37 °C pendant toute la nuit. Ensuite, un tube de 10 ml de milieu

LM17 a été inoculé à 1% et incubé à 42 °C jusqu’à l’obtention d’une DO600 de 0,4 (maximum 0,45).

Puis, 10 ml de milieu « Choc Glycine » (LM17 + 0,8 M sorbitol + 20% glycine), préincubé à 42 °C,

ont été ajoutés au tube de culture et incubé 1h à 42 °C. Ensuite, la culture a été centrifugée pendant 5

minutes à 12 000g et transférée sur glace. Le surnageant a été jeté, puis le culot a été resuspendu dans

1 ml de solution de lavage froide (0,4 M sorbitol + 10% glycérol) et transféré dans un microtube de

1,5 ml. La resuspension a été centrifugée 1 minute à 16 000g pour un deuxième lavage où le culot a

été resuspendu dans 500 µl de solution de lavage froide. Un troisième lavage a été fait pour obtenir

un volume final de 150 µl de cellules électro-compétentes. Un volume de 1-5 µl (idéalement 500 ng

à 1 µg d’ADN) du plasmide à transformer et 50 µl de cellules compétentes fraîchement préparées ont

été ajoutés à une cuvette d’électroporation. Ensuite, les cellules ont été électroporées dans le Gene

Pulser réglé à 25 µF, 200 Ω et 2,5 KV et 950 µl de milieu de récupération froid (LM17 + 0,4 M

sorbitol + 20 mM MgCl2 + 2 mM CaCl2) a été immédiatement ajouté à la cuvette, puis transféré dans

un microtube de 1,5 ml et incubé sur glace pendant 10 minutes. Les microtubes ont été

subséquemment placés à 42 °C pendant 2 heures et 100 µl de transformants ont été étalés sur gélose

LM17 supplémentée de l’antibiotique nécessaire pour la sélection des clones.

2.2 Édition de génome du phage 2972

L’édition de génome du phage 2972 s’est faite selon Martel et Moineau (48). Les orfs visés lors de

cette étude sont identifiés dans le tableau 2.2 ci-dessous. Ces orfs sont majoritairement des gènes

exprimés tôt suite à l’infection et ils sont conservés parmi les gènes de phages de S. thermophilus.

37

Pour cette recherche, les gènes n’ont pas été enlevés au complet du génome, car certains se

chevauchent (orf40 et orf43) et il est préférable de ne pas modifier le cadre de lecture. Nous avons

opté plutôt pour une version tronquée du gène duquel les domaines identifiés sont absents ou si aucun

domaine n’a été identifié, près de la moitié ou plus des acides aminés manquent à la protéine.

Tableau 2.2 : Les orfs prédits du phage 2972 ainsi que leurs fonctions putatives (48).

a Produit final de l’excision d’un intron b orfs présents sur des introns c Basé sur le Basic Local Alignment Seach Tool (BLAST) de NCBI d BI : Bio-informatique, SDS : SDS-PAGE e Les orfs à l’étude sont encadrés et en caractère gras

e

Taille Fonction putative (domaine)

38

2.2.1 Construction des BIM «sur demande»

Un BIM est nécessaire pour l’édition de génome de chaque gène visé. Les BIM utilisés dans le tableau

2.1 proviennent en majorité d’une banque de souches présente au laboratoire, toutefois les BIM AR1,

AR2, AR3 et AR4 ont dû être construits, car aucun BIM contenant un espaceur contre ces gènes

n’avait été isolé. Désormais, il est possible d’exercer une pression de sélection qui force l’acquisition

d’un espaceur précis conduisant à l’obtention d’un BIM « sur demande » (voir Figure 2.1) (169).

D’abord, le génome du phage a été analysé pour la présence de motifs PAM (Locus CRISPR 1 ou 3)

dans la région où l’on veut induire une coupure double brin (tableau 2.3). Ensuite, une courte

séquence d’ADN d’environ 130 pb contenant un PAM sélectionné ainsi que les 30 pb en amont de

celui-ci a été clonée dans le plasmide pNZ123 par assemblage Gibson (voir section B.3 de l’annexe

1), pour obtenir le plasmide programmeur de l’acquisition. Puis, ce plasmide a été transformé dans la

souche DGCC7710 par électroporation (voir section 2.1.3). Les clones résultants ont été incubés à 37

°C pendant toute la nuit dans 10 ml de milieu LM17 + 5 µg/ml de chloramphénicol. Puis, 10 ml de

milieu LM17 sans antibiotique ont été inoculés avec 100 µl de la culture incubée pendant toute la nuit

jusqu’à l’obtention d’une DO600 de 0,6. Ensuite, un volume de 300 µl de bactéries a été infecté avec

1 x 108 phages (le volume varie en fonction du titre de lysat) dans 3 ml de gélose molle LM17 + CaCl2

10 mM + 0,75% agar. Le tout a été versé sur gélose solide LM17 + CaCl2 10 mM + 1 agar. Les boîtes

de Pétri ont été incubées à 42 °C pendant 24 à 48 heures jusqu’à l’apparition de clones. Ceci a été fait

pour chaque gène visé.

Tableau 2.3 : Espaceurs possibles visés lors de la programmation du système CRISPR-Cas.

Gène

visé

Taille de

l’insert

(pb)

Espaceurs possibles (5’-3’) PAM

possibles

Locus

CRISPR

correspondant

orf22 133 TAAAAAAATCGCAAAATATGATGAAATGAT TGAGAAA CR1

CCAAGAAAACTTCCCTCAACGTGCTGAAAA CGAGAAA CR1

orf27 122 CAATACCGTGCCAAGTCTGGTATAATAGTA TCAGAAA CR1

CGTGCCAAGTCTGGTATAATAGTATCAGAA AGGTG CR3

GTATCAGAAAGGTGTAACGACTATCCTTTT AGGAG CR3

TACCAGACTTGGCACGGTATTGCCCGTTCT GGGTG CR3

orf30 135 GATCCTATTTATATTAGTGTGGATATTAAT AGGAG CR3

orf40 132 CCGCATATTAACATTGGAACAGTTACCAGA TGAGAAA CR1

39

Figure 2.1 : Programmation du système CRISPR-Cas natif. Lors de l’étape 1, la souche contenant le plasmide

programmeur croît sans pression de l’antibiotique. Plusieurs scénarios sont possibles. D’abord, 94 % des

cellules vont garder le plasmide (scénario A). Toutefois, environ 3 % des cellules vont perdre le plasmide sans

intervention du système CRISPR (scénario B). Puis, 3 % des cellules vont aussi perdre le plasmide, mais sous

intervention du système CRISPR où la majorité des cellules vont acquérir un espaceur provenant du plasmide

(scénario C) et une faible portion aura acquis l’espaceur désiré (scénario D). À l’étape 2, la population mixte

de cellules est exposée au phage à une grande concentration (108 virions). Suite à la pression de sélection

provenant du phage, environ une cellule sur 1 million va survivre suite à l’acquisition au hasard d’un espaceur

provenant du phage. Cependant, les cellules ayant acquis le bon espaceur auparavant (scénario D) auront un

taux de survie de 100 % et représenteront la majorité des colonies présentes à la surface des boîtes de Pétri

(étape 3).

Puis, une fois les BIM générés, il est essentiel de déterminer leur efficacité de défense contre

l’infection en calculant l’efficacité à former des plaques (EOP). Cette efficacité d’infection est

mesurée en calculant le titre du phage sauvage sur la souche sauvage et sur la souche résistante selon

la section 2.1.2. Ainsi la valeur est calculée grâce à l’équation suivante.

EOP = Titre du phage sur la souche résistante / Titre du phage sur la souche sensible

40

2.2.2 Construction des gabarits de recombinaison

Pour obtenir les phages mutants, un gabarit de recombinaison avec la délétion désirée doit être

construit pour chaque gène. Les informations sur les constructions génétiques se trouvent dans le

tableau 2.4. Cette étape de la méthodologie est très bien expliquée dans l’étape B du protocole publié

selon Lemay et al. (170).

Tableau 2.4 : Informations sur les constructions génétiques pour chaque gène visé ainsi que sur les domaines

conservés chez les protéines résultantes.

Orf

Taille

de la

délétion

(pb)

Domaines conservés

chez la protéine

Taille de la

région

homologue en

amont du gène -

Insert A (pb)

Taille de la région

homologue en aval

du gène - Insert B

(pb)

Taille de

l'insert

complet

(pb)

22 387 DUF 1366 Superfamily 573 572 1401

23 144 Aucun 528 534 1295

24 333 Aucun 577 376 1211

27 123 Aucun 534 433 1224

28 186 Aucun 576 547 1356

30 132 Aucun 272 573 1103

32 123 Aucun 581 552 1389

36 456 DUF 669 527 554 1346

40 252 Aucun 505 491 1253

41 156 Aucun 533 537 1302

43 327 DUF 1372 569 590 1393

44 708 DUF 1340 610 588 1429

pb : paire de bases

L’obtention d’un tel gabarit de recombinaison se fait d’abord en choisissant un gène dont la fonction

est inconnue chez le phage 2972 (voir figure 2.2 pour représentation de la méthodologie complète).

La présence de PAM, propre au locus CRISPR 1 (NNAGAAW) ou 3 (NGGNG), a été identifiée pour

déterminer la cible (proto-espaceur et PAM) qui sera coupée par le système CRISPR-Cas suite à

l’interférence. Ensuite, l’existence d’un BIM dans la collection possédant l’espaceur correspondant a

été vérifiée et si un tel BIM était absent, il a été créé selon la méthodologie de la section 2.2.1. Par la

suite, la longueur des régions homologues a été déterminée en amont et en aval du gène. Une longueur

d’environ 500 pb est idéale pour obtenir un bon taux de recombinaison homologue pendant l’édition

de génome, mais plusieurs facteurs sont à considérer.

41

D’abord, aucun gène toxique ne doit être présent dans les régions homologues pour éviter que le

gabarit soit toxique pour la cellule. Si une telle situation survient, il est possible de réduire la taille

d’un des inserts jusqu’à 200 pb ou de cloner l’insert total en sens inverse du promoteur du gène de

résistance de l’antibiotique du plasmide pNZ123. Puis, il est essentiel que le proto-espaceur présent

dans le gène soit exclu dans la délétion résultante pour éviter que la séquence soit reconnue par le

système CRISPR-Cas de la bactérie. Ensuite, les régions homologues doivent comprendre le début et

la fin du cadre de lecture pour éviter de modifier les espaces intergéniques, ce qui pourrait modifier

l’expression des gènes avoisinants.

Figure 2.2 : Schématisation de la méthodologie permettant l’obtention des gabarits de recombinaison. Quatre

amorces sont conçues pour former deux inserts (A et B) d’environ 500 pb pour la recombinaison homologue.

Ces inserts sont amplifiés par réaction PCR et ensuite assemblés dans le vecteur pNZ123, coupé avec l’enzyme

de restriction XbaI, à l’aide de l’assemblage Gibson.

Finalement, les oligonucléotides ont été conçus à l’aide du logiciel Geneious© (version 11.0.4) pour

permettre d’amplifier les deux inserts (A et B) répondants à toutes les conditions énumérées

précédemment. Les amorces extérieures de l’insert total (A + B) ont une extension complémentaire

(en vert) au vecteur de clonage pNZ123 coupé par l’enzyme de restriction XbaI (voir section B.1 de

l’annexe) et les amorces intérieures ont une extension complémentaire entre elles (en jaune) pour

42

former une version tronquée du gène suite à l’assemblage. La longueur des extensions doit faire

minimum 30 pb pour obtenir un taux d’assemblage satisfaisant. Cette longueur peut être augmentée

en fonction de la longueur et du nombre d’inserts.

Les inserts A et B ont été amplifiés par PCR (section B.2 de l’annexe 1) avec l’ADN polymérase Q5

et migrés sur gel d’agarose 2% avec l’échelle moléculaire «Low DNA Mass ladder» de la compagnie

InvitrogenTM pour estimer la concentration des produits PCR (section B.2 de l’annexe 1). Puis, les

inserts et le vecteur pNZ123 ont été assemblés à l’aide du «Gibson Assembly Master Mix» selon les

recommandations du manufacturier (section B.3 de l’annexe).

Les constructions génétiques ont été transformées dans des cellules E. coli NEB5α

chimiocompétentes de la compagnie New England Biolabs selon les recommandations du

manufacturier et incubées à 37°C toute la nuit sur gélose LB supplémentée de chloramphénicol à une

concentration de 20 µg/ml. Les colonies résultantes ont été testées par amplification PCR pour la

présence du bon insert avec les amorces pNZinsF et pNZinsR s’appariant sur une région extérieure

au site de clonage sur le plasmide pNZ123. Ensuite, les produits PCR ont été migrés sur gel d’agarose

2% et ceux ayant un produit de la taille attendue ont été séquencés par la méthode Sanger à la

plateforme de séquençage du CHUL. Une fois la séquence confirmée, les colonies correspondant aux

bonnes séquences ont été incubées toute la nuit dans 10 ml de milieu LB contenant 20 µg/ml de

chloramphénicol. Puis, les gabarits de recombinaison ont été extraits des souches d’E. coli NEB5α

(voir section 2.1.3) à partir de 3 ml de la culture et 1 ml a été utilisé pour effectuer un tube de

conservation à -80 °C. Finalement, 500 ng à 1 µg d’ADN plasmidique ont été transformés dans le

BIM correspondant au bon gabarit de recombinaison selon le protocole de la section 2.1.3.

Tableau 2.5 : Oligonucléotides utilisés lors cette de recherche ainsi que leur utilisation.

Nom Séquence (5’-3’) Fonction

Construction des plasmides programmeur de l'acquisition

orf22_cbgGIB_rev ATTACAGCTCCAGATCCAGTACTGAATTCTCGCTAACTGAGTCATCTTTTCAGATTT

ATC

Amplification de

l'insert pour le plasmide

programmeur de

l'acquisition de l'espaceur contre

l'orf22

orf22_cbgGIB_fwd GAAAATATGCACTCGAGAAGCTTGAGCTCTCCAAGAAAACTTCCCTCAACGTGCTG

orf27_cbgGIB_fwd GAAAATATGCACTCGAGAAGCTTGAGCTCTATGCAAAAAGCATGGCTAACGGTGG Amplification de l'insert pour le

plasmide

programmeur de l'acquisition de

l'espaceur contre l'orf27

orf27_cbgGIB_rev ATTACAGCTCCAGATCCAGTACTGAATTCTCACGTACAAATAGTGAGCGTACTCC

orf30_cbgGIB_fwd GAAAATATGCACTCGAGAAGCTTGAGCTCTGAAAAACGAGGTGAAAACAATGGATAC

43

orf30_cbgGIB_rev ATTACAGCTCCAGATCCAGTACTGAATTCTCAATAAAAAAAAGAGAGCGATTGCCC

Amplification de

l'insert pour le

plasmide programmeur de

l'acquisition de

l'espaceur contre l'orf30

orf40_cbgGIB_fwd GAAAATATGCACTCGAGAAGCTTGAGCTCTCAATAAAGATATGGATTTGGTCAGTG Amplification de

l'insert pour le plasmide

programmeur de

l'acquisition de l'espaceur contre

l'orf40

orf40_cbgGIB_rev ATTACAGCTCCAGATCCAGTACTGAATTCTACTATGTTCTTCGCTAGTTCTATCATC

Construction des gabarits de recombinaison

orf22_left_fwd ACTCGAGAAGCTTGAGCTCTAGCCATTCAAACTTTTTGGGGA Amplification de l'insert A pour le

gabarit de

recombinaison visant la délétion de l'orf22

orf22_left_rev2 GTCATCTTGACTGGCAAAAAGACGGGTACG

orf22_right_fwd2 TGCCAGTCAAGATGACTCAGTTAGCGACTGCTAC Amplification de

l'insert B pour le gabarit de

recombinaison visant

la délétion de l'orf22

orf22_right_rev CAGATCCAGTACTGAATTCTGCGATAGGCTATTGACTGCCT

orf23_left_fwd ACTCGAGAAGCTTGAGCTCTTCCGCAATTGATACTAGAAATGGT Amplification de

l'insert A pour le gabarit de



orf23_left_rev3 CTCTCACTTTTCTAAGCTGATGTTCTTCCTCCTAAAATTGTGTCT

orf23_right_fwd3 AATTTTAGGAGGAAGAACATCAGCTTAGAAAAGTGAGAGGAGCT Amplification de

l'insert B pour le

gabarit de recombinaison visant


orf23_right_rev CAGATCCAGTACTGAATTCTGCAAAGCTTTTTCACCGCCT

orf24_left_fwd ACTCGAGAAGCTTGAGCTCTCCCGTCTTTTTGCCAGTCGA Amplification de

l'insert A pour le

gabarit de


orf24_left_rev TCGGTAGCTCCGCCAACCTTATCAATCGT

orf24_right_fwd TTGGCGGAGCTACCGAAAATCAGCAGCA Amplification de




orf24_right_rev CAGATCCAGTACTGAATTCTGCCTTTAGCGTCCTCATTTGC

orf27_left_fwd ACTCGAGAAGCTTGAGCTCTACGGTCACTCTAGGCTCACA Amplification de

l'insert A pour le



orf27_left_rev2 CGTACTCCCCACCGTTAGCCATGCTTTTTGCAT

orf27_right_fwd2 AACGGTGGGGAGTACGCTCACTATTTGTACGTG Amplification de l'insert B pour le

gabarit de



orf27_right_rev CAGATCCAGTACTGAATTCTCCTGCAAAACTAAAGAACATTCCAGG

orf28_left_fwd ACTCGAGAAGCTTGAGCTCTGGGTCACGTTGGTGTCATGA Amplification de




orf28_left_rev TACTTAAAGGAATTTCAGAACAAACGCCACGATTGGTTTTACTC

orf28_right_fwd AAAACCAATCGTGGCGTTTGTTCTGAAATTCCTTTAAGTATGACAGAAAAT Amplification de

l'insert B pour le



orf28_right_rev CAGATCCAGTACTGAATTCTTGTATCCATTGTTTTCACCTCGT

orf30_left_fwd ACTCGAGAAGCTTGAGCTCTCGAGTTTGGTCAGTTTGGTACGG Amplification de l'insert A pour le

gabarit de


orf30_left_rev2 ATTACAATAAAAAAAAGAGAGCGATTGCCCCATTGTTTTCACCTCGTTTTTCTTACC

T

44

orf30_right_fwd2 TGAGGTAAGAAAAACGAGGTGAAAACAATGGGGCAATCGCTCTCTTTTTTTTATTG Amplification de

l'insert B pour le



orf30_right_rev2 CAGATCCAGTACTGAATTCTCCTTGAGAACCGTATTTTTC

orf32_left_fwd ACTCGAGAAGCTTGAGCTCTGGTCGAAGCCTCAGCATTATGCT Amplification de l'insert A pour le

gabarit de


orf32_left_rev GATAGTTGCATTTTAAATACCTTTCTATTAATAGTTAAAG

orf32_right_fwd TTAAAATGCAACTATCAATGAAATAAAATAGCTAAACCG Amplification de




orf32_right_rev CAGATCCAGTACTGAATTCTGTCATACTAATCGCAAGCGCTGC

orf36_left_fwd ACTCGAGAAGCTTGAGCTCTGCCATGAGGGCTTTAAACCCAAGAG Amplification de

l'insert A pour le



orf36_left_rev AATCTCAGCGTAAGTACCGTCTTTGATAGATCCG

orf36_right_fwd TACTTACGCTGAGATTTCAGAAATTGACCTTCCA Amplification de l'insert B pour le

gabarit de


orf36_right_rev CAGATCCAGTACTGAATTCTCAACGCAAGAGGTGCTTCTGTTATGC

orf40_left_fwd ACTCGAGAAGCTTGAGCTCTGAGAGAGAGTCAAAAAATAAGGTGCCTC Amplification de




orf40_left_rev2 TTCTTCGCCCCAGGTGCATAGATGCCAACTAAC

orf40_right_fwd2 CACCTGGGGCGAAGAACATAGTAGGAGATTAGTAG Amplification de

l'insert B pour le



orf40_right_rev CAGATCCAGTACTGAATTCTCCACTGAATCTTAGGGTCAGCT

orf41_left_fwd ACTCGAGAAGCTTGAGCTCTACTGGAGCACCAAAAGGTTT Amplification de

l'insert A pour le

gabarit de


orf41_left_rev CCACTGTGTACAATCTTAAAACATCATCTTCCATGTTGTCGT

orf41_right_fwd GACAACATGGAAGATGATGTTTTAAGATTGTACACAGTGGAGATG Amplification de




orf41_right_rev CAGATCCAGTACTGAATTCTTGATTTCCTCGTACGCAATGC

orf43_left_fwd ACTCGAGAAGCTTGAGCTCTCCATCGTCGAGTTGGCTGAA Amplification de

l'insert A pour le



orf43_left_rev TACGACCCACAATCAAGCGTCCAGACTGACGACTAAGATAGCAA

orf43_right_fwd TATCTTAGTCGTCAGTCTGGACGCTTGATTGTGGGTCGTA Amplification de l'insert B pour le



orf43_right_rev CAGATCCAGTACTGAATTCTTGGCTTGTTGATTTGTACAGCC

orf44_left_fwd ACTCGAGAAGCTTGAGCTCTTCACAGACCCACAAATGGCA Amplification de l'insert A pour le

gabarit de


orf44_left_rev CCGAATAGCTCTCTAGACAGTGTTCTGCGATGTTCTTCCCT

orf44_right_fwd GGGAAGAACATCGCAGAACACTGTCTAGAGAGCTATTCGGTAAGA Amplification de




orf44_right_rev CAGATCCAGTACTGAATTCTGCCTGCAATTGTGTCGGTC

Criblage et vérification

pNZinsF AATGTCACTAACCTGCCC Criblage des clones

possédant les inserts

dans le vecteur pNZ123

pNZinsR CATTGAACATGCTGAAGA

45

CL-15 TACGAGTTGGACTGCAAACC Vérification de la longueur de la RBP DT26 TTTGACCATCGGCACTATCG

pZN_XbaI_F AGAGCTCAAGCTTCTCGAG Linéarisation du

plasmide pNZ123 digéré par l’enzyme

Xba1 pNZ_xbaI_R AGAATTCAGTACTGGATCTGGAGC

CR1 up TGCTGAGACAACCTAGTCTCTC Amplification du locus 1 du système

CRISPR de S.

thermophilus DGCC7710

RDS7.BamHI GGATCCGGATCCGTTGAGGCCTTGTTC

CR3up CGTAATCGCACTATTAATCTCAG Amplification du

locus 3 du système CRISPR de S.

thermophilus

DGCC7710

CR3down GCTGGATATTCGTATAACATGTT

2.2.3 Génération et purification des phages mutants

Pour générer les délétions dans le génome du phage 2972, le BIM possédant un espaceur visant le

gène à éditer possédant le gabarit de recombinaison correspondant a été inoculé dans 10 ml de milieu

LM17 supplémenté de 5 µg/ml de chloramphénicol et incubé à 37 °C pendant toute la nuit. Trois

dilutions du phage 2972 sauvage (100, 10-1 et 10-2) ont ensuite été préparées en effectuant une dilution

sériée dans 900 µl de tampon de phage 1X (voir «titration de phage» dans la section 2.1.2). Puis, un

volume de 300 µl de culture a été infecté avec 100 µl de la dilution de phage 100 (titre approximatif

de 1x109 ufp/ml) dans 3 ml de gélose molle LM17 + CaCl2 10 mM et le tout a été versé sur gélose

solide LM17 + CaCl2 10 mM + 1% agar. Le tout a été répété pour les dilutions de phages 10-1 et 10-

2. Les géloses ont été incubées à 42 °C pendant 24h ou jusqu’à l’apparition de plages de lyse.

Les phages mutants ont été purifiés trois fois suite à l’édition de génome. Le BIM et son gabarit de

recombinaison a été inoculé dans 10 ml de LM17 + 5 µg/ml de chloramphénicol et incubés à 37 °C

toute la nuit. Une plage de lyse isolée provenant de la première infection a été prélevée avec un

embout tronqué stérile et transférée dans 400 µl de tampon de phage 1X. La plage de lyse a été laissée

un minimum de 20 minutes à la température ambiante pour permettre aux phages mutants de diffuser

dans le tampon. Puis, 300 µl de la culture du BIM et 100 µl du tampon de phage contenant la plage

de lyse ont été ajoutés à 3 ml de gélose molle LM17 + CaCl2 10 mM + 0,75% agar. Le tout a été versé

sur gélose solide LM17 + CaCl2 10 mM + 1% agar et incubé 24h à 42 °C. Cette méthodologie a été

répétée deux autres fois avec une plage de lyse provenant de la deuxième infection, puis de la

troisième infection.

Après la purification, les plages de lyse sont analysées par réaction PCR. Les amorces extérieures

(pNZinsF et pNZinsR) au gabarit de recombinaison ont été utilisées pour vérifier la présence de la

46

délétion chez les phages mutants en les comparant au phage sauvage. Les produits PCR ayant la

délétion attendue ont été envoyés au séquençage et les plages de lyse correspondantes ont été

amplifiées et conservées à long terme (voir section 2.1.2).

Des CEMs (CRISPR Escape Mutants) ont aussi été générés lors de cette étude. Les CEMs sont des

mutants pouvant échapper au système CRISPR-Cas de la bactérie en modifiant leur proto-espaceur,

le plus souvent par une mutation ponctuelle. Un BIM a été mis en culture dans 10 ml de milieu LM17

et incubé à 37 °C pendant toute la nuit. Un volume de 300 µl de la culture a ensuite été transféré dans

3 ml de gélose molle LM17 + 10mM CalCl2 + 0,75 % agar avec une quantité de 106 (volume à calculé

en fonction du titre du lysat de phage) du phage 2972. Le tout a été versé sur gélose solide LM17 +

10 mM CalCl2 + 1% agar. La gélose a été incubée pendant 18 à 24 heures à 42 °C et vérifiée pour la

présence de plages de lyse. Les plages de lyse ont été purifiées trois fois sur le BIM. Une plage de

lyse a été prélevée avec un embout tronqué et transférée dans 300 µl de tampon de phage 1X pendant

20 minutes. Un volume de 300 µl du BIM a été transféré dans 3 ml de gélose molle LM17 + 10mM

CalCl2 + 0,75 % agar avec 100 µl du tampon de phage contenant la plage de lyse prélevée et versée

sur gélose solide LM17 + 10 mM CalCl2 + 1% agar. La gélose a été incubée pendant 18 à 24 heures

à 42 °C. Le processus a été répété deux autres fois. Ensuite, la région du proto-espaceur visé par le

BIM utilisé pour générer le CEM a été amplifiée par PCR et envoyé au service de séquençage pour

identifier la mutation.

2.3 Caractérisation des phages mutants

2.3.1 Courbes de croissance

Plusieurs méthodes peuvent être utilisées pour mesurer l’impact des mutations. Premièrement, il est

possible de faire une courbe de croissance (49). Celle-ci permet d’obtenir le temps de latence, soit le

temps nécessaire à un phage pour compléter son cycle lytique et la taille de la progéniture, soit le

nombre de phages relâchés suite à l’infection d’une cellule par un seul phage. En premier temps, 108

cellules de la souche hôte ont été infectées à une MOI de 0,05 avec le phage mutant et incubées à

42°C pendant 5 minutes pour une adsorption maximale. Puis, la souche infectée a été centrifugée 1

minute à 16 000g. Le surnageant a été enlevé et le culot a été resuspendu dans 1 ml de LM17 + CaCl2

10 mM. Cette étape a été répétée une deuxième fois. Ensuite, une dilution jusqu’à 10-2 a été effectuée

dans 900 µl de milieu LM17 + 10 mM CaCl2. La dilution 10-4 a été faite directement à partir de la

dilution 10-2 en transférant 100 µl de la dilution dans 10 ml de milieu LM17 + CaCl2. Ce tube a été

47

conservé dans un bain-marie à 42 °C pendant l’entièreté de l’expérience. Un échantillon de 100 µl de

la dilution 10-4 a ainsi été prélevé pendant 80 minutes à intervalles de 10 minutes. Toutes les dilutions

subséquentes proviennent du tube 10-4. Les dilutions 10-4, 10-5 et 10-6 ont été titrées en triplicata

biologique (voir section 2.1.2) pour les 30 premières minutes pour évaluer la concentration en nombre

de phages par millilitre. Après 30 minutes après le début de l’expérience, les dilutions 10-5, 10-6 et 10-

7 ont été utilisées pour la titration. Toutes les boîtes de Pétri ont été incubées pendant 24h à 42 °C.

Suite à l’incubation, le titre est estimé à partir de la dilution qui contient entre 30 et 300 plages de

lyse pour chaque temps prélevé (voir l’équation de la section 2.1.2). Un graphique semi-

logarithmique du titre du phage (UFP/ml en échelle logarithmique) en fonction du temps en minutes

a été réalisé à l’aide du programme Excel. Le temps de latence a été estimé à partir de ce graphique.

Cette donnée correspond au temps au milieu de la courbe entre les deux plateaux, comme l’indique

la ligne noire au temps 45 minutes sur le graphique démonstratif suivant (figure 2.3).

Figure 2.3 : Exemple d’un graphique résultant d’une courbe de croissance de phage standard. La ligne noire

représente le temps de latence. Il est possible de voir les deux plateaux qui se situent avant et après la lyse des

cellules suite au cycle lytique. Le plateau initial est aux temps 10, 20 et 30 minutes pour le titre du phage à

environ 6,5 Log et le plateau final se trouve aux temps 60, 70 et 80 minutes où le titre du phage est à environ

9,7 Log.

Finalement, la taille de la progéniture a été déterminée en calculant le titre à chaque point des plateaux

et en faisant la moyenne pour chaque plateau individuel. Le titre pour le premier plateau correspond

au titre initial et le titre pour le deuxième plateau correspond au titre final. La taille de la progéniture

a été calculée selon l’équation suivante.

48

(Titre final – Titre initial) / Titre initial = Taille de la progéniture

2.3.2 Test d’adsorption

Un test d’adsorption a été effectué pour mesurer la capacité du phage à s’attacher aux récepteurs de

la paroi bactérienne (46). Les souches hôtes (BIM et sauvage) sont incubées à 37 °C toute la nuit dans

10 ml de milieu LM17. Le phage sauvage et le phage mutant à tester ont été dilués chacun en série

pour avoir un titre d’environ 1,5 x 104 ufp/ml. Puis, 2 tubes de 10 ml de milieu LM17 ont été inoculés

à 2% avec les souches différentes et incubés à 42°C jusqu’à l’obtention d’une DO600 entre 0,6 et 0,8.

Un volume de 100 µl de la dilution du phage sauvage est ajouté à 900 µl de la culture sauvage, 900

µl du BIM et 900 µl de milieu non inoculé comme contrôle négatif. Le tout a été répété pour le phage

mutant. Les six conditions, soit culture sauvage, culture résistante et contrôle pour chaque phage, ont

été incubées à 42 °C pendant 5 minutes et répéter pour 10 minutes. Les microtubes ont été centrifugés

à 16 000g pendant une minute et le surnageant a été récupéré et titré (voir section 2.1.2). Le

pourcentage d’adsorption pour le phage sauvage et le phage mutant a été calculé avec l’équation

suivante.

[(Titre du contrôle négatif – Titre du surnageant de la culture) / Titre du contrôle négatif] x 100

2.3.3 Microscopie électronique à transmission

Il est possible d’observer la morphologie des phages à l’aide de la microscopie électronique à

transmission (10). Les lysats non purifiés du phage 2972 sauvage, du phage 2972Δ22 et du phage

2972Δ24 ont été observés à la Plateforme d’imagerie moléculaire et microscopie à l’IBIS. Le

microscope électronique à transmission JEOL modèle JEM-1230 et une coloration à l’acide

phosphotungstique 2% ont été utilisés. Les mesures de la capside et de la queue ont été faites à l’aide

de l’outil «Mesure» dans le logiciel Adobe Illustrator© CC 2018 sur un minimum de trois particules

virales.

2.3.4 Spectrométrie de masse

Le phage 2972 purifié selon Sambrook et al. a été envoyé à la Plateforme de protéomique du Centre

de recherche du CHU (Centre Hospitalier Universitaire) du Québec pour le service d’identification

49

des protéines (191). Ce service permet d’identifier les protéines structurales, ou présentes dans la

capside, du phage sauvage. Un spectromètre de masse Orbitrap Fusion (Thermo) a été utilisé pour

réaliser une analyse de type LC-MS/MS de 60 minutes. L’échantillon a préalablement été dessalé et

digéré en solution avec la trypsine. Les données ont ensuite été analysées avec le programme Scaffold

4©.

2.3.5 Production de BIM

La capacité d’une souche à produire des BIM face au phage mutant a été vérifiée pour caractériser

une partie des interactions phage-bactérie (80). Comme le principal moyen de défense chez l’espèce

S. thermophilus est le système CRISPR-Cas, les évènements d’acquisition d’espaceurs ont été

analysés pour le phage sauvage, le phage mutant et un CEM (CRISPR Escaping Mutant) ne possédant

qu’une mutation ponctuelle dans la région du proto-espaceur ou du PAM comme contrôle.

Les BIM ont été générés par la méthode suivante. Une culture de la souche sauvage et le BIM qui a

servi à générer la délétion dans le phage ont été incubés à 37 °C pendant toute la nuit dans 10 ml de

milieu LM17. Un volume de 200 µl a été ajouté à 10 ml de milieu LM17 pour chaque souche et

incubé à 42 °C jusqu’à une DO600 de 0,6. Les cultures ont ensuite été mélangées à l’aide du vortex

pendant 1 minute. Un volume de 300 µl de culture et 1 x 108 virions (volume variable en fonction du

titre de départ) ont été ajoutés à 3 ml de gélose molle LM17 + CaCl2 10 mM + 0,75% agar et versés

sur gélose solide LM17 + CaCl2 10 mM + 1% agar. Chaque phage (sauvage, mutant et CEM) a été

testé en triplicata avec chaque souche (sauvage et BIM). Toutes les boîtes de Pétri ont été incubées à

42 °C pendant 48h.

Les colonies résultantes ont été dénombrées pour chaque condition. Les loci CRISPR 1 des colonies

(48 pour chaque) générées à partir des combinaisons BIM + phage mutant et BIM + CEM ont été

séquencés, car la majorité des acquisitions se font dans ce locus et les évènements d’acquisition ont

ensuite pu être analysés (96).

50

2.4 Caractérisation des protéines sauvages

2.4.1 Choix et synthèse des protéines

Douze gènes ont été analysés dans cette recherche et donc un total de douze protéines codées par ces

gènes peuvent être potentiellement caractérisées par des techniques biochimiques. Il est évident que

ce nombre représente une charge de travail importante et donc, il est nécessaire de viser les protéines

ayant un intérêt scientifique significatif. Les produits des gènes qui sont essentiels pour la réplication

virale ou qui démontrent un phénotype altéré ont été retenus, car ils suscitent un intérêt marqué pour

l’objectif de recherche. De plus, une analyse bio-informatique sur la prédiction des structures de

toutes les protéines du phage 2972 a été faite, en plus de l’analyse de la solubilité qui est un facteur

important lorsque l’on étudie les protéines (171). Les protéines ayant un modèle de prédiction fiable,

ne possédant pas de segments transmembranaires et détenant un taux de solubilité élevé sont d’un

plus grand intérêt. Puis, il est préférable d’avoir des protéines ayant une taille plus petite que 100

résidus, car la détermination de la structure par spectroscopie RMN des protéines plus grosses est trop

complexe. En se fiant à tous ces critères, trois protéines ont été sélectionnées, soit les produits des

gènes de l’orf32, l’orf40 et l’orf41.

Les protéines ont été synthétisées par la compagnie Bio Basic© à un pourcentage de pureté > 95 %

(95,71% pour ORF32, 95,98% pour ORF40 et 95,28% pour ORF41). Un poids de 14,5 mg a été

synthétisé pour chaque protéine.

2.4.2 Prédictions bio-informatiques

Les prédictions bio-informatiques ont été exécutées par Vincent Boulanger, étudiant au baccalauréat

dans le laboratoire de Stéphane Gagné à l’Institut de biologie intégrative et des systèmes (IBIS), dans

le cadre de son projet de recherche en collaboration avec le Professeur Sylvain Moineau intitulé

«Structure Determination of Virulent Bacteriophage 2972 of Streptococcus thermophilus Proteins»

(171). Les modèles bio-informatiques des différentes protéines du phage 2972 ont été déterminés en

utilisant plusieurs logiciels appliqués en fonction du pointage donnés suite à l’analyse. Ces logiciels

sont I-TASSER 5.1, QUARK server, ThreaDomEx, COACH and COFACTOR. Le logiciel

I_TASSER 5.1 a été utilisé pour prédire la structure des protéines codées par l’orf32 et par l’orf41 et

QUARK server a été utilisé pour prédire la structure de la protéine codée par l’orf40.

51

2.4.3 Dichroïsme circulaire

Le dichroïsme circulaire est une méthode pour estimer les structures secondaires des protéines (172).

Un spectropolarimètre de dichroïsme circulaire modèle Jasco J-815 a été utilisé dans le cadre de cette

recherche. Les protéines ORF32 et ORF40 synthétisées ont été solubilisées dans un tampon sodium

phosphate 25 mM pH 4.5 à une concentration de 1 mg/ml. Le tampon a servi de contrôle négatif pour

la prise de mesures. Les échantillons ont été transférés dans des cellules de quartz ayant une épaisseur

de 0,2 mm. Un spectre complet à 25 °C, à 42 °C et à 80 °C a été enregistré pour chaque protéine à

des longueurs d’onde de 190 nm à 260 nm en utilisant le programme d’acquisition Spectra

Measurement. Une mesure a été prise à chaque 0,1 nm avec une vitesse de 100 nm/minute pour dix

accumulations (n=10).

Une courbe de dénaturation a aussi été enregistrée pour chaque protéine en utilisant le programme

Variable Temperature Measurement. Selon les spectres complets précédemment enregistrés, les

longueurs d’onde de 222 nm, 208 nm et 201 nm ont été choisies pour prendre les mesures, car elles

représentent les pics les plus négatifs des spectres. Un intervalle de température de 25 °C à 80 °C,

ainsi qu’une prise de mesure à chaque 2 °C pour une vitesse d’augmentation de 1 °C/minute ont été

utilisés.

Le signal provenant du contrôle négatif a été soustrait des données brutes et ensuite elles ont été

transformées en ellipticité molaire à l’aide de l’outil Spectra Analysis dans le logiciel Spectra

Manager (version 2.08.01) en fonction de la concentration molaire par résidu selon l’équation

suivante.

Concentration molaire = (1000*Nombre de résidus*Concentration de la protéine en g/mol)

Masse molaire de la protéine en g/mol

52

Les proportions en structures secondaires ont été estimées avec l’outil CDPro et les bases de données

disponibles dans le service de Nanomédecine et de nanobiotechnologie de PROTEO, ainsi que les

méthodes de calculs incluses dans l’outil. Un exemple de spectres générés par chaque type de

structure est représenté dans la figure suivante.

Figure 2.4 : Signaux de dichroïsme circulaire émis par les différents types de structures secondaires en fonction

de la longueur d’onde en nanomètre. La courbe en noire représente les hélices α, la courbe lignée en bleue

représente les feuillets β et la courbe pointillée en mauve représente une structure désordonnée, tirée de

Campbell (172).

53

CHAPITRE 3: Résultats


3.1.1 Construction des BIM «sur demande»

Tableau 3.1 : Espaceurs intégrés dans les locus CRISPR1 ou CRISPR3 de la souche S. thermophilus

DGCC7710 suite à la programmation du système CRISPR-Cas natif (BIM «sur demande»).

Nom

du

BIM

Locus Séquence de l'espaceur (5’-

3’) PAM

Position du

proto-espaceur Brin

Gène

correspondant

AR1 CR1

CCAAGAAAACTTCCCTCAA

CGTGCTGAAAA CGAGAAA 23 599 - 23 629 + orf22

AR2 CR3

CGTGCCAAGTCTGGTATAA

TAGTATCAGAA AGGTG 25 379 – 25 408 + orf27

AR3 CR3

GATCCTATTTATATTAGTG

TGGATATTAAT AGGAG 26 175 - 26 205 + orf30

AR4 CR1

CCGCATATTAACATTGGAA

CAGTTACCAGA TGAGAAA 32 937 - 32 967 + orf40

Il a été démontré que le système CRISPR-Cas de type II-A chez S. thermophilus peut être programmé

pour acquérir un espaceur spécifique dans un des loci CRISPR présents chez cette bactérie (169).

Cette méthode est beaucoup plus précise que la méthode traditionnelle, où l’acquisition se fait de

manière aléatoire et induit un biais en fonction de la taille des gènes et de la disposition des PAM

dans le génome (44). On voit ici une acquisition ciblée des espaceurs pour chaque orf permettant

d’obtenir des BIM nécessaires à l’étude (tableau 3.1). Les espaceurs ont été acquis dans les deux loci

différents CR1 et CR3, selon la disponibilité dans le gène ciblé, en respectant les PAM types de

chaque locus (NNAGAAW pour CR1 et NGGNG pour CR3), ceci pour chaque gène ciblé par

l’acquisition.

Tableau 3.2 : EOP du phage 2972 sur les BIM construits suite à la programmation du système CRISPR-Cas.

Nom du BIM Titre sur la souche

résistante (ufp/ml)

Titre sur la souche

sensible (ufp/ml) EOP

AR1 1 x 103

2 x 109

5 x 10-7

AR2 1 x 103 5 x 10-7

AR3 2 x 102 1 x 10-7

AR4 1 x 104 5 x 10-6

54

De plus, l’EOP du phage 2972 sur les BIM a été calculé pour déterminer la force de leur résistance à

ce phage (tableau 3.2). Les BIM AR1, AR2, AR3 et AR4 ont obtenu respectivement des valeurs

d’EOP de 5 x 10-7, 5 x 10-7, 1 x 10-7 et 5 x 10-6.

3.1.2 Génération et purification des phages mutants

Le génome du phage 2972 comporte un total de 44 orfs putatifs dont 16 de ces gènes prédits codent

pour des protéines de fonction inconnue (tableau 2.2). Deux de ces gènes se trouvent dans les modules

qui codent pour des protéines structurales et donc représentent un intérêt moindre dans le cadre de la

recherche, ce qui laisse 14 orfs putatifs à l’étude, dont 12 ont été ciblés pour l’édition de génome du

phage 2972. L’objectif principal était d’éditer le génome de ce phage et d’identifier le génome

minimal requis pour la survie virale.

Tableau 3.3 : Information génétique sur les gènes à l’étude du phage 2972.

Orfs

inconnus

Longueur de la

délétion / Longueur

totale du gène Importance

du gène*

Expression

temporelle

Le gène

est-il

essentiel ?

Fréquence

d’isolement

(n=50) nt. *** a.a****

22 171/387 57/129 Génome de

cœur Tardive Non 30,0 %

23 144/144 48/48 Conservé Tardive ND** -

24 126/333 42/111 Unique à 2972 Tardive Non 62,5 %

27 72/123 24/41 Conservé Non

caractérisée Non 25,0 %

28 123/186 41/62 Conservé Non

caractérisée Non 100 %

30 87/132 29/44 Conservé Précoce ND** -

32 102/123 34/41 Conservé Précoce Oui 0 %

36 363/456 121/152 Conservé Précoce Non 20,0 %

40 180/252 60/84 Conservé Précoce Oui -

41 69/156 23/52 Conservé Précoce Non 33,3 %

43 231/327 77/109 Conservé Précoce Non 20 %

44 435/708 145/236 Génome de

coeur Précoce ND** -

* Parmi les phages de Streptococcus thermophilus

** Non déterminé

*** nt : nucléotide

**** a.a. : acide aminé

55

En utilisant le système CRISPR-Cas de type II-A chez S. thermophilus et un gabarit de recombinaison

ayant une délétion majeure, on permet au phage de contourner le système CRISPR-Cas au détriment

de la perte d’un gène. Si l’absence de ce gène n’est pas létale à la réplication du phage et que plusieurs

mutants peuvent être isolés, ce gène est déterminé comme non essentiel en condition de laboratoire.

Au total, 9 de ces gènes (orfs 22, 24, 27, 28, 32, 36, 40, 41 et 43) ont pu être étudiés sur 12 au total,

dont deux (orfs 32 et 40) ont été identifiés comme essentiels à la réplication du phage in vitro (tableau

3.3). L’importance de ces gènes varie entre des gènes faisant partie du génome de cœur des phages

de type pac et cos, gènes conservés parmi les phages de S. thermophilus et des gènes uniquement

présents chez 2972. La majorité des gènes a une expression temporelle précoce, donc ils sont

exprimés tôt dans le cycle infectieux (49).

Figure 3.1 : Migration des produits PCR des régions délétées et sauvages pour les sept gènes

identifiés comme non essentiels au génome du phage 2972. Les nombres impairs sont des

amplifications faites à partir du phage 2972 sauvage et les nombres pairs sont des amplifications faites

à partir des phages mutants pour chaque orf identifié. M : Échelle moléculaire 1Kb + DNA ladder

(Invotrogen).

Une fois les mutants obtenus, les plages de lyse ont été purifiées trois fois pour obtenir des lysats purs

ayant une délétion dans un gène ciblé (figure 3.1). L’ADN des lysats purifiés pour le phage 2972 et

les mutants des orfs 22, 28, 41 et 43 a ensuite été extrait pour procéder au séquençage complet du

génome avec Illumina (tableau 3.4). Les délétions ciblées dans les bons cadres de lecture ont toutes

été identifiées. Une mutation ponctuelle dans l’orf18 a aussi été identifiée chez tous les phages, mais

comme elle se trouve aussi dans le phage sauvage il est donc possible qu’il y ait eu une erreur de

56

séquençage dans le génome de référence ou que le génome du phage sauvage ait évolué avec le temps.

Les autres mutations identifiées ont toutes été confirmées et infirmées par PCR (tableau 3.4).

Tableau 3.4 : Résultats du séquençage Illumina pour les phages 2972, 2972Δ22, 2972Δ28, 2972Δ41 et

2972Δ43.

Phage Type de mutation Position Gène Confirmation

PCR

2972 Ponctuelle 14 045 Orf18 – Tape Mesure

Protein

Présente

2972Δ22 Ponctuelle 2952 Orf4 – Terminase large

Subunit

Présente

Ponctuelle 4009 Orf5 – Portal Protein Présente

Ponctuelle 14 045 Orf18 – Tape Mesure

Protein

Présente

Délétion Variable Orf20 – Receptor Binding

Protein

Présente

Délétion 23 548 – 23 712 Orf22 - Unknown Présente

2922Δ28 Ponctuelle 14 045 Orf18 – Tape Mesure

Protein

Présente



Protein

Présente



Protein

Présente



3.2.1 Courbes de croissance

Pour mesurer l’impact des délétions sur la réplication virale, une courbe de croissance pour trois des

sept mutants obtenus a été faite. Cette méthode est utile pour visualiser les effets d’un gène en moins

dans le génome. Le phage 2972 a servi de référence et le phage 2972 possédant une RBP courte, qui

est un mutant spontané obtenu en laboratoire, a servi de comparaison pour les temps de latence plus

courts. Comme les titres de départs utilisés étaient différents pour chaque lysat, les résultats ont été

reportés sur un titre relatif où un seul phage génère une progéniture (figure 3.2).

Les données des temps de latence et des tailles de la progéniture sont obtenues en triplicata de chaque

expérience. Une moyenne et un écart-type sont ensuite engendrés pour toutes les courbes de

croissance (tableau 3.5). Pour le phage de référence 2972, on observe une taille de la progéniture de

121 ± 22 phages après un temps de latence de 53 ± 1,5 minutes. Une taille de la progéniture similaire

57

est observée chez le phage 2972 RBP courte qui est de 123 ± 45 virions produits par cellule, toutefois

cette progéniture est relâchée plus tôt que le phage 2972 sauvage, à un temps de 44 ± 4,7 minutes.

Des temps de latence plus courts sont aussi observés chez les phages mutants 2972Δ22, 2972Δ41 et

2972Δ43 respectivement de 37 ± 1,0 minutes, 41 ± 2,8 minutes et 43 ± 2,3 minutes. Ces temps de

latence sont semblables au temps de latence obtenue pour le mutant spontané 2972 RBP courte, et

donc un PCR a été effectué sur la région de l’orf20 (Receptor Binding Protein) pour vérifier la

longueur de cette protéine. Tous les sept phages mutants produits possèdent la version longue de la

RBP, et donc la réduction du temps de latence est un effet de la délétion et non de la longueur de la

RBP.

Figure 3.2 : Courbe de croissance à partir du titre relatif en fonction du temps pour cinq phages. Les données

ont été faites en triplicata biologiques et techniques. La courbe en bleu et la courbe en jaune représentent

respectivement le phage de référence 2972 et le phage de référence pour le temps de latence plus court, 2972

RBP courte. La courbe en vert, la courbe en rose et la courbe en gris représentent respectivement le phage

2972Δ22, 2972Δ41 et 2972Δ43.

Le nombre de virions relâchés par bactérie pour les trois phages mutants analysés varie en fonction

du mutant. Le phage 2972Δ41 a une taille de la progéniture de 65 ± 25 phages, ce qui représente la

moitié de celle du phage 2972 et le phage 2972Δ43 a une taille de la progéniture de 19 ± 6 phages,

ce qui représente un sixième de la population normalement produite. Pour ce qui est du phage

2972Δ22, la taille de la progéniture est d’au moins 63 phages, car suite au premier cycle de réplication

courte

58

(environ 43 minutes), le nombre de plages de lyse ne cesse d’augmenter au lieu d’observer un plateau

jusqu’à la deuxième lyse.

Tableau 3.5 : Données correspondantes aux courbes de croissance des phages 2972, 2972 RBP courte,

2972Δ22, 2972Δ41 et 2972Δ43.

Phage

Taille de la

progéniture

(virions/cellule)

Temps de latence

(minutes)

2972 121 ± 22 53 ± 1,5

2972 RBP courte 123 ± 45 44 ± 4,7

2972Δ22 > 63 37 ± 1,0

2972Δ41 65 ± 25 41 ± 2,8

2972Δ43 19 ± 6 43 ± 2,3

3.2.2 Test d’adsorption

L’orf22 est un gène putatif situé près du module de morphologie de la queue du phage, en plus d’avoir

une expression temporelle tardive (tableau 3.2). Il se peut donc qu’il ait un rôle structural dans le

génome et que le phénotype observé lors des courbes de croissance soit dû à une morphologie

différente et non à un cycle de réplication modifié. L’adsorption à la cellule bactérienne est un

paramètre influencé par la morphologie de la queue, plus particulièrement par la plaque basale (15).

Un test d’adsorption après 10 minutes seulement a donc été fait pour mesurer l’adsorption du phage

2972Δ22 à la souche DGCC7710, en utilisant le phage 2972 comme contrôle positif et le phage

2972Δ41 comme mutant contrôle.

Tableau 3.6 : Pourcentage d’adsorption après 10 minutes des phages 2972, 2972Δ22 et 2972Δ41 sur la souche

S. thermophilus DGCC7710.

Phage Pourcentage d’adsorption

(après 5 minutes)

Pourcentage d’adsorption

(après 10 minutes)

2972 96,6 ± 0,9 96,4 ± 2,4

2972 RBP courte 92,4 ± 1,4 89,6 ± 10,4

2972Δ22 ND 72,6 ± 5,1

2972Δ41 96,7 ± 0,9 99,6 ± 0,5

*ND : Non déterminé

Le phage 2972 et 2972Δ41 ont des pourcentages d’adsorption similaires, soit de 96,4 ± 4,3% et 99,2

± 2,4% respectivement selon le tableau 3.6. Cela indique que lorsque ces phages sont en contact avec

59

la souche DGCC7710, presque la totalité des phages s’adsorbe rapidement à la surface de la bactérie.

Toutefois, le pourcentage d’adsorption pour le phage 2972Δ22 est de 72,6 ± 5,1%, ce qui représente

une diminution significative par rapport au phage sauvage.

3.2.3 Microscopie électronique à transmission

Les résultats obtenus suite aux tests d’adsorption suggèrent que l’orf22 pourrait jouer un rôle

structural, plus particulièrement dans la morphologie de la queue ou de la plaque basale due à son

emplacement dans le génome et à son adsorption modifiée. L’observation des particules virales en

microscopie électronique à transmission permet une analyse rapide de la morphologie des phages et

d’identifier les différences s’il y a lieu.

Figure 3.3 : Photo en microscopie électronique à transmission des phages 2972 (A) et 2972Δ22 (B). La barre

pour chaque photo représente une longueur de 50 nm. Une coloration à l’acide phosphotungstique a été utilisée.

La figure 3.3 montre une photo en microscopie électronique à transmission du phage 2972 et

2972Δ22. À première vue, aucune distinction morphologique ne semble apparente entre ces deux

phages. Le phage 2972 possède une queue de 256 ± 8 nm et une capside de 69 ± 3 nm et le phage

2972Δ22 possède une queue de 266 ± 6 nm et une capside de 63 ± 4 nm (tableau 3.7). Ces mesures

n’ont pas de différence significative entre elles et donc la morphologie des deux phages est très

semblable.

A

B

60

Tableau 3.7 : Mesure des dimensions de la queue (n=3) et de la capside (n=9) du phage 2972 et du phage

2972Δ22.

Phage Mesure de la queue (nm) Mesure de la capside (nm)

2972 256 ± 8 69 ± 3

2972Δ22 266 ± 6 63 ± 4

3.2.4 Spectrométrie de masse

Les résultats observés par microscopie électronique précédemment montrent que le phage 2972 et le

phage 2972Δ22 ont une morphologie comparable. Toutefois, la plaque basale est un élément très

difficile à observer avec ce type de microscope et donc si la protéine codée par l’orf22 joue un rôle

dans la structure du phage, ce ne sera pas visible lors des résultats. C’est pourquoi le phage 2972 a

été analysé par spectrométrie de masse, pour tenter de détecter la protéine de ORF22 et vérifier son

rôle structural.

Tableau 3.8 : Les protéines du phage 2972 détectées par spectrométrie de masse.

Protéine détectée

Poids

moléculaire

(kDa)

Nombre de

peptides

uniques

Pourcentage de

couverture

Orf2_Small terminase subunit 17 2 15%

Orf5_Portal Protein 58 20 46%

Orf6_Minor Head Protein 34 12 44%

Orf7_Scaffold/Prohead capsid Assembly 21 6 58%

Orf8_Capsid Protein 13 6 50%

Orf9_Major capsid Protein 37 11 37%

Orf11_Head to Tail Joint 13 4 57%

Orf12_Minor capsid Structural Protein 11 6 67%

Orf13_Unknown 12 3 40%

Orf14_Structural Protein 15 4 46%

Orf15_Major Tail Protein 19 8 67%

Orf18_Tape Measure Protein 154 31 26%

Orf19_Tail-tip Protein 58 20 61%

Orf20_Receptor Binding Protein (RBP) 177 59 52%

Orf21_Phage Baseplate Protein 74 19 42%

Orf24_Unknown 12 5 46%

Orf25_Holin 12 1 14%

Orf26_Endolysin 22 6 46%

Orf36_Unknown 17 1 9.3%

Orf42_DNA Binding 20 1 6.5%

61

La spectrométrie de masse permet de détecter les protéines structurales ou encapsidées du phage et

de confirmer plus précisément le rôle qu’elles jouent dans le génome. Le tableau 3.8 montre que 20

protéines sur 44 protéines prédites ont été détectées par spectrométrie de masse, où un seul peptide

unique est détecté pour trois protéines. Donc, 2 peptides uniques ont été détectés pour 17 protéines

du phage 2972 avec un pourcentage de couverture de la séquence en acides aminés variant entre 15%

et 67%. La majorité de ces protéines ont déjà été annotées comme des protéines structurales

auparavant (en bleu dans le tableau 3.5, les protéines non structurales sont en orange), cependant

l’ORF24 a été décelé avec 5 peptides uniques pour un pourcentage de couverture de 46%. La fonction

du gène codant pour cette protéine est inconnue (encadré rouge dans le tableau 3.5) et un mutant a

été obtenu pour cet orf (tableau 3.2).

3.2.5 Production de BIM

La production de BIM chez la souche S. thermophilus DGCC7710 et les BIM appropriés a été testée

en utilisant les phages mutants pour voir si les interactions entre les phages mutants et l’hôte sont

différentes. Plusieurs productions de BIM ont été faites et les espaceurs acquis ont été séquencés pour

la présence d’un motif d’acquisition. Les tableaux 3.9 et 3.10 montrent qu’en moyenne une

cinquantaine de BIM sont produits par le système CRISPR-Cas sauvage lors d’une première

infection, soit une souche non résistante et un phage qui peut l’infecter. Ces nombres ne semblent pas

augmenter lorsque la souche sauvage est infectée avec les phages mutants 2972Δ41 et 2972Δ22. Les

CEM utilisés comme contrôle positif (phage résistant) possèdent une mutation ponctuelle dans le

proto-espaceur leur conférant la résistance au système CRISPR-Cas de type II-A présent dans la

souche (tableau 2.1).

La production de BIM suite à l’infection par les phages mutants varie quelque peu par rapport au

système sauvage. Sur la souche sensible, le CEM41 a tendance à produire plus de BIM et le CEM22

produit moins de BIM. Cependant, les nombres changent beaucoup lorsqu’une souche résistante

(BIM) est infectée par un phage mutant. Dans le contexte de cette expérience, il n’y a pas de

reconnaissance du proto-espaceur du phage mutant par le BIM, car le proto-espaceur est absent du

génome viral. Cependant, il y a reconnaissance partielle entre l’ARNcr d’un BIM et le proto-espaceur

d’un CEM, car une seule paire de base est mutée. Lorsque l’on compare les BIM produits suite à

l’infection par le phage mutant et ceux produits suite à l’infection par le CEM, il est possible de

constater une augmentation prononcée pour le CEM41 et légère pour le CEM22 (tableaux 3.9 et 3.10).

62

Tableau 3.9 : Capacité de production de BIM avec la souche DGCC7710 et le BIM AR1 contre les phages

2972, 2972Δ22 et CEM22.

Lorsque le BIM AR1 est infecté par le phage CEM22, le nombre de BIM augmente d’un facteur de

1,4 par rapport à la souche sauvage. Cette augmentation est d’un facteur de 27 pour le BIM A-35 et

le CEM41 (figure 3.5). Pour les BIM générés avec les phages mutants et leurs BIM respectifs, aucune

augmentation n’est observée pour le phage 2972Δ22 et une légère augmentation d’un facteur de 7 est

observée pour le phage 2972Δ41 (figures 3.4 et 3.5).

Figure 3.4 : Le ratio de la production de BIM avec deux phages mutants (2972Δ22 et CEM22) par rapport au

phage 2972 sauvage en fonction de deux souches testées (DGCC7710 et BIM AR1). Les colonnes en bleu

représentent les données générées à partir de la souche DGCC7710 et les colonnes en rouge représentent les

données générées à partir de la souche AR1. La ligne noire représente le ratio de 1, ce qui correspond au ratio

de BIM produit par le phage 2972.

Phage Souche

DGCC7710 BIM AR1

2972 90,7 ± 20,2 -

2972Δ22 61,3 ± 24,5 72,2 ± 17,6

CEM22 11,8 ± 7,7 120,3 ± 37,7

63

Tableau 3.10 : Capacité de production de BIM avec la souche DGCC7710 et le BIM A-35 contre les phages

2972, 2972Δ41 et CEM41.

Phage Souche

DGCC7710 BIM A-35

2972 25,3 ± 3,8 -

2972Δ41 28,8 ± 3,5 185,6 ± 16,5

CEM41 45,7 ± 6,8 662,9 ± 29,4

Figure 3.5 : Le ratio de la production de BIM avec deux phages mutants (2972Δ41 et CEM41) selon le phage

2972 sauvage en fonction de deux souches testées (DGCC7710 et BIM A-35). Les colonnes en bleu représentent

les données générées à partir de la souche DGCC7710 et les colonnes en rouge représentent les données

générées à partir de la souche A-35. La ligne noire représente le ratio de 1, ce qui correspond au ratio de BIM

produit par le phage 2972.

64

Figure 3.6 : Dispersion des proto-espaceurs visés sur le génome du phage 2972 par le locus 1 du système CRISPR-Cas de S. thermophilus lors d’une pression

sélective face aux phages ayant diverses mutations dans l’orf22 (A) et l’orf41 (B). Les flèches bleues sont des proto-espaceurs visés suite à la génération de BIM

avec les phages possédant une délétion (2972Δ22 pour A et 2972Δ41 pour B) et les flèches roses sont des proto-espaceurs visés suite à la génération de BIM avec

les phages ne possédant qu’une mutation ponctuelle (CEM22 pour A et CEM41 pour B). L’orientation des flèches indique la position des proto-espaceurs sur les

brins d’ADN. Les flèches pointant vers la droite sont des proto-espaceurs positionnés sur le brin positif et les flèches pointant vers la gauche sont des proto-espaceurs

positionnés sur le brin négatif.

A

B

65

La figure 3.6 permet une observation du motif d’acquisition des espaceurs suite à l’infection par

différents phages pour leur BIM associé. La majorité des proto-espaceurs visés se situent dans la

région codant pour des protéines non structurales. Les espaceurs acquis ne visent pas nécessairement

une région proche des mutations induites (flèches en noir sur le génome du phage 2972) comme les

flèches bleues et roses ne sont pas agglomérées autour de ces gènes. Toutefois, les proto-espaceurs

sont majoritairement orientés dans le même sens que le proto-espaceur muté, soit positionnés sur le

brin positif.

Pour les proto-espaceurs visés suite à l’infection par les phages 2972Δ41 et CEM41, une proportion

de respectivement 72,5 % (37/51) et 77,5% (31/40) des séquences sont positionnées sur le brin positif,

puis pour les proto-espaceurs visés suite à l’infection par les phages 2972Δ22 et CEM22, une

proportion de respectivement 84,6% (22/26) et 80% (36/45) des séquences sont positionnées sur le

brin positif.


3.3.1 Prédictions bio-informatiques

Les modèles de structure des protéines déterminées par les outils bio-informatiques peuvent donner

une piste quant à la vraie conformation de celles-ci. Elles peuvent identifier des domaines possibles,

les sites de liaison à certains ligands et aider à prédire la solubilité des protéines. En général, la

première étape pour prédire la structure d’une protéine consiste à chercher si d’autres protéines ont

une similarité de séquence dans les bases de données pour pouvoir élaborer une structure à partir d’un

modèle d’homologie (173). Malheureusement, toutes les protéines inconnues du phage 2972

sélectionnées semble avoir une similitude de séquence avec d’autres protéines de phages infectant le

genre Streptococcus qui n’ont pas de fonctions assignées et qui n’ont pas de structures déterminées

(données non présentées), d’où l’importance de l’étude. Donc, les prédictions bio-informatiques

quant à la structure des protéines ORF32, ORF40 et ORF41 ont seulement été déterminées par les

logiciels QUARK ou I-TASSER (figures 3.7, 3.8 et 3.9).

66

Figure 3.7 : Prédiction bio-informatique de la structure secondaire de l’ORF32 réalisée avec le logiciel I-

TASSER (171).

Figure 3.8 : Prédiction bio-informatique de la structure secondaire de l’ORF40 réalisée avec le logiciel

QUARK (171).

67

Figure 3.9 : Prédiction bio-informatique de la structure secondaire de l’ORF41 réalisée avec le logiciel I-

TASSER (171).

Selon la figure 3.7, la structure de l’ORF32 semble composée principalement de deux hélices α reliées

par une boucle et un peu de structure désordonnée. L’ORF40, quant à elle, serait composée de cinq

hélices α et de quelques séquences désordonnées (figure 3.8), puis l’ORF41 prédit une hélice α, deux

feuillets β et un peu de séquences désordonnées.

3.3.2 Dichroïsme circulaire

Les spectres de dichroïsme circulaire peuvent révéler deux caractéristiques des protéines. D’abord, il

est possible d’avoir une estimation de la structure secondaire d’une protéine, puis il est possible

d’évaluer la température de dénaturation de celle-ci. Les deux protéines analysées (ORF32 et ORF40)

semblent posséder plusieurs types de structures secondaires différents et non un seul. La structure est

similaire à 25°C et 42 °C pour les deux protéines analysées, puisque leurs spectres en bleu et en jaune

sont presque identiques.

Pour ce qui est de la température de dénaturation, les longueurs d’onde sélectionnées des figures 3.11

et 3.13, soit de 222 nm et 208 nm (points les plus bas d’un spectre d’hélice α) et 201 nm (point le plus

bas du spectre de l’ORF32), augmentent légèrement pour l’ORF32 et sont stables jusqu’à 80 °C pour

68

l’ORF40. Les spectres complets enregistrés à 80 °C (en vert, figures 3.10 et 3.13) montrent que la

structure des protéines change un peu par rapport aux autres températures.

Figure 3.10 : Analyse par dichroïsme circulaire de la protéine ORF32 selon trois températures différentes. Le

spectre en bleu représente les données prises à 25 °C, le spectre en jaune représente les données prises à 42 °C

et le spectre en vert représente les données prises à 80 °C.

Les tableaux 3.11 et 3.12 affichent le contenu de chaque type de structure secondaire en pourcentage

pour les deux protéines à l’étude à 25 °C. Le pourcentage d’hélices α pour l’ORF32 varie entre 7,0%

et 10,8%, celui des feuillets β varie entre 18,3% et 34,0%, la proportion en boucle se situe entre 13,1%

et 25,8% et le pourcentage de structure désordonnée varie entre 34,5% et 57,1% (tableau 3.11). Le

tableau 3.12 montre un pourcentage en hélices α, entre 2,2% et 16,7%, un pourcentage de feuillets β

entre 21,7% et 40,1%, la proportion de boucles se situe entre 9,6% et 21,8% et la proportion de

structures désordonnées est de 15,3% à 49,3% en fonction de la méthode de calcul.

69

Figure 3.11 : Courbe de dénaturation en mesurant l’absorbance de dichroïsme circulaire (CD) en millidegrés

selon la température pour des longueurs d’onde de 222 nm (en rouge), 208 nm (en mauve) et 201 nm (en gris)

de la protéine ORF32.

Figure 3.12 : Analyse par dichroïsme circulaire de la protéine ORF40 selon de trois températures différentes.

Le spectre en bleu représente les données prises à 25 °C, le spectre en jaune représente les données prises à 42

°C et le spectre en vert représente les données prises à 80 °C.

.

70

Figure 3.13 : Courbe de dénaturation en mesurant l’absorbance de dichroïsme circulaire (CD) en millidegrés

selon la température pour des longueurs d’onde de 222 nm (en rouge), 208 nm (en mauve) et 201 nm (en gris)

de la protéine ORF40.

Tableau 3.11 : Résultats du calcul des structures secondaires en pourcentage de l’ORF32 à 25 °C selon

différentes bases de données et méthodes de calcul.

Base de

données

Méthode

de calcul Pourcentage de structure

Hélice α Feuillet β Boucle Désordonné

SP29 CONTIN 8,5 32,0 21,0 38,4

SP22X CDSSTR 8,5 18,3 16,0 44,7

CONTIN 9,4 18,8 15,5 44,7

SP37 CONTIN 10,8 29,3 22,9 37,0

SP37A CONTIN 10,2 19,7 13,1 44,6

SP43 CONTIN 9,1 32,2 23,1 35,6

SPD42 CONTIN 7,0 21,7 14,2 57,1

SPD48 CONTIN 7,0 22,9 14,1 56,0

CLSTR CDSSTR 8,4 34,0 24,2 34,5

CONTIN 10,7 32,1 22,5 34,6

SMP50 CONTIN 8,8 30,7 25,8 34,7

SMP56 CONTIN 8,6 32,1 23,0 36,3

71

Tableau 3.12 : Résultats du calcul des structures secondaires en pourcentage de l’ORF40 à 25 °C selon

différentes bases de données et méthodes de calcul.

Base de

données

Méthode

de calcul Pourcentage de structure

Hélice α Feuillet β Boucle Désordonné

SP29 CDSSTR 9,1 40,1 19,4 30,2

CONTIN 15,2 34,2 21,1 29,4

SP22X SELCON3 2,2 32,4 9,6 49,3

CDSSTR 13,3 25,7 11,8 40,9

SP37 CDSSTR 8,2 37,4 21,7 32,5

CONTIN 16,0 30,1 21,7 32,2

SP43 SELCON3 16,3 32,7 17,7 15,3

CONTIN 15,5 30,8 21,4 32,2

SP37A CONTIN 15,2 21,7 13,0 41,0

SPD42 SELCON3 16,3 32,7 17,7 15,3

CDSSTR 7,9 36,0 15,1 40,6

CONTIN 15,0 29,2 19,9 35,9

SPD48 CDSSTR 7,7 35,2 19,5 37,0

CONTIN 14,7 30,3 19,7 35,4

SMP50 CONTIN 15,9 30,1 21,8 32,0

SMP56 CONTIN 16,7 30,2 20,8 32,3

72

CHAPITRE 4: Discussion


L’édition de génome commence d’abord avec l’obtention d’un BIM, qu’il ait été généré par simple

pression sélective ou qu’il ait été programmé pour l’acquisition d’une séquence précise d’un espaceur.

Selon le tableau 2.3, il y a plusieurs possibilités d’acquisition d’espaceurs ciblant certains gènes. Le

plasmide programmeur de l’orf22 possède deux PAM qui peuvent être ciblés par le locus CR1 de S.

thermophilus DGCC7710, celui de l’orf27 possède quatre PAM dont un qui est ciblé par le locus CR1

et trois qui sont ciblés par le locus CR3, puis l’orf30 et l’orf40 n’ont qu’un seul PAM ciblé

respectivement par le locus CR3 et le locus CR1. Le tableau 3.1 indique ensuite les espaceurs acquis

suite à la programmation du système CRISPR-Cas, où il est possible d’observer que les BIM purifiés

pour chaque gène ont acquis une des possibilités du plasmide programmeur et non un autre espaceur

ciblé au hasard provenant du génome du phage 2972. Ceci est en accord avec les travaux publiés par

Hynes et al. 2016 (169) où 100% des colonies obtenues avec un plasmide programmeur ont acquis le

bon espaceur pour le locus CR1 et 83,3% pour le locus CR3. Ces résultats permettent donc de montrer

que la programmation du système CRISPR-Cas se fait bien pour les deux loci actifs chez S.

thermophilus, même si le niveau d’activité entre ces deux loci diffère pour cette souche. En effet, le

locus CR1 est responsable de plus de 90% de l’acquisition naturelle chez S. thermophilus DGCC7710

(96). Toutefois, l’utilisation des loci CR1 et CR3 augmente le nombre de possibilités d’acquisition

d’espaceurs à partir du génome du phage 2972, où il y a 233 PAM spécifiques au locus CR1 et 483

PAM spécifiques au locus CR3, pour un total de 716 proto-espaceurs hypothétiques. La

programmation du système CRISPR-Cas présente donc plusieurs avantages par rapport à la méthode

traditionnelle pour obtenir des BIM.

De plus, l’utilisation de la programmation pour l’acquisition d’espaceurs dans chacun des locus

n’affecte pas le niveau de résistance des BIM (tableau 3.2). Par exemple, une valeur d’EOP de 1 x

10-7 signifie qu’environ un phage sur 10 millions est capable d’échapper au système CRISPR-Cas de

la bactérie. L’EOP du phage 2972 sur les BIM générés sur demande se situe entre 10-6 et 10-7, ce qui

est similaire pour les valeurs de résistance des espaceurs acquis dans le locus CR1 et supérieur à celles

retrouvées sur les BIM ayant acquis des espaceurs dans le locus CR3 (96). Donc, forcer le système à

acquérir un espaceur spécifique n’affecte pas son efficacité en soi.

73

Suite à l’édition de génome, plusieurs phages mutants ont été obtenus (tableau 3.3 et figure 3.1).

Certaines délétions ont une fréquence de mutation plus grande que d’autres, ceci peut indiquer

l’importance du gène ou simplement l’efficacité de l’espaceur à cibler et couper le proto-espaceur.

Les gènes pour lesquels un phage mutant a été impossible à obtenir pour l’instant ont été déterminés

comme des gènes essentiels à la réplication du phage. L’obtention de sept phages mutants sur douze

gènes visés démontre que la technique utilisée fonctionne efficacement.


4.2.1 Le phage 2972 et 2972 RBP Courte

Plusieurs méthodes sont nécessaires pour une caractérisation exhaustive des interactions entre un

phage et son hôte. Pour comparer les phages mutants obtenus lors de cette étude, il faut aussi bien

connaître le phage sauvage. Le phage 2972 et le mutant spontané 2972 RBP courte ont été d’abord

analysés. Le phage 2972 possède une taille de la progéniture de 120 ± 22 virions relâchés par cellule

suite à un cycle infectieux et un temps de latence de 53 ± 1,5 minutes pour compléter ce cycle (tableau

3.5). Le pourcentage d’adsorption après 10 minutes est de 96,4 ± 4,3% des particules virales totales.

Les mesures prises en microscopie électronique à transmission révèlent que la queue a une longueur

de 256 ± 8 nm et la capside à une largeur de 69 ± 3 nm. Ces données s’approchent de celles publiées

dans la littérature, où selon Deveau et al. 2008, le phage 2972 possède une taille de la progéniture de

190 ± 33 virions infectieux par cellule suite à un cycle lytique de 40 ± 3 minutes (1). De plus, le

pourcentage d’adsorption expérimental est légèrement plus élevé lors de ces recherches, comparé au

pourcentage d’adsorption après 10 minutes de 89,3 ± 2,6%. Finalement, les mesures prises en

microscopie électronique à transmission sont semblables à celle de Lévesque et al. 2005,où le phage

2972 possède une capside ayant un diamètre de 55 nm et une queue d’une longueur de 260 nm (26).

Puis, la spectrométrie de masse a permis d’identifier et de confirmer le rôle structural de certaines

protéines du phage 2972. Plusieurs protéines qui font normalement partie de la structure du virus

n’ont pas pu être identifiées, par exemple la protéine codée par l’orf17 qui code pour une protéine de

la queue. La spectrométrie de masse est une technique efficace pour identifier les peptides purifiés,

cependant ce système est moins précis lorsque l’on désire détecter les empreintes peptidiques des

mélanges de protéines complexes. De plus, le ratio de chaque protéine est différent dans l’échantillon

et une quantité trop faible d’une certaine protéine par rapport aux autres peut la rendre non détectable

(174). Cependant, deux protéines non détectées lors de cette expérience (ORFS 22 et 23) ont toutefois

74

été détectées par Young et al. 2012 en utilisant un système de séparation par gel 2D couplé au LC-

MS/MS et donc il est fort probable que la technique utilisée et les paramètres de l’expérience soient

sujets à une optimisation (97). Ensuite, certains peptides appartenant à des protéines non structurales

ont aussi été détectés (voir section en doré du tableau 3.8), soit les protéines codées par l’orf24,

l’orf25, l’orf26, l’orf36 et l’orf42. Cinq peptides uniques ont été identifiés pour l’ORF24, ce qui

signifie probablement que cette protéine joue un rôle structural ou elle se retrouve en assez grande

quantité sous forme de contamination après la purification du lysat de phage. C’est le cas pour les

protéines des orfs 25 et 26 qui codent pour la holine et l’endolysine respectivement, les deux protéines

majeures du complexe responsable de la lyse bactérienne. Comme le rôle de ces protéines est connu

et qu’il est fort peu probable qu’elles soient associées à la structure, il est juste de proposer qu’elles

soient des contaminants suite au processus de purification des phages. Finalement, l’ORF36 et

l’ORF42 ont aussi été détectés, toutefois un seul peptide unique a été identifié pour chacune de ces

protéines et donc ils ne sont pas considérés dans l’analyse (il en va de même pour l’ORF25). En effet,

lorsqu’un seul peptide unique est assigné à une protéine il est impossible de confirmer sa présence

dans le mélange protéique.

Pour ce qui est du phage 2972 RBP courte, sa courbe de croissance ressemble à celle du phage 2972,

toutefois, le temps de latence est moins long (figure 3.2). En effet, le temps de latence du phage 2972

RBP courte est de 44 ± 4,7 minutes et celle de la taille de la progéniture est de 123 ± 45 comparé à

un temps de latence de 53 ± 1,5 minutes et à une taille de la progéniture de 120 ± 22 pour le phage

2972 (tableau 3.5). Le phage 2972 RBP Courte libère donc le même nombre de virions que le phage

2972 suite à la lyse cellulaire, seulement il le fait en prenant environ 10 minutes de moins. La protéine

de la RBP joue un rôle dans la première étape de l’infection par un phage, interagissant avec le

récepteur à la surface cellulaire lors de l’adsorption (175). Alors, il se peut qu’une mutation dans ce

gène soit favorable à une meilleure adsorption, donc un test d’adsorption a été effectué. Toutefois,

l’adsorption ne semble pas supérieure à celle du phage sauvage après 10 minutes, ou même après 5

minutes (tableau 3.6). En effet, le phage 2972 RBP Courte a un pourcentage d’adsorption de 92,4 ±

1,4% après 5 minutes et de 89,6 ± 10,4% après 10 minutes et le phage 2972 a un pourcentage

d’adsorption de 96,6 ± 0,9% après 5 minutes et de 96,4 ± 2,4% après 10 minutes. Donc, la version

plus courte de la RBP ne modifie pas l’efficacité d’adsorption du phage. Toutefois, une mutation

spontanée de la RBP pourrait jouer un autre rôle selon Binetti et al. (175). L’adsorption des particules

virales ne nécessite pas d’ajout d’ion calcium, mais cet ion est indispensable au processus d’infection

(175). Donc, il se pourrait que le phage 2972 RBP courte ne nécessite pas d’ajout de CaCl2 pour

75

compléter son cycle infectieux, qui serait ainsi plus rapide et donc aurait un temps de latence plus

court.

4.2.2 Le phage 2972Δ22

Le phage 2972Δ22 a été amplement caractérisé. Premièrement, son cycle lytique a une durée de 37 ±

1,0 minutes pour un nombre plus grand que 63 phages relargués par cellule. Le cycle lytique du phage

2972Δ22 est significativement plus court que celui du phage 2972 sauvage. Suite, au séquençage

Illumina, une version courte de la RBP a été identifiée et comme le cycle lytique du phage 2972 RBP

Courte est aussi plus petit, il est possible que ce soit pour cette raison. Cependant, le temps de latence

est tout de même un peu plus court que celui du phage ayant la même version de la RBP, ainsi il se

peut que l’orf22 influence la durée du cycle lytique. De plus, une taille de la progéniture précise a été

impossible à établir, car le titre du phage augmente de plus en plus après la première lyse au lieu

d’être stable sous forme de plateau, comme il est possible d’observer pour une courbe de croissance

standard (figure 2.3). Ensuite, une deuxième lyse n’est pas observée dans un temps donné de 112

minutes, alors que normalement lorsque la deuxième lyse cellulaire survient à 74 minutes (données

non présentées). Conséquemment, une délétion dans l’orf22 affecte le cycle lytique du phage de façon

considérable.

En fonction de sa position dans le génome, il est possible d’émettre plusieurs hypothèses quant au

rôle de l’orf22. Il se situe directement après l’orf21 qui code pour la protéine formant la plaque basale

et avant le complexe de lyse cellulaire formé par les orfs 25 et 26/29. Les orfs 23 et 24 ont une fonction

inconnue. Donc, il est possible que l’orf22 joue un rôle structural, car les modules des phages ont

tendance à être regroupés dans les génomes, ou alors il peut aussi jouer le rôle de régulateur de la

lyse. Toutefois, il est important aussi de considérer le fait que la fonction de cette protéine pourrait

être totalement nouvelle, car les génomes des phages sont parmi les plus diversifiés (176). Pour savoir

si l’orf22 prend part dans la structure du phage, une observation en microscopie électronique à

transmission a été faite (figure 3.3). L’apparence générale du phage 2972Δ22 et les dimensions

calculées ne semblent pas différentes de celle du phage 2972. Le phage 2972Δ22 possède une capside

d’un diamètre de 63 ± 4 nm et une queue d’une longueur de 266 ± 6 nm, ce qui n’est pas

significativement divergent du phage sauvage qui possède une capside de 69 ± 3 nm et une queue de

256 ± 8 nm. De plus, il n’a pas été détecté en spectrométrie de masse (tableau 3.8), mais si la protéine

est en très faible quantité elle ne sera pas identifiée par cette méthode. Par contre, il se peut qu’elle

affecte la structure sans pour autant en faire partie, comme par exemple les protéines chaperonnes qui

76

aident les autres protéines à maturer jusqu’à leur conformation finale (52). Donc si la structure de la

queue ou de la plaque basale est affectée, il se peut que l’adsorption soit affectée. C’est effectivement

le cas pour le phage 2972Δ22 qui a un pourcentage d’adsorption de 72,6 ± 5,1% après 10 minutes

(tableau 3.6) et donc l’adsorption de ce phage est moins efficace que le phage sauvage qui a un

pourcentage d’adsorption proche de 100%. Toutefois, il ne faut pas oublier que le phage 2972Δ22

possède d’autres mutations dans son génome et que les résultats peuvent être dus à ces mutations.

Finalement, une partie des interactions phage-hôte a été caractérisée par la production de BIM. Le

nombre de BIM produits avec la souche DGCC7710 contre les phages 2972 et 2972Δ22 est assez

similaire, soit respectivement 90,7 ± 20,2 colonies et 61,3 ± 24,5 colonies (tableau 3.9). Ces BIM

sont considérés comme des mutants résistants de première génération. Ceci indique que l’absence de

l’orf22 n’influence pas le nombre de BIM générés, toutefois le CEM22, qui possède une mutation

ponctuelle dans l’orf22 (voir tableau 2.1), semble avoir une production réduite. La mutation

ponctuelle change un acide aminé glutamate pour un aspartate, où les deux molécules sont chargées

négativement et donc la structure de la protéine codée par l’orf22 ne devrait pas être modifiée (4). En

revanche, il est impossible de confirmer cette hypothèse sans avoir la structure des deux protéines

(sauvage et le mutant du CEM22), et ainsi il se peut que ce changement affecte la protéine, par

exemple dans son adsorption, ce qui pourrait expliquer une diminution de la production de BIM, car

moins de phages seraient en contact avec les cellules bactériennes. Cependant, cette diminution n’est

pas observée lorsque l’orf22 est délété. Il se peut donc que ce changement soit dû à un phénomène

différent, comme une mutation compensatoire dans le génome.

Il y a cependant un changement lorsque les BIM sont produits à partir d’un BIM déjà résistant à 2972,

le BIM AR1, pour produire des BIM de deuxième génération. Le phage 2972 n’a pas la capacité de

produire des BIM dans ce contexte, car le système CRISPR-Cas du BIM AR1 reconnaît le phage et

clive son génome, empêchant ainsi le cycle lytique (1). Quant à lui, le phage 2972Δ22, où le proto-

espaceur correspondant à l’espaceur acquis dans le BIM AR1 est absent dû à la délétion dans son

génome, n’est pas reconnu pas le système CRISPR-Cas et il peut être utilisé pour générer des BIM.

Le nombre de BIM produit par le couple 2972Δ22-BIM AR1 est de 72,2 ± 17,6 colonies, ce qui est

très proche du nombre obtenu par le couple 2972Δ22-DGCC7710. Ce résultat est attendu, car les

BIM générés par les deux couples sont des BIM de première génération, comme le BIM AR1 n’est

pas en mesure de se défendre contre le phage 2972Δ22. Le nombre de BIM de deuxième génération

produits par le couple CEM22-BIM AR1 est toutefois intéressant. Environ 120,3 ± 37,7 colonies sont

générées lorsque le phage CEM22 infecte le BIM AR1 à une grande MOI.

77

Ce phénomène est décrit dans la littérature comme étant le priming, ou l’amorçage, du système

CRISPR-Cas. Ceci survient lorsqu’un proto-espaceur correspondant partiellement à un espaceur

contenu dans le locus CRISPR stimule une acquisition plus rapide et efficace d’espaceurs additionnels

(177). Donc, lorsqu’une cellule bactérienne ayant un système CRISPR-Cas actif subit une infection

pour la première fois, le système est décrit comme étant naïf. Cette cellule pourra ensuite acquérir un

espaceur ciblant ce phage, pour devenir résistante. Puis, le phage va muter son proto-espaceur, le plus

souvent par une mutation ponctuelle dans le PAM ou dans la région 3’ du proto-espaceur, pour ne

plus être reconnu lors de l’interférence (80). Lorsque la cellule ayant le nouvel espaceur sera infectée

par le phage muté, ce sera donc un système décrit comme primed, ou amorcé (177). Donc, lorsque le

CEM22 infecte le BIM AR1, il y a une reconnaissance partielle entre l’espaceur et le proto-espaceur,

ce qui active l’acquisition de façon supérieure.

Ce phénomène a majoritairement été observé avec les systèmes CRISPR-Cas de type I, sous-types B,

C, E et F (104, 178–181). Il peut être observé par une augmentation considérable des évènements

d’acquisition entre la première et la deuxième infection. Par exemple, selon Datsenko et al. 2012,

environ 4,3% des colonies résistantes ont acquis un espaceur lors de la première infection et 77% des

colonies résistantes ont acquis un nouvel espaceur lors de la deuxième infection. Ceci représente une

augmentation du nombre d’évènements d’acquisition d’environ 17 fois (104). Selon le graphique de

la figure 3.4 qui montre les ratios des évènements d’acquisitions par rapport au système sauvage, le

nombre d’évènements pour le CEM22 augmente de moins de 1,5 fois par rapport au système naïf,

représenté par la ligne noire à la valeur de 1. Cependant, si le CEM22 produit moins de BIM que le

système sauvage, il est important de comparer la production des BIM de première et de deuxième

génération entre eux. Donc, le CEM22 lorsqu’il infecte DGCC7710, produit environ 11,8 colonies

résistantes et il produit environ 120,3 colonies résistantes lorsqu’il infecte le BIM AR1, ce qui

représente une augmentation d’un peu plus de 10 fois. Cette valeur est assez rapprochée du nombre

retrouvé dans la littérature et donc il est possible que le système CRISPR-Cas de type II-A puisse être

un système capable d’amorçage.

Les évènements d’acquisition d’un système amorcé ne sont toutefois pas aléatoires et il semble y

avoir un motif d’acquisition particulier (182). En effet, les BIM de deuxième génération ont un motif

d’acquisition dépendant de l’orientation de l’espaceur, où la majorité des espaceurs acquis se

retrouvent sur le même brin d’ADN et donc dans la même orientation, à un pourcentage variant entre

64 % et 83 % (104, 178, 179). Certaines recherches ont de plus démontré que les espaceurs acquis

78

étaient regroupés autour de l’espaceur responsable de l’amorçage (180). Selon la figure 3.6-A qui

montre la distribution des proto-espaceurs pour l’orf22, il est possible d’observer qu’effectivement la

majorité des proto-espaceurs visés se retrouvent sur le même brin que le premier proto-espaceur (brin

positif), à un pourcentage de 80% chez le phage CEM22 qui infecte le BIM AR1. De plus, la

distribution des proto-espaceurs légèrement regroupée vers la fin du génome, mais sans aucune

concentration évidente autour de l’espaceur servant à l’amorçage. Par la distribution des proto-

espaceurs majoritairement sur le même brin, il serait possible d’émettre l’hypothèse que le système

CRISPR-Cas de type II-A est un système capable d’amorçage de façon brin-dépendant. Toutefois

selon la figure 3.6-A il ne semble pas avoir de différence entre le système naïf, soit le phage 2972Δ22

infectant le BIM AR1 et le système amorcé, où la majorité des espaceurs sont aussi sur le même brin

à 84,6% et réunis vers la fin du génome. Donc, il se peut que les observations faites pour le système

amorcé soient dues à un biais naturel du système CRISPR-Cas de type II-A et non à sa capacité

d’amorçage. Pour confirmer cette hypothèse, il faudrait donc répéter l’expérience avec un proto-

espaceur situé sur le brin négatif et un proto-espaceur situé au début du génome.

4.2.3 Le phage 2972Δ24

L’orf24 est le seul gène inconnu à l’étude dont la protéine déduite a été détectée par la spectrométrie

de masse avec certitude. Il est donc fort probable qu’elle joue un rôle structural dans le génome du

phage 2972. Tout comme l’orf22, le gène de l’orf24 se situe à la fin du module des gènes codant pour

les différentes protéines de la queue et il se peut que la protéine codée par ce gène soit impliquée dans

le complexe de la plaque basale. Toutefois, il se situe proche du gène de l’endolysine qui est très

souvent détectée dû à sa très grande expression lors de la lyse. L’endolysine se retrouve souvent sous

forme de contaminant et donc il se peut que cette situation s’applique à l’ORF24. Pour déterminer si

2972Δ24 joue un rôle structural, il faudrait l’observer en microscopie électronique et tester

l’adsorption.

4.2.4 Les phages 2972Δ27 et 2972Δ28

Les orfs 27 et 28 sont tous deux des gènes situés sur un intron de groupe I sous-groupe A2 entre

l’orf26 et l’orf29 qui codent pour l’endolysine. Cette protéine fait partie du processus de lyse

bactérienne où elle dégrade le peptidoglycane pour libérer les virions nouvellement formés suite à un

cycle lytique (14).

79

Les introns appartenant au groupe I sont fréquents chez les phages infectant les bactéries à Gram

positif, notamment Lactococcus, Lactobacillus, Staphylococcus et Streptococcus (183, 184). Environ

50% des phages de Streptococcus possèdent un intron de groupe I situé dans le gène de l’endolysine

qui se trouve à avoir plusieurs variations du même intron en fonction du phage (185). Chez le phage

Sfi21, l’intron qui interrompt le gène pour l’endolysine contient trois cadres de lecture ouverts

orientés dans le même sens codant pour trois protéines putatives de 207, 253 et 75 acides aminés. Les

domaines des protéines ORF207 et ORF75, nommées par leur nombre d’acides aminés, ont pu être

déduits par leur homologie de séquence avec le phage Dp-1 (186). L’ORF207 possède un domaine

d’activité catalytique et l’ORF75 possède un domaine de reconnaissance du substrat caractéristique

des endolysines de bactériophages. Cet intron a pu être identifié, car le pourcentage en G+C de

l’orf253 est considérablement plus faible, à 28%, que le reste du génome du phage qui varie entre

41% et 43%. Il a été démontré que le phage 2972, selon Lévesque et al. 2005, possède le même intron

(26). Il est donc intéressant, lors de l’analyse, de remarquer que le pourcentage en contenu G+C de

l’orf28 a une valeur d’exactement 28% (données non présentées). Cependant, le produit de ce gène

dispose d’une longueur de 61 acides aminés et non de 253. Par contre, l’orf253 semble être un hotspot

pour les mutations, car toutes les versions de l’intron possèdent une grande variabilité dans ce gène

et ce à partir du codon 55 et l’orf28 est en tout point identique à l’orf253 jusqu’au codon 55, où

quelques mutations ponctuelles font de l’orf28 du phage 2972 une version courte de l’orf253 du phage

Sfi21 (185).

Finalement, l’ORF253 possède une similitude de séquence avec les endonucléases de type HNH.

Toutefois, les recherches de prédiction de motifs en utilisant l’outil HHPred (187) identifient un

domaine Ecl1 qui est impliqué dans la régulation du cycle de vie chez Saccharomyces cerevisiae à

une probabilité de 94,21%. Une protéine contenant ce domaine, lorsqu’elle est surexprimée,

augmente le temps de vie chez la souche en question et donc cela suggère que l’ORF28 du phage

2972 pourrait jouer un rôle de régulation quelconque (188). Pour ce qui est de l’orf27, l’alignement

de l’outil HHPred l’associe à NucB, qui est une endonucléase de Bacillus licheniformis responsable

de la dégradation du biofilm (189). Cependant, la probabilité de cet alignement est de 65,44% et donc

assez faible. Une piste quant à la fonction de l’ORF27 reste donc inconnue.

4.2.5 Le phage 2972Δ36

Le phage 2972Δ36 n’a pas pu être caractérisé lors de ce projet. L’orf36 fait partie des gènes conservés

parmi les phages infectants S. thermophilus de type pac et la protéine putative que ce gène encode

80

possède un domaine identifié chez plusieurs protéines de phages nommées DUF669.

Malheureusement, l’abréviation DUF tient pour Domain of Unknown Function et donc le domaine

est identifié chez plusieurs protéines sans pour autant en connaître la fonction. Il serait donc

intéressant de trouver la fonction de cette protéine et son rôle dans le cycle infectieux, car ceci

permettrait de trouver la fonction des autres protéines possédant ce domaine.

4.2.6 Le phage 2972Δ41

Plusieurs expériences permettant la caractérisation de la fonction potentielle de l’ORF41 ont été

exécutées lors de ce projet, dont une courbe de croissance, un test d’adsorption et une production de

BIM. Premièrement, la courbe en rose de la figure 3.2 montre un temps de latence semblable aux

phages 2972Δ22 et 2922 RBP Courte, ainsi qu’un plateau obtenu après un cycle lytique un peu plus

bas que le phage sauvage. En effet, le phage 2972Δ41 produit 65 ± 25 virions suite à la lyse cellulaire

qui nécessite un temps de 41 ± 2,8 minutes (tableau 3.5). Ce phage produit environ la moitié moins

de virions que le phage sauvage (120 ± 22 virions), et prend environ 10 minutes de moins pour

relarguer sa progéniture (53 ± 1,5 minutes). Son temps de latence est similaire à celui du phage 2972

RBP courte (44 ± 4,7 minutes) toutefois le phage 2972Δ41 possède une RBP longue et donc la

diminution du temps de latence n’est pas causée par la longueur de sa RBP. Cependant, il est

impossible de confirmer si la délétion dans l’orf41 cause une production moindre de virions, et donc

une lyse plus courte ou si une lyse précoce fait en sorte que la production de virions est diminuée.

Ensuite, il n’est pas probable que l’orf41 soit impliqué dans le processus d’adsorption. Son

pourcentage d’adsorption après 10 minutes est de 99,6 ± 0,5%, ce qui est comparable au pourcentage

d’adsorption après 10 minutes du phage sauvage, qui est de 96,4 ± 2,4% (tableau 3.6). De plus, un

rôle structural probable est à éliminer, car ce gène n’a pas été détecté par spectrométrie de masse.

Finalement, la production de BIM avec le phage 2972Δ41 a été caractérisée pour mesurer l’impact

de la délétion par rapport au phage 2972. Lors de l’infection de la souche DGCC7710, la production

de BIM avec les phages 2972, 2972Δ41 et CEM41 est respectivement de 25,3 ± 3,8, 28,8 ± 3,5 et

45,7 ± 6,8 colonies résistantes, ce qui est assez similaire. La production de BIM avec le CEM41 est

légèrement plus grande que celle du phage 2972 et 2972Δ41. La mutation ponctuelle dans ce gène

change un acide aminé tyrosine pour une asparagine, ainsi un acide aminé aromatique est substitué

pour un acide aminé amide (4). Cependant, les deux molécules sont polaires et donc devraient

accomplir un rôle similaire dans la structure, mais comme c’est le cas pour le CEM22, il est

81

impossible de confirmer cette hypothèse sans avoir la structure. Il se peut donc que la mutation dans

le CEM41 affecte le bon fonctionnement de la réplication et le rende plus vulnérable au système

CRISPR-Cas de la bactérie, produisant ainsi un peu plus de BIM. Lors de l’infection du BIM A-35,

le génome du phage 2972 est ciblé et clivé par le système CRISPR-Cas (1). Il est intéressant que le

phage 2972Δ41 infectant le BIM A-35, puisse générer environ 7 fois plus de BIM que le système

sauvage (figure 3.5). Il est connu que le nombre de BIM est directement relié au nombre de phages

défectueux, ainsi le système CRISPR-Cas est avantagé et les évènements d’acquisition sont plus

fréquents (190). Le phage 2972Δ41 a la capacité de fabriquer environ 65 phages infectieux par cellule

infectée, il se peut donc qu’il produise une plus grande quantité de phages. Cependant, un défaut

engendré par une délétion dans l’orf41 pourrait causer une machinerie de réplication infructueuse, et

ainsi un grand nombre de phages incapables de compléter un cycle lytique pourraient être relâchés

dans l’environnement, ce qui permettrait à plus de cellules d’acquérir un espaceur. Toutefois, si cette

hypothèse s’avérait exacte, ce phénomène serait aussi observé lorsque le phage 2972Δ41 infecte la

souche DGCC7710. Le nombre accru de colonies résistantes générées par ce phage lorsqu’il infecte

le BIM A-35 n’est peut-être pas une propriété du phage, mais du BIM, car comme il a été généré par

pression sélective et non programmé sur demande, ce n’est pas exclu qu’il puisse posséder une autre

mutation dans son génome. La solution serait de faire un BIM sur demande avec le même espaceur

et de voir si le même résultat survient pour confirmer si les résultats proviennent d’une caractéristique

du BIM ou du phage mutant.

Puis, la production de colonies résistantes de deuxième génération par le CEM41 lorsqu’il infecte le

BIM A-35 augmente de 27 fois par rapport au système sauvage, et de 14 fois par rapport à l’infection

de la souche DGCC7710 par le CEM41 selon la figure 3.5. Ceci est peut-être dû à l’amorçage du

système CRISPR-Cas, comme il a été observé pour l’orf22. Cette augmentation est la plus élevée

observée et aucun résultat n’est similaire dans la littérature, où les évènements d’acquisition survenus

grâce à l’amorçage augmentait d’un facteur maximum de 17 (104, 178). De plus, selon la figure 3.6-

B, la majorité des proto-espaceurs acquis par les BIM de deuxième génération suite à une pression

sélective du CEM41, sont situés sur le même brin que l’espaceur amorcé à un pourcentage de 77,5%

et ils sont regroupés vers la fin du génome. Ce regroupement ne peut pas être expliqué par la

distribution naturelle des PAM, car ceux-ci sont répartis assez uniformément à travers le génome du

phage 2972. Toutefois, ils ne sont pas plus concentrés autour de l’orf41. Il est important de noter que

le même motif est observé pour le couple 2972Δ41-BIM A-35 et donc, comme c’est le cas pour les

observations faites en lien avec l’orf22, il se peut que le motif d’acquisition naturel du système

CRISPR-Cas de type II-A induise un biais dans les résultats. En effet, selon les résultats compilés du

82

protocole publié par Hynes et al. 2017, les espaceurs acquis par la souche DGCC7710 pour se

défendre contre le phage 2972 sont la plupart situé sur le brin positif (168). Sur 66 espaceurs analysés,

54 espaceurs sont sur le brin positif, soit 81% (communication personnelle). Ainsi, selon les résultats

de la production de BIM pour les orfs 22 et 41, la hausse des évènements d’acquisition lorsqu’un

espaceur est partiellement complémentaire au génome du phage 2972 est peut-être due à l’amorçage

du système CRISPR-Cas de type II-A, toutefois les motifs d’acquisition observés ne sont

probablement pas attribuables à ce phénomène. L’acquisition des espaceurs sur le brin positif est

plausiblement engendrée par un biais naturel du système CRISPR-Cas présent chez la souche

DGCC7710. Comme cela a été conclu pour l’orf22, il faudra répéter les expériences de production

de BIM avec un espaceur situé sur le brin négatif pour vérifier si l’acquisition est brin-dépendante et

un espaceur situé au début du génome pour vérifier si l’acquisition est regroupée autour de l’espaceur

amorcé.

4.2.7 Le phage 2972Δ43

Une certaine caractérisation a été faite sur le phage 2972Δ43. Selon la courbe en gris de la figure 3.2,

il est possible de constater que la taille de la progéniture est la plus petite des phages analysés. En

effet, le nombre de virions relâchés après un cycle lytique est de 19 ± 6 phages, suite à un temps de

latence de 43,2 ± 2,3 minutes. La délétion dans ce gène impacte donc grandement la production de

phages infectieux. De plus, le temps de latence est plus court et se rapproche de celui des phages

2972Δ41 et 2972RBP courte, pourtant le phage 2972Δ43 possède une version longue de la RBP et donc

cet effet n’est pas dû à la version de la RBP. Ensuite, les phages 2972Δ41 et 2972Δ43 ont un temps

de latence très similaire, mais des tailles de la progéniture distinctes. Il est donc moins probable que

les orfs 41 et 43 jouent un rôle dans la régulation temporelle du cycle lytique, car une infection

écourtée aurait probablement causé le même impact sur la taille de la progéniture. Ces gènes jouent

peut-être un rôle dans la réplication du génome ou la régulation de celui-ci, ce qui pourrait affecter le

nombre de virions infectieux produits et aussi la lyse se ferait plus tôt, car l’assemblage de moins de

virions prend moins de temps. Finalement, l’orf43, conservé parmi les phages de type pac, possède

un domaine de fonction inconnu DUF1372 qui est commun à plusieurs protéines des phages infectant

les streptocoques. La résolution du rôle de cette protéine serait donc d’une grande importance et

aiderait à identifier la fonction des protéines possédant ce domaine.

83


4.3.1 L’ORF32

Les outils bio-informatiques prédisent que la structure de l’ORF32, ayant une longueur de 40 résidus,

serait composée de deux hélices α et d’une faible proportion de structure désordonnée (figure 3.7).

Toutefois, en se fiant au modèle de la figure 2.4, la figure 3.10 du spectre en dichroïsme circulaire de

l’ORF32 montre un spectre se rapprochant d’une structure désordonnée couplé avec des feuillets β.

Il y a une grande proportion de feuillets β entre 18,3 % et 34,0% et de séquences désordonnées entre

34,5% et 57,1%, ce qui représente un gros pourcentage de la protéine par rapport aux hélices α et aux

boucles qui ne représentent respectivement que 7,0 % à 10,8 % et 13,1% à 25,8% (tableau 3.12).

Ensuite, la figure 3.11 montre les trois points sélectionnés pour suivre le maintien de la structure de

la protéine lorsque la température augmente. Les trois courbes semblent stables jusqu’à une

température de 65 °C et il y a une légère augmentation de l’absorbance à partir de cette température

jusqu’à 80 °C. Ceci indique que la protéine commence à perdre son intégrité structurale, cependant

les courbes n’atteignent pas zéro et donc la protéine n’est pas totalement dénaturée. Le spectre

complet enregistré à 80 °C de la figure 3.10 est assez différent de ceux enregistrés à 25 °C et 42°C,

or la protéine commence à perdre sa structure secondaire proche de 80 °C.

Les prédictions bio-informatiques et les données de dichroïsme circulaire ne permettent pas d’obtenir

les mêmes conclusions, néanmoins les données expérimentales sont considérées plus fiables. Il sera

tout de même important de déterminer précisément la structure de l’ORF32.

4.3.2 L’ORF40

La figure 3.8, montrant la structure prédite par les outils bio-informatiques, indique que la séquence

de 83 résidus de l’ORF40 aurait une structure secondaire composée de 5 hélices α et d’une assez

petite séquence désordonnée. La figure 3.12, quant à elle, montre un spectre de dichroïsme circulaire

composé de feuillets β couplés avec des hélices α. Les analyses du tableau 3.12 montrent un

pourcentage assez variable d’hélices α, entre 2,2% et 16,7%. Un haut pourcentage de feuillets β entre

21,7% et 40,1% est présent, la proportion de boucles est un peu moins nombreuse, entre 9,6% et

21,8% et la proportion de structures désordonnées est tout de même moins grande que pour l’ORF32,

soit entre 15,3% et 49,3%. Les feuillets β et la structure désordonnée sont en effet, les structures qui

semblent être les plus présentes dans la structure secondaire de l’ORF40.

84

La figure 3.13, qui mesure le degré de dénaturation de la protéine, fournit des informations

additionnelles sur celle-ci. Les courbes sont stables jusqu’à une température de 80 °C, sauf pour le

point à 201 nm qui semble diminuer légèrement, mais pas de façon significative. Le spectre complet

enregistré à 80 °C, en vert dans la figure 3.13, montre que la structure de l’ORF40 change très peu

par rapport aux autres températures et qu’il conserve tout de même une forme, indiquant que la

structure est encore relativement stable à 80 °C. Tout comme l’ORF32, les prédictions bio-

informatiques et les données provenant des spectres de dichroïsme circulaire ne concordent pas,

cependant les données expérimentales du dichroïsme circulaire sont plus fiables. Donc, l’ORF40

pourrait, en grande partie, se composer d’hélices α et de feuillets β.

4.3.2 L’ORF 41

Selon la figurer 3.9, les outils bio-informatiques prédisent que l’ORF41, composé de 51 résidus, serait

constitué d’une hélice α et de deux feuillets β. Malheureusement, le peptide synthétisé de l’ORF41

n’a pas pu être solubilisé. Sans une solution du peptide, il est impossible de générer des spectres de

dichroïsme circulaire et donc les seules données disponibles sur la structure de l’ORF41 sont celles

des prédictions bio-informatiques.

85

Conclusion et perspectives

Les bactéries et les bactériophages sont au cœur d’une guerre microscopique responsable d’une

coévolution rapide. Les phages surpassent de 10 fois le nombre de bactéries sur la planète. Pourtant,

la grande majorité des protéines qu’ils codent ont une fonction inconnue. Les génomes de phages sont

séparés selon l’expression temporelle des gènes au moment de l’infection (expression précoce,

médiane et tardive). Les gènes tardifs sont souvent bien caractérisés, car ils codent pour des protéines

structurales, plus faciles à étudier, car le phénotype est observable par microscopie électronique.

Toutefois, énormément de gènes précoces et médians codant pour des protéines non structurales n’ont

aucune fonction déterminée, malgré le fait qu’ils sont d’une grande importance pour la réplication

virale et jouent un rôle majeur dans la régulation. L’outil génétique CRISPR-Cas9, qui a révolutionné

le monde de l’édition de génome, permet la modification de ces gènes et ainsi l’étude du phénotype

de phages mutants.

Sur les 14 gènes du phage 2972 qui codent pour des protéines aux fonctions inconnues, nous en avons

sept, ce qui confirme la robustesse de notre approche expérimentale. De ces sept mutants, trois

présentent une difficulté significative au niveau de la réplication virale en conditions de laboratoire.

Lorsque le phage 2972 infecte la souche S. thermophilus DGCC7710, approximativement 120 virions

sont relâchés dans l’environnement pour chaque cellule lysée. Les phages 2972Δ22, 2972Δ41 et

2972Δ43 ont une progéniture diminuée d’au moins la moitié ou plus. De plus, le phage mutant

2972Δ22 possède aussi une capacité d’adsorption à la surface cellulaire de 30% moins efficace.

Plusieurs hypothèses ont été émises quant au rôle que ces protéines peuvent jouer, cependant aucune

fonction n’a encore été déterminée avec certitude. Il est connu que la structure d’une protéine est

fortement liée à sa fonction. Ainsi, des études préliminaires quant à la structure secondaire de

certaines protéines codées par ces gènes ont été entreprises.

En perspective, il est évident que des tests plus approfondis seront nécessaires à chaque gène à l’étude,

en plus de la détermination de la structure secondaire des gènes impossible à muter. Il serait aussi très

intéressant d’étudier les interactions de ces protéines avec les protéines de l’hôte ou du phage. En

somme, les données recueillies permettront une meilleure compréhension des interactions

moléculaires entre les phages et les bactéries, ainsi que l’approfondissement des connaissances des

mécanismes de réplication et d’infection des bactériophages pour éventuellement perfectionner les

méthodes de contrôle appliquées en industrie laitière.

86

BIBLIOGRAPHIE

1. Deveau H, Barrangou R, Garneau JE, Labonté J, Fremaux C, Boyaval P, Romero DA, Horvath

P, Moineau S. 2008. Phage response to CRISPR-encoded resistance in Streptococcus

thermophilus. J Bacteriol 190:1390–1400.

2. Emond E, Moineau S. 2007. Bacteriophages and food fermentations, p. 93–124. In McGath,

S, Van Sideren, D (eds.), Bacteriophage: genetics and molecular biology. Caister Academic

Press, U.K.

3. Rohwer F, Youle M, Maughan H, Hisakawa N. 2014. Life in our phage world. Wholon, San

Diego, CA.

4. Wiley J, Sherwood L, Woolverton C. 2013. Prescott’s Microbiology, 4th ed. McGrawth-Hill.

5. Keen EC. 2015. A century of phage research: bacteriophages and the shaping of modern

biology. Bioessays 37:6–9.

6. Hershey AD. 1952. Inheritance in bacteriophage. Ann New York Acadamy Sci 54:960–962.

7. Cisek AA, Dąbrowska I, Gregorczyk KP, Wyżewski Z. 2017. Phage therapy in bacterial

infections treatment: one hundred years after the discovery of bacteriophages. Curr Microbiol

74:277–283.

8. Ebrahimizadeh, W. Rajabibazl M. 2014. Bacteriophage vehicles for phage display: biology,

mechanism, and application. Curr Microbiol 69:109–120.

9. Bradley DE. 1967. Ultrastructure of bacteriophages and bacteriocins. Bacteriol Rev 31:230–

314.

10. Ackermann HW, Prangishvili D. 2012. Prokaryote viruses studied by electron microscopy.

Arch Virol 157:1843–1849.

11. Lavigne R, Darius P, Summer EJ, Seto D, Mahadevan P, Nilsson AS, Ackermann HW,

Kropinski AM. 2009. Classification of Myoviridae bacteriophages using protein sequence

similarity. BMC Microbiol 9:224.

12. Ackermann H. 2003. Bacteriophage observations and evolution. Res Microbiol 245–251.

13. Ackermann H-W. 2001. Frequency of morphological phage descriptions in the year 2000.

Arch Virol 146:843–857.

14. Kutter E, Raya R, Carlson K. 2005. Molecular mechanisms of phage infection, p. 165–222. In

Kutter, E, Sulakvelidze, A (eds.), Bacteriophages: biology and applications. CRC Press.

15. Rakhuba D, Kolomiets E, Szwajcer Dey E, Novik G. 2010. Bacteriophage receptors,

mechanisms of phage adsorption and penetration into host cell. Pol Journal Microbiol 59:145–

155.

16. Leiman PG, Battisti AJ, Bowman VD, Stummeyer K, Muhlenhoff M, Gerardy-Schahn R,

Scholl D, Molineux IJ. 2007. The structures of bacteriophages K1E and K1-5 explain

processive degradation of polysaccharide capsules and evolution of new host specificities. J

Mol Biol 371:836–849.

17. Labrie SJ, Samson JE, Moineau S. 2010. Bacteriophage resistance mechanisms. Nat Rev

Microbiol 8:317–327.

18. Kostyuchenko VA, Chipman PR, Leiman PG, Arisaka F, Mesyanzhinov V V., Rossmann MG.

2005. The tail structure of bacteriophage T4 and its mechanism of contraction. Nat Struct Mol

Biol 12:810–813.

19. Leiman PG, Shneider MM. 2012. Contractile tail machines of bacteriophages, p. 93–114. In

Rossmann, MG, Rao, VB (eds.), Viral Molecular Machines. Springer, New-York.

20. Davidson AR, Cardarelli L, Pell LG, Radford DR, Maxwell KL. 2012. Long noncontractile

tail machines of bacteriophages, p. 115–142. In Rossmann, MG, Rao, VB (eds.), Viral

Molecular Machines. Springer, New-York.

21. Rossmann MG, Rao VB. 2012. Viral molecular machines, 1st ed. Springer, New-York.

87

22. Bhardwaj A, Olia AS, Cingolani G. 2014. Architechture of viral genome-delivery molecular

machines. Curr Opin Struct Biol 25:1–8.

23. Casjens SR, Molineux IJ. 2012. Short noncontractile tail machines: adsorption and DNA

delivery by Podoviruses, p. 143–180. In Rossmann, MG, Rao, VB (eds.), Viral molecular

machines. Springer, New-York.

24. Weigel C, Seitz H. 2006. Bacteriophage replication modules. FEMS Microbiol Rev 30:321–

381.

25. Dupuis MÈ, Moineau S. 2010. Genome organization and characterization of the virulent

lactococcal phage 1358 and its similarities to Listeria phages. Appl Environ Microbiol

76:1623–1632.

26. Lévesque C, Duplessis M, Labonté J, Labrie S, Fremaux C, Tremblay D, Moineau S. 2005.

Genomic organization and molecular analysis of virulent bacteriophage 2972 infecting an

exopolysaccharide-producing Streptococcus thermophilus strain. Appl Environ Microbiol

71:4057–4068.

27. Rao VB, Feiss M. 2008. The bacteriophage DNA packaging motor. Annu Rev Genet 42:647–

681.

28. Molineux IJ, Panja D. 2013. Popping the cork: Mechanisms of phage genome ejection. Nat

Rev Microbiol 11:194–204.

29. Casjens SR, Gilcrease EB. 2009. Determining DNA packaging strategy by analysis of the

termini of the chromosomes in tailed-bacteriophage virions. Methods Mol Biol 502:91–111.

30. Ramanculov E, Young R. 2001. Genetic analysis of the T4 holin: timing and topology. Gene

265:25–36.

31. Erez Z, Steinberger-Levy I, Shamir M, Doron S, Stokar-Avihail A, Peleg Y, Melamed S,

Leavitt A, Savidor A, Albeck S, Amitai G, Sorek R. 2017. Communication between viruses

guides lysis-lysogeny decisions. Nature 541:488–493.

32. Casjens SR, Hendrix RW. 2015. Bacteriophage lambda: Early pioneer and still relevant.

Virology 479–480:310–330.

33. Harshey RM. 2014. Transposable phage Mu. Microbiol Spectr 2:MDNA3-0007-2014.

34. Howard-Varona C, Hargreaves KR, Abedon ST, Sullivan MB. 2017. Lysogeny in nature:

mechanisms, impact and ecology of temperate phages. ISME J 11:1511–1520.

35. Quiberoni A, Moineau S, Rousseau GM, Reinheimer J, Ackermann HW. 2010. Streptococcus

thermophilus bacteriophages. Int Dairy J 20:657–664.

36. Marcó MB, Moineau S, Quiberoni A. 2012. Bacteriophages and dairy fermentations.

Bacteriophage 2:149–158.

37. Quiberoni A, Tremblay D, Ackermann H-W, Moineau S, Reinheimer JA. 2006. Diversity of

Streptococcus thermophilus phages in a large-production cheese factory in Argentina. J Dairy

Sci 89:3791–3799.

38. Lucchini S, Desiere F, Brüssow H. 1999. Comparative genomics of Streptococcus

thermophilus phage species supports a modular evolution theory. J Virol 73:8647–8656.

39. Le Marrec C, Van Sinderen D, Walsh L, Stanley E, Vlegels E, Moineau S, Heinze P,

Fitzgerald G, Fayard B. 1997. Two groups of bacteriophages infecting Streptococcus

thermophilus can be distinguished on the basis of mode of packaging and genetic determinants

for major structural proteins. Appl Environ Microbiol 63:3246–3253.

40. Fujisawa H, Morita M. 1997. Phage DNA packaging. Genes to Cells 2:537–545.

41. Mills S, Griffin C, O’Sullivan O, Coffey A, McAuliffe OE, Meijer WC, Serrano LM, Ross

RP. 2011. A new phage on the “Mozzarella” block: Bacteriophage 5093 shares a low level of

homology with other Streptococcus thermophilus phages. Int Dairy J 21:963–969.

42. McDonnell B, Mahony J, Hanemaaijer L, Neve H, Noben JP, Lugli GA, Ventura M, Kouwen

TR, van Sinderen D. 2017. Global survey and genome exploration of bacteriophages infecting

the lactic acid bacterium Streptococcus thermophilus. Front Microbiol 8:1754.

43. McDonnell B, Mahony J, Neve H, Hanemaaijer L, Noben J-P, Kouwen T, van Sinderen D.

88

2016. Identification and analysis of a novel group of bacteriophages infecting the lactic acid

bacterium Streptococcus thermophilus. Appl Environ Microbiol 82:5153–5165.

44. Martel B. 2014. CRISPR-Cas : un nouvel outil pour l’étude des génomes de bactériophages.

Université Laval, Québec.

45. Duplessis M, Moineau S. 2001. Identification of a genetic determinant responsible for host

specificity in Streptococcus thermophilus bacteriophages. Mol Microbiol 41:325–336.

46. Duplessis M, Lévesque CM, Moineau S. 2006. Characterization of Streptococcus

thermophilus host range phage mutants. Appl Environ Microbiol 72:3036–3041.

47. Szymczak P, Janzen T, Neves AR, Kot W, Hansen LH, Lametsch R, Neve H, Franz CMAP,

Vogensen FK. 2017. Novel variants of Streptococcus thermophilus bacteriophages are

indicative of genetic recombination among phages from different bacterial species. Appl

Environ Microbiol Microbiol 83:e02748-16.

48. Martel B, Moineau S. 2014. CRISPR-Cas: an efficient tool for genome engineering of virulent

bacteriophages. Nucleic Acids Res 42:9504–9513.

49. Duplessis M, Russell WM, Romero DA, Moineau S. 2005. Global gene expression analysis

of two Streptococcus thermophilus bacteriophages using DNA microarray. Virology 340:192–

208.

50. Lysenko A, Botina S, Ganina V, Sukhodolets V. 2001. DNA relatedness, divergence, and

sibling species of the lactic acid bacterium Streptococcus thermophilus. Microbiology 70:59–

63.

51. Hatmaker EA, Riley LA, O’Dell KB, Papanek B, Graveley BR, Garrett SC, Wei Y, Terns MP,

Guss AM. 2018. Complete genome sequence of industrial dairy Strain Streptococcus

thermophilus DGCC 7710. Genome Announc 6:e01587-17.

52. Snyder L, Peters JE, Hankins TM, Champness W. 2013. Molecular genetics of bacteria, 4th

ed. ASM Press.

53. Halász A. 2009. Lactic acid bacteria, p. 70–82. In Lasztity, R (ed.), Food Quality and

Standards. EOLSS Publications.

54. De Vuyst L, Degeest B. 1999. Heteropolysaccharides from lactic acid bacteria. FEMS

Microbiol Rev 23:153–177.

55. Drider D, Prevost H. 2009. Bactéries lactiques : Physiologie, métabolisme, génomique et

applications industrielles. Economica, Paris.

56. Hassan AN, Frank JF, Schmidt KA, Shalabi SI. 1996. Textural properties of yogurt made with

encapsulated nonropy lactic cultures. J Dairy Sci 79:2098–2103.

57. Broadbent JR, McMahon DJ, Welker DL, Oberg CJ, Moineau S. 2003. Biochemistry,

genetics, and applications of exopolysaccharide production in Streptococcus thermophilus: a

review. J Dairy Sci 86:407–423.

58. Cui Y, Hu T, Qu X, Zhang L, Ding Z, Dong A. 2015. Plasmids from food lactic acid bacteria:

Diversity, similarity, and new developments. Int J Mol Sci 16:13172–13202.

59. Xiao J, Zhang Y, Yang Z. 2014. Lactic acid bacteria in health and disease, p. 303–374. In

Zhang, H, Cai, Y (eds.), Lactic Acid Bacteria : Fundamentals and Pratice. Springer.

60. Bergey DH. 2009. Bergey’s Manual of Systematic Bacteriology - Volume 3 : The Firmicutes,

2nd ed. Springer, New-York.

61. Zhihong S, Jie Y, Tong D, Wenyi Z, Heping Z. 2014. Phylogenesis and evolution of lactic

acid bacteria, p. 1–101. In Lactic acid bacteria : Fundamentals and pratice. Springer.

62. Bolotin A, Quinquis B, Renault P, Sorokin A, Ehrlich SD, Kulakauskas S, Lapidus A,

Goltsman E, Mazur M, Pusch GD, Fonstein M, Overbeek R, Kyprides N, Purnelle B, Prozzi

D, Ngui K, Masuy D, Hancy F, Burteau S, Boutry M, Delcour J, Goffeau A, Hols P. 2004.

Complete sequence and comparative genome analysis of the dairy bacterium Streptococcus

thermophilus. Nat Biotechnol 22:1554–1558.

63. Lourens-Hattingh A, Viljoen BC. 2001. Yogurt as probiotic carrier food. Int Dairy J 11:1–17.

64. Cerning J. 1995. Production of expolysaccharides by lactic acid bacteria and dairy

89

propionibacteria. Lait 75:463–472.

65. Welman AD, Maddox IS. 2003. Exopolysaccharides from lactic acid bacteria: Perspectives

and challenges. Trends Biotechnol 21:269–274.

66. Duboc P, Mollet B. 2001. Applications of exopolysaccharides in the dairy industry. Int Dairy

J 11:759–768.

67. Gao XY, Zhi XY, Li HW, Klenk HP, Li WJ. 2014. Comparative genomics of the bacterial

genus Streptococcus illuminates evolutionary implications of species groups. PLoS One

9:e101229.

68. Zhang W, Zhang H. 2014. Genomics of lactic acid bateria, p. 205–247. In Zhang, H, Cai, Y

(eds.), Lactic Acid Bacteria : Fundamentals and Pratice. Springer, Nederlands.

69. Moineau S. 1999. Applications of phage resistance in lactic acid bacteria. Antonie Van

Leeuwenhoek 76:377–382.

70. Geagea H, Gomaa AI, Remondetto G, Moineau S, Subirade M. 2015. Investigation of the

protective effect of whey proteins on lactococcal phages during heat treatment at various pH.

Int J Food Microbiol 210:33–41.

71. Campagna C, Villion M, Labrie SJ, Duchaine C, Moineau S. 2014. Inactivation of dairy

bacteriophages by commercial sanitizers and disinfectants. Int J Food Microbiol 171:41–47.

72. Nordstrom K, Forsgren A. 1974. Effect of protein A on adsorption of bacteriophages to

Staphylococcus aureus. J Virol 14:198–202.

73. Westra ER, Swarts DC, Staals RHJ, Jore MM, Brouns SJJ, van der Oost J. 2012. The

CRISPRs, They are A-changin’: How prokaryotes generate adaptive immunity. Annu Rev

Genet 46:311–339.

74. Lu MJ, Henning U. 1994. Superinfection exclusion by T-even-type coliphages. Trends


75. Bondy-Denomy J, Qian J, Westra ER, Buckling A, Guttman DS, Davidson AR, Maxwell KL.

2016. Prophages mediate defense against phage infection through diverse mechanisms. ISME

J 10:2854–2866.

76. Chopin MC, Chopin A, Bidnenko E. 2005. Phage abortive infection in lactococci: Variations

on a theme. Curr Opin Microbiol 8:473–479.

77. Hyman P, Abedon ST. 2010. Bacteriophage host range and bacterial resistance. Adv Appl


78. Reuter M, Mücke M, Krüger D. 2004. Structure and function of type IIE restriction

endonucleases, p. 261–295. In Pingoud, A (ed.), Restriction Endonucleases. Springer.

79. Allison GE, Klaenhammer TR. 1998. Phage resistance mechanisms in lactic acid bacteria. Int

Dairy J 8:207–226.

80. Barrangou R, Fremaux C, Deveau H, Richards M, Boyaval P, Moineau S, Romero D a,

Horvath P. 2007. CRISPR provides aquired resistance against viruses in prokaryotes. Science

(80- ) 315:1709–1712.

81. Bolotin A, Quinquis B, Sorokin A, Dusko Ehrlich S. 2005. Clustered regularly interspaced

short palindrome repeats (CRISPRs) have spacers of extrachromosomal origin. Microbiology

151:2551–2561.

82. Mojica FJM, Díez-Villaseñor C, García-Martínez J, Soria E. 2005. Intervening sequences of

regularly spaced prokaryotic repeats derive from foreign genetic elements. J Mol Evol

60:174–182.

83. Marraffini LA, Sontheimer EJ. 2008. CRISPR interference limits horizontal gene transfer in

staphylococci by targeting DNA. Science 322:1843–1845.

84. Ishino Y, Shinagawa H, Makino K, Amemura M, Nakata A. 1987. Nucleotide sequence of the

iap gene, responsible for alkaline phosphatase isozyme conversion in Escherichia coli, and

identification of the gene product. J Bacteriol 169:5429–5433.

85. Horvath P, Barrangou R. 2010. CRISPR/Cas, the immune system of bacteria and archaea.

Science 327:167–170.

90

86. Jansen R, Embden J, Gaastra W, Schouls L. 2002. Identification of genes that are associated

with DNA repeats in prokaryotes. Mol Microbiol 43:1565–1575.

87. Hille F, Richter H, Wong SP, Bratovič M, Ressel S, Charpentier E. 2018. The Biology of

CRISPR-Cas: backward and forward. Cell 172:1239–1259.

88. Garneau JE, Dupuis ME, Villion M, Romero DA, Barrangou R, Boyaval P, Fremaux C,

Horvath P, Magadan AH, Moineau S. 2010. The CRISPR/Cas bacterial immune system

cleaves bacteriophage and plasmid DNA. Nature 468:67–71.

89. Makarova KS, Wolf YI, Alkhnbashi OS, Costa F, Shah SA, Saunders SJ, Barrangou R, Brouns

SJ, Charpentier E, Haft DH, Horvath P, Moineau S, Mojica FJM, Terns RM, Terns MP, White

MF, Yakunin AF, Garrett RA, van der Oost J, Backofen R, Koonin E V. 2015. An updated

evolutionary classification of CRISPR–Cas systems. Nat Rev Microbiol 13:722–736.

90. Makarova KS, Haft DH, Barrangou R, Brouns SJJ, Charpentier E, Horvath P, Moineau S,

Mojica FJM, Wolf YI, Yakunin AF, van der Oost J, Koonin E V. 2011. Evolution and

classification of the CRISPR–Cas systems. Nat Rev Microbiol 9:467–477.

91. Koonin E V., Makarova KS, Zhang F. 2017. Diversity, classification and evolution of

CRISPR-Cas systems. Curr Opin Microbiol 37:67–78.

92. Noble C, Olejarz J, Esvelt K, Church G, Nowak M. 2017. Evolutionary dynamics of CRISPR

gene drives. Sci Adv e1601964.

93. Koonin E V., Makarova KS, Zhang F. 2017. Diversity, classification and evolution of

CRISPR-Cas systems. Curr Opin Microbiol 37:67–78.

94. Hao M, Cui Y, Qu X. 2018. Analysis of CRISPR-cas system in Streptococcus thermophilus

and its application. Front Microbiol 9:257.

95. Carte J, Christopher RT, Smith JT, Olson S, Barrangou R, Moineau S, Claiborne VCGI,

Graveley BR, Terns RM, Terns MP. 2014. The three major types of CRISPR-Cas systems

function independently in CRISPR RNA biogenesis in Streptococcus thermophilus. Mol


96. Magadán AH, Dupuis MÈ, Villion M, Moineau S. 2012. Cleavage of phage DNA by the

Streptococcus thermophilus CRISPR3-Cas system. PLoS One 7:e40913.

97. Young JC, Dill BD, Pan C, Hettich RL, Banfield JF, Shah M, Fremaux C, Horvath P,

Barrangou R, Verberkmoes NC. 2012. Phage-induced expression of CRISPR-associated

proteins is revealed by shotgun proteomics in Streptococcus thermophilus. PLoS One

7:e38077.

98. Horvath P, Romero DA, Coûté-Monvoisin AC, Richards M, Deveau H, Moineau S, Boyaval

P, Fremaux C, Barrangou R. 2008. Diversity, activity, and evolution of CRISPR loci in

Streptococcus thermophilus. J Bacteriol 190:1401–1412.

99. van der Oost J, Jore MM, Westra ER, Lundgren M, Brouns SJJ. 2009. CRISPR-based adaptive

and heritable immunity in prokaryotes. Trends Biochem Sci 34:401–407.

100. Barrangou R. 2013. CRISPR-Cas systems and RNA-guided interference. Wiley Interdiscip

Rev RNA 4:267–278.

101. Levy A, Goren MG, Yosef I, Auster O, Manor M, Amitai G, Edgar R, Qimron U, Sorek R.

2015. CRISPR adaptation biases explain preference for acquisition of foreign DNA. Nature

520:505–510.

102. Modell JW, Jiang W, Marraffini LA. 2017. CRISPR-Cas systems exploit viral DNA injection

to establish and maintain adaptive immunity. Nature 544:101–104.

103. Mojica FJM, Díez-Villaseñor C, García-Martínez J, Almendros C. 2009. Short motif

sequences determine the targets of the prokaryotic CRISPR defence system. Microbiology

155:733–740.

104. Datsenko KA, Pougach K, Tikhonov A, Wanner BL, Severinov K, Semenova E. 2012.

Molecular memory of prior infections activates the CRISPR/Cas adaptive bacterial immunity

system. Nat Commun 3:945.

105. Heler R, Samai P, Modell JW, Weiner C, Goldberg GW, Bikard D, Marraffini LA. 2015. Cas9

91

specifies functional viral targets during CRISPR-Cas adaptation. Nature 519:199–202.

106. Nuñez JK, Lee ASY, Engelman A, Doudna J a. 2015. Integrase-mediated spacer acquisition

during CRISPR–Cas adaptive immunity. Nature 519:193–198.

107. McGinn J, Marraffini LA. 2016. CRISPR-Cas systems optimize their immune response by

specifying the site of spacer integration. Mol Cell 64:616–623.

108. Rollie C, Graham S, Rouillon C, White MF. 2018. Prespacer processing and specific

integration in a Type I-A CRISPR system. Nucleic Acids Res 46:1007–1020.

109. Xiao Y, Ng S, Hyun Nam K, Ke A. 2017. How type II CRISPR-Cas establish immunity

through Cas1-Cas2-mediated spacer integration. Nature 550:137–141.

110. Arslan Z, Hermanns V, Wurm R, Wagner R, Pul U. 2014. Detection and characterization of

spacer integration intermediates in type I-E CRISPR-Cas system. Nucleic Acids Res 42:7884–

7893.

111. Sashital DG, Jinek M, Doudna JA. 2011. An RNA-induced conformational change required

for CRISPR RNA cleavage by the endoribonuclease Cse3. Nat Struct Mol Biol 18:680–687.

112. Haurwitz RE, Jinek M, Wiedenheft B, Zhou K, Doudna JA. 2010. Sequence- and structure-

specific RNA processing by a CRISPR endonuclease. Science 329:1355–1358.

113. Gesner EM, Schellenberg MJ, Garside EL, George MM, MacMillan AM. 2011. Recognition

and maturation of effector RNAs in a CRISPR interference pathway. Nat Struct Mol Biol

18:688–692.

114. Sefcikova J, Roth M, Yu G, Li H. 2017. Cas6 processes tight and relaxed repeat RNA via

multiple mechanisms: A hypothesis. BioEssays 39:1700019.

115. Deltcheva E, Chylinski K, Sharma CM, Gonzales K, Chao Y, Pirzada ZA, Eckert MR, Vogel

J, Charpentier E. 2011. CRISPR RNA maturation by trans-encoded small RNA and host factor

RNase III. Nature 471:602–607.

116. Shmakov S, Abudayyeh OO, Makarova KS, Wolf YI, Gootenberg JS, Semenova E, Minakhin

L, Joung J, Konermann S, Severinov K, Zhang F, Koonin E V. 2015. Discovery and functional

characterization of diverse class 2 CRISPR-Cas systems. Mol Cell 60:385–397.

117. Fonfara I, Richter H, Bratovič M, Le Rhun A, Charpentier E. 2016. The CRISPR-associated

DNA-cleaving enzyme Cpf1 also processes precursor CRISPR RNA. Nature 532:517–521.

118. Gasiunas G, Barrangou R, Horvath P, Siksnys V. 2012. Cas9-crRNA ribonucleoprotein

complex mediates specific DNA cleavage for adaptive immunity in bacteria. Proc Natl Acad

Sci 109:E2579–E2586.

119. Wright A V., Doudna JA. 2016. Protecting genome integrity during CRISPR immune

adaptation. Nat Struct Mol Biol 23:876–883.

120. Brouns SJJ, Jore MM, Lundgren M, Westra ER, Slijkhuis RJH, Snijders APL, Dickman MJ,

Makarova KS, Koonin E V., Van der Oost J. 2008. Small CRISPR RNAs guide antiviral

defense in prokaryotes. Science (80- ) 321:960–964.

121. Semenova E, Jore MM, Datsenko KA, Semenova A, Westra ER, Wanner B, van der Oost J,

Brouns SJJ, Severinov K. 2011. Interference by clustered regularly interspaced short

palindromic repeat (CRISPR) RNA is governed by a seed sequence. Proc Natl Acad Sci

108:10098–10103.

122. Xiao Y, Luo M, Hayes RP, Kim J, Ng S, Ding F, Liao M, Ke A. 2017. Structure basis for

directional R-loop formation and substrate handover mechanisms in type I CRISPR-Cas

system. Cell 170:48–60.e11.

123. Redding S, Sternberg SH, Marshall M, Gibb B, Bhat P, Guegler CK, Wiedenheft B, Doudna

JA, Greene EC. 2015. Surveillance and processing of foreign DNA by the Escherichia coli

CRISPR-Cas System. Cell 163:854–865.

124. Taylor DW, Zhu Y, Staals RHJ, Kornfeld JE, Shinkai A, van der Oost J, Nogales E, Doudna

JA. 2015. Structures of the CRISPR-Cmr complex reveal mode of RNA target positioning.

Science 348:581 LP-585.

125. Jinek M, Jiang F, Taylor DW, Sternberg SH, Kaya E, Ma E, Anders C, Hauer M, Zhou K, Lin

92

S, Kaplan M, Iavarone AT, Charpentier E, Nogales E, Doudna JA. 2014. Structures of Cas9

endonucleases reveal RNA-mediated conformational activation. Science 343:1247997.

126. Sternberg SH, Redding S, Jinek M, Greene EC, Doudna JA. 2014. DNA interrogation by the

CRISPR RNA-guided endonuclease Cas9. Nature 507:62–67.

127. Nishimasu H, Ran FA, Hsu PD, Konermann S, Shehata SI, Dohmae N, Ishitani R, Zhang F,

Nureki O. 2014. Crystal structure of Cas9 in complex with guide RNA and target DNA. Cell

156:935–949.

128. Jiang F, Zhou K, Ma L, Gressel S, Doudna JA. 2015. A Cas9-guide RNA complex

preorganized for target DNA recognition. Science 348:1477–1481.

129. East-Seletsky A, O’Connell MR, Burstein D, Knott GJ, Doudna JA. 2017. RNA targeting by

functionally orthogonal yype VI-A CRISPR-Cas enzymes. Mol Cell 66:373–383.e3.

130. Abudayyeh OO, Gootenberg JS, Konermann S, Joung J, Slaymaker IM, Cox DBT, Shmakov

S, Makarova KS, Semenova E, Minakhin L, Severinov K, Regev A, Lander ES, Koonin E V,

Zhang F. 2016. C2c2 is a single-component programmable RNA-guided RNA-targeting

CRISPR effector. Science 353:aaf5573.

131. Liu L, Li X, Ma J, Li Z, You L, Wang J, Wang M, Zhang X, Wang Y. 2017. The Molecular

architecture for RNA-guided RNA leavage by Cas13a. Cell 170:714–726.e10.

132. Hsu PD, Lander ES, Zhang F. 2014. Development and applications of CRISPR-Cas9 for

genome engineering. Cell 157:1262–1278.

133. Jiang W, Bikard D, Cox D, Zhang F, Marraffini LA. 2013. CRISPR-assisted editing of

bacterial genomes. Nat Biotechnol 31:233–239.

134. Cong L, Ran FA, Cox D, Lin S, Barretto R, Habib N, Hsu PD, Wu X, Jiang W, Marraffini

LA, Zhang F. 2013. Multiplex genome engineering using CRISPR/Cas systems. Science

339:819–823.

135. Zaidi SS-A, Tashkandi M, Mansoor S, Mahfouz MM. 2016. Engineering plant immunity:

using CRISPR/Cas9 to generate virus resistance. Front Plant Sci 7:1673.

136. Jiang W, Bikard D, Cox D, Zhang F, Marraffini L a. 2013. RNA-guided editing of bacterial

genomes using CRISPR-Cas systems. Nat Biotechnol 31:233–239.

137. DiCarlo JE, Norville JE, Mali P, Rios X, Aach J, Church GM. 2013. Genome engineering in

Saccharomyces cerevisiae using CRISPR-Cas systems. Nucleic Acids Res 41:4336–4343.

138. Cho SW, Kim S, Kim JM, Kim J-S. 2013. Targeted genome engineering in human cells with

the Cas9 RNA-guided endonuclease. Nat Biotechnol 31:230–232.

139. Rouet P, Smih F, Jasin M. 1994. Introduction of double-strand breaks into the genome of

mouse cells by expression of a rare-cutting endonuclease. Mol Cell Biol 14:8096–8106.

140. Rouet P, Smih F, Jasin M. 1994. Expression of a site-specific endonuclease stimulates

homologous recombination in mammalian cells. Proc Natl Acad Sci U S A 91:6064–6068.

141. Porteus M. 2016. Genome editing: a new approach to human therapeutics. Annu Rev

Pharmacol Toxicol 56:163–190.

142. Wang H, La Russa M, Qi LS. 2016. CRISPR/Cas9 in genome editing and beyond. Annu Rev

Biochem 85:227–264.

143. Silva G, Poirot L, Galetto R, Smith J, Montoya G, Duchateau P, Pâques F. 2011.

Meganucleases and other tools for targeted genome engineering: perspectives and challenges

for gene therapy. Curr Gene Ther 11:11–27.

144. Gaj T, Gersbach CA, Barbas CF. 2013. ZFN, TALEN, and CRISPR/Cas-based methods for

genome engineering. Trends Biotechnol 31:397–405.

145. K. J, Fonfara I, Hauer M, Doudna JA, Charpentier E, Chylinski M. 2012. A programmable

dual-RNA-guided DNA endonuclease in adapative bacterial immunity. Science 337:816–821.

146. Hilton IB, D’Ippolito AM, Vockley CM, Thakore PI, Crawford GE, Reddy TE, Gersbach CA.

2015. Epigenome editing by a CRISPR-Cas9-based acetyltransferase activates genes from

promoters and enhancers. Nat Biotechnol 33:510–517.

147. Lo A, Qi L. 2017. Genetic and epigenetic control of gene expression by CRISPR–Cas systems.

93

F1000 Res 6:F1000 Faculty Rev-747.

148. Qi LS, Larson MH, Gilbert LA, Doudna JA, Weissman JS, Arkin AP, Lim WA. 2013.

Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene

expression. Cell 152:1173–1183.

149. Knight SC, Xie L, Deng W, Guglielmi B, Witkowsky LB, Bosanac L, Zhang ET, El Beheiry

M, Masson J-B, Dahan M, Liu Z, Doudna JA, Tjian R. 2015. Dynamics of CRISPR-Cas9

genome interrogation in living cells. Science 350:823–826.

150. Court D, Sawitzke J, Thomason L. 2002. Genetic engineering using homologous

recombination. Annu Rev Genet 36:361–388.

151. Fonfara I, Le Rhun A, Chylinski K, Makarova KS, Lecrivain A-L, Bzdrenga J, Koonin E V,

Charpentier E. 2014. Phylogeny of Cas9 determines functional exchangeability of dual-RNA

and Cas9 among orthologous type II CRISPR-Cas systems. Nucleic Acids Res 42:2577–2590.

152. Doudna JA, Charpentier E. 2014. The new frontier of genome engineering with CRISPR-

Cas9. Science 346:1258096.

153. Terao M, Tamano M, Hara S, Kato T, Kinoshita M, Takada S. 2016. Utilization of the

CRISPR/Cas9 system for the efficient production of mutant mice using crRNA/tracrRNA with

Cas9 nickase and FokI-dCas9. Exp Anim 65:275–283.

154. Ran FA, Hsu PD, Lin CY, Gootenberg JS, Konermann S, Trevino AE, Scott DA, Inoue A,

Matoba S, Zhang Y, Zhang F. 2013. Double nicking by RNA-guided CRISPR cas9 for

enhanced genome editing specificity. Cell 154:1380–1389.

155. Shen B, Zhang W, Zhang J, Zhou J, Wang J, Chen L, Wang L, Hodgkins A, Iyer V, Huang

X, Skarnes WC. 2014. Efficient genome modification by CRISPR-Cas9 nickase with minimal

off-target effects. Nat Methods 11:399–402.

156. Hao N, Shearwin KE, Dodd IB. 2017. Programmable DNA looping using engineered bivalent

dCas9 complexes. Nat Commun 8:1628.

157. Gilbert LA, Larson MH, Morsut L, Liu Z, Brar GA, Torres SE, Stern-Ginossar N, Brandman

O, Whitehead EH, Doudna JA, Lim WA, Weissman JS, Qi LS. 2013. CRISPR-mediated

modular RNA-guided regulation of transcription in eukaryotes. Cell 154:442–451.

158. Chen B, Gilbert LA, Cimini BA, Schnitzbauer J, Zhang W, Li G-W, Park J, Blackburn EH,

Weissman JS, Qi LS, Huang B. 2013. Dynamic imaging of genomic loci in living human cells

by an optimized CRISPR/Cas system. Cell 155:1479–1491.

159. Tanenbaum ME, Gilbert LA, Qi LS, Weissman JS, Vale RD. 2014. A protein-tagging system

for signal amplification in gene expression and fluorescence imaging. Cell 159:635–646.

160. Anton T, Bultmann S, Leonhardt H, Markaki Y. 2014. Visualization of specific DNA

sequences in living mouse embryonic stem cells with a programmable fluorescent

CRISPR/Cas system. Nucleus 5:163–172.

161. Nishimasu H, Cong L, Yan WX, Ran FA, Zetsche B, Li Y, Kurabayashi A, Ishitani R, Zhang

F, Nureki O. 2015. Crystal structure of Staphylococcus aureus Cas9. Cell 162:1113–1126.

162. Ran FA, Cong L, Yan WX, Scott DA, Gootenberg JS, Kriz AJ, Zetsche B, Shalem O, Wu X,

Makarova KS, Koonin E V., Sharp PA, Zhang F. 2015. In vivo genome editing using

Staphylococcus aureus Cas9. Nature 520:186–191.

163. Esvelt KM, Mali P, Braff JL, Moosburner M, Yaung SJ, Church GM. 2013. Orthogonal Cas9

proteins for RNA-guided gene regulation and editing. Nat Methods 10:1116–1121.

164. Vos WM De. 1987. Gene cloning and expression in lactic streptococci. FEMS Microbiol Rev

46:281–295.

165. Terzaghi BE, Sandine WE. 1975. Improved medium for lactic streptococci and their

bacteriophages. Appl Microbiol 29:807–813.

166. Bertani G. 1951. Studies on lysogenesis. I. The mode of phage liberation by lysogenic

Escherichia coli. J Bacteriol 62:293–300.

167. Moineau S, Pandian S, Klaenhammer TR. 1994. Evolution of a lytic bacteriophage via DNA

acquisition from the Lactococcus lactis chromosome. Appl Environ Microbiol 60:1832–1841.

94

168. Hynes AP, Lemay M, Trudel L, Deveau H, Frenette M, Tremblay DM, Moineau S. 2017.

Detecting natural adaptation of the Streptococcus thermophilus CRISPR-Cas systems in

research and classroom settings. Nat Protoc 12:547–565.

169. Hynes AP, Labrie SJ, Moineau S. 2016. Programming native CRISPR arrays for the

generation of targeted immunity. MBio 7:e00202-16.

170. Lemay M-L, Renaud A, Rousseau GM, Moineau S. 2018. Targeted genome editing of virulent

phages using CRISPR-Cas9. Bio-protocol 8:e2674.

171. Boulanger V. 2017. Structure determination of virulent bacteriophage 2972 of Streptococcus

thermophilus proteins. Rapport de stage, Université Laval, Québec.

172. Campbell I, Dwek R. 1984. Biological Spectroscopy : Concepts, Application and Aroblems.

Benjamin-Cummings Publishing Company, California.

173. Edwards YJ, Cottage A. 2003. Bioinformatics methods to predict protein structure and

function. A practical approach. Mol Biotechnol 23:139–166.

174. Baldwin MA. 2004. Protein identification by mass spectrometry. Mol Cell Proteomics 3:1–9.

175. Binetti A, Quiberoni A, Reinheimer J a. 2002. Phage adsorption to Streptococcus

thermophilus. Influence of environmental factors and characterization of cell-receptors. Food

Res Int 35:73–83.

176. Hatfull GF, Hendrix RW. 2011. Bacteriophages and their genomes. Curr Opin Virol 1:298–

303.

177. Amitai G, Sorek R. 2016. CRISPR–Cas adaptation: insights into the mechanism of action. Nat

Rev Microbiol 14:67–76.

178. Fineran PC, Gerritzen MJH, Suárez-Diez M, Künne T, Boekhorst J, van Hijum SAFT, Staals

RHJ, Brouns SJJ. 2014. Degenerate target sites mediate rapid primed CRISPR adaptation.

Proc Natl Acad Sci U S A 111:E1629–E1638.

179. Xue C, Seetharam AS, Musharova O, Severinov K, Brouns SJJ, Severin AJ, Sashital DG.

2015. CRISPR interference and priming varies with individual spacer sequences. Nucleic

Acids Res 43:10831–10847.

180. Richter C, Dy RL, McKenzie RE, Watson BNJ, Taylor C, Chang JT, McNeil MB, Staals RHJ,

Fineran PC. 2014. Priming in the type I-F CRISPR-Cas system triggers strand-independent

spacer acquisition, bi-directionally from the primed protospacer. Nucleic Acids Res 42:8516–

8526.

181. Rao C, Chin D, Ensminger AW. 2017. Priming in a permissive type I-C CRISPR-Cas system

reveals distinct dynamics of spacer acquisition and loss. RNA 23:1525–1538.

182. Semenova E, Savitskaya E, Musharova O, Strotskaya A, Vorontsova D, Datsenko KA,

Logacheva MD, Severinov K. 2016. Highly efficient primed spacer acquisition from targets

destroyed by the Escherichia coli type I-E CRISPR-Cas interfering complex. Proc Natl Acad

Sci 113:7626–7631.

183. Shub DA, Gott JM, Xu MQ, Lang BF, Michel F, Tomaschewski J, Pedersen-Lane J, Belfort

M. 1988. Structural conservation among three homologous introns of bacteriophage T4 and

the group I introns of eukaryotes. Proc Natl Acad Sci 85:1151–1155.

184. Quirk SM, Bell-Pedersen D, Tomaschewski J, Rüger W, Belfort M. 1989. The inconsistent

distribution of introns in the T-even phages indicates recent genetic exchanges. Nucleic Acids

Res 17:301–315.

185. Foley S, Bruttin A, Brüssow H. 2000. Widespread distribution of a group I intron and its three

deletion derivatives in the lysin gene of Streptococcus thermophilus bacteriophages. J Virol

74:611–618.

186. Sheehan MM, Garcia JL, Lopex R, Garcia P. 1997. The lytic enzyme of the pneumococcal

phage Dp-1: a chimeric lysin of intergenic origin. Mol Microbiol 25:717–725.

187. Zimmermann L, Stephens A, Nam S, Rau D, Kübler J, Lozajic M, Gabler F, Söding J, Lupas

A, Alva V. 2018. A completely reimplemented MPI bioinformatics toolkit with a new HHpred

server at its core. J Mol Biol 430:2237–2243.

95

188. Azuma K, Ohtsuka H, Mita S, Murakami H, Aiba H. 2009. Identification and Characterization

of an Ecl1-Family Gene in Saccharomyces cerevisiae. Biosci Biotechnol Biochem 73:2787–

2789.

189. Baslé A, Hewitt L, Koh A, Lamb HK, Thompson P, Burgess JG, Hall MJ, Hawkins AR,

Murray H, Lewis RJ. 2018. Crystal structure of NucB, a biofilm-degrading endonuclease.

Nucleic Acids Res 46:473–484.

190. Hynes AP, Villion M, Moineau S. 2014. Adaptation in bacterial CRISPR-Cas immunity can

be driven by defective phages. Nat Commun 5:4399.

191. Sambrook, J., E. F. Fritsch, and T. Maniatis. 1989. Molecular cloning: a laboratory manual,

2nd ed. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.

Documents

L'utilisation du système CRISPR-Cas9 pour l'étude des