Upload
others
View
3
Download
0
Embed Size (px)
Citation preview
L'utilisation du système CRISPR-Cas9 pour l'étude des protéines non structurales du bactériophage 2972
infectant Streptococcus thermophilus
Mémoire
Ariane Renaud
Maîtrise en microbiologie - avec mémoire
Maître ès sciences (M. Sc.)
Québec, Canada
© Ariane Renaud, 2019
L’utilisation du système CRISPR-Cas9 pour
l’étude des protéines non structurales du
bactériophage 2972 infectant Streptococcus
thermophilus
Mémoire
Ariane Renaud
Sous la direction de :
Sylvain Moineau, directeur de recherche
iii
RÉSUMÉ
Les bactériophages sont des maîtres manipulateurs, prenant le contrôle complet d’une cellule
bactérienne, contournant les systèmes de défense et détournant la machinerie de transcription et de
traduction du génome bactérien pour la réplication virale. Les grandes étapes de la multiplication des
phages sont connues, pourtant les mécanismes intrinsèques de cette prise de contrôle restent un
mystère bien préservé. Malgré la petite taille et la simplicité relative des génomes de phages, seuls
les gènes associés à la structure des virions sont amplement caractérisés. Toutefois, les protéines non
structurales qui sont susceptibles d’être responsables de la prise de contrôle sont rarement étudiées.
C’est effectivement le cas pour le phage modèle 2972, infectant la souche Streptococcus thermophilus
DGCC7710 largement utilisée en industrie laitière. Son génome code pour 44 protéines putatives,
dont 14 protéines sont classées comme étant non structurales et dont aucune fonction n’est encore
associée. Lors de ce projet de maîtrise, le système CRISPR-Cas de type II-A, naturellement présent
chez S. thermophilus, a été utilisé à des fins d’édition du génome de ce phage pour étudier le rôle des
protéines non structurales. Ce système est idéal pour les manipulations génétiques des phages
virulents généralement complexes à modifier. Ainsi, une connaissance approfondie des interactions
entre le phage et son hôte sera un outil indispensable pour développer de meilleures méthodes de
contrôle des phages en industrie laitière.
iv
ABSTRACT
Bacterial viruses are master manipulators of bacterial cells. They are able to take complete control of
a bacterium, bypassing bacterial immune systems, hijacking core transcription and translation
machinery, and typically resulting in lysis of the host. Although the major steps of phage replication
are well understood, very little is known about the mechanisms of the host-cell takeover. Despite
phages having relatively small and ‘simple’ genomes, generally only the structural proteins have been
well characterized. In contrast, non-structural proteins, which include those involved in host cell
takeover, tend to be completely uncharacterized.
This is certainly the case for the model of Streptococcus thermophilus phages, 2972, which infects
the strain DGCC7710 widely used by the dairy industry. Its genome encodes for 44 putative proteins,
14 of which are non-structural and have no known function. In this master thesis, the type II-A
CRISPR-Cas system naturally present in S. thermophilus was used for genome engineering purposes
to investigate the role of non-structural proteins of phage 2972. This natural bacterial immune system
provides an ideal means for genetic manipulation of virulent phages, which are otherwise intractable.
This could lead to potentially valuable discoveries allowing us to further fine-tune the bacteria used
in various biological processes.
v
TABLE DES MATIÈRES
RÉSUMÉ ............................................................................................................................... iii ABSTRACT .......................................................................................................................... iv LISTE DES FIGURES ......................................................................................................... vii
LISTE DES TABLEAUX ................................................................................................... viii REMERCIEMENTS ............................................................................................................ xii Introduction ............................................................................................................................ 1
1.1 Les bactériophages .............................................................................................................. 1 1.1.1 Classification et morphologie ............................................................................................. 1
1.1.2 Mode d’infection ................................................................................................................ 2
1.1.3 Les phages de Streptococcus thermophilus ........................................................................ 7
1.1.4 Le phage 2972 .................................................................................................................... 9
1.2 Les bactéries lactiques ............................................................................................................. 11 1.2.1 Importance industrielle ......................................................................................................... 12
1.2.2 Le genre Streptococcus .................................................................................................... 12
1.2.3 Sensibilité aux phages ...................................................................................................... 14
1.2.4 Les mécanismes de défense .............................................................................................. 15
1.3 Les systèmes CRISPR ............................................................................................................. 17 1.3.1 Composition des systèmes CRISPR-Cas ......................................................................... 18
1.3.2 Classification .................................................................................................................... 19
1.3.3 CRISPR-Cas chez Streptococcus thermophilus ............................................................... 21
1.3.4 Les mécanismes de fonctionnement ................................................................................. 22
1.3.4.1 L’adaptation .................................................................................................................. 23
1.3.4.2 La biogenèse des ARNcr ............................................................................................... 25
1.3.4.3 L’interférence ................................................................................................................ 25
1.4 L’édition de génome................................................................................................................ 27 1.5 Problématique et objectifs de recherche .................................................................................. 30
CHAPITRE 2: Matériel et méthodes .................................................................................... 32 2.1 Souches bactériennes, plasmides et phages utilisés ................................................................ 32
2.1.1 Conditions de culture des bactéries .................................................................................. 34
2.1.2 Propagation, titration et conservation des lysats de phage ............................................... 35
2.1.3 Transformation bactérienne et extraction de plasmides ................................................... 36
2.2 Édition de génome du phage 2972 .......................................................................................... 36 2.2.1 Construction des BIM «sur demande» ............................................................................. 38
2.2.2 Construction des gabarits de recombinaison .................................................................... 40
2.2.3 Génération et purification des phages mutants ................................................................. 45
2.3 Caractérisation des phages mutants ......................................................................................... 46 2.3.1 Courbes de croissance ...................................................................................................... 46
2.3.2 Test d’adsorption .............................................................................................................. 48
2.3.3 Microscopie électronique à transmission ......................................................................... 48
2.3.4 Spectrométrie de masse .................................................................................................... 48
2.3.5 Production de BIM ........................................................................................................... 49
2.4 Caractérisation des protéines sauvages ................................................................................... 50 2.4.1 Choix et synthèse des protéines........................................................................................ 50
vi
2.4.2 Prédictions bio-informatiques .......................................................................................... 50
2.4.3 Dichroïsme circulaire ....................................................................................................... 51
CHAPITRE 3: Résultats ....................................................................................................... 53 3.1 Édition de génome du phage 2972 .......................................................................................... 53
3.1.1 Construction des BIM «sur demande» ............................................................................. 53
3.1.2 Génération et purification des phages mutants ................................................................. 54
3.2 Caractérisation des phages mutants ......................................................................................... 56 3.2.1 Courbes de croissance ...................................................................................................... 56
3.2.2 Test d’adsorption .............................................................................................................. 58
3.2.3 Microscopie électronique à transmission ......................................................................... 59
3.2.4 Spectrométrie de masse .................................................................................................... 60
3.2.5 Production de BIM ........................................................................................................... 61
3.3 Caractérisation des protéines sauvages ................................................................................... 65 3.3.1 Prédictions bio-informatiques .......................................................................................... 65
3.3.2 Dichroïsme circulaire ....................................................................................................... 67
CHAPITRE 4: Discussion .................................................................................................... 72 4.1 Édition de génome du phage 2972 .......................................................................................... 72 4.2 Caractérisation des phages mutants ......................................................................................... 73
4.2.1 Le phage 2972 et 2972 RBP Courte ................................................................................. 73
4.2.2 Le phage 2972Δ22............................................................................................................ 75
4.2.3 Le phage 2972Δ24............................................................................................................ 78
4.2.4 Les phages 2972Δ27 et 2972Δ28 ..................................................................................... 78
4.2.5 Le phage 2972Δ36............................................................................................................ 79
4.2.6 Le phage 2972Δ41............................................................................................................ 80
4.2.7 Le phage 2972Δ43............................................................................................................ 82
4.3 Caractérisation des protéines sauvages ................................................................................... 83 4.3.1 L’ORF32 .......................................................................................................................... 83
4.3.2 L’ORF40 .......................................................................................................................... 83
4.3.2 L’ORF 41 ......................................................................................................................... 84
Conclusion et perspectives ................................................................................................... 85
BIBLIOGRAPHIE ............................................................................................................... 86
vii
LISTE DES FIGURES
Figure 1.1 : Morphologie des trois familles de l'ordre des Caudovirales. .......................................... 2
Figure 1.2 : Le cycle lytique et lysogénique des bactériophages ....................................................... 3
Figure 1.3 : Modèle d’assemblage du bactériophage T4 .................................................................... 6
Figure 1.4 : Arbre phylogénétique montrant la divergence génétique entre le phage 5093 et cinq
phages pour le groupe cos et le groupe pac......................................................................................... 8
Figure 1.5 : Représentation du génome du phage virulent 2972 infectant S. thermophilus ............... 9
Figure 1.6 : Comparaison du génome des phages infectant Streptococcus thermophilus ................ 10
Figure 1.7 : Arbre phylogénétique de 138 espèces du genre Streptococcus .................................... 14
Figure 1.8 : Représentation schématique des différents systèmes de défense bactériens ................ 16
Figure 1.9 : Composition générale des systèmes CRISPR-Cas........................................................ 18
Figure 1.10 : Classification et organisation des types de systèmes CRISPR-Cas et domaines des
protéines effectrices pour les classes 1 et 2 ....................................................................................... 21
Figure 1.11 : Les trois étapes de fonctionnement des systèmes CRISPR-Cas ................................. 23
Figure 1.12 : Applications et outils reliés à l’utilisation de la protéine Cas9 en édition de génome.29
Figure 2.1 : Programmation du système CRISPR-Cas natif………………………………………..39
Figure 2.2 : Schématisation de la méthodologie permettant l’obtention des gabarits de recombinaison
........................................................................................................................................................... 41
Figure 2.3 : Exemple d’un graphique résultant d’une courbe de croissance de phage standard ..... 47
Figure 2.4 : Signaux de dichroïsme circulaire émis par les différents types de structures secondaires
en fonction de la longueur d’onde en nanomètre .............................................................................. 52
Figure 3.1 : Migration des produits PCR des régions délétées et sauvages pour les sept gènes
identifiés comme non essentiels au génome du phage 2972 ............................................................. 55
Figure 3.2 : Courbe de croissance à partir du titre relatif en fonction du temps pour cinq phages .. 57
Figure 3.3 : Photo en microscopie électronique à transmission des phages 2972 et 2972Δ22 ........ 59
Figure 3.4 : Le ratio de la production de BIM avec deux phages mutants (2972Δ22 et CEM22) par
rapport au phage 2972 sauvage en fonction de deux souches testées (DGCC7710 et BIM AR1) .... 62
Figure 3.5 : Le ratio de la production de BIM avec deux phages mutants (2972Δ41 et CEM41) par
rapport au phage 2972 sauvage en fonction de deux souches testées (DGCC7710 et BIM A-35). .. 63
Figure 3.6 : Dispersion des proto-espaceurs visés sur le génome du phage 2972 du système CRISPR-
Cas de S. thermophilus face aux phages ayant diverses mutations dans l’orf22 et l’orf41 ............... 64
Figure 3.7 : Prédiction bio-informatique de la structure secondaire de l’ORF32 réalisée avec le
logiciel I-TASSER ............................................................................................................................ 66
Figure 3.8 : Prédiction bio-informatique de la structure secondaire de l’ORF40 réalisée avec le
logiciel QUARK (171). ..................................................................................................................... 66
Figure 3.9 : Prédiction bio-informatique de la structure secondaire de l’ORF41 réalisée avec le
logiciel I-TASSER (171). .................................................................................................................. 67
Figure 3.10 : Analyse par dichroïsme circulaire de la protéine ORF32 ........................................... 68
Figure 3.11 : Courbe de dénaturation de la protéine ORF32. .......................................................... 69
Figure 3.12 : Analyse par dichroïsme circulaire de la protéine ORF40 ........................................... 69
Figure 3.13 : Courbe de dénaturation de la protéine ORF40. .......................................................... 70
viii
LISTE DES TABLEAUX
Tableau 2.1 : Liste des souches bactériennes, des phages et des plasmides utilisés lors de l’étude et
leurs caractéristiques. ........................................................................................................................ 32
Tableau 2.2 : Les orfs prédits du phage 2972 ainsi que leurs fonctions putatives (48).................... 37
Tableau 2.3 : Espaceurs possibles visés lors de la programmation du système CRISPR-Cas. ........ 38
Tableau 2.4 : Informations sur les constructions génétiques pour chaque gène visé ainsi que sur les
domaines conservés chez les protéines résultantes. .......................................................................... 40
Tableau 2.5 : Oligonucléotides utilisés lors cette de recherche ainsi que leur utilisation. ............... 42
Tableau 3.1 : Espaceurs intégrés dans les locus CRISPR1 ou CRISPR3 de la souche S. thermophilus
DGCC7710 suite à la programmation du système CRISPR-Cas natif………………………………53
Tableau 3.2 : EOP du phage 2972 sur les BIM construits suite à la programmation du système
CRISPR-Cas. ..................................................................................................................................... 53
Tableau 3.3 : Information génétique sur les gènes à l’étude du phage 2972. .................................. 54
Tableau 3.4 : Résultats du séquençage Illumina pour les phages 2972, 2972Δ22, 2972Δ28, 2972Δ41
et 2972Δ43. ....................................................................................................................................... 56
Tableau 3.5 : Données correspondantes aux courbes de croissance des phages 2972, 2972 RBP
courte, 2972Δ22, 2972Δ41 et 2972Δ43. ........................................................................................... 58
Tableau 3.6 : Pourcentage d’adsorption après 10 minutes des phages 2972, 2972Δ22 et 2972Δ41 sur
la souche S. thermophilus DGCC7710. ............................................................................................. 58
Tableau 3.7 : Mesure des dimensions de la queue et de la capside du phage 2972 et du phage
2972Δ22. ........................................................................................................................................... 60
Tableau 3.8 : Les protéines du phage 2972 détectées par spectrométrie de masse. ......................... 60
Tableau 3.9 : Capacité de production de BIM avec la souche DGCC7710 et le BIM AR1 contre les
phages 2972, 2972Δ22 et CEM22. .................................................................................................... 62
Tableau 3.10 : Capacité de production de BIM avec la souche DGCC7710 et le BIM A-35 contre les
phages 2972, 2972Δ41 et CEM41. .................................................................................................... 63
Tableau 3.11 : Résultats du calcul des structures secondaires en pourcentage de l’ORF32 à 25 °C
selon différentes bases de données et méthodes de calcul. ............................................................... 70
Tableau 3.12 : Résultats du calcul des structures secondaires en pourcentage de l’ORF40 à 25 °C
selon différentes bases de données et méthodes de calcul. ............................................................... 71
ix
LISTE DES ABRÉVIATIONS
a.a. Acide aminé
Abi Abortive infection mecanism (Mécanisme d’avortement de l’infection)
ADN Acide Désoxyribonucléique
ADNsb ADN simple brin
ARN Acide ribonucléique
ARNcr ARN CRISPR
ARNpré-cr ARN précusseur
ARNtracr ARN transactivateur des ARNcr
ATP Adénosine Triphosphate
BIM Bacteriophage Insensitive Mutant (Mutant résistant aux bactériophages)
Cas CRISPR associated (associé au système CRISPR)
CEM CRISPR Escaping Mutant (Mutant échappant au système CRISPR)
CHUL Centre Hospitalier de l’Université Laval
CRISPR Clustered Regularly Interspaced Short Palindromic Repeats (Agglomération
de courtes répétitions palindromiques espacées par intervalle régulier)
dCas9 Dead Cas9 (Cas9 catalytiquement inactive)
DO600 Densité optique à une longueur d’onde de 600 nm
DSB Double Stranded Break (Bris double brin)
DUF Domain of Unknown Function (Domaine de function inconnu)
EOP Efficiency of Plaquing (Efficacité d’infection)
EPS Exopolysaccharides
GRAS Generally Recognized as Safe (Reconnue comme sécuritaire)
HIF Host Intergration Factor (Facteur d’intégration de l’hôte)
BL Bactérie lactique
MOI Mutiplicity of Infection (Mutiplicité d’infection)
NAG N-acetylglucosamine
NAM Acide N-acetyl muramique
nCas9 Nickase Cas9 (Cas nickase)
NHEJ Non-Homologous End Joining
nm Nanomètre
x
NmCas9 Cas9 de Neisseria meningitidis
nt. Nucléotide
Orf Open Reading Frame (Cadre de lecture ouvert)
PAM Protospacer Adjacent Motif (Motif adjacent au proto-espaceur)
pb Paire de bases
PCR Polymerase Chain Reaction (Réaction en chaine de la polymérase)
RBP Receptor Binding Protein (Protéine liant le récepteur)
RH Recombinaison homologue
rpm Rotation par minute
Sie Super infection exclusion (Exclusion de super-infection)
SpCas9 Cas9 de Streptococcus pyogenes
TALEN Transcription activator-like effectors nuclease (Nucléase semblable aux
activateurs de la transcription)
TMP Tape Measure Protein (Protéine de mesure étalon)
UFP Unité formatrice de plage de lyse
ZFN Zinc Finger Nuclease (Nucléase doigt de zinc)
xi
« Almost all aspects of life are engineered at a molecular level, and
without understanding molecules we can only have a very sketchy
understanding of life itself »
-Francis Crick, 1988
xii
REMERCIEMENTS
Je tiens à remercier mon directeur de recherche, le professeur Sylvain Moineau, de m’avoir donné
l’occasion de travailler dans un laboratoire d’une grande expertise avec une équipe motivante et
soudée. Mon amour pour les phages a commencé lorsque j’étais laborantine et j’ai pu ensuite
découvrir ce monde merveilleux lors d’un stage de recherche et enfin, une maîtrise. Mes années
passées dans le laboratoire du Prof. Moineau m’ont appris à repousser mes limites et à travailler pour
ce qu’on aime. J’aimerais souligner l’appui des professionnelles de recherche Denise Tremblay et
Geneviève Rousseau qui ont répondu à mes millions de questions chaque jour. Grâce aux membres
de l’équipe, plus particulièrement Moïra, Marie-Laurence, Stéphanie, Rachel, Cécile, Alessandra,
Alexander, Witold, Simon, Alice, Cas et Hany, j’ai trouvé ma deuxième famille et c’est avec cette
famille que j’ai pu avancer dans la science !
Je voudrais aussi remercier les membres de mon comité aviseur. D’abord, Alexander Culley pour les
conseils et le soutien lors de mon projet et Stéphane gagné pour son aide précieuse lorsqu’une
microbiologiste s’aventure dans le monde de la détermination de structure des protéines.
Ensuite, j’aimerais remercier toutes les personnes présentes à mes côtés lors de mes études. Plus
particulièrement mes parents et ma sœur, Gabrielle, pour le soutien moral et l’approvisionnement en
café lors de mon écriture. Merci de m’avoir toujours encouragé dans mes projets.
Finalement, je désire remercier le regroupement PROTEO et le Conseil de recherche en sciences
naturelles et en génie pour le soutien financier, ainsi que le Groupe de recherche en écologie buccale
pour les locaux, les équipements et les évènements.
1
Introduction
1.1 Les bactériophages
Les bactériophages sont les entités biologiques les plus variées et nombreuses sur la planète (1). Il est
estimé que le nombre de phages sur terre se situe entre 1030 et 1032, ce qui est dix fois plus que le
nombre de cellules bactériennes (2). Ils ont un impact écologique immense, notamment sur le
recyclage des éléments nutritifs des cycles biogéochimiques et sur le maintien de la diversité
microbienne (3, 4).
En 100 ans de recherche, les phages ont été impliqués dans de nombreuses de découvertes
biologiques, contribuant à l’avancée significative de la génétique et de la biologie moléculaire (5).
Les phages possèdent énormément de diversité morphologique et génétique, leur conférant une
gamme de caractéristiques très diverse et répandue. L’étude des phages a notamment permis de
découvrir que les attributs héréditaires sont transmis par l’ADN et non les protéines, que les phages
sont responsables de conférer des facteurs de virulence à certaines bactéries pathogènes et que le code
génétique est constitué de codons composés de trois nucléotides (5, 6). Les phages sont aussi au cœur
de plusieurs technologies dont la thérapie par les phages et l’exposition sur phage (phage display) (7,
8). Les phages étant les entités biologiques les plus influentes sur Terre, la recherche qui en découle
joue donc un rôle de haut niveau dans les avancées présentes et futures.
1.1.1 Classification et morphologie
Tous les virus sont construits selon le même principe, où une molécule génétique composée d’acide
désoxyribonucléique (ADN) ou d’acide ribonucléique (ARN), sous forme double ou simple brin, est
protégée par une enveloppe protéique. La forme, la taille et la composition de cette enveloppe varient
grandement et elle est souvent constituée de sous-unités identiques qui respectent des règles
géométriques très strictes (9). Les virus infectant les procaryotes peuvent avoir une morphologie
polyédrique, filamenteuse, pléomorphique ou avec une queue (10). La classification de ces particules
virales se fait principalement par la distinction morphologique de l’enveloppe protéique et par la
différence du contenu génétique selon Bradley en 1967 (9). L’ordre le plus nombreux est celui des
Caudovirales où 96,3 % des phages observés peuvent y être assignés, comprenant trois familles, soit
les Myoviridae, les Siphoviridae et les Podoviridae (figure 1.1), ayant une prévalence de
respectivement 24,8%, 57,3% et 14,2% (10). Tous les phages appartenant à cet ordre possèdent une
2
tête icosaédrique, ou capside, formée de capsomères, une queue et un génome d’ADN double brin
(11). Certains phages parmi ceux-ci peuvent être dotés d’appendices supplémentaires tels des fibres
caudales ou des plaques basales. C’est la morphologie de la queue qui permet de distinguer les
différentes familles. Les phages de la famille des Myoviridae ont une queue gainée qui a la capacité
de se contracter et qui est assez large, contrairement à ceux de la famille des Podoviridae qui ont une
queue très courte et non contractile. Pour ce qui est des phages de la famille des Siphoviridae, ils
possèdent une queue plus longue, non contractile et moins large que celle des Myoviridae (11–13).
Figure 1.1 : Morphologie des trois familles de l'ordre des Caudovirales. Adaptée de Ackermann, 2003 (12).
1.1.2 Mode d’infection
Les bactériophages ont plusieurs modes d’infection. En général, ils peuvent être virulents ou
tempérés, et donc compléter respectivement un cycle lytique ou un cycle lysogénique (figure 1.2). Le
cycle lytique comprend six grandes étapes. D’abord, il y a reconnaissance et adsorption du phage à
la surface cellulaire. Ensuite, le phage injecte son ADN à l’intérieur du cytoplasme de la cellule, où
celui-ci prend contrôle de la bactérie pour la réplication de son propre génome. Puis, il y a
transcription et traduction des protéines du bactériophage. Les protéines structurales serviront à
former les composantes nécessaires à l’assemblage des virions. Les éléments de la capside et de la
queue s’associent indépendamment l’un de l’autre pour permettre à l’ADN d’entrer dans la capside.
Le génome sera empaqueté dans la capside vide, puis les virions complets seront assemblés et libérés
par lyse cellulaire (4). Pour ce qui est des bactériophages tempérés, ils vont s’intégrer au génome
bactérien suite à l’entrée de l’ADN dans la cellule pour entamer un cycle lysogénique. Ils pourront
être transmis aux cellules filles sous forme de prophage, jusqu’à ce qu’un stress provoque son excision
et que le cycle lytique soit engagé (3, 4).
Podoviridae
Siphoviridae Myoviridae
3
L’étape initiale de l’adsorption implique les protéines de la queue du phage (fibres, plaque basale,
etc.) qui reconnaîtront un récepteur à la surface bactérienne. Les récepteurs sont variables en fonction
du type de bactérie (Gram positif ou Gram négatif) et sont généralement des protéines membranaires,
des polysaccharides ou des composantes du peptidoglycane, tels les acides téichoïques et
lipotéichoiques (14, 15). Le type de récepteur reconnu est spécifique à chaque phage, ce qui détermine
son spectre lytique. Certains phages vont aussi posséder des enzymes associées à leur queue pour
dégrader les constituants de la paroi cellulaire et permettre une meilleure adsorption (16).
L’attachement initial à la cellule hôte est réversible jusqu’à ce qu’un changement de conformation
des protéines de reconnaissance rendent le lien irréversible, assurant le début du cycle lytique (14).
Figure 1.2 : Le cycle lytique (à gauche) et lysogénique (embranchement à droite) des bactériophages. Adaptée
de Labrie et al., 2010 (17).
Puis, lorsque cet attachement devient irréversible, le cycle lytique peut alors commencer. La queue
du bactériophage va subir un changement de conformation majeur, lui permettant d’injecter son
génome à travers la membrane bactérienne. Les phages appartenant à des familles différentes n’auront
pas les mêmes mécanismes d’injection de l’ADN dû aux composantes de la queue qui sont distinctes
entre ces familles. Les Myoviridae ont deux composantes majeures qui jouent un rôle important lors
de cette étape, soit le tube interne rigide qui connecte la capside du phage au cytoplasme de la bactérie
4
et la gaine contractile qui entoure le tube interne (18). Lors de l’attachement du phage par la plaque
basale ou les fibres caudales, celle-ci va entamer un changement de conformation qui provoque la
contraction de la gaine de la queue. Ensuite, le tube interne, grâce à sa nature rigide, va percer
l’enveloppe cellulaire pour permettre la translocation de l’ADN et des protéines contenues dans la
capside à l’intérieur de la bactérie (19). Les phages appartenant à la famille des Siphoviridae ont une
stratégie plutôt différente. Les détails du mécanisme de translocation de l’ADN n’ont pas encore été
élucidés, en revanche il a été établi que la protéine majeure étalon (TMP) joue un rôle très important.
Suite à la reconnaissance de la surface bactérienne par les fibres de la queue ou les protéines se liant
aux récepteurs (RBP), un changement de conformation de ce complexe protéique force le contact du
tube interne de la queue sur la paroi cellulaire. La liaison de ces deux structures engendre l’éjection
de l’ADN, qui force la sortie de la TMP, contenue à l’intérieur du tube rigide et crée ainsi un tunnel
pour l’ADN jusqu’au cytoplasme (20). Pour ce qui est des Podoviridae, comme cette famille est
définie par une queue très courte, beaucoup de phages ont des RBP qui possèdent une activité
enzymatique permettant au phage de percer un canal jusqu’à la surface bactérienne (21). Il y a souvent
une digestion du récepteur primaire, fréquemment des polysaccharides, pour générer l’accès au
récepteur secondaire. Suite à la liaison irréversible du phage, les protéines internes de la queue qui
forme la machinerie d’éjection complexe vont former un passage à travers la paroi. L’ADN encapsidé
se trouve dans un état énergétique non favorable, créant une extrême pression qui va donc forcer son
éjection dans le cytoplasme (22, 23).
L’ADN contenu dans la capside se trouve sous forme linéaire, toutefois la majorité des génomes de
phages vont prendre une forme circulaire dès l’entrée dans le cytoplasme. La circularisation assure la
transcription des extrémités du génome, cependant plusieurs stratégies ont été développées par les
phages se répliquant de manière linéaire pour contrer ce problème. Par exemple, le phage T7 possède
des extrémités répétées qui seront régénérées lors de l’empaquetage de l’ADN, ce qui empêche la
perte de matériel génétique (24). Quant à eux, les génomes circulaires ont un type de réplication thêta
(θ) ou en cercle roulant.
Ensuite, les différents modules de l’architecture des génomes sont transcrits et traduits selon leur
expression temporelle, soit les gènes précoces, médians et tardifs, en fonction des étapes du cycle
infectieux (figure 1.2). Les gènes précoces et médians codent normalement pour des protéines ayant
un rôle dans la réplication et la transcription virale, ainsi que la régulation des gènes. Comme
l’assemblage des virions est une des dernières étapes, les gènes tardifs, exprimés tard suite à
l’infection formeront les composantes structurales du virion (25, 26).
5
Puis, les protéines de la capside vont s’assembler pour permettre l’empaquetage de l’ADN, où un
minimum de 60 copies de la protéine majeure de la capside est nécessaire pour former une procapside
vide (figure 1.3). Chaque génome est transloqué dans la capside par une ouverture dans celle-ci,
comme une bobine de fil. Le complexe protéique d’empaquetage, composé de plusieurs protéines
structurales, utilise l’hydrolyse de l’ATP pour accomplir cette tâche (27, 28). Enfin, la terminase,
faisant partie de ce complexe et attachée à l’ouverture de la capside, coupe le génome des phages de
différente façon selon le type de phage. Par exemple, le génome des phages de type cos sera coupé
au site portant le même nom, afin d’obtenir une copie du génome par capside et donc une population
de phages identiques. Pour les phages de type pac, la terminase coupe le génome lorsque la capside
est pleine et donc celle-ci contient généralement 102% à 110% du génome total (29). Lorsque l’ADN
est transloqué, le connecteur et les protéines du col vont venir bloquer l’ouverture de la capside et
permettre l’attachement de la queue préalablement assemblée. Finalement, les protéines accessoires
de la queue, s’il-y-a lieu, vont venir se joindre à l’extrémité de la queue pour former un virion mature
(4).
Finalement, les virions matures sont prêts à être libérés dans l’environnement par lyse cellulaire. Les
phages à ADN double brin ont une lyse précisément programmée qui est possible grâce à deux
principales protéines, la holine et l’endolysine. La holine forme des agrégats résultant en un trou dans
la membrane interne, permettant le passage de l’endolysine et l’accès au peptidoglycane. La lyse est
donc dépendante de l’expression de la holine pour contrôler son temps de latence, soit le temps
nécessaire pour compléter un cycle lytique (14). Trois classes de holines sont connues chez les
phages, mais chaque phage ne possède qu’une holine. Les holines de classe I ont trois domaines
transmembranaires et une courte séquence en C-terminal chargée positivement. Les holines de classe
II n’ont que deux domaines transmembranaires dont les extrémités de la protéine sont
cytoplasmiques. Puis, les holines de classe III possèdent un domaine transmembranaire et un large
segment hydrophile en C-terminal. Quant à elle, l’endolysine est responsable de la dégradation du
peptidoglycane et s’accumule dans le cytoplasme généralement durant la transcription et la traduction
tardive du génome (14, 30)
Pour les endolysines, il existe quatre principales classes qui attaquent différents liens de la couche du
peptidoglycane. Encore une fois, un phage ne peut posséder qu’une seule endolysine. Deux types de
lysozymes, les endo-β-N-acetylglucosaminidases et les N-acetylmuraminidases agissent sur deux
liaisons majeures entre le squelette glucosé du N-acetylglucosamine (NAG) et de l’acide N-acetyl
6
muramique (NAM). Les endopeptidases dégradent les liens interpeptidiques et les amidases, la classe
d’endolysine la plus fréquente, hydrolysent les liaisons amides des oligopeptides (14).
Figure 1.3 : Modèle d’assemblage du bactériophage T4. Tirée de Wiley, 2013 (4).
Les phages tempérés sont particuliers du fait qu’ils peuvent prendre la décision d’entrer soit dans le
cycle lytique ou lysogénique. Il y a l’établissement d’une communication, dirigée entre autres par de
petites protéines ou des déterminants génétiques, entre l’hôte et le phage pour coordonner l’un ou
l’autre des cycles (31). Le cycle lysogénique comporte trois grandes étapes, dont les mécanismes
moléculaires varient beaucoup en fonction de la nature du phage. D’abord, il y a l’intégration du
génome viral, où celui-ci va s’intégrer dans le chromosome bactérien au hasard ou par recombinaison
via des sites spécifiques (32, 33). Certains phages vont rester sous forme circulaire ou linéaire sans
intégration au génome bactérien. Puis, il y a l’étape de persistance où le génome viral, alors nommé
prophage, est répliqué avec celui de la bactérie et donc transmis aux cellules filles. Les prophages
extra-chromosomaux codent alors pour des gènes d’origine plasmidique nécessaires à leur transfert
et à leur maintien. Finalement, il y a l’induction du prophage, où il va s’exciser du génome bactérien
7
et entreprendre le cycle lytique. Cet évènement se fait de façon spontanée à très basse fréquence ou
survient suite à un stress externe chez la bactérie (34).
1.1.3 Les phages de Streptococcus thermophilus
Les phages infectant l’espèce Streptococcus thermophilus appartiennent tous à la famille des
Siphoviridae par la présence de leur longue queue fine et non contractile. La plupart de ces phages
ont été isolés à partir d’échantillons de lait ou de fromage, car ceux-ci sont responsables de certains
problèmes dans l’industrie laitière. En effet, comme les phages attaquent les bactéries présentes dans
les ferments, ils peuvent causer un ralentissement de la fermentation laitière (voir section 1.2.1) (35–
38). La classification de ces phages se fait maintenant en quatre groupes en fonction du nombre de
protéines majeures structurales, de leur mécanisme d’empaquetage de l’ADN et de la séquence
génomique (39). Les phages appartenant au groupe cos ont des extrémités génomiques cohésives (site
cos) qui sont reconnues et clivées lors de l’empaquetage de l’ADN dans la procapside, résultant en
une seule copie du génome par virion (29, 40). Les phages de ce type possèdent deux protéines
majeures structurales tandis que les phages de type pac possèdent trois protéines majeures
structurales. Les phages de type pac ne possèdent pas de sites cos et utilisent un mode d’empaquetage
dit «tête pleine» (headful packaging), où l’ADN est transloqué dans la capside et clivé seulement
lorsque celle-ci est pleine (27, 40).
Un autre groupe de phages, nommé 5093, moins prévalent, infecte aussi l’espèce thermophilus (41).
Il affiche certaines similitudes de séquence avec des phages infectant le genre Streptococcus, mais
appartenant à des espèces non utilisées dans l’industrie laitière (S. pyogenes, S. pneumoniae et S.
gordonii), en plus de son incapacité à être détecté par un PCR Multiplex utilisé pour grouper les
phages appartenant aux groupes précédents (37, 42). Ce groupe est distinct par un gène codant pour
la protéine de liaison au récepteur complètement différent, généralement très conservé parmi les
autres groupes et par une plaque basale contenant 6 fibres d’apparence globulaire suggérant que son
mode d’attachement à la cellule bactérienne est différent (41, 42). D’un point de vue évolutif, ce
groupe est divergent des autres et il a emprunté un chemin phylogénétique tout à fait unique des
phages des groupes cos et pac (figure 4).
8
Figure 1.4 : Arbre phylogénétique montrant la divergence génétique entre le phage 5093 et cinq phages pour
le groupe cos et le groupe pac (41).
Récemment, un nouveau groupe de phages infectant S. thermophilus a été découvert, le groupe 987
(43). Ce groupe, détecté en 2016, est le résultat probable d’un évènement d’échange génétique,
puisqu’il présente plusieurs caractéristiques des phages du groupe P335 infectant Lactococcus lactis.
La morphologie de la queue présente de grandes ressemblances avec ces phages, étant
significativement plus petite, soit environ 135 nm contrairement aux phages typiques de S.
thermophilus qui varie entre 220 et 330 nm (35). De plus, la plaque basale est visible en microscopie
électronique et s’apparente à celles observées chez les phages du groupe P335. Ces traits sont le
produit d’un génome hybride, où les modules codant pour les protéines structurales ont un haut
pourcentage d’identité en acides aminés avec les phages du groupe P335 (plus précisément le phage
TP901-1) et où les modules de réplication du groupe 987 présentent de fortes similarités avec les
autres phages de S. thermophilus. De plus, certains des phages provenant de ce groupe ont la capacité
de s’adsorber à la surface des souches de Streptococcus thermophilus et de Lactococcus lactis (43).
Pour ce qui est de la ressemblance génétique entre les phages infectant S. thermophilus, peu de cadres
de lecture ouverts (orf) peuvent être inclus dans le génome de cœur, soit la portion du génome
partagée entre tous les phages. Selon douze séquences complètes des phages de S. thermophilus des
groupes cos ou pac, il est possible d’identifier 26 orfs conservés parmi les phages de type cos et 24
orfs conservés parmi les phages de type pac, pour seulement 5 orfs tous types confondus (44). Les
gènes généralement conservés dans le génome de cœur font partie du module de la lyse cellulaire
(holine et endolysine) et du module d’empaquetage de l’ADN (35). De plus, les phages de S.
9
thermophilus possèdent un gène codant pour la protéine de liaison au récepteur bien conservé (sauf
pour le groupe 5093 décrit ci-dessus). Il est intéressant de noter qu’une région hautement variable
dans ce gène, nommée VR2, est spécifique à chaque phage et que cette région est le principal
déterminant du spectre lytique (45). Alternativement, il est possible de grouper les phages en fonction
de cette région, cependant cette méthode ne permet pas un classement exhaustif, car il a été suggéré
que VR2 n’est probablement pas le seul déterminant de la reconnaissance bactérienne (42, 45, 46).
Bref, il est clair qu’une grande diversité génétique est présente chez les phages infectant S.
thermophilus. Jusqu’à ce jour, quatre groupes de phages ont été découverts et caractérisés. Cette
disparité est due à beaucoup d’évènements de réarrangement génétique et d’échange de modules,
résultant en une gamme variée de phages pouvant infecter les souches utilisées dans l’industrie laitière
(42, 47).
1.1.4 Le phage 2972
Le phage 2972 est un phage virulent, appartenant au groupe de type pac, qui infecte la souche S.
thermophilus DGCC7710. Ce phage de la famille des Siphoviridae possède une capside de 55 nm et
une queue d’une longueur de 260 nm. Il possède un génome d’ADN double brin de 34 704 paires de
base (pb), un des plus petits chez les phages infectant l’espèce thermophilus et code pour 44 orfs
putatifs de 40 codons et plus ayant tous la même orientation (figure 5) (26).
Figure 1.5 : Représentation du génome du phage virulent 2972 infectant S. thermophilus. Les flèches
représentent des orfs. Les orfs en vert indiquent des gènes exprimés tôt suite à l’infection (0-7 minutes post-
infection), les orfs en bleu indiquent des gènes exprimés au milieu de l’infection (7-22 minutes post-infection)
et les orfs en rouge ou jaune indiquent des gènes exprimés tard suite à l’infection (12-27 minutes post-infection).
Les orfs ayant un contour gras codent pour des protéines aux fonctions inconnues. Les flèches noires
représentent les promoteurs putatifs, inspirée de Martel et Moineau, 2014, Duplessis et al., 2005 et Lévesque et
al., 2005 (26, 48, 49).
10
Son génome a un pourcentage G+C de 40,15%, ce qui est semblable au pourcentage présent dans le
génome de son hôte DGCC7710, qui est de 39% (50, 51). Il est divisé en trois groupes de gènes
déterminés selon le profil d’expression temporelle. Les gènes précoces (de l’orf30 jusqu’à l’orf44 et
l’orf1), en vert, sont exprimés au niveau maximal de 0 à 7 minutes suite à l’infection. Les gènes
médians (de l’orf2 à l’orf12), en bleu, sont exprimés au plus haut niveau de 7 à 22 minutes après le
début du cycle lytique. Puis les gènes tardifs (de l’orf13 à l’orf26), en rouge, sont exprimés
majoritairement de 12 à 27 minutes. De plus, les gènes peuvent aussi être divisés en module de
fonction dans le génome : le module d’encapsidation, la morphogénèse de la capside et de la queue,
le module de lyse et le module de réplication de l’ADN et de régulation de la transcription (48, 49).
Figure 1.6 : Comparaison du génome des phages infectant Streptococcus thermophilus. Les orfs sont
représentés par les flèches. Les flèches de la même couleur et reliées en gris si possible ont 70% ou plus
d’identité en acides aminés entre les protéines déduites. Les couleurs de fond représentent les différents modules
des génomes. Le rouge représente le module de morphologie, le jaune est pour le module de lyse cellulaire et
le bleu regroupe les orfs du module de lysogénie. Finalement, le vert représente le module de réplication du
génome et activation de la transcription. Tirée de Martel et Moineau, 2014 (44).
Le génome du phage 2972possède aussi deux introns. Le premier se situe entre les orfs 3 et 4, a une
longueur de 307 pb et interrompt la grande sous-unité de la terminase. Le deuxième se trouve entre
les orfs 26 et 29, a une longueur de 442 pb et coupe le gène de l’endolysine. Ces introns font partie
11
des introns du groupe I. Ils sont auto-épissable et s’excisent de l’ARNm, donc ils n’empêchent pas
l’expression des gènes dans lesquels ils se trouvent (52). Trois promoteurs putatifs ont été déterminés
selon la séquence consensus en position -35 et -10. Le promoteur P1 se trouve à 358 pb en amont de
l’orf2, le promoteur P2 se situe 30 pb en amont de l’orf31 et le promoteur P3 a été localisé à 166 pb
en amont de l’orf39 (26).
Plusieurs régions du génome du phage 2972 sont conservées parmi les phages infectant S.
thermophilus, dont le module de réplication de l’ADN et les modules codant pour les protéines
structurales (figure 6). Toutefois, l’orf25 codant pour la holine possède un pourcentage d’identité
>50% avec des prophages infectant d’autres espèces appartenant au genre Streptococcus. La
prédiction de la topologie a identifié que cette protéine possèderait trois domaines transmembranaires,
ce qui est caractéristique des holines de classe I. L’orf20 a été identifiée comme codant pour la
protéine structurale la plus divergente parmi celles du protéome. Cette protéine possède plusieurs
motifs collagen-like, ce qui est typique des RBP chez les phages infectant des hôtes ayant un faible
pourcentage G+C. Elle a donc été désignée comme étant la RBP, dû aux caractéristiques énumérées
précédemment et sa position dans le génome (26). La plupart des gènes structuraux ont été identifiés
pour ce phage, principalement par analyses bio-informatiques et SDS-PAGE (tableau 2.2). Toutefois,
une grande partie des protéines codées par les gènes précoces dans le module de réplication du
génome et de régulation de la transcription ont encore une fonction inconnue (48).
1.2 Les bactéries lactiques
Les bactéries lactiques (BL) sont des bactéries à Gram positif et catalase négative. Elles sont
majoritairement retrouvées sous forme de coques ou de bâtonnets, ayant un mode de fermentation
anaérobie facultative (53). Le produit final de la fermentation des sucres se trouve à être en grande
partie l’acide lactique. Les BL incluent parmi leur rang les genres Lactobacillus, Lactococcus,
Leuconostoc, Streptococcus, Oenococcus, Pediococcus et Denococcus (54). Les BL ont un
métabolisme homofermentaire ou hétérofermentaire. Les espèces homofermentaires convertissent les
sucres en acide lactique et les espèces hétérofermentaires ont une production d’acide lactique
accompagnée d’acétate, de CO2 et d’éthanol (55).
Les bactéries lactiques sont des organismes commensaux et leurs habitats sont très diversifiés. Elles
peuvent se retrouver dans la cavité orale, vaginale et la voie gastro-intestinale des humains et des
animaux, ainsi que sur les plantes et les produits de fermentation. Certains de ces genres bactériens
12
sont producteurs d’exopolysaccharides (EPS), un polymère de grande masse moléculaire attaché ou
non à la paroi ou la capsule de la bactérie (56, 57).
Ces bactéries sont connues comme étant un groupe hétérogène possédant une diversité énorme de
plasmides (58). Les plasmides sont des modules autoréplicatifs indépendants du chromosome
bactérien, qui confère souvent un avantage évolutif dans un environnement particulier (4). Plusieurs
fonctions importantes pour les bactéries lactiques sont codées par des gènes retrouvés sur ces éléments
génétiques. Par exemple, ils peuvent porter des gènes codant pour l’hydrolyse de protéines, la
production d’exopolysaccharides, la résistance aux antibiotiques et le métabolisme de certaines
molécules. Les souches de BL qui possèdent un plasmide augmentant l’hydrolyse de la caséine,
permettant l’utilisation du lactose, du galactose, ou de tout autre métabolite qui modifie le goût et la
texture des produits de consommation, ont donc des caractéristiques industrielles intéressantes (58).
1.2.1 Importance industrielle
L’industrie laitière est le principal exploitant des ferments composés de ces bactéries lactiques,
productrices ou non d’exopolysaccharides, pour la production de yogourt, fromage, kéfir et autres
produits d’origine laitière. Toutefois, les bactéries lactiques sont aussi utilisées lors du processus de
production de la choucroute, du pain de seigle, de certains types de saucissons et de beaucoup d’autres
produits de fermentation (53). Les ferments de départ utilisés vont contribuer à la saveur du produit
grâce à la diversité des métabolites secondaires produits.
Les bactéries lactiques sont aussi utilisées sous forme de probiotiques. Les probiotiques sont définis
comme une préparation de microorganismes vivants qui sont destinés à la consommation et qui
lorsqu’ils sont consommés en quantité adéquate procurent des bienfaits sur la santé (59). Plusieurs
études ont montré que le microbiote, soit la communauté de bactéries qui colonise le corps humain,
influence la prévalence de plusieurs maladies tels le diabète, l’obésité et quelques problèmes
inflammatoires des intestins. L’administration de probiotiques promeut donc un microbiote équilibré
pour de meilleurs bénéfices sur la santé globale (59).
1.2.2 Le genre Streptococcus
Les bactéries appartenant au genre Streptococcus ont une morphologie en coques sphériques ou
allongées d’une longueur variant entre 0,8 µm et 1,2 µm, en pairs ou chaînes et non motiles (60).
13
Elles ont une respiration anaérobie facultative et un métabolisme homofermentaire, où l’acide
lactique est le seul produit de la fermentation des sucres. Les besoins nutritifs de ce genre sont assez
complexes et variables selon l’espèce et les souches. De plus, la grande production d’acide lactique
chez ce genre bactérien cause une baisse du pH rapide qui inhibe la croissance bactérienne et c’est
pour cette raison qu’il est important de tamponner le milieu de culture. Beaucoup d’espèces présentes
dans ce genre, telles S. pneumoniae et S. pyogenes, sont connues comme des organismes pathogènes
ayant une grande virulence. Leur température optimale de croissance varie de 37 °C à 42°C (55, 61).
Une classification du genre Streptococcus regroupe les espèces en sept distincts groupes nommés par
l’espèce modèle de chacun (figure 1.7). La classification phylogénétique s’est faite selon l’ARN16S.
S. thermophilus, contenu dans le groupe Salivarius, est une espèce ayant une distance phylogénétique
proche des espèces pathogènes, pourtant elle est la seule à être définie comme un organisme
sécuritaire Generally Recognized As Safe (GRAS), ce qui lui permet d’être utilisée dans l’industrie
alimentaire (62).
Effectivement, les gènes codant pour des déterminants génétiques de la virulence sont absents,
inactifs ou sous forme de pseudogènes chez S. thermophilus. Ceci témoigne de l’évolution de cette
espèce à s’adapter à sa niche écologique, le lait. L’acclimatation de Streptococcus thermophilus s’est
fort probablement faite par une pression sélective du milieu et par échange de gènes horizontaux (61).
Plusieurs séquences d’insertions dans certains génomes de cette espèce ont plus de 90% d’identité
avec d’autres bactéries lactiques, telles Lactobacillus bulgaricus, Lactococcus lactis sous-espèce
cremoris et lactis. Ces microorganismes, dont le métabolisme est optimisé pour la croissance dans le
lait, sont fréquemment utilisés en co-culture lors de la fermentation de produits laitiers et donc cela
suggère que leur proximité physique a favorisé l’échange de gènes (62).
C’est grâce à cette évolution que l’espèce S. thermophilus est la plus utilisée pour les ferments de
yogourt, puisqu’elle procure une texture remarquable ayant de grandes propriétés organoleptiques
(56, 63–65). Ceci est dû en partie à son métabolisme homofermentaire et à sa production unique
d’exopolysaccharides. En effet, cette espèce bactérienne à Gram positif et à faible pourcentage G+C,
permet l’obtention d’un ferment avec une plus grande stabilité et viscosité que les autres genres
bactériens, grâce à la capacité de ses EPS à lier les molécules d’eau (1, 54, 66). Les bactéries lactiques
productrices d’EPS font partie de la plus importante application industrielle et sont utilisées partout
à travers le monde (56). L’utilisation des ferments producteurs d’exopolysaccharides est destinée à
augmenter la qualité et la texture des produits de fermentation sans ajout d’additifs alimentaires.
14
Figure 1.7 : Arbre phylogénétique de 138 espèces du genre Streptococcus. Les espèces sont
regroupées en sept groupes en fonction de l’espèce modèle, Pyogenic, Mitis, Anginosus, Bovis,
Mutans, Salivarius et Inconnu (Unknown) selon les points de couleurs différentes (67).
1.2.3 Sensibilité aux phages
Cette espèce bactérienne, comme tant d’autres, est sensible aux bactériophages qui peuvent affecter
les productions (68). Ceci peut mener à un ralentissement de la fermentation et une perte de la qualité
des produits (69). Les phages se retrouvent naturellement dans le lait et résistent à la pasteurisation,
ils sont donc ubiquitaires dans les usines laitières. De plus, ils ont un temps de latence relativement
court et une taille de la progéniture très grande ce qui leur permet de se reproduire rapidement lors
15
d’une production. Les industries peuvent être impactées par plusieurs facteurs, cependant les phages
sont la source majeure de problèmes d’origine biologique. L’observation d’un haut pH, d’un haut
niveau de lactose résiduel et d’un contenu en acide lactique pauvre lors d’une fermentation sont les
indicateurs d’une infection par les phages. Ils proviennent principalement du lait, mais ils peuvent
être dispersés sous forme d’aérosols par le mouvement du personnel ou des équipements, causant la
contamination des zones à risques (36). Une autre source de contamination importante est le recyclage
des sous-produits de la fermentation, telles les protéines de lactosérum. Les producteurs les utilisent
pour augmenter le rendement fromagé, cependant ces protéines ont un effet protecteur sur les phages
lors du traitement thermique. Le début d’une production est donc contaminé par les sous-produits de
la précédente (70).
Plusieurs mesures pour tenter de contrôler les phages et leur dissémination doivent être mises en place
dans une industrie laitière. Les stratégies de contrôle concernent souvent la configuration de l’usine,
l’utilisation de désinfectants appropriés et la gestion des ferments. D’abord, la conception de l’usine
doit séparer les zones à risques et permettre une réception du lait isolée de la production. Une filtration
de l’air appropriée, ainsi qu’une pression atmosphérique positive sont des facteurs pouvant contrôler
le déplacement des phages (36). Puis, l’utilisation d’agents assainissant efficace est très importante.
Toutefois, certains aspects sont à prendre en compte. L’assainissant ne doit pas avoir d’impacts
négatifs sur la production, il doit avoir un mécanisme d’action rapide et stable dans le temps, il ne
doit pas posséder d’effets toxiques et doit pouvoir agir sur les phages et les microorganismes. Les
agents oxydant tels l’acide peracétique, l’acide acétique et le peroxyde d’hydrogène, et les composés
d’ammonium quaternaire sont parmi les agents assainissant les plus efficaces pour le contrôle des
phages infectant les BL (71). Finalement, une bonne gestion des ferments permet de réduire la
fréquence des infections. Il doit y avoir une rotation des cultures pour éviter les infections récurrentes
par le même phage qui devient de plus en plus nombreux. De plus, l’utilisation de ferments
naturellement résistants aux phages est employée par plusieurs compagnies, car les bactéries
possèdent de nombreux mécanismes de résistance (36, 69).
1.2.4 Les mécanismes de défense
Il y a plusieurs mécanismes de résistance aux bactériophages qui visent les différentes étapes du cycle
d’infection (figure 1.8). D’abord, il est possible de bloquer l’adsorption des phages à la surface
cellulaire et ainsi empêcher le cycle lytique de commencer. Les bactéries peuvent accomplir cette
action par une variété de stratégies. Elles peuvent muter le récepteur cellulaire et donc il n’y a plus
16
de reconnaissance moléculaire par la protéine de liaison au récepteur du phage ou alors elles peuvent
bloquer l’accès de ce récepteur par la production d’une matrice extracellulaire (EPS) qui devient alors
une barrière physique contre les phages (17, 72).
Figure 1.8 : Représentation schématique des différents systèmes de défense bactériens. Plusieurs mécanismes
sont présents chez les procaryotes pour lutter contre les éléments d’ADN étrangers, comme les génomes de
bactériophages et les plasmides. Ces systèmes incluent le blocage de l’adsorption en masquant ou en mutant les
récepteurs cellulaires, le blocage de la translocation de l’ADN dans le cytoplasme, les systèmes Abi où la cellule
provoque sa propre mort suite à une infection, les systèmes de restriction/modification et les systèmes CRISPR-
Cas qui clivent l’ADN de façon différente avec ou sans reconnaissance spécifique de l’ADN envahisseur. M :
méthyltransférase, R : endonucléase de restriction, C : Protéine Cas (73).
Ensuite, il est possible de bloquer l’entrée de l’ADN dans la cellule. C’est un phénomène souvent
associé à la présence d’un prophage qui se nomme l’exclusion de surinfection (Sie) et qui va
contrecarrer la réinfection par le même phage ou un phage similaire (74). Ceci va empêcher la
compétition pour les ressources de la bactérie entre plusieurs phages et assurer la survie du prophage
déjà en place (17). Les prophages codent souvent pour des protéines qui vont s’associer à la
17
membrane, avec les éléments qui la composent ou qui interagissent avec le récepteur de la queue des
phages. Celles-ci peuvent bloquer physiquement l’éjection de l’ADN ou bloquer le processus (75). Il
est important de noter que l’exclusion de surinfection ne bloque pas l’adsorption des phages.
Puis, il y a les systèmes d’avortement de l’infection (Abi) qui cause la mort prématurée de la cellule
suite au début de la réplication du phage. Le sacrifice d’une cellule infectée résulte en moins de phages
relâchés pour préserver la population bactérienne (17, 76). Lorsqu’infectés par un phage, les
procaryotes possédant un système Abi ciblent des étapes importantes de la réplication de la cellule
ou clivent les composantes cellulaires majeures. Par exemple, un système Abi peut cliver des
composantes de la membrane et ainsi provoquer une baisse du potentiel membranaire pour arrêter la
production d’ATP, ou alors un autre genre de système Abi va inhiber la synthèse protéique (73, 77).
La cellule peut aussi couper l’ADN étranger qui entre dans le cytoplasme pour inhiber la réplication
de celui-ci. Les systèmes de restriction/modification sont des systèmes très répandus qui coupent
l’ADN non méthylé lors de son entrée dans la cellule (78). Ces systèmes fonctionnent en trois grandes
étapes. D’abord, une séquence nucléotidique présente dans le génome de l’hôte est reconnue par la
méthylase. Puis, un groupement méthyle est ajouté au site de reconnaissance sur l’ADN par cette
enzyme, ce qui protège le chromosome bactérien. Finalement, l’ADN non méthylé qui se retrouve
dans le cytoplasme de la cellule bactérienne sera digéré par une endonucléase de restriction pour
arrêter la propagation de l’infection. (79).
Finalement, les systèmes CRISPR-Cas (CRISPR: Clustered Regularly Interspaced Short Palindromic
Repeats, Cas: CRISPR associated), présents dans un grand nombre de bactéries et d’archées, font
partie des systèmes capables de couper et digérer l’ADN étranger. Ces systèmes fonctionnent par
reconnaissance et clivage spécifique d’une courte séquence d’ADN ou d’ARN (80–83).
1.3 Les systèmes CRISPR
Les structures génétiques CRISPR et leurs gènes Cas sont des systèmes d’immunité adaptative
bactériens observés pour la première fois en 1987 chez Escherichia coli (84). Ces systèmes sont
présents chez près de 90% des archées et près de 50% des procaryotes, sans aucun homologue chez
les eucaryotes (85, 86). Ils jouent un rôle de défense contre les éléments d’ADN envahisseurs parmi
lesquels se trouvent les phages et les plasmides, tout comme le système immunitaire humain joue un
rôle de défense contre les infections (1, 87). Les systèmes CRISPR-Cas sont décrits comme étant
18
adaptatif, car ils ont la capacité d’acquérir leur immunité et de la transmettre aux cellules filles suite
à la division cellulaire.
1.3.1 Composition des systèmes CRISPR-Cas
Les systèmes sont composés de loci d’un nombre variable de courtes séquences nucléotidiques
identiques, nommées répétitions, entrecoupées par des espaceurs uniques de longueurs variables selon
l’espèce (figure 1.9). Les répétitions ont une longueur entre 23 pb et 47 pb et une séquence
généralement partiellement palindromique, ce qui leur confère une structure secondaire nécessaire à
la maturation des ARNcr (85, 86). Les répétitions sont habituellement bien conservées parmi les
espèces proches, toutefois le nombre de répétitions et la séquence des espaceurs varient grandement
en fonction des souches (86). Ces espaceurs, de 21 pb à 72 pb, sont des séquences hypervariables
(85). Les espaceurs ont longtemps été considérés comme de l’ADN insignifiant, jusqu’à la réalisation
qu’ils correspondent à des séquences d’ADN identiques aux génomes des bactériophages ou à
certains plasmides (1, 80). En effet, un espaceur peut souvent être associé à une séquence
complémentaire dans le génome correspondant d’un phage, ou à la séquence d’un plasmide, d’où il
provient (80, 81, 88). Cette séquence correspondante, nommée proto-espaceur, est un élément clé lors
de la reconnaissance de l’ADN envahisseur. Pour certains types, il est obligatoirement adjacent à un
court motif nommé PAM (Protospacer Adjacent Motif) et il est nécessairement absent du
chromosome bactérien pour éviter que le système CRISPR cible son propre génome (1, 80).
Figure 1.9 : Composition générale des systèmes CRISPR-Cas. Les flèches en rouge représentent les gènes cas,
la ligne rose représente la séquence leader suivie du locus CRISPR composé des répétitions (losanges noirs) et
des espaceurs (rectangles de couleurs individuelles). Adaptée de Hille et al. (87).
Les loci CRISPR sont généralement tous adjacents à une séquence leader, riche en adénine et en
thymine qui ne possède pas de cadre de lecture ouvert, donc elle ne code pas pour une protéine. Cette
séquence se situe directement en amont ou en aval du locus CRISPR et elle s’oriente toujours dans le
19
même sens que le locus (86). Il a été montré qu’elle est le point de départ de la transcription du locus
CRISPR et qu’elle joue donc un rôle de promoteur lors de la biogenèse (87).
Puis, les loci CRISPR fonctionnels sont accompagnés de gènes cas qui varient en nombre et en
composition selon le type de système. Ils peuvent se situer en amont ou en aval du locus et ils sont
couramment éloignés de celui-ci par environ une centaine de paires de base. L’orientation de l’opéron
des gènes cas n’est pas obligatoirement identique à celle du locus et il possède habituellement le
même contenu en guanine et en cytosine que le chromosome bactérien (86). Les protéines codées par
les gènes cas ont plusieurs domaines fonctionnels caractéristiques des nucléases, des hélicases et des
protéines liants les polynucléotides. Ces gènes accomplissent quatre rôles distincts au sein des
systèmes CRISPR-Cas en fonction de ces domaines : le module d’adaptation pour l’acquisition de
nouveaux espaceurs, le module d’expression pour la maturation des ARNcr, le module d’interférence
pour le clivage de l’ADN envahisseur et le module auxiliaire pour la régulation ou toute autre fonction
(89).
1.3.2 Classification
La classification des systèmes CRISPR-Cas est une tâche ardue et complexe. Plusieurs classifications
ont été nécessaires avant d’arriver à celle établie à ce jour. En 2011, une première classification des
systèmes a été proposée qui les divisait en trois types en fonction des gènes cas signatures associés
au locus, où tous les systèmes fonctionnels possèdent les gènes cas1 et cas2. Le type I est caractérisé
par la présence de cas3, le type II est caractérisé par la présence de cas9 et le type III possède cas10
(90). L’architecture génomique et la disposition des gènes cas est responsable des différents sous-
types.
Puis, la recherche accrue sur les systèmes CRISPR-Cas, ainsi qu’une augmentation des données
génomiques disponibles, a permis la découverte de nouveaux systèmes ne correspondant pas à la
classification établie. En 2015, la catégorisation a été révisée pour donner le jour à deux classes, cinq
types et seize sous-types, classés en fonction des modules d’interférence (89). Finalement, une
dernière mise à jour a été faite en 2017 pour ajouter un nouveau type, le type VI (figure 1.10). La
classe 1 regroupe les types I, III qui sont les plus fréquents parmi les archaea et le type IV, qui est très
rare et ne possède pas de module d’adaptation. Les types appartenant à cette classe possèdent
beaucoup de petits gènes cas pour former le complexe d’interférence, tandis que les types rattachés à
la classe 2 possèdent une seule grosse protéine, ayant de multiples domaines, capables d’effectuer
20
l’interférence. Le type II, ayant la protéine Cas9, le type V, ayant l’effecteur Cfp-1 et le nouveau type
VI, possédant le gène cas13 font partie de la classe 2 (91). Finalement, l’évolution rapide des systèmes
CRISPR-Cas, son énorme variabilité et l’absence de gènes cas universels démontrent qu’une
classification robuste doit constamment être mise à jour pour permettre la caractérisation précise de
ces systèmes (89, 92).
A
21
Figure 1.10 : Classification et organisation des types de systèmes CRISPR-Cas et domaines des protéines
effectrices pour les classes 1 (A) et 2 (B). Tirée de Koonin, 2017 (93).
1.3.3 CRISPR-Cas chez Streptococcus thermophilus
Chez l’espèce Streptococcus thermophilus, il y a quatre loci CRISPR possibles (1 à 4) identifiés dans
plusieurs génomes. Chez la souche DGCC7710, les loci CR1 et CR3 sont de type II-A, le locus CR2
B
22
est de type III-A et le locus CR4 est de type I-E, où chaque séquence des répétions est propre à chaque
locus (88, 94–96). Il a été démontré que tous les loci CRISPR, ainsi que leurs gènes cas associés,
présents dans cette souche sont transcrits indépendamment lors d’une infection phagique (95, 97). En
effet, une séquence leader a été identifiée pour les loci CR1, CR2 et CR3, toutefois la transcription
du locus CR4 serait probablement une continuation de la transcription des gènes cas (95). Cependant,
seuls les locus CR1 et CR3 sont actifs et confèrent une résistance contre les bactériophages lorsqu’il
y a acquisition de nouveaux espaceurs (96, 98). Ces locus possèdent les protéines Cas1, Cas2 et Csn2
en amont de la séquence répétition-espaceur en plus du gène cas9, qui est le gène signature pour le
type II.
Les répétitions des loci de type II-A, chez la souche DGCC7710, ont une longueur de 36 pb. Les
répétitions et les gènes cas sont spécifiques à chaque locus et ils ne reconnaissent pas le même motif
PAM. Le locus CR1 est associé au motif NNAGAAW et le locus CR3 est associé au motif NGGNG,
où N représente n’importe quel nucléotique de l’ADN et W représente une adénine ou une thymine
(88, 98). Toutes les souches de S. thermophilus possèdent le locus CR1, qui possède en moyenne 23
espaceurs par locus d’une longueur entre 28 pb et 32 pb. Environ 91 % des souches de S. thermophilus
possèdent un locus CR2, avec un maximum de 7 espaceurs, d’une longueur qui varie entre 35 pb et
40 pb. Puis, 80% des souches possèdent le locus CR3 avec environ 13 espaceurs de longueur entre
29 pb et 32 pb. Puisqu’ils sont rares, la fréquence des loci CR4 n’a pas été déterminée. En général, la
grande majorité des espaceurs, tous loci confondus, proviennent de séquences virales (77%), puis de
plasmides (16%) et finalement 7% proviennent du chromosome bactérien (98).
1.3.4 Les mécanismes de fonctionnement
Les systèmes CRISPR-Cas ont tous un mécanisme de fonctionnement propre à leur type et parfois à
leur sous-type, toutefois il y a trois étapes communes à tous (99, 100). Il y a d’abord l’étape
d’acquisition d’un espaceur dans le locus CRISPR, suivi de la biogenèse, ou la maturation, des ARNcr
et finalement l’étape d’interférence (figure 1.11). Ici, les étapes générales seront décrites en soulignant
plus en détail le système de type II-A, présent dans la souche S. thermophilus DGCC7710.
23
Figure 1.11 : Les trois étapes de fonctionnement des systèmes CRISPR-Cas. Lors de l’adaptation, le complexe
Cas1-Cas2 est responsable de la sélection et de l’intégration d’un nouvel espaceur dans le locus. Puis, le locus
est transcrit sous forme d’ARN précurseur et sera traité en ARNcr mature lors de la biogenèse. Finalement, il y
a reconnaissance de l’ADN envahisseur par le module d’interférence et clivage de cet ADN (87).
1.3.4.1 L’adaptation
L’adaptation est le processus par lequel le système CRISPR-Cas acquiert de nouveaux espaceurs dans
son locus, formant ainsi une mémoire moléculaire des infections précédentes. (87). Les protéines
Cas1 et Cas2 sont communes à presque tous les types et semblent jouer un rôle clé lors de l’adaptation
(91). Le processus d’acquisition est accompli en plusieurs étapes complexes, soit la détection de
l’infection, la sélection du proto-espaceur et son intégration dans le locus (87). D’abord, il y a la
détection d’un élément d’ADN étranger qui stimule la machinerie d’adaptation. Ici, il est nécessaire
24
que la machinerie puisse différencier et préférer l’ADN envahisseur de son propre ADN pour éviter
une auto-immunité. Chez E. coli, il a été démontré qu’une source importante de proto-espaceurs
provenait de la dégradation des fragments d’ADN lors de la réparation des bris double brins par le
sentier de réparation RecBCD. Le système de réparation RecBCD déroule et dégrade l’ADN jusqu’à
ce qu’il atteigne un site Chi. Le nombre de sites Chi dans les ADN étrangers étant beaucoup plus
faibles que dans le génome d’E. coli, une plus grande portion de l’ADN étranger est dégradée et
intégrée dans le locus CRISPR, induisant ainsi un biais envers l’ADN envahisseur (101). De plus, un
mécanisme similaire a été décrit chez Streptococcus pyogenes qui possède un CRISPR de type II-A,
utilisant la machinerie AddAB semblable à la voie de réparation RecBCD (102).
Toutefois, la sélection des proto-espaceurs intégrés dans le locus CRISPR n’est pas un processus
laissé au hasard, d’où l’existence des PAM. Les protéines Cas des systèmes de types I et II
sélectionnent des proto-espaceurs adjacents aux PAM compatibles avec la machinerie d’interférence
(1, 87, 103). Dans certains cas, seul le complexe formé de Cas1 et Cas2 est nécessaire à la
reconnaissance du PAM, tel que retrouvé dans le type I-E (104). Cependant, d’autres types nécessitent
des protéines additionnelles à la machinerie d’acquisition, tel le type II-A. Ce type nécessite aussi
l’assistance de Cas9 qui aide à la reconnaissance du PAM, de Csn2 et de l’ARN transactivateur
(ARNtracr) (105). Ainsi, différents mécanismes servent à sélectionner les proto-espaceurs qui seront
intégrés dans le locus. Cette intégration se fait de préférence à l’extrémité 5’ de la séquence répétition-
espaceurs du locus CRISPR et permet d’obtenir un ordre chronologique des infections passées (80).
L’intégration des nouveaux espaceurs peut se faire de cette façon, car la machinerie d’adaptation sera
en mesure de reconnaître la séquence riche en A-T de la région leader. Encore une fois, les
mécanismes d’intégration varient en fonction du type et du sous-type. Par exemple, le type I-E, parmi
les plus étudiés, a besoin entres-autres d’un facteur d’intégration provenant de l’hôte (HIF, Host
Integration factor), tandis que le type II-A nécessite un court site d’encrage nommé LAS présent dans
la séquence leader permettant d’incorporer l’espaceur (106, 107). Cette séquence de 5 pb à l’extrémité
adjacente aux répétitions est directement reconnue par le complexe Cas1-Cas2, jouant le rôle
d’intégrase. Puis, l’espaceur est intégré par deux réactions de «demi-site», où une extrémité 3’OH du
futur espaceur fait une attaque nucléophile à l’extrémité 5’ à proximité de la séquence leader de la
répétition et l’autre extrémité 3’ de l’espaceur ira se lier à l’extrémité 5’ distale de la séquence leader
du brin complémentaire de la répétition. Le clivage de l’ADN ainsi que la ligature des extrémités est
effectuée par transestérification à l’aide de Cas1. Donc l’intégration d’un espaceur duplique une
répétition pour chaque espaceur intégré (108–110).
25
1.3.4.2 La biogenèse des ARNcr
La biogenèse des ARNcr concerne le processus de maturation de ces ARN particuliers qui serviront
de guide lors de l’étape d’interférence. Il y a d’abord la transcription d’un long ARN précurseur
(ARNpré-cr) qui contient les transcrits des répétitions et des espaceurs tels qu’ils sont disposés dans
le locus CRISPR. Cet ARNpré-cr est ensuite clivé et mature en petites unités composées d’une portion
de la répétition et de l’espaceur, formant ainsi l’ARNcr mature. Les systèmes appartenant aux classes
1 et 2 ont différents mécanismes de maturation, qui possèdent quelques subtilités en fonction des
types et des sous-types (87).
Les systèmes de classe 1 utilisent généralement la protéine Cas6 ou certains homologues (111, 112).
Les systèmes de type I ont des répétitions ayant une séquence palindromique, ce qui leur confère une
structure secondaire en tige-boucle reconnue par Cas6. Cette protéine possède une activité nucléase
et donc elle clive la répétition en aval de la structure secondaire résultant en un ARNcr mature (113).
Quelques sous-types n’ont pas de répétitions palindromiques, toutefois il a été suggéré que Cas6
remodèle la répétition pour former une structure secondaire et reconnaître le site de coupure (114).
Quant à eux, les systèmes de classe 2 ont souvent recours à la machinerie d’interférence et même
parfois des facteurs non protéiques pour la maturation des ARNcr. Les systèmes de type II et de type
V-B nécessitent l’assistance d’un ARN transactivateur (ARNtracr) pour la biogenèse et l’interférence
(115, 116). L’ARNtracr, étant complémentaire à la portion des répétitions, celui-ci s’apparie à
l’ARNpré-cr. Ce complexe sera stabilisé par la protéine responsable de l’interférence, par exemple
Cas9 pour le type II-A, puis la RNAseIII de l’hôte est recrutée pour cliver le complexe en duplex
ARNcr:ARNtracr. Un second clivage par une autre RNase inconnue élimine une partie de la répétition
pour former un complexe de surveillance Cas9 lié au duplex ARNcr:ARNtracr mature. Pour les types
V et VI, la protéine effectrice a la capacité de reconnaître la structure secondaire formée par les
répétitions. Son activité nucléase double lui permet de cliver l’ARN précurseur en ARNcr matures,
en plus d’exercer le processus d’interférence (115, 117, 118).
1.3.4.3 L’interférence
L’étape finale est l’interférence, responsable de la reconnaissance et de la destruction de l’ADN
envahisseur (87). Lors de cette étape, le module d’interférence est guidé par l’ARNcr qui ira
26
s’apparier avec le proto-espaceur par complémentarité des bases. De plus, les protéines Cas vont aussi
reconnaître la présence d’un PAM pour éviter de cibler le chromosome bactérien (80, 119).
Les systèmes de classe 1, plus particulièrement le type I, sont parmi les plus répandus dans le monde
bactérien (93). Le module d’interférence de ces systèmes est composé de plusieurs protéines Cas
formant un complexe nommé Cascade, responsable de l’identification de la cible et de la protéine
Cas3, responsable du clivage de la cible (120). La composition du complexe Cascade varie en
fonction des sous-types, par contre la structure est conservée pour garder les similitudes
fonctionnelles (93). Suite à la biogenèse des ARNcr, Cas6, qui a clivé l’ARN précurseur, y reste
attachée et subséquemment le complexe Cascade s’assemble le long de la structure de l’ARNcr (121).
Ce complexe, sous invasion moléculaire, va reconnaître le PAM présent sur l’ADN envahisseur et
les huit nucléotides avoisinants celui-ci iront s’apparier à l’ARNcr. Le brin non ciblé sera lié par une
sous-unité du complexe Cascade pour former une structure en R, ce qui provoque un changement de
conformation permettant le recrutement de Cas3 (122). Ainsi, Cas3 clive le brin d’ADN non ciblé et
le dégrade grâce à son activité hélicase en direction 3’→ 5’ pour créer une région simple brin
d’environ 200 à 300 nt dans le génome (123). Pour les systèmes de type III, le module d’interférence
possède une composition et une structure semblable à celle de type I, toutefois il cible autant l’ADN
que l’ARN pour éliminer la menace des infections (124).
Quant à eux, les systèmes de classe 2 utilisent une large protéine effectrice pour accomplir l’étape
d’interférence, par exemple la protéine Cas9 chez les systèmes de type II (87, 100). Cette protéine se
liera au complexe ARNcr:ARNtracr pour scanner la présence de PAM sur une molécule d’ADN.
Lorsque que Cas9 reconnaît le motif d’un PAM et que par la suite le brin cible est complémentaire à
l’ARNcr, la protéine génère une coupure double brin trois nucléotides en amont du PAM (88, 125).
Cas9 possède une structure bilobée, où le lobe REC est responsable de la liaison de l’ARN et de
l’ADN et le lobe NUC est responsable du clivage de l’ADN et de l’interaction avec le PAM. Le
clivage est généré par deux domaines différents du lobe NUC de la protéine, soit le domaine HNH
qui clive le brin cible et le domaine RuvC qui clive le brin non ciblé (126, 127). Lorsque la protéine
se lie au duplex ARNcr:ARNtracr, un grand changement de conformation se produit permettant à la
protéine de pouvoir lier le PAM et à l’ARNcr de se lier à l’ADN cible pour activer l’interférence et
produire un bris double brin dans cet ADN (125, 128).
Cependant, quelques systèmes de classe 2 ne nécessitent pas d’ARNtracr, tel le système de type V-
A. Les protéines Cas12a et Cas12b reconnaissent le PAM sur les deux brins et clive les deux brins
27
d’ADN se façon non symétrique résultant en une coupure ayant des extrémités cohésives (87, 116,
117). Quant à eux, les systèmes de type VI ciblent et clivent l’ADN simple brin (ADNsb) (129).
Cas13 est stimulé par la reconnaissance de l’ADNsb et de l’ARNcr pour dégrader non seulement le
brin d’ADN ciblé, mais aussi les autres brins d’ADNsb. Ces systèmes ne nécessitent pas non plus
l’utilisation d’ARNtracr pour le processus d’interférence (130, 131).
1.4 L’édition de génome
L’avancée des recherches dans le domaine de la biologie moléculaire durant ces dernières années a
permis le développement de techniques efficaces et rapides pour l’édition de génome. L’édition de
génome est très efficace pour l’étude des gènes inconnus d’un organisme, en partant des virus,
jusqu’aux plantes et à l’humain (132–138). Il a été démontré qu’une coupure double brin de l’ADN
(DSB) en utilisant une nucléase spécifique stimule les voies de réparation de l’ADN par
recombinaison homologue ou par assemblage des brins non homologues (NHEJ), permettant
l’introduction de mutations aux sites spécifiques d’un génome (139–141). Les protéines ayant la
capacité de produire de tels bris dans l’ADN doivent obligatoirement posséder deux domaines
différents, un domaine pour reconnaître et lier l’ADN et un domaine pour le couper (142). Parmi les
premières protéines utilisées pour l’édition de génome se trouvaient les endonucléases, plus
particulièrement les mégas nucléases, les doigts de zinc et les protéines nucléases effectrices de type
activateur de transcription (TALEN) (132, 143, 144). Toutefois, ces nucléases fonctionnent par
interactions entre la protéine et un site spécifique sur le génome, et pouvoir cibler un nouveau site
implique la fabrication d’une nouvelle protéine ce qui représente un travail énorme. Ainsi les cibles
possibles dans un génome sont assez restreintes et limitent les possibilités futures.
Cependant, la découverte de la protéine Cas9 augmente de beaucoup l’efficacité d’édition de génome,
car cette protéine est guidée par une molécule d’ARN interchangeable et la reconnaissance d’un site
spécifique fonctionne par complémentarité des bases selon le principe de Watson-Crick (128, 145).
Cas9 devient donc un outil révolutionnaire dans le domaine des modifications génétiques permettant
l’établissement de systèmes à haut débit. Les variantes de cette protéine, développées au courant des
dernières années, ont permis aux chercheurs d’adapter ce système pour diverses applications
différentes, dont la régulation des gènes et l’imagerie génomique (figure 1.11) (142, 146–148).
L’édition de génome employant Cas9 est quelque peu divergente du système de type II-A, au sens
qu’il nécessite un ARN guide plutôt qu’une molécule ARNtracr:ARNcr. L’ARN guide est en quelque
28
sorte une fusion de ces deux ARN dont la partie complémentaire au proto-espaceur peut
s’interchanger et viser des régions différentes de n’importe quel génome (145). Comme mentionné
précédemment, Cas9 possède deux domaines qui produisent une coupure double brin dans l’ADN
cible lorsqu’il y a une reconnaissance du PAM et du proto-espaceur. Cette coupure stimule les voies
de réparation de l’ADN. La voie de réparation NHEJ cause des mutations diverses, telles des
délétions, des insertions et des mutations ponctuelles, de façon aléatoire au site de coupure ce qui
peut causer l’inactivation d’un gène ou un changement de cadre de lecture (149). Pour engendrer une
mutation précise, il est possible de fournir un gabarit d’ADN qui ira s’insérer par recombinaison
homologue au site de coupure, résultant ainsi en une mutation contrôlée pour accomplir n’importe
quelle tâche (140, 150).
La protéine Cas9 est associée à plusieurs sous-types de systèmes CRISPR-Cas, soit les types II-A, II-
B et II-C. Celle majoritairement utilisée en édition de génome provient du système de type II-A de
Streptococcus pyogenes (SpCas9) et elle a une taille de 1368 acides aminés (145, 151, 152). La
nucléase SpCas9 reconnaît un court PAM NGG, ou plus rarement NAG. De plus, il est possible de
muter les domaines de SpCas9 pour produire une version ayant un seul des deux domaines ou les
deux domaines absents. Lorsqu’un seul domaine est actif, un seul brin d’ADN est coupé et agit
comme une nickase (nCas9). Cette version limite les mutations non prévues (off target activity) et
permet d’augmenter la spécificité du système (142, 153–155). Lorsque les deux domaines sont
inactifs, la protéine est catalytiquement morte, d’où le terme dead Cas9 (dCas9), mais elle peut tout
de même lier l’ADN et être couplée à d’autres facteurs pour générer des mutations épigénétiques ou
réguler la transcription des gènes (146, 156, 157). De plus, dCas9 peut être couplée à plusieurs
protéines fluorescentes permettant l’étiquetage de certaines séquences associées aux maladies
génétiques. Cette méthode est avantageuse, car elle peut être pratiquée sur les cellules vivantes et
permettre l’étude de la dynamique des génomes en temps réel (158–160).
29
Figure 1.12 : Applications et outils reliés à l’utilisation de la protéine Cas9 en édition de génome. Cas9 peut
être utilisé pour causer une coupure double brin et favoriser la réparation de l’ADN par la voie NHEJ, causant
des mutations au hasard ou la recombinaison homologue avec un gabarit d’ADN, pour une mutation précise
(a). Cas9 ayant les sites RuvC et HNH inactifs (dCas9) peut être couplé à certains facteurs de transcription et
influencer la régulation des gènes (b). La protéine dCas9, couplée à une protéine pouvant modifier les histones,
peut servir à l’édition des marqueurs épigénétiques (c). Lorsque dCas9 est couplée à un marqueur fluorescent,
cet outil peut être utilisé pour l’identification de séquence en imagerie génomique. Adaptée de Wang et al.
(142).
Plusieurs autres orthologues de Cas9, provenant d’autres microorganismes, ont aussi été développés
comme outil d’édition génomique. Notamment, la protéine Cas9 de Staphylococcus aureus (SaCas9).
30
L’édition de génome in vivo utilise souvent un vecteur de transfection viral associé aux adénovirus
qui ne peut supporter une charge plus grande que 4,5 kb, toutefois la taille de SpCas9 limite
l’utilisation de ce vecteur à des fins thérapeutiques. En revanche, SaCas9, par sa taille plus petite de
1053 acides aminés, a été optimisée pour ce genre d’application et le rendement d’édition de génome
in vivo est égal à SpCas9. SaCas9 reconnaît un PAM NNGRRT, où R représente une adénine ou une
guanine, et a déjà été développée pour l’édition, en plus de la régulation des gènes (161, 162). Un
autre problème engendré avec l’utilisation de SpCas9, est que cette protéine ne peut effectuer qu’une
seule tâche à plusieurs sites, incapable de médier plusieurs activités différentes à des sites différents
en même temps. Les orthologues Cas9 de Neisseria meningitidis et de S. thermophilus CR1 ont été
développés dans ce but. Il a été démontré que ces protéines peuvent accomplir plusieurs activités
indépendamment l’une de l’autre dans une seule cellule. Par exemple, une version de NmCas9
couplée à un activateur peut réguler un gène, tandis qu’une autre version de NmCas9 édite le génome
simultanément. Ceci permet d’exercer une pression sélective plus forte et plus rapide (98, 163).
Finalement, il est clair que les possibilités employant la protéine Cas9 et ses orthologues sont infinies.
Ces outils moléculaires seront indispensables pour approfondir l’étude de la fonction des gènes, les
modèles thérapeutiques, la thérapie par les gènes et les interactions entre les protéines et le génome.
Le plein potentiel de cette technologie est encore à découvrir et les prochaines années verront
l’exploration et la recherche de nouveaux mécanismes et de nouveaux systèmes augmenter de façon
considérable.
1.5 Problématique et objectifs de recherche
La souche S. thermophilus DGCC7710 est une souche très utilisée pour la production mondiale de
yogourt. C’est une souche très particulière pour ses propriétés organoleptiques, ce pourquoi il s’avère
extrêmement difficile de la remplacer. Malgré les précautions prises par l’industrie laitière, telles la
rotation des ferments, une meilleure hygiène et une ventilation adaptée, les infections par les phages
restent la principale cause de perte de rendements dans la production. C’est pourquoi une meilleure
compréhension de ces phages est nécessaire pour éventuellement en venir à un contrôle efficace.
Cette étude rejoint non seulement le côté industriel, mais aussi un grand volet fondamental.
Dans cette étude, le système CRISPR-Cas9 de S. thermophilus DGCC7710 peut être utilisé pour
l’édition de génome du bactériophage virulent 2972, permettant ainsi l’étude des gènes précoces
nécessaires à la réplication de celui-ci et l’identification du génome minimal. Ce système permettra
31
l’inactivation des gènes précoces inconnus du génome du phage 2972 par une délétion importante à
l’intérieur du cadre de lecture ouvert et ainsi nous fournira un outil pour identifier les gènes essentiels.
De plus, les interactions entre les phages mutants et l’hôte sauvage seront caractérisées pour mesurer
l’impact des délétions. Somme toute, en étudiant les protéines du bactériophage 2972, qui peut servir
de modèle pour l’étude de bien d’autres phages, il sera possible d’approfondir les connaissances en
biologie du phage et ainsi mieux comprendre les mécanismes d’infection et de réplication de ceux-
ci.
32
CHAPITRE 2: Matériel et méthodes
2.1 Souches bactériennes, plasmides et phages utilisés
Toutes les souches bactériennes, les plasmides et les phages utilisés lors de cette recherche ainsi que
les caractéristiques spécifiques les concernant sont regroupés dans le tableau 2.1. Les loci CRISPR1
et CRISPR3 de chaque BIM (Bacteriophage Insensitive Mutant) ont été amplifiés par réaction PCR
(Polymérase Chain Reaction) et séquencés par la méthode Sanger par la Plateforme de séquençage
du Centre Hospitalier de l’Université Laval (CHUL) pour confirmer la séquence des espaceurs
d’intérêts. Les phages mutants ont été vérifiés par réaction PCR et séquençage du produit PCR, ainsi
que par séquençage complet du génome sur la plateforme Illumina© pour vérifier l’absence d’autres
mutations. Finalement, toutes les séquences insérées dans le vecteur de clonage pNZ123 ont aussi été
vérifiées par réaction PCR et séquençage du produit de la réaction.
Tableau 2.1 : Liste des souches bactériennes, des phages et des plasmides utilisés lors de l’étude et leurs
caractéristiques.
Souches
bactériennes, phages
et plasmides
Caractéristiques importantes
Souches bactériennes
Streptococcus
thermophilus
DGCC7710
Aucun plasmide, sensible au phage 2972 (26).
BIM AR1 Dérivée de la souche DGCC7710, espaceur contre l'orf22 du phage 2972
(position 23 600-23 629) intégré dans le locus CRISPR 1.
BIM 307.1 Dérivée de la souche DGCC7710, espaceur contre l'orf23 du phage 2972
(position 23 959-23 987) intégré dans le locus CRISPR 1.
BIM 324.2 Dérivée de la souche DGCC7710, espaceur contre l'orf24 du phage 2972
(position 24 107-24 136) intégré dans le locus CRISPR 1.
BIM AR2 Dérivée de la souche DGCC7710, espaceur contre l'orf27 du phage 2972
(position 25 379-25 408) intégré dans le locus CRISPR 3.
BIM A-135 Dérivée de la souche DGCC7710, espaceur contre l'orf28 du phage 2972
(position 25 782-25 611) intégré dans le locus CRISPR 1.
BIM AR3 Dérivée de la souche DGCC7710, espaceur contre l'orf30 du phage 2972
(position 26 175-26 204) intégré dans le locus CRISPR 3.
BIM MED-10 Dérivée de la souche DGCC7710, espaceur contre l'orf32 du phage 2972
(position 26 660-26 689) intégré dans le locus CRISPR 1.
33
BIM MED-16 Dérivée de la souche DGCC7710, espaceur contre l'orf36 du phage 2972
(position 29 558-29 587) intégré dans le locus CRISPR 1.
BIM AR4 Dérivée de la souche DGCC7710, espaceur contre l'orf40 du phage 2972
(position 32 937-32 966) intégré dans le locus CRISPR 1.
BIM A-35 Dérivée de la souche DGCC7710, espaceur contre l'orf41 du phage 2972
(position 33 108-33 137) intégré dans le locus CRISPR 1.
BIM B-185 Dérivée de la souche DGCC7710, espaceur contre l'orf43 du phage 2972
(position 33 769-33 798) intégré dans le locus CRISPR 1.
BIM MED-136 Dérivée de la souche DGCC7710, espaceur contre l'orf44 du phage 2972
(position 34 105-34 134) intégré dans le locus CRISPR 1.
Escherichia coli NEB5α Cellules compétentes à haute efficacité provenant de la compagnie New
England Biolabs® (# Catalogue : C2987H).
Phages
2972 Infecte Streptococcus thermophilus DGCC7710 (26).
2972Δ22 Infecte la souche DGCC7710 et le BIM AR1, Délétion (position 23 546-23
713).
CEM22 Infecte la souche DGCC7710 et le BIM AR1, Mutation ponctuelle (G-23’633-
T).
2972Δ24 Infecte la souche DGCC7710 et le BIM MED 324.2, Délétion (position 24
076-24 201).
2972Δ27 Infecte la souche DGCC7710 et le BIM AR2, Délétion (position 25 359-25
430).
2972Δ28 Infecte la souche DGCC7710 et le BIM A-135, Délétion (position 25 521-25
643).
2972Δ36 Infecte la souche DGCC7710 et le BIM MED-16, Délétion (position 29 499-
29 861).
2972Δ41 Infecte la souche DGCC7710 et le BIM A-35, Délétion (position 33 076-33
144).
CEM41 Infecte la souche DGCC7710 et le BIM A-35, Mutation ponctuelle (T-33 137-
A).
2972Δ43 Infecte la souche DGCC7710 et le BIM A-185, Délétion (position 33 754-33
891).
Plasmides
pNZ123 Plasmide de 2497 paires de base, haut nombre de copies par cellule (50-100).
Possède un gène de résistance au chloramphénicol (164).
pΔ22 Dérivé de pNZ123, taille de 3586 paires de base et possède le gabarit de
recombinaison pour une délétion de l'orf22 du phage 2972.
pΔ23 Dérivé de pNZ123, taille de 3468 paires de base et possède le gabarit de
recombinaison pour une délétion de l'orf23 du phage 2972.
34
pΔ24 Dérivé de pNZ123, taille de 3394 paires de base et possède le gabarit de
recombinaison pour une délétion de l'orf24 du phage 2972.
pΔ27 Dérivé de pNZ123, taille de 3410 paires de base et possède le gabarit de
recombinaison pour une délétion de l'orf27 du phage 2972.
pΔ28 Dérivé de pNZ123, taille de 3536 paires de base et possède le gabarit de
recombinaison pour une délétion de l'orf28 du phage 2972
pΔ30 Dérivé de pNZ123, taille de 3281 paires de base et possède le gabarit de
recombinaison pour une délétion de l'orf30 du phage 2972.
pΔ32 Dérivé de pNZ123, taille de 3536 paires de base et possède le gabarit de
recombinaison pour une délétion de l'orf32 du phage 2972.
pΔ36 Dérivé de pNZ123, taille de 3518 paires de base et possède le gabarit de
recombinaison pour une délétion de l'orf36 du phage 2972.
pΔ40 Dérivé de pNZ123, taille de 3433 paires de base et possède le gabarit de
recombinaison pour une délétion de l'orf40 du phage 2972.
pΔ41 Dérivé de pNZ123, taille de 3483 paires de base et possède le gabarit de
recombinaison pour une délétion de l'orf41 du phage 2972.
pΔ43 Dérivé de pNZ123, taille de 3572 paires de base et possède le gabarit de
recombinaison pour une délétion de l'orf43 du phage 2972.
pΔ44 Dérivé de pNZ123, taille de 3611 paires de base et possède le gabarit de
recombinaison pour une délétion de l'orf44 du phage 2972.
2.1.1 Conditions de culture des bactéries
La souche S. thermophilus DGCC7710 a été utilisée comme hôte pour le phage virulent 2972 (26).
Cette souche bactérienne et ses dérivés ont été cultivés dans le milieu LM17 (M17 Oxoid + 0,5% de
lactose), sans agitation, à température optimale de 42 °C (165). Les incubations de 18 heures et plus
ont été faites à une température à 37 °C et non 42 °C pour éviter une plus grande production d’acide
lactique. Les souches possédant un plasmide dérivé du vecteur de clonage pNZ123 ont été cultivées
dans le milieu LM17 décrit précédemment, supplémenté de chloramphénicol à une concentration de
5 µg/ml (164). Les cellules compétentes à haute efficacité Escherichia coli NEB 5-alpha de la
compagnie New England Biolabs® (# Catalogue : C2987I) ont également été utilisées pendant cette
étude. Celles-ci ont été cultivées dans le milieu LB (Lysogeny Broth,) à 37 °C avec agitation à 200
rotations par minute (166). Une concentration de 20 µg/ml de chloramphénicol a été ajoutée pour
permettre la sélection des clones contenant les plasmides.
35
2.1.2 Propagation, titration et conservation des lysats de phage
La propagation des phages a été utilisée pour augmenter la concentration de ceux-ci jusqu’à
idéalement 109 unités formatrices de plages de lyse (ufp) par millilitre. D’abord, les souches de S.
thermophilus ont été incubées toute la nuit à 37 °C sans agitation dans 10 ml de milieu LM17. Pour
la première amplification, 100 µl de cette culture et 50 µl de phages ont été ajoutés à 10 ml de milieu
LM17 supplémenté de CaCl2 à une concentration de 10 mM et incubés à 42 °C jusqu’à lyse complète,
soit l’obtention d’un tube de milieu de culture clair. L’amplification a ensuite été filtrée sur filtre 0,45
µm. Lors de la deuxième amplification, 100 µl de la culture incubée pendant toute la nuit ont été
ajoutés à 10 ml de milieu LM17 et incubés à 42 °C jusqu’à l’obtention d’une densité optique à une
longueur d’onde de 600 nm (DO600) de 0,1. Ensuite, le CaCl2 (10 mM) et 50 µl de la première
amplification ont été ajoutés, le tout a été incubé à 42 °C jusqu’à lyse complète et filtré sur filtre 0,45
µm.
Pour vérifier la concentration précise, soit le titre du phage suite à l’amplification, il faut procéder à
une titration en milieu solide. La souche hôte a été incubée à 37 °C toute la nuit dans 10 ml de milieu
LM17. Ensuite, une dilution en série du lysat à titrer a été effectuée dans du tampon de phage 1X
(Tris-HCl 50 mM pH 7,5, NaCl 100 mM et MgSO4 8mM). Pour la dilution 10-1, 100 µl du lysat ont
été ajoutés à un microtube contenant 900 µl de tampon de phage stérile et mélangé délicatement en
pipettant de haut en bas avec un embout filtré. Puis, 100 µl de la dilution 10-1 ont été ajoutés à un
autre microtube contenant 900 µl de tampon de phage pour faire la dilution 10-2. Le tout a été répété
jusqu’à la dilution 10-6. Après, 100 µl de la dilution 10-1 et 300 µl de la culture ont été ajoutés à 3 ml
de gélose molle LM17 (LM17 + 0,75 % agar) supplémentée de CaCl2 à 10 mM gardée à 55 °C.
Ensuite, la gélose molle a été rapidement versée sur une boîte de Pétri contenant une gélose solide
LM17 (LM17 + 1 % agar) supplémentée de CaCl2 à 10 mM. Ceci a été exécuté en triplicata pour
chaque dilution et incubé à 42 °C pendant 18 à 24 heures (167). Suite à l’incubation, le triplicata
contenant entre 30 et 300 plages de lyse a été utilisé pour estimer le nombre d’ufp par millilitre de
lysat. La moyenne du nombre de plages de lyse de chaque triplicata a été divisée par le volume du
phage étalé, puis ceci a été multiplié par 1 sur le facteur de dilution.
(Moyenne des UFP/Volume d’étalement) * (1/Facteur de dilution) = UFP/ml
36
Les lysats peuvent se garder à 4 °C pendant quelques mois au réfrigérateur. Pour une conservation à
long terme, 850 µl du lysat ont été ajoutés à 150 µl de glycérol stérile dans un tube de 1,5 ml vissé et
gardé dans un congélateur à -80 °C.
2.1.3 Transformation bactérienne et extraction de plasmides
Les cellules chimiocompétentes E. coli NEB5α ont été transformées selon le protocole fourni par la
compagnie New England Biolabs®. Les plasmides construits lors de cette étude ont toujours été
extraits à partir des clones de la souche NEB5α à l’aide de la trousse «QIAprep® Spin Miniprep Kit»
de la compagnie Qiagen© selon les recommandations du manufacturier.
La souche S. thermophilus DGCC7710 et ses dérivés ont été transformés par électroporation (168).
D’abord, la souche a été incubée à 37 °C pendant toute la nuit. Ensuite, un tube de 10 ml de milieu
LM17 a été inoculé à 1% et incubé à 42 °C jusqu’à l’obtention d’une DO600 de 0,4 (maximum 0,45).
Puis, 10 ml de milieu « Choc Glycine » (LM17 + 0,8 M sorbitol + 20% glycine), préincubé à 42 °C,
ont été ajoutés au tube de culture et incubé 1h à 42 °C. Ensuite, la culture a été centrifugée pendant 5
minutes à 12 000g et transférée sur glace. Le surnageant a été jeté, puis le culot a été resuspendu dans
1 ml de solution de lavage froide (0,4 M sorbitol + 10% glycérol) et transféré dans un microtube de
1,5 ml. La resuspension a été centrifugée 1 minute à 16 000g pour un deuxième lavage où le culot a
été resuspendu dans 500 µl de solution de lavage froide. Un troisième lavage a été fait pour obtenir
un volume final de 150 µl de cellules électro-compétentes. Un volume de 1-5 µl (idéalement 500 ng
à 1 µg d’ADN) du plasmide à transformer et 50 µl de cellules compétentes fraîchement préparées ont
été ajoutés à une cuvette d’électroporation. Ensuite, les cellules ont été électroporées dans le Gene
Pulser réglé à 25 µF, 200 Ω et 2,5 KV et 950 µl de milieu de récupération froid (LM17 + 0,4 M
sorbitol + 20 mM MgCl2 + 2 mM CaCl2) a été immédiatement ajouté à la cuvette, puis transféré dans
un microtube de 1,5 ml et incubé sur glace pendant 10 minutes. Les microtubes ont été
subséquemment placés à 42 °C pendant 2 heures et 100 µl de transformants ont été étalés sur gélose
LM17 supplémentée de l’antibiotique nécessaire pour la sélection des clones.
2.2 Édition de génome du phage 2972
L’édition de génome du phage 2972 s’est faite selon Martel et Moineau (48). Les orfs visés lors de
cette étude sont identifiés dans le tableau 2.2 ci-dessous. Ces orfs sont majoritairement des gènes
exprimés tôt suite à l’infection et ils sont conservés parmi les gènes de phages de S. thermophilus.
37
Pour cette recherche, les gènes n’ont pas été enlevés au complet du génome, car certains se
chevauchent (orf40 et orf43) et il est préférable de ne pas modifier le cadre de lecture. Nous avons
opté plutôt pour une version tronquée du gène duquel les domaines identifiés sont absents ou si aucun
domaine n’a été identifié, près de la moitié ou plus des acides aminés manquent à la protéine.
Tableau 2.2 : Les orfs prédits du phage 2972 ainsi que leurs fonctions putatives (48).
a Produit final de l’excision d’un intron b orfs présents sur des introns c Basé sur le Basic Local Alignment Seach Tool (BLAST) de NCBI d BI : Bio-informatique, SDS : SDS-PAGE e Les orfs à l’étude sont encadrés et en caractère gras
e
Taille Fonction putative (domaine)
38
2.2.1 Construction des BIM «sur demande»
Un BIM est nécessaire pour l’édition de génome de chaque gène visé. Les BIM utilisés dans le tableau
2.1 proviennent en majorité d’une banque de souches présente au laboratoire, toutefois les BIM AR1,
AR2, AR3 et AR4 ont dû être construits, car aucun BIM contenant un espaceur contre ces gènes
n’avait été isolé. Désormais, il est possible d’exercer une pression de sélection qui force l’acquisition
d’un espaceur précis conduisant à l’obtention d’un BIM « sur demande » (voir Figure 2.1) (169).
D’abord, le génome du phage a été analysé pour la présence de motifs PAM (Locus CRISPR 1 ou 3)
dans la région où l’on veut induire une coupure double brin (tableau 2.3). Ensuite, une courte
séquence d’ADN d’environ 130 pb contenant un PAM sélectionné ainsi que les 30 pb en amont de
celui-ci a été clonée dans le plasmide pNZ123 par assemblage Gibson (voir section B.3 de l’annexe
1), pour obtenir le plasmide programmeur de l’acquisition. Puis, ce plasmide a été transformé dans la
souche DGCC7710 par électroporation (voir section 2.1.3). Les clones résultants ont été incubés à 37
°C pendant toute la nuit dans 10 ml de milieu LM17 + 5 µg/ml de chloramphénicol. Puis, 10 ml de
milieu LM17 sans antibiotique ont été inoculés avec 100 µl de la culture incubée pendant toute la nuit
jusqu’à l’obtention d’une DO600 de 0,6. Ensuite, un volume de 300 µl de bactéries a été infecté avec
1 x 108 phages (le volume varie en fonction du titre de lysat) dans 3 ml de gélose molle LM17 + CaCl2
10 mM + 0,75% agar. Le tout a été versé sur gélose solide LM17 + CaCl2 10 mM + 1 agar. Les boîtes
de Pétri ont été incubées à 42 °C pendant 24 à 48 heures jusqu’à l’apparition de clones. Ceci a été fait
pour chaque gène visé.
Tableau 2.3 : Espaceurs possibles visés lors de la programmation du système CRISPR-Cas.
Gène
visé
Taille de
l’insert
(pb)
Espaceurs possibles (5’-3’) PAM
possibles
Locus
CRISPR
correspondant
orf22 133 TAAAAAAATCGCAAAATATGATGAAATGAT TGAGAAA CR1
CCAAGAAAACTTCCCTCAACGTGCTGAAAA CGAGAAA CR1
orf27 122 CAATACCGTGCCAAGTCTGGTATAATAGTA TCAGAAA CR1
CGTGCCAAGTCTGGTATAATAGTATCAGAA AGGTG CR3
GTATCAGAAAGGTGTAACGACTATCCTTTT AGGAG CR3
TACCAGACTTGGCACGGTATTGCCCGTTCT GGGTG CR3
orf30 135 GATCCTATTTATATTAGTGTGGATATTAAT AGGAG CR3
orf40 132 CCGCATATTAACATTGGAACAGTTACCAGA TGAGAAA CR1
39
Figure 2.1 : Programmation du système CRISPR-Cas natif. Lors de l’étape 1, la souche contenant le plasmide
programmeur croît sans pression de l’antibiotique. Plusieurs scénarios sont possibles. D’abord, 94 % des
cellules vont garder le plasmide (scénario A). Toutefois, environ 3 % des cellules vont perdre le plasmide sans
intervention du système CRISPR (scénario B). Puis, 3 % des cellules vont aussi perdre le plasmide, mais sous
intervention du système CRISPR où la majorité des cellules vont acquérir un espaceur provenant du plasmide
(scénario C) et une faible portion aura acquis l’espaceur désiré (scénario D). À l’étape 2, la population mixte
de cellules est exposée au phage à une grande concentration (108 virions). Suite à la pression de sélection
provenant du phage, environ une cellule sur 1 million va survivre suite à l’acquisition au hasard d’un espaceur
provenant du phage. Cependant, les cellules ayant acquis le bon espaceur auparavant (scénario D) auront un
taux de survie de 100 % et représenteront la majorité des colonies présentes à la surface des boîtes de Pétri
(étape 3).
Puis, une fois les BIM générés, il est essentiel de déterminer leur efficacité de défense contre
l’infection en calculant l’efficacité à former des plaques (EOP). Cette efficacité d’infection est
mesurée en calculant le titre du phage sauvage sur la souche sauvage et sur la souche résistante selon
la section 2.1.2. Ainsi la valeur est calculée grâce à l’équation suivante.
EOP = Titre du phage sur la souche résistante / Titre du phage sur la souche sensible
40
2.2.2 Construction des gabarits de recombinaison
Pour obtenir les phages mutants, un gabarit de recombinaison avec la délétion désirée doit être
construit pour chaque gène. Les informations sur les constructions génétiques se trouvent dans le
tableau 2.4. Cette étape de la méthodologie est très bien expliquée dans l’étape B du protocole publié
selon Lemay et al. (170).
Tableau 2.4 : Informations sur les constructions génétiques pour chaque gène visé ainsi que sur les domaines
conservés chez les protéines résultantes.
Orf
Taille
de la
délétion
(pb)
Domaines conservés
chez la protéine
Taille de la
région
homologue en
amont du gène -
Insert A (pb)
Taille de la région
homologue en aval
du gène - Insert B
(pb)
Taille de
l'insert
complet
(pb)
22 387 DUF 1366 Superfamily 573 572 1401
23 144 Aucun 528 534 1295
24 333 Aucun 577 376 1211
27 123 Aucun 534 433 1224
28 186 Aucun 576 547 1356
30 132 Aucun 272 573 1103
32 123 Aucun 581 552 1389
36 456 DUF 669 527 554 1346
40 252 Aucun 505 491 1253
41 156 Aucun 533 537 1302
43 327 DUF 1372 569 590 1393
44 708 DUF 1340 610 588 1429
pb : paire de bases
L’obtention d’un tel gabarit de recombinaison se fait d’abord en choisissant un gène dont la fonction
est inconnue chez le phage 2972 (voir figure 2.2 pour représentation de la méthodologie complète).
La présence de PAM, propre au locus CRISPR 1 (NNAGAAW) ou 3 (NGGNG), a été identifiée pour
déterminer la cible (proto-espaceur et PAM) qui sera coupée par le système CRISPR-Cas suite à
l’interférence. Ensuite, l’existence d’un BIM dans la collection possédant l’espaceur correspondant a
été vérifiée et si un tel BIM était absent, il a été créé selon la méthodologie de la section 2.2.1. Par la
suite, la longueur des régions homologues a été déterminée en amont et en aval du gène. Une longueur
d’environ 500 pb est idéale pour obtenir un bon taux de recombinaison homologue pendant l’édition
de génome, mais plusieurs facteurs sont à considérer.
41
D’abord, aucun gène toxique ne doit être présent dans les régions homologues pour éviter que le
gabarit soit toxique pour la cellule. Si une telle situation survient, il est possible de réduire la taille
d’un des inserts jusqu’à 200 pb ou de cloner l’insert total en sens inverse du promoteur du gène de
résistance de l’antibiotique du plasmide pNZ123. Puis, il est essentiel que le proto-espaceur présent
dans le gène soit exclu dans la délétion résultante pour éviter que la séquence soit reconnue par le
système CRISPR-Cas de la bactérie. Ensuite, les régions homologues doivent comprendre le début et
la fin du cadre de lecture pour éviter de modifier les espaces intergéniques, ce qui pourrait modifier
l’expression des gènes avoisinants.
Figure 2.2 : Schématisation de la méthodologie permettant l’obtention des gabarits de recombinaison. Quatre
amorces sont conçues pour former deux inserts (A et B) d’environ 500 pb pour la recombinaison homologue.
Ces inserts sont amplifiés par réaction PCR et ensuite assemblés dans le vecteur pNZ123, coupé avec l’enzyme
de restriction XbaI, à l’aide de l’assemblage Gibson.
Finalement, les oligonucléotides ont été conçus à l’aide du logiciel Geneious© (version 11.0.4) pour
permettre d’amplifier les deux inserts (A et B) répondants à toutes les conditions énumérées
précédemment. Les amorces extérieures de l’insert total (A + B) ont une extension complémentaire
(en vert) au vecteur de clonage pNZ123 coupé par l’enzyme de restriction XbaI (voir section B.1 de
l’annexe) et les amorces intérieures ont une extension complémentaire entre elles (en jaune) pour
42
former une version tronquée du gène suite à l’assemblage. La longueur des extensions doit faire
minimum 30 pb pour obtenir un taux d’assemblage satisfaisant. Cette longueur peut être augmentée
en fonction de la longueur et du nombre d’inserts.
Les inserts A et B ont été amplifiés par PCR (section B.2 de l’annexe 1) avec l’ADN polymérase Q5
et migrés sur gel d’agarose 2% avec l’échelle moléculaire «Low DNA Mass ladder» de la compagnie
InvitrogenTM pour estimer la concentration des produits PCR (section B.2 de l’annexe 1). Puis, les
inserts et le vecteur pNZ123 ont été assemblés à l’aide du «Gibson Assembly Master Mix» selon les
recommandations du manufacturier (section B.3 de l’annexe).
Les constructions génétiques ont été transformées dans des cellules E. coli NEB5α
chimiocompétentes de la compagnie New England Biolabs selon les recommandations du
manufacturier et incubées à 37°C toute la nuit sur gélose LB supplémentée de chloramphénicol à une
concentration de 20 µg/ml. Les colonies résultantes ont été testées par amplification PCR pour la
présence du bon insert avec les amorces pNZinsF et pNZinsR s’appariant sur une région extérieure
au site de clonage sur le plasmide pNZ123. Ensuite, les produits PCR ont été migrés sur gel d’agarose
2% et ceux ayant un produit de la taille attendue ont été séquencés par la méthode Sanger à la
plateforme de séquençage du CHUL. Une fois la séquence confirmée, les colonies correspondant aux
bonnes séquences ont été incubées toute la nuit dans 10 ml de milieu LB contenant 20 µg/ml de
chloramphénicol. Puis, les gabarits de recombinaison ont été extraits des souches d’E. coli NEB5α
(voir section 2.1.3) à partir de 3 ml de la culture et 1 ml a été utilisé pour effectuer un tube de
conservation à -80 °C. Finalement, 500 ng à 1 µg d’ADN plasmidique ont été transformés dans le
BIM correspondant au bon gabarit de recombinaison selon le protocole de la section 2.1.3.
Tableau 2.5 : Oligonucléotides utilisés lors cette de recherche ainsi que leur utilisation.
Nom Séquence (5’-3’) Fonction
Construction des plasmides programmeur de l'acquisition
orf22_cbgGIB_rev ATTACAGCTCCAGATCCAGTACTGAATTCTCGCTAACTGAGTCATCTTTTCAGATTT
ATC
Amplification de
l'insert pour le plasmide
programmeur de
l'acquisition de l'espaceur contre
l'orf22
orf22_cbgGIB_fwd GAAAATATGCACTCGAGAAGCTTGAGCTCTCCAAGAAAACTTCCCTCAACGTGCTG
orf27_cbgGIB_fwd GAAAATATGCACTCGAGAAGCTTGAGCTCTATGCAAAAAGCATGGCTAACGGTGG Amplification de l'insert pour le
plasmide
programmeur de l'acquisition de
l'espaceur contre l'orf27
orf27_cbgGIB_rev ATTACAGCTCCAGATCCAGTACTGAATTCTCACGTACAAATAGTGAGCGTACTCC
orf30_cbgGIB_fwd GAAAATATGCACTCGAGAAGCTTGAGCTCTGAAAAACGAGGTGAAAACAATGGATAC
43
orf30_cbgGIB_rev ATTACAGCTCCAGATCCAGTACTGAATTCTCAATAAAAAAAAGAGAGCGATTGCCC
Amplification de
l'insert pour le
plasmide programmeur de
l'acquisition de
l'espaceur contre l'orf30
orf40_cbgGIB_fwd GAAAATATGCACTCGAGAAGCTTGAGCTCTCAATAAAGATATGGATTTGGTCAGTG Amplification de
l'insert pour le plasmide
programmeur de
l'acquisition de l'espaceur contre
l'orf40
orf40_cbgGIB_rev ATTACAGCTCCAGATCCAGTACTGAATTCTACTATGTTCTTCGCTAGTTCTATCATC
Construction des gabarits de recombinaison
orf22_left_fwd ACTCGAGAAGCTTGAGCTCTAGCCATTCAAACTTTTTGGGGA Amplification de l'insert A pour le
gabarit de
recombinaison visant la délétion de l'orf22
orf22_left_rev2 GTCATCTTGACTGGCAAAAAGACGGGTACG
orf22_right_fwd2 TGCCAGTCAAGATGACTCAGTTAGCGACTGCTAC Amplification de
l'insert B pour le gabarit de
recombinaison visant
la délétion de l'orf22
orf22_right_rev CAGATCCAGTACTGAATTCTGCGATAGGCTATTGACTGCCT
orf23_left_fwd ACTCGAGAAGCTTGAGCTCTTCCGCAATTGATACTAGAAATGGT Amplification de
l'insert A pour le gabarit de
recombinaison visant
la délétion de l'orf23
orf23_left_rev3 CTCTCACTTTTCTAAGCTGATGTTCTTCCTCCTAAAATTGTGTCT
orf23_right_fwd3 AATTTTAGGAGGAAGAACATCAGCTTAGAAAAGTGAGAGGAGCT Amplification de
l'insert B pour le
gabarit de recombinaison visant
la délétion de l'orf23
orf23_right_rev CAGATCCAGTACTGAATTCTGCAAAGCTTTTTCACCGCCT
orf24_left_fwd ACTCGAGAAGCTTGAGCTCTCCCGTCTTTTTGCCAGTCGA Amplification de
l'insert A pour le
gabarit de
recombinaison visant la délétion de l'orf24
orf24_left_rev TCGGTAGCTCCGCCAACCTTATCAATCGT
orf24_right_fwd TTGGCGGAGCTACCGAAAATCAGCAGCA Amplification de
l'insert B pour le gabarit de
recombinaison visant
la délétion de l'orf24
orf24_right_rev CAGATCCAGTACTGAATTCTGCCTTTAGCGTCCTCATTTGC
orf27_left_fwd ACTCGAGAAGCTTGAGCTCTACGGTCACTCTAGGCTCACA Amplification de
l'insert A pour le
gabarit de recombinaison visant
la délétion de l'orf27
orf27_left_rev2 CGTACTCCCCACCGTTAGCCATGCTTTTTGCAT
orf27_right_fwd2 AACGGTGGGGAGTACGCTCACTATTTGTACGTG Amplification de l'insert B pour le
gabarit de
recombinaison visant
la délétion de l'orf27
orf27_right_rev CAGATCCAGTACTGAATTCTCCTGCAAAACTAAAGAACATTCCAGG
orf28_left_fwd ACTCGAGAAGCTTGAGCTCTGGGTCACGTTGGTGTCATGA Amplification de
l'insert A pour le gabarit de
recombinaison visant
la délétion de l'orf28
orf28_left_rev TACTTAAAGGAATTTCAGAACAAACGCCACGATTGGTTTTACTC
orf28_right_fwd AAAACCAATCGTGGCGTTTGTTCTGAAATTCCTTTAAGTATGACAGAAAAT Amplification de
l'insert B pour le
gabarit de recombinaison visant
la délétion de l'orf28
orf28_right_rev CAGATCCAGTACTGAATTCTTGTATCCATTGTTTTCACCTCGT
orf30_left_fwd ACTCGAGAAGCTTGAGCTCTCGAGTTTGGTCAGTTTGGTACGG Amplification de l'insert A pour le
gabarit de
recombinaison visant la délétion de l'orf30
orf30_left_rev2 ATTACAATAAAAAAAAGAGAGCGATTGCCCCATTGTTTTCACCTCGTTTTTCTTACC
T
44
orf30_right_fwd2 TGAGGTAAGAAAAACGAGGTGAAAACAATGGGGCAATCGCTCTCTTTTTTTTATTG Amplification de
l'insert B pour le
gabarit de recombinaison visant
la délétion de l'orf30
orf30_right_rev2 CAGATCCAGTACTGAATTCTCCTTGAGAACCGTATTTTTC
orf32_left_fwd ACTCGAGAAGCTTGAGCTCTGGTCGAAGCCTCAGCATTATGCT Amplification de l'insert A pour le
gabarit de
recombinaison visant la délétion de l'orf32
orf32_left_rev GATAGTTGCATTTTAAATACCTTTCTATTAATAGTTAAAG
orf32_right_fwd TTAAAATGCAACTATCAATGAAATAAAATAGCTAAACCG Amplification de
l'insert B pour le gabarit de
recombinaison visant
la délétion de l'orf32
orf32_right_rev CAGATCCAGTACTGAATTCTGTCATACTAATCGCAAGCGCTGC
orf36_left_fwd ACTCGAGAAGCTTGAGCTCTGCCATGAGGGCTTTAAACCCAAGAG Amplification de
l'insert A pour le
gabarit de recombinaison visant
la délétion de l'orf36
orf36_left_rev AATCTCAGCGTAAGTACCGTCTTTGATAGATCCG
orf36_right_fwd TACTTACGCTGAGATTTCAGAAATTGACCTTCCA Amplification de l'insert B pour le
gabarit de
recombinaison visant la délétion de l'orf36
orf36_right_rev CAGATCCAGTACTGAATTCTCAACGCAAGAGGTGCTTCTGTTATGC
orf40_left_fwd ACTCGAGAAGCTTGAGCTCTGAGAGAGAGTCAAAAAATAAGGTGCCTC Amplification de
l'insert A pour le gabarit de
recombinaison visant
la délétion de l'orf40
orf40_left_rev2 TTCTTCGCCCCAGGTGCATAGATGCCAACTAAC
orf40_right_fwd2 CACCTGGGGCGAAGAACATAGTAGGAGATTAGTAG Amplification de
l'insert B pour le
gabarit de recombinaison visant
la délétion de l'orf40
orf40_right_rev CAGATCCAGTACTGAATTCTCCACTGAATCTTAGGGTCAGCT
orf41_left_fwd ACTCGAGAAGCTTGAGCTCTACTGGAGCACCAAAAGGTTT Amplification de
l'insert A pour le
gabarit de
recombinaison visant la délétion de l'orf41
orf41_left_rev CCACTGTGTACAATCTTAAAACATCATCTTCCATGTTGTCGT
orf41_right_fwd GACAACATGGAAGATGATGTTTTAAGATTGTACACAGTGGAGATG Amplification de
l'insert B pour le gabarit de
recombinaison visant
la délétion de l'orf41
orf41_right_rev CAGATCCAGTACTGAATTCTTGATTTCCTCGTACGCAATGC
orf43_left_fwd ACTCGAGAAGCTTGAGCTCTCCATCGTCGAGTTGGCTGAA Amplification de
l'insert A pour le
gabarit de recombinaison visant
la délétion de l'orf43
orf43_left_rev TACGACCCACAATCAAGCGTCCAGACTGACGACTAAGATAGCAA
orf43_right_fwd TATCTTAGTCGTCAGTCTGGACGCTTGATTGTGGGTCGTA Amplification de l'insert B pour le
gabarit de recombinaison visant
la délétion de l'orf43
orf43_right_rev CAGATCCAGTACTGAATTCTTGGCTTGTTGATTTGTACAGCC
orf44_left_fwd ACTCGAGAAGCTTGAGCTCTTCACAGACCCACAAATGGCA Amplification de l'insert A pour le
gabarit de
recombinaison visant la délétion de l'orf44
orf44_left_rev CCGAATAGCTCTCTAGACAGTGTTCTGCGATGTTCTTCCCT
orf44_right_fwd GGGAAGAACATCGCAGAACACTGTCTAGAGAGCTATTCGGTAAGA Amplification de
l'insert B pour le gabarit de
recombinaison visant
la délétion de l'orf44
orf44_right_rev CAGATCCAGTACTGAATTCTGCCTGCAATTGTGTCGGTC
Criblage et vérification
pNZinsF AATGTCACTAACCTGCCC Criblage des clones
possédant les inserts
dans le vecteur pNZ123
pNZinsR CATTGAACATGCTGAAGA
45
CL-15 TACGAGTTGGACTGCAAACC Vérification de la longueur de la RBP DT26 TTTGACCATCGGCACTATCG
pZN_XbaI_F AGAGCTCAAGCTTCTCGAG Linéarisation du
plasmide pNZ123 digéré par l’enzyme
Xba1 pNZ_xbaI_R AGAATTCAGTACTGGATCTGGAGC
CR1 up TGCTGAGACAACCTAGTCTCTC Amplification du locus 1 du système
CRISPR de S.
thermophilus DGCC7710
RDS7.BamHI GGATCCGGATCCGTTGAGGCCTTGTTC
CR3up CGTAATCGCACTATTAATCTCAG Amplification du
locus 3 du système CRISPR de S.
thermophilus
DGCC7710
CR3down GCTGGATATTCGTATAACATGTT
2.2.3 Génération et purification des phages mutants
Pour générer les délétions dans le génome du phage 2972, le BIM possédant un espaceur visant le
gène à éditer possédant le gabarit de recombinaison correspondant a été inoculé dans 10 ml de milieu
LM17 supplémenté de 5 µg/ml de chloramphénicol et incubé à 37 °C pendant toute la nuit. Trois
dilutions du phage 2972 sauvage (100, 10-1 et 10-2) ont ensuite été préparées en effectuant une dilution
sériée dans 900 µl de tampon de phage 1X (voir «titration de phage» dans la section 2.1.2). Puis, un
volume de 300 µl de culture a été infecté avec 100 µl de la dilution de phage 100 (titre approximatif
de 1x109 ufp/ml) dans 3 ml de gélose molle LM17 + CaCl2 10 mM et le tout a été versé sur gélose
solide LM17 + CaCl2 10 mM + 1% agar. Le tout a été répété pour les dilutions de phages 10-1 et 10-
2. Les géloses ont été incubées à 42 °C pendant 24h ou jusqu’à l’apparition de plages de lyse.
Les phages mutants ont été purifiés trois fois suite à l’édition de génome. Le BIM et son gabarit de
recombinaison a été inoculé dans 10 ml de LM17 + 5 µg/ml de chloramphénicol et incubés à 37 °C
toute la nuit. Une plage de lyse isolée provenant de la première infection a été prélevée avec un
embout tronqué stérile et transférée dans 400 µl de tampon de phage 1X. La plage de lyse a été laissée
un minimum de 20 minutes à la température ambiante pour permettre aux phages mutants de diffuser
dans le tampon. Puis, 300 µl de la culture du BIM et 100 µl du tampon de phage contenant la plage
de lyse ont été ajoutés à 3 ml de gélose molle LM17 + CaCl2 10 mM + 0,75% agar. Le tout a été versé
sur gélose solide LM17 + CaCl2 10 mM + 1% agar et incubé 24h à 42 °C. Cette méthodologie a été
répétée deux autres fois avec une plage de lyse provenant de la deuxième infection, puis de la
troisième infection.
Après la purification, les plages de lyse sont analysées par réaction PCR. Les amorces extérieures
(pNZinsF et pNZinsR) au gabarit de recombinaison ont été utilisées pour vérifier la présence de la
46
délétion chez les phages mutants en les comparant au phage sauvage. Les produits PCR ayant la
délétion attendue ont été envoyés au séquençage et les plages de lyse correspondantes ont été
amplifiées et conservées à long terme (voir section 2.1.2).
Des CEMs (CRISPR Escape Mutants) ont aussi été générés lors de cette étude. Les CEMs sont des
mutants pouvant échapper au système CRISPR-Cas de la bactérie en modifiant leur proto-espaceur,
le plus souvent par une mutation ponctuelle. Un BIM a été mis en culture dans 10 ml de milieu LM17
et incubé à 37 °C pendant toute la nuit. Un volume de 300 µl de la culture a ensuite été transféré dans
3 ml de gélose molle LM17 + 10mM CalCl2 + 0,75 % agar avec une quantité de 106 (volume à calculé
en fonction du titre du lysat de phage) du phage 2972. Le tout a été versé sur gélose solide LM17 +
10 mM CalCl2 + 1% agar. La gélose a été incubée pendant 18 à 24 heures à 42 °C et vérifiée pour la
présence de plages de lyse. Les plages de lyse ont été purifiées trois fois sur le BIM. Une plage de
lyse a été prélevée avec un embout tronqué et transférée dans 300 µl de tampon de phage 1X pendant
20 minutes. Un volume de 300 µl du BIM a été transféré dans 3 ml de gélose molle LM17 + 10mM
CalCl2 + 0,75 % agar avec 100 µl du tampon de phage contenant la plage de lyse prélevée et versée
sur gélose solide LM17 + 10 mM CalCl2 + 1% agar. La gélose a été incubée pendant 18 à 24 heures
à 42 °C. Le processus a été répété deux autres fois. Ensuite, la région du proto-espaceur visé par le
BIM utilisé pour générer le CEM a été amplifiée par PCR et envoyé au service de séquençage pour
identifier la mutation.
2.3 Caractérisation des phages mutants
2.3.1 Courbes de croissance
Plusieurs méthodes peuvent être utilisées pour mesurer l’impact des mutations. Premièrement, il est
possible de faire une courbe de croissance (49). Celle-ci permet d’obtenir le temps de latence, soit le
temps nécessaire à un phage pour compléter son cycle lytique et la taille de la progéniture, soit le
nombre de phages relâchés suite à l’infection d’une cellule par un seul phage. En premier temps, 108
cellules de la souche hôte ont été infectées à une MOI de 0,05 avec le phage mutant et incubées à
42°C pendant 5 minutes pour une adsorption maximale. Puis, la souche infectée a été centrifugée 1
minute à 16 000g. Le surnageant a été enlevé et le culot a été resuspendu dans 1 ml de LM17 + CaCl2
10 mM. Cette étape a été répétée une deuxième fois. Ensuite, une dilution jusqu’à 10-2 a été effectuée
dans 900 µl de milieu LM17 + 10 mM CaCl2. La dilution 10-4 a été faite directement à partir de la
dilution 10-2 en transférant 100 µl de la dilution dans 10 ml de milieu LM17 + CaCl2. Ce tube a été
47
conservé dans un bain-marie à 42 °C pendant l’entièreté de l’expérience. Un échantillon de 100 µl de
la dilution 10-4 a ainsi été prélevé pendant 80 minutes à intervalles de 10 minutes. Toutes les dilutions
subséquentes proviennent du tube 10-4. Les dilutions 10-4, 10-5 et 10-6 ont été titrées en triplicata
biologique (voir section 2.1.2) pour les 30 premières minutes pour évaluer la concentration en nombre
de phages par millilitre. Après 30 minutes après le début de l’expérience, les dilutions 10-5, 10-6 et 10-
7 ont été utilisées pour la titration. Toutes les boîtes de Pétri ont été incubées pendant 24h à 42 °C.
Suite à l’incubation, le titre est estimé à partir de la dilution qui contient entre 30 et 300 plages de
lyse pour chaque temps prélevé (voir l’équation de la section 2.1.2). Un graphique semi-
logarithmique du titre du phage (UFP/ml en échelle logarithmique) en fonction du temps en minutes
a été réalisé à l’aide du programme Excel. Le temps de latence a été estimé à partir de ce graphique.
Cette donnée correspond au temps au milieu de la courbe entre les deux plateaux, comme l’indique
la ligne noire au temps 45 minutes sur le graphique démonstratif suivant (figure 2.3).
Figure 2.3 : Exemple d’un graphique résultant d’une courbe de croissance de phage standard. La ligne noire
représente le temps de latence. Il est possible de voir les deux plateaux qui se situent avant et après la lyse des
cellules suite au cycle lytique. Le plateau initial est aux temps 10, 20 et 30 minutes pour le titre du phage à
environ 6,5 Log et le plateau final se trouve aux temps 60, 70 et 80 minutes où le titre du phage est à environ
9,7 Log.
Finalement, la taille de la progéniture a été déterminée en calculant le titre à chaque point des plateaux
et en faisant la moyenne pour chaque plateau individuel. Le titre pour le premier plateau correspond
au titre initial et le titre pour le deuxième plateau correspond au titre final. La taille de la progéniture
a été calculée selon l’équation suivante.
48
(Titre final – Titre initial) / Titre initial = Taille de la progéniture
2.3.2 Test d’adsorption
Un test d’adsorption a été effectué pour mesurer la capacité du phage à s’attacher aux récepteurs de
la paroi bactérienne (46). Les souches hôtes (BIM et sauvage) sont incubées à 37 °C toute la nuit dans
10 ml de milieu LM17. Le phage sauvage et le phage mutant à tester ont été dilués chacun en série
pour avoir un titre d’environ 1,5 x 104 ufp/ml. Puis, 2 tubes de 10 ml de milieu LM17 ont été inoculés
à 2% avec les souches différentes et incubés à 42°C jusqu’à l’obtention d’une DO600 entre 0,6 et 0,8.
Un volume de 100 µl de la dilution du phage sauvage est ajouté à 900 µl de la culture sauvage, 900
µl du BIM et 900 µl de milieu non inoculé comme contrôle négatif. Le tout a été répété pour le phage
mutant. Les six conditions, soit culture sauvage, culture résistante et contrôle pour chaque phage, ont
été incubées à 42 °C pendant 5 minutes et répéter pour 10 minutes. Les microtubes ont été centrifugés
à 16 000g pendant une minute et le surnageant a été récupéré et titré (voir section 2.1.2). Le
pourcentage d’adsorption pour le phage sauvage et le phage mutant a été calculé avec l’équation
suivante.
[(Titre du contrôle négatif – Titre du surnageant de la culture) / Titre du contrôle négatif] x 100
2.3.3 Microscopie électronique à transmission
Il est possible d’observer la morphologie des phages à l’aide de la microscopie électronique à
transmission (10). Les lysats non purifiés du phage 2972 sauvage, du phage 2972Δ22 et du phage
2972Δ24 ont été observés à la Plateforme d’imagerie moléculaire et microscopie à l’IBIS. Le
microscope électronique à transmission JEOL modèle JEM-1230 et une coloration à l’acide
phosphotungstique 2% ont été utilisés. Les mesures de la capside et de la queue ont été faites à l’aide
de l’outil «Mesure» dans le logiciel Adobe Illustrator© CC 2018 sur un minimum de trois particules
virales.
2.3.4 Spectrométrie de masse
Le phage 2972 purifié selon Sambrook et al. a été envoyé à la Plateforme de protéomique du Centre
de recherche du CHU (Centre Hospitalier Universitaire) du Québec pour le service d’identification
49
des protéines (191). Ce service permet d’identifier les protéines structurales, ou présentes dans la
capside, du phage sauvage. Un spectromètre de masse Orbitrap Fusion (Thermo) a été utilisé pour
réaliser une analyse de type LC-MS/MS de 60 minutes. L’échantillon a préalablement été dessalé et
digéré en solution avec la trypsine. Les données ont ensuite été analysées avec le programme Scaffold
4©.
2.3.5 Production de BIM
La capacité d’une souche à produire des BIM face au phage mutant a été vérifiée pour caractériser
une partie des interactions phage-bactérie (80). Comme le principal moyen de défense chez l’espèce
S. thermophilus est le système CRISPR-Cas, les évènements d’acquisition d’espaceurs ont été
analysés pour le phage sauvage, le phage mutant et un CEM (CRISPR Escaping Mutant) ne possédant
qu’une mutation ponctuelle dans la région du proto-espaceur ou du PAM comme contrôle.
Les BIM ont été générés par la méthode suivante. Une culture de la souche sauvage et le BIM qui a
servi à générer la délétion dans le phage ont été incubés à 37 °C pendant toute la nuit dans 10 ml de
milieu LM17. Un volume de 200 µl a été ajouté à 10 ml de milieu LM17 pour chaque souche et
incubé à 42 °C jusqu’à une DO600 de 0,6. Les cultures ont ensuite été mélangées à l’aide du vortex
pendant 1 minute. Un volume de 300 µl de culture et 1 x 108 virions (volume variable en fonction du
titre de départ) ont été ajoutés à 3 ml de gélose molle LM17 + CaCl2 10 mM + 0,75% agar et versés
sur gélose solide LM17 + CaCl2 10 mM + 1% agar. Chaque phage (sauvage, mutant et CEM) a été
testé en triplicata avec chaque souche (sauvage et BIM). Toutes les boîtes de Pétri ont été incubées à
42 °C pendant 48h.
Les colonies résultantes ont été dénombrées pour chaque condition. Les loci CRISPR 1 des colonies
(48 pour chaque) générées à partir des combinaisons BIM + phage mutant et BIM + CEM ont été
séquencés, car la majorité des acquisitions se font dans ce locus et les évènements d’acquisition ont
ensuite pu être analysés (96).
50
2.4 Caractérisation des protéines sauvages
2.4.1 Choix et synthèse des protéines
Douze gènes ont été analysés dans cette recherche et donc un total de douze protéines codées par ces
gènes peuvent être potentiellement caractérisées par des techniques biochimiques. Il est évident que
ce nombre représente une charge de travail importante et donc, il est nécessaire de viser les protéines
ayant un intérêt scientifique significatif. Les produits des gènes qui sont essentiels pour la réplication
virale ou qui démontrent un phénotype altéré ont été retenus, car ils suscitent un intérêt marqué pour
l’objectif de recherche. De plus, une analyse bio-informatique sur la prédiction des structures de
toutes les protéines du phage 2972 a été faite, en plus de l’analyse de la solubilité qui est un facteur
important lorsque l’on étudie les protéines (171). Les protéines ayant un modèle de prédiction fiable,
ne possédant pas de segments transmembranaires et détenant un taux de solubilité élevé sont d’un
plus grand intérêt. Puis, il est préférable d’avoir des protéines ayant une taille plus petite que 100
résidus, car la détermination de la structure par spectroscopie RMN des protéines plus grosses est trop
complexe. En se fiant à tous ces critères, trois protéines ont été sélectionnées, soit les produits des
gènes de l’orf32, l’orf40 et l’orf41.
Les protéines ont été synthétisées par la compagnie Bio Basic© à un pourcentage de pureté > 95 %
(95,71% pour ORF32, 95,98% pour ORF40 et 95,28% pour ORF41). Un poids de 14,5 mg a été
synthétisé pour chaque protéine.
2.4.2 Prédictions bio-informatiques
Les prédictions bio-informatiques ont été exécutées par Vincent Boulanger, étudiant au baccalauréat
dans le laboratoire de Stéphane Gagné à l’Institut de biologie intégrative et des systèmes (IBIS), dans
le cadre de son projet de recherche en collaboration avec le Professeur Sylvain Moineau intitulé
«Structure Determination of Virulent Bacteriophage 2972 of Streptococcus thermophilus Proteins»
(171). Les modèles bio-informatiques des différentes protéines du phage 2972 ont été déterminés en
utilisant plusieurs logiciels appliqués en fonction du pointage donnés suite à l’analyse. Ces logiciels
sont I-TASSER 5.1, QUARK server, ThreaDomEx, COACH and COFACTOR. Le logiciel
I_TASSER 5.1 a été utilisé pour prédire la structure des protéines codées par l’orf32 et par l’orf41 et
QUARK server a été utilisé pour prédire la structure de la protéine codée par l’orf40.
51
2.4.3 Dichroïsme circulaire
Le dichroïsme circulaire est une méthode pour estimer les structures secondaires des protéines (172).
Un spectropolarimètre de dichroïsme circulaire modèle Jasco J-815 a été utilisé dans le cadre de cette
recherche. Les protéines ORF32 et ORF40 synthétisées ont été solubilisées dans un tampon sodium
phosphate 25 mM pH 4.5 à une concentration de 1 mg/ml. Le tampon a servi de contrôle négatif pour
la prise de mesures. Les échantillons ont été transférés dans des cellules de quartz ayant une épaisseur
de 0,2 mm. Un spectre complet à 25 °C, à 42 °C et à 80 °C a été enregistré pour chaque protéine à
des longueurs d’onde de 190 nm à 260 nm en utilisant le programme d’acquisition Spectra
Measurement. Une mesure a été prise à chaque 0,1 nm avec une vitesse de 100 nm/minute pour dix
accumulations (n=10).
Une courbe de dénaturation a aussi été enregistrée pour chaque protéine en utilisant le programme
Variable Temperature Measurement. Selon les spectres complets précédemment enregistrés, les
longueurs d’onde de 222 nm, 208 nm et 201 nm ont été choisies pour prendre les mesures, car elles
représentent les pics les plus négatifs des spectres. Un intervalle de température de 25 °C à 80 °C,
ainsi qu’une prise de mesure à chaque 2 °C pour une vitesse d’augmentation de 1 °C/minute ont été
utilisés.
Le signal provenant du contrôle négatif a été soustrait des données brutes et ensuite elles ont été
transformées en ellipticité molaire à l’aide de l’outil Spectra Analysis dans le logiciel Spectra
Manager (version 2.08.01) en fonction de la concentration molaire par résidu selon l’équation
suivante.
Concentration molaire = (1000*Nombre de résidus*Concentration de la protéine en g/mol)
Masse molaire de la protéine en g/mol
52
Les proportions en structures secondaires ont été estimées avec l’outil CDPro et les bases de données
disponibles dans le service de Nanomédecine et de nanobiotechnologie de PROTEO, ainsi que les
méthodes de calculs incluses dans l’outil. Un exemple de spectres générés par chaque type de
structure est représenté dans la figure suivante.
Figure 2.4 : Signaux de dichroïsme circulaire émis par les différents types de structures secondaires en fonction
de la longueur d’onde en nanomètre. La courbe en noire représente les hélices α, la courbe lignée en bleue
représente les feuillets β et la courbe pointillée en mauve représente une structure désordonnée, tirée de
Campbell (172).
53
CHAPITRE 3: Résultats
3.1 Édition de génome du phage 2972
3.1.1 Construction des BIM «sur demande»
Tableau 3.1 : Espaceurs intégrés dans les locus CRISPR1 ou CRISPR3 de la souche S. thermophilus
DGCC7710 suite à la programmation du système CRISPR-Cas natif (BIM «sur demande»).
Nom
du
BIM
Locus Séquence de l'espaceur (5’-
3’) PAM
Position du
proto-espaceur Brin
Gène
correspondant
AR1 CR1
CCAAGAAAACTTCCCTCAA
CGTGCTGAAAA CGAGAAA 23 599 - 23 629 + orf22
AR2 CR3
CGTGCCAAGTCTGGTATAA
TAGTATCAGAA AGGTG 25 379 – 25 408 + orf27
AR3 CR3
GATCCTATTTATATTAGTG
TGGATATTAAT AGGAG 26 175 - 26 205 + orf30
AR4 CR1
CCGCATATTAACATTGGAA
CAGTTACCAGA TGAGAAA 32 937 - 32 967 + orf40
Il a été démontré que le système CRISPR-Cas de type II-A chez S. thermophilus peut être programmé
pour acquérir un espaceur spécifique dans un des loci CRISPR présents chez cette bactérie (169).
Cette méthode est beaucoup plus précise que la méthode traditionnelle, où l’acquisition se fait de
manière aléatoire et induit un biais en fonction de la taille des gènes et de la disposition des PAM
dans le génome (44). On voit ici une acquisition ciblée des espaceurs pour chaque orf permettant
d’obtenir des BIM nécessaires à l’étude (tableau 3.1). Les espaceurs ont été acquis dans les deux loci
différents CR1 et CR3, selon la disponibilité dans le gène ciblé, en respectant les PAM types de
chaque locus (NNAGAAW pour CR1 et NGGNG pour CR3), ceci pour chaque gène ciblé par
l’acquisition.
Tableau 3.2 : EOP du phage 2972 sur les BIM construits suite à la programmation du système CRISPR-Cas.
Nom du BIM Titre sur la souche
résistante (ufp/ml)
Titre sur la souche
sensible (ufp/ml) EOP
AR1 1 x 103
2 x 109
5 x 10-7
AR2 1 x 103 5 x 10-7
AR3 2 x 102 1 x 10-7
AR4 1 x 104 5 x 10-6
54
De plus, l’EOP du phage 2972 sur les BIM a été calculé pour déterminer la force de leur résistance à
ce phage (tableau 3.2). Les BIM AR1, AR2, AR3 et AR4 ont obtenu respectivement des valeurs
d’EOP de 5 x 10-7, 5 x 10-7, 1 x 10-7 et 5 x 10-6.
3.1.2 Génération et purification des phages mutants
Le génome du phage 2972 comporte un total de 44 orfs putatifs dont 16 de ces gènes prédits codent
pour des protéines de fonction inconnue (tableau 2.2). Deux de ces gènes se trouvent dans les modules
qui codent pour des protéines structurales et donc représentent un intérêt moindre dans le cadre de la
recherche, ce qui laisse 14 orfs putatifs à l’étude, dont 12 ont été ciblés pour l’édition de génome du
phage 2972. L’objectif principal était d’éditer le génome de ce phage et d’identifier le génome
minimal requis pour la survie virale.
Tableau 3.3 : Information génétique sur les gènes à l’étude du phage 2972.
Orfs
inconnus
Longueur de la
délétion / Longueur
totale du gène Importance
du gène*
Expression
temporelle
Le gène
est-il
essentiel ?
Fréquence
d’isolement
(n=50) nt. *** a.a****
22 171/387 57/129 Génome de
cœur Tardive Non 30,0 %
23 144/144 48/48 Conservé Tardive ND** -
24 126/333 42/111 Unique à 2972 Tardive Non 62,5 %
27 72/123 24/41 Conservé Non
caractérisée Non 25,0 %
28 123/186 41/62 Conservé Non
caractérisée Non 100 %
30 87/132 29/44 Conservé Précoce ND** -
32 102/123 34/41 Conservé Précoce Oui 0 %
36 363/456 121/152 Conservé Précoce Non 20,0 %
40 180/252 60/84 Conservé Précoce Oui -
41 69/156 23/52 Conservé Précoce Non 33,3 %
43 231/327 77/109 Conservé Précoce Non 20 %
44 435/708 145/236 Génome de
coeur Précoce ND** -
* Parmi les phages de Streptococcus thermophilus
** Non déterminé
*** nt : nucléotide
**** a.a. : acide aminé
55
En utilisant le système CRISPR-Cas de type II-A chez S. thermophilus et un gabarit de recombinaison
ayant une délétion majeure, on permet au phage de contourner le système CRISPR-Cas au détriment
de la perte d’un gène. Si l’absence de ce gène n’est pas létale à la réplication du phage et que plusieurs
mutants peuvent être isolés, ce gène est déterminé comme non essentiel en condition de laboratoire.
Au total, 9 de ces gènes (orfs 22, 24, 27, 28, 32, 36, 40, 41 et 43) ont pu être étudiés sur 12 au total,
dont deux (orfs 32 et 40) ont été identifiés comme essentiels à la réplication du phage in vitro (tableau
3.3). L’importance de ces gènes varie entre des gènes faisant partie du génome de cœur des phages
de type pac et cos, gènes conservés parmi les phages de S. thermophilus et des gènes uniquement
présents chez 2972. La majorité des gènes a une expression temporelle précoce, donc ils sont
exprimés tôt dans le cycle infectieux (49).
Figure 3.1 : Migration des produits PCR des régions délétées et sauvages pour les sept gènes
identifiés comme non essentiels au génome du phage 2972. Les nombres impairs sont des
amplifications faites à partir du phage 2972 sauvage et les nombres pairs sont des amplifications faites
à partir des phages mutants pour chaque orf identifié. M : Échelle moléculaire 1Kb + DNA ladder
(Invotrogen).
Une fois les mutants obtenus, les plages de lyse ont été purifiées trois fois pour obtenir des lysats purs
ayant une délétion dans un gène ciblé (figure 3.1). L’ADN des lysats purifiés pour le phage 2972 et
les mutants des orfs 22, 28, 41 et 43 a ensuite été extrait pour procéder au séquençage complet du
génome avec Illumina (tableau 3.4). Les délétions ciblées dans les bons cadres de lecture ont toutes
été identifiées. Une mutation ponctuelle dans l’orf18 a aussi été identifiée chez tous les phages, mais
comme elle se trouve aussi dans le phage sauvage il est donc possible qu’il y ait eu une erreur de
56
séquençage dans le génome de référence ou que le génome du phage sauvage ait évolué avec le temps.
Les autres mutations identifiées ont toutes été confirmées et infirmées par PCR (tableau 3.4).
Tableau 3.4 : Résultats du séquençage Illumina pour les phages 2972, 2972Δ22, 2972Δ28, 2972Δ41 et
2972Δ43.
Phage Type de mutation Position Gène Confirmation
PCR
2972 Ponctuelle 14 045 Orf18 – Tape Mesure
Protein
Présente
2972Δ22 Ponctuelle 2952 Orf4 – Terminase large
Subunit
Présente
Ponctuelle 4009 Orf5 – Portal Protein Présente
Ponctuelle 14 045 Orf18 – Tape Mesure
Protein
Présente
Délétion Variable Orf20 – Receptor Binding
Protein
Présente
Délétion 23 548 – 23 712 Orf22 - Unknown Présente
2922Δ28 Ponctuelle 14 045 Orf18 – Tape Mesure
Protein
Présente
Délétion 25 521 – 25 644 Orf28 - Unknown Présente
2972Δ41 Ponctuelle 14 045 Orf18 – Tape Mesure
Protein
Présente
Délétion 33 076 – 33 145 Orf41 - Unknown Présente
2972Δ43 Ponctuelle 14 045 Orf18 – Tape Mesure
Protein
Présente
Délétion 33 753 – 33 891 Orf43 - Unknown Présente
3.2 Caractérisation des phages mutants
3.2.1 Courbes de croissance
Pour mesurer l’impact des délétions sur la réplication virale, une courbe de croissance pour trois des
sept mutants obtenus a été faite. Cette méthode est utile pour visualiser les effets d’un gène en moins
dans le génome. Le phage 2972 a servi de référence et le phage 2972 possédant une RBP courte, qui
est un mutant spontané obtenu en laboratoire, a servi de comparaison pour les temps de latence plus
courts. Comme les titres de départs utilisés étaient différents pour chaque lysat, les résultats ont été
reportés sur un titre relatif où un seul phage génère une progéniture (figure 3.2).
Les données des temps de latence et des tailles de la progéniture sont obtenues en triplicata de chaque
expérience. Une moyenne et un écart-type sont ensuite engendrés pour toutes les courbes de
croissance (tableau 3.5). Pour le phage de référence 2972, on observe une taille de la progéniture de
121 ± 22 phages après un temps de latence de 53 ± 1,5 minutes. Une taille de la progéniture similaire
57
est observée chez le phage 2972 RBP courte qui est de 123 ± 45 virions produits par cellule, toutefois
cette progéniture est relâchée plus tôt que le phage 2972 sauvage, à un temps de 44 ± 4,7 minutes.
Des temps de latence plus courts sont aussi observés chez les phages mutants 2972Δ22, 2972Δ41 et
2972Δ43 respectivement de 37 ± 1,0 minutes, 41 ± 2,8 minutes et 43 ± 2,3 minutes. Ces temps de
latence sont semblables au temps de latence obtenue pour le mutant spontané 2972 RBP courte, et
donc un PCR a été effectué sur la région de l’orf20 (Receptor Binding Protein) pour vérifier la
longueur de cette protéine. Tous les sept phages mutants produits possèdent la version longue de la
RBP, et donc la réduction du temps de latence est un effet de la délétion et non de la longueur de la
RBP.
Figure 3.2 : Courbe de croissance à partir du titre relatif en fonction du temps pour cinq phages. Les données
ont été faites en triplicata biologiques et techniques. La courbe en bleu et la courbe en jaune représentent
respectivement le phage de référence 2972 et le phage de référence pour le temps de latence plus court, 2972
RBP courte. La courbe en vert, la courbe en rose et la courbe en gris représentent respectivement le phage
2972Δ22, 2972Δ41 et 2972Δ43.
Le nombre de virions relâchés par bactérie pour les trois phages mutants analysés varie en fonction
du mutant. Le phage 2972Δ41 a une taille de la progéniture de 65 ± 25 phages, ce qui représente la
moitié de celle du phage 2972 et le phage 2972Δ43 a une taille de la progéniture de 19 ± 6 phages,
ce qui représente un sixième de la population normalement produite. Pour ce qui est du phage
2972Δ22, la taille de la progéniture est d’au moins 63 phages, car suite au premier cycle de réplication
courte
58
(environ 43 minutes), le nombre de plages de lyse ne cesse d’augmenter au lieu d’observer un plateau
jusqu’à la deuxième lyse.
Tableau 3.5 : Données correspondantes aux courbes de croissance des phages 2972, 2972 RBP courte,
2972Δ22, 2972Δ41 et 2972Δ43.
Phage
Taille de la
progéniture
(virions/cellule)
Temps de latence
(minutes)
2972 121 ± 22 53 ± 1,5
2972 RBP courte 123 ± 45 44 ± 4,7
2972Δ22 > 63 37 ± 1,0
2972Δ41 65 ± 25 41 ± 2,8
2972Δ43 19 ± 6 43 ± 2,3
3.2.2 Test d’adsorption
L’orf22 est un gène putatif situé près du module de morphologie de la queue du phage, en plus d’avoir
une expression temporelle tardive (tableau 3.2). Il se peut donc qu’il ait un rôle structural dans le
génome et que le phénotype observé lors des courbes de croissance soit dû à une morphologie
différente et non à un cycle de réplication modifié. L’adsorption à la cellule bactérienne est un
paramètre influencé par la morphologie de la queue, plus particulièrement par la plaque basale (15).
Un test d’adsorption après 10 minutes seulement a donc été fait pour mesurer l’adsorption du phage
2972Δ22 à la souche DGCC7710, en utilisant le phage 2972 comme contrôle positif et le phage
2972Δ41 comme mutant contrôle.
Tableau 3.6 : Pourcentage d’adsorption après 10 minutes des phages 2972, 2972Δ22 et 2972Δ41 sur la souche
S. thermophilus DGCC7710.
Phage Pourcentage d’adsorption
(après 5 minutes)
Pourcentage d’adsorption
(après 10 minutes)
2972 96,6 ± 0,9 96,4 ± 2,4
2972 RBP courte 92,4 ± 1,4 89,6 ± 10,4
2972Δ22 ND 72,6 ± 5,1
2972Δ41 96,7 ± 0,9 99,6 ± 0,5
*ND : Non déterminé
Le phage 2972 et 2972Δ41 ont des pourcentages d’adsorption similaires, soit de 96,4 ± 4,3% et 99,2
± 2,4% respectivement selon le tableau 3.6. Cela indique que lorsque ces phages sont en contact avec
59
la souche DGCC7710, presque la totalité des phages s’adsorbe rapidement à la surface de la bactérie.
Toutefois, le pourcentage d’adsorption pour le phage 2972Δ22 est de 72,6 ± 5,1%, ce qui représente
une diminution significative par rapport au phage sauvage.
3.2.3 Microscopie électronique à transmission
Les résultats obtenus suite aux tests d’adsorption suggèrent que l’orf22 pourrait jouer un rôle
structural, plus particulièrement dans la morphologie de la queue ou de la plaque basale due à son
emplacement dans le génome et à son adsorption modifiée. L’observation des particules virales en
microscopie électronique à transmission permet une analyse rapide de la morphologie des phages et
d’identifier les différences s’il y a lieu.
Figure 3.3 : Photo en microscopie électronique à transmission des phages 2972 (A) et 2972Δ22 (B). La barre
pour chaque photo représente une longueur de 50 nm. Une coloration à l’acide phosphotungstique a été utilisée.
La figure 3.3 montre une photo en microscopie électronique à transmission du phage 2972 et
2972Δ22. À première vue, aucune distinction morphologique ne semble apparente entre ces deux
phages. Le phage 2972 possède une queue de 256 ± 8 nm et une capside de 69 ± 3 nm et le phage
2972Δ22 possède une queue de 266 ± 6 nm et une capside de 63 ± 4 nm (tableau 3.7). Ces mesures
n’ont pas de différence significative entre elles et donc la morphologie des deux phages est très
semblable.
A
B
60
Tableau 3.7 : Mesure des dimensions de la queue (n=3) et de la capside (n=9) du phage 2972 et du phage
2972Δ22.
Phage Mesure de la queue (nm) Mesure de la capside (nm)
2972 256 ± 8 69 ± 3
2972Δ22 266 ± 6 63 ± 4
3.2.4 Spectrométrie de masse
Les résultats observés par microscopie électronique précédemment montrent que le phage 2972 et le
phage 2972Δ22 ont une morphologie comparable. Toutefois, la plaque basale est un élément très
difficile à observer avec ce type de microscope et donc si la protéine codée par l’orf22 joue un rôle
dans la structure du phage, ce ne sera pas visible lors des résultats. C’est pourquoi le phage 2972 a
été analysé par spectrométrie de masse, pour tenter de détecter la protéine de ORF22 et vérifier son
rôle structural.
Tableau 3.8 : Les protéines du phage 2972 détectées par spectrométrie de masse.
Protéine détectée
Poids
moléculaire
(kDa)
Nombre de
peptides
uniques
Pourcentage de
couverture
Orf2_Small terminase subunit 17 2 15%
Orf5_Portal Protein 58 20 46%
Orf6_Minor Head Protein 34 12 44%
Orf7_Scaffold/Prohead capsid Assembly 21 6 58%
Orf8_Capsid Protein 13 6 50%
Orf9_Major capsid Protein 37 11 37%
Orf11_Head to Tail Joint 13 4 57%
Orf12_Minor capsid Structural Protein 11 6 67%
Orf13_Unknown 12 3 40%
Orf14_Structural Protein 15 4 46%
Orf15_Major Tail Protein 19 8 67%
Orf18_Tape Measure Protein 154 31 26%
Orf19_Tail-tip Protein 58 20 61%
Orf20_Receptor Binding Protein (RBP) 177 59 52%
Orf21_Phage Baseplate Protein 74 19 42%
Orf24_Unknown 12 5 46%
Orf25_Holin 12 1 14%
Orf26_Endolysin 22 6 46%
Orf36_Unknown 17 1 9.3%
Orf42_DNA Binding 20 1 6.5%
61
La spectrométrie de masse permet de détecter les protéines structurales ou encapsidées du phage et
de confirmer plus précisément le rôle qu’elles jouent dans le génome. Le tableau 3.8 montre que 20
protéines sur 44 protéines prédites ont été détectées par spectrométrie de masse, où un seul peptide
unique est détecté pour trois protéines. Donc, 2 peptides uniques ont été détectés pour 17 protéines
du phage 2972 avec un pourcentage de couverture de la séquence en acides aminés variant entre 15%
et 67%. La majorité de ces protéines ont déjà été annotées comme des protéines structurales
auparavant (en bleu dans le tableau 3.5, les protéines non structurales sont en orange), cependant
l’ORF24 a été décelé avec 5 peptides uniques pour un pourcentage de couverture de 46%. La fonction
du gène codant pour cette protéine est inconnue (encadré rouge dans le tableau 3.5) et un mutant a
été obtenu pour cet orf (tableau 3.2).
3.2.5 Production de BIM
La production de BIM chez la souche S. thermophilus DGCC7710 et les BIM appropriés a été testée
en utilisant les phages mutants pour voir si les interactions entre les phages mutants et l’hôte sont
différentes. Plusieurs productions de BIM ont été faites et les espaceurs acquis ont été séquencés pour
la présence d’un motif d’acquisition. Les tableaux 3.9 et 3.10 montrent qu’en moyenne une
cinquantaine de BIM sont produits par le système CRISPR-Cas sauvage lors d’une première
infection, soit une souche non résistante et un phage qui peut l’infecter. Ces nombres ne semblent pas
augmenter lorsque la souche sauvage est infectée avec les phages mutants 2972Δ41 et 2972Δ22. Les
CEM utilisés comme contrôle positif (phage résistant) possèdent une mutation ponctuelle dans le
proto-espaceur leur conférant la résistance au système CRISPR-Cas de type II-A présent dans la
souche (tableau 2.1).
La production de BIM suite à l’infection par les phages mutants varie quelque peu par rapport au
système sauvage. Sur la souche sensible, le CEM41 a tendance à produire plus de BIM et le CEM22
produit moins de BIM. Cependant, les nombres changent beaucoup lorsqu’une souche résistante
(BIM) est infectée par un phage mutant. Dans le contexte de cette expérience, il n’y a pas de
reconnaissance du proto-espaceur du phage mutant par le BIM, car le proto-espaceur est absent du
génome viral. Cependant, il y a reconnaissance partielle entre l’ARNcr d’un BIM et le proto-espaceur
d’un CEM, car une seule paire de base est mutée. Lorsque l’on compare les BIM produits suite à
l’infection par le phage mutant et ceux produits suite à l’infection par le CEM, il est possible de
constater une augmentation prononcée pour le CEM41 et légère pour le CEM22 (tableaux 3.9 et 3.10).
62
Tableau 3.9 : Capacité de production de BIM avec la souche DGCC7710 et le BIM AR1 contre les phages
2972, 2972Δ22 et CEM22.
Lorsque le BIM AR1 est infecté par le phage CEM22, le nombre de BIM augmente d’un facteur de
1,4 par rapport à la souche sauvage. Cette augmentation est d’un facteur de 27 pour le BIM A-35 et
le CEM41 (figure 3.5). Pour les BIM générés avec les phages mutants et leurs BIM respectifs, aucune
augmentation n’est observée pour le phage 2972Δ22 et une légère augmentation d’un facteur de 7 est
observée pour le phage 2972Δ41 (figures 3.4 et 3.5).
Figure 3.4 : Le ratio de la production de BIM avec deux phages mutants (2972Δ22 et CEM22) par rapport au
phage 2972 sauvage en fonction de deux souches testées (DGCC7710 et BIM AR1). Les colonnes en bleu
représentent les données générées à partir de la souche DGCC7710 et les colonnes en rouge représentent les
données générées à partir de la souche AR1. La ligne noire représente le ratio de 1, ce qui correspond au ratio
de BIM produit par le phage 2972.
Phage Souche
DGCC7710 BIM AR1
2972 90,7 ± 20,2 -
2972Δ22 61,3 ± 24,5 72,2 ± 17,6
CEM22 11,8 ± 7,7 120,3 ± 37,7
63
Tableau 3.10 : Capacité de production de BIM avec la souche DGCC7710 et le BIM A-35 contre les phages
2972, 2972Δ41 et CEM41.
Phage Souche
DGCC7710 BIM A-35
2972 25,3 ± 3,8 -
2972Δ41 28,8 ± 3,5 185,6 ± 16,5
CEM41 45,7 ± 6,8 662,9 ± 29,4
Figure 3.5 : Le ratio de la production de BIM avec deux phages mutants (2972Δ41 et CEM41) selon le phage
2972 sauvage en fonction de deux souches testées (DGCC7710 et BIM A-35). Les colonnes en bleu représentent
les données générées à partir de la souche DGCC7710 et les colonnes en rouge représentent les données
générées à partir de la souche A-35. La ligne noire représente le ratio de 1, ce qui correspond au ratio de BIM
produit par le phage 2972.
64
Figure 3.6 : Dispersion des proto-espaceurs visés sur le génome du phage 2972 par le locus 1 du système CRISPR-Cas de S. thermophilus lors d’une pression
sélective face aux phages ayant diverses mutations dans l’orf22 (A) et l’orf41 (B). Les flèches bleues sont des proto-espaceurs visés suite à la génération de BIM
avec les phages possédant une délétion (2972Δ22 pour A et 2972Δ41 pour B) et les flèches roses sont des proto-espaceurs visés suite à la génération de BIM avec
les phages ne possédant qu’une mutation ponctuelle (CEM22 pour A et CEM41 pour B). L’orientation des flèches indique la position des proto-espaceurs sur les
brins d’ADN. Les flèches pointant vers la droite sont des proto-espaceurs positionnés sur le brin positif et les flèches pointant vers la gauche sont des proto-espaceurs
positionnés sur le brin négatif.
A
B
65
La figure 3.6 permet une observation du motif d’acquisition des espaceurs suite à l’infection par
différents phages pour leur BIM associé. La majorité des proto-espaceurs visés se situent dans la
région codant pour des protéines non structurales. Les espaceurs acquis ne visent pas nécessairement
une région proche des mutations induites (flèches en noir sur le génome du phage 2972) comme les
flèches bleues et roses ne sont pas agglomérées autour de ces gènes. Toutefois, les proto-espaceurs
sont majoritairement orientés dans le même sens que le proto-espaceur muté, soit positionnés sur le
brin positif.
Pour les proto-espaceurs visés suite à l’infection par les phages 2972Δ41 et CEM41, une proportion
de respectivement 72,5 % (37/51) et 77,5% (31/40) des séquences sont positionnées sur le brin positif,
puis pour les proto-espaceurs visés suite à l’infection par les phages 2972Δ22 et CEM22, une
proportion de respectivement 84,6% (22/26) et 80% (36/45) des séquences sont positionnées sur le
brin positif.
3.3 Caractérisation des protéines sauvages
3.3.1 Prédictions bio-informatiques
Les modèles de structure des protéines déterminées par les outils bio-informatiques peuvent donner
une piste quant à la vraie conformation de celles-ci. Elles peuvent identifier des domaines possibles,
les sites de liaison à certains ligands et aider à prédire la solubilité des protéines. En général, la
première étape pour prédire la structure d’une protéine consiste à chercher si d’autres protéines ont
une similarité de séquence dans les bases de données pour pouvoir élaborer une structure à partir d’un
modèle d’homologie (173). Malheureusement, toutes les protéines inconnues du phage 2972
sélectionnées semble avoir une similitude de séquence avec d’autres protéines de phages infectant le
genre Streptococcus qui n’ont pas de fonctions assignées et qui n’ont pas de structures déterminées
(données non présentées), d’où l’importance de l’étude. Donc, les prédictions bio-informatiques
quant à la structure des protéines ORF32, ORF40 et ORF41 ont seulement été déterminées par les
logiciels QUARK ou I-TASSER (figures 3.7, 3.8 et 3.9).
66
Figure 3.7 : Prédiction bio-informatique de la structure secondaire de l’ORF32 réalisée avec le logiciel I-
TASSER (171).
Figure 3.8 : Prédiction bio-informatique de la structure secondaire de l’ORF40 réalisée avec le logiciel
QUARK (171).
67
Figure 3.9 : Prédiction bio-informatique de la structure secondaire de l’ORF41 réalisée avec le logiciel I-
TASSER (171).
Selon la figure 3.7, la structure de l’ORF32 semble composée principalement de deux hélices α reliées
par une boucle et un peu de structure désordonnée. L’ORF40, quant à elle, serait composée de cinq
hélices α et de quelques séquences désordonnées (figure 3.8), puis l’ORF41 prédit une hélice α, deux
feuillets β et un peu de séquences désordonnées.
3.3.2 Dichroïsme circulaire
Les spectres de dichroïsme circulaire peuvent révéler deux caractéristiques des protéines. D’abord, il
est possible d’avoir une estimation de la structure secondaire d’une protéine, puis il est possible
d’évaluer la température de dénaturation de celle-ci. Les deux protéines analysées (ORF32 et ORF40)
semblent posséder plusieurs types de structures secondaires différents et non un seul. La structure est
similaire à 25°C et 42 °C pour les deux protéines analysées, puisque leurs spectres en bleu et en jaune
sont presque identiques.
Pour ce qui est de la température de dénaturation, les longueurs d’onde sélectionnées des figures 3.11
et 3.13, soit de 222 nm et 208 nm (points les plus bas d’un spectre d’hélice α) et 201 nm (point le plus
bas du spectre de l’ORF32), augmentent légèrement pour l’ORF32 et sont stables jusqu’à 80 °C pour
68
l’ORF40. Les spectres complets enregistrés à 80 °C (en vert, figures 3.10 et 3.13) montrent que la
structure des protéines change un peu par rapport aux autres températures.
Figure 3.10 : Analyse par dichroïsme circulaire de la protéine ORF32 selon trois températures différentes. Le
spectre en bleu représente les données prises à 25 °C, le spectre en jaune représente les données prises à 42 °C
et le spectre en vert représente les données prises à 80 °C.
Les tableaux 3.11 et 3.12 affichent le contenu de chaque type de structure secondaire en pourcentage
pour les deux protéines à l’étude à 25 °C. Le pourcentage d’hélices α pour l’ORF32 varie entre 7,0%
et 10,8%, celui des feuillets β varie entre 18,3% et 34,0%, la proportion en boucle se situe entre 13,1%
et 25,8% et le pourcentage de structure désordonnée varie entre 34,5% et 57,1% (tableau 3.11). Le
tableau 3.12 montre un pourcentage en hélices α, entre 2,2% et 16,7%, un pourcentage de feuillets β
entre 21,7% et 40,1%, la proportion de boucles se situe entre 9,6% et 21,8% et la proportion de
structures désordonnées est de 15,3% à 49,3% en fonction de la méthode de calcul.
69
Figure 3.11 : Courbe de dénaturation en mesurant l’absorbance de dichroïsme circulaire (CD) en millidegrés
selon la température pour des longueurs d’onde de 222 nm (en rouge), 208 nm (en mauve) et 201 nm (en gris)
de la protéine ORF32.
Figure 3.12 : Analyse par dichroïsme circulaire de la protéine ORF40 selon de trois températures différentes.
Le spectre en bleu représente les données prises à 25 °C, le spectre en jaune représente les données prises à 42
°C et le spectre en vert représente les données prises à 80 °C.
.
70
Figure 3.13 : Courbe de dénaturation en mesurant l’absorbance de dichroïsme circulaire (CD) en millidegrés
selon la température pour des longueurs d’onde de 222 nm (en rouge), 208 nm (en mauve) et 201 nm (en gris)
de la protéine ORF40.
Tableau 3.11 : Résultats du calcul des structures secondaires en pourcentage de l’ORF32 à 25 °C selon
différentes bases de données et méthodes de calcul.
Base de
données
Méthode
de calcul Pourcentage de structure
Hélice α Feuillet β Boucle Désordonné
SP29 CONTIN 8,5 32,0 21,0 38,4
SP22X CDSSTR 8,5 18,3 16,0 44,7
CONTIN 9,4 18,8 15,5 44,7
SP37 CONTIN 10,8 29,3 22,9 37,0
SP37A CONTIN 10,2 19,7 13,1 44,6
SP43 CONTIN 9,1 32,2 23,1 35,6
SPD42 CONTIN 7,0 21,7 14,2 57,1
SPD48 CONTIN 7,0 22,9 14,1 56,0
CLSTR CDSSTR 8,4 34,0 24,2 34,5
CONTIN 10,7 32,1 22,5 34,6
SMP50 CONTIN 8,8 30,7 25,8 34,7
SMP56 CONTIN 8,6 32,1 23,0 36,3
71
Tableau 3.12 : Résultats du calcul des structures secondaires en pourcentage de l’ORF40 à 25 °C selon
différentes bases de données et méthodes de calcul.
Base de
données
Méthode
de calcul Pourcentage de structure
Hélice α Feuillet β Boucle Désordonné
SP29 CDSSTR 9,1 40,1 19,4 30,2
CONTIN 15,2 34,2 21,1 29,4
SP22X SELCON3 2,2 32,4 9,6 49,3
CDSSTR 13,3 25,7 11,8 40,9
SP37 CDSSTR 8,2 37,4 21,7 32,5
CONTIN 16,0 30,1 21,7 32,2
SP43 SELCON3 16,3 32,7 17,7 15,3
CONTIN 15,5 30,8 21,4 32,2
SP37A CONTIN 15,2 21,7 13,0 41,0
SPD42 SELCON3 16,3 32,7 17,7 15,3
CDSSTR 7,9 36,0 15,1 40,6
CONTIN 15,0 29,2 19,9 35,9
SPD48 CDSSTR 7,7 35,2 19,5 37,0
CONTIN 14,7 30,3 19,7 35,4
SMP50 CONTIN 15,9 30,1 21,8 32,0
SMP56 CONTIN 16,7 30,2 20,8 32,3
72
CHAPITRE 4: Discussion
4.1 Édition de génome du phage 2972
L’édition de génome commence d’abord avec l’obtention d’un BIM, qu’il ait été généré par simple
pression sélective ou qu’il ait été programmé pour l’acquisition d’une séquence précise d’un espaceur.
Selon le tableau 2.3, il y a plusieurs possibilités d’acquisition d’espaceurs ciblant certains gènes. Le
plasmide programmeur de l’orf22 possède deux PAM qui peuvent être ciblés par le locus CR1 de S.
thermophilus DGCC7710, celui de l’orf27 possède quatre PAM dont un qui est ciblé par le locus CR1
et trois qui sont ciblés par le locus CR3, puis l’orf30 et l’orf40 n’ont qu’un seul PAM ciblé
respectivement par le locus CR3 et le locus CR1. Le tableau 3.1 indique ensuite les espaceurs acquis
suite à la programmation du système CRISPR-Cas, où il est possible d’observer que les BIM purifiés
pour chaque gène ont acquis une des possibilités du plasmide programmeur et non un autre espaceur
ciblé au hasard provenant du génome du phage 2972. Ceci est en accord avec les travaux publiés par
Hynes et al. 2016 (169) où 100% des colonies obtenues avec un plasmide programmeur ont acquis le
bon espaceur pour le locus CR1 et 83,3% pour le locus CR3. Ces résultats permettent donc de montrer
que la programmation du système CRISPR-Cas se fait bien pour les deux loci actifs chez S.
thermophilus, même si le niveau d’activité entre ces deux loci diffère pour cette souche. En effet, le
locus CR1 est responsable de plus de 90% de l’acquisition naturelle chez S. thermophilus DGCC7710
(96). Toutefois, l’utilisation des loci CR1 et CR3 augmente le nombre de possibilités d’acquisition
d’espaceurs à partir du génome du phage 2972, où il y a 233 PAM spécifiques au locus CR1 et 483
PAM spécifiques au locus CR3, pour un total de 716 proto-espaceurs hypothétiques. La
programmation du système CRISPR-Cas présente donc plusieurs avantages par rapport à la méthode
traditionnelle pour obtenir des BIM.
De plus, l’utilisation de la programmation pour l’acquisition d’espaceurs dans chacun des locus
n’affecte pas le niveau de résistance des BIM (tableau 3.2). Par exemple, une valeur d’EOP de 1 x
10-7 signifie qu’environ un phage sur 10 millions est capable d’échapper au système CRISPR-Cas de
la bactérie. L’EOP du phage 2972 sur les BIM générés sur demande se situe entre 10-6 et 10-7, ce qui
est similaire pour les valeurs de résistance des espaceurs acquis dans le locus CR1 et supérieur à celles
retrouvées sur les BIM ayant acquis des espaceurs dans le locus CR3 (96). Donc, forcer le système à
acquérir un espaceur spécifique n’affecte pas son efficacité en soi.
73
Suite à l’édition de génome, plusieurs phages mutants ont été obtenus (tableau 3.3 et figure 3.1).
Certaines délétions ont une fréquence de mutation plus grande que d’autres, ceci peut indiquer
l’importance du gène ou simplement l’efficacité de l’espaceur à cibler et couper le proto-espaceur.
Les gènes pour lesquels un phage mutant a été impossible à obtenir pour l’instant ont été déterminés
comme des gènes essentiels à la réplication du phage. L’obtention de sept phages mutants sur douze
gènes visés démontre que la technique utilisée fonctionne efficacement.
4.2 Caractérisation des phages mutants
4.2.1 Le phage 2972 et 2972 RBP Courte
Plusieurs méthodes sont nécessaires pour une caractérisation exhaustive des interactions entre un
phage et son hôte. Pour comparer les phages mutants obtenus lors de cette étude, il faut aussi bien
connaître le phage sauvage. Le phage 2972 et le mutant spontané 2972 RBP courte ont été d’abord
analysés. Le phage 2972 possède une taille de la progéniture de 120 ± 22 virions relâchés par cellule
suite à un cycle infectieux et un temps de latence de 53 ± 1,5 minutes pour compléter ce cycle (tableau
3.5). Le pourcentage d’adsorption après 10 minutes est de 96,4 ± 4,3% des particules virales totales.
Les mesures prises en microscopie électronique à transmission révèlent que la queue a une longueur
de 256 ± 8 nm et la capside à une largeur de 69 ± 3 nm. Ces données s’approchent de celles publiées
dans la littérature, où selon Deveau et al. 2008, le phage 2972 possède une taille de la progéniture de
190 ± 33 virions infectieux par cellule suite à un cycle lytique de 40 ± 3 minutes (1). De plus, le
pourcentage d’adsorption expérimental est légèrement plus élevé lors de ces recherches, comparé au
pourcentage d’adsorption après 10 minutes de 89,3 ± 2,6%. Finalement, les mesures prises en
microscopie électronique à transmission sont semblables à celle de Lévesque et al. 2005,où le phage
2972 possède une capside ayant un diamètre de 55 nm et une queue d’une longueur de 260 nm (26).
Puis, la spectrométrie de masse a permis d’identifier et de confirmer le rôle structural de certaines
protéines du phage 2972. Plusieurs protéines qui font normalement partie de la structure du virus
n’ont pas pu être identifiées, par exemple la protéine codée par l’orf17 qui code pour une protéine de
la queue. La spectrométrie de masse est une technique efficace pour identifier les peptides purifiés,
cependant ce système est moins précis lorsque l’on désire détecter les empreintes peptidiques des
mélanges de protéines complexes. De plus, le ratio de chaque protéine est différent dans l’échantillon
et une quantité trop faible d’une certaine protéine par rapport aux autres peut la rendre non détectable
(174). Cependant, deux protéines non détectées lors de cette expérience (ORFS 22 et 23) ont toutefois
74
été détectées par Young et al. 2012 en utilisant un système de séparation par gel 2D couplé au LC-
MS/MS et donc il est fort probable que la technique utilisée et les paramètres de l’expérience soient
sujets à une optimisation (97). Ensuite, certains peptides appartenant à des protéines non structurales
ont aussi été détectés (voir section en doré du tableau 3.8), soit les protéines codées par l’orf24,
l’orf25, l’orf26, l’orf36 et l’orf42. Cinq peptides uniques ont été identifiés pour l’ORF24, ce qui
signifie probablement que cette protéine joue un rôle structural ou elle se retrouve en assez grande
quantité sous forme de contamination après la purification du lysat de phage. C’est le cas pour les
protéines des orfs 25 et 26 qui codent pour la holine et l’endolysine respectivement, les deux protéines
majeures du complexe responsable de la lyse bactérienne. Comme le rôle de ces protéines est connu
et qu’il est fort peu probable qu’elles soient associées à la structure, il est juste de proposer qu’elles
soient des contaminants suite au processus de purification des phages. Finalement, l’ORF36 et
l’ORF42 ont aussi été détectés, toutefois un seul peptide unique a été identifié pour chacune de ces
protéines et donc ils ne sont pas considérés dans l’analyse (il en va de même pour l’ORF25). En effet,
lorsqu’un seul peptide unique est assigné à une protéine il est impossible de confirmer sa présence
dans le mélange protéique.
Pour ce qui est du phage 2972 RBP courte, sa courbe de croissance ressemble à celle du phage 2972,
toutefois, le temps de latence est moins long (figure 3.2). En effet, le temps de latence du phage 2972
RBP courte est de 44 ± 4,7 minutes et celle de la taille de la progéniture est de 123 ± 45 comparé à
un temps de latence de 53 ± 1,5 minutes et à une taille de la progéniture de 120 ± 22 pour le phage
2972 (tableau 3.5). Le phage 2972 RBP Courte libère donc le même nombre de virions que le phage
2972 suite à la lyse cellulaire, seulement il le fait en prenant environ 10 minutes de moins. La protéine
de la RBP joue un rôle dans la première étape de l’infection par un phage, interagissant avec le
récepteur à la surface cellulaire lors de l’adsorption (175). Alors, il se peut qu’une mutation dans ce
gène soit favorable à une meilleure adsorption, donc un test d’adsorption a été effectué. Toutefois,
l’adsorption ne semble pas supérieure à celle du phage sauvage après 10 minutes, ou même après 5
minutes (tableau 3.6). En effet, le phage 2972 RBP Courte a un pourcentage d’adsorption de 92,4 ±
1,4% après 5 minutes et de 89,6 ± 10,4% après 10 minutes et le phage 2972 a un pourcentage
d’adsorption de 96,6 ± 0,9% après 5 minutes et de 96,4 ± 2,4% après 10 minutes. Donc, la version
plus courte de la RBP ne modifie pas l’efficacité d’adsorption du phage. Toutefois, une mutation
spontanée de la RBP pourrait jouer un autre rôle selon Binetti et al. (175). L’adsorption des particules
virales ne nécessite pas d’ajout d’ion calcium, mais cet ion est indispensable au processus d’infection
(175). Donc, il se pourrait que le phage 2972 RBP courte ne nécessite pas d’ajout de CaCl2 pour
75
compléter son cycle infectieux, qui serait ainsi plus rapide et donc aurait un temps de latence plus
court.
4.2.2 Le phage 2972Δ22
Le phage 2972Δ22 a été amplement caractérisé. Premièrement, son cycle lytique a une durée de 37 ±
1,0 minutes pour un nombre plus grand que 63 phages relargués par cellule. Le cycle lytique du phage
2972Δ22 est significativement plus court que celui du phage 2972 sauvage. Suite, au séquençage
Illumina, une version courte de la RBP a été identifiée et comme le cycle lytique du phage 2972 RBP
Courte est aussi plus petit, il est possible que ce soit pour cette raison. Cependant, le temps de latence
est tout de même un peu plus court que celui du phage ayant la même version de la RBP, ainsi il se
peut que l’orf22 influence la durée du cycle lytique. De plus, une taille de la progéniture précise a été
impossible à établir, car le titre du phage augmente de plus en plus après la première lyse au lieu
d’être stable sous forme de plateau, comme il est possible d’observer pour une courbe de croissance
standard (figure 2.3). Ensuite, une deuxième lyse n’est pas observée dans un temps donné de 112
minutes, alors que normalement lorsque la deuxième lyse cellulaire survient à 74 minutes (données
non présentées). Conséquemment, une délétion dans l’orf22 affecte le cycle lytique du phage de façon
considérable.
En fonction de sa position dans le génome, il est possible d’émettre plusieurs hypothèses quant au
rôle de l’orf22. Il se situe directement après l’orf21 qui code pour la protéine formant la plaque basale
et avant le complexe de lyse cellulaire formé par les orfs 25 et 26/29. Les orfs 23 et 24 ont une fonction
inconnue. Donc, il est possible que l’orf22 joue un rôle structural, car les modules des phages ont
tendance à être regroupés dans les génomes, ou alors il peut aussi jouer le rôle de régulateur de la
lyse. Toutefois, il est important aussi de considérer le fait que la fonction de cette protéine pourrait
être totalement nouvelle, car les génomes des phages sont parmi les plus diversifiés (176). Pour savoir
si l’orf22 prend part dans la structure du phage, une observation en microscopie électronique à
transmission a été faite (figure 3.3). L’apparence générale du phage 2972Δ22 et les dimensions
calculées ne semblent pas différentes de celle du phage 2972. Le phage 2972Δ22 possède une capside
d’un diamètre de 63 ± 4 nm et une queue d’une longueur de 266 ± 6 nm, ce qui n’est pas
significativement divergent du phage sauvage qui possède une capside de 69 ± 3 nm et une queue de
256 ± 8 nm. De plus, il n’a pas été détecté en spectrométrie de masse (tableau 3.8), mais si la protéine
est en très faible quantité elle ne sera pas identifiée par cette méthode. Par contre, il se peut qu’elle
affecte la structure sans pour autant en faire partie, comme par exemple les protéines chaperonnes qui
76
aident les autres protéines à maturer jusqu’à leur conformation finale (52). Donc si la structure de la
queue ou de la plaque basale est affectée, il se peut que l’adsorption soit affectée. C’est effectivement
le cas pour le phage 2972Δ22 qui a un pourcentage d’adsorption de 72,6 ± 5,1% après 10 minutes
(tableau 3.6) et donc l’adsorption de ce phage est moins efficace que le phage sauvage qui a un
pourcentage d’adsorption proche de 100%. Toutefois, il ne faut pas oublier que le phage 2972Δ22
possède d’autres mutations dans son génome et que les résultats peuvent être dus à ces mutations.
Finalement, une partie des interactions phage-hôte a été caractérisée par la production de BIM. Le
nombre de BIM produits avec la souche DGCC7710 contre les phages 2972 et 2972Δ22 est assez
similaire, soit respectivement 90,7 ± 20,2 colonies et 61,3 ± 24,5 colonies (tableau 3.9). Ces BIM
sont considérés comme des mutants résistants de première génération. Ceci indique que l’absence de
l’orf22 n’influence pas le nombre de BIM générés, toutefois le CEM22, qui possède une mutation
ponctuelle dans l’orf22 (voir tableau 2.1), semble avoir une production réduite. La mutation
ponctuelle change un acide aminé glutamate pour un aspartate, où les deux molécules sont chargées
négativement et donc la structure de la protéine codée par l’orf22 ne devrait pas être modifiée (4). En
revanche, il est impossible de confirmer cette hypothèse sans avoir la structure des deux protéines
(sauvage et le mutant du CEM22), et ainsi il se peut que ce changement affecte la protéine, par
exemple dans son adsorption, ce qui pourrait expliquer une diminution de la production de BIM, car
moins de phages seraient en contact avec les cellules bactériennes. Cependant, cette diminution n’est
pas observée lorsque l’orf22 est délété. Il se peut donc que ce changement soit dû à un phénomène
différent, comme une mutation compensatoire dans le génome.
Il y a cependant un changement lorsque les BIM sont produits à partir d’un BIM déjà résistant à 2972,
le BIM AR1, pour produire des BIM de deuxième génération. Le phage 2972 n’a pas la capacité de
produire des BIM dans ce contexte, car le système CRISPR-Cas du BIM AR1 reconnaît le phage et
clive son génome, empêchant ainsi le cycle lytique (1). Quant à lui, le phage 2972Δ22, où le proto-
espaceur correspondant à l’espaceur acquis dans le BIM AR1 est absent dû à la délétion dans son
génome, n’est pas reconnu pas le système CRISPR-Cas et il peut être utilisé pour générer des BIM.
Le nombre de BIM produit par le couple 2972Δ22-BIM AR1 est de 72,2 ± 17,6 colonies, ce qui est
très proche du nombre obtenu par le couple 2972Δ22-DGCC7710. Ce résultat est attendu, car les
BIM générés par les deux couples sont des BIM de première génération, comme le BIM AR1 n’est
pas en mesure de se défendre contre le phage 2972Δ22. Le nombre de BIM de deuxième génération
produits par le couple CEM22-BIM AR1 est toutefois intéressant. Environ 120,3 ± 37,7 colonies sont
générées lorsque le phage CEM22 infecte le BIM AR1 à une grande MOI.
77
Ce phénomène est décrit dans la littérature comme étant le priming, ou l’amorçage, du système
CRISPR-Cas. Ceci survient lorsqu’un proto-espaceur correspondant partiellement à un espaceur
contenu dans le locus CRISPR stimule une acquisition plus rapide et efficace d’espaceurs additionnels
(177). Donc, lorsqu’une cellule bactérienne ayant un système CRISPR-Cas actif subit une infection
pour la première fois, le système est décrit comme étant naïf. Cette cellule pourra ensuite acquérir un
espaceur ciblant ce phage, pour devenir résistante. Puis, le phage va muter son proto-espaceur, le plus
souvent par une mutation ponctuelle dans le PAM ou dans la région 3’ du proto-espaceur, pour ne
plus être reconnu lors de l’interférence (80). Lorsque la cellule ayant le nouvel espaceur sera infectée
par le phage muté, ce sera donc un système décrit comme primed, ou amorcé (177). Donc, lorsque le
CEM22 infecte le BIM AR1, il y a une reconnaissance partielle entre l’espaceur et le proto-espaceur,
ce qui active l’acquisition de façon supérieure.
Ce phénomène a majoritairement été observé avec les systèmes CRISPR-Cas de type I, sous-types B,
C, E et F (104, 178–181). Il peut être observé par une augmentation considérable des évènements
d’acquisition entre la première et la deuxième infection. Par exemple, selon Datsenko et al. 2012,
environ 4,3% des colonies résistantes ont acquis un espaceur lors de la première infection et 77% des
colonies résistantes ont acquis un nouvel espaceur lors de la deuxième infection. Ceci représente une
augmentation du nombre d’évènements d’acquisition d’environ 17 fois (104). Selon le graphique de
la figure 3.4 qui montre les ratios des évènements d’acquisitions par rapport au système sauvage, le
nombre d’évènements pour le CEM22 augmente de moins de 1,5 fois par rapport au système naïf,
représenté par la ligne noire à la valeur de 1. Cependant, si le CEM22 produit moins de BIM que le
système sauvage, il est important de comparer la production des BIM de première et de deuxième
génération entre eux. Donc, le CEM22 lorsqu’il infecte DGCC7710, produit environ 11,8 colonies
résistantes et il produit environ 120,3 colonies résistantes lorsqu’il infecte le BIM AR1, ce qui
représente une augmentation d’un peu plus de 10 fois. Cette valeur est assez rapprochée du nombre
retrouvé dans la littérature et donc il est possible que le système CRISPR-Cas de type II-A puisse être
un système capable d’amorçage.
Les évènements d’acquisition d’un système amorcé ne sont toutefois pas aléatoires et il semble y
avoir un motif d’acquisition particulier (182). En effet, les BIM de deuxième génération ont un motif
d’acquisition dépendant de l’orientation de l’espaceur, où la majorité des espaceurs acquis se
retrouvent sur le même brin d’ADN et donc dans la même orientation, à un pourcentage variant entre
64 % et 83 % (104, 178, 179). Certaines recherches ont de plus démontré que les espaceurs acquis
78
étaient regroupés autour de l’espaceur responsable de l’amorçage (180). Selon la figure 3.6-A qui
montre la distribution des proto-espaceurs pour l’orf22, il est possible d’observer qu’effectivement la
majorité des proto-espaceurs visés se retrouvent sur le même brin que le premier proto-espaceur (brin
positif), à un pourcentage de 80% chez le phage CEM22 qui infecte le BIM AR1. De plus, la
distribution des proto-espaceurs légèrement regroupée vers la fin du génome, mais sans aucune
concentration évidente autour de l’espaceur servant à l’amorçage. Par la distribution des proto-
espaceurs majoritairement sur le même brin, il serait possible d’émettre l’hypothèse que le système
CRISPR-Cas de type II-A est un système capable d’amorçage de façon brin-dépendant. Toutefois
selon la figure 3.6-A il ne semble pas avoir de différence entre le système naïf, soit le phage 2972Δ22
infectant le BIM AR1 et le système amorcé, où la majorité des espaceurs sont aussi sur le même brin
à 84,6% et réunis vers la fin du génome. Donc, il se peut que les observations faites pour le système
amorcé soient dues à un biais naturel du système CRISPR-Cas de type II-A et non à sa capacité
d’amorçage. Pour confirmer cette hypothèse, il faudrait donc répéter l’expérience avec un proto-
espaceur situé sur le brin négatif et un proto-espaceur situé au début du génome.
4.2.3 Le phage 2972Δ24
L’orf24 est le seul gène inconnu à l’étude dont la protéine déduite a été détectée par la spectrométrie
de masse avec certitude. Il est donc fort probable qu’elle joue un rôle structural dans le génome du
phage 2972. Tout comme l’orf22, le gène de l’orf24 se situe à la fin du module des gènes codant pour
les différentes protéines de la queue et il se peut que la protéine codée par ce gène soit impliquée dans
le complexe de la plaque basale. Toutefois, il se situe proche du gène de l’endolysine qui est très
souvent détectée dû à sa très grande expression lors de la lyse. L’endolysine se retrouve souvent sous
forme de contaminant et donc il se peut que cette situation s’applique à l’ORF24. Pour déterminer si
2972Δ24 joue un rôle structural, il faudrait l’observer en microscopie électronique et tester
l’adsorption.
4.2.4 Les phages 2972Δ27 et 2972Δ28
Les orfs 27 et 28 sont tous deux des gènes situés sur un intron de groupe I sous-groupe A2 entre
l’orf26 et l’orf29 qui codent pour l’endolysine. Cette protéine fait partie du processus de lyse
bactérienne où elle dégrade le peptidoglycane pour libérer les virions nouvellement formés suite à un
cycle lytique (14).
79
Les introns appartenant au groupe I sont fréquents chez les phages infectant les bactéries à Gram
positif, notamment Lactococcus, Lactobacillus, Staphylococcus et Streptococcus (183, 184). Environ
50% des phages de Streptococcus possèdent un intron de groupe I situé dans le gène de l’endolysine
qui se trouve à avoir plusieurs variations du même intron en fonction du phage (185). Chez le phage
Sfi21, l’intron qui interrompt le gène pour l’endolysine contient trois cadres de lecture ouverts
orientés dans le même sens codant pour trois protéines putatives de 207, 253 et 75 acides aminés. Les
domaines des protéines ORF207 et ORF75, nommées par leur nombre d’acides aminés, ont pu être
déduits par leur homologie de séquence avec le phage Dp-1 (186). L’ORF207 possède un domaine
d’activité catalytique et l’ORF75 possède un domaine de reconnaissance du substrat caractéristique
des endolysines de bactériophages. Cet intron a pu être identifié, car le pourcentage en G+C de
l’orf253 est considérablement plus faible, à 28%, que le reste du génome du phage qui varie entre
41% et 43%. Il a été démontré que le phage 2972, selon Lévesque et al. 2005, possède le même intron
(26). Il est donc intéressant, lors de l’analyse, de remarquer que le pourcentage en contenu G+C de
l’orf28 a une valeur d’exactement 28% (données non présentées). Cependant, le produit de ce gène
dispose d’une longueur de 61 acides aminés et non de 253. Par contre, l’orf253 semble être un hotspot
pour les mutations, car toutes les versions de l’intron possèdent une grande variabilité dans ce gène
et ce à partir du codon 55 et l’orf28 est en tout point identique à l’orf253 jusqu’au codon 55, où
quelques mutations ponctuelles font de l’orf28 du phage 2972 une version courte de l’orf253 du phage
Sfi21 (185).
Finalement, l’ORF253 possède une similitude de séquence avec les endonucléases de type HNH.
Toutefois, les recherches de prédiction de motifs en utilisant l’outil HHPred (187) identifient un
domaine Ecl1 qui est impliqué dans la régulation du cycle de vie chez Saccharomyces cerevisiae à
une probabilité de 94,21%. Une protéine contenant ce domaine, lorsqu’elle est surexprimée,
augmente le temps de vie chez la souche en question et donc cela suggère que l’ORF28 du phage
2972 pourrait jouer un rôle de régulation quelconque (188). Pour ce qui est de l’orf27, l’alignement
de l’outil HHPred l’associe à NucB, qui est une endonucléase de Bacillus licheniformis responsable
de la dégradation du biofilm (189). Cependant, la probabilité de cet alignement est de 65,44% et donc
assez faible. Une piste quant à la fonction de l’ORF27 reste donc inconnue.
4.2.5 Le phage 2972Δ36
Le phage 2972Δ36 n’a pas pu être caractérisé lors de ce projet. L’orf36 fait partie des gènes conservés
parmi les phages infectants S. thermophilus de type pac et la protéine putative que ce gène encode
80
possède un domaine identifié chez plusieurs protéines de phages nommées DUF669.
Malheureusement, l’abréviation DUF tient pour Domain of Unknown Function et donc le domaine
est identifié chez plusieurs protéines sans pour autant en connaître la fonction. Il serait donc
intéressant de trouver la fonction de cette protéine et son rôle dans le cycle infectieux, car ceci
permettrait de trouver la fonction des autres protéines possédant ce domaine.
4.2.6 Le phage 2972Δ41
Plusieurs expériences permettant la caractérisation de la fonction potentielle de l’ORF41 ont été
exécutées lors de ce projet, dont une courbe de croissance, un test d’adsorption et une production de
BIM. Premièrement, la courbe en rose de la figure 3.2 montre un temps de latence semblable aux
phages 2972Δ22 et 2922 RBP Courte, ainsi qu’un plateau obtenu après un cycle lytique un peu plus
bas que le phage sauvage. En effet, le phage 2972Δ41 produit 65 ± 25 virions suite à la lyse cellulaire
qui nécessite un temps de 41 ± 2,8 minutes (tableau 3.5). Ce phage produit environ la moitié moins
de virions que le phage sauvage (120 ± 22 virions), et prend environ 10 minutes de moins pour
relarguer sa progéniture (53 ± 1,5 minutes). Son temps de latence est similaire à celui du phage 2972
RBP courte (44 ± 4,7 minutes) toutefois le phage 2972Δ41 possède une RBP longue et donc la
diminution du temps de latence n’est pas causée par la longueur de sa RBP. Cependant, il est
impossible de confirmer si la délétion dans l’orf41 cause une production moindre de virions, et donc
une lyse plus courte ou si une lyse précoce fait en sorte que la production de virions est diminuée.
Ensuite, il n’est pas probable que l’orf41 soit impliqué dans le processus d’adsorption. Son
pourcentage d’adsorption après 10 minutes est de 99,6 ± 0,5%, ce qui est comparable au pourcentage
d’adsorption après 10 minutes du phage sauvage, qui est de 96,4 ± 2,4% (tableau 3.6). De plus, un
rôle structural probable est à éliminer, car ce gène n’a pas été détecté par spectrométrie de masse.
Finalement, la production de BIM avec le phage 2972Δ41 a été caractérisée pour mesurer l’impact
de la délétion par rapport au phage 2972. Lors de l’infection de la souche DGCC7710, la production
de BIM avec les phages 2972, 2972Δ41 et CEM41 est respectivement de 25,3 ± 3,8, 28,8 ± 3,5 et
45,7 ± 6,8 colonies résistantes, ce qui est assez similaire. La production de BIM avec le CEM41 est
légèrement plus grande que celle du phage 2972 et 2972Δ41. La mutation ponctuelle dans ce gène
change un acide aminé tyrosine pour une asparagine, ainsi un acide aminé aromatique est substitué
pour un acide aminé amide (4). Cependant, les deux molécules sont polaires et donc devraient
accomplir un rôle similaire dans la structure, mais comme c’est le cas pour le CEM22, il est
81
impossible de confirmer cette hypothèse sans avoir la structure. Il se peut donc que la mutation dans
le CEM41 affecte le bon fonctionnement de la réplication et le rende plus vulnérable au système
CRISPR-Cas de la bactérie, produisant ainsi un peu plus de BIM. Lors de l’infection du BIM A-35,
le génome du phage 2972 est ciblé et clivé par le système CRISPR-Cas (1). Il est intéressant que le
phage 2972Δ41 infectant le BIM A-35, puisse générer environ 7 fois plus de BIM que le système
sauvage (figure 3.5). Il est connu que le nombre de BIM est directement relié au nombre de phages
défectueux, ainsi le système CRISPR-Cas est avantagé et les évènements d’acquisition sont plus
fréquents (190). Le phage 2972Δ41 a la capacité de fabriquer environ 65 phages infectieux par cellule
infectée, il se peut donc qu’il produise une plus grande quantité de phages. Cependant, un défaut
engendré par une délétion dans l’orf41 pourrait causer une machinerie de réplication infructueuse, et
ainsi un grand nombre de phages incapables de compléter un cycle lytique pourraient être relâchés
dans l’environnement, ce qui permettrait à plus de cellules d’acquérir un espaceur. Toutefois, si cette
hypothèse s’avérait exacte, ce phénomène serait aussi observé lorsque le phage 2972Δ41 infecte la
souche DGCC7710. Le nombre accru de colonies résistantes générées par ce phage lorsqu’il infecte
le BIM A-35 n’est peut-être pas une propriété du phage, mais du BIM, car comme il a été généré par
pression sélective et non programmé sur demande, ce n’est pas exclu qu’il puisse posséder une autre
mutation dans son génome. La solution serait de faire un BIM sur demande avec le même espaceur
et de voir si le même résultat survient pour confirmer si les résultats proviennent d’une caractéristique
du BIM ou du phage mutant.
Puis, la production de colonies résistantes de deuxième génération par le CEM41 lorsqu’il infecte le
BIM A-35 augmente de 27 fois par rapport au système sauvage, et de 14 fois par rapport à l’infection
de la souche DGCC7710 par le CEM41 selon la figure 3.5. Ceci est peut-être dû à l’amorçage du
système CRISPR-Cas, comme il a été observé pour l’orf22. Cette augmentation est la plus élevée
observée et aucun résultat n’est similaire dans la littérature, où les évènements d’acquisition survenus
grâce à l’amorçage augmentait d’un facteur maximum de 17 (104, 178). De plus, selon la figure 3.6-
B, la majorité des proto-espaceurs acquis par les BIM de deuxième génération suite à une pression
sélective du CEM41, sont situés sur le même brin que l’espaceur amorcé à un pourcentage de 77,5%
et ils sont regroupés vers la fin du génome. Ce regroupement ne peut pas être expliqué par la
distribution naturelle des PAM, car ceux-ci sont répartis assez uniformément à travers le génome du
phage 2972. Toutefois, ils ne sont pas plus concentrés autour de l’orf41. Il est important de noter que
le même motif est observé pour le couple 2972Δ41-BIM A-35 et donc, comme c’est le cas pour les
observations faites en lien avec l’orf22, il se peut que le motif d’acquisition naturel du système
CRISPR-Cas de type II-A induise un biais dans les résultats. En effet, selon les résultats compilés du
82
protocole publié par Hynes et al. 2017, les espaceurs acquis par la souche DGCC7710 pour se
défendre contre le phage 2972 sont la plupart situé sur le brin positif (168). Sur 66 espaceurs analysés,
54 espaceurs sont sur le brin positif, soit 81% (communication personnelle). Ainsi, selon les résultats
de la production de BIM pour les orfs 22 et 41, la hausse des évènements d’acquisition lorsqu’un
espaceur est partiellement complémentaire au génome du phage 2972 est peut-être due à l’amorçage
du système CRISPR-Cas de type II-A, toutefois les motifs d’acquisition observés ne sont
probablement pas attribuables à ce phénomène. L’acquisition des espaceurs sur le brin positif est
plausiblement engendrée par un biais naturel du système CRISPR-Cas présent chez la souche
DGCC7710. Comme cela a été conclu pour l’orf22, il faudra répéter les expériences de production
de BIM avec un espaceur situé sur le brin négatif pour vérifier si l’acquisition est brin-dépendante et
un espaceur situé au début du génome pour vérifier si l’acquisition est regroupée autour de l’espaceur
amorcé.
4.2.7 Le phage 2972Δ43
Une certaine caractérisation a été faite sur le phage 2972Δ43. Selon la courbe en gris de la figure 3.2,
il est possible de constater que la taille de la progéniture est la plus petite des phages analysés. En
effet, le nombre de virions relâchés après un cycle lytique est de 19 ± 6 phages, suite à un temps de
latence de 43,2 ± 2,3 minutes. La délétion dans ce gène impacte donc grandement la production de
phages infectieux. De plus, le temps de latence est plus court et se rapproche de celui des phages
2972Δ41 et 2972RBP courte, pourtant le phage 2972Δ43 possède une version longue de la RBP et donc
cet effet n’est pas dû à la version de la RBP. Ensuite, les phages 2972Δ41 et 2972Δ43 ont un temps
de latence très similaire, mais des tailles de la progéniture distinctes. Il est donc moins probable que
les orfs 41 et 43 jouent un rôle dans la régulation temporelle du cycle lytique, car une infection
écourtée aurait probablement causé le même impact sur la taille de la progéniture. Ces gènes jouent
peut-être un rôle dans la réplication du génome ou la régulation de celui-ci, ce qui pourrait affecter le
nombre de virions infectieux produits et aussi la lyse se ferait plus tôt, car l’assemblage de moins de
virions prend moins de temps. Finalement, l’orf43, conservé parmi les phages de type pac, possède
un domaine de fonction inconnu DUF1372 qui est commun à plusieurs protéines des phages infectant
les streptocoques. La résolution du rôle de cette protéine serait donc d’une grande importance et
aiderait à identifier la fonction des protéines possédant ce domaine.
83
4.3 Caractérisation des protéines sauvages
4.3.1 L’ORF32
Les outils bio-informatiques prédisent que la structure de l’ORF32, ayant une longueur de 40 résidus,
serait composée de deux hélices α et d’une faible proportion de structure désordonnée (figure 3.7).
Toutefois, en se fiant au modèle de la figure 2.4, la figure 3.10 du spectre en dichroïsme circulaire de
l’ORF32 montre un spectre se rapprochant d’une structure désordonnée couplé avec des feuillets β.
Il y a une grande proportion de feuillets β entre 18,3 % et 34,0% et de séquences désordonnées entre
34,5% et 57,1%, ce qui représente un gros pourcentage de la protéine par rapport aux hélices α et aux
boucles qui ne représentent respectivement que 7,0 % à 10,8 % et 13,1% à 25,8% (tableau 3.12).
Ensuite, la figure 3.11 montre les trois points sélectionnés pour suivre le maintien de la structure de
la protéine lorsque la température augmente. Les trois courbes semblent stables jusqu’à une
température de 65 °C et il y a une légère augmentation de l’absorbance à partir de cette température
jusqu’à 80 °C. Ceci indique que la protéine commence à perdre son intégrité structurale, cependant
les courbes n’atteignent pas zéro et donc la protéine n’est pas totalement dénaturée. Le spectre
complet enregistré à 80 °C de la figure 3.10 est assez différent de ceux enregistrés à 25 °C et 42°C,
or la protéine commence à perdre sa structure secondaire proche de 80 °C.
Les prédictions bio-informatiques et les données de dichroïsme circulaire ne permettent pas d’obtenir
les mêmes conclusions, néanmoins les données expérimentales sont considérées plus fiables. Il sera
tout de même important de déterminer précisément la structure de l’ORF32.
4.3.2 L’ORF40
La figure 3.8, montrant la structure prédite par les outils bio-informatiques, indique que la séquence
de 83 résidus de l’ORF40 aurait une structure secondaire composée de 5 hélices α et d’une assez
petite séquence désordonnée. La figure 3.12, quant à elle, montre un spectre de dichroïsme circulaire
composé de feuillets β couplés avec des hélices α. Les analyses du tableau 3.12 montrent un
pourcentage assez variable d’hélices α, entre 2,2% et 16,7%. Un haut pourcentage de feuillets β entre
21,7% et 40,1% est présent, la proportion de boucles est un peu moins nombreuse, entre 9,6% et
21,8% et la proportion de structures désordonnées est tout de même moins grande que pour l’ORF32,
soit entre 15,3% et 49,3%. Les feuillets β et la structure désordonnée sont en effet, les structures qui
semblent être les plus présentes dans la structure secondaire de l’ORF40.
84
La figure 3.13, qui mesure le degré de dénaturation de la protéine, fournit des informations
additionnelles sur celle-ci. Les courbes sont stables jusqu’à une température de 80 °C, sauf pour le
point à 201 nm qui semble diminuer légèrement, mais pas de façon significative. Le spectre complet
enregistré à 80 °C, en vert dans la figure 3.13, montre que la structure de l’ORF40 change très peu
par rapport aux autres températures et qu’il conserve tout de même une forme, indiquant que la
structure est encore relativement stable à 80 °C. Tout comme l’ORF32, les prédictions bio-
informatiques et les données provenant des spectres de dichroïsme circulaire ne concordent pas,
cependant les données expérimentales du dichroïsme circulaire sont plus fiables. Donc, l’ORF40
pourrait, en grande partie, se composer d’hélices α et de feuillets β.
4.3.2 L’ORF 41
Selon la figurer 3.9, les outils bio-informatiques prédisent que l’ORF41, composé de 51 résidus, serait
constitué d’une hélice α et de deux feuillets β. Malheureusement, le peptide synthétisé de l’ORF41
n’a pas pu être solubilisé. Sans une solution du peptide, il est impossible de générer des spectres de
dichroïsme circulaire et donc les seules données disponibles sur la structure de l’ORF41 sont celles
des prédictions bio-informatiques.
85
Conclusion et perspectives
Les bactéries et les bactériophages sont au cœur d’une guerre microscopique responsable d’une
coévolution rapide. Les phages surpassent de 10 fois le nombre de bactéries sur la planète. Pourtant,
la grande majorité des protéines qu’ils codent ont une fonction inconnue. Les génomes de phages sont
séparés selon l’expression temporelle des gènes au moment de l’infection (expression précoce,
médiane et tardive). Les gènes tardifs sont souvent bien caractérisés, car ils codent pour des protéines
structurales, plus faciles à étudier, car le phénotype est observable par microscopie électronique.
Toutefois, énormément de gènes précoces et médians codant pour des protéines non structurales n’ont
aucune fonction déterminée, malgré le fait qu’ils sont d’une grande importance pour la réplication
virale et jouent un rôle majeur dans la régulation. L’outil génétique CRISPR-Cas9, qui a révolutionné
le monde de l’édition de génome, permet la modification de ces gènes et ainsi l’étude du phénotype
de phages mutants.
Sur les 14 gènes du phage 2972 qui codent pour des protéines aux fonctions inconnues, nous en avons
sept, ce qui confirme la robustesse de notre approche expérimentale. De ces sept mutants, trois
présentent une difficulté significative au niveau de la réplication virale en conditions de laboratoire.
Lorsque le phage 2972 infecte la souche S. thermophilus DGCC7710, approximativement 120 virions
sont relâchés dans l’environnement pour chaque cellule lysée. Les phages 2972Δ22, 2972Δ41 et
2972Δ43 ont une progéniture diminuée d’au moins la moitié ou plus. De plus, le phage mutant
2972Δ22 possède aussi une capacité d’adsorption à la surface cellulaire de 30% moins efficace.
Plusieurs hypothèses ont été émises quant au rôle que ces protéines peuvent jouer, cependant aucune
fonction n’a encore été déterminée avec certitude. Il est connu que la structure d’une protéine est
fortement liée à sa fonction. Ainsi, des études préliminaires quant à la structure secondaire de
certaines protéines codées par ces gènes ont été entreprises.
En perspective, il est évident que des tests plus approfondis seront nécessaires à chaque gène à l’étude,
en plus de la détermination de la structure secondaire des gènes impossible à muter. Il serait aussi très
intéressant d’étudier les interactions de ces protéines avec les protéines de l’hôte ou du phage. En
somme, les données recueillies permettront une meilleure compréhension des interactions
moléculaires entre les phages et les bactéries, ainsi que l’approfondissement des connaissances des
mécanismes de réplication et d’infection des bactériophages pour éventuellement perfectionner les
méthodes de contrôle appliquées en industrie laitière.
86
BIBLIOGRAPHIE
1. Deveau H, Barrangou R, Garneau JE, Labonté J, Fremaux C, Boyaval P, Romero DA, Horvath
P, Moineau S. 2008. Phage response to CRISPR-encoded resistance in Streptococcus
thermophilus. J Bacteriol 190:1390–1400.
2. Emond E, Moineau S. 2007. Bacteriophages and food fermentations, p. 93–124. In McGath,
S, Van Sideren, D (eds.), Bacteriophage: genetics and molecular biology. Caister Academic
Press, U.K.
3. Rohwer F, Youle M, Maughan H, Hisakawa N. 2014. Life in our phage world. Wholon, San
Diego, CA.
4. Wiley J, Sherwood L, Woolverton C. 2013. Prescott’s Microbiology, 4th ed. McGrawth-Hill.
5. Keen EC. 2015. A century of phage research: bacteriophages and the shaping of modern
biology. Bioessays 37:6–9.
6. Hershey AD. 1952. Inheritance in bacteriophage. Ann New York Acadamy Sci 54:960–962.
7. Cisek AA, Dąbrowska I, Gregorczyk KP, Wyżewski Z. 2017. Phage therapy in bacterial
infections treatment: one hundred years after the discovery of bacteriophages. Curr Microbiol
74:277–283.
8. Ebrahimizadeh, W. Rajabibazl M. 2014. Bacteriophage vehicles for phage display: biology,
mechanism, and application. Curr Microbiol 69:109–120.
9. Bradley DE. 1967. Ultrastructure of bacteriophages and bacteriocins. Bacteriol Rev 31:230–
314.
10. Ackermann HW, Prangishvili D. 2012. Prokaryote viruses studied by electron microscopy.
Arch Virol 157:1843–1849.
11. Lavigne R, Darius P, Summer EJ, Seto D, Mahadevan P, Nilsson AS, Ackermann HW,
Kropinski AM. 2009. Classification of Myoviridae bacteriophages using protein sequence
similarity. BMC Microbiol 9:224.
12. Ackermann H. 2003. Bacteriophage observations and evolution. Res Microbiol 245–251.
13. Ackermann H-W. 2001. Frequency of morphological phage descriptions in the year 2000.
Arch Virol 146:843–857.
14. Kutter E, Raya R, Carlson K. 2005. Molecular mechanisms of phage infection, p. 165–222. In
Kutter, E, Sulakvelidze, A (eds.), Bacteriophages: biology and applications. CRC Press.
15. Rakhuba D, Kolomiets E, Szwajcer Dey E, Novik G. 2010. Bacteriophage receptors,
mechanisms of phage adsorption and penetration into host cell. Pol Journal Microbiol 59:145–
155.
16. Leiman PG, Battisti AJ, Bowman VD, Stummeyer K, Muhlenhoff M, Gerardy-Schahn R,
Scholl D, Molineux IJ. 2007. The structures of bacteriophages K1E and K1-5 explain
processive degradation of polysaccharide capsules and evolution of new host specificities. J
Mol Biol 371:836–849.
17. Labrie SJ, Samson JE, Moineau S. 2010. Bacteriophage resistance mechanisms. Nat Rev
Microbiol 8:317–327.
18. Kostyuchenko VA, Chipman PR, Leiman PG, Arisaka F, Mesyanzhinov V V., Rossmann MG.
2005. The tail structure of bacteriophage T4 and its mechanism of contraction. Nat Struct Mol
Biol 12:810–813.
19. Leiman PG, Shneider MM. 2012. Contractile tail machines of bacteriophages, p. 93–114. In
Rossmann, MG, Rao, VB (eds.), Viral Molecular Machines. Springer, New-York.
20. Davidson AR, Cardarelli L, Pell LG, Radford DR, Maxwell KL. 2012. Long noncontractile
tail machines of bacteriophages, p. 115–142. In Rossmann, MG, Rao, VB (eds.), Viral
Molecular Machines. Springer, New-York.
21. Rossmann MG, Rao VB. 2012. Viral molecular machines, 1st ed. Springer, New-York.
87
22. Bhardwaj A, Olia AS, Cingolani G. 2014. Architechture of viral genome-delivery molecular
machines. Curr Opin Struct Biol 25:1–8.
23. Casjens SR, Molineux IJ. 2012. Short noncontractile tail machines: adsorption and DNA
delivery by Podoviruses, p. 143–180. In Rossmann, MG, Rao, VB (eds.), Viral molecular
machines. Springer, New-York.
24. Weigel C, Seitz H. 2006. Bacteriophage replication modules. FEMS Microbiol Rev 30:321–
381.
25. Dupuis MÈ, Moineau S. 2010. Genome organization and characterization of the virulent
lactococcal phage 1358 and its similarities to Listeria phages. Appl Environ Microbiol
76:1623–1632.
26. Lévesque C, Duplessis M, Labonté J, Labrie S, Fremaux C, Tremblay D, Moineau S. 2005.
Genomic organization and molecular analysis of virulent bacteriophage 2972 infecting an
exopolysaccharide-producing Streptococcus thermophilus strain. Appl Environ Microbiol
71:4057–4068.
27. Rao VB, Feiss M. 2008. The bacteriophage DNA packaging motor. Annu Rev Genet 42:647–
681.
28. Molineux IJ, Panja D. 2013. Popping the cork: Mechanisms of phage genome ejection. Nat
Rev Microbiol 11:194–204.
29. Casjens SR, Gilcrease EB. 2009. Determining DNA packaging strategy by analysis of the
termini of the chromosomes in tailed-bacteriophage virions. Methods Mol Biol 502:91–111.
30. Ramanculov E, Young R. 2001. Genetic analysis of the T4 holin: timing and topology. Gene
265:25–36.
31. Erez Z, Steinberger-Levy I, Shamir M, Doron S, Stokar-Avihail A, Peleg Y, Melamed S,
Leavitt A, Savidor A, Albeck S, Amitai G, Sorek R. 2017. Communication between viruses
guides lysis-lysogeny decisions. Nature 541:488–493.
32. Casjens SR, Hendrix RW. 2015. Bacteriophage lambda: Early pioneer and still relevant.
Virology 479–480:310–330.
33. Harshey RM. 2014. Transposable phage Mu. Microbiol Spectr 2:MDNA3-0007-2014.
34. Howard-Varona C, Hargreaves KR, Abedon ST, Sullivan MB. 2017. Lysogeny in nature:
mechanisms, impact and ecology of temperate phages. ISME J 11:1511–1520.
35. Quiberoni A, Moineau S, Rousseau GM, Reinheimer J, Ackermann HW. 2010. Streptococcus
thermophilus bacteriophages. Int Dairy J 20:657–664.
36. Marcó MB, Moineau S, Quiberoni A. 2012. Bacteriophages and dairy fermentations.
Bacteriophage 2:149–158.
37. Quiberoni A, Tremblay D, Ackermann H-W, Moineau S, Reinheimer JA. 2006. Diversity of
Streptococcus thermophilus phages in a large-production cheese factory in Argentina. J Dairy
Sci 89:3791–3799.
38. Lucchini S, Desiere F, Brüssow H. 1999. Comparative genomics of Streptococcus
thermophilus phage species supports a modular evolution theory. J Virol 73:8647–8656.
39. Le Marrec C, Van Sinderen D, Walsh L, Stanley E, Vlegels E, Moineau S, Heinze P,
Fitzgerald G, Fayard B. 1997. Two groups of bacteriophages infecting Streptococcus
thermophilus can be distinguished on the basis of mode of packaging and genetic determinants
for major structural proteins. Appl Environ Microbiol 63:3246–3253.
40. Fujisawa H, Morita M. 1997. Phage DNA packaging. Genes to Cells 2:537–545.
41. Mills S, Griffin C, O’Sullivan O, Coffey A, McAuliffe OE, Meijer WC, Serrano LM, Ross
RP. 2011. A new phage on the “Mozzarella” block: Bacteriophage 5093 shares a low level of
homology with other Streptococcus thermophilus phages. Int Dairy J 21:963–969.
42. McDonnell B, Mahony J, Hanemaaijer L, Neve H, Noben JP, Lugli GA, Ventura M, Kouwen
TR, van Sinderen D. 2017. Global survey and genome exploration of bacteriophages infecting
the lactic acid bacterium Streptococcus thermophilus. Front Microbiol 8:1754.
43. McDonnell B, Mahony J, Neve H, Hanemaaijer L, Noben J-P, Kouwen T, van Sinderen D.
88
2016. Identification and analysis of a novel group of bacteriophages infecting the lactic acid
bacterium Streptococcus thermophilus. Appl Environ Microbiol 82:5153–5165.
44. Martel B. 2014. CRISPR-Cas : un nouvel outil pour l’étude des génomes de bactériophages.
Université Laval, Québec.
45. Duplessis M, Moineau S. 2001. Identification of a genetic determinant responsible for host
specificity in Streptococcus thermophilus bacteriophages. Mol Microbiol 41:325–336.
46. Duplessis M, Lévesque CM, Moineau S. 2006. Characterization of Streptococcus
thermophilus host range phage mutants. Appl Environ Microbiol 72:3036–3041.
47. Szymczak P, Janzen T, Neves AR, Kot W, Hansen LH, Lametsch R, Neve H, Franz CMAP,
Vogensen FK. 2017. Novel variants of Streptococcus thermophilus bacteriophages are
indicative of genetic recombination among phages from different bacterial species. Appl
Environ Microbiol Microbiol 83:e02748-16.
48. Martel B, Moineau S. 2014. CRISPR-Cas: an efficient tool for genome engineering of virulent
bacteriophages. Nucleic Acids Res 42:9504–9513.
49. Duplessis M, Russell WM, Romero DA, Moineau S. 2005. Global gene expression analysis
of two Streptococcus thermophilus bacteriophages using DNA microarray. Virology 340:192–
208.
50. Lysenko A, Botina S, Ganina V, Sukhodolets V. 2001. DNA relatedness, divergence, and
sibling species of the lactic acid bacterium Streptococcus thermophilus. Microbiology 70:59–
63.
51. Hatmaker EA, Riley LA, O’Dell KB, Papanek B, Graveley BR, Garrett SC, Wei Y, Terns MP,
Guss AM. 2018. Complete genome sequence of industrial dairy Strain Streptococcus
thermophilus DGCC 7710. Genome Announc 6:e01587-17.
52. Snyder L, Peters JE, Hankins TM, Champness W. 2013. Molecular genetics of bacteria, 4th
ed. ASM Press.
53. Halász A. 2009. Lactic acid bacteria, p. 70–82. In Lasztity, R (ed.), Food Quality and
Standards. EOLSS Publications.
54. De Vuyst L, Degeest B. 1999. Heteropolysaccharides from lactic acid bacteria. FEMS
Microbiol Rev 23:153–177.
55. Drider D, Prevost H. 2009. Bactéries lactiques : Physiologie, métabolisme, génomique et
applications industrielles. Economica, Paris.
56. Hassan AN, Frank JF, Schmidt KA, Shalabi SI. 1996. Textural properties of yogurt made with
encapsulated nonropy lactic cultures. J Dairy Sci 79:2098–2103.
57. Broadbent JR, McMahon DJ, Welker DL, Oberg CJ, Moineau S. 2003. Biochemistry,
genetics, and applications of exopolysaccharide production in Streptococcus thermophilus: a
review. J Dairy Sci 86:407–423.
58. Cui Y, Hu T, Qu X, Zhang L, Ding Z, Dong A. 2015. Plasmids from food lactic acid bacteria:
Diversity, similarity, and new developments. Int J Mol Sci 16:13172–13202.
59. Xiao J, Zhang Y, Yang Z. 2014. Lactic acid bacteria in health and disease, p. 303–374. In
Zhang, H, Cai, Y (eds.), Lactic Acid Bacteria : Fundamentals and Pratice. Springer.
60. Bergey DH. 2009. Bergey’s Manual of Systematic Bacteriology - Volume 3 : The Firmicutes,
2nd ed. Springer, New-York.
61. Zhihong S, Jie Y, Tong D, Wenyi Z, Heping Z. 2014. Phylogenesis and evolution of lactic
acid bacteria, p. 1–101. In Lactic acid bacteria : Fundamentals and pratice. Springer.
62. Bolotin A, Quinquis B, Renault P, Sorokin A, Ehrlich SD, Kulakauskas S, Lapidus A,
Goltsman E, Mazur M, Pusch GD, Fonstein M, Overbeek R, Kyprides N, Purnelle B, Prozzi
D, Ngui K, Masuy D, Hancy F, Burteau S, Boutry M, Delcour J, Goffeau A, Hols P. 2004.
Complete sequence and comparative genome analysis of the dairy bacterium Streptococcus
thermophilus. Nat Biotechnol 22:1554–1558.
63. Lourens-Hattingh A, Viljoen BC. 2001. Yogurt as probiotic carrier food. Int Dairy J 11:1–17.
64. Cerning J. 1995. Production of expolysaccharides by lactic acid bacteria and dairy
89
propionibacteria. Lait 75:463–472.
65. Welman AD, Maddox IS. 2003. Exopolysaccharides from lactic acid bacteria: Perspectives
and challenges. Trends Biotechnol 21:269–274.
66. Duboc P, Mollet B. 2001. Applications of exopolysaccharides in the dairy industry. Int Dairy
J 11:759–768.
67. Gao XY, Zhi XY, Li HW, Klenk HP, Li WJ. 2014. Comparative genomics of the bacterial
genus Streptococcus illuminates evolutionary implications of species groups. PLoS One
9:e101229.
68. Zhang W, Zhang H. 2014. Genomics of lactic acid bateria, p. 205–247. In Zhang, H, Cai, Y
(eds.), Lactic Acid Bacteria : Fundamentals and Pratice. Springer, Nederlands.
69. Moineau S. 1999. Applications of phage resistance in lactic acid bacteria. Antonie Van
Leeuwenhoek 76:377–382.
70. Geagea H, Gomaa AI, Remondetto G, Moineau S, Subirade M. 2015. Investigation of the
protective effect of whey proteins on lactococcal phages during heat treatment at various pH.
Int J Food Microbiol 210:33–41.
71. Campagna C, Villion M, Labrie SJ, Duchaine C, Moineau S. 2014. Inactivation of dairy
bacteriophages by commercial sanitizers and disinfectants. Int J Food Microbiol 171:41–47.
72. Nordstrom K, Forsgren A. 1974. Effect of protein A on adsorption of bacteriophages to
Staphylococcus aureus. J Virol 14:198–202.
73. Westra ER, Swarts DC, Staals RHJ, Jore MM, Brouns SJJ, van der Oost J. 2012. The
CRISPRs, They are A-changin’: How prokaryotes generate adaptive immunity. Annu Rev
Genet 46:311–339.
74. Lu MJ, Henning U. 1994. Superinfection exclusion by T-even-type coliphages. Trends
Microbiol 2:137–139.
75. Bondy-Denomy J, Qian J, Westra ER, Buckling A, Guttman DS, Davidson AR, Maxwell KL.
2016. Prophages mediate defense against phage infection through diverse mechanisms. ISME
J 10:2854–2866.
76. Chopin MC, Chopin A, Bidnenko E. 2005. Phage abortive infection in lactococci: Variations
on a theme. Curr Opin Microbiol 8:473–479.
77. Hyman P, Abedon ST. 2010. Bacteriophage host range and bacterial resistance. Adv Appl
Microbiol 70:217–248.
78. Reuter M, Mücke M, Krüger D. 2004. Structure and function of type IIE restriction
endonucleases, p. 261–295. In Pingoud, A (ed.), Restriction Endonucleases. Springer.
79. Allison GE, Klaenhammer TR. 1998. Phage resistance mechanisms in lactic acid bacteria. Int
Dairy J 8:207–226.
80. Barrangou R, Fremaux C, Deveau H, Richards M, Boyaval P, Moineau S, Romero D a,
Horvath P. 2007. CRISPR provides aquired resistance against viruses in prokaryotes. Science
(80- ) 315:1709–1712.
81. Bolotin A, Quinquis B, Sorokin A, Dusko Ehrlich S. 2005. Clustered regularly interspaced
short palindrome repeats (CRISPRs) have spacers of extrachromosomal origin. Microbiology
151:2551–2561.
82. Mojica FJM, Díez-Villaseñor C, García-Martínez J, Soria E. 2005. Intervening sequences of
regularly spaced prokaryotic repeats derive from foreign genetic elements. J Mol Evol
60:174–182.
83. Marraffini LA, Sontheimer EJ. 2008. CRISPR interference limits horizontal gene transfer in
staphylococci by targeting DNA. Science 322:1843–1845.
84. Ishino Y, Shinagawa H, Makino K, Amemura M, Nakata A. 1987. Nucleotide sequence of the
iap gene, responsible for alkaline phosphatase isozyme conversion in Escherichia coli, and
identification of the gene product. J Bacteriol 169:5429–5433.
85. Horvath P, Barrangou R. 2010. CRISPR/Cas, the immune system of bacteria and archaea.
Science 327:167–170.
90
86. Jansen R, Embden J, Gaastra W, Schouls L. 2002. Identification of genes that are associated
with DNA repeats in prokaryotes. Mol Microbiol 43:1565–1575.
87. Hille F, Richter H, Wong SP, Bratovič M, Ressel S, Charpentier E. 2018. The Biology of
CRISPR-Cas: backward and forward. Cell 172:1239–1259.
88. Garneau JE, Dupuis ME, Villion M, Romero DA, Barrangou R, Boyaval P, Fremaux C,
Horvath P, Magadan AH, Moineau S. 2010. The CRISPR/Cas bacterial immune system
cleaves bacteriophage and plasmid DNA. Nature 468:67–71.
89. Makarova KS, Wolf YI, Alkhnbashi OS, Costa F, Shah SA, Saunders SJ, Barrangou R, Brouns
SJ, Charpentier E, Haft DH, Horvath P, Moineau S, Mojica FJM, Terns RM, Terns MP, White
MF, Yakunin AF, Garrett RA, van der Oost J, Backofen R, Koonin E V. 2015. An updated
evolutionary classification of CRISPR–Cas systems. Nat Rev Microbiol 13:722–736.
90. Makarova KS, Haft DH, Barrangou R, Brouns SJJ, Charpentier E, Horvath P, Moineau S,
Mojica FJM, Wolf YI, Yakunin AF, van der Oost J, Koonin E V. 2011. Evolution and
classification of the CRISPR–Cas systems. Nat Rev Microbiol 9:467–477.
91. Koonin E V., Makarova KS, Zhang F. 2017. Diversity, classification and evolution of
CRISPR-Cas systems. Curr Opin Microbiol 37:67–78.
92. Noble C, Olejarz J, Esvelt K, Church G, Nowak M. 2017. Evolutionary dynamics of CRISPR
gene drives. Sci Adv e1601964.
93. Koonin E V., Makarova KS, Zhang F. 2017. Diversity, classification and evolution of
CRISPR-Cas systems. Curr Opin Microbiol 37:67–78.
94. Hao M, Cui Y, Qu X. 2018. Analysis of CRISPR-cas system in Streptococcus thermophilus
and its application. Front Microbiol 9:257.
95. Carte J, Christopher RT, Smith JT, Olson S, Barrangou R, Moineau S, Claiborne VCGI,
Graveley BR, Terns RM, Terns MP. 2014. The three major types of CRISPR-Cas systems
function independently in CRISPR RNA biogenesis in Streptococcus thermophilus. Mol
Microbiol 93:98–112.
96. Magadán AH, Dupuis MÈ, Villion M, Moineau S. 2012. Cleavage of phage DNA by the
Streptococcus thermophilus CRISPR3-Cas system. PLoS One 7:e40913.
97. Young JC, Dill BD, Pan C, Hettich RL, Banfield JF, Shah M, Fremaux C, Horvath P,
Barrangou R, Verberkmoes NC. 2012. Phage-induced expression of CRISPR-associated
proteins is revealed by shotgun proteomics in Streptococcus thermophilus. PLoS One
7:e38077.
98. Horvath P, Romero DA, Coûté-Monvoisin AC, Richards M, Deveau H, Moineau S, Boyaval
P, Fremaux C, Barrangou R. 2008. Diversity, activity, and evolution of CRISPR loci in
Streptococcus thermophilus. J Bacteriol 190:1401–1412.
99. van der Oost J, Jore MM, Westra ER, Lundgren M, Brouns SJJ. 2009. CRISPR-based adaptive
and heritable immunity in prokaryotes. Trends Biochem Sci 34:401–407.
100. Barrangou R. 2013. CRISPR-Cas systems and RNA-guided interference. Wiley Interdiscip
Rev RNA 4:267–278.
101. Levy A, Goren MG, Yosef I, Auster O, Manor M, Amitai G, Edgar R, Qimron U, Sorek R.
2015. CRISPR adaptation biases explain preference for acquisition of foreign DNA. Nature
520:505–510.
102. Modell JW, Jiang W, Marraffini LA. 2017. CRISPR-Cas systems exploit viral DNA injection
to establish and maintain adaptive immunity. Nature 544:101–104.
103. Mojica FJM, Díez-Villaseñor C, García-Martínez J, Almendros C. 2009. Short motif
sequences determine the targets of the prokaryotic CRISPR defence system. Microbiology
155:733–740.
104. Datsenko KA, Pougach K, Tikhonov A, Wanner BL, Severinov K, Semenova E. 2012.
Molecular memory of prior infections activates the CRISPR/Cas adaptive bacterial immunity
system. Nat Commun 3:945.
105. Heler R, Samai P, Modell JW, Weiner C, Goldberg GW, Bikard D, Marraffini LA. 2015. Cas9
91
specifies functional viral targets during CRISPR-Cas adaptation. Nature 519:199–202.
106. Nuñez JK, Lee ASY, Engelman A, Doudna J a. 2015. Integrase-mediated spacer acquisition
during CRISPR–Cas adaptive immunity. Nature 519:193–198.
107. McGinn J, Marraffini LA. 2016. CRISPR-Cas systems optimize their immune response by
specifying the site of spacer integration. Mol Cell 64:616–623.
108. Rollie C, Graham S, Rouillon C, White MF. 2018. Prespacer processing and specific
integration in a Type I-A CRISPR system. Nucleic Acids Res 46:1007–1020.
109. Xiao Y, Ng S, Hyun Nam K, Ke A. 2017. How type II CRISPR-Cas establish immunity
through Cas1-Cas2-mediated spacer integration. Nature 550:137–141.
110. Arslan Z, Hermanns V, Wurm R, Wagner R, Pul U. 2014. Detection and characterization of
spacer integration intermediates in type I-E CRISPR-Cas system. Nucleic Acids Res 42:7884–
7893.
111. Sashital DG, Jinek M, Doudna JA. 2011. An RNA-induced conformational change required
for CRISPR RNA cleavage by the endoribonuclease Cse3. Nat Struct Mol Biol 18:680–687.
112. Haurwitz RE, Jinek M, Wiedenheft B, Zhou K, Doudna JA. 2010. Sequence- and structure-
specific RNA processing by a CRISPR endonuclease. Science 329:1355–1358.
113. Gesner EM, Schellenberg MJ, Garside EL, George MM, MacMillan AM. 2011. Recognition
and maturation of effector RNAs in a CRISPR interference pathway. Nat Struct Mol Biol
18:688–692.
114. Sefcikova J, Roth M, Yu G, Li H. 2017. Cas6 processes tight and relaxed repeat RNA via
multiple mechanisms: A hypothesis. BioEssays 39:1700019.
115. Deltcheva E, Chylinski K, Sharma CM, Gonzales K, Chao Y, Pirzada ZA, Eckert MR, Vogel
J, Charpentier E. 2011. CRISPR RNA maturation by trans-encoded small RNA and host factor
RNase III. Nature 471:602–607.
116. Shmakov S, Abudayyeh OO, Makarova KS, Wolf YI, Gootenberg JS, Semenova E, Minakhin
L, Joung J, Konermann S, Severinov K, Zhang F, Koonin E V. 2015. Discovery and functional
characterization of diverse class 2 CRISPR-Cas systems. Mol Cell 60:385–397.
117. Fonfara I, Richter H, Bratovič M, Le Rhun A, Charpentier E. 2016. The CRISPR-associated
DNA-cleaving enzyme Cpf1 also processes precursor CRISPR RNA. Nature 532:517–521.
118. Gasiunas G, Barrangou R, Horvath P, Siksnys V. 2012. Cas9-crRNA ribonucleoprotein
complex mediates specific DNA cleavage for adaptive immunity in bacteria. Proc Natl Acad
Sci 109:E2579–E2586.
119. Wright A V., Doudna JA. 2016. Protecting genome integrity during CRISPR immune
adaptation. Nat Struct Mol Biol 23:876–883.
120. Brouns SJJ, Jore MM, Lundgren M, Westra ER, Slijkhuis RJH, Snijders APL, Dickman MJ,
Makarova KS, Koonin E V., Van der Oost J. 2008. Small CRISPR RNAs guide antiviral
defense in prokaryotes. Science (80- ) 321:960–964.
121. Semenova E, Jore MM, Datsenko KA, Semenova A, Westra ER, Wanner B, van der Oost J,
Brouns SJJ, Severinov K. 2011. Interference by clustered regularly interspaced short
palindromic repeat (CRISPR) RNA is governed by a seed sequence. Proc Natl Acad Sci
108:10098–10103.
122. Xiao Y, Luo M, Hayes RP, Kim J, Ng S, Ding F, Liao M, Ke A. 2017. Structure basis for
directional R-loop formation and substrate handover mechanisms in type I CRISPR-Cas
system. Cell 170:48–60.e11.
123. Redding S, Sternberg SH, Marshall M, Gibb B, Bhat P, Guegler CK, Wiedenheft B, Doudna
JA, Greene EC. 2015. Surveillance and processing of foreign DNA by the Escherichia coli
CRISPR-Cas System. Cell 163:854–865.
124. Taylor DW, Zhu Y, Staals RHJ, Kornfeld JE, Shinkai A, van der Oost J, Nogales E, Doudna
JA. 2015. Structures of the CRISPR-Cmr complex reveal mode of RNA target positioning.
Science 348:581 LP-585.
125. Jinek M, Jiang F, Taylor DW, Sternberg SH, Kaya E, Ma E, Anders C, Hauer M, Zhou K, Lin
92
S, Kaplan M, Iavarone AT, Charpentier E, Nogales E, Doudna JA. 2014. Structures of Cas9
endonucleases reveal RNA-mediated conformational activation. Science 343:1247997.
126. Sternberg SH, Redding S, Jinek M, Greene EC, Doudna JA. 2014. DNA interrogation by the
CRISPR RNA-guided endonuclease Cas9. Nature 507:62–67.
127. Nishimasu H, Ran FA, Hsu PD, Konermann S, Shehata SI, Dohmae N, Ishitani R, Zhang F,
Nureki O. 2014. Crystal structure of Cas9 in complex with guide RNA and target DNA. Cell
156:935–949.
128. Jiang F, Zhou K, Ma L, Gressel S, Doudna JA. 2015. A Cas9-guide RNA complex
preorganized for target DNA recognition. Science 348:1477–1481.
129. East-Seletsky A, O’Connell MR, Burstein D, Knott GJ, Doudna JA. 2017. RNA targeting by
functionally orthogonal yype VI-A CRISPR-Cas enzymes. Mol Cell 66:373–383.e3.
130. Abudayyeh OO, Gootenberg JS, Konermann S, Joung J, Slaymaker IM, Cox DBT, Shmakov
S, Makarova KS, Semenova E, Minakhin L, Severinov K, Regev A, Lander ES, Koonin E V,
Zhang F. 2016. C2c2 is a single-component programmable RNA-guided RNA-targeting
CRISPR effector. Science 353:aaf5573.
131. Liu L, Li X, Ma J, Li Z, You L, Wang J, Wang M, Zhang X, Wang Y. 2017. The Molecular
architecture for RNA-guided RNA leavage by Cas13a. Cell 170:714–726.e10.
132. Hsu PD, Lander ES, Zhang F. 2014. Development and applications of CRISPR-Cas9 for
genome engineering. Cell 157:1262–1278.
133. Jiang W, Bikard D, Cox D, Zhang F, Marraffini LA. 2013. CRISPR-assisted editing of
bacterial genomes. Nat Biotechnol 31:233–239.
134. Cong L, Ran FA, Cox D, Lin S, Barretto R, Habib N, Hsu PD, Wu X, Jiang W, Marraffini
LA, Zhang F. 2013. Multiplex genome engineering using CRISPR/Cas systems. Science
339:819–823.
135. Zaidi SS-A, Tashkandi M, Mansoor S, Mahfouz MM. 2016. Engineering plant immunity:
using CRISPR/Cas9 to generate virus resistance. Front Plant Sci 7:1673.
136. Jiang W, Bikard D, Cox D, Zhang F, Marraffini L a. 2013. RNA-guided editing of bacterial
genomes using CRISPR-Cas systems. Nat Biotechnol 31:233–239.
137. DiCarlo JE, Norville JE, Mali P, Rios X, Aach J, Church GM. 2013. Genome engineering in
Saccharomyces cerevisiae using CRISPR-Cas systems. Nucleic Acids Res 41:4336–4343.
138. Cho SW, Kim S, Kim JM, Kim J-S. 2013. Targeted genome engineering in human cells with
the Cas9 RNA-guided endonuclease. Nat Biotechnol 31:230–232.
139. Rouet P, Smih F, Jasin M. 1994. Introduction of double-strand breaks into the genome of
mouse cells by expression of a rare-cutting endonuclease. Mol Cell Biol 14:8096–8106.
140. Rouet P, Smih F, Jasin M. 1994. Expression of a site-specific endonuclease stimulates
homologous recombination in mammalian cells. Proc Natl Acad Sci U S A 91:6064–6068.
141. Porteus M. 2016. Genome editing: a new approach to human therapeutics. Annu Rev
Pharmacol Toxicol 56:163–190.
142. Wang H, La Russa M, Qi LS. 2016. CRISPR/Cas9 in genome editing and beyond. Annu Rev
Biochem 85:227–264.
143. Silva G, Poirot L, Galetto R, Smith J, Montoya G, Duchateau P, Pâques F. 2011.
Meganucleases and other tools for targeted genome engineering: perspectives and challenges
for gene therapy. Curr Gene Ther 11:11–27.
144. Gaj T, Gersbach CA, Barbas CF. 2013. ZFN, TALEN, and CRISPR/Cas-based methods for
genome engineering. Trends Biotechnol 31:397–405.
145. K. J, Fonfara I, Hauer M, Doudna JA, Charpentier E, Chylinski M. 2012. A programmable
dual-RNA-guided DNA endonuclease in adapative bacterial immunity. Science 337:816–821.
146. Hilton IB, D’Ippolito AM, Vockley CM, Thakore PI, Crawford GE, Reddy TE, Gersbach CA.
2015. Epigenome editing by a CRISPR-Cas9-based acetyltransferase activates genes from
promoters and enhancers. Nat Biotechnol 33:510–517.
147. Lo A, Qi L. 2017. Genetic and epigenetic control of gene expression by CRISPR–Cas systems.
93
F1000 Res 6:F1000 Faculty Rev-747.
148. Qi LS, Larson MH, Gilbert LA, Doudna JA, Weissman JS, Arkin AP, Lim WA. 2013.
Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene
expression. Cell 152:1173–1183.
149. Knight SC, Xie L, Deng W, Guglielmi B, Witkowsky LB, Bosanac L, Zhang ET, El Beheiry
M, Masson J-B, Dahan M, Liu Z, Doudna JA, Tjian R. 2015. Dynamics of CRISPR-Cas9
genome interrogation in living cells. Science 350:823–826.
150. Court D, Sawitzke J, Thomason L. 2002. Genetic engineering using homologous
recombination. Annu Rev Genet 36:361–388.
151. Fonfara I, Le Rhun A, Chylinski K, Makarova KS, Lecrivain A-L, Bzdrenga J, Koonin E V,
Charpentier E. 2014. Phylogeny of Cas9 determines functional exchangeability of dual-RNA
and Cas9 among orthologous type II CRISPR-Cas systems. Nucleic Acids Res 42:2577–2590.
152. Doudna JA, Charpentier E. 2014. The new frontier of genome engineering with CRISPR-
Cas9. Science 346:1258096.
153. Terao M, Tamano M, Hara S, Kato T, Kinoshita M, Takada S. 2016. Utilization of the
CRISPR/Cas9 system for the efficient production of mutant mice using crRNA/tracrRNA with
Cas9 nickase and FokI-dCas9. Exp Anim 65:275–283.
154. Ran FA, Hsu PD, Lin CY, Gootenberg JS, Konermann S, Trevino AE, Scott DA, Inoue A,
Matoba S, Zhang Y, Zhang F. 2013. Double nicking by RNA-guided CRISPR cas9 for
enhanced genome editing specificity. Cell 154:1380–1389.
155. Shen B, Zhang W, Zhang J, Zhou J, Wang J, Chen L, Wang L, Hodgkins A, Iyer V, Huang
X, Skarnes WC. 2014. Efficient genome modification by CRISPR-Cas9 nickase with minimal
off-target effects. Nat Methods 11:399–402.
156. Hao N, Shearwin KE, Dodd IB. 2017. Programmable DNA looping using engineered bivalent
dCas9 complexes. Nat Commun 8:1628.
157. Gilbert LA, Larson MH, Morsut L, Liu Z, Brar GA, Torres SE, Stern-Ginossar N, Brandman
O, Whitehead EH, Doudna JA, Lim WA, Weissman JS, Qi LS. 2013. CRISPR-mediated
modular RNA-guided regulation of transcription in eukaryotes. Cell 154:442–451.
158. Chen B, Gilbert LA, Cimini BA, Schnitzbauer J, Zhang W, Li G-W, Park J, Blackburn EH,
Weissman JS, Qi LS, Huang B. 2013. Dynamic imaging of genomic loci in living human cells
by an optimized CRISPR/Cas system. Cell 155:1479–1491.
159. Tanenbaum ME, Gilbert LA, Qi LS, Weissman JS, Vale RD. 2014. A protein-tagging system
for signal amplification in gene expression and fluorescence imaging. Cell 159:635–646.
160. Anton T, Bultmann S, Leonhardt H, Markaki Y. 2014. Visualization of specific DNA
sequences in living mouse embryonic stem cells with a programmable fluorescent
CRISPR/Cas system. Nucleus 5:163–172.
161. Nishimasu H, Cong L, Yan WX, Ran FA, Zetsche B, Li Y, Kurabayashi A, Ishitani R, Zhang
F, Nureki O. 2015. Crystal structure of Staphylococcus aureus Cas9. Cell 162:1113–1126.
162. Ran FA, Cong L, Yan WX, Scott DA, Gootenberg JS, Kriz AJ, Zetsche B, Shalem O, Wu X,
Makarova KS, Koonin E V., Sharp PA, Zhang F. 2015. In vivo genome editing using
Staphylococcus aureus Cas9. Nature 520:186–191.
163. Esvelt KM, Mali P, Braff JL, Moosburner M, Yaung SJ, Church GM. 2013. Orthogonal Cas9
proteins for RNA-guided gene regulation and editing. Nat Methods 10:1116–1121.
164. Vos WM De. 1987. Gene cloning and expression in lactic streptococci. FEMS Microbiol Rev
46:281–295.
165. Terzaghi BE, Sandine WE. 1975. Improved medium for lactic streptococci and their
bacteriophages. Appl Microbiol 29:807–813.
166. Bertani G. 1951. Studies on lysogenesis. I. The mode of phage liberation by lysogenic
Escherichia coli. J Bacteriol 62:293–300.
167. Moineau S, Pandian S, Klaenhammer TR. 1994. Evolution of a lytic bacteriophage via DNA
acquisition from the Lactococcus lactis chromosome. Appl Environ Microbiol 60:1832–1841.
94
168. Hynes AP, Lemay M, Trudel L, Deveau H, Frenette M, Tremblay DM, Moineau S. 2017.
Detecting natural adaptation of the Streptococcus thermophilus CRISPR-Cas systems in
research and classroom settings. Nat Protoc 12:547–565.
169. Hynes AP, Labrie SJ, Moineau S. 2016. Programming native CRISPR arrays for the
generation of targeted immunity. MBio 7:e00202-16.
170. Lemay M-L, Renaud A, Rousseau GM, Moineau S. 2018. Targeted genome editing of virulent
phages using CRISPR-Cas9. Bio-protocol 8:e2674.
171. Boulanger V. 2017. Structure determination of virulent bacteriophage 2972 of Streptococcus
thermophilus proteins. Rapport de stage, Université Laval, Québec.
172. Campbell I, Dwek R. 1984. Biological Spectroscopy : Concepts, Application and Aroblems.
Benjamin-Cummings Publishing Company, California.
173. Edwards YJ, Cottage A. 2003. Bioinformatics methods to predict protein structure and
function. A practical approach. Mol Biotechnol 23:139–166.
174. Baldwin MA. 2004. Protein identification by mass spectrometry. Mol Cell Proteomics 3:1–9.
175. Binetti A, Quiberoni A, Reinheimer J a. 2002. Phage adsorption to Streptococcus
thermophilus. Influence of environmental factors and characterization of cell-receptors. Food
Res Int 35:73–83.
176. Hatfull GF, Hendrix RW. 2011. Bacteriophages and their genomes. Curr Opin Virol 1:298–
303.
177. Amitai G, Sorek R. 2016. CRISPR–Cas adaptation: insights into the mechanism of action. Nat
Rev Microbiol 14:67–76.
178. Fineran PC, Gerritzen MJH, Suárez-Diez M, Künne T, Boekhorst J, van Hijum SAFT, Staals
RHJ, Brouns SJJ. 2014. Degenerate target sites mediate rapid primed CRISPR adaptation.
Proc Natl Acad Sci U S A 111:E1629–E1638.
179. Xue C, Seetharam AS, Musharova O, Severinov K, Brouns SJJ, Severin AJ, Sashital DG.
2015. CRISPR interference and priming varies with individual spacer sequences. Nucleic
Acids Res 43:10831–10847.
180. Richter C, Dy RL, McKenzie RE, Watson BNJ, Taylor C, Chang JT, McNeil MB, Staals RHJ,
Fineran PC. 2014. Priming in the type I-F CRISPR-Cas system triggers strand-independent
spacer acquisition, bi-directionally from the primed protospacer. Nucleic Acids Res 42:8516–
8526.
181. Rao C, Chin D, Ensminger AW. 2017. Priming in a permissive type I-C CRISPR-Cas system
reveals distinct dynamics of spacer acquisition and loss. RNA 23:1525–1538.
182. Semenova E, Savitskaya E, Musharova O, Strotskaya A, Vorontsova D, Datsenko KA,
Logacheva MD, Severinov K. 2016. Highly efficient primed spacer acquisition from targets
destroyed by the Escherichia coli type I-E CRISPR-Cas interfering complex. Proc Natl Acad
Sci 113:7626–7631.
183. Shub DA, Gott JM, Xu MQ, Lang BF, Michel F, Tomaschewski J, Pedersen-Lane J, Belfort
M. 1988. Structural conservation among three homologous introns of bacteriophage T4 and
the group I introns of eukaryotes. Proc Natl Acad Sci 85:1151–1155.
184. Quirk SM, Bell-Pedersen D, Tomaschewski J, Rüger W, Belfort M. 1989. The inconsistent
distribution of introns in the T-even phages indicates recent genetic exchanges. Nucleic Acids
Res 17:301–315.
185. Foley S, Bruttin A, Brüssow H. 2000. Widespread distribution of a group I intron and its three
deletion derivatives in the lysin gene of Streptococcus thermophilus bacteriophages. J Virol
74:611–618.
186. Sheehan MM, Garcia JL, Lopex R, Garcia P. 1997. The lytic enzyme of the pneumococcal
phage Dp-1: a chimeric lysin of intergenic origin. Mol Microbiol 25:717–725.
187. Zimmermann L, Stephens A, Nam S, Rau D, Kübler J, Lozajic M, Gabler F, Söding J, Lupas
A, Alva V. 2018. A completely reimplemented MPI bioinformatics toolkit with a new HHpred
server at its core. J Mol Biol 430:2237–2243.
95
188. Azuma K, Ohtsuka H, Mita S, Murakami H, Aiba H. 2009. Identification and Characterization
of an Ecl1-Family Gene in Saccharomyces cerevisiae. Biosci Biotechnol Biochem 73:2787–
2789.
189. Baslé A, Hewitt L, Koh A, Lamb HK, Thompson P, Burgess JG, Hall MJ, Hawkins AR,
Murray H, Lewis RJ. 2018. Crystal structure of NucB, a biofilm-degrading endonuclease.
Nucleic Acids Res 46:473–484.
190. Hynes AP, Villion M, Moineau S. 2014. Adaptation in bacterial CRISPR-Cas immunity can
be driven by defective phages. Nat Commun 5:4399.
191. Sambrook, J., E. F. Fritsch, and T. Maniatis. 1989. Molecular cloning: a laboratory manual,
2nd ed. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.