Upload
others
View
4
Download
0
Embed Size (px)
Citation preview
Développement d’un algorithme permettant la prédiction des métastases à partir de mutations germinales et celles du clone
fondateur chez des patients atteints du cancer.
Mémoire
Jean-Sébastien Milanese
Maîtrise en biologie cellulaire et moléculaire Maître ès sciences (M. Sc.)
Québec, Canada
© Jean-Sébastien Milanese, 2018
Développement d’un algorithme permettant la prédiction des métastases à partir de mutations germinales et celles du clone
fondateur chez des patients atteints du cancer.
Mémoire
Jean-Sébastien Milanese
Sous la direction de :
Arnaud Droit, directeur de recherche
iii
RÉSUMÉ
Avec les constantes avancées du séquençage de nouvelle génération (NGS), la
quantité de données disponibles devient massive. En parallèle, les méthodes de
détection au cancer demeurent très spécifiques et peu efficaces. De plus, le taux
de survie des patients est directement relié à la progression tumorale et par
conséquent, aux méthodes de détection. Malgré des avancées technologiques
très importantes dans les dernières années, le taux de mortalité du cancer ne
cesse d’augmenter. L’importance de développer des nouvelles méthodes de
détection applicables à tous les types de cancer devient une nécessité. Jusqu’à
présent, il n’existe aucun modèle permettant d’utiliser le séquençage de nouvelle
génération qui permet la prédiction de caractéristiques cancéreuse (ex :
récurrence, résistance, etc.). Les sections suivantes démontrent la création d’un
modèle utilisant des mutations somatiques et germinales pour prédire la
récurrence et son applicabilité au travers de tous les types de cancers (et même
différentes maladies). En utilisant des signatures géniques (combinaisons de
gènes) spécifiques à chaque cancer, nous avons été en mesure d’obtenir une
précision de 90% (et plus) pour le groupe où le cancer est récurrent. De nos
connaissances, ceci est la première tentative de développement de modèle
permettant de prédire le pronostic du patient en utilisant le NGS. Ceci amène un
nouvel aspect pour la médecine personnalisée et spécialement pour le dépistage
du cancer.
iv
ABSTRACT
With the constant progress in neext generation sequencing, the quantity of data
available for investigation becomes massive. In parallel, cancer detection
methods and treatments remain very specific and barely accurate. Moreover, the
patients survival rate are directly linked with tumoral progression and therefore,
to cancer detection methods. Despite continual technological advances in recent
years, the global cancer mortality rate keeps rising. The creation of new detection
methods accessible to all cancer types becomes a necessity. As of now, there is
no model available that using sequencing data to predict cancer traits (ex:
recurrence, resistance, etc.). The following sections demonstrate the creation of
such model using somatic and germline mutations to predict recurrence and its
applicability across all cancer types (and even across different diseases). By
using gene signatures specific to each cancer types, we were able to obtain an
accuracy of 90% (and more) for the cohort where the cancer was recurrent. To
our knowledge, this is the first attempt to develop a model that can predict the
patient’s prognosis using genome sequencing data. This will affect future studies
and improve personalized medicine as well as cancer detection methods.
v
vi
TABLE DES MATIÈRES
Résumé ..................................................................................................................................................................................... iii
Abstract .................................................................................................................................................................................... iv
Liste des figures ................................................................................................................................................................ viii
Liste des abréviations ..................................................................................................................................................... ix
Remerciements ................................................................................................................................................................... xii
Chapitre 1 Introduction ................................................................................................................................................ 1
1.1 Le Cancer .............................................................................................................................................................. 1
1.1.1 Origine ........................................................................................................................................................... 1
1.1.2 Base génétique et caractéristiques du cancer (« Cancer Hallmarks ») ............... 2
1.1.3 Taux d’incidence et mortalité ....................................................................................................... 13
1.1.4 Diagnostics ............................................................................................................................................... 15
1.1.5 Traitements ............................................................................................................................................... 16
1.1.6 Hétérogénéité et résistance ........................................................................................................... 22
1.1.7 La génétique du cancer et sa progression jusqu'à présent ...................................... 25
1.2 Biologie des systèmes ................................................................................................................................ 27
1.2.1 Concept ....................................................................................................................................................... 27
1.2.2 Sentiers métaboliques et diaphonie (« crosstalk ») ....................................................... 28
1.2.3 Réseaux ...................................................................................................................................................... 29
Chapitre 2 Problématique, hypothèse et objectifs ................................................................................... 34
2.1 Problématique .................................................................................................................................................. 34
2.2 Hypothèse et objectifs ................................................................................................................................ 35
Chapitre 3 Article ............................................................................................................................................................... 36
Avant-Propos .................................................................................................................................................................. 36
3.1 Résumé ................................................................................................................................................................. 36
3.2 Abstract ................................................................................................................................................................ 38
3.3 Introduction ....................................................................................................................................................... 39
3.4 Methods ................................................................................................................................................................ 41
3.5 Results .................................................................................................................................................................. 43
3.6 Discussion .......................................................................................................................................................... 48
3.7 References .......................................................................................................................................................... 51
vii
3.8 Tables .................................................................................................................................................................... 55
3.9 Figures and legends ..................................................................................................................................... 57
Chapitre 4 Discussion générale ............................................................................................................................... 62
4.1 Le NGS et son utilisation comme outil de prédiction ............................................................. 62
4.2 Impacts du clone fondateur dans l’expansion clonale du cancer .................................. 63
4.3 Les mutations germinales et leur potentielle utilisation ....................................................... 64
4.4 Vision à long terme ....................................................................................................................................... 64
Conclusions et perspectives...................................................................................................................................... 66
Bibliographie ........................................................................................................................................................................ 67
viii
LISTE DES FIGURES
Figure 1.1 Le développement du cancer.
Figure 1.2 Les capacités distinctes du cancer « Cancer Hallmarks ».
Figure 1.3 Le microenvironnement tumoral, la réponse immunitaire et la
diaphonie (« cross-talk ») métabolique.
Figure 1.4 Graphique démontrant le taux d’incidence normalisé selon l’âge (TINA)
du cancer chez les hommes et les femmes au fil des années au Canada.
Figure 1.5 Graphique démontrant le taux de mortalité normalisé selon l’âge
(TMNA) du cancer chez les hommes et les femmes au fil des années au Canada.
Figure 1.6: Réseau non dirigé représentant les gènes associés à la prolifération
du glioblastome.
ix
LISTE DES ABRÉVIATIONS
Akt/pKb Protein kinase B
APS Antigène Prostatique Spécifique
Bcl-2 B-Cell Lymphoma 2
BER Base Excision Repair
BRCA1/2 Breast Cancer Gene 1/2
ChIP-Seq Chromatin Immunoprecipitation Sequencing
CTL Cytotoxic T Lymphocyte
EGA European Genome-phenome Archive
EGFR Epidermal Growth Factor Receptor
EMT Epithelial Mesenchymal Transition
ER+/RE+ Estrogen Receptor Positive/Récepteur d’estrogène positif
ERK Extracellular signal-regulated kinase
FISH Fluorescence in situ hybridization
GLUT1 Glucose transporter 1
GWAS Genome Wide Association Study
HGP Human Genome Project
ICGC International Cancer Genome Consortium
NER Nucleotide Excision Repair
NHEJ Non-homologous end joining
NIH National Institute of Health
MAPK Mitogen-activated protein kinase
MEC Matrice extracellulaire
MMR Mismatch repair
mTor/mTorC1 Mammalian target of rapamycin complex 1
NK Natural killer cell
Rb/pRb Retinoblastoma Protein
SNP Single Polymorphism Nucleotide
TCGA The Cancer Genome Atlas
TERT Telomerase reverse transcriptase
x
TP53/p53 Tumor Protein p53
TSP1 Thrombospondin 1
UTR Untranslated Regions
VEGF Vascular endothelial growth factor
WES Whole Exome Sequencing
xi
« We cannot solve our problems
with the same thinking we used
when we created them. »
Albert Einstein
xii
REMERCIEMENTS
En premier lieu, j’aimerais remercier mon directeur de maîtrise Dr Arnaud Droit, et Dr
Edwin Wang, pour m’avoir donné l’opportunité de pouvoir exécuter mon propre projet
pendant 3 années. Malgré les obstacles tout au long du chemin, personnels et
professionnels, nous avons mené à terme le projet et sommes en processus de publier
un article dans Jama Oncology. Edwin, jusqu’à aujourd’hui, je persiste à croire que tu
es une des personnes les plus innovatrices pour ce qui est de la biologie des systèmes
appliquée au cancer. J’ai apprécié nos conversations scientifiques quotidiennes et elles
ont été une source de motivation pour moi tout au long de ces années. Ton désir et ta
passion de faire avancer la science sont une source d’inspiration pour tous les
professionnels en recherche. J’aimerais également remercier tous les membres de
l’équipe du NRC : Naif Zaman, Chabane Tibiche, Jinfeng Zou et notre chef d’équipe
André Nantel. Vos connaissances, votre aide et votre support sont (et seront) toujours
très appréciés. De plus, j’aimerais remercier Mme Eileen Raymond qui m’a initialement
présenté à Dr Wang. Cette maîtrise et ce projet n’auraient pu être réalisables sans votre
appui à tous.
En second lieu, j’aimerais remercier ma famille qui m’a supporté tout au long de cette
étape. Plus spécifiquement mon père, qui est une source d’inspiration majeure pour
moi, merci de m’avoir guidé et motivé lorsque le projet n’avançait pas au rythme que je
désirais. Merci pour ton support dans tous mes choix de carrière, et ce, même lorsque
je me questionnais sur ceux-ci. Merci pour ton constant soutien et pour la fierté que tu
m’attribues chaque jour.
1
CHAPITRE 1 INTRODUCTION
1.1 Le Cancer
1.1.1 Origine
Les premières observations du cancer proviennent de l’Antiquité égyptienne.
Hippocrates, un des premiers observateurs du cancer, fut l’un des premiers à
caractériser la maladie. Il désigna le terme karkinos (carcinos ou carcinoma) à
celle-ci après avoir observé des ulcères chroniques ou des croissances
cellulaires anormales (tumeurs malignes). Karkinos signifie crabe en grec et est
attribuable à la densité de veines accrochées à la tumeur telle un crabe et toutes
ces pattes l’entourant. Le terme oncos fût ensuite introduit pour désigner une
croissance cellulaire anormale ou tumeur maligne. Certains physiciens
déclaraient déjà la maladie d’incurable alors que d’autres avaient opté pour la
chirurgie (ou excision). Par contre, les traditions égyptiennes ne permettaient pas
d’ouvrir un cadavre et donc, peu de caractéristiques ont pu être observées et
vérifiées (1) (2). Ce n’est donc que beaucoup plus tard que certaines hypothèses
concernant les phénomènes biologiques entourant le cancer ont pu être
formulées. Au 18e siècle, à l’aide du microscope, des cellules cancéreuses ont
été observées à l’extérieur du tissu primaire par un chirurgien nommé Campbell
de Morgan et formulaient donc la première évidence des métastases (3). En
1902, les premières bases génétiques de la maladie furent émises par Theodor
Boveri qui suggéra que certaines mutations causant une croissance anormale
pouvaient être transmissibles par les chromosomes (hérédité) et que certains
agents pathogènes pouvaient promouvoir la maladie (agents carcinogènes). Il
introduit également certains termes comme gène suppresseur de tumeur,
oncogène et des points de contrôles cellulaires (4). Vers la fin du 18e siècle, à
l’aide de la découverte de la radiation, Marie et Pierre Curie ainsi qu’Henri
Coutard développèrent le premier traitement contre le cancer excluant la
2
chirurgie; traitement qui est encore utilisé aujourd’hui (5). Finalement, la lutte
contre le cancer fût enfin reconnue mondialement en 1971 lorsque le président
des États-Unis Richard Nixon mit en vigueur l’acte national contre le cancer qui
avait pour but de promouvoir les risques associés au cancer et principalement,
de mettre en garde la population (6). Malheureusement, encore aujourd’hui,
plusieurs milliards de dollars sont investis par plusieurs pays chaque année et le
taux de mortalité du cancer semble ne pas diminuer. Bien évidemment, avec une
espérance de vie plus élevée, les chances de développer un cancer augmentent.
Le taux de mortalité, les enjeux des méthodes de détection et les traitements
alternatifs seront discutés dans les sections à venir (1.1.3, 1.1.4 et 1.1.5,
respectivement).
1.1.2 Base génétique et caractéristiques du cancer (« Cancer Hallmarks »)
L’ADN d’une cellule normale est toujours sujet à des changements génétiques
(mutations, amplifications, délétions). Les changements endogènes sont des
modifications de l’ADN causés par des phénomènes à l’intérieur de la cellule
(ex. : oxydation, alkylation, erreur de réplication, etc.). Ceux-ci sont corrigés par
des mécanismes cellulaires comme le MMR, le BER, le NER, la recombinaison
homologue, la jonction d’extrémités non homologues (NHEJ) et à l’aide de
certains gènes (BRCA1, BRCA2, la famille Uvr, MSH, etc.). Les changements
exogènes, quant à eux, sont des agents pathogènes qui ont un effet direct sur
l’ADN (rayons X, rayons-γ, rayons ultraviolets, benzène) qui sont une partie
intégrante de notre environnement (soleil, rayons X, etc.) ou notre mode de vie
(cigarette, alimentation, etc.) (7). Pour qu’une cellule devienne cancéreuse,
plusieurs mutations sont transmises de génération en génération lors de la
mitose et confèrent plusieurs avantages sélectifs à cette cellule (Figure 1.1).
Parmi ces avantages, un des plus importants est la capacité de croitre à une
fréquence plus élevée que les cellules normales. Lorsque cette cellule se sera
multipliée à plusieurs reprises, la sous-population de cellules se nommera plutôt
une tumeur. Si cette sous-population de cellules est capable d’envahir un autre
3
tissu, nous parlerons d’une tumeur maligne (cancéreuse) et si ce n’est pas le
cas, cette tumeur sera bénigne. Une tumeur bénigne est souvent beaucoup
moins dangereuse qu’un cancer. Dans la plupart des cas, une simple excision
peut convenir et les patients sont totalement hors de danger. Évidemment,
plusieurs gènes sont impliqués dans le processus de formation de cellules
cancéreuses et certains mécanismes/voies peuvent aider ou nuire à cette
formation. Les gènes qui vont généralement aider la formation de cellules
cancéreuses sont généralement des gènes favorisant la prolifération (EGFR,
Ras, etc.); ces gènes sont nommés des oncogènes (ou proto-oncogènes). À
l’inverse, les gènes qui protègent la cellule contre des étapes favorisant la
formation du cancer sont des gènes nommés des gènes suppresseurs de tumeur
(BRCA1, BRCA2). Ceux-ci peuvent avoir plusieurs fonctions diverses: réparation
de l’ADN, apoptose, inhibiteur de croissance, etc. Les cellules cancéreuses
inhibent donc ces gènes et peuvent échapper à plusieurs points de contrôle.
La progression du cancer a été caractérisée au fil des années et maintenant, il
est possible de déterminer à n’importe quel moment le stage d’une tumeur. Il
existe maintenant 5 stages (stage 0 à IV) qui permettent de classifier la
progression du cancer. Stage 0 est la phase in situ ou la phase nulle. Le patient
possède une croissance anormale de cellule, mais celle-ci n’est pas cancéreuse
(tumeur bénigne). Stage 1 représente la phase locale et implique que le patient
possède une petite tumeur localisée dans son organe/tissu de développement.
Stage 2 est une phase un peu plus complexe. Celle-ci caractérise une tumeur
plus large que le stage 1 et/ou une invasion d’un ou plusieurs ganglions
lymphatiques (ceci varie en fonction du type de cancer). Le stage 3, quant à lui,
implique qu’il y a déjà des cellules cancéreuses à l’intérieur des ganglions et que
la tumeur s’est propagée dans 1 ou plusieurs tissus proches. Finalement, le
stage 4 est la phase la plus avancée du cancer et implique une invasion distante
des cellules (métastases). De même, pour certains types de cancer (ex :
glioblastome, colon), certaines gènes régulateurs sont directement associés à un
stage en particulier et il devient possible d’immédiatement identifier ceux-ci (8).
4
Le concept de cellule cancéreuse a été révisé au fil des années ainsi que ses
caractéristiques. Comme mentionné précédemment, les cellules ont d’abord été
identifiées par leur prolifération (ou croissance) augmentée par rapport aux
cellules normales. Cependant, plusieurs mécanismes ont maintenant été
identifiés et sont référés aujourd’hui comme les capacités distinctes des
cancéreuses ou « Cancer Hallmarks » (Figure 1.2) (9) (10).
Figure 1.1 : Le développement du cancer. Adaptée de (78).
5
Puisque la machinerie cellulaire des cellules cancéreuses est accélérée versus
celle des cellules normales, les cellules cancéreuses évoluent plus rapidement et
donc, peuvent acquérir des avantages sélectifs plus rapidement. Comme
mentionné ci-dessus, les cellules cancéreuses possèdent une fréquence de
croissance plus élevée que les cellules normales, car leurs signaux de
prolifération sont maintenus. Des phénomènes comme la dérégulation de
l’expression des protéines réceptrices (donc une expression plus élevée) rendent
ainsi ces cellules hypersensibles aux signaux de croissance ou même, une
modification de la structure du récepteur augmentant l’interaction avec le ligand
(facteur de croissance) (11). Par ailleurs, certaines mutations somatiques
acquises peuvent conférer une activation constitutive de facteurs de croissance.
Un bon exemple est une mutation dans la structure de la protéine B-Raf qui
résulte directement d’une activation constitutive de la voie de signalisation
MAPK/ERK qui promeut la transcription de l’ADN et par conséquent, la
prolifération cellulaire (12). Toutefois, une cellule proliférant à un niveau élevé
Figure 1.2 : Les capacités distinctes du cancer « Cancer Hallmarks ».
Adaptée de (9).
6
peut éventuellement tomber en sénescence ou simplement, enclencher la mort
cellulaire. La sénescence est une réponse cellulaire qui permet de stopper la
duplication d’une cellule s’étant déjà dupliquée à plusieurs reprises (donc stopper
la prolifération). Ce mécanisme dépend des protéines oncogéniques RAS, MYC
et Raf et est directement relié à leur signalisation. Donc, paradoxalement, une
suractivation de la prolifération peut causer la sénescence et/ou l’apoptose.
Cependant, il est possible aux cellules cancéreuses, grâce à leur machinerie, de
contrecarrer ces mécanismes et continuer leur croissance.
Les cellules cancéreuses sont également capables d’échapper aux inhibiteurs de
croissance. Comme discuté antérieurement, les inhibiteurs de croissance sont
majoritairement des gènes suppresseurs de tumeurs. Il n’est donc pas étonnant
que les cellules cancéreuses inhibent ces gènes puisqu’ils nuisent à leur survie.
Les deux plus importants suppresseurs de tumeur sont Rb (ou pRb) et p53 (ou
TP53). La protéine Rb est l’un des gènes clé dans les points de contrôle du cycle
cellulaire (G1/S, plus spécifiquement) et est inhibée dans plusieurs types de
cancers. Elle intègre plusieurs signaux intra- et extracellulaire pour déterminer si
une cellule peut passer en phase S. Lorsque celle-ci est inactivée, les cellules
peuvent donc passer en phase S alors que celle-ci est activée, certaines cellules
resteront en phase G1, ne pourront se répliquer et entreront éventuellement en
apoptose (13). La protéine TP53, quant à elle, a souvent été référée comme une
gardienne du génome. En effet, elle assure l’intégrité de l’ADN et enclenche
l’apoptose si l’ADN d’une cellule contient trop de dommages (ou si la cellule a
subi un trop grand stress). Si TP53 est inactivée, il n’y a donc aucune vérification
de l’ADN. Les cellules endommagées ne seront pas détruites et pourront donc
se répliquer pour ensuite, transmettre toutes leurs mutations à la génération
suivante. Il n’est donc pas surprenant de voir que TP53 est muté dans presque
tous les types de cancer et à une fréquence relativement élevée (entre 2 et 94%)
(14).
7
Une des réponses cellulaires les plus utilisées par le corps humain pour corriger
multiples anomalies à l’intérieur de la cellule est l’apoptose. Il ne peut suffire que
l’ADN soit moindrement endommagé ou que les signaux de croissance soient
surexprimés et celle-ci peut être détruite. Donc, si une cellule prolifère trop
rapidement, elle peut entrer en apoptose. Encore une fois, les cellules
cancéreuses sont capables de résister à l’apoptose et contourner ce mécanisme.
Par conséquent, les cellules non détruites favorisent directement la
tumorigénèse. L’apoptose est subdivisée en deux voies d'autant plus importantes
l’une que l’autre : la voie intracellulaire (intrinsèque) et extracellulaire
(extrinsèque). La voie extrinsèque implique la liaison du ligand Fas à son
récepteur et à l’aide d’autres signaux extracellulaires vont enclencher une
cascade d’activation des protéines caspases (protéases), qui elles à leur tour,
vont activer l’apoptose. Cette voie est généralement moins exploitée par les
cellules cancéreuses, car modifier une chaine de signaux extracellulaires n‘est
pas une simple tâche. La voie intrinsèque, quant à elle, est constituée
principalement des protéines Bax, Bak et Bcl-2. Les protéines Bax et Bak sont
des protéines qui vont briser la membrane cellulaire externe. Ces deux protéines
sont généralement inhibées par la famille des Bcl (ou Bcl2). Lorsque la
membrane cellulaire externe est brisée, des signaux proapoptotiques sont
largués (entre autres le cytochrome C) et vont activés, à leur tour, une cascade
de caspases activant ainsi, l’apoptose (15) (16). Les facteurs antiapoptotiques
(ou inhibiteurs) comme Bcl2 sont largement surexprimés dans les cellules
cancéreuses. La voie intrinsèque de l’apoptose est donc très inhibée et les
cellules cancéreuses peuvent résister à la mort cellulaire. Une autre voie de
signalisation grandement ciblée par les cellules cancéreuses est celle de PI3-
kinase, Akt et mTor. Cette voie favorise la prolifération et inhibe l’apoptose (et
autophagie) en intégrant des facteurs de croissance (EGF, insuline, VEGF, etc.).
Suite à l’intégration de ces signaux, PI3K va phosphorylé Akt qui va à son tour
activé mTor et enclenché la voie. Une fois de plus, PI3K est ciblé par les cellules
cancéreuses et peut être muté jusqu’à 52,2% dans certains types de cancers
8
(13). Subséquemment, les cellules peuvent échapper à l’apoptose et à
l’autophagie.
Le concept d’immortalité est un concept qui a émergé très récemment. Comme
mentionné auparavant, les cellules ont un potentiel limité de réplication. La
sénescence est un mécanisme cellulaire qui implique que les cellules possèdent
un âge (ou nombre maximal de réplications). Après ce nombre spécifique de
réplications, la cellule peut soit entrer en apoptose ou tomber en phase de
dormance (sénescence). Si elle entre en sénescence, la cellule reste dans un
état viable, mais ne peut se répliquer. Cependant, il est possible d’observer des
cellules qui transcendent cette barrière et finalement, possède un potentiel infini
de réplication. Ce phénomène est nommé immortalisation et est présent chez les
cellules cancéreuses. Le potentiel de réplication est en fait lié aux télomères. Les
télomères sont des répétitions d’hexanucléotides au bout des chromosomes et
ayant pour but de protéger l’ADN codant de ceux-ci. Par conséquent, la longueur
des télomères indique le nombre de réplications réalisées par la cellule. Lorsque
ceux-ci deviennent si courts qu’ils ne peuvent plus protéger l’ADN des
chromosomes, la cellule a donc atteint son potentiel de réplication et va entrer en
apoptose ou en sénescence (17). La télomérase est la protéine responsable
d’ajouter les répétitions sur les télomères. En contraste, celle-ci est pratiquement
non exprimée chez les cellules non immortalisées et est présente dans
pratiquement toutes les cellules immortalisées. Évidemment, sa présence est
fortement corrélée avec une inhibition de la barrière apoptose/sénescence.
Malgré cela, une sous-unité de la télomérase (TERT) a été associée pour avoir
un rôle dans plusieurs autres mécanismes comme la réparation de l’ADN, la
prolifération et même à plusieurs autres sites sur les chromosomes en dehors
des télomères suggérant que celle-ci possède un rôle beaucoup plus complexe
(18) (19). Par le fait même, le rôle des télomères serait également plus complexe
qu’une simple barrière de protection contre l’ADN. De plus, dans une majorité de
tumeurs, les mutations sur p53 affectent directement l’instabilité du génome et
favorisent fortement les changements génétiques (amplification, délétions,
9
duplication). Ces changements ont un impact direct sur la longueur des
chromosomes et par conséquent, les télomères.
Lorsqu’il est question de croissance cellulaire, il est toujours question des
nutriments et d’énergie. Naturellement, étant donné que les cellules cancéreuses
prolifèrent plus rapidement, celles-ci requièrent non seulement plus de
nutriments, mais également, de se débarrasser de molécules toxiques (CO2 par
exemple). Ceci est réalisé par l’angiogénèse. L’embryogénèse et la formation de
cellules endothéliales sont toujours associées avec la vasculogénèse (formation
de nouveaux vaisseaux) et avec l’angiogénèse (expansion des vaisseaux déjà
existants). Suite à cette croissance rapide, ces deux mécanismes deviennent
latents et ne redeviennent actifs qu’après un certain traumatisme (ex. : une
blessure, cycle de reproduction féminin). Ce phénomène est surnommé
l’interrupteur angiogénique (« angiogenic switch »). À l’opposé, chez les cellules
cancéreuses, cet interrupteur est constamment activé (20). Les régulateurs
principaux de l’angiogénèse sont VEGF et TSP1. VEGF est un facteur de
croissance responsable de la formation de vaisseaux lors du développement
natal, de la survie des cellules endothéliales et en réponse à des situations
physiologiques chez les adultes. VEGF peut se lier à des récepteurs tyrosine
kinase et peut être régulés à plusieurs niveaux. VEGF est généralement
surexprimé dans les cellules cancéreuses, rendant ainsi la liaison plus efficace.
TSP1 agit plutôt comme une contrepartie et inhibe l’angiogénèse. TSP1 se lie
également aux récepteurs de la membrane extracellulaire et est en compétition
directe avec VEGF. Contrairement aux tissus normaux, les néoplasmes ne sont
pas entourés de vaisseaux sains. Malgré le fait que l’angiogénèse est toujours
active chez les cellules cancéreuses, l’excès de vaisseaux dans un espace
restreint entraine souvent plusieurs problèmes comme des vaisseaux déformés
et empilés l’un sur l’autre, des fuites, un flux sanguin irrégulier et même des
microhémorragies (21). Par contre, l’angiogénèse est un phénomène qui varie
énormément selon le type de cancer (hyper ou hypo). VEGF est un facteur de
croissance excessivement régulé et par conséquent, des mutations dans des
10
gènes clés ont un impact direct sur son expression. Par exemple, des mutations
sur des oncogènes comme Ras et Myc favorisent énormément l’angiogénèse.
Les mécanismes entourant l’invasion d’autres tissus et les métastases n’ont été
que caractérisés que très récemment. Il était clair que les tumeurs atteignaient
un stage plus élevé lorsque celle-ci pouvait traverser la zone épithéliale et ainsi,
avoir accès à la circulation sanguine. Cependant, depuis le début des années
2000, plusieurs progrès pour élucider ce mécanisme ont été faits et il est
maintenant connu que cette transition est un résultat obtenu lorsque les cellules
perdent leur adhésion. En effet, l’adhérence des cellules représente en quelque
sorte leur ancrage et leur positionnement. Lorsque cet ancrage est perdu, il est
possible aux cellules de pouvoir migrer à différents endroits (et même traverser
des membranes). La protéine la plus importante à ce niveau est la E-cadhérine.
La E-cadhérine est responsable du contact cellule-cellule et du contact cellule-
MEC qu’elle maintient à l’aide de jonctions adhérentes. Si celle-ci n’est pas
exprimée, les cellules perdent donc toutes leurs jonctions adhérentes et par
conséquent, leur contact cellule-cellule et leur contact cellule-MEC (22). De plus,
plusieurs carcinomes agressifs sont caractérisés par la perte (ou diminution)
d’expression de la E et N-cadhérine. Lorsque les cellules obtiennent la
caractéristique d’invasion, celle-ci vont donc effectuer une transition épithéliale-
mésenchyme (EMT), vont pouvoir accéder à la circulation sanguine et migrer
dans n’importe quel tissu par la suite. La nouvelle génération de cellules dans un
autre tissu est ce qu’on appelle les métastases. Additionnellement, les cellules
cancéreuses métastatiques sont différentes génétiquement des cellules
cancéreuses du tissu primaire. Puisqu’elles sont différentes, les traitements et
drogues associés à ceux-ci doivent forcément être différents et compliquent
beaucoup plus la situation (qualité de vie du patient, effets secondaires, etc.). La
capacité d’invasion peut également être par la communication entre les cellules
cancéreuses du stroma et les cellules cancéreuses du tissu primaire. Les
cellules néoplasiques du stroma peuvent induire une sécrétion de protéines
stimulant l’invasion (ex. : CCL5) (23). Le microenvironnement de la tumeur a un
impact majeur sur l’acquisition de cette capacité.
11
Comme mentionné précédemment, les cellules néoplasiques nécessitent une
grande portion d’énergie pour maintenir leur croissance accélérée. Cette
demande d’énergie a donc demandé un ajustement au niveau du métabolisme
pour combler cette demande d’énergie. En condition aérobique, les cellules vont
transformer le glucose en pyruvate à l’aide de la glycolyse et produire du dioxyde
de carbone dans les mitochondries (cycle de Krebbs). À l’opposé, en condition
anaérobique, très peu pyruvate sera transporté vers les mitochondries. Les
cellules cancéreuses sont capables de reprogrammer leur métabolisme du
glucose indépendamment de la présence d’oxygène. Ce mécanisme est réalisé
en favorisant grandement la glycolyse menant à une phase surnommée
« glycolyse aérobique » (ou « Warburg effect ») et consiste plutôt, à une
fermentation d’acide lactique (24). Le niveau d’augmentation de la glycolyse est
atteint à l’aide de l’augmentation d’expression du transporteur du glucose
GLUT1. Ceci concorde parfaitement avec le fait que le niveau de glucose peut
refléter et même identifier une population de cellules cancéreuses. Par ailleurs,
puisque les cellules sont si flexibles à ce niveau, il devient très complexe de
pouvoir cibler le néoplasme en utilisant le glucose. De plus, plusieurs liens ont
été établis avec la glycolyse aérobique et des mutations dans des gènes
oncogènes/suppresseur de tumeur clé (Ras entre autres). Ras possède un effet
direct sur les facteurs de transcriptions HIF1α et HIF2α, qui eux à leur tour,
régulent la glycolyse (25). Dans certains cas, il a même été observé que deux
sous-populations de cellules peuvent croitre en symbiose à l’aide de ce
mécanisme. Dans ce cas spécifique, une sous-population utilise la glycolyse et
l’autre, la fermentation, permettant ainsi aux deux sous-populations de pouvoir
proliférer sans nuire à l’autre. Le terme de sous-population sera revu en détail
dans la section hétérogénéité à venir (1.1.6). Ceci démontre encore une fois un
exemple de communication entre les cellules cancéreuses (« crosstalk ») (26).
Un autre phénomène émergent encore non expliqué est celui d’échapper à la
destruction immunitaire. La réponse immunitaire est un mécanisme cellulaire par
lequel chacune des cellules est considérée comme étant en
surveillance. Lorsqu’une cellule agit anormalement, celle-ci est reconnue par les
12
macrophages et est détruite. Ce contournement n’est pas seulement utilisé par
les cellules néoplasiques, mais également, par les virus. Évidemment, si le
système immunitaire est compromis ou inexistant (immunodéficient), le
pathogène pourra se propager (ou proliférer) plus rapidement. Cette réponse
immunitaire est généralement contournée lorsque les lymphocytes sont soit
mutés ou sous-exprimés. En effet, les CTLs (lymphocytes T) et les NKs sont
souvent des cibles de choix pour les cellules cancéreuses (Figure 1.3). Il existe
donc énormément de communication (« crosstalk ») entre les cellules
cancéreuses et leur microenvironnement. En communiquant avec celui-ci, elles
sont en mesure de dérégler plusieurs sentiers métaboliques qui leur favorisent
une prolifération. Par conséquent, en diminuant l’efficacité des lymphocytes, les
cellules cancéreuses peuvent encore une fois, bénéficier d’un environnement
plus apte à leur croissance.
Figure 1.3: Le microenvironnement tumoral, la réponse immunitaire et la diaphonie (« cross-
talk ») métabolique. En phase d’élimination, les lymphocytes T et NKs vont pouvoir éliminer
les cellules anormales. En phase de prolifération, certains facteurs de croissance (TGFβ) vont
inhiber la réponse immunitaire permettant la prolifération des cellules cancéreuses. Adaptée
de (80).
13
1.1.3 Taux d’incidence et mortalité
Malgré le fait que le cancer est une maladie connue et caractérisée depuis très
longtemps, il n’y a toujours aucun traitement définitif non spécifique qui garantit à
100% la survie du patient. Par conséquent, année après année, il est possible
d’observer des augmentations au niveau de l’incidence du cancer (Figure 1.4 et
1.5). Il est à noter que sur ces figures, l’augmentation du taux d’incidence est
assez évidente et indépendante avec l’âge. Cependant, il est à noter que le taux
de mortalité est également en augmentation, mais puisque celui-ci est
standardisé avec l’âge, les résultats sont moins apparents. De plus, l’espérance
de vie augmente année après année grâce aux progrès de la médecine et les
personnes plus âgées sont plus à risque de développer un cancer. Cette
situation crée une problématique mondiale puisque le cancer peut affecter
n’importe qui. En assumant que la population mondiale augmente chaque année,
les nouveaux cas de cancer deviennent de plus en plus massifs et la mortalité
rattachée à ceux-ci également. En 2012, il a été estimé que 12,1 millions de
nouveaux cas de cancers ont été diagnostiqués et 8,2 millions de personnes
sont décédées suite à un cancer. Ceci représente une augmentation de 48%
pour l’incidence et 61% pour la mortalité depuis 1990 (27) (28). En fait, le cancer
est maintenant la plus grande cause de décès mondial suivi des maladies
cardiaques et des accidents cérébraux vasculaires (29). Il est donc évident que
plusieurs progrès doivent encore être faits au niveau des méthodes de détection
et au niveau des traitements.
14
Figure 1.4: Graphique démontrant le
taux d’incidence normalisé selon
l’âge (TINA) du cancer chez les
hommes et les femmes au fil des
années au Canada. Adaptée de (79).
Figure 1.5: Graphique démontrant le
taux de mortalité normalisé selon l’âge
(TMNA) du cancer chez les hommes et
les femmes au fil des années au
Canada. Adaptée de (79).
15
1.1.4 Diagnostics
Plusieurs avancées ont été faites au niveau des méthodes de dépistage depuis
quelques années. Certains cancers possèdent maintenant des protocoles
permettant ainsi un suivi plus régulier des patients. Il est très important de
comprendre qu’au niveau génétique/médicinal, un suivi régulier d’un patient
révèle davantage d’informations qui peuvent par la suite engendrer une meilleure
prévention (que ce soit pour le cancer ou toute autre maladie).
Malheureusement, la majorité des tests de dépistage mis en place sont des tests
relativement invasifs que les médecins ne veulent évidemment pas soumettre à
leurs patients à moins d’avoir préalablement certaines justifications (ex. : biopsie,
colonoscopie, sigmoidoscopie, PAP test, etc.) de même que les conséquences
rattachées un faux positif. Il n’existe que très peu de tests non invasifs
fréquemment utilisés avec peu (ou aucun) d’effet néfaste sur le corps (ex. :
mammographie, résonnance magnétique, rayons X, tomographie, APS). Ceux-ci
sont d’ailleurs beaucoup plus utilisés dans la pratique de nos jours. De plus, la
fiabilité de ces tests peut parfois être remise en question. Pour le cancer de la
prostate, les seuls tests disponibles sont l’examen digital et le test de l'APS
(antigène prostatique spécifique). Cependant, les deux méthodes ont des
désavantages assez importants. Pour le APS, un niveau élevé de APS n’est pas
nécessairement associé au cancer. Par ailleurs, plusieurs facteurs influencent
énormément les résultats du test (ex. : stress, fréquence d’éjaculation, etc.). Les
faux positifs rattachés au test sont également très importants. Selon certaines
études, environ 25% des hommes possédant une APS élevé ont bel et bien un
cancer alors que tous ces hommes seront sujets à une biopsie après le test (30).
Pour l’examen rectal, celui-ci est toujours très subjectif au médecin qui l’applique.
Non seulement le médecin peut juger l’examen dans les limites de la normale,
mais la sensibilité elle-même du praticien peut être un facteur crucial à ce
niveau. Donc, encore une fois, l’efficacité des méthodes est remise en question.
16
En matière d’efficacité, les tests génétiques seront toujours plus avantageux.
Non seulement ceux-ci, pour la plupart, sont non invasifs (simple prise de sang),
mais en plus, peuvent permettre d’avoir le profil génétique complet du patient si
désiré (WES). Les tests de dépistage pour BRCA1/BRCA2 sont le meilleur
exemple dans cette catégorie. Par contre, outre le fait qu’une mutation dans
BRCA1 ne garantit pas à 100% le développement d’un cancer, les mutations
héréditaires de BRCA1 sont représentées dans une très faible partie de la
population (0.0025% à 0.00125% selon les ethnicités) ce qui signifie que le test
est généralement négatif (et donc très spécifique) (31). Il existe donc un grand
manque de tests de dépistage possédant une grande efficacité de même que
peu de spécificité. Les problèmes de détection sont un grand enjeu pour les
traitements du cancer puisque lorsque celui-ci est détecté trop tard, les
traitements sont beaucoup moins efficaces et les chances de survie diminuent
drastiquement. Pour ce qui est des symptômes, lorsque ceux-ci sont finalement
visibles, le cancer est déjà très avancé et encore une fois, ceci n’aide en aucun
cas les futurs traitements. Bien évidemment, la communauté scientifique est
consciente que ceci est un problème majeur et par conséquent, plusieurs
nouvelles méthodes de détection sont mises au point en tentant de résoudre ce
problème (ex : biopuces, nanopuces) (32). Cependant, celles-ci requiert
beaucoup plus de suivi pour les patients que de simples tests génétiques (ou
prise de sang).
1.1.5 Traitements
Lorsqu’un cancer est diagnostiqué chez un patient, quelques méthodes de
traitements sont disponibles. Les 3 principales méthodes sont la chirurgie, la
chimiothérapie et la radiothérapie. Bien évidemment, la progression du cancer
joue un rôle crucial dans l’élaboration d’un plan de traitement. Jusqu’à
aujourd’hui, le meilleur traitement disponible reste la chirurgie. Cependant, il
n’est pas toujours possible d’exciser la tumeur. Si celle-ci est déjà trop large, ou
potentiellement située à un endroit plus dangereux pour le patient (ex. : près d’un
17
nerf ou d’une artère), le médecin ne peut pas toujours exciser complètement la
tumeur. La chirurgie reste la meilleure option si celle-ci est possible, car elle cible
uniquement les cellules cancéreuses. Par le fait même, plusieurs types de
cancers démontrent un taux de rémission plus élevé lorsque la tumeur est
excisée (33) (34). Par conséquent, les chances de survie sont directement
reliées aux méthodes de détection. Cela explique également pourquoi certains
types de cancers possèdent un taux de mortalité si élevé (ex. : ovaire, pancréas).
Les cancers sont détectés trop tard et il devient impossible d’opérer à ce
moment. Également, il est possible pour certains types de cancers que les
risques associés à la chirurgie soient très élevés et donc, celle-ci n’est pas
utilisée comme traitement (ex. : cerveau, cou). Il n’est pas surprenant que le taux
de mortalité pour ces cancers soit plus haut.
Un autre type de traitement utilisé contre le cancer est la radiothérapie. La
radiothérapie utilise des particules à haute fréquence (ex. : rayons X, rayons
gamma, etc.) en but de cibler les cellules cancéreuses. Par contre, cette
méthode cible également les cellules normales et possède donc certains
désavantages. Il existe plusieurs moyens d’introduire cette radioactivité. La
radiothérapie externe est le premier type de traitement. Celle-ci consiste à utiliser
une machine externe pour introduire les radiations de l’extérieur du corps à
l’intérieur de la tumeur. Le traitement peut prendre plusieurs semaines et dépend
de la grosseur de la tumeur, du stage et du type de celui-ci, de la santé globale
du patient, etc. La radiothérapie interne (brachythérapie) consiste à introduire un
implant radioactif à l’intérieur du corps. Par la suite, les cellules néoplasiques
deviennent plus susceptibles à la radiothérapie et sont plus facilement détruites.
Finalement, la radiothérapie systémique, quant à elle, consiste à introduire des
médicaments radioactifs à l’intérieur du corps (intraveineux ou oral). Ces
molécules vont s’associer aux cellules cancéreuses et détruire celle-ci à l’aide de
leur radioactivité. La radiothérapie possède plusieurs désavantages. Non
seulement celle-ci peut causer plusieurs effets secondaires (ex. : saignement,
vomissement, fatigue, etc.), mais la radiothérapie endommage les tissus
18
entourant la tumeur et elle altère le mécanisme de coagulation. Par contre, la
radiothérapie est très efficace pour réduire la grosseur d’une tumeur et est donc
très efficace pour les petites tumeurs (stage 1 et 2) (35) (36). De plus,
contrairement à une chirurgie, il est possible de pouvoir préserver l’organe
atteint. Cependant, il n’est jamais garanti que celle-ci puisse détruire la totalité
des cellules cancéreuses et par conséquent, ne peut être utilisé comme seul et
unique traitement lorsque le cancer est plus avancé. C’est d’ailleurs une des
raisons pour laquelle plusieurs traitements sont fréquemment jumelés lorsqu’il
est question d’éradication complète du cancer.
Un deuxième traitement largement utilisé est la chimiothérapie. La
chimiothérapie est utilisée lors de différentes situations dans la médecine
courante et pour différents objectifs. Pour les cancers peu avancés (stage 1 et
2), la chimiothérapie est généralement appliquée suite à une chirurgie. Son but
est de potentiellement anéantir les cellules cancéreuses restantes que la
chirurgie n’aurait pas réussi à éliminer. Pour les cancers plus avancés, la
chimiothérapie permet de potentiellement contrôler (ou ralentir) le cancer. Cela
peut parfois permettre une espérance de vie plus élevée selon ce que le patient
désire. Cependant, la chimiothérapie est l’un des traitements les plus toxiques
présentement utilisés en médecine et est beaucoup plus souvent perçue comme
un traitement de dernier recours. Celle-ci contient une liste foudroyante d’effets
secondaires comme les vomissements, étourdissements, problèmes de fertilité,
manque de concentration, diarrhée, problèmes au niveau de la coagulation, etc.
L’effet secondaire le plus drastique est la suppression du système immunitaire.
Les patients bénéficiant d’une rémission du cancer deviennent donc vulnérables
à multiples infections et maladies qui sont normalement sans danger (ex. :
rhume, allergies, etc.). En fait, la chimiothérapie est un traitement avec une
spécificité pratiquement non existante et donc, les agents chimiothérapeutiques
ciblent toutes les cellules. Il existe plusieurs classes d'agents
chimiothérapeutiques et ceux-ci possèdent tous différents mécanismes d’action :
les agents alkylants, les anthracyclines, les perturbateurs du cytosquelette, les
19
inhibiteurs des topoisomérases, les inhibiteurs des histones déacétylase, les
analogues des nucléotides et leurs précurseurs, les inhibiteurs de protéines
kinases, les peptides antimicrobiens, les platines, les rétinoïdes et finalement, les
vinca alcaloïdes. Les agents alkylants sont des médicaments qui agissent
directement sur l’ADN (ex. : cyclophosphomide, méchloretamine). Ceux-ci vont
rajouter un groupement alkyle sur l’ADN bloquant ainsi la réplication de l’ADN et
entrainant la dégradation cellulaire (37). Les anthracyclines sont une autre classe
de médicaments utilisés contre le cancer (ex. : doxorubicin, daunorubicin). Ceux-
ci possèdent 4 grands mécanismes d’action. Premièrement, les anthracyclines
sont en mesure d’intercaler les bases de l’ADN et de l’ARN simple brin causant
donc une inhibition de réplication. Deuxièmement, elles peuvent causer une
inhibition de la topoisomérase II ce qui va en retour inhiber la transcription et la
réplication de l’ADN. Troisièmement, elles sont capables d’augmenter la
production de radicaux libres et ainsi, endommagent directement l’ADN, les
protéines et les membranes. Finalement, les anthracines peuvent également
séparer les histones de la chromatine résultant ainsi à des modifications de
l’épigénome et d’une mauvaise réparation de l’ADN (38). Les perturbateurs du
cytosquelette (ou taxanes) sont également une autre classe d’agent
chimiothérapeutique (ex. : paclitaxel, docetaxel). Ceux-ci interfèrent avec les
microtubules en entrainant leur bris causant ainsi, une inhibition de la division
cellulaire (39). L’utilisation des inhibiteurs d’histone déacétylase est aussi
fréquemment utilisée. Certains médicaments (ex. : vorinostat, romidepsine) vont
être en mesure d’inhiber les histones déacétylase favorisant donc l’apoptose
(40). L’utilisation des inhibiteurs de topoisomérase I (ex. : irinotecan, topotecan)
ou II (ex : etoposide, teniposide) est également largement utilisée. L’inhibition de
la topoisomérase entraine une diminution d’ADN déplié et celle-ci ne peut donc
pas entrer en réplication et en transcription par la suite (41) (42). De même,
plusieurs inhibiteurs de kinases sont utilisés. Ceux-ci sont très variés et
possèdent différentes fonctions. Par exemple, le Bortezomib est un inhibiteur de
la protéase. En inhibant celle-ci, le point de contrôle G2-M n’est pas franchi et la
cellule va tomber en apoptose. Par conséquent, le Bortezomib agit directement
20
sur la prolifération cellulaire (43). Des nucléotides et précurseurs analogues sont
un autre type d’agent chimiothérapique utilisé (ex. : méthotrexate, fluorouracil).
Ceux-ci vont interférer avec la synthèse des nucléotides ou des précurseurs de
ceux-ci inhibant ainsi la synthèse de l’ADN (44) (45). Les peptides microbiens
(ex. : bléomycine, actinomycine), quant à eux, sont des médicaments qui se lient
directement à l’ADN ou induisent des bris à celle-ci (46). Encore une fois, ceci
inhibe la transcription et la réplication. Les platines, ou les drogues néoplasiques
à base de platine, sont des agents thérapeutiques qui vont directement se lier à
l’ADN en faisant des liaisons transversales, des liaisons entre brins et des
liaisons entre les brins et les protéines. Les rétinoïdes sont une autre classe
d’agent chimiothérapeutique qui a été découvert récemment. Leur mécanisme
d’action reste un peu inconnu, mais il a été démontré que ceux-ci peuvent
stopper la différenciation et la prolifération des cellules cancéreuses (47).
Finalement, la dernière classe de médicaments chimiothérapeutiques utilisées
sont les vinca alcaloïdes (ex : vincristine, vinblastine). Ceux-ci se lient à la
tubuline pendant l’anaphase ou produisent des fragments de microtubules
favorisant ainsi leur détachement du centrosome. Suite à ceci, la cellule entrera
en apoptose et sera détruite (48).
Comme mentionné ci-dessus, aucune de ces classes de médicaments ne
possède une affinité particulière pour les cellules cancéreuses et peuvent donc,
affecter n’importe quels types de cellules. Cela explique en grande partie
pourquoi la chimiothérapie est si toxique par rapport à d’autres traitements. Non
seulement les patients ne sont pas garantis que ce traitement va ralentir ou
détruire leur cancer, mais en plus, celui-ci affecte énormément la qualité et
l’espérance de vie. Ceci concorde bien avec le fait que seulement 2.4% des
patients aux États-Unis possèdent un taux de survie de 5 ans ou plus lorsqu’ils
sont sujets à la chimiothérapie (49). Par ailleurs, plusieurs protocoles déjà mis en
place dans la médecine courante utilisent un médicament spécifique pour traiter
différents types et sous-types de cancer. Dans ce cas, il n’est pas surprenant de
voir que le taux de rémission est si faible puisque non seulement les cancers
21
sont génétiquement différents, mais en plus, différentes sous-populations à
l’intérieur du même cancer peuvent être très différentes génétiquement. Une
solution possible à ce monstrueux problème serait d'exécuter une transition entre
la médecine courante et la médecine personnalisée. Les patients pourraient être
dépistés régulièrement (bien avant qu’un cancer se manifeste), mais lorsque
celui-ci est développé, les gènes clés seraient immédiatement identifiés et les
médicaments seraient ajustés en conséquence, et ce, indépendamment du type
du cancer. Ceci diminuerait non seulement les coûts rattachés au cancer, mais
augmenterait l’efficacité des agents chimiothérapeutiques utilisés. Les coûts
associés au cancer aux États-Unis sont estimés à 124.57 milliards de dollars et
sont prévus d’augmenter jusqu’à 157.77 milliards en 2020 et sont justement un
problème majeur (50).
Finalement, puisque l’enjeu majeur des méthodes mentionnées ci-dessus est la
spécificité (capacité de cibler seulement les cellules cancéreuses), d’autres
approches comme l’immunothérapie ont émergés depuis quelques années. La
réponse immunitaire joue un rôle crucial dans la lutte contre le cancer. Les
macrophages, lymphocytes T et les anticorps sont en constant combat avec les
cellules cancéreuses. La stratégie principale est d’altérer (ou d’injecter) des
anticorps monoclonaux (ex : herceptine) possédant des antigènes exclusif aux
cellules cancéreuses. De cette façon, le système immunitaire ira cibler les
cellules cancéreuses possédant les antigènes ciblés (51) (52).
Malheureusement, la constante évolution des cellules cancéreuses interfèrent
énormément avec ces méthodes et l’acquisition de nouvelles mutations ou de
nouveaux antigènes diminuent grandement l’efficacité de l’immunothérapie.
Conformément, l’immunothérapie n’est jamais utilisée comme méthode unique
de traitement mais bel et bien, en combinaison avec d’autres méthodes
mentionnées ci-dessus.
22
1.1.6 Hétérogénéité et résistance
L’hétérogénéité est un concept émergeant qui a pris beaucoup d’ampleur depuis
quelques années. En effet, l’hétérogénéité était très peu discutée avant que le
phénomène de résistance se manifeste et était même, très peu acceptée dans la
communauté scientifique. Avec la découverte des caractéristiques du cancer, les
méthodes de traitement se sont orientées vers des gènes ayant une importance
majeure (« cancer driver genes ») comme potentielles cibles de traitement (ex. :
p53, Rb, Ras, etc.). Cependant, les résultats attendus ne concordaient pas avec
l’importance de ceux-ci et le taux de rémission des patients n’a pas démontré les
attentes anticipées. La raison pour laquelle ces traitements ne fonctionnent pas à
grande échelle est l’hétérogénéité. L’hétérogénéité est un mécanisme cellulaire
qui fait partie de la division cellulaire. Lorsqu’une cellule se divise, son matériel
génétique inné (mutations germinales, hérédité) et acquis (mutations
somatiques) est transmis à la génération suivante. Si, lors de sa croissance,
cette cellule a acquis de nouvelles caractéristiques ou de nouveaux phénotypes,
ceux-ci seront transmis à la génération suivante et ainsi de suite. La première
génération de cellules cancéreuses est référée au clone fondateur et les sous-
populations possédant les mêmes phénotypes sont les sous-clones (ou clones)
(voir figure 1.5).
23
Par conséquent, d’un point de vue génétique, les clones provenant du même
type de cancer pour 2 individus peuvent être complètement différents
(hétérogénéité intertumorale) et également, peuvent être complètement
différents à l’intérieur du même individu (hétérogénéité intratumorale). Puisque
ces clones sont génétiquement différents, certains d’entre eux peuvent favoriser
différentes voies de signalisation pour exprimer leur phénotype (ou
caractéristique) (53). La résistance d’un cancer à un certain médicament devient
donc explicable par le fait que soit 1 ou plusieurs clones n’utilisent pas la voie
ciblée par la drogue utilisée. Il devient donc impossible de pouvoir traiter
plusieurs patients avec le même médicament sans préalablement connaître le
profil génétique de celui-ci. Cela est extrêmement reflété dans l’efficacité de
traitement comme la chimiothérapie par exemple. Plusieurs protocoles sont déjà
en place selon certains types de cancers et les médecins suivent les étapes
préalablement établies. Bien évidemment, certains ajustements ont été faits à ce
niveau. L’utilisation de thérapie combinatoire où plusieurs agents
Figure 1.5: L’expansion clonale du cancer. Adaptée de (71).
24
chimiothérapeutiques sont utilisés (où multiples voies sont ciblées) est
maintenant une pratique commune. Cependant, il existe énormément de voie et
de gènes à l’intérieur du corps humain et l'utilisation d'une combinaison de
médicaments sans avoir le profil génétique du patient représente du essaie
erreur et ne devrait, en aucun cas, être une option de traitement viable pour les
patients (surtout considérant les effets néfastes de la chimiothérapie) (54). De
plus, il est très difficile de déterminer le nombre de clones pour un patient. Il n’y a
aucune approche en ce moment accepté par une majeure partie de la
communauté scientifique pour identifier des clones. Par conséquent, même si un
patient répond bien à un traitement (en rémission), il est possible que le
traitement n’ait pas tué tous les clones et le cancer pourrait resubmerger.
Également, comme mentionnées auparavant, les cellules cancéreuses sont
constamment en communication et réagissent grandement à leur
microenvironnement. Dans certains cas, il a été démontré que des clones
pouvaient acquérir une résistance après avoir été sous pression (ex. :
radiothérapie, chimiothérapie); un phénomène très similaire aux bactéries (ex. :
résistance à l’ampicilline) (55). Les clones sont aussi capables d’interagir entre
eux soit par compétition ou par coopération. Lorsqu’il y a compétition, les clones
vont tenter de croitre le plus rapidement possible au détriment des autres. Il y
aura donc une pression de sélection et un clone deviendra plus gros. À l’inverse,
si les clones coopèrent entre eux, différents clones vont favoriser différentes
voies de sorte à ne pas nuire à la croissance des clones adjacents et formeront
une tumeur généralement plus agressive (56) (57). Dans tous ces cas, la
médecine personnalisée semble être l’approche la plus apte à surmonter ces
phénomènes et donc détecter les profils génétiques (ou clones) devient
impératif.
25
1.1.7 La génétique du cancer et sa progression jusqu'à présent
Malgré les enjeux concernant le cancer mentionné précédemment, la
communauté scientifique tente continuellement d'acquérir et de caractériser la
tumorigénèse et les mécanismes entourant celle-ci (ainsi que le gènes et les
sentiers métaboliques impliqués). Initialement, le portrait génétique du cancer
était si peu connu que l'obtention de nouveaux éléments biologiques sur un seul
gène constituait une avancée majeur (ex: p53) (58) (59). Comme dans plusieurs
autres maladies, les traitements résultants des ces découvertes furent
principalement de la thérapie génique (immunothérapie, virologie et transfert de
gène) (60). Malheureusement, jusqu'à aujourd'hui, aucunes de ces thérapies ne
peut être utilisée uniquement pour traiter le cancer en raison de plusieurs
caractéristiques des cellules cancéreuses (ex: résistance, hétérogénéité, etc.).
L'émergence des caractéristiques des cellules cancéreuses (9) et la visualisation
du cancer comme une entité (c.-à-d. une combinaison de mutations aux travers
plusieurs gènes et non un seul) entraîna un changement de paradigme. Suite à
ceci, avec l'apparition du NGS, une multitude de projets à grande échelle (ex:
GWAS, 1000 génomes, TCGA) ont été entamés dans le but de créer un
catalogue détaillé de variations génétiques (ex: SNPs, variants, insertions,
délétions, variation du nombre de copie, etc.) du génome humain (61) (62) (63)
(64) ainsi qu'une liste exhaustive de mutations exclusivement associées au
cancer (COSMIC) (65). Avec la constante évolution du NGS et la diminution des
coûts rattachés à celui-ci, la grandeur et la disponibilité de plusieurs ensembles
de données ne cessent d'augmenter. Plusieurs expériences sont maintenant
caractérisées et disponibles publiquement (ex: expression génique, expression
des miARNs, méthylation, etc.) (66). Toutes ces informations sont maintenant
disponibles dans une masse de base de données (ex: Ensembl, NIH, EGA,
cBioPortal, ICGC, etc.) et peuvent maintenant être intégrées dans n'importes
quelles études à travers le monde. Ceci est primordial pour obtenir une image
globale de la situation et pour tenter de représenter le phénomène biologique au
meilleur de nos capacités. De plus, avec un large catalogue à notre portée,
26
plusieurs biais potentiellement rattachés à nos ensembles de données peuvent
être déchiffrés rapidement et amenés à des conclusions biologiques beaucoup
plus significatives (ex: âge, sexe, ethnicité, environnement, etc.). Bien
évidemment, plusieurs régions et éléments du génome sont encore très peu
documentés et pourraient, dans un futur proche, améliorer davantage notre
compréhension du cancer (ex: ARN non-codants, introns, mutations germinales,
etc.).
Malgré ceci, il n'y a eu que très peu d'avancement au niveau clinique pour le
cancer depuis plusieurs années. Les traitements restent peu efficaces et le taux
de mortalité est automatiquement corrélé avec l'inefficacité de ceux-ci. Il existe
donc un immense goulet d'étranglement entre la gigantesque quantité
d'information et la disponibilité de modèles prédictifs biologiques ayant un effet
clinique. De tels modèles pourraient non seulement avoir un impact majeur au
niveau diagnostic mais également, sur l'efficacité des traitements. Jusqu'à
présent, les méthodes diagnostiques disponibles sont très spécifiques (ex:
biopsie) et possèdent toujours quelques risques. L'utilisation de la salive et du
plasma sanguin demeure une avenue prometteuse à ce sujet (67) (68). Les
mutations extraites du NGS peuvent aussi renforcées la classification du cancer
préalablement dominée par l'histologie. Par ailleurs, l'utilisation du NGS
permettrait l'incorporation de l'impact collectif des mutations spécifiques à
chaque patient et contrecarrerait l'hétérogénéité intratumorale (médecine
personnalisée) (69).
27
1.2 Biologie des systèmes
1.2.1 Concept
La biologie des systèmes est un domaine qui cible les interactions entre
plusieurs composantes et qui étudie le comportement global d’un système. Les
composantes du système étudié sont très variables et peuvent être des gènes,
protéines, sentiers métaboliques, etc. La biologie des systèmes utilise des
approches computationnelles et mathématiques pour créer des modèles qui
représentent le comportement des systèmes étudiés. Les systèmes représentés
deviennent donc plus simples et il devient possible d’étudier le contexte
biologique complet. Comme plusieurs mécanismes et réponses cellulaires
dépendent de plusieurs facteurs et signaux, il est logique d’utiliser le maximum
d’information disponible lorsque l’on veut établir un modèle. La biologie des
systèmes est donc utilisée conjointement avec la bio-informatique, la
protéomique, la transcriptomique, l’épigénétique, la métabolomique, la biologie
cellulaire, l’enzymologie, etc. En extractant une grosse quantité d‘information
provenant de différents domaines, le modèle construit devient plus complet. Il
devient possible de pouvoir représenter le contexte biologique plus précisément.
Cependant, la biologie des systèmes requiert énormément d’analyse de données
et dépend visiblement des données disponibles. Par ailleurs, le but global de la
biologie de systèmes est de simplifier un système ayant pour but de l’étudier. En
incorporant le maximum d’informations disponibles, le système peut rapidement
devenir surchargé et contrecarrer ce principe. Au niveau du cancer, il est
possible de combiner plusieurs voies métaboliques et une combinaison de gènes
qui peuvent devenir des cibles thérapeutiques ou de dépistage. Par conséquent,
ceci peut non seulement améliorer les traitements déjà mis en place, mais
également, augmenter l’efficacité des méthodes de détection du cancer (non
invasif).
28
1.2.2 Sentiers métaboliques et diaphonie (« crosstalk »)
La diaphonie (« crosstalk ») est un phénomène par lequel certaines
composantes d’un système affectent un ou plusieurs autres composantes du
même système. Ce phénomène est utilisé à grande échelle à l’intérieur du corps
humain et constitue principalement un rôle de régulation. Les composantes sont
généralement des gènes ou protéines à l’intérieur d’un sentier (ou cascade)
métabolique. Ces sentiers sont en fait un équilibre de stimulus extérieurs qui
engendrent des réponses cellulaires (prolifération, apoptose, etc.). Par exemple,
si une cellule capte des facteurs de croissance extracellulaire (EGF, TGFβ), la
machinerie intracellulaire engendrera une cascade qui favorisera la prolifération.
Plusieurs mécanismes sont donc régulés à haut niveau de sorte à pouvoir
détecter et interpréter ces signaux. Bien évidemment, si ces signaux ou certaines
composantes du sentier sont altérés, la réponse cellulaire va donc être changée
elle aussi. Les cellules cancéreuses exploitent plusieurs sentiers de cette
manière en utilisant une variété de protéines et de gènes (plusieurs mentionnés
ci-dessus). Ceci leur permet d’adapter leur microenvironnement de manière à
pouvoir contourner plusieurs réponses cellulaires et favoriser leur survie. Ceci
est partiellement reflété avec la résistance et l’hétérogénéité tumorale. Les
cellules cancéreuses s’adaptent en favorisant de nouveaux sentiers
métaboliques et survivent à certains traitements. La biologie des systèmes
devient donc une approche idéale pour étudier le comportement et l’évolution
des cellules cancéreuses. Avec une image plus globale et plus complète de la
cellule, il est possible d’étudier et idéalement, d’anticiper son comportement
cellulaire. Ceci permettrait finalement d’utiliser une combinaison de gènes et de
sentiers cruciaux à la survie de la cellule cancéreuse. Comme mentionné plus
tôt, puisqu’il existe de l’hétérogénéité au travers des individus, ceci devra être
utilisé uniquement pour chaque patient et démontre l’importance de la médecine
personnalisée.
29
1.2.3 Réseaux
Les réseaux (ou graphes) sont utilisés pour modéliser une variété de systèmes
(ex. : trajet d’avion, compte bancaire, etc.). Les composantes étudiées (ex :
clients, villes, gènes) sont habituellement représentées par des sommets et les
interactions entre chaque sommet sont reliées par des arêtes. Il est possible de
représenter toutes les interactions avec leur direction si celles-ci sont définies
dans le système étudié. De plus, les interactions et les sommets peuvent être
représentés par des valeurs si le système étudié le permet. Par conséquent, il
devient possible d’évaluer et quantifier un système d’un point de vue statistique.
Des perturbations (ex. : mutations, amplifications, etc.) peuvent être introduites et
à ce moment, il est possible d’étudier la stabilisation du graphe et d’évaluer son
comportement (70). L’analyse des graphes peut donc déterminer plusieurs
situations avantageuses ou non selon le modèle étudié. D’un point de vue
biologique, les gènes (ou protéines) et leurs interactions (ex. : positive, négative,
physique, etc.) peuvent être illustrés facilement à l’aide d’un réseau (Figure 1.6).
L’incorporation de plusieurs sentiers peut faciliter la compréhension du
comportement du système. Pour ce qui est du cancer, comme discuté
précédemment, plusieurs voies métaboliques semblent être contournées lorsque
les cellules cancéreuses sont sujettes à un traitement. Une approche utilisant
une modélisation graphique qui cible directement ce problème pourrait non
seulement donner davantage d’informations sur le comportement des cellules
cancéreuses (et cellules-microenvironnement), mais pourrait être utilisée comme
méthode de détection (voir chapitre 3). Des combinaisons de gènes clés
(signature) seraient utilisables pour diriger les traitements, mais aussi, comme
outil de détection. Bien évidemment, les graphiques utilisés devraient être
spécifiques à un sous-type (ex. : cancer du sein luminal, basal, etc.) et les
perturbations seraient distinctes pour chaque patient. Ceci amènerait donc une
spécificité intra- et inter-tumoral de même qu’une spécificité intra- et inter-
individus ce qui constitue un problème majeur en ce moment avec les méthodes
courantes utilisées. Les signatures pourraient d’autant plus être utilisées comme
cibles thérapeutiques (ex. : chimiothérapie combinatoire).
30
Ceci augmenterait l’efficacité des traitements et réduirait grandement les effets
néfastes de ceux-ci. Suivant ce concept, il devient possible d’identifier plusieurs
gènes associés à un phénotype désiré (ex. : métastases, maladie cardiaque,
etc.) et identifier des signatures en conséquence (section 3) (71). Ceci signifie
qu’il n’y a aucune mutation aléatoire lors du développement du cancer et que
toutes ces mutations sont des étapes par lesquelles le cancer peut progresser.
Ainsi, toutes ces mutations peuvent être utilisées pour détecter et surveiller de
près la progression tumorale (72). La médecine courante pourrait donc introduire
des protocoles permettant de suivre certains patients avec des antécédents
médicaux ou des antécédents familiaux et veiller à ce que la progression du
phénotype (s’il y a lieu) soit suivie. Bien évidemment, le cancer pourrait lui-même
être détecté avec cette approche et malgré le fait que certains groupes de
Figure 1.6: Réseau non dirigé représentant les gènes associés à la prolifération du
glioblastome. Chaque sommet représentant un gène et chaque arête une interaction
entre les sommets impliqués. Tirée de (81).
31
recherche tentent d’accomplir cette tâche, cette méthode n’a pas encore été
explorée assez profondément pour réaliser ceci (73).
1.3 La bio-informatique et son importance
Depuis la fin du projet du génome humain en 2003, les méthodes de
séquençage ont subi d’énormes avancées. Avec le séquençage de nouvelle
génération (NGS), il est maintenant possible de séquencer le génome humain
pour moins de 1000$ et cela prend environ 26h (74). Initialement, durant le HGP,
ceci avait pris 13 ans et couté environ 2,7 milliards de dollars. De plus, plusieurs
sous-méthodes ont été développées depuis le NGS. De nos jours, le
séquençage du génome entier est beaucoup moins utilisé qui l’était au début des
années 2000. Le séquençage complet des exomes (WES) est une méthode
beaucoup plus utilisée lorsqu’il est question d’obtenir le profil génétique d’un
patient (c’est-à-dire ses mutations). Le séquençage d’ARN (RNA-seq) est
également utilisé à grande échelle lorsqu’il est question d’obtenir le profil
d’expression des cellules du patient. Plusieurs autres méthodes subséquentes
ont également été développées au fil des années pour différents types d’études
(ex. : ChIP-Seq, FISH, séquençage ciblé, etc.). Bien évidemment, avec toutes
ces nouvelles méthodes, la quantité de données découlant de ces analyses
augmentent sans arrêt et par conséquent, la bio-informatique prend beaucoup
d’ampleur. Il est toujours important d’avoir une bonne quantité de données
lorsque l’on veut entreprendre une investigation. Cependant, ces données
doivent être analysées et traitées avant même de pouvoir être utilisables; ceci
est réalisé à l’aide de la bio-informatique. Avec des avancées technologiques
immenses, il n’est pas surprenant de voir une corrélation entre la quantité de
données émises et l’utilisation (expansion) de la bio-informatique. En bref, la bio-
informatique représente le pont majeur entre les méthodes expérimentales et les
méthodes informatiques (ex. : statistiques, réseaux, modèles, etc.). La bio-
informatique permet maintenant beaucoup d’approches qui ne semblaient pas
possibles auparavant. Des calculs complexes qui pouvaient prendre des mois et
même des années sont maintenant réalisés en quelques jours avec l’aide de
32
multiserveurs contenant plusieurs processeurs et même, dans certains cas,
plusieurs cartes graphiques (parallélisme). Il est donc possible de représenter
des systèmes beaucoup plus complexes et de simuler leurs comportements pour
améliorer notre compréhension de ceux-ci (ex. : modélisation biomoléculaire,
biologie des systèmes, apprentissage automatique, etc.). Mais encore, les
algorithmes (méthodes) pour traiter les données produites par le NGS sont
constamment améliorés par la communauté scientifique de sorte à produire des
données de plus en plus précises et ne pas négliger aucun aspect
potentiellement omis durant ce traitement. Par conséquent, plusieurs
compagnies se consacrent maintenant à l’analyse de données (ex : Biobase,
Bina technologies, etc.). Certaines compagnies informatiques ont même
commencé à offrir certains services d’analyses de fichiers de séquençages
puisque ceux-ci deviennent de plus en plus immenses (ex. : Microsoft, Google). Il
existe aussi plusieurs compagnies qui procurent de l’espace de stockage et du
temps du calcul (ex. : Annai Systems, GNS healthcare, etc.) pour des plus petits
laboratoires qui n’ont pas les moyens d’investir dans ces services. De plus, pour
des maladies ayant un impact mondial comme le cancer, les compagnies veulent
évidemment avoir des méthodes de dépistage (biomarqueurs) et des signatures
disponibles au public (ex. : 23andMe). Bien évidemment, l’intérêt soudain des
multinationales pour la bio-informatique n’a absolument aucun lien avec la
recherche et est principalement consacré à procurer des services, mais il est
intéressant de voir que ces compagnies voient l’immense potentiel de celle-ci.
D’autre part, les sciences computationnelles amènent plusieurs avantages au
niveau temporel et une certaine flexibilité. Par exemple, d’un point de vue
expérimental, si l’on désire tester un médicament, il faut passer par des essais
cliniques et ceux-ci sont très régulés et très longs. D'un point de vue
informatique, il serait possible de tester plusieurs médicaments pour plusieurs
types de cancers à la fois et déterminer si ceux-ci ont l’effet désiré ou non (cibles
thérapeutiques). Les essais cliniques suivant ces analyses sont donc beaucoup
plus efficaces. Par contre, les modèles informatiques ne sont jamais parfaits et
requièrent toujours des améliorations. Par conséquent, la bio-informatique
33
requiert généralement des preuves expérimentales pour valider les résultats
obtenus. Cependant, celle-ci peut accélérer de façon significative la durée de
l’étude et même explorer plus largement le mécanisme désiré. Les méthodes
informatiques et expérimentales doivent donc être utilisées conjointement pour
maximiser leurs avantages.
34
CHAPITRE 2 PROBLÉMATIQUE, HYPOTHÈSE ET OBJECTIFS
2.1 Problématique
Même avec les avancements réalisés sur le cancer, il n’existe toujours aucune
méthode de dépistage offert pour tous les types de cancers. Additionnellement,
le meilleur traitement disponible reste la chirurgie et est proportionnellement
affecté par la progression du cancer. Par conséquent, les méthodes de
dépistage affectent directement la survie des patients. De plus, depuis
l’existence du NGS, la disponibilité et quantité de données disponibles
augmentent sans arrêt et aucun modèle jusqu’à présent ne permet la prédiction
d’un phénotype donné à l’aide des fichiers de séquençage. Également, plusieurs
études utilisent déjà des signatures génétiques (combinaisons de gènes) pour
identifier certains types de cancers. Il existe donc une grande corrélation entre
les mutations et la progression tumorale. Ainsi, la création de modèles
permettant de prédire un phénotype à l’aide de mutations provenant des fichiers
de séquençage devient une priorité. Par ailleurs, la prédiction de phénotype peut
non seulement améliorer grandement les méthodes de détection, mais aussi, le
comportement tumoral et augmenter l’efficacité des médicaments utilisés en
ciblant des gènes responsables du phénotype en question. Si l’efficacité des
traitements couramment utilisés est augmentée, la survie des patients l’est
également. Finalement, puisque la létalité du cancer reste un problème d’une
importance mondial, ces problèmes restent d’une priorité extrême et une
amélioration à ce niveau génèrerait donc un impact majeur aussi scientifique que
médical.
35
2.2 Hypothèse et objectifs
Si les signatures géniques peuvent être utilisées comme outil de prédiction, il
devrait être possible d’utiliser les mutations des patients pour obtenir des
signatures exclusives pour chaque patient. Par ailleurs, aucune méthode ne
permet la prédiction de certains phénotypes (c.-à-d. récurrence). De plus, il
n’existe en ce moment aucun modèle permettant d’utiliser les mutations
provenant des fichiers de séquençage. Par conséquent, si un modèle
(algorithme) peut être développé permettant cette tâche, ceci avantagerait
grandement la médecine personnalisée. Également, si les mutations somatiques
peuvent refléter la progression tumorale, les mutations germinales peuvent
hypothétiquement être utilisées selon le même principe. Avec un suivi accru du
patient, il serait donc possible de détecter un phénotype spécifique avant même
son apparition. Finalement, en utilisant la biologie des systèmes et des réseaux
de gènes, il pourrait être possible de représenter et d’étudier un phénotype. En
utilisant des cancers bien détaillés (ovaire et sein), il serait possible de bien
caractériser la récurrence de ceux-ci et potentiellement, de prédire si le cancer
d’un patient développera des métastases. Les objectifs sont donc :
- Représenter et caractériser un phénotype à l’intérieur d’un réseau de gènes
pour en étudier son comportement.
- En utilisant le NGS et le comportement du phénotype étudié, extraire des
mutations somatiques ayant un impact sur les gènes clés causant la
récurrence (phénotype étudié).
- Identifier des signatures géniques distinctes à chaque type de cancer pouvant
permettre la prédiction de la récurrence du patient.
- Tenter d’utiliser les mutations germinales comme outil de prédiction de la
même manière que les mutations somatiques.
36
Chapitre 3 Article
AVANT-PROPOS
La section qui suit représente l’intégrité totale de mon projet de maîtrise. J’ai été
la principale personne à travailler sur ce projet et j’ai réalisé toutes les étapes de
celui-ci avec l’aide de mes collègues (mentionnés ci-dessous). Les
méthodes/résultats ont été soumises sous forme d’article dans le journal JAMA
Oncology en août 2016 et avons resoumis en Juin 2017 (avec corrections
demandées). Bien évidemment, le projet entier a été supervisé par mon directeur
Dr Arnaud Droit et Dr Edwin Wang en collaboration avec tous les membres du
laboratoire du Conseil National de Recherches du Canada à Montréal: Naif
Zaman, Chabane Tibiche et Jinfeng Zou.
3.1 Résumé
Importance: La diminution constante des coûts de séquençage augmente
constamment l’accessibilité du séquençage du génome pour des applications
cliniques routinières. Le développement de tests ayant des pronostiques basés
sur le génome pour les patients atteints du cancer (lorsque diagnostiqué) va
avoir un impact significatif sur la sélection des traitements et la survie du patient,
ce qui est crucial pour les cliniciens et leurs prises de décisions.
Objectifs : Développer et valider les signatures géniques et leurs pronostiques
en utilisant des données de séquençages des clones fondateurs de la tumeur
(c.-à-d., la cellule cancéreuse fondatrice transformée d’une cellule normale après
avoir acquise une série de mutations) ou les mutations germinales des patients
atteints du cancer des ovaires et du sein.
Plans, paramètres et participants : 272 patients ayant un cancer du sein RE+
(luminal) et 267 patients ayant un carcinome séreux ovarien avec un suivi
clinique ont été utilisé. Le séquençage des exomes complets (WES) de la tumeur
37
et du tissu normal conjoint furent sélectionnés. 63 tumeurs ovariennes et 80
tumeurs luminals furent désignées pour représenter l’ensemble des données
d’entrainement et le reste pour l’ensemble des données de validation.
Mesure des résultats principaux : Les signatures géniques identifiées à partir
des données de séquençage des mutations germinales et des clones fondateurs
des patients peuvent prédire les résultats médicaux des patients.
Résultats : Nous avons correctement identifié des signatures géniques qui
donnent un pronostique médical en utilisant le séquençage complet des exomes
des mutations germinales et des clones fondateurs des patients. Nous avons
montré que des signatures dérivées des mutations génomiques germinales ou
des clones fondateurs distinguent significativement la récurrence des patients
ayant le cancer des ovaires (P=1.0x10-6 et 3.3x10-6 pour les mutations
germinales et celles du clone fondateur, respectivement) de même que la
récurrence des patients atteints du cancer du sein (P=3.7x10-3 et 1.1x10-3 pour
les mutations germinales et celles du clone fondateur, respectivement).
Cependant, les signatures provenant des mutations du clone fondateur
démontrent une meilleure performance comparée à celle des mutations
germinales.
Conclusions et pertinence : Les signatures géniques dérivées des mutations
germinales ou celles provenant du clone fondateur des patients prédisent
significativement le pronostique du cancer. Ces résultats impliquent qu’un profil
génétique d’un patient peut prédire des phénotypes médicaux (et la santé du
patient) et est une méthode potentielle non invasive pour développer des tests
pronostiques provenant du génome en séquençant la salive ou le sang du
patient.
38
3.2 Abstract
Importance: Continual reduction in sequencing cost is expanding the
accessibility of genome sequencing for routine clinical applications. Development
of noninvasive, genome-based prognostic tests for cancer patients at diagnosis
will significantly impact on treatment selection and patients’ outcomes, which is
critical for clinicians in making decisions.
Objective: To develop and validate prognostic gene signatures using whole
exome sequencing data of tumor founding clones (i.e., the founding cancer cell
transformed from a single normal cell through acquiring a series of mutations) or
germlines of breast and ovarian cancer patients.
Designs, settings and Participants: 272 luminal-breast and 267 serous ovarian
cancer patients who have clinical follow-up have been used. Tumors and their
paired normal samples have been whole exome-sequenced. 63 ovarian and 80
luminal-breast cancer patients, respectively, were used for discovery while the
rest of the patients were used for validation.
Main Outcome Measures: Gene signatures identified from the sequencing data
of cancer patients’ germlines or tumor founding clones significantly predict
patient outcome.
Results We successfully identified gene signatures for cancer prognosis using
the whole exome sequencing data of either tumor founding clones or patients’
germlines. We showed that gene signatures derived from genomic mutations of
either germlines or tumor founding clones significantly distinguished recurred and
non-recurred ovarian cancer patients (P=1.0x10-6 and 3.3x10-6 for germlines and
founding clones, respectively) and breast cancer patients (P=3.7x10-3 and
1.1x10-3 for germlines and founding clones, respectively), although founding
clone mutations derived gene signatures have slightly better performance than
germline mutations derived ones.
39
Conclusions and Relevance: Gene signatures derived from patients’ germline
mutations or tumor founding clone mutations significantly predicted cancer
prognosis. These results imply that a patient’ genetic makeup could predict
clinical outcomes and it is potential to develop a non-invasive, genome-based
prognostic test by sequencing a patient’s blood or saliva sample.
3.3 Introduction
Tumor recurrence and metastasis is the leading cause of cancer mortality.
Accurately predicting of tumor recurrence and metastasis could greatly aid
clinicians in making treatment decisions. For example, most of the low-risk breast
cancer patients (i.e., patients whose tumors do not recur for 10 years after
surgery alone) do not gain survival benefits from adjuvant therapy (i.e.,
chemotherapy given after surgery to reduce the risk of cancer recurrence), but
will suffer from its toxic side effects. Prognostic biomarkers could predict if a
patient is likely to get tumor recurrence and metastasis after surgical removal.
Therefore, it is helpful to identify patients who should be treated with
chemotherapy. With the decreasing cost of genome sequencing, prognostic
prediction using genome sequencing data have become of great clinical interest.
In the past, some germline mutations have been associated with the outcomes of
cancer patients. For example, germline mutations in BRCA1/2 have a good
prognosis in ovarian cancer patients33, while TP53 and ATM mutations in
chronic lymphocytic leukemia patients have poor survival, independent of other
factors32. Thus far, only a handful gene mutations in germlines have been
associated with cancer outcomes, furthermore, these genes represent only a
small fraction of cancer patients. In general, cancer recurrence and metastasis
are the results of multiple gene interactions, therefore, we are reasoning that a
collective germline genetic variants/mutations in cancer patients might be
40
associated with patient outcomes. Next-generation sequencing provides an
opportunity to test this hypothesis. Furthermore, genome sequencing
technologies are becoming more affordable and accessible for routine clinical
usage. If the collective germline mutations of a cancer patient could predict
his/her clinical outcome, genome sequencing of patients’ blood or saliva samples
could provide a noninvasive way for determining patients’ prognosis and help
clinicians in making treatment decisions.
Predicting cancer prognosis using genome sequencing data has proven
challenging, since complex genetic diseases including cancer exhibit extensive
mutational heterogeneity. For example, gene mutation status varies widely
across individual cancer cells. In other words, mutated genes are rarely shared
between any two individual tumors, even of the same cancer type. Each patient
tumor thus harbors a unique genomic profile 1,2,5,13,14,20. This feature of tumor
mutations makes it extremely hard to make predictions using collective genomic
mutations. Although tumor collective genomic mutations have not been
successful for making predictions, they have been used for tumor classifications
based on a network approach11. This approach transforms the mutations of an
individual sample into a profile which is similar to gene expression profiles (here,
we called this process as ‘network profiling’).
In this study, to predict cancer prognosis using sequencing data (i.e.,
eTumorMetastasis), we first took a network profiling approach which transforms
genome sequencing data into network-derived profiles (i.e., netProfiles). To
identify gene signatures, we modified our previously developed Multiple Survival
Screening (MSS) algorithm 11, which was originally designed to identify cancer-
hallmark-based gene expression signatures, and then applied combinatory
cancer-hallmark-based gene signature sets (CSS sets) approach7 to the
netProfiles. We showed that the germline mutations of either cancer patients or
tumor founding clones (i.e., the founding cancer cell transformed from a single
normal cell through acquiring a series of mutations) successfully predicted the
recurrence and patient outcomes in breast and ovarian cancers. These results
41
imply that the germline mutations of cancer patients play a critical role in tumor
recurrence, metastasis and patient outcomes. Furthermore, genome sequencing
of blood or saliva samples of cancer patients could provide a noninvasive,
convenient, and timely prognostic test.
3.4 Methods
Data for tumors and their paired normal samples
Whole exome-sequence data of serous ovarian and luminal-breast tumors and
their paired normal samples were obtained from TCGA. Patients for which
information on recurrence and clinical follow-up is available were selected for the
analysis. In total, 272 and 267 ovarian and luminal-breast tumor samples have
been used in this study. Gene expression profiles and SNP 6.0 array data of
these samples were also downloaded from TCGA.
Determine functionally mutated genes
To determine whether a genetic variant is functionally mutated, we ran the
following tools: Variant Effect Predictor 19 (e.g., a functional mutation is defined
as deleterious or damaging), CRAVAT 6 (e.g., a functional mutation is defined as
a score higher than or equal to 0.5) and MutationTaster2 21 (e.g., a functional
mutation is defined as having a disease impact). For a given sample, we merged
all functional mutations predicted by the three tools for further analysis. In this
study, all the mutated genes mentioned are ‘functionally mutated genes’.
Construction of luminal-breast and ovarian cancer-specific metastasis
networks
To construct the breast luminal-breast cancer specific metastasis network, we
modified a previous procedure for constructing luminal breast cancer-specific
cancer survival and proliferation networks 27. Briefly, we extracted a subnetwork
by mapping the luminal-breast cancer specific metastasis-associated genes onto
a human signaling network. To do so, we first identified metastasis-associated
genes using luminal cancer cell lines and tumor samples. We obtained the gene
42
expression data of 22 luminal cancer cell lines from the Cancer Cell Line
Encyclopedia (CCLE, http://www.broadinstitute.org/ccle). Gene expression
data normalization was conducted with the median centering and z-score
normalization method described previously 17. Using the ratio of two genes’
expression values (i.e., CDH1/VIM for determining epithelial–mesenchymal
transition), we classified these lines into epithelial (n=13, CDH1/VIM > 1.2) and
mesenchymal (n=9, CDH1/VIM <= 1.2) lines. Modulated genes (called Set 1)
were identified by conducting a t-test comparison (P < 0.05) of the two groups of
cell lines with 10 re-samplings (i.e., each re-sampling randomly took 60% of the
original samples). We also obtained the gene expression data of 1,197 luminal
tumor samples from METBRIC set
(https://www.ebi.ac.uk/ega/studies/EGAS00000000083). These samples include
information about cancer recurrence and clinical follow-up. Using this set, we
used a t-test (P < 0.05) to identify significantly-modulated genes between the
recurred and non-recurred samples. Next, we performed Kaplan-Meier survival
tests on the modulated genes to identify survival-associated genes (called Set 2)
using 10 re-samplings. We further identified potential cancer gene regulators by
analyzing the copy number data (SNP 6.0 data) of the luminal tumor samples
from TCGA. The SNP 6.0 data were processed using GISTIC to obtain GISTIC
scores for each gene. For a given gene in a sample, if its GISTIC score was
greater than 0.3 and its expression value was ranked among the top 50% of the
genome, we defined this gene as a cancer regulator (for details, see Zaman et
al., 2013 27). The regulators of all TCGA’s luminal tumor samples were defined as
Set 3. We mapped all the genes from Sets 1, 2 and 3 onto the signaling network
(eg, merging the manually curated human signaling network 4,18 and a protein
interaction network 15) and extracted their links to obtain a luminal-breast cancer
specific metastasis network that contains 6,148 genes and 62,004 interactions.
The same procedure was applied to construct an ovarian cancer specific
metastasis network. To do so, gene expression of 17 ovarian cancer cell lines
from CCLE and ovarian tumors from GSE13876 and GSE26712 were used while
SNP 6.0 data of TCGA ovarian tumors were used.
43
Generation of netProfiles using a network propagation approach
To generate a netProfile for a sample, we projected its functionally mutated
genes as seeds onto its cancer type-specific metastasis network and then
applied a network propagation algorithm 24 to obtain heating scores of the genes
within the network. We applied a scaling factor of 100,000 to the heating scores
and then conducted data transformation using the median centering and z-score
within sample approach 17.
Statistical Analysis
Statistical significance of the prognostic groups (ie, high- or low-risk groups
defined by gene signatures) was determined using Kaplan-Meier survival plots. A
prognostically significant result was defined by log-rank P< .05. All the analyses
were performed using the R statistics package.
3.5 Results
Tumor founding clone mutations predict tumor recurrence
To determine if genome sequencing data can be used to predict cancer
prognosis, we first used mutations of tumor founding clones. A single normal cell
is assumed to acquire a series of random mutations until their combined effect
results in its transformation into a founding cancer cell (e.g., the founding clone),
an early evolutionary stage of a tumor. Additional accumulation of mutations from
this founding clone leads to the formation of a tumor that is composed of a
heterogeneous mixture of cells (Fig. 1). Therefore, each tumor originates from a
founding clone whose mutations are ubiquitously present in all the cells of that
tumor. New mutations do not arise in isolation but rather act together in a
complementary manner within the context of the established genomic landscape;
therefore, the pre-existing mutations or genetic variants (i.e., in germlines or
founding clones) of a molecular network may have a profound effect on the fate
of the cells and determine whether novel mutations will result in cell death, clonal
expansion, metastasis and other cancer hallmark traits25. This implies that the
44
genetic makeup of the founding clone provides an evolutionary constraint for
sequential subclone generation and limits the genetic and clonal complexity of
tumors. Tumor genome sequencing allows us to dissect founding and subclones
and to replay the tape of tumor evolutionary history, while eTumorMetastasis
developed here allows us to examine the evolutionary and patient outcomes that
are affected by these early evolutionary events (eg, mutations in early
evolutionary stages). Therefore, we examined whether the mutations in founding
clones could predict tumor recurrence and metastasis.
This hypothesis was first tested using serous ovarian tumor whole exome
sequencing data. Serous ovarian cancer represents more than 70% of ovarian
cancers. Fig 2 shows the flowchart for identifying gene signatures using genome
sequencing data. To predict cancer prognosis using founding clone mutations,
we first constructed an ovarian cancer-specific metastasis network (Methods) by
modifying our previous method of constructing a luminal-specific cancer survival
network 27. We identified functionally mutated genes in the founding clones using
the sequencing data of ovarian tumors and their paired normal samples
(Supplementary Methods). New mutations need to function together with pre-
existing mutations to activate and promote cancer hallmark networks such as
metastasis networks25; therefore, founding clone mutations contain both germline
mutations and founding clone somatic mutations. To generate a netProfile for a
founding clone, we projected its mutated genes onto the ovarian cancer
metastasis network using the network propagation algorithm (Methods). This
resulted in a founding clone-specific netProfile in which the network genes were
assigned with heating scores.
To identify gene signatures for predicting tumor recurrence, we modified our
previously developed MSS algorithm17. MSS has been originally designed for
identifying gene signatures from gene expression profile. To apply MSS to
netProfiles, we modified the MSS by generating 5 million random gene sets (30
gene each) from a selected cancer hallmark gene group to classify 200 random
sets of netProfiles (i.e., classify into recurred and non-recurred sample groups)
derived from the training set, and finally selected 1,000 to 5,000 gene sets that
45
are able to classify at least 180 sets of the 200 sets of netProfiles (details in the
pseudocode of eTumorMetastasis, Supplementary Methods). We identified 12
gene signatures (Supplementary Table 1) and showed that they were
significantly predictive in 4 validation sets (Supplementary Table 2). To further
improve the prediction accuracy, we built combinatory gene signature sets (CSS
sets, Supplementary Methods) 7 using the identified gene signatures. We further
showed that the CSS sets (Supplementary Table 3) significantly distinguished
recurred and non-recurred tumors in all 4 other validation sets (P=3.3x10-6, Table
1 and Fig 3a-b).
To demonstrate a broader applicability of eTumorMetastasis, we applied it to
TCGA breast tumors. Breast cancer has two major molecular subtypes: luminal
and basal. Luminal tumors represent a large proportion (~70%) of the breast
tumors. Through an examination of sequencing data and clinical follow-up
information, we found that TCGA collected several hundred of luminal tumors but
only ~100 basal tumors. We therefore decided to use luminal tumors to
implement eTumorMetastasis. We showed that founding clone-derived gene
signatures significantly distinguished recurred and non-recurred tumors in
validation sets of luminal-breast cancer patients (P=1.1x10-3, Supplementary
Tables 1, 4-5 and Supplementary Fig. 1), suggesting that the algorithm is
applicable to other cancer types. These results strongly indicate that late
evolutionary events and patient outcomes (i.e., tumor recurrence and metastasis)
are highly dependent on the genomic landscape of early evolutionary stages
(i.e., founding clone).
Germline mutations of cancer patients predict tumor recurrence
Cancer is a process of asexual evolution driven by genomic alterations. A single
normal cell randomly acquires a series of mutations that allows it to proliferate
and to be transformed into a founding clone thus initiating tumor progression. We
hypothesized that mutagenic processes are essentially blind or non-purposeful,
however, to drive cancer metastasis, new mutations will be selected if they
46
integrate into the pre-existing genomic landscape (i.e., germline mutations or
germline genetic variants) to trigger or activate a cancer metastasis network25.
This means that pre-existing germline genetic variants could provide a profound
constraint on the evolution of founding clones and subclones, and therefore, has
a contingent effect on tumor evolution and patient outcomes. As shown above,
founding clone mutations are able to predict tumor recurrence. Thus, we asked if
the genomic landscape of a patient’s germline could predict a cancer patient
outcome.
To do so, we used the sequencing data of luminal-breast and ovarian cancer
patient germlines to identify gene signatures for predicting tumor recurrence. We
extended the procedures used for founding clones to the patient germline
sequencing data. Finally, we identified 8 and 10 gene signatures for luminal-
breast and ovarian cancer, respectively (to understand the signature number
differences, see Supplementary Methods). CSS sets were constructed using
these gene signatures. The CSS sets of ovarian cancer significantly
distinguished recurred and non-recurred tumors in all the validation sets of
ovarian cancer patients (P=1.0x10-6, Table 2, Fig. 3c-d, Supplementary Tables 1
and 8 and Supplementary Fig. 2). Similarly, the CSS sets of breast cancer
significantly distinguished recurred and non-recurred tumors in all the validation
sets of breast cancer patients (P=3.7x10-3, Supplementary Tables 1, 6-7). These
results support our hypothesis that clinical outcome is significantly dependent on
the original germline genomic landscape of the cancer patient. Practically,
genome sequencing a patient’s blood or saliva sample provides a convenient,
timely and noninvasive way to predict patient outcome in a clinical setting.
To understand why germline genomic landscapes of cancer patients are
predictive for tumor recurrence, we conducted enrichment analysis of the genes
with high heating scores derived from germline mutations (Supplementary
Methods). We found that high heating-score genes derived from germline
mutations of the recurred ovarian cancer patients are enriched with cell-cell
adhesion but not in non-recurred patients (Supplementary Table 9). This data
47
suggest that germline genetic variants or mutations of the recurred patients
influence cell-cell adhesion process, with is related to metastasis. Furthermore,
although cell cycle and DNA damage are enriched in the high heating scored
genes for both recurred and non-recurred ovarian cancer patients, they are more
significant in the recurred group (Supplementary Table 9). These results suggest
that germline genetic variants in the recurred patients promote more cell
proliferation (i.e., cell cycle) and genome instability (i.e., DNA damage), which
also promote metastasis. It is well known that molecular mechanisms of
tumorigenesis are different between luminal-breast cancer and ovarian cancer2.
We found that cell migration and FGF pathway are significantly enriched in the
high heating scored genes of recurred patients but not in non-recurred patients
(Supplementary Table 10). FGF pathway has been reported to promote breast
cancer metastases for a long time28. These results suggest that germline
mutations in the recurred and non-recurred patients are different such that
recurred patients germline genetic variants promote more cell proliferation and
cell migration.
Of note, in both cancer types we could not identify gene signatures which are
involved in immune response (i.e., a cancer hallmark) using germline mutations,
but successfully identified immunologically related gene signatures using
founding clone mutations. These results suggest that functionally mutated genes
that help cancer cells to escape from host immune system were positively
selected during early stage (i.e., founding clone) of tumorigenesis. In addition,
we observed that the prediction performance of founding clone derived CSS sets
is better than that of germline derived CSS sets. These results are consistent
with the fact that a founding clone lies downstream of the germline ancestor cell
during tumor evolution.
48
3.6 Discussion
Predicting cancer prognosis using genome sequencing data
As genome sequencing technologies are becoming more affordable and
accessible for routine clinical usage, they are now being used for personalized
genomic tests such as TruGenome clinical sequencing tests (Illumina), Personal
DNA tests (23andMe), FoundationOne cancer sequencing tests (Foundation
Medicine) and so on. At the moment, it is easy to generate personal genome
sequencing data, but extremely difficult to interpret in the context of personal
health. Genomic reports derived from these genomic tests often use a single
gene mutation or SNP as a link to complex genetic diseases or to guide certain
treatments. However, most of these associations are very weak and ambiguous,
because complex genetic diseases result from the interactions between multiple
genetic mutations and other factors. Clearly, to properly interpret personalized
genomic testing results, it is necessary to use a collection of mutations to predict
phenotypes or diseases. In this study, we showed that a combination of network
profiling and MSS allows the prediction of cancer prognosis using genome
sequencing data, which paves the way for the application of sequencing
technology in clinics.
Network profiling allows to estimate the collective effects of genomic alterations
(i.e., functionally mutated genes) on cancer hallmark networks (details about
cancer hallmark networks can be found in the recent review25) that better
represent the phenotypic consequences of mutated genes. Tumor recurrence
may be regulated by a transition state between metastatic and non-metastatic in
a metastasis network. Rare commonalities of mutated genes between tumors
suggest that there are multiple ways in which genetic alterations may trigger a
state transition. However, the collective effects of multiple mutated genes may
converge into a few sets of networked genes (i.e., gene signatures) that
modulate the transition state between metastatic and non-metastatic. Each of
these sets (i.e., gene signatures) contains a group of genes along with a
representation of their regulatory relationships and strengths (i.e., represented by
49
heating scores here). In this context, we expected that these gene signatures
might predict tumor recurrence and metastasis.
Germline genomic landscapes impact cancer patient outcomes
Genome-wide germline genetic variants can be easily obtained by genome
sequencing of cells from liquid biopsies such as blood or saliva samples.
Prognostic prediction using a patient's germline genomic landscape opens up the
possibility of assessing cancer patients’ risk of recurrence in a noninvasive
manner, which allows forecasting of cancer recurrences in a quick, convenient
and minimally painful manner. Cancer recurrence and metastasis are highly
complex processes where interactions between tumors and their hosts (i.e.,
encoded by the germline genomic landscapes of the cancer patients) play a
dominant role. Therefore, we hypothesized that, once a patient develops cancer,
the chance of tumor recurrence is significantly dependent on that patient’s
germline genomic landscape. Our observation that germline genomic landscapes
can predict tumor recurrence and metastasis supports this hypothesis.
The tumor microenvironment, which can also be modulated by the patients’
genetic makeup could also influence tumor recurrence. Thus far, our
understanding of the fundamental biology of the tumor-host interaction has been
limited. However, several reports provide evidence that germline mutations of
cancer patients modulate metastasis through the tumor microenvironment. It is
known that germline-encoded receptors could trigger innate immune responses
in cancer patients29. The presence or absence of the T cell-inflamed tumor
microenvironment phenotype in individual patients also the result from
interactions between somatic differences at the level of the tumor cells and
germline polymorphism differences at the level of the host. Patients with T cell-
inflamed tumors often have good prognosis30. Germline mutations of cancer
patients could mediate the efficiency of the immune systems in the tumor
50
microenvironment. For example, lung cancer patients with germline mutations in
the Nrf2 gene have good prognosis, due to a mechanism that Nrf2 exerts anti-
metastatic activity by regulating the inflammatory status and redox balance of the
hematopoietic and immune systems of cancer patients31. In prostate cancer,
patients with some germline variants of the ASPN D locus are highly associated
with poorer oncologic outcomes32, probably through its interactions with TGF-b.
These studies support the hypothesis that the cancer patients’ genetic makeup
influences metastasis. Taken together, the germline genomic landscape of a
cancer patient might provide not only a substantial constraint on tumor
recurrence for tumor cells, but also constrains for the tumor microenvironment,
which ultimately has a profound impact on patient outcomes. These insights
provide rationales that clinical outcomes of carcinogenesis could be predicted
based on the germline genomic landscapes of cancer patients. This study sheds
light on the possibility that metastasis rates are predictable based on the
germline genomic landscapes of cancer patients. These results prompted us to
propose that future studies of tumor metastasis would benefit from a shift to
genome-based studies in the early evolution of tumors. Traditionally, germline
mutations have been largely ignored in cancer genomics studies. Many cancer
genomic studies, including the TCGA efforts, have often focused on somatic
cancer driving mutations, while filtering out germline mutations before formal
analysis of tumor genome sequencing data.
In summary, we implemented an eTumorMetastasis algorithm for predicting
prognosis based on genome sequencing data. We showed that sequencing of
patient germline genomes might provide an efficient, non-painful and convenient
way for predicting tumor recurrence. Moreover, genome sequencing of blood or
salivary samples of cancer patients could provide a non-invasive test for
prognosis that could help doctors in making treatment decisions.
51
3.7 References
1 Cancer Genome Atlas Network, "Integrated genomic analyses of ovarian carcinoma," Nature 474(7353), 609 (2011).
Ref Type: Journal
2 Cancer Genome Atlas Network, "Comprehensive molecular portraits of human breast tumours," Nature 490(7418), 61 (2012).
Ref Type: Journal
3 J. C. Costello, et al., "A community effort to assess and improve drug sensitivity prediction algorithms," Nat. Biotechnol. 32(12), 1202 (2014).
Ref Type: Journal
4 Q. Cui, et al., "A map of human cancer signaling," Mol. Syst. Biol. 3, 152 (2007).
Ref Type: Journal
5 T. Davoli, et al., "Cumulative haploinsufficiency and triplosensitivity drive aneuploidy patterns and shape the cancer genome," Cell 155(4), 948 (2013).
Ref Type: Journal
6 C. Douville, et al., "CRAVAT: cancer-related analysis of variants toolkit," Bioinformatics. 29(5), 647 (2013).
Ref Type: Journal
7 S. Gao, et al., "Identification and Construction of Combinatory Cancer Hallmark-Based Gene Signature Sets to Predict Recurrence and Chemotherapy Benefit in Stage II Colorectal Cancer," JAMA Oncol. doi:10.1001/jamaoncol.2015.3413 (2015).
Ref Type: Journal
8 G. Gundem, et al., "The evolutionary history of lethal metastatic prostate cancer," Nature 520(7547), 353 (2015).
Ref Type: Journal
9 D. Hanahan and R. A. Weinberg, "Hallmarks of cancer: the next generation," Cell 144(5), 646 (2011).
Ref Type: Journal
10 Douglas Hanahan and Robert A. Weinberg, "The Hallmarks of Cancer," Cell 100(1), 57 (2000).
Ref Type: Journal
11 M. Hofree, et al., "Network-based stratification of tumor mutations," Nat. Methods 10(11), 1108 (2013).
52
Ref Type: Journal
12 M. K. Hong, et al., "Tracking the origins and drivers of subclonal metastatic expansion in prostate cancer," Nat. Commun. 6, 6605 (2015).
Ref Type: Journal
13 D. T. Jones, et al., "Dissecting the genomic complexity underlying medulloblastoma," Nature 488(7409), 100 (2012).
Ref Type: Journal
14 S. Jones, et al., "Core signaling pathways in human pancreatic cancers revealed by global genomic analyses," Science 321(5897), 1801 (2008).
Ref Type: Journal
15 T. S. Keshava Prasad, et al., "Human Protein Reference Database--2009 update," Nucleic Acids Res. 37(Database issue), D767-D772 (2009).
Ref Type: Journal
16 M. D. Leiserson, et al., "Pan-cancer network analysis identifies combinations of rare somatic mutations across pathways and protein complexes," Nat. Genet. 47(2), 106 (2015).
Ref Type: Journal
17 J. Li, et al., "Identification of high-quality cancer prognostic markers and metastasis network modules," Nat. Commun. 1, 34 (2010).
Ref Type: Journal
18 L. Li, et al., "The human phosphotyrosine signaling network: Evolution and hotspots of hijacking in cancer," Genome Res. 22(7), 1222 (2012).
Ref Type: Journal
19 W. McLaren, et al., "Deriving the consequences of genomic variants with the Ensembl API and SNP Effect Predictor," Bioinformatics. 26(16), 2069 (2010).
Ref Type: Journal
20 D. W. Parsons, et al., "An integrated genomic analysis of human glioblastoma multiforme," Science 321(5897), 1807 (2008).
Ref Type: Journal
21 J. M. Schwarz, et al., "MutationTaster2: mutation prediction for the deep-sequencing age," Nat. Methods 11(4), 361 (2014).
Ref Type: Journal
53
22 The Cancer Genome Atlas Research Network, "Comprehensive genomic characterization defines human glioblastoma genes and core pathways," Nature 455(7216), 1061 (2008).
Ref Type: Journal
23 The Cancer Genome Atlas Research Network, "Comprehensive molecular characterization of human colon and rectal cancer," Nature 487(7407), 330 (2012).
Ref Type: Journal
24 O. Vanunu, et al., "Associating genes and protein complexes with disease via network propagation," PLoS. Comput. Biol. 6(1), e1000641 (2010).
Ref Type: Journal
25 E. Wang, et al., "Predictive genomics: a cancer hallmark network framework for predicting tumor clinical phenotypes using genome sequencing data," Semin. Cancer Biol. 30, 4 (2015).
Ref Type: Journal
26 E. Wang, et al., "Cancer systems biology in the genome sequencing era: Part 1, dissecting and modeling of tumor clones and their networks," Semin. Cancer Biol. 23(4), 279 (2013).
Ref Type: Journal
27 N. Zaman, et al., "Signaling network assessment of mutations and copy number variations predict breast cancer subtype-specific drug targets," Cell Rep. 5(1), 216 (2013).
Ref Type: Journal 28P. Okunieff, et al., "Fibroblast growth factors (FGFS) increase
breast tumor growth rate, metastases, blood flow, and oxygenation without significant change in vascular density," Adv Exp Med Biol. 530, 593 (2003).
Ref Type: Journal 29A. Marcus, et al., "Recognition of tumors by the innate immune
system and natural killer cells," Adv Immunol. 122, 91 (2014). Ref Type: Journal 30A. J. Gentles, et al., "The prognostic landscape of genes and
infiltrating immune cells across human cancers," Nat Med. 21(8), 938 (2015).
Ref Type: Journal
54
31H. Satoh, et al., "Nrf2-deficiency creates a responsive microenvironment for metastasis to the lung," Carcinogenesis. 31(10), 1833 (2010).
Ref Type: Journal 31P. J. Hurley, et al., "Germline Variants in Asporin Vary by Race,
Modulate the Tumor Microenvironment, and Are Differentially Associated with Metastatic Prostate Cancer," Clin Cancer Res. 22(2), 448 (2016).
Ref Type: Journal
32C. Nabhan, et al., "Predicting Prognosis in Chronic Lymphocytic Leukemia in the Contemporary Era", JAMA Oncol. 1(7), 965 (2015).
Ref Type: Journal 33D. Yang , et al., "Association of BRCA1 and BRCA2 mutations with
survival, chemotherapy sensitivity, and gene mutator phenotype in patients with ovarian cancer", JAMA. 306(14), 1557 (2011).
Ref Type: Journal
55
3.8 Tables
Table 1 Prediction accuracy and recall rate for validation sets for ovarian cancer using the CNSS sets derived from tumor founding clones
Dataset Number of samples
High-risk Low-Risk
Accuracy (%)* Recall (%)† Accuracy (%)* Recall (%)††
Validation Set 1
35 94.4 60.7 50.0 28.6
Validation Set 2
35 94.7 64.3 50.0 57.1
Validation Set 3
35 93.8 53.6 40.0 28.6
Validation Set 4
35 92.9 46.4 28.6 28.6
Notes:
*Percentage of recurred (i.e., metastatic) samples in the predicted high-risk
group.
†Percentage of the predicted high-risk samples from the recurred group.
**Percentage of non-recurred (i.e., non-metastatic) samples in the predicted low-
risk group.
††Percentage of the predicted low-risk samples from the non-recurred group.
56
Table 2 Prediction accuracy and recall rate for validation sets for ovarian cancer using the CNSS sets derived from germline mutations
Dataset Number of samples
High-risk Low-Risk
Accuracy (%)* Recall (%)† Accuracy (%)** Recall (%)††
Validation Set 1
35 93.3 100.0 100.0 42.9
Validation Set 2
35 90.5 67.9 57.1 57.1
Validation Set 3
35 90.0 64.3 50.0 42.9
Validation Set 4
35 84.6 39.3 75.0 42.9
Notes:
*Percentage of recurred (i.e., metastatic) samples in the predicted high-risk
group.
†Percentage of the predicted high-risk samples from the recurred group.
**Percentage of non-recurred (i.e., non-metastatic) samples in the predicted low-
risk group.
††Percentage of the predicted low-risk samples from the non-recurred group.
57
3.9 Figures and legends
Fig 1 Tumor evolution, a founding clone and its mutations. New somatic mutations (dark brown) functionally or epistatically work with germline mutations (green) to form a founding clone (i.e., the earliest, ancestral cancer cell). New somatic mutations occur in the founding clone to generate subclones. A tumor often contains several subclones. Of note, all the mutations from germline and somatic mutations in the founding clone are present in all the subclones and every cancer cell of the tumor. Circles represent cells while colored bars represent mutated genes.
Fig 2 A flowchart of the eTumorMetastasis. Functionally mutated genes of
samples (eg, either from germline or tumor founding clones) are projected on a
metastasis network to generate gene heating scores using a network
propagation approach (i.e., mutated genes become heat sources that diffuse
‘energy’ to neighboring genes along the edges of the network) 24. After this step,
genes and their heating scores are considered as a netProfile for a sample. We
then applied the modified Multiple Survival Screening algorithm 17 to identify gene
signatures that distinguish the two phenotypic groups (i.e., recurred vs non-
recurred tumor samples). Each signature containing a set of genes with heating
scores quantifies the network state transition (i.e., state between recurred and
non-recurred tumors). In the network, nodes and lines represent genes and gene
relations, respectively. Numeral numbers of each network node represent
heating scores.
Fig 3 Kaplan–Meier curves of the risk groups for ovarian cancer patients with 5-year disease-free survival predicted by the CSS sets. CSS sets derived from tumor founding clones’ mutations in (a) the training set and (b) the validation sets (all the samples in 4 validation sets were merged). CSS sets derived from germline mutations in (c) the training set and (d) the validation sets (all the samples in 4 validation sets were merged). Kaplan–Meier curves have been not made for samples which do not have follow-up time. Blue and red curves represent low- and high-risk groups, respectively. P-values were obtained from the χ2-test.
58
Fig 1
59
Fig 2
60
Fig 3
a
b
61
c
d
62
CHAPITRE 4 DISCUSSION GÉNÉRALE
4.1 Le NGS et son utilisation comme outil de prédiction
Pour tenter d’améliorer les traitements associés au cancer ainsi que la spécificité
de ceux-ci, de nouvelles méthodes de détection doivent être implémentées. Avec
l’utilisation massive du NGS et de la diminution constante des coûts rattachés à
celui-ci, la nécessité de modèles permettant la détection du cancer (ou même
certains pronostics relatifs à celui-ci) devient une priorité mondiale. Ainsi, la
quantité de données produites par le NGS ainsi que leur accessibilité fournit un
avantage très important au niveau du développement de telles méthodes. Le
chapitre 3 démontre qu’un modèle basé sur le NGS (et les mutations) peut bel et
bien être utilisé pour représenter un pronostic (ou phénotype), mais également,
comme outil de détection (prédiction de 92% et plus pour 2 cancers différents).
Bien évidemment, l’application du modèle demeure à être exploré davantage et
plusieurs autres pronostics pourraient éventuellement être modélisés et détectés
à l’aide de celui-ci. Donc, plus il y aura de données de séquençage disponible et
plus de modèles permettant la prédiction de différents pronostics pourront être
élaborés. Par ailleurs, le séquençage amène un aspect thérapeutique très
convoité puisque celui-ci peut être fait à partir d’un échantillon sanguin et est
donc classifié comme étant une méthode non invasive. Cela représente un gros
avantage au niveau médical puisqu’il n’y a pratiquement aucun effet néfaste sur
le patient et pourra donc être prescrit non seulement en premier lieu, mais
également, au quotidien. De plus, le NGS n’est pas seulement limité à la
détection de mutations. Des méthodes comme le RNA-seq sont en mesure de
représenter le niveau d’expression génique avec une très bonne précision. Par
conséquent, les modèles utilisables pour la prédiction pourraient combiner non
seulement les mutations significatives des gènes, mais également, leur
expression. L’expression génique représente un défi beaucoup plus intéressant
car celle-ci est beaucoup plus dépendante des conditions présentes. Ceci
amènerait une deuxième dimension au modèle et améliorerait la spécificité et la
63
précision de celui-ci. Jusqu’à présent, l’utilisation de modèles similaires est
minime, ou même non existante. Bien entendu, avant le développement du NGS,
il est impossible de pouvoir concevoir des modèles à ce niveau puisque la
quantité de données requise et disponible pour représenter celui-ci n’étaient pas
suffisantes. Le développement de nouveaux modèles utilisant cette approche
représente donc un phénomène émergent pour la détection du cancer et sera
très intéressant à surveiller.
4.2 Impacts du clone fondateur dans l’expansion clonale du cancer
Comme mentionné précédemment, le clone fondateur représente la première
génération de cellules cancéreuses. Les mutations significatives retrouvées à
l’intérieur de celui-ci sont donc présentes à l’intérieur de tous les autres clones.
Ainsi, non seulement le clone fondateur peut être utilisé comme outil de
prédiction, mais peut également diriger les traitements. Lors de nos analyses, il a
été révélé que les mutations provenant du clone fondateur à l’intérieur des sous-
clones représentent environ 90% des mutations totales. Par conséquent,
l’expansion clonale est fortement structurée par le clone fondateur. Bien entendu,
les caractéristiques acquises (par mutations) par le clone fondateur améliorent
grandement la survie des cellules cancéreuses, mais ceux-ci peuvent également
dicter le comportement du cancer. Les mutations préalablement acquises vont
diriger les mutations futures et accentuer des voies de signalisation très
spécifiques. Le clone fondateur a donc un rôle pour l'aspect diagnostic, pronostic
et thérapeutique. L’hétérogénéité intratumorale observée à l’intérieur des sous-
clones est donc un résultat des mutations du clone fondateur. Ceci explique
également la différence de comportement de sous-type et de types de cancer.
Les bases génétiques (mutations du clone fondateur) sont différentes pour
chacun d’entre eux et conséquemment, les voies de signalisation utilisées et
leurs comportements diffèrent (ex. : cancer luminal et basal). Les mutations
provenant d’agents carcinogènes ou de causes environnementales (avant la
formation de la tumeur) vont elles aussi influencer l’évolution du cancer. Un bel
exemple est le cancer du poumon où les patients sont généralement séparés en
64
2 groupes : fumeur et non-fumeur (75). La cigarette modifie l’ADN et par
conséquent, engendre une énorme quantité de mutations. Les comportements
des 2 groupes seront donc différents ainsi que leurs signatures géniques (lors de
la détection).
4.3 Les mutations germinales et leur potentielle utilisation
Les mutations germinales sont des mutations retrouvées dans toutes les cellules
et sont héritées de la génération précédente (parents). Malgré le fait que toutes
ces mutations ne sont pas nécessairement reliées au cancer, si le patient
possède un historique familial susceptible au cancer, ces mutations vont agir
comme précurseur du cancer et augmenter les risques associés à celui-ci.
Jusqu’à présent, l’utilisation de mutations germinales comme outil de prédiction
est non existante. La section 3 démontre que ces mutations peuvent en effet
dicter et prédire le comportement du cancer (avec une précision de 80-90%).
Évidemment, celles-ci font partie du clone fondateur et comme mentionné
précédemment, ont un impact majeur à ce niveau. L’efficacité et la précision
obtenues pour la prédiction de la récurrence indiquent que les mutations
pourraient être utilisées pour prédire d’autres phénotypes spécifiques (ex. :
maladie cardiaque, résistance, etc.). Ceci amène un nouvel aspect pour les
méthodes de détection et de dépistage. Des combinaisons de mutations
germinales pourraient être utilisables lors du suivi des patients et ainsi, surveiller
le développement du cancer (s’il y a lieu) ou d’autres pronostics tout aussi
importants.
4.4 Vision à long terme
Malgré les résultats obtenus, plusieurs améliorations peuvent encore être
appliquées au modèle. En premier lieu, parmi les données utilisées pour
construire le réseau, certains ensembles de données datent de plus de 5 ans. Un
raffinement du réseau à ce niveau pourrait permettre une meilleure
représentation de la problématique et même mener à une meilleure prédiction.
Par ailleurs, pour la totalité du projet, nous n'avons tenu compte que des
65
mutations fonctionnelles et avons ignoré les insertions/délétions. Ces
changements ont également un rôle crucial dans l'instabilité génomique du
cancer. De même, toutes les régions du génome ayant des changements du
nombre de copie ont été ignorées. Une intégration de ces altérations au modèle
serait une option possible. Pour certains types de cancer (ex: pancréas), il existe
beaucoup plus d'altérations au nombre de copie que de mutations fonctionnelles
(76). Par conséquent, le modèle pourrait être très incomplet (potentiellement
même non applicable) pour ceux-ci. En deuxième lieu, l'étude entière repose sur
les parties codantes du génome (exons). Alors que les régions non-codantes
sont souvent associées au phénomène de régulation, il est possible que les
cellules cancéreuses utilisent plusieurs mécanismes pour altérer celles-ci.
L'instabilité génomique (mutations, insertions, délétions) à l'intérieur de plusieurs
régions régulatrices (ex: 3' - 5' UTR, promoteurs) auraient un impact majeur sur
la cellule (77). Ces signatures génétiques pourraient être diversifiées selon le
type de cancer et même selon les patients. Hypothétiquement, il serait donc
envisageable d' utiliser celles-ci comme outil diagnostique au même titre que les
mutations fonctionnelles germinales. Finalement, il serait intéressant de
reproduire les résultats obtenus dans l'article en clinique avec des échantillons
de salive ou de plasma. De bons résultats à ce niveau mènerait éventuellement
à une nouvelle méthode de détection non-invasive envisageable.
66
CONCLUSIONS ET PERSPECTIVES
Le cancer demeure un problème d’une envergure mondiale. Les traitements
associés à celui-ci sont peu efficaces et mènent à un important taux de mortalité,
et ce, malgré des milliards de dollars d’investissements et des années de
recherches. Il n’existe que quelques méthodes de détection très fiables et celles-
ci sont majoritairement spécifiques à un type de cancer. Par conséquent,
plusieurs cancers sont détectés trop tard et le taux de survie des patients
diminue drastiquement. Bien évidemment, plus le cancer est détecté à un stage
avancé, plus les chances de survie des patients diminuent. L’importance de
nouvelles méthodes de détection est donc massive. Par le fait même, le NGS est
maintenant l’une des technologies les plus utilisées et les données produites par
celui-ci ne cessent d’augmenter. Le développement de modèle de dépistage (ou
prédiction) du cancer en utilisant des données de séquençage devient impératif
et est jusqu’à présent pratiquement non existant. La biologie des systèmes et
l’approche des graphes amènent cette possibilité. En utilisant le NGS et des
mutations clés, il devient possible de, non seulement, modéliser et prédire un
phénotype spécifique (ex. : récurrence), mais également d’intégrer
l’hétérogénéité intra- et inter-tumoral. Donc, cela permet de prédire le
comportement du cancer, orienter les futurs traitements en ciblant des gènes
clés et mêmes, de surveiller le développement du phénotype désiré sur une base
quotidienne (échantillon sanguin). En utilisant des mutations germinales et celles
du clone fondateur, il est possible de prédire un pronostic avec une excellente
précision (90-95%). Bien évidemment, le concept reste à être exploré davantage
et plusieurs autres informations pourraient être intégrées à celui-ci. Néanmoins,
ceci amène une majeure amélioration au niveau du dépistage du cancer et
risque de rediriger les études et les protocoles dans le futur.
67
BIBLIOGRAPHIE
1. American Cancer Society. The history of Cancer. 2009.
2. Institut Jules Bordet. The history of Cancer. Bruxelles : s.n., 2010.
3. Grange JM, Stanford JL, Stanford CA. Campbell De Morgan's 'Observations on cancer', and their
relevance today. s.l. : Journal of Royal Society of Medecine, 2002. Vol. 95(6).
4. Boveri, Theodor. Concerning the Origin of Malignant Tumours. s.l. : Journal of Cell Science, 2008.
pp. 1-84. Vol. 121.
5. Coutard, Henri. The results and methods of treatment of cancer by radiation. s.l. : Annals of
surgery, 1937. pp. 584-598. Vol. 106(4).
6. Office of Government and Congressional Relations. National Cancer Institute. National
Cancer Act, Legislative History. 2016.
7. James D. Watson, Tania A. Baker, Stephen P. Bell, Alexander Gann, Michael Levine, Richard
Losick, Inglis CSHLP. Molecular Biology of the Gene. 6th edition. s.l. : Pearson, 2008.
8. Identification of 42 Genes Linked to Stage II Colorectal Cancer Metastatic Relapse. Rabeah A. Al-
Temaimi, Tuan Zea Tan, Makia J. Marafie, Jean Paul Thiery, Philip Quirke and Fahd Al-Mulla.
5, s.l. : Int J Mol Sci., 2016, Vol. 17.
9. Douglas Hannahan, Robert A. Weinberg. Hallmarks of cancer. s.l. : Cell, 2000. pp. 57-70. Vol.
100(1).
10. —. Hallmarks of Cancer: The Next Generation. s.l. : Cell, 2011. pp. 646-674. Vol. 144(5).
11. Cheng N, Chytil A, Shyr Y, Joly A, Moses HL. Transforming growth factor-beta signaling-
deficient fibroblasts enhance hepatocyte growth factor signaling in mammary carcinoma cells to
promote scattering and invasion. s.l. : Molecular Cancer Research, 2008. pp. 1521-33. Vol. 6(10).
12. Davies MA, Samuels Y. Analysis of the genome to personalize therapy for melanoma. s.l. :
Oncogene, 2010. pp. 5545-55. Vol. 29(41).
13. Burkhart DL, Sage J. Cellular mechanisms of tumour suppression by the retinoblastoma gene. s.l. :
Nature Reviews Cancer, 2008. pp. 671-82. Vol. 8(9).
14. Kandoth C, McLellan MD, Vandin F, Ye K, Niu B, Lu C, Xie M, Zhang Q, McMichael JF,
Wyczalkowski MA, Leiserson MD, Miller CA, Welch JS, Walter MJ, Wendl MC, Ley TJ, Wilson
RK, Raphael BJ, Ding L. Mutational landscape and significance across 12 major cancer types. s.l. :
Nature, 2013. pp. 333-9. Vol. 502(7471).
15. Adams JM, Cory S. The Bcl-2 apoptotic switch in cancer development and therapy. s.l. : Oncogene,
2007. pp. 1324-37. Vol. 26(9).
68
16. Lowe SW, Cepero E, Evan G. Intrinsic tumour suppression. s.l. : Nature, 2004. pp. 307-15. Vol.
432(7015).
17. Blasco, MA. Telomeres and human disease: ageing, cancer and beyond. s.l. : Nature Reviews
Genetics, 2005. pp. 611-22. Vol. 6(8).
18. Masutomi K, Possemato R, Wong JM, Currier JL, Tothova Z, Manola JB, Ganesan S,
Lansdorp PM, Collins K, Hahn WC. The telomerase reverse transcriptase regulates chromatin state
and DNA damage responses. s.l. : Proc Natl Acad Sci U S A, 2005. pp. 8222-7. Vol. 102(23).
19. Kang HJ, Choi YS, Hong SB, Kim KW, Woo RS, Won SJ, Kim EJ, Jeon HK, Jo SY, Kim TK,
Bachoo R, Reynolds IJ, Gwag BJ, Lee HW. Ectopic expression of the catalytic subunit of telomerase
protects against brain injury resulting from ischemia and NMDA-induced neurotoxicity. s.l. : J
Neurosci, 2004. pp. 1280-7. Vol. 24(6).
20. Hanahan D, Folkman J. Patterns and emerging mechanisms of the angiogenic switch during
tumorigenesis. s.l. : Cell, 1996. pp. 353-64. Vol. 86(3).
21. Baluk P, Hashizume H, McDonald DM. Cellular abnormalities of blood vessels as targets in
cancer. s.l. : Curr Opin Genet Dev., 2005. pp. 102-11. Vol. 15(1).
22. Cavallaro U, Christofori G. Cell adhesion and signalling by cadherins and Ig-CAMs in cancer. s.l. :
Nature Reviews Cancer, 2004. pp. 118-32. Vol. 4(2).
23. Joyce JA, Pollard JW. Microenvironmental regulation of metastasis. s.l. : Nature Reviews Cancer,
2009. pp. 239-52. Vol. 9(4).
24. O., Warburg. On respiratory impairment in cancer cells. s.l. : Science, 1956. pp. 269-70. Vol.
124(3215).
25. GL., Semenza. HIF-1: upstream and downstream of cancer metabolism. s.l. : Curr Opin Genet
Dev., 2010. pp. 51-6. Vol. 20(1).
26. O., Feron. Pyruvate into lactate and back: from the Warburg effect to symbiotic energy fuel
exchange in cancer cells. s.l. : Radiother Oncol., 2009. pp. 329-33. Vol. 92(3).
27. Center for disease control and prevention. Global Cancer Statistics. 2012.
28. International Agency for Research on Cancer. The global burden on cancer. 2003.
29. World Health Organization. International Agency for Research on Cancer. World Cancer
Report. 2014.
30. MJ., Barry. Clinical practice. Prostate-specific-antigen testing for early diagnosis of prostate
cancer. s.l. : New England Journal of Medecine., 2001. pp. 1373-7. Vol. 344(18).
31. Petrucelli N, Daly MB, Feldman GL. Hereditary breast and ovarian cancer due to mutations in
BRCA1 and BRCA2. s.l. : Genet Med., 2010. pp. 245-59. Vol. 12(5).
69
32. Gdowski A, Ranjan AP, Mukerjee A, Vishwanatha JK. Nanobiosensors: role in cancer detection
and diagnosis. s.l. : Adv Exp Med Biol, 2014. pp. 33-58. Vol. 807.
33. Strand TE, Rostad H, Møller B, Norstein J. Survival after resection for primary lung cancer: a
population based study of 3211 resected patients. s.l. : Thorax, 2006. pp. 710-5. Vol. 61(8).
34. Bleicher RJ, Ruth K, Sigurdson ER, Beck JR, Ross E, Wong YN, Patel SA, Boraas M, Chang EI,
Topham NS, Egleston BL. Time to Surgery and Breast Cancer Survival in the United States. s.l. :
JAMA Oncology, 2016. pp. 330-9. Vol. 2(3).
35. Eastham JA, Kattan MW, Groshen S, Scardino PT, Rogers E, Carlton CE Jr, Lerner SP.
Fifteen-year survival and recurrence rates after radiotherapy for localized prostate cancer. s.l. : J Clin
Oncol., 1997. pp. 3214-22. Vol. 15(10).
36. Komatsu T, Kunieda E, Oizumi Y, Tamai Y, Akiba T. An analysis of the survival rate after
radiotherapy in lung cancer patients with bone metastasis: is there an optimal subgroup to be treated
with high-dose radiation therapy? s.l. : Neoplasma, 2012. pp. 650-7. Vol. 59(6).
37. Alkylating agents and DNA polymerases. LP, Bignold. 2B, s.l. : Anticancer Res, 2006, Vol. 26, pp.
1327-36.
38. Anthracycline Chemotherapy and Cardiotoxicity. John V McGowan, Robin Chung, Angshuman
Maulik, Izabela Piotrowska, J Malcolm Walker, and Derek M Yellon. 1, s.l. : Cardiovasc Drugs
Ther, 2017, Vol. 31, pp. 63-75.
39. How Taxol/paclitaxel kills cancer cells. Weaver, Beth A. 18, s.l. : Mol Biol Cell, 2014, Vol. 25, pp.
2677–2681.
40. Epigenetic therapy of cancer with histone deacetylase inhibitor. Lakshmaiah KC, Jacob LA,
Aparna S1, Lokanatha D, Saldanha SC. 3, s.l. : J Cancer Res Ther, 2014, Vol. 10, pp. 469-78.
41. Topoisomerase 1 inhibitors and cancer therapy. Moukharskaya J1, Verschraegen C. 3, s.l. :
Hematol Oncol Clin North Am, 2012, Vol. 26, pp. 507-25.
42. Etoposide, topoisomerase II and cancer. Baldwin EL, Osheroff N. 4, s.l. : Curr Med Chem
Anticancer Agents, 2005, Vol. 5, pp. 363-72.
43. Bortezomib as the first proteasome inhibitor anticancer drug: current status and future
perspectives. Chen D, Frezza M, Schmitt S, Kanwar J, Dou QP. 3, s.l. : Curr Cancer Drug Targets,
2011, Vol. 11, pp. 239-53.
44. Cancer chemotherapy: targeting folic acid synthesis. Joerger, Nicole Hagner and Markus. s.l. :
Cancer Manag Res, Vol. 2, pp. 293-301.
45. 5-fluorouracil: mechanisms of action and clinical strategies. Longley DB, Harkin DP, Johnston
PG. 5, s.l. : Nat Rev Cancer, 2003, Vol. 3, pp. 330-8.
70
46. Actinomycin D inhibits cell proliferations and promotes apoptosis in osteosarcoma cells. Dai-Feng
Lu, Yan-Song Wang, Chao Li, Guo-Jun Wei, Rui Chen, Da-Ming Dong, and Meng Yao. 2, s.l. : Int J
Clin Exp Med, 2015, Vol. 8, pp. 1904–1911.
47. Freemantle SJ, Spinella MJ, Dmitrovsky E. Retinoids in cancer therapy and chemoprevention:
promise meets resistance. s.l. : Oncogene, 2003. pp. 7305-15. Vol. 22(47).
48. Vinca Alkaloids. Maryam Moudi, Rusea Go, Christina Yong Seok Yien, and Mohd. Nazre. 11,
s.l. : Int J Prev Med, 2013, Vol. 4, pp. 1231–1235.
49. Morgan G, Ward R, Barton M. The contribution of cytotoxic chemotherapy to 5-year survival in
adult malignancies. s.l. : Clin Oncol (R Coll Radiol)., 2004. pp. 549-60. Vol. 16(8).
50. Angela B. Mariotto, K. Robin Yabroff, Yongwu Shao, Eric J. Feuer, and Martin L. Brown.
Projections of the Cost of Cancer Care in the United States: 2010–2020. s.l. : J Natl Cancer Inst., 2011.
pp. 117-128. Vol. 103(2).
51. Andrew M. Scott, James P. Allison and Jedd D. Wolchok. Monoclonal antibodies in cancer
therapy. s.l. : Cancer Immun., 2012. Vol. 12.
52. RO., Dillman. Perceptions of Herceptin: a monoclonal antibody for the treatment of breast cancer.
s.l. : Cancer Biother Radiopharm., 1999. pp. 5-10. Vol. 14.
53. Burrell RA, McGranahan N, Bartek J, Swanton C. The causes and consequences of genetic
heterogeneity in cancer evolution. s.l. : Nature, 2013. pp. 338-45. Vol. 501(7467).
54. G., Curigliano. New drugs for breast cancer subtypes: targeting driver pathways to overcome
resistance. s.l. : Cancer Treat Rev., 2012. pp. 303-10. Vol. 34(4).
55. Yoneyama H, Takizawa-Hashimoto A, Takeuchi O, Watanabe Y, Atsuda K, Asanuma F,
Yamada Y, Suzuki Y. Acquired resistance to gemcitabine and cross-resistance in human pancreatic
cancer clones. s.l. : Anticancer Drugs, 2015. pp. 90-100. Vol. 26(1).
56. Polyak K, Marusyk A. Cancer: Clonal cooperation. 2014 : Nature. pp. 52-3. Vol. 508(7494).
57. Wang E, Zou J, Zaman N, Beitel LK, Trifiro M, Paliouras M. Cancer systems biology in the
genome sequencing era: part 2, evolutionary dynamics of tumor clonal networks and drug resistance.
s.l. : Semin Cancer Biol., 2013. pp. 286-92. Vol. 23(4).
58. Cancer. p53, guardian of the genome. DP, Lane. 6381, s.l. : Nature, 1992, Vol. 358, pp. 15-16.
59. p53, the cellular gatekeeper for growth and division. AJ., Levine. 3, s.l. : Cell, 1997, Vol. 88, pp.
323-31.
60. Gene Therapy for Cancer Treatment: Past, Present and Future. Deanna Cross, and James K.
Burmester. 3, s.l. : Clin Med Res, 2006, Vol. 4, pp. 218-227.
71
61. Mapping copy number variation by population scale genome sequencing. Ryan E. Mills, Klaudia
Walter, Chip Stewart, Robert E. Handsaker, Ken Chen, Can Alkan, Alexej Abyzov, Seungtai
Chris Yoon, Kai Ye, R. Keira Cheetham, Asif Chinwalla, Donald F. Conrad, et al. 7332, s.l. :
Nature, 2011, Vol. 470, pp. 59-65.
62. A global reference for human genetic variation. 1000 Genomes Project Consortium, Auton A,
Brooks LD, Durbin RM, Garrison EP, Kang HM, Korbel JO, Marchini JL, McCarthy S, McVean
GA, Abecasis GR. 7571, s.l. : Nature, 2015, Vol. 526, pp. 68-74.
63. An integrated map of structural variation in 2,504 human genomes. Sudmant PH, Rausch T,
Gardner EJ, Handsaker RE, Abyzov A, Huddleston J, Zhang Y, Ye K, Jun G, Fritz MH, Konkel MK,
Malhotra A, Stütz AM, Shi X, Casale FP, Chen J, Hormozdiari F, Dayama G, Chen K, et al. 7571,
s.l. : Nature, 2015, Vol. 526, pp. 75-81.
64. An integrated map of genetic variation from 1,092 human genomes. 1000 Genomes Project
Consortium, Abecasis GR, Auton A, Brooks LD, DePristo MA, Durbin RM, Handsaker RE, Kang
HM, Marth GT, McVean GA. 7422, s.l. : Nature, 2012, Vol. 491, pp. 56-65.
65. The Catalogue of Somatic Mutations in Cancer (COSMIC). Forbes SA, Bhamra G, Bamford S,
Dawson E, Kok C, Clements J, Menzies A, Teague JW, Futreal PA, Stratton MR. s.l. : Curr Protoc
Hum Genet, 2008, Vol. 10.
66. Human cancer databases (Review). ATHANASIA P, DEMETRIOS A. S., and Ioannis
MICHALOPOULOS. 1, s.l. : Oncol Rep, 2015, Vol. 33, pp. 3-18.
67. Saliva: An emerging biofluid for early detection of diseases. Yu-Hsiang Lee, and David T. Wong,.
4, s.l. : Am J Dent, 2010, Vol. 22, pp. 241-248.
68. Detection of cancer DNA in plasma of patients with early-stage breast cancer. Beaver JA, et al. 10,
s.l. : Clin Cancer Res, 2014, Vol. 20, pp. 2643-2650.
69. Next-generation sequencing to guide cancer therapy. Gagan J, Van Allen EM. 1, s.l. : Genome
Med, 2015, Vol. 7, p. 80.
70. Woo JH, Shimoni Y, Yang WS, Subramaniam P, Iyer A, Nicoletti P, Rodríguez Martínez M,
López G, Mattioli M, Realubit R, Karan C, Stockwell BR, Bansal M, Califano A. Elucidating
Compound Mechanism of Action by Network Perturbation Analysis. s.l. : Cell, 2015. pp. 441-51. Vol.
162(2).
71. Milanese JS, Zaman N, Tibiche C, Jinfeng Z, Droit A, Wang E. Genomic landscapes of either
cancer patients’ germlines or tumor founding clones predict tumor recurrence. s.l. : Submitted., 2016.
72. Loeb KR, Loeb LA. Significance of multiple mutations in cancer. s.l. : Carcinogenesis, 2000. pp.
379-85. Vol. 21(3).
73. Zaman N, Milanese JS, Zou J, Wand A, Wang E. Predicting key personalized cancer driver-
mutated genes in advance based on healthy individuals’ genetic makeup. s.l. : Submitted, 2016.
72
74. Miller NA, Farrow EG, Gibson M, Willig LK, Twist G, Yoo B, Marrs T, Corder S, Krivohlavek
L, Walter A, Petrikin JE, Saunders CJ, Thiffault I, Soden SE, Smith LD, Dinwiddie DL, Herd S,
Cakici JA, Catreux S. A 26-hour system of highly sensitive whole genome sequencing for emergency
management of genetic diseases. s.l. : Genome Med., 2015. p. 100. Vol. 7.
75. Tanner NT, Kanodra NM, Gebregziabher M, Payne E, Halbert CH, Warren GW, Egede LE,
Silvestri GA. The Association between Smoking Abstinence and Mortality in the National Lung
Screening Trial. s.l. : Am J Respir Crit Care Med., 2016. pp. 534-41. Vol. 193(5).
76. Recurrent hemizygous deletions in cancers may optimize proliferative potential. Solimini NL, Xu
Q, Mermel CH, Liang AC, Schlabach MR, Luo J, Burrows AE, Anselmo AN, Bredemeyer AL, Li
MZ, Beroukhim R, Meyerson M, Elledge SJ. 6090, s.l. : Science, 2012, Vol. 337, pp. 104-9.
77. Genome-wide analysis of non-coding regulatory mutations in cancer. Nils Weinhold, Anders
Jacobsen, Nikolaus Schultz, Chris Sander, and William Lee. 11, s.l. : Nat Genet, 2015, Vol. 46, pp.
1160-1165.
78. Société Canadienne du Cancer. Développement de la cellule cancéreuse. 2016.
79. Société Canadienne du Cancer, Agence de la santé publique du Canada, Statistiques
Canada. Prévisions concernant le fardeau futur du cancer au Canada. 2015.
80. Monjazeb AM, Zamora AE, Grossenbacher SK, Mirsoian A, Sckisel GD, Murphy WJ.
Immunoediting and antigen loss: overcoming the achilles heel of immunotherapy with antigen non-
specific therapies. s.l. : Front Oncol., 2013. p. 197. Vol. 3.
81. Serão NV, Delfino KR, Southey BR, Beever JE, Rodriguez-Zas SL. Cell cycle and aging,
morphogenesis, and response to stimuli genes are individualized biomarkers of glioblastoma
progression and survival. s.l. : BMC Med Genomics., 2011. p. 49. Vol. 4.