10
La Lettre du Cancérologue • Vol. XXI - n° 6 - juin 2012 | 295 DOSSIER THÉMATIQUE La médecine personnalisée Séquençage haut débit Deep sequencing or next generation sequencing M.H. Stern* * INSERM U830-Section de recherche ; institut Curie, Paris. L e cancer est une maladie génétique, le caractère malin d’une cellule étant transmis intégrale- ment à ses cellules filles (le “omnis cellula e cellula” de R.L.K. Virchow, 1858 [1]) lors de la division cellulaire. Le terme “génétique” est pris ici au sens le plus large, celui d’informations transmises d’une cellule à sa descendance comprenant le génome constitutionnel, ses modifications somatiques au cours de la tumorigenèse, ainsi que les modifica- tions de la chromatine dites épigénétiques – héritées, acquises lors de l’embryogenèse ou au cours de la transformation maligne. La caractérisation de ce génome tumoral a révolutionné notre compréhension du cancer durant les 30 dernières années, avec une augmentation exponentielle des données, notam- ment grâce aux développements technologiques dans le séquençage. Ces informations génomiques dépassent le cadre fondamental, et contribuent depuis longtemps au diagnostic, à la nosologie, aux indications ou contre-indications thérapeutiques. Cependant, seuls quelques gènes étaient jusqu’à présent évalués pour la prise en charge clinique d’un patient atteint d’une tumeur maligne. Une réelle rupture technologique, scientifique et médicale est en cours depuis l’avènement d’une deuxième généra- tion des techniques de séquençage, appelée séquen- çage massif ou nouvelle génération de séquençage (Next-Generation Sequencing [NGS], ou NextGen). Cet article fera d’abord un bref rappel sur le séquen- çage classique, puis abordera les techniques NGS disponibles sur le marché et en cours de développe- ment, avant d’en montrer les applications en biologie et, finalement, en médecine. Techniques de séquençage Séquençage de Sanger Cette méthode, décrite par F. Sanger en 1977 (2), s’est rapidement imposée aux dépens de la méthode de Maxam et Gilbert, qui mettait en œuvre un clivage chimique par des substances hautement toxiques. Elle utilise l’extension par une polymérase d’un oligonucléotide sur la matrice simple brin que l’on cherche à caractériser. Cette extension est interrompue aléatoirement par l’addition dans le mélange de désoxynucléotides triphosphates (dNTP, carburants de la polymérase) de didésoxynucléo- tides triphosphates (ddNTP) ; l’absence de l’hydoxyl en position 3 ne permet plus l’extension par la polymérase. Les fragments générés par exemple dans le mélange contenant du didésoxyadénosine triphosphate (ddATP) se termineront tous par un ddA, ce qui permet de localiser ce nucléotide sur la séquence. La réalisation de 4 réactions avec chaque ddNTP (ddATP, didésoxycitidine triphos- phate [ddCTP], didésoxyguanosine triphosphate [ddGTP], didésoxythymidine triphosphate [ddTTP]) permet de déterminer la séquence recherchée. En gardant ce principe extrêmement astucieux, la technique a évolué, remplaçant le marquage radioactif des nucléotides par un couplage fluo- rescent, les gels d’acrylamide par des capillaires, le fragment de Klenow de l’ADN polymérase par des polymérases thermostables de type Taq polymérase, et par la commercialisation d’automates. Le statut actuel de cette méthode est la détermination avec une extrême fiabilité d’un fragment d’ADN jusqu’à 1 000 bases environ, chaque expérience correspon- dant à une molécule d’ADN. La détermination de la séquence du génome humain, d’environ 3.10 9 paires de base (bp), après une quinzaine d’années d’un effort international, reposait entièrement sur la méthode de Sanger (3, 4). Deuxième génération Même si d’autres approches du séquençage ont été proposées antérieurement, la rupture technologique a été marquée par l’équipe de J.M. Rothberg, qui a créé

Séquençage haut débit - edimark.fr · acquises lors de l’embryogenèse ou au cours de la transformation maligne. La caractérisation de ce ... Résumé Les techniques de séquençage

Embed Size (px)

Citation preview

Page 1: Séquençage haut débit - edimark.fr · acquises lors de l’embryogenèse ou au cours de la transformation maligne. La caractérisation de ce ... Résumé Les techniques de séquençage

La Lettre du Cancérologue • Vol. XXI - n° 6 - juin 2012 | 295

DOSSIER THÉMATIQUELa médecine personnalisée

Séquençage haut débitDeep sequencing or next generation sequencing

M.H. Stern*

* INSERM U830-Section de recherche ; institut Curie, Paris.

Le cancer est une maladie génétique, le caractère malin d’une cellule étant transmis intégrale-ment à ses cellules fi lles (le “omnis cellula e

cellula” de R.L.K. Virchow, 1858 [1]) lors de la division cellulaire. Le terme “génétique” est pris ici au sens le plus large, celui d’informations transmises d’une cellule à sa descendance comprenant le génome constitutionnel, ses modifi cations somatiques au cours de la tumorigenèse, ainsi que les modifi ca-tions de la chromatine dites épigénétiques – héritées, acquises lors de l’embryogenèse ou au cours de la transformation maligne. La caractérisation de ce génome tumoral a révolutionné notre compréhension du cancer durant les 30 dernières années, avec une augmentation exponentielle des données, notam-ment grâce aux développements techno logiques dans le séquençage. Ces informations génomiques dépassent le cadre fondamental, et contribuent depuis longtemps au diagnostic, à la nosologie, aux indications ou contre-indications thérapeutiques. Cependant, seuls quelques gènes étaient jusqu’à présent évalués pour la prise en charge clinique d’un patient atteint d’une tumeur maligne. Une réelle rupture technologique, scientifi que et médicale est en cours depuis l’avènement d’une deuxième généra-tion des techniques de séquençage, appelée séquen-çage massif ou nouvelle génération de séquençage (Next-Generation Sequencing [NGS], ou NextGen). Cet article fera d’abord un bref rappel sur le séquen-çage classique, puis abordera les techniques NGS disponibles sur le marché et en cours de développe-ment, avant d’en montrer les applications en biologie et, fi nalement, en médecine.

Techniques de séquençage

Séquençage de Sanger

Cette méthode, décrite par F. Sanger en 1977 (2), s’est rapidement imposée aux dépens de la méthode

de Maxam et Gilbert, qui mettait en œuvre un clivage chimique par des substances hautement toxiques. Elle utilise l’extension par une poly mérase d’un oligonucléotide sur la matrice simple brin que l’on cherche à caractériser. Cette extension est interrompue aléatoirement par l’addition dans le mélange de désoxynucléotides triphosphates (dNTP, carburants de la polymérase) de didésoxynucléo-tides triphosphates (ddNTP) ; l’absence de l’hydoxyl en position 3 ne permet plus l’extension par la polymérase. Les fragments générés par exemple dans le mélange contenant du didésoxyadénosine triphosphate (ddATP) se termineront tous par un ddA, ce qui permet de localiser ce nucléotide sur la séquence. La réalisation de 4 réactions avec chaque ddNTP (ddATP, didésoxycitidine triphos-phate [ddCTP], didésoxyguanosine triphosphate [ddGTP], didésoxythymidine triphosphate [ddTTP]) permet de déterminer la séquence recherchée. En gardant ce principe extrêmement astucieux, la technique a évolué, remplaçant le marquage radioactif des nucléotides par un couplage fl uo-rescent, les gels d’acrylamide par des capillaires, le fragment de Klenow de l’ADN polymérase par des polymérases thermostables de type Taq polymérase, et par la commercialisation d’automates. Le statut actuel de cette méthode est la détermination avec une extrême fi abilité d’un fragment d’ADN jusqu’à 1 000 bases environ, chaque expérience correspon-dant à une molécule d’ADN. La détermination de la séquence du génome humain, d’environ 3.109 paires de base (bp), après une quinzaine d’années d’un effort international, reposait entièrement sur la méthode de Sanger (3, 4).

Deuxième génération

Même si d’autres approches du séquençage ont été proposées antérieurement, la rupture technologique a été marquée par l’équipe de J.M. Rothberg, qui a créé

Page 2: Séquençage haut débit - edimark.fr · acquises lors de l’embryogenèse ou au cours de la transformation maligne. La caractérisation de ce ... Résumé Les techniques de séquençage

296 | La Lettre du Cancérologue • Vol. XXI - n° 6 - juin 2012

RésuméLes techniques de séquençage ont bénéficié depuis quelques années d’innovations technologiques qui permettent dès à présent d’aborder le génome complet d’un individu. On parle de Nouvelle Génération de Séquençage (NGS ou NextGen) ou de séquençage massivement parallèle. L’évolution des performances et la baisse des coûts par nucléotide suit actuellement un rythme impressionnant. Les conséquences sont une accélération des découvertes en génétique fondamentale, dans les pathologies génétiques, et dans la description des génomes tumoraux. Le NGS est en cours d’implantation dans la pratique diagnostique comme la recherche de mutations constitutionnelles (BRCA1, BRCA2) ou de mutations somatiques, potentielles cibles thérapeutiques, dans les cancers. En dehors de ces avancées techniques, de nouveaux problèmes sont posés, notamment en bioéthique et sur l’organisation même du diagnostic génétique en oncologie.

Mots-clésNouvelle génération de séquençage/séquençage haut débit/séquençage massivement parallèleMédecine personnaliséeGénomeExomeGénétique somatique et constitutionnelle

SummaryDNA sequencing has bene-fi ted in recent years of tech-nological breakthroughs that give potentially access to the complete genetic informa-tion of an individual. These novel sequencing approaches are commonly named Next Generation Sequencing (NGS or NextGen) or massively parallel sequencing. The increase of their performance and decrease cost per nucleotide follow an impressive curve. Conse-quences are an increasing pace of discoveries in basic genetics, in elucidating genetic disorders and in the description of tumor genomes. The NGS is being implemented in diag-nostic practice such as search for constitutional mutations (BRCA1, BRCA2) or for somatic mutations, and more specifi -cally for search of potential therapeutic targets in cancer. Apart from these technical advances, new problems are arising, especially in bioethics and in the future organization of genetic and oncology diag-nosis laboratories.

KeywordsNext Generation Sequencing

Personalized Medicine

Genome

Exome

Germline and somatic genetics

et commercialisé le premier outil de NGS (5) − ainsi que le très récent PGM/Ion Torrent. Toutes les méthodes de NGS reposent approximativement sur le même principe (6) [fi gure 1].On ne séquence plus un fragment simple d’ADN, mais un mélange complexe, allant jusqu’à un génome entier. Ce mélange est fragmenté. Les fragments sont ligaturés à de courtes séquences universelles (adaptateurs) constituant une banque (library).Chaque molécule est amplifi ée localement, dans une émulsion (ePCR : 454/Roche et SOLiD/Life) ou in situ sur une lame (Illumina). Ce processus de PRC en émulsion consiste à créér une émulsion huile/milieu aqueux le plus souvent autour d’une bille magnétique, chaque gouttelette aqueuse conte-nant l’ensemble des réactifs nécessaire à la réaction. L’émulsion est ensuite soumise à des cycles ther-miques comme dans une machine PRC classique, les gouttelettes constituant des milliards de micro-réacteurs individuels.La détermination de la séquence par différentes méthodes biochimiques (pyroséquençage : 454/Roche ; séquençage par semi-conducteur : PGM/IonTorrent/Life ; ligation : SOLiD/Life ; type Sanger pour Illumina) [fi gure 2, p. 298] se fait simultané-ment sur un très grand nombre de fragments ampli-fi és (jusqu’à plusieurs centaines de millions). On parle de séquençage massivement parallèle, ou massif.La fiabilité de chaque séquence individuelle est médiocre (variable selon les technologies) mais compensée par le nombre de courts fragments de séquence (reads) du même nucléotide sur des frag-ments indépendants, correspondant à la profondeur de séquençage ; le NGS est de fait parfois appelé “deep sequencing”.

Les conséquences de cette rupture d’approche sont considérables.

➤ Le coût par base est diminué de plusieurs ordres de magnitude, et la rapidité d’obtention est augmentée dans le même ordre de grandeur. La détermination de la séquence codante d’un génome humain (environ 3.107 bp) revient actuel-lement à environ 5 000 euros et prend quelques semaines, au lieu d’environ 25 millions d’euros en plusieurs mois ou années. Si le coût du nucléotide

est faible, chaque expérience est coûteuse (jusqu’à 10 000 euros), nécessitant une grande rigueur dans la gestion des plateformes.

➤ Le frein n’est plus technique mais bio- informatique. Comment gérer le fl ux considérable de données, stocker ces dernières à coût raisonnable et obtenir une séquence fi able pouvant être utilisée en clinique humaine à partir d’un gigantesque ensemble de séquences peu fi ables ?

➤ Ces technologies – appareils, réactifs, protocoles et outils d’analyse bio-informatique – sont en évolu-tion très rapide. Tout en bénéfi ciant de l’amélioration des performances du NGS, l’instabilité des méthodes pose de nombreux problèmes dans leur implémen-tation à visée diagnostique.

Actuellement, le secteur est extrêmement concur-rentiel, avec des instruments lourds adaptés au séquençage de génomes entiers (comme Genome Analyzer d’Illumina ou SOLiD5550 de Life, etc.). Les outils les plus adaptés au diagnostic sont les séquenceurs “de paillasse” (Roche GS Junior de Roche, MiSeq d’Illumina, PGM/Ion Torrent de Life, etc.). L’objet de cette revue n’est évidemment pas de comparer ces plateformes ni d’établir une liste exhaustive des fournisseurs. Le choix de la plate-forme dépendra des priorités données à la longueur des courts fragments de séquence, à la fi abilité des séquences, au nombre des courts fragments de séquence fournis par expérience et à la durée de l’expérience jusqu’au rendu de la séquence.

Utilisation et applications du NGS en biologieLes outils de NGS se sont imposés en quelques années pour une variété impressionnante de caracté-risations génétiques : évidemment, la séquence des génomes ou d’une partie des génomes, des transcrits codant pour des protéines ou non codants (trans-criptome), de l’état de la chromatine (épigénome), de la réplication, de l’organisation tridimension-nelle du génome dans le noyau, des sites de fi xa-tion de facteurs nucléaires, etc. Ces techniques ne sont pas spécifi ques à une espèce et s’appliquent indifféremment aux micro-organismes, aux plantes

Page 3: Séquençage haut débit - edimark.fr · acquises lors de l’embryogenèse ou au cours de la transformation maligne. La caractérisation de ce ... Résumé Les techniques de séquençage

Figure 1. Établissement des banques de fragments et amplifi cation avant séquençage. L’ADN est tout d’abord fragmenté, les extrémités sont “ réparées” et ligaturées à des adaptateurs (petits rectangles verts). Selon les constructeurs, 2 méthodes d’amplifi cation sont proposées le plus souvent. a. Amplifi cation en émulsion (ePCR). b. Amplifi cation in situ sur la lame de verre.

Fragmentation de l’ADN

In vitro adaptor ligation

a

b

La Lettre du Cancérologue • Vol. XXI - n° 6 - juin 2012 | 297

DOSSIER THÉMATIQUE

ou aux animaux. Le NGS reste plus performant dans la comparaison des courts fragments de séquence à une séquence de référence (comme le génome humain) du fait de leur petite taille, même si quelques séquences de novo ont pu être assemblées.Chaque application repose sur un protocole particu-lier, souvent complexe. Il est important cependant d’expliquer quelques grandes déclinaisons du NGS, qui sont orientées par les questions posées par le biologiste ou le médecin.La constitution de la banque se décline en plusieurs versions, communes ou proches pour la plupart des plateformes, en fonction de l’application (fi gure 3, p. 300).

➤ Le simple séquençage d’un fragment dans une direction sur plusieurs dizaines ou centaines de bases. C’est la solution la plus simple pour couvrir le génome et en déterminer les variations.

➤ Le séquençage d’un fragment dans les 2 direc-tions (paired-end library). L’apport de ce protocole par rapport au précédent est de simplifi er l’identifi ca-tion de variations complexes (insertions et délétions de nucléotides) en ajoutant une information sur la distance attendue entre 2 courts fragments de séquence et, quand il est appliqué au transcriptome, d’identifi er les transcrits de fusion.

➤ La réalisation de banques particulières permet-tant de séquencer 2 régions éloignées de plusieurs kilobases (kb) [mate-paired library]. Ces banques permettent d’identifi er les remaniements de struc-ture du génome : inversion, délétion, duplication et translocation.

➤ L’addition d’une courte séquence d’identifi ca-tion (code-barres) qui permet de multiplexer dans la même expérience plusieurs échantillons afin, notamment, de réduire les coûts et le nombre de manipulations.

Il faut également choisir ce que l’on veut séquencer : l’ADN, l’ARN codant, l’ARN non codant. Pour l’ADN, un génome humain haploïde contient environ 3.109 bp. Seul environ 1 % du génome a une fonction bien comprise dans le codage des protéines. Loin de considérer comme négligeable le rôle du reste du génome, il faut réaliser que l’évaluation des éventuelles conséquences délétères d’une variation, d’une mutation ou d’un remaniement du génome non codant est diffi cile, et reste du domaine de la recherche. D’où l’idée de sélectionner, avant ou après la construction de la banque, les séquences qui intéressent vraiment l’utilisateur. Cette sélection peut être faite par amplifi cation en chaîne, simple PCR (Polymerase Chain Reaction) ou, plus souvent, PCR multiplex, ou bien par hybridation avec des sondes qui vont permettre de capturer les séquences d’intérêt. On peut ainsi amplifi er ou sélectionner un gène, une famille de gènes, une partie du génome codant comme les kinases (kinome), les gènes “du cancer” ou tout le génome codant (exome). Dans d’autres applications plus fondamentales, l’ADN est sélectionné par immunoprécipitation en fonction de son environnement chromatinien ou de ses modifi cations épigénétiques. La sélection des séquences d’intérêt permet de diminuer les

Page 4: Séquençage haut débit - edimark.fr · acquises lors de l’embryogenèse ou au cours de la transformation maligne. La caractérisation de ce ... Résumé Les techniques de séquençage

b

Image

APS

ATP

PPI

Luciférine

Amorce

Polymérase

A G A A T C G G C A T G C T A A A G T C A

Lumière + oxyluférine

Sulfurylase

Luciférase

A G A A T C G G C A T G C T A A A G T C AA A TG A AA A T TA

a

Life - séquençage par ligation

Amorce 1er cycle

3’3’

3’

3’

3’3’

– 1

+

AT

OHP

Ligase

TAAdaptateur Fragment à séquencer

Fluorescence,imagerie en 4 couleursExcitation

Agent de clivage

Répétition des cycles de ligation Cycles de ligation 1 2 3 4 5 6 7... (n cycles)

Remise à zéro avec amorce (n – 1) et nouveau cycle de ligation

Décalage d’une base

Réinitialisation 3 fois de suite du processus

Amorce universelle (n – 1)

Amorce 2e cycle(décalage d’une base)

AT

TA

P

Universal seq primer (n)

AT TT CT GT TT CA GC TA AA GA CA AA GT CG

AA CT GC TG AT CC CG

T GA CG AC TA GG GC

3’

3’

3’

3’

x y n n n z z z

x y n n n z z z

x y n n n z z z

x y n n n z z z

5’

5’

5’

5’

1,2-Sondes x, y Bases interrogées n Bases dégénérées z Bases universelles

298 | La Lettre du Cancérologue • Vol. XXI - n° 6 - juin 2012

Séquençage haut débitDOSSIER THÉMATIQUELa médecine personnalisée

Page 5: Séquençage haut débit - edimark.fr · acquises lors de l’embryogenèse ou au cours de la transformation maligne. La caractérisation de ce ... Résumé Les techniques de séquençage

Figure 2. Différentes méthodes de séquençage utilisées en NGS. a. Principe du pyroséquençage, utilisé pour 454/Roche. Le même principe est utilisé pour la technique IonTorrent/PGM, mais c’est alors un ion H+ qui est détecté au lieu de la lumière. b. Principe du séquençage par ligation utilisé sur les plateformes SOLiD/Life.c. Principe du séquençage utilisé sur la plateforme Illumina/Solexa.

C A

T G

c

Les 4 nucléotides sont incorporés, chacun ayant une couleur diff érente

Acquisition de l’image après lavage

Clivage des fl uochromes et des terminateurs, puis lavage

Au-dessus : CATCGR

Au-dessous : CCCCCC

Répétition des cycles

Illumina/Solexa - terminateurs réversibles

F

F

F

F

F

F

F

F

F

F

F

F F

F

F

F

F

C C

C

C

C

CG

CG

CG

TT

T

T

T

TG

TC

TC

G

G

G

G

G

GA

GA

GA

A

A

A

FF

F

F

La Lettre du Cancérologue • Vol. XXI - n° 6 - juin 2012 | 299

DOSSIER THÉMATIQUE

coûts et d’augmenter la profondeur du séquençage (le nombre de fois où chaque nucléotide est lu), donc la fi abilité de la lecture. Pour certaines méthodes (séquençage sans sélection, amplifi cation multiplex ou capture), après normalisation des données par traitement bio-informatique, cette profondeur de séquençage correspond au nombre de copies du génome présent. L’ensemble des données peut être simplement représenté sous forme de diagrammes de Circos (fi gure 4, p. 300).

Utilisation et applications du NGS en oncogenèse (7)

Le NGS permet d’ores et déjà de défi nir complète-ment le génome tumoral en identifi ant :

➤ toutes les mutations somatiques, en comparant le génome tumoral au génome constitutionnel ;

➤ toutes les variations germinales potentiellement délétères, en comparant le génome constitutionnel avec la séquence de référence ;

Page 6: Séquençage haut débit - edimark.fr · acquises lors de l’embryogenèse ou au cours de la transformation maligne. La caractérisation de ce ... Résumé Les techniques de séquençage

Figure 4. Multiplicité des réarrangements somatiques dans une tumeur du sein (© Pierga JY, Diéras V. La Lettre du Cancérologue 2011;XX(1):9).

Remaniement intrachromosomiqueRemaniement interchromosomique

Altérations de nombre de copies

Figure 3. Les 3 principales variations de protocole de NGS. Le séquençage simple donne les informations sur les variations nucléotidiques, la technique paired-end permet de détecter des remaniements de petites tailles, la technique mate-paired est adaptée à la détection de remaniements de structure du génome (translocation chromosomique, par exemple).

Séquençage simple

Paired-end (2 reads par fragment)

Extrémité

Séquençage des extrémités Alignement des 2 reads par rapport à la séquence de référence et comparaison des positions relatives

des 2 reads par rapport aux positions théoriques

B B

BB

Grand fragment d’ADN (quelques kb)

Extrémité Extrémité

Circularisation Fragmentation

Mate-paired (2 reads par fragment)

BB B

300 | La Lettre du Cancérologue • Vol. XXI - n° 6 - juin 2012

Séquençage haut débitDOSSIER THÉMATIQUELa médecine personnalisée

➤ la représentation de chaque segment chromo-somique dans la tumeur et donc les pertes, les gains et les amplifi cations chromosomiques ;

➤ les régions de perte d’hétérozygotie (Loss of Hetero zygosity [LOH]), en comparant les SNP (Single Nucleotide Polymorphism) avec la séquence consti-tutionnelle ;

➤ tous les remaniements intra- et interchromo-somiques par l’utilisation de mate-paired libraries.

En termes d’informations biologiques, le NGS, par son caractère global, donne des informations essen-tielles sur l’instabilité génétique de la tumeur. Il peut s’agir de données attendues, comme les mutations ponctuelles, en très grand nombre dans une lignée de mélanomes − plus de 32 000 mutations corres-pondant à la mutagenèse des ultraviolets (8) − ou de cancers du poumon − environ 30 000, surtout des transversions dues au tabac (9) −, le très grand nombre de réarrangements inter- et intrachromo-somique dans les cancers du sein triple-négatifs ER− PR− HER2−, ces tumeurs étant fréquemment inactivées pour BRCA1 qui joue un rôle clé dans la réparation de l’ADN (10). De nouvelles formes d’instabilité ont également pu être découvertes par l’analyse NGS, comme les duplications en tandem

Page 7: Séquençage haut débit - edimark.fr · acquises lors de l’embryogenèse ou au cours de la transformation maligne. La caractérisation de ce ... Résumé Les techniques de séquençage

La Lettre du Cancérologue • Vol. XXI - n° 6 - juin 2012 | 301

DOSSIER THÉMATIQUE

dans les cancers du sein triple-négatifs (10) ou l’explosion chromosomique (chromothripsis) [11].Globalement, le nombre de mutations retrouvées dans chaque tumeur est largement supérieur à ce qui était prédit par les modèles biologiques, y compris dans des hémopathies réputées géné-tiquement plus simples que les tumeurs solides. Le problème principal est maintenant de distin-guer les mutations causales, impliquées dans l’oncogenèse (mutations “driver”), des muta-tions neutres dans l’histoire de la maladie, liées à l’instabilité génétique de la plupart des tumeurs (mutations “passenger”). Seul le séquençage d’un grand nombre de tumeurs de chaque tissu et type histologique permet de démontrer leurs caractères récurrents, argument majeur (mais non définitif) de leur caractère driver, d’où la mise en place de grands consortiums internationaux comme The Cancer Genome Atlas Research Network (TCGA) [12] ou l’International Cancer Genome Consortium (ICGC) [13] pour répondre à cette question essen-tielle. Un argument complémentaire du caractère driver est l’accumulation de mutations de gènes contribuant aux mêmes voies cellulaires dans un même type tumoral, comme les gènes codant des acteurs de la voie de la protéolyse médiée par l’ubiquitination dans le cancer du rein à cellules claires (14).Le NGS permet également d’identifi er et de carto-graphier les remaniements chromosomiques à la recherche de nouvelles translocations driver, notam-ment dans les tumeurs solides. Leur recherche n’en est encore qu’à ses débuts. Cette recherche est pour le moment infructueuse dans la majorité des cancers du sein (10), mais le séquençage massif des transcrits (RNAseq) a permis la découverte du gène de fusion BCOR-CCNB3 dans certains sarcomes à petites cellules rondes et l’identifi cation d’une nouvelle entité pathologique (15).

Utilisation et applications du NGS en oncologieCes immenses progrès dans la caractérisation de la génétique tumorale sont de peu d’intérêt s’ils ne se traduisent pas par des progrès dans la pratique clinique. Or, le passage de la recherche fondamen-tale à la clinique est long et diffi cile. L’implémen-tation du NGS dans la prise en charge du patient en cancérologie en est essentiellement aux étapes de faisabilité. Les applications potentielles sont regrou-pées comme suit.

Trouver des marqueurs de sensibilité et de résistance

L’efficacité du trastuzumab dans les cancers du sein avec amplifi cation HER2 (Human Epidermal growth factor Receptor 2) et de l’imatinib dans les leucémies myéloïdes chroniques avec transloca-tions BCR-ABL a apporté la preuve du concept de thérapeutiques ciblées. Cependant, seul un petit nombre d’altérations génétiques peuvent orienter la décision thérapeutique, que ce soit en biomarqueur de sensibilité (mutation BRAF p.V600E et sensi-bilité au vémurafénib) ou de résistance (mutation KRAS et résistance aux anti-EGFR [Epidermal Growth Factor Receptor]). Le NGS permet d’analyser simul-tanément un grand nombre de gènes et donc de rechercher des altérations même rarement présentes dans un type de tumeur donné. Pour que le temps expérimental et celui de l’analyse bio-informatique soient compatibles avec une prise en compte dans la décision thérapeutique, le plus souvent seuls les gènes directement pertinents sont séquencés (PCR multiplex ou capture et séquenceurs de paillasse). De même, l’interprétation de l’ensemble des variants peut être diffi cile. Les mutations activatrices d’onco-gènes posent peu de problèmes, car elles sont le plus souvent récurrentes, répertoriées dans des bases de données (16) et validées fonctionnellement lors de leur découverte. Pour les mutations inactivatrices de gènes suppresseurs de tumeurs, l’interprétation d’une mutation stop ou d’un décalage du cadre de lecture est facile. Pour les variants faux-sens, une analyse informatique prenant en compte la distance physicochimique entre l’acide aminé sauvage et le variant, et son degré de conservation dans la phylo-génie apporte des arguments importants (mais non défi nitifs) sur le caractère délétère. La connaissance du polymorphisme humain est également essen-tielle (17), et dès qu’un grand nombre de gènes sont étudiés, la comparaison avec le génome constitu-tionnel devient obligatoire pour identifi er les variants somatiques (cela doit faire l’objet d’un consentement éclairé).Pour le moment, la stratégie est de prescrire une thérapeutique ciblée devant un type d’altération génétique (herceptine devant l’amplifi cation HER2, vérumafénib devant une mutation BRAF p.V600E, etc.), parfois associée aux chimiothérapies clas-siques. Ce raisonnement devra probablement évoluer rapidement. La résistance aux antiestro-gènes est associée à l’activation constitutive de la voie PI3K/AKT, et potentiellement réversible par l’évérolimus, un inhibiteur de mTOR (mammalian

Page 8: Séquençage haut débit - edimark.fr · acquises lors de l’embryogenèse ou au cours de la transformation maligne. La caractérisation de ce ... Résumé Les techniques de séquençage

302 | La Lettre du Cancérologue • Vol. XXI - n° 6 - juin 2012

Séquençage haut débitDOSSIER THÉMATIQUELa médecine personnalisée

Target Of Rapamycin). Cette activation peut être liée à des mutations activatrices de PIK3CA, de PIK3R ou de AKT1, à l’inactivation de PTEN ou d’INPP4B, à la signalisation d’amont (amplifi cation d’HER2) ou à d’autres mécanismes (18). Il faudra donc à terme être capable d’évaluer l’ensemble d’une voie biologique, sur le statut mutationnel, de réarrangement et de nombre de copies pour en prédire le niveau d’activa-tion. La modélisation bio-informatique de ces voies par des approches dites de biologie des systèmes sera essentielle dans l’interprétation des données.

Vers une nosologie moléculaire

L’accès à une description détaillée du génome montre une hétérogénéité considérable des tumeurs, y compris pour des entités considérées jusqu’à présent homogènes, comme les leucémies. Ces nouvelles sous-classes tumorales sont caractérisées par des pronostics et des réponses thérapeutiques différents. Le séquençage massif devrait donc être un outil diagnostique complétant l’analyse morphologique et immunohistochimique du pathologiste.

Déterminer les facteurs génétiques de prédisposition aux cancers

Le NGS a 2 applications prometteuses dans ce domaine. D’une part, il est possible que la demande de tests génétiques pour les prédispositions aux cancers du sein dépasse rapidement les capacités d’analyse des laboratoires, en raison de la probable sensibilité de ces patientes aux agents ciblant le défaut de réparation de l’ADN des tumeurs mutées pour BRCA1 ou BRCA2 (19, 20). D’autre part, le rendu des résultats est actuellement trop long pour être pris en compte dans le traitement de la tumeur primitive. Le remplacement des techniques actuelles par le NGS est un objectif majeur pour les laboratoires de génétique afi n d’augmenter le débit, de diminuer le coût et d’inclure d’autres gènes de prédisposition dont les mutations ont une très faible prévalence dans la population mais dont les conséquences sont proches de celles des mutations BRCA1 ou BRCA2 (comme BRIP1 et PALB2) [21]. Par ailleurs, le NGS a révolutionné l’identification des gènes responsables de maladies génétiques dont la rareté rendait difficile les approches clas-siques. Il est donc possible, par le séquençage de l’ADN constitutionnel d’un patient et, si possible, de ses apparentés ayant une association inhabituelle

de pathologies – y compris malignes –, d’identi-fier de nouvelles prédispositions génétiques aux cancers (22, 23).

Caractériser des biomarqueurs permettant le diagnostic précoce de la maladie métastatique

Les développements de la recherche de biomar-queurs sanguins témoignant de la maladie micro-métastatique et de la masse tumorale (liquid biopsy) sont intenses. Un de ces biomarqueurs est l’ADN tumoral circulant (ctDNA). L’ADN spécifique de la tumeur est reconnu par ses mutations ou rema-niements. Vu les faibles quantités d’ADN circulant et les difficultés d’amplifier spécifiquement un allèle porteur d’une simple mutation ponctuelle, une stratégie proposée consiste à rechercher des translocations non récurrentes mais spécifiques d’une tumeur par NGS (mate-paired library), ce qui permet ensuite de mettre au point des PCR très spécifiques de ces translocations, et donc utilisables à la recherche d’ADN tumoral circulant (24). Une autre approche utilisant le NGS pour le ctDNA porteur d’une mutation ponctuelle est de séquencer à très grande profondeur l’ADN circulant plasma-tique, et de déterminer le pourcentage de séquences mutées (25).

L’avenir

Alors que les performances de cette deuxième géné-ration de séquençage sont en croissance rapide, une troisième génération est déjà bien avancée dans les méthodologies et la mise sur le marché. La prochaine révolution est l’analyse de molécules uniques d’ADN, évitant la phase d’amplifi cation et promettant un nouveau saut quantitatif et qualitatif dans la longueur des courts fragments de séquence, la vitesse d’acquisition et la quantité de données. Les technologies font rêver : suivre l’incorporation de chaque nucléotide par la polymérase sur une matrice d’ADN en temps réel (Pacifi c Biosciences) ou faire passer un brin d’ADN dans un nanopore et en déduire sa séquence (Oxford Nanopore Techno-logies). La génération de longues séquences à partir d’une molécule unique aura un intérêt considérable pour le séquençage de novo, simplifi era la reconsti-tution des haplotypes et l’identifi cation des rema-niements chromosomiques constitutionnels ou acquis. Si ces technologies tiennent leurs promesses,

Page 9: Séquençage haut débit - edimark.fr · acquises lors de l’embryogenèse ou au cours de la transformation maligne. La caractérisation de ce ... Résumé Les techniques de séquençage

w w w . e d i m a r k . f rToute l’actualité

de votre spécialité sur

www.edimark.tv

Société éditrice : EDIMARK SAS

CPPAP : 0312 T 81579 – ISSN : 1165-113X

PÉRIODIQUE DE FORMATION

EN LANGUE FRANÇAISE

Mensuel Prix du numéro : 20 €

Vol. XXI - n° 5Mai 2012

l e c o u r r i e r d u s p é c i a l i s t e

12e édition

MISES AU POINTCancers du sein

Cancers du sein métastatiques

Anticorps conjugués

DOSSIER THÉMATIQUE

Éducation thérapeutique

Coordonné par Élisabeth Carola

ctlal

ma

w w w . e d i m a r k . f r

Toute l’actualitéde votre spécialité sur

www.edimark.tv

Société éditrice : EDIMARK SASCPPAP : 0312 T 81579 – ISSN : 1165-113X

PÉRIODIQUE DE FORMATION EN LANGUE FRANÇAISE

Mensuel Prix du numéro : 20 €

Vol. XXI - n° 6Juin 2012

l e c o u r r i e r d u s p é c i a l i s t e

12e édition

ÉDITORIAL

La médecine personnalisée : définition et historique

DOSSIER THÉMATIQUELa médecine personnalisée

Coordonnateur : Christophe Le Tourneau

1 abonnement papier donne accès 1 abonnement papier donne accès à plus de 20 revues et plus de 12 ans d’archiveà plus de 20 revues et plus de 12 ans d’archive

La Lettre du Cancérologue • Vol. XXI - n° 6 - juin 2012 | 303

DOSSIER THÉMATIQUE

1. Virchow R. Die Cellularpathologie in ihrer Begründung und in ihrer Auswirkung auf die physiologische und patho-logische Gewebelehre, Verlag A. Hirschwald, Berlin 1858.2. Sanger F, Air GM, Barrell BG et al. Nucleotide sequence of bacteriophage phi X174 DNA. Nature 1977;265:687-95.3. International Human Genome Sequencing Consortium. Finishing the euchromatic sequence of the human genome. Nature 2004;431(7011):931-45.4. Lander ES, Linton LM, Birren B et al. Initial sequencing and analysis of the human genome. Nature 2001;409 (6822): 860-921.

5. Margulies M, Egholm M, Altman WE et al. Genome sequencing in microfabricated high-density picolitre reac-tors. Nature 2005;437(7057):376-80.6. Shendure J, Ji H. Next-generation DNA sequencing. Nat Biotechnol 2008;26(10):1135-45.7. Stratton MR. Exploring the genomes of cancer cells: progress and promise. Science 2011;331(6024):1553-8.8. Pleasance ED, Cheetham RK, Stephens PJ et al. A compre-hensive catalogue of somatic mutations from a human cancer genome. Nature 2010;463(7278):191-6.

9. Pleasance ED, Stephens PJ, O’Meara S et al. A small-cell lung cancer genome with complex signatures of tobacco exposure. Nature 2010;463(7278):184-90.

10. Stephens PJ, McBride DJ, Lin ML et al. Complex lands-capes of somatic rearrangement in human breast cancer genomes. Nature 2009;462(7276):1005-10.

Références bibliographiques

L’auteur remercie Thomas Rio Frio et Élodie Manié pour leur relecture.

nous pouvons compter sur l’accessibilité à faible coût et à grande vitesse de séquences complètes des patients et de leurs tumeurs. Reste à stocker et, surtout, analyser la masse considérable de ces données, pouvoir les transférer pour le bénéfi ce du

patient et résoudre tous les problèmes éthiques qui, bien que non abordés ici, sont considérables (iden-tité, origine géographique, histoire familiale, gènes de susceptibilité ne concernant pas la pathologie traitée, etc.). ■

Au sommairedu prochain numéro : Dossier thématique : “Entretiens du groupe ‘Sein’ du 28 mars, consacrés à l’hormonothérapie dans le cancer du sein”Coordinatrice : Brigitte Sigal-Zafrani

»» Comment défi nit-on en 2012 une tumeur du sein hormonosensible ? (J.M. Guinebretière)

»» Les nouveaux traitements pour les cancers du sein RE+ (P. Cottu)

»» Traitements adjuvants : pour quelles indications et pour quelle durée ? (J.Y. Pierga)

»» Hormonothérapie dans les stades très précoces : rapport bénéfi ces/risques ? (A. Fourquet)

»» Hormonothérapie des cancers du sein métastasés : quels progrès ? (V. Diéras)

Cas clinique»» Les tumeurs HER2+++ sont-elles hormonosensibles ? (E. Brain)

Abonnez-vous p. 319Abonnez-vous p. 319ou surou sur www.edimark.frwww.edimark.fr

»»

Page 10: Séquençage haut débit - edimark.fr · acquises lors de l’embryogenèse ou au cours de la transformation maligne. La caractérisation de ce ... Résumé Les techniques de séquençage

304 | La Lettre du Cancérologue • Vol. XXI - n° 6 - juin 2012

DOSSIER THÉMATIQUELa médecine personnalisée Séquençage haut débit

11. Stephens PJ, Greenman CD, Fu B et al. Massive genomic rearrangement acquired in a single catastrophic event during cancer development. Cell 2011;144(1):27-40.12. The Cancer Genome Atlas Research Network : https://tcga-data.nci.nih.gov/tcga13. International Cancer Genome Consortium : www.icgc.org14. Guo G, Gui Y, Gao S et al. Frequent mutations of genes encoding ubiquitin-mediated proteolysis pathway compo-nents in clear cell renal cell carcinoma. Nat Genet 2011; 44(1):17-9.15. Pierron G, Tirode F, Lucchesi C et al. A new subtype of bone sarcoma defined by BCOR-CCNB3 gene fusion. Nat Genet 2012;44(4):461-6.16. Sanger Institute : www.sanger.ac.uk/genetics/CGP/cosmic/17. National Center for Biotechnology Information : www.ncbi.nlm.nih.gov/projects/SNP/

18. Gewinner C, Wang ZC, Richardson A et al. Evidence that inositol polyphosphate 4-phosphatase type II is a tumor suppressor that inhibits PI3K signaling. Cancer Cell 2009; 16(2):115-25.

19. Kaye SB, Lubinski J, Matulonis U et al. Phase II, open-label, randomized, multicenter study comparing the efficacy and safety of olaparib, a poly (ADP-ribose) polymerase inhibitor, and pegylated liposomal doxo-rubicin in patients with BRCA1 or BRCA2 mutations and recurrent ovarian cancer. J Clin Oncol 2012;30(4): 372-9.

20. Silver DP, Richardson AL, Eklund AC et al. Efficacy of neoadjuvant cisplatin in triple-negative breast cancer. J Clin Oncol 2010;28(7):1145-53.

21. Walsh T, Lee MK, Casadei S et al. Detection of inhe-rited mutations for breast and ovarian cancer using

genomic capture and massively parallel sequencing. Proc Natl Acad Sci USA 2010;107(28):12629-33.22. Testa JR, Cheung M, Pei J et al. Germline BAP1 mutations predispose to malignant mesothelioma. Nat Genet 2011; 43(10):1022-5.23. Wiesner T, Obenauf AC, Murali R et al. Germline muta-tions in BAP1 predispose to melanocytic tumors. Nat Genet 2011;43(10):1018-21.24. McBride DJ, Orpana AK, Sotiriou C et al. Use of cancer-specific genomic rearrangements to quantify disease burden in plasma from patients with solid tumors. Genes Chromo-somes Cancer 2010;49(11):1062-9.25. Kinde I, Wu J, Papadopoulos N, Kinzler KW, Vogels-tein B. Detection and quantification of rare mutations with massively parallel sequencing. Proc Natl Acad Sci USA 2011; 108(23):9530-5.

Références bibliographiques (suite de la p. 303)