« Le NGS pour les nuls - Accueil - MaRIH...2019/12/03 · « Le NGS pour les nuls » Les neutropénies ongénitales à l’ère du NGS Juin 2019 Christine Bellanné-Chantelot Département

« Le NGS pour les nuls » Les neutropénies congénitales à l’ère du NGS

Juin 2019

Christine Bellanné-Chantelot

Département de Génétique, Hôpital Pitié-Salpétrière

UMR1170, Gustave Roussy, Villejuif

2

Du Sanger au NGS : une révolution technologique

1977 2005

1998

NGS Séquençage nouvelle génération

Séquençage à haut débit Séquençage massif parallèle

2004

3

NGS : un changement d’échelle

Séquençage nouvelle génération

101 102 103 104 105 106 107 108 109 pb 100

Exons Quelques dizaines de pb à quelques kb

Gènes Kb à 2 Mb

Chromosomes humains 50 à 250 Mb

Génome humain 3200 Mb

Séquençage Sanger

Nucléotide

NGS

4

2003 Séquençage du génome

humain Sanger

3 milliards $, 13 ans

2008 Séquençage d’un génome

humain NGS

1 million $, 2 mois

2017 Séquençage d’un génome

humain NGS

1000 $, 2 jours

5

Les applications du NGS

ARN

ARN immuno- précipité

ARNm ARN non codant

miARN

ADN

Génome entier

ADN codant

ADN immuno- précipité

ADN méthylé

Séquençage de novo

Reséquençage

Interactions ADN/protéines

Méthylation de l’ADN

Interactions ARN/protéines

Séquençage de l’ARN

Exome-Seq Target-Seq

ChIP-Seq MeDIP-Seq Bisulfite-Seq

CLIP-Seq Small RNA-Seq

RNA-Seq Genome -Seq

6

Les 5 étapes du NGS

1. Préparation Librairie

2. Amplification clonale

3. Séquençage

4. Analyse bio-informatique

5. Interprétation biologique

La librairie



3. Séquençage



Multiplexage d’échantillons

Code-barre

L’enrichissement en régions d’intérêts



3. Séquençage



Panel de gènes, Exome

L’enrichissement par capture



3. Séquençage



Génome

Panel de gènes, Exome

Le séquençage



3. Séquençage



Ion torrent ThermoFisher

Solexa Illumina

Chimie Illumina (Solexa)

Flow cell Formation des «clusters» pour séquençage

L’analyse bio-informatique des données



3. Séquençage






3. Séquençage



1. Détermination de la séquence « Base calling » (Fastq)

2. Alignement de la séquence sur le génome de référence « Mapping » (BAM/SAM)

3. Détection des variants « Variant calling » (VCF)

4. Annotation des variants (VCF)

5. Filtrage des variants




3. Séquençage



1. Détermination de la séquence « Base calling » (Fastq)





• Scores de qualité « QC Metrics » Séq. Brutes Séquences utiles globalement ➣ Eliminer duplicats de PCR, off target

• Attribuer index (dé-multiplexage)



2. Amplification

clonale

3. Séquençage



1. Détermination de la séquence « Base calling » (FASTQ)





Deux paramètres essentiels ➣ Profondeur de lecture ➣ Couverture de séquence

• Scores de qualité « QC Metrics » Séq. Brutes Séquences utiles globalement ➣ Eliminer duplicats de PCR, off target

• Attribuer index (dé-multiplexage)

Lecture (Read)

Profondeur (en X) Nombre de lectures couvrant une base

Deux impératifs de qualité de séquence

Exigences : Variant germinal : 100 % couverture avec une profondeur > 20X Variant somatique : profondeur > 1000X pour détecter un variant à 1%

Couverture % de bases séquencées par des lectures indépendantes / Nbre total de bases de la région

18

GATA2

L’analyse des données



3. Séquençage








➣ Associer à chaque variant des données sur • gène / transcrit (s) • Fréquence du variant dans les bases de données • Effet sur la protéine, sur l’épissage • Prédictions de scores de pathogénicité

L’analyse des données



3. Séquençage







5. Filtrage / « priorisation » des variants

Défi : nombre et interprétation des variants

Panel de gènes Neutropénies

39 23 000

Exome Génome

15 000-20 000

60

Nb gènes

Nb variants

3 000 000-4 000 000 Variant(s)

responsable(s)

Défi : nombre et interprétation des variants

Les risques Si critères de filtre

Trop stringents

Risque de faux-négatifs

Trop permissifs Trop de variants à évaluer

Expertise clinico-biologique

Exclusion des variants fréquents dans les

populations contrôles

Variants affectant la séquence protéique

Prédictions en faveur d’une pathogénicité

Mode de transmission

Variant(s) pathogène (s)

Aide à l’interprétation des variants

Richards et al, Recommendations ACMG, 2015

Données épidémiologiques Bases de données de populations

Effet du variant sur la fonction

de la protéine Nature du variant nucléotidique Prédictions in silico de pathogénicité Données fonctionnelles

Ségrégation familiale Phénotypes

Base gnomAD 120 000 exome+génomes

Aide à l’interprétation des variants

Données épidémiologiques Bases de données de populations

Effet du variant sur la fonction

de la protéine Nature du variant nucléotidique Prédictions in silico de pathogénicité Données fonctionnelles

Ségrégation familiale Phénotypes

Richards et al, Recommendations ACMG, 2015

Comparaison de l’interprétation inter-laboratoire

• 9 laboratoires américains • Interpréter 99 variants

Amendola et al, Am J Hum Genet , 2016

Concordance 34% quand comparaison inter-laboratoire de l’interprétation

Après discussions, concordance 71% ➣ réduction des discordances de 66% à 29%

Complexité du diagnostic : variants de signification inconnue

➣ non transmis

➣ rendu au clinicien

Variants dont la pathogénicité est incertaine jusqu’à une étude plus approfondie

+ ségrégation familiale + arguments cliniques + arguments fonctionnels

classification évolutive

Complexité du diagnostic : variants de signification inconnue

Impacts sur les stratégies diagnostiques

I. Analyse ciblée Panel de gènes

IIa. Analyse globale Exome

IIb. Analyse globale Génome

23 000 gènes- 1,5% génome

Altérations exoniques de gènes connus

Identification de nouvelles altérations exoniques

Nouveaux types d’altérations génétiques

(variants structuraux, variants introniques profonds, de régions

régulatrices, …)

Recherche Diagnostic

Trio Solo

• Coût du séquençage

• Volume de stockage des données

• Analyse bioinformatique plus complexe

29

De l’exome au Génome

• Pas d’étape d’enrichissement

• Pas (peu) de régions non couvertes

• Homogénéité de la profondeur de lecture

• Améliore détection des CNV

Avantages Limites

Limites inhérentes au NGS 2nde génération

Variants non (mal) détectés par NGS Expansions de triplets Variants de structure

Pseudogènes : difficultés pour l’alignement SBDS : 98% homologie avec pseudogène

Régions difficiles à capturer /amplifier Régions riches en GC

Futur : Séquenceurs de 3ème et 4ème génération

Séquençage en temps réel sur molécule unique sans amplification Séquençage long read

• ADN

– Séquençage des régions riches en GC

– Séquençage des régions répétées

Distinction gène / pseudogène

Séquençage d’expansions

– Détection des variants de structure

– Reconstruction d’haplotypes

• ARN

– Séquençage des longs ARN sur même read

Impacts du NGS sur le diagnostic des neutropénies congénitales

33

Contexte

• Entités très rares : 1-2 /100 000

• Hétérogénéité clinique

• Hétérogénéité génétique : environ 30 gènes

Avec blocage maturation

Monocytopénie

Surdité

Thrombopénie

Pancréas

Coeur

Appareil uro-génital

os

Inf. non bactériennes

Peau

Tractus digestif

Sans blocage maturation

SNC

Muscle

Dysmorphie

Autosomique dominant, autosomique recessif, lié à l’X

La stratégie diagnostique

NGS sur panel ciblé

Orientation clinique

1 ou 2 gènes majeurs Et de « petite taille »

(Shwachman, WHIM, GATA2)

Séquençage Sanger « ciblé »

+ -

+ Whole exome

Variant causal

-

RCP -

• Gènes d’utilité clinique Implication dans la physiopathologie démontrée Gènes « actionnables »

• Gènes associés à des entités syndromiques présentation atypique Variants à pénétrance incomplète

• Gènes associés à des phénotypes chevauchants

• Gènes identifiés dans le cadre d’exomes Souvent inclus en pratique pour affirmer l’implication d’un gène Mais résultat rendu uniquement si étude fonctionnelle

Discussions généticiens / cliniciens / CRMR – Filières

Panels évolutifs

36

Quels gènes inclure dans les panels ?

Résultats de l’analye NGS

18 20 28 30 36 39

2015 2016 2016 2017 2018 2019

13%

19%

Variants pathogènes (classe 4, 5)

Variants de signification inconnue

Non

résolus

Nb gènes

17 gènes

6 gènes (35%) : 1 seul cas identifié

Découverte fortuite entité syndromique (20%)

• 454 patients (2015 – Mai 2019) – Porte d’entrée « neutropénie chronique »

ELANE

CSF3R

CXCR2

SRP54 TCIRG1

SBDS

G6PC3

GATA2

HAX1

JAGN1 GFI1

EFL1

GINS1

Gène X VPS13B

EIF2AK3 THPO

Résolus

Rendu et suivi des VSI

0%

20%

40%

60%

80%

100%

Classe 4/5 VSI

13%

19%

Résultat : « aucun variant clairement pathogène » Commentaire : « identification d’un VSI »

Poursuivre l’investigation génétique

• Analyse de ségrégation familiale

Discuter les résultats avec les cliniciens

• Arguments cliniques additionnels ?

Poursuivre avec une investigation fonctionnelle

• Conséquence sur le transcrit

• Conséquence sur la fonction de la protéine

COMPTE RENDU

Non

résolus

39

Du panel ciblé à l’exome

WES

30% * *

* trio *

* *

*

*

*

*

10 5 4

21% (4)

52% (10)

16% (3)

11% (2)

Gènes d’entités syndromiques (TAZ, CLPB)

Gènes d’entités chevauchantes (RTEL1, CARD11)

• SRP54 (5 familles) • 5 nouveaux gènes – 1 cas identifié / gène

Non résolus

Registre Neutropénies

Adapté de Bluteau et al, Blood, 2018

GINS1

CARD11

TAZ

CLPB

VPS13B

Du panel ciblé au panel virtuel sur exome

41

En conclusion

Vers une harmonisation des tests diagnostiques Panel de gènes ➣ Panel virtuel /exome / Génome Phase de transition en termes de développements technologiques

Complexité du diagnostic par NGS : le nombre et l’interprétation des variants Interprétation sur un faisceau d’arguments Interprétation évolutive des variants Discuter les résultats avec les cliniciens et les laboratoires « experts »

du gène Difficultés de poursuivre les analyses (études familiales, tests

fonctionnels) pour tous les variants et gènes « privés »

Diagnostic des neutropénies congénitales par NGS Augmentation du taux diagnostique Ré-évaluation de la fréquence des gènes Découverte fortuite d’entités syndromiques, entités chevauchantes

Hôpital Pitié-Salpétrière

Département de Génétique

Julien Buratti

Florence Bellanger

Séverine Clauin

Gwendoline Leroy

Gustave Roussy, Villejuif

INSERM U1170

Isabelle Plo

Caroline Marty

Barbara Schmaltz-Panneau

Hôpital Saint-Antoine

Laboratoire d’Hématologie

François Delhommeau

Pierre Hirsch

Hôpital Trousseau, Paris

CRMR Neutropénies Chroniques

Jean Donadieu

Blandine Beaupain

Hélène Lapillonne

Hôpital Robert Debré

Laboratoire d’Hématologie

Odile Fenneteau

Sorbonne Université, Paris

CNRS UMR7590

Isabelle Callebaut

Tous les cliniciens des services d’Hématologie

Institut Imagine

UMR1163

Patrick Revy

Université Paris-Saclay

UMR996

Françoise Bachelerie

Documents

« Le NGS pour les nuls - Accueil - MaRIH...2019/12/03 · « Le NGS pour les nuls » Les neutropénies ongénitales à l’ère du NGS Juin 2019 Christine Bellanné-Chantelot Département