80
Biologie Moléculaire et Médecine; Kaplan et Delpech; Flammarion « How to sequence a genome » (film): www.genome.gov/25019885 Human Genome Project: http://www.genome.gov/HGP/ Organisation du Génome humain Notions essentielles Analyses génomiques en pathologie humaine Problématiques des études moléculaires en génétique humaine Biologie Moléculaire et Médecine; Kaplan et Delpech; Flammarion Human Genome Variation Society: www.hgvs.org Nomenclature mutationnelle: www.hgvs.org/mutnomen Analyse de variants faux-sens: http://genetics.bwh.harvard.edu/pph/ Analyse de l’effet de variants de séquence sur l’épissage: www.umd.be/HSF/ Bases de données: Bases de données « locus-spécifiques » Listing disponible site HGVS www.hgvs.org/dblist/glsdb.html Bases de données « centrales/globales » Human Gene Mutation Database www.hgmd.org SNP database www.ncbi.nlm.nih.gov/SNP/ UCSC Genome Browser genome.ucsc.edu Ensembl www.ensembl.org Dr. Martin Krahn [email protected] Département de Génétique Médicale Hôpital Timone Enfants INSERM UMR 910 - Faculté de Médecine Université de la Méditerranée Marseille

M krahn organisation_genome_et_analyses_genomiques_2009

Embed Size (px)

DESCRIPTION

 

Citation preview

Page 1: M krahn organisation_genome_et_analyses_genomiques_2009

Biologie Moléculaire et Médecine; Kaplan et Delpech ; Flammarion« How to sequence a genome » (film): www.genome.gov/250 19885Human Genome Project: http://www.genome.gov/HGP/

Organisation du Génome humainNotions essentielles

Analyses génomiques en pathologie humaineProblématiques des études moléculaires en génétique h umaine

Biologie Moléculaire et Médecine; Kaplan et Delpech ; FlammarionHuman Genome Variation Society: www.hgvs.orgNomenclature mutationnelle: www.hgvs.org/mutnomenAnalyse de variants faux-sens: http://genetics.bwh. harvard.edu/pph/Analyse de l’effet de variants de séquence sur l’ép issage: www.umd.be/HSF/Bases de données:

Bases de données « locus-spécifiques »� Listing disponible site HGVS

www.hgvs.org/dblist/glsdb.html

Bases de données « centrales/globales »� Human Gene Mutation Database www.hgmd.org� SNP database www.ncbi.nlm.nih.gov/SNP/� UCSC Genome Browser genome.ucsc.edu� Ensembl www.ensembl.org

Dr. Martin [email protected]épartement de Génétique MédicaleHôpital Timone EnfantsINSERM UMR 910 - Faculté de MédecineUniversité de la MéditerranéeMarseille

Page 2: M krahn organisation_genome_et_analyses_genomiques_2009

Organisation du Génome humainNotions essentielles

Martin Krahn

[email protected]épartement de Génétique Médicale

Hôpital Timone EnfantsINSERM UMR 910 - Faculté de Médecine

Université de la MéditerranéeMarseille

Page 3: M krahn organisation_genome_et_analyses_genomiques_2009

Organisation du Génome humainNotions essentielles

Quelques rappels historiques

Séquençage du Génome humain

Organisation du Génome humain

M. KRAHN M2 2009

Page 4: M krahn organisation_genome_et_analyses_genomiques_2009

Génome

= ensemble du matériel génétique d'une espèce (ADN)

≠ ensemble des gènes !!!

!

M. KRAHN M2 2009

Page 5: M krahn organisation_genome_et_analyses_genomiques_2009

Pourquoi cartographier le génome ?

� Clonage positionnel : identification de gènes par exploration du génome suivant un balisage de marqueurs

� Médecine:pour localiser les loci morbides, associés à des maladies héréditaires, voire pour appréhender les maladies multifactorielles

� Depuis les premières cartes, plus de 2500 gènes impliqués dans des syndromes héréditaires ont été identifiés (OMIM, sept.2009)

Cette phase est suivie d’exploration thérapeutique(voir site essais cliniques AFM)

� Agronomie:pour localiser et cloner les gènes d’intérêt ou les zones du génome impliquées dans des traits intéressants et les transférer entre espèces…

�Bond des biotechnologies végétales, clonage, OGM…M. KRAHN M2 2009

Page 6: M krahn organisation_genome_et_analyses_genomiques_2009

Histoire

• De l’Antiquité au 19e siècle : transmission de caractères parents-enfants selon diverses théories: préformisme, animalculisme, patroclinisme, ovisme, épigénisme…

• 1865: G. Mendel jette les bases de la génétique moderne, allèles, dominance, hétérozygotie…

• 1910: T. Morgan découvre la recombinaison méiotique et publie ses résultats qui sont les bases de la théorie chromosomique de l’hérédité

• 1913: première carte génétique

M. KRAHN M2 2009

Page 7: M krahn organisation_genome_et_analyses_genomiques_2009

Histoire

• 1953: J. Watson, F. Crick et R. Franklin décryptent des clichés de diffraction et publient la structure en double hélice de l’ADN

• 1965: J. Monod, F. Jacob et A. Lwoff « découvrent » les ARN et la régulation de l’expression génique

• 1973: moratoire sur le clonage et le génie génétique

M. KRAHN M2 2009

Page 8: M krahn organisation_genome_et_analyses_genomiques_2009

Histoire

• Années 1980 : découverte des marqueurs polymorphiques, des techniques de RFLP, des microsatellites, grands progrès du génie génétique. Cartographie intensive

• 1983: découverte de la PCR. Les cartes s’enrichissent de toutes ces techniques

• 1989: un programme mondial de séquençage du génome humain se met en place : HUGO

• 1992-1996: publication des premières cartes du génome humain par le Généthon

M. KRAHN M2 2009

Page 9: M krahn organisation_genome_et_analyses_genomiques_2009

Histoire

• 2000: premiers résultats de thérapie génique sur l’homme (Fischer)

• 2001: premier assemblage de la séquence du génome humain (Science 291, Nature 409)

• 2003: finition de l’assemblage de notre séquence génomique

CELERA

HUGO-HGP

M. KRAHN M2 2009

Page 10: M krahn organisation_genome_et_analyses_genomiques_2009

HUGO – Human Genome Project

• Plus grand projet scientifique mondial lancé en 1988 /1989 HGP démarre en 1990

• Ampleur de la tâche– 1 page = 3000 bases– 1 tome: 500 pages = 1 500 000 bases– 1 génome = 1 000 tomes !!!

• Capacité de séquençage– En 1975, 1 000 nucléotides/semaine ���� 500 ans pour 100 personnes !– En 1986, 10 000 nucléotides/jour ���� 8 ans pour 100 machines– En 1998, 200 000 nucléotides/jour ���� 5 mois pour 100 machines

• Stratégie du Human Genome Projectvs Stratégie de CELERA Genomics

M. KRAHN M2 2009

Page 11: M krahn organisation_genome_et_analyses_genomiques_2009

HGP / CeleraHUGO - HGP CELERA

M. KRAHN M2 2009

Page 12: M krahn organisation_genome_et_analyses_genomiques_2009

Séquence finale

• CELERA: Seuls 2 ADN ont servi de matrice (dont celui de C. Venter). Celera a intégré les données publiques dans sa base au fur et à mesure de leur publication

• HGP: profondeur de séquence: 10X (10 équivalents génomiques séquençés) à partir de près d'une vingtaine d'individus différents

• Travail de "finition" poursuivi jusqu'en avril 2003

• Précision finale: 99.99 % = 1 erreur toutes les 10 000 bases environ

• Coût global: environ 2.7 milliards $

• Parties manquantes: hétérochromatine, télomères et centromèresM. KRAHN M2 2009

Page 13: M krahn organisation_genome_et_analyses_genomiques_2009

Coûts de séquençage

M. KRAHN M2 2009

Page 14: M krahn organisation_genome_et_analyses_genomiques_2009

Organisation du génome humain

1/3 2/3

<3% code des protéines

>50% séquences répétéesM. KRAHN M2 2009

Page 15: M krahn organisation_genome_et_analyses_genomiques_2009

Le génome humain

• Le génome humain est composé de 3 272 millions de nucléotides

• Les régions riches en gènes sont également les régions riches en nucléotides G/C

• Les régions pauvres en gènes sont riches en A/T

Ces différentes régions peuvent généralement être visuali séescomme des bandes claires ou sombres sur les chromosomes métaphasiques (" banding ")Bandes G: riches en AT, pauvres en gènesBandes R: riches en GC, riches en gènes

• Le chromosome 1 contient le plus grand nombre de gèn esestimés (environ 3000) tandis que le chromosome Y en a le moins (231)

• Moins de 3% de l’ADN code pour des protéines

• Les séquences répétées composent environ 50% de la to talité dugénome

M. KRAHN M2 2009

Page 16: M krahn organisation_genome_et_analyses_genomiques_2009

Le génome humain

• Le nombre total de gènes se situe entre 25 000 et 30 000

• La taille moyenne d’un gène est de 3000 bases, 9 exons, mais la taille varie beaucoup

(ex : le gène de la dystrophine a une taille de 2,4 mill ions bp)

• 99.9% des nucléotides sont identiques entre deux personne s. Il existe donc 0,1% de différences (soit environ 3,5 mill ions de

différences par génome)

• Plus de 50% des gènes ont une fonction inconnue

M. KRAHN M2 2009

Page 17: M krahn organisation_genome_et_analyses_genomiques_2009

Organisation du GénomeVitesse de réassociation du génome

On dénature l'ADN par chauffage

On mesure la vitesse de réhybridation

L'ADN d'E. coli se réhybride suivant une courbe sigmoïde simple

���� quand un fragment d'ADN trouve son fragment complémentaire, les séquences adjacentes se réhybrident rapidement de façon coopérative , comme une fermeture éclair

M. KRAHN M2 2009

Page 18: M krahn organisation_genome_et_analyses_genomiques_2009

Vitesse de réassociation du génome

% de réhybridation

0

25

50

75

100

Vitesse de réassociation

10-1 1 101 10210-2

Rapide Lente

E. ColiH. Sapiens

1

3

2

M. KRAHN M2 2009

Page 19: M krahn organisation_genome_et_analyses_genomiques_2009

Le génome est hétérogène

• Zones fortement répétitives���� 10 à 15% du génome, non codées en protéinesCentromères, Télomères, Mégasatellites, Minisatéllites, Microsatellites

• Zones moyennement répétitives���� 20 à 40 % du génome, non codées en protéines Transposons, séquences SINE (Alu) et LINE, Rétrovirus endogènesQuelques gènes codant des rRNA, tRNA, RNA5S et 7SL

• Séquences uniques���� ~50% du génome, contiennent la plupart des gènes codant pour des protéines (ARNm)

M. KRAHN M2 2009

Page 20: M krahn organisation_genome_et_analyses_genomiques_2009

Les zones répétitives

Les minisatellites ou VNTR (Variable Numbers of Tandem Repeats): - séquences de 11 à 16 pb- répétées parfois jusqu'à 1000 fois- Localisations surtout télomériques (ou centromériqu es) - peu utilisés en pratique

Les microsatellites - séquences de 1 à 4 pb- souvent (CA) n, n variant de 12 à 40. - répartition homogène sur tout le génome, tous les 25 à 100 kb- très variables donc informatifs- facilement amplifiés par PCR - utilisation pour les analyses de liaison- utilisation en diagnostic moléculaire (« indirect ») et pour les empreintes génétiques

M. KRAHN M2 2009

Page 21: M krahn organisation_genome_et_analyses_genomiques_2009

Marqueurs génétiques

• Les MARQUEURS génétiques:Variations polymorphes de la séquence d’ADN

- répartis uniformément sur le génome- localisation connue- PAS d’effet direct sur le phénotype

• Microsatellites (utilisés ++) :Polymorphismes de répétitionExple: répétitions de motif « CA »- séquences répétées NON codantes- réparties uniformément dans le génome- polymorphes = à un même endroit du génome, des indi vidus

pris au hasard (pop.gén.) présentent un nombre différent de répétitions sur chaque chrom osome

…ATCGTCTCACACACACACACACATGTCGTAT…

…ATCGTCTCACACACACACACACACACACACATGTCGTAT…

8 répétitions CA

12 répétitions CA

Exemple: chromosome 4

ADNMarqueur

Gène

M. KRAHN M2 2009

Page 22: M krahn organisation_genome_et_analyses_genomiques_2009

Et maintenant ?

M. KRAHN M2 2009

Page 23: M krahn organisation_genome_et_analyses_genomiques_2009

Et maintenant ?

M. KRAHN M2 2009

Page 24: M krahn organisation_genome_et_analyses_genomiques_2009

Et maintenant ?

M. KRAHN M2 2009

Page 25: M krahn organisation_genome_et_analyses_genomiques_2009

Et maintenant ?

Clonage positionnel révolu – gènes localisés

Agronomie dopée – OGM par analyse QTL

Catalogue des gènes: GenAtlas, OMIM, Genome Browser, bases de

données de SNP, de miARN…

Séquençage en masse d'autres organismes

���� Cartes de synténie inter-espèces, évolution

Séquençage personnalisé possible

Nouvelles technologies mêlant bioinformatique, robo tique et

nanobiologie…

Thérapie génique, pharmacologique ou cellulaire uti lisant les

données acquises…

M. KRAHN M2 2009

Page 26: M krahn organisation_genome_et_analyses_genomiques_2009

Analyses génomiques en pathologie humaine

M. KRAHN M2 2009

Page 27: M krahn organisation_genome_et_analyses_genomiques_2009

Anomalies du Génome et Pathologie humaine

MACROLESIONS MICROLESIONS

Echelle du Chromosome Echelle du Gène

?

M. KRAHN M2 2009

Page 28: M krahn organisation_genome_et_analyses_genomiques_2009

Anomalies du Génome et Pathologie humaine

MACROLESIONS MICROLESIONS

� Délétions

� Duplications

� Amplifications

� Translocations

� Inversions

� Insertions

(...)

Echelle du Chromosome Echelle du Gène

� Mutations ponctuelles

� Insertions/délétions

de qques nucléotides

� Insertions/délétions

de qques 10aines ou 100aines de nt

� Mutations dynamiques/amplifications

(...)

Maladies génétiques: anomalies génétiques causalesMaladies polyfactorielles: prédisposition génétique

M. KRAHN M2 2009

Page 29: M krahn organisation_genome_et_analyses_genomiques_2009

Anomalies du Génome et Pathologie humaine

MACROLESIONS MICROLESIONS

Echelle du Chromosome Echelle du Gène

METHODES D’ANALYSE

?

M. KRAHN M2 2009

Page 30: M krahn organisation_genome_et_analyses_genomiques_2009

Anomalies du Génome et Pathologie humaine

MACROLESIONS MICROLESIONS

Echelle du Chromosome Echelle du Gène

METHODES D’ANALYSECARYOTYPE

FISH

CGH

SEQUENCAGE

CRIBLAGE MUTATIONNEL

M. KRAHN M2 2009

Page 31: M krahn organisation_genome_et_analyses_genomiques_2009

Rappel: Mutations « classiques »

Mutations en séquence non codante:

perturbations d‘éléments régulateurs

mutations perturbant l‘épissage

CAAT5´ 3´

Région 5´UTR

Exon Intron

TATA ATG

Région 3´UTR

TAATAGTGA

AATAAA

Mutations en séquence codante:

faux sens

non sens

insertions/délétions

décalage du cadre de lecture

mutations perturbant l‘épissage

=> perte/gain de fonction

GT AGSite donneur Site accepteur

M. KRAHN M2 2009

Page 32: M krahn organisation_genome_et_analyses_genomiques_2009

Problématiques des études moléculaires en génétique humaine

• Stratégies de Diagnostic génétique

• Problèmes d’interprétation de données mutationnelle s

• Perspectives de criblage mutationnel à haut débit

M. KRAHN M2 2009

Page 33: M krahn organisation_genome_et_analyses_genomiques_2009

Les avancées méthodologiques qui ontrévolutionné la génétique moléculaire

1970: Endonucléases de restriction1972-1973: Ligases1975: Séquençage (Sanger&Coulon, Maxam&Gilbert, Hood )1985: PCR (Karry Mullis)1998: Puces à ADN (“microarrays”)Années 1990 à aujourd’hui: Développement +++ de nouvel les techniques

Les applications/progrès réalisées grâce aux technique s de Biologie moléculaire:• Meilleure connaissance des mécanismes physiopathologiq ues des maladies:

- Identification et études fonctionnelles de gènes impl iqués dans des maladies humaines, création et analyse de modèles anim aux, séquençage du génome humain,,…

• Généralisation des applications diagnostiques en routine hospitalièreM. KRAHN M2 2009

Page 34: M krahn organisation_genome_et_analyses_genomiques_2009

ADN

GénomeARN

Transcriptome

Protéines

Protéome

Transcription Traduction

Reverse Transcription

Réplication

Analyses génétiques/ Biologie moléculaire Biochimie

Principes des Études Moléculaires en Génétique Humaine

M. KRAHN M2 2009

Page 35: M krahn organisation_genome_et_analyses_genomiques_2009

ADN

GénomeARN

Transcriptome

Protéines

Protéome

Analyses génétiques/ Biologie moléculaire Biochimie

En principe identiquepour toutes les cellules d’un individu

Spécifiques d’un tissud’un type cellulaired’un état

Principes des Études Moléculaires en Génétique Humaine

M. KRAHN M2 2009

Page 36: M krahn organisation_genome_et_analyses_genomiques_2009

ADN

GénomeARN

Transcriptome

Protéines

Protéome

En principe identiquepour toutes les cellules d’un individu

Spécifiques d’un tissud’un type cellulaired’un état

Prélèvement de « base »en Génétique= prélèvement sanguinpériphérique

Extraction d’ADN génomique à partir de LYMPHOCYTES du sang

Analyses en Génétique moléculaire:Directes ou Indirectes

Autres prélèvements:•Tissus embryonnaires/fœtaux(villosités choriales, liquide amniotique,…) pour DPN• Autres tissus : analyses complémentaires dans certaines pathologies (surtout analyses d’expression du ARNm)

ATTENTION:Toujours avec CONSENTEMENT de l’individu

Principes des Études Moléculaires en Génétique Humaine

M. KRAHN M2 2009

Page 37: M krahn organisation_genome_et_analyses_genomiques_2009

Notions essentielles

• Stratégies de Diagnostic génétique- Diagnostic direct vs indirect- Précriblage mutationnel

• Problèmes d’interprétation de données mutationnelle s- Bases de données mutationnelles- Variants « nouveaux » => recueil d’arguments de pathogén icité- Outils bioinformatiques ++

• Perspectives de criblage mutationnel à haut débit

M. KRAHN M2 2009

Page 38: M krahn organisation_genome_et_analyses_genomiques_2009

Stratégie diagnostique dans les maladies génétiques

CONSULTATION DIAGNOSTIQUE:Interrogatoire et examen clinique Histoire de la maladie

Arbre généalogique/mode de transmissionExamen clinique cibléExamen clinique général

EXAMENS COMPLEMENTAIRES:

Analyses biologiques selon le contexte

Imagerie

Examens ciblés selon orientation

� DIAGNOSTIC CLINIQUE

M. KRAHN M2 2009

Page 39: M krahn organisation_genome_et_analyses_genomiques_2009

Stratégie diagnostique dans les maladies génétiques

CONSULTATION DIAGNOSTIQUE:Interrogatoire et examen clinique Histoire de la maladie

Arbre généalogique/mode de transmissionExamen clinique cibléExamen clinique général

EXAMENS COMPLEMENTAIRES:

Analyses biologiques selon le contexte

Imagerie

Examens ciblés selon orientation

� DIAGNOSTIC CLINIQUE ⇒⇒⇒⇒ DIAGNOSTIC GENETIQUE

ANALYSES GENETIQUES:

Génétique moléculaire:Diagnostic direct: Recherche de l’anomalie génétiqu e primaireDiagnostic indirect: Analyses de liaison

Cytogénétique:Caryotype

constitutionnel standardFISH,… (Cf cours)

M. KRAHN M2 2009

Page 40: M krahn organisation_genome_et_analyses_genomiques_2009

Diagnostic moléculairedes maladies génétiques

� Objectif : établir un diagnostic précis par l’identification de l’anomalie génétique

� Intérêt : certitude diagnostiqueprise en charge adaptée

conseil génétique

� 2 approches :

DIAGNOSTIC DIRECT: Recherche de l’anomalie génétique primaire

� identification de Mutations constitutionnelles délétères

DIAGNOSTIC INDIRECT: Analyses de liaison

� Utilisation de marqueurs pour analyser la coségrégation d’un

phénotype avec un allèle particulier dans une famille

M. KRAHN M2 2009

Page 41: M krahn organisation_genome_et_analyses_genomiques_2009

ADN du patient en faible quantité

Région d’intérêtPCR Région d’intérêt

AMPLIFIEE en grande quantité

Analyse de la TAILLE� Applications diverses� Analyse de Microsatellites

ANALYSEde la région d’intérêt

Analyse de la SEQUENCE� Recherche de MUTATIONS

dans la région d’intérêt

Gène de 3 exons

Exon 1

Exon 2

Exon 3

Rappel: le rôle central de la PCR

M. KRAHN M2 2009

Page 42: M krahn organisation_genome_et_analyses_genomiques_2009

Séquençage complet

Mutation ponctuelle

Exon 1

Exon 2

Exon 3Gène de 3 exons

PRECRIBLAGE puis Séquençage ciblé

Mutation ponctuelle

Exon 1

Exon 2

Exon 3

Profil NORMAL

Profil NORMAL

Profil ANORMAL

- Différentes technologies: SSCP, DHPLC, HRM,…- Intérêt: détecter les exons porteurs d’une variati on de séquence

=> réduction du temps d’analyse et des coûts

M. KRAHN M2 2009

Page 43: M krahn organisation_genome_et_analyses_genomiques_2009

Diagnostic direct et Diagnostic indirect

Patient atteintPhénotype: diagnostic cliniqueOu suspicion diagnostique

Analyses en Génétique moléculaireDIAGNOSTIC DIRECT

Forw.

CAACANNNNNNNNNNNNN

Identification de mutation(s) dans le gène impliqué

Patient atteintPhénotype: diagnostic clinique(certitude diagnostique nécessaire)

Analyses en Génétique moléculaireDIAGNOSTIC INDIRECT

105 113

105 115

113 115

105 115

Coségrégation familiale phénotype/marqueurM. KRAHN M2 2009

Page 44: M krahn organisation_genome_et_analyses_genomiques_2009

Utilisation de marqueurs pour analyser la coségrégation marqueur/maladie

• on connaît la localisation du gène morbide• on connaît des marqueurs localisés à proximité• étude de la Coségrégation familiale phénotype/marqueur

Diagnostic indirect

Patient atteintAvec Diagnostic clinique CERTAIN

Analyses en Génétique moléculaireDIAGNOSTIC INDIRECT

Coségrégation familiale phénotype/marqueur

105 113

105 115

113 115

105 115

Gène morbide

Marqueur

Permet de suivre INDIRECTEMENT la transmission d’une mutation

M. KRAHN M2 2009

Page 45: M krahn organisation_genome_et_analyses_genomiques_2009

Utilisation de marqueurs pour analyser la coségrégation marqueur/maladie

• on connaît la localisation du gène morbide• on connaît des marqueurs localisés à proximité• étude de la Coségrégation familiale phénotype/marqueur

Diagnostic indirect

Gène morbide

Marqueur

Permet de suivre INDIRECTEMENT la transmission d’une mutation

� Approche utilisée quand diagnostic direct non faisa ble, trop difficile…� Principaux problèmes posés:

- nécessite de connaître le gène impliqué (ou le locu s) pour choisir les marqueurs à utiliser

(problème posé si hétérogénéité génétique)- nécessite une certitude du diagnostic clinique- nécessite une étude FAMILIALE- nécessite une famille « informative »: parfois non c oncluant- risque d’erreur par recombinaisonM. KRAHN M2 2009

Page 46: M krahn organisation_genome_et_analyses_genomiques_2009

Diagnostic moléculaire indirectPrincipes

105 113

105 115

113 115

105 115

Étude de microsatellites.Exemple: étude familiale, maladie autosomique domin ante

Gène morbide

Marqueur

M. KRAHN M2 2009

Page 47: M krahn organisation_genome_et_analyses_genomiques_2009

Diagnostic moléculaire indirectPrincipes

105 113

105 115

105 115

Gène morbide

Étude de la Coségrégation familiale phénotype/marqueur

Phénotype atteintAllèles 105 et 113

Phénotype sainAllèles 105 et 115

Phénotype sainAllèles 105 et 115Phénotype atteint

Allèles 113 et 115

113 115L’enfant atteint a reçu l’allèle 113 de son père:Il y a COSEGREGATION entre le PHENOTYPE « atteint » et l’allèle 113 paternel L’allèle 113, d’origine paternelle est lié à l’allèle muté du gène en cause

Marqueur

NB: Diagnostic indirect nécessite- Certitude du diagnostic clinique- Étude familiale

Étude de microsatellites.Exemple: étude familiale, maladie autosomique domin ante

M. KRAHN M2 2009

Page 48: M krahn organisation_genome_et_analyses_genomiques_2009

Diagnostic moléculaire indirectPrincipes

105 113

105 115

113 115

105 115

Gène morbide

Étude de la Coségrégation familiale phénotype/marqueur

Phénotype atteintAllèles 105 et 113

Phénotype sainAllèles 105 et 115

Mutation dansle gène impliqué*

Allèle 105 Allèle 113

Phénotype atteintAllèles 113 et 115*

Allèle 105 Allèle 113Phénotype sainAllèles 105 et 115

Allèle 105 Allèle 115

Allèle 115Allèle 105

Marqueur

L’enfant atteint a reçu l’allèle 113 de son père:Il y a COSEGREGATION entre le PHENOTYPE « atteint » et l’allèle 113 paternel L’allèle 113, d’origine paternelle est lié à l’allèle muté du gène en cause

Étude de microsatellites.Exemple: étude familiale, maladie autosomique domin ante

Chez le père, l’allèle 113 du marqueurest sur le même chromosomeque la mutation impliquée dans la maladie

Lorsque le père transmet le chromosome avec la mutation, il transmet AUSSI l’allèle 113⇒ Permet de suivre indirectement

la transmission de la mutation

M. KRAHN M2 2009

Page 49: M krahn organisation_genome_et_analyses_genomiques_2009

Diagnostic direct

DIAGNOSTIC DIRECT: Recherche de l’anomalie génétique primaire

� identification de mutations constitutionnelles délé tères

� approche utilisée de préférence, permet un diagnost ic de certitude

� principaux problèmes posés:

- parfois lourd sur le plan technique

- parfois non concluant

- polymorphismes ou mutations constitutionnelles dél étères?

Patient atteintPhénotype: diagnostic cliniqueOu suspicion diagnostique

Analyses en Génétique moléculaireDIAGNOSTIC DIRECT

Forw.

CAACANNNNNNNNNNNNN

Identification de mutation dans le gène impliqué

M. KRAHN M2 2009

Page 50: M krahn organisation_genome_et_analyses_genomiques_2009

Diagnostic moléculaire directStratégie

Patient atteintPhénotype: diagnostic cliniqueOu suspicion diagnostique

Gène impliqué de GRANDE TAILLE+/- Spectre mutationnel large

Séquençage ciblédes exons présentant des profils anormaux

Précriblage mutationnel

Séquençage complet trop lourd et trop coûteux

Séquençage complet de la totalitéde la séquence codante d’intérêt(tous les exons codants)

Gène impliqué de PETITE TAILLEet/ou mutations récurrentes

• techniques permettant d’identifier les exons présentant des variations de séquence• mais SANS préciser quelle est la variation de séquence• ORIENTATION

� Identification de variations de séquenceMutation ponctuelle

Profil ANORMAL

M. KRAHN M2 2009

Page 51: M krahn organisation_genome_et_analyses_genomiques_2009

Diagnostic moléculaire directExemple: gène de petite taille

• Gène de la cavéoline-3 (CAV3) : localisé en 3p25

séquence codante de 456 paires de bases (2 exons)

ARNm d’ expression musculaire

Protéine impliquée dans la réparation de la membran e musculaire (?)• Mutations CAV3 :

dystrophie musculaire des ceintures autosomique dom inante

M. KRAHN M2 2009

Page 52: M krahn organisation_genome_et_analyses_genomiques_2009

Diagnostic moléculaire directExemple: gène de petite taille

• Gène de la cavéoline-3 (CAV3) : localisé en 3p25

séquence codante de 456 paires de bases (2 exons)

ARNm d’ expression musculaire

Protéine impliquée dans la réparation de la membran e musculaire (?)• Mutations CAV3 :

dystrophie musculaire des ceintures autosomique dom inante

• Gène de petite taille: analyse « facile » par séquença ge direct

PatientContrôle

For.For. c.298A>T hétérozygotep.Ile100Phe

Confirmation du diagnosticpar IDENTIFICATION directe de la mutation

M. KRAHN M2 2009

Page 53: M krahn organisation_genome_et_analyses_genomiques_2009

Diagnostic moléculaire directExemple: gène de grande taille

• Gène de la dysferline (DYSF) : localisé en 2p13.3-13.1

séquence codante de 6243 paires de bases (55 exons)

ARNm d’ expression musculaire (et autres tissus)

Protéine impliquée dans la réparation de la membran e musculaire (?)• Mutations DYSF :

dystrophie musculaire des ceintures autosomique récessive> 400 mutations différentes rapportées

réparties sur toute la longueur du gène= « Spectre mutationnel large »

• Gène de grande taille +/- spectre mutationnel large:Analyse par séquençage complet techniquement trop l ourd

et trop coûteux: NON faisableUtilisation de techniques de PREcriblage mutationnel

M. KRAHN M2 2009

Page 54: M krahn organisation_genome_et_analyses_genomiques_2009

Diagnostic moléculaire directExemple: gène de grande taille

Patient IVS 6

c.946-1G>A

Patient Exon 17

c.1979A>G

Profil hétéroduplex évident

Profil hétéroduplex difficilement mis en évidence

dHPLC

dHPLC

Séquençage

Séquençage

M. KRAHN M2 2009

Page 55: M krahn organisation_genome_et_analyses_genomiques_2009

Diagnostic moléculaire direct

Identification de variations de séquence

� Comparaison à séquence de référence

- UCSC Genome Browser genome.ucsc.edu

- Ensembl www.ensembl.org

� Description précise du variant : NOMENCLATURE HGVS

www.hgvs.org/mutnomenNomenclature officielle Human Genome Variation Society

Mutations délétèresou

Variations de séquence non pathogènes ?

M. KRAHN M2 2009

Page 56: M krahn organisation_genome_et_analyses_genomiques_2009

Problématiques des études moléculaires en génétique humaine

• Stratégies de Diagnostic génétique

• Problèmes d’interprétation de données mutationnelle s

• Perspectives de criblage mutationnel à haut débit

M. KRAHN M2 2009

Page 57: M krahn organisation_genome_et_analyses_genomiques_2009

Diagnostic moléculaire direct

Identification de variations de séquence

� Description précise du variant : NOMENCLATURE HGVS

� Comparaison à séquence de référence:Mutation délétère… ou simple variation de la normale /polymorphisme?

2 situations:

� la variation de séquence est connue (consultation de bases de données)

� la variation de séquence N’EST PAS connue

M. KRAHN M2 2009

Page 58: M krahn organisation_genome_et_analyses_genomiques_2009

Diagnostic moléculaire direct

Identification de variations de séquence

� Description précise du variant : NOMENCLATURE HGVS

� Comparaison à séquence de référence:Mutation délétère… ou simple variation de la normale /polymorphisme?

2 situations:

� la variation de séquence est connue (consultation de bases de données)

- Caractère délétère confirmé au préalable chez d’aut res patients� Mutation constitutionnelle délétère

- Présence sans effets pathologiques dans la populat ion générale� Polymorphisme

� la variation de séquence N’EST PAS connue

M. KRAHN M2 2009

Page 59: M krahn organisation_genome_et_analyses_genomiques_2009

Diagnostic moléculaire direct

Identification de variations de séquence

� Description précise du variant : NOMENCLATURE HGVS

� Comparaison à séquence de référence:Mutation délétère… ou simple variation de la normale /polymorphisme?

2 situations:

� la variation de séquence est connue (consultation de bases de données)

- Caractère délétère confirmé au préalable chez d’aut res patients� Mutation constitutionnelle délétère

- Présence sans effets pathologiques dans la populat ion générale� Polymorphisme

� la variation de séquence N’EST PAS connue

Séance EDAnalyses mutationnelles en Génétique Humaine

M. KRAHN M2 2009

Page 60: M krahn organisation_genome_et_analyses_genomiques_2009

Consultation de bases de données

Mutation rapportée au préalable ?

Bases de données « locus-spécifiques »� Listing disponible site HGVS

www.hgvs.org/dblist/glsdb.html

Human Genome Variation Societywww.hgvs.org

Porte d’entrée pour les Bases de données mutationnell es

Bases de données « centrales/globales »

� Human Gene Mutation Database www.hgmd.org� SNP database www.ncbi.nlm.nih.gov/SNP/� UCSC Genome Browser genome.ucsc.edu� Ensembl www.ensembl.org

M. KRAHN M2 2009

Page 61: M krahn organisation_genome_et_analyses_genomiques_2009

Diagnostic moléculaire direct

Identification de variations de séquence

� Description précise du variant : NOMENCLATURE HGVS

� Comparaison à séquence de référence:Mutation délétère… ou simple variation de la normale /polymorphisme?

2 situations:

� la variation de séquence est connue (consultation de bases de données)

� la variation de séquence N’EST PAS connue

- Évaluation de différentes données pour conclure su r

le caractère pathogène ou non de la variation de sé quence

- Saisie des résultats dans les bases de données

M. KRAHN M2 2009

Page 62: M krahn organisation_genome_et_analyses_genomiques_2009

Diagnostic moléculaire directVariation de séquence non connue au préalable

Mutation délétère ou Polymorphisme?

?

M. KRAHN M2 2009

Page 63: M krahn organisation_genome_et_analyses_genomiques_2009

Diagnostic moléculaire directVariation de séquence non connue au préalable

Mutation délétère ou Polymorphisme?

� (Consultation de bases de données)

� Nature de la mutation

(non-sens, décalage cadre de lecture, épissage, fau x-sens, isosémantique,…)

� Étude de la ségrégation de la variation de séquence à l’intérieur de la fami lle

� Recherche de la variation dans une population de té moins sains- absence = en faveur du caractère délétère- présence = polymorphisme probable

� Études fonctionnelles : transcriptionnelles, protéiques,…Plus difficile, parfois plutôt domaine de la recher che

� Modélisation bio-informatique:- de l’effet sur l’épissage/l’ARNm- de la conservation du nucléotide impliqué (et AA co rrespondant)

au cours de l’évolution - de l’effet au niveau de la protéine

M. KRAHN M2 2009

Page 64: M krahn organisation_genome_et_analyses_genomiques_2009

Modélisation bio-informatique

Analyse de l’effet sur l’épissage/l’ARNmEpissage anormal, dégradation,..

Analyse de la conservation du nucléotide impliqué(et AA correspondant) au cours de l’évolution => Surtout pour variants faux-sens, isosémantiques e t introniques)

- Conservé= important, donc une variation est susceptible d’ê tre délétère

- Non conservé= moins important, une variation est possible sans effet majeur

Analyse de l’effet au niveau de la protéine Domaines fonctionnels, protéine tronquée,…

M. KRAHN M2 2009

Page 65: M krahn organisation_genome_et_analyses_genomiques_2009

Problématiques des études moléculaires en génétique humaine

• Stratégies de Diagnostic génétique

• Problèmes d’interprétation de données mutationnelle s

• Perspectives de criblage mutationnel à haut débit

M. KRAHN M2 2009

Page 66: M krahn organisation_genome_et_analyses_genomiques_2009

Rappel: Mutations « classiques »

Mutations en séquence non codante:

perturbations d‘éléments régulateurs

mutations perturbant l‘épissage

CAAT5´ 3´

Région 5´UTR

Exon Intron

TATA ATG

Région 3´UTR

TAATAGTGA

AATAAA

Mutations en séquence codante:

faux sens

non sens

insertions/délétions

décalage du cadre de lecture

mutations perturbant l‘épissage

=> perte/gain de fonction

GT AGSite donneur Site accepteur

M. KRAHN M2 2009

Page 67: M krahn organisation_genome_et_analyses_genomiques_2009

Séquençage complet

Mutation ponctuelle

Exon 1

Exon 2

Exon 3Gène de 3 exons

PRECRIBLAGE puis Séquençage ciblé

Mutation ponctuelle

Exon 1

Exon 2

Exon 3

Profil NORMAL

Profil NORMAL

Profil ANORMAL

- Différentes technologies: SSCP, DHPLC, HRM,…- Intérêt: détecter les exons porteurs d’une variati on de séquence

=> réduction du temps d’analyse et des coûts

M. KRAHN M2 2009

Page 68: M krahn organisation_genome_et_analyses_genomiques_2009

Suspicion d’une pathologie particulière…sans identification de mutations

Sensibilité insuffisante des techniques utilisées en routine

Quelles mutations ne sont pas détectées par les stratégies « classiques » ?

� Mutations introniques ? Mutations de régions régulatrices ?

� Mutations dans exons alternatifs ?� Réarrangements intragéniques de grande taille ?� (…)

Hétérozygotes symptomatiques, digénisme…

Exemple: Maladies autosomiques récessives

Mutations dans d’autres gènesMême voie physiopathologique ++

M. KRAHN M2 2009

Page 69: M krahn organisation_genome_et_analyses_genomiques_2009

Réarrangements intragéniques de grande tailleDélétions/Amplifications exoniques

Parfois détectées de manière fortuite

(détection en PCR; variants de séquence pseudo-homo zygotes;…)

Non détectables de manière systématique avec les tec hniques

« classiques » de criblage mutationnel de la séquence c odante génique

Développement récent de techniques adaptées:

- Quantitative multiplex PCR of short fluorescent fr agments(QMPSF; Casilli et al., 2002)

- Multiplex Ligand-dependant Probe Amplification(MLPA; Shouten et al., 2002)

Analyse mono-allélique

Exemple: délétion exonique

M. KRAHN M2 2009

Page 70: M krahn organisation_genome_et_analyses_genomiques_2009

Diagnostic moléculaire de routineMoyens actuels et Perspectives

Techniques de criblage mutationnel « efficaces »Outils bio-informatiques :

- Bases de données mutationnelles- Algorithmes d’analyse de variants de séquence

… mais sensibilité insuffisante des techniques d’anal yse

� Mutations non détectées par les techniques actuelle s de routineDéveloppement de techniques complémentaires

� Mutations dans d’autres gènes / gènes candidats� (…)

Nouvelles technologies d’analyse mutationnelle géno mique à haut débit

Exemples:� CGH Microarrays� Sequence Capture Arrays et Séquençage à haut débit

M. KRAHN M2 2009

Page 71: M krahn organisation_genome_et_analyses_genomiques_2009

Nouvelles technologies d’analyse mutationnelle génomique à haut débit

CGH Arrays

� ADN génomique non amplifiéPatient et contrôle

� Fragmentation aléatoire

� Marquage avec « random 9mers »- 5’-Cy3 (ADN patient)- 5’-Cy5 (ADN contrôle)

et

� Hybridation sur lame (array)

� AnalyseCapture des signaux fluorescents (Scanner)

Analyse des données (Ratio Cy3/Cy5)

ADN patient

ADN contrôle

M. KRAHN M2 2009

Page 72: M krahn organisation_genome_et_analyses_genomiques_2009

Nouvelles technologies d’analyse mutationnelle génomique à haut débit

CGH Arrays

2.1M

4-plex 12-plex4 x 70 K 12 x 135 K

385K

M. KRAHN M2 2009

Page 73: M krahn organisation_genome_et_analyses_genomiques_2009

Duplication hétérozygote exons 37+38 (+39)71684074-71693259

DYSF CGH arrays

Nimblegen-Roche

Délétion homozygote exons 2 à 40 71562000-71720000

M. KRAHN M2 2009

Page 74: M krahn organisation_genome_et_analyses_genomiques_2009

DYS et SGC CGH arrays

γγγγSarcoglycanLGMD2C

DystrophinDMD

Saillour et al, 2008M. KRAHN M2 2009

Page 75: M krahn organisation_genome_et_analyses_genomiques_2009

400000 lecturesFragments de 250-300bp500Mb de séquence/runCouverture 15x/région5Mb de séquence propre/run

Séquençage à haut débit

Nimblegen-Roche

Fragmentation

Ligation d’adaptateur

Création de microréacteurs par émulsion(billes et fragments ADN)

Séquençage et analyse

ADN génomique

PCR en émulsion

M. KRAHN M2 2009

Page 76: M krahn organisation_genome_et_analyses_genomiques_2009

Séquençage à haut débit5Mb de séquence interprétable / run

Sequence Capture arrays et Séquençage à haut débit

Nimblegen-Roche

Régions cible

Fragmentationet ligation d’un « linker »

Sélection/Enrichissementen séquence cible(alternative à PCR)

Hybridation

Élution de la Région d’intérêt

Lavages

Amplification

M. KRAHN M2 2009

Page 77: M krahn organisation_genome_et_analyses_genomiques_2009

2.1M

4-plex 12-plex4 x 70 K 12 x 135 K

1-plex1 x 2.1 M

1-plex1 x 385 K

385K

Nimblegen-Roche

Sequence Capture arrays

M. KRAHN M2 2009

Page 78: M krahn organisation_genome_et_analyses_genomiques_2009

Nouvelles technologies d’analyse mutationnelle génomique à haut débit

PERSPECTIVES

Criblage mutationnel à haut débit en routine� Analyses de séquence

- « Mutations classiques »Substitutions et ins/del de petite taille

- Extension de l’analyse aux régions introniqueset/ou régions régulatrices

(Epissage, 5’UTR, 3’UTR, CNGS, microRNA,…)� Anomalies génomiques quantitatives

- Réarrangements intragéniques de grande tailleDélétions/Amplifications exoniques

- Copy Number Variations

Analyse de gènes candidats et gènes modificateursÉtapes de validation par techniques complémentaires (Séq. direct, Q-PCR; RT-PCR et Q-RT-PCR, MLPA, Micro arrays d’expression,…)

(…)

M. KRAHN M2 2009

Page 79: M krahn organisation_genome_et_analyses_genomiques_2009

Diagnostic moléculairePERSPECTIVES

Procédure actuelle

Procédure future

Approche « gène par gène »

Approche « haut débit »

Orientation cliniqueanatomopathologique

biochimique(…)

Orientation cliniqueanatomopathologique

biochimique(…)

Un ou quelques gènesLong; 1 semaine à 1 an Coûteux

Plusieurs dizaines de gènesRapide; 72 heures à 1 semaine Réduction des coûts

M. KRAHN M2 2009

Page 80: M krahn organisation_genome_et_analyses_genomiques_2009

Conclusion – Notions essentielles

• Stratégies de Diagnostic génétique- Diagnostic direct vs indirect- Précriblage mutationnel

• Problèmes d’interprétation de données mutationnelle s- Bases de données mutationnelles- Variants « nouveaux » => recueil d’arguments de pathogén icité- Outils bioinformatiques ++

• Perspectives de criblage mutationnel à haut débit

M. KRAHN M2 2009