Les -omiques
ENSPS 2 TIC-Santé2012-2013
Plan
• Introduction:– La définition des –omiques et leurs apparitions en
Biologie– L’analyse de l’information dans les données
• Les génomes : de la cartographie au séquençage,• Les ARN messagers : de l’hybridation au DNA chip,• La protéomique : Du gel bidimensionnel à la
spectrométrie de masse. L’interactome.• La métabolomique (l’analyse des métabolites)
GÉNES, GÉNOME, GÉNOMIQUE
La recherche de nouveaux médicaments dans l’ére de la
génomique
Industries du médicament et biotechnologie
Le blockbuster ( 1Milliard d’euros par an)
Les nouveaux paradigmes
Environnement
Fonds génétiques
Mutations individuelles
Xénobiotique
Microbe
Art de vivre
La biologie en comprenant
Jacques Monod1910-1976
James WATSON1928-Francis Crick1916-Jean Dausset
1916-
De la recherche au médicament
• Recherche fondamentale (Génomique)• Technologie (Biotechnologie)• Produits (Réalisation de services, produits,
concepts)
La première loi de la Biologie
La Génomique
• La séquence d’organismes entiers et d’individus (polymorphisme)
• Lien phénotype-génotype• Le transcriptome• Le protéome• La physiologie revisitée : biologie intégrative
et génomique fonctionnelle.
La Génomique :Une Nouvelle Biologie.
• Exhaustivité et industrialisation de l’acquisition des données,
• Gestion, structuration, analyse de grands ensembles de données (Bioinformatique),
• Transfert rapide de méthodes, techniques et concepts vers le secteur industriel.
3 Retournements de La Stratégie de Recherche
Phénotype Génotype Gènes orphelinsBiologie
Génomique
Spécifique GlobalBiologie
Génomique
ExhaustivitéIndustrialisation
Classification Prédiction
Modélisation
Biologie
Génomique
Bioinformatique
3 Conséquences Structurelles
Production Linéaire des données
Production exponentielle
Biologie
Génomique
Gestion des donnéesMésoinformatique
Individu ÉquipeBiologie
Génomique
ConsortiumProgrammeÉvaluationEurope
Fondamental versus Appliqué
Similarité entre recherche publique et recherche privé
Biologie
Génomique
Attractivité en recherche publique
Evolution des Sociétés
Société Industrielle
Société de la Connaissance
Société de Services
Une révolution industrielle ?• Sectorialisation des marchés
– Par population– Par individu– Par manière de vivre
• Le rôle de la biotechnologie– Big Pharma versus Biotech– Globalisation de la production
• La distribution du médicament– Molécules/ identité génétique– Une nouvelle galénique ou biogallénique– Distribution ciblée versus distribution globale
Un histoire de la génomique
France et USA au coude à coude
Le Dogme central de la Biologie
Séparation entre la technologie et le concept
Biologie Moléculaire
versus
biologie moléculaire
L’industrialisation de l’acquisition des données
• La génomique d’après les Etats-Unies– Une approche industrielle (Histoire de Lee HOOD)
• La génomique Française– Une approche Humaniste ( Jean DAUSSET)– Une approche pour le malade (AFM)
Industrialisation du Séquençage1981
1999
Bref Historique en France
Le génome humain
Régulation de la synthèse des enzymes du "système lactose", septembre 1970Le Hasard et la Nécessité, p.100, figure 4 (Editions Point Sciences)
3 milliards35 000 gènes
150 000messagers
1 millionprotéines
Le corps humain
Genotype-Phenotype
• Le polymorphisme humain– La théorie de KIMURA
• La pharmacogénétique ou l’épidémiologie moléculaire
• La pharmacogénomique ou des médicaments personnalisés
Une nouvelle génétique
Pharmacogénétique et pharmacogénomique
Les collections biologiques Les Centres de Ressources biologiques (CRBs)
Une carte génétique
Le déséquilibre de liaison
Les marqueurs
Adapted from William E. Evans, * Mary V. Relling, Science Volume 286, Number 5439, Issue of 15 Oct 1999, pp. 487-491
NCIAPCIT(FCGP)
Wellcome TrustBayer Group AG, Bristol-Myers Squibb Co., Glaxo Wellcome PLC, Hoechst Marion Roussel AG, Monsanto Co., Novartis AG, Pfizer Inc., Roche Holding Ltd., SmithKline Beecham PLC, Zeneca Group PLC
The SNP Consortium
F. Sigaux, 2000
Génomique ADN (Gene)
GénomiqueFonctionnelle
Transcriptomique ARN
Protéomique PROTEINE
Métabolomique METABOLITE
Transcription
Traduction
Réactionenzymatique
La nomemclature des …omiques
GenTranscritProteMetabol
~ome Ensemble exhaustif de
GènesTranscritsProtéinesMétabolites
=
GenProte ~omique = Analyse du Génome
Protéome
Quelques définitions…
Variation en génétique humaine: Définition et classification
Identité des génomes humains
• Séquence du génome 99.9% identique• 3,200,000 nucléotides différents• Nombres de différences de bases
individuelles: ca. 3 million• Nombres d’acides aminés différents dans
le protéome: ca. 100,000
Types de variations
• Macro:– Nombre de chromosomes– Duplications de segments, rearrangements, and deletions
• Medium:– Séquences répétées– Eléments transposables– Courte délétion, Séquences répétés (microsatellites)
• Micro:– Polymorphisme de nucléotides uniques (SNPs)– Délétions et insertions de nucléotides uniques (Indels)
Single Nucleotide Polymorphism (SNP)
Un SNP est un changement d’une base qui apparaît dans plus de 1% de la population.
GATTTAGATCGCGATAGAGGATTTAGATCTCGATAGAG
Une mutation quand la fréquence est inférieure à 0,1 %.
Est-ce que tous les SNPs sont vraiment des SNPs?
• Un SNP est trouvé en comparant la séquence de plusieurs individus.
– Position 8 variable (A|C) – Est-ce suffisant pour dire que l’on a un SNP ?
• Deux types d’erreurs– Inclusion de paralogues dans l’alignement– Erreurs de séquences
GCATGCAAGCAGATAGCATGCACGCAGATAGCATGCAAGCAGATAGCATGCAAGCAGATAGCATGCAAGCAGATAGCATGCAAGCAGATA
discard low confidenceSNP predictions
Quality control in SNP finding
• Downweighting sequencing errors:– Take into account
• Bases ocurring at variable position• Depth of coverage at the position• Quality score of the postion (from chromatogram)
69,756variable positions
59candidate SNPs
36 candidate SNPs for validation
20 validated SNPs
80,469 variable positions• Screening out paralogs:
– Paralogs differ in 1/50 positions; SNPs occur in 1/1000 positions: ESTs with more tha expected number of mutations classified as paralogs and removed.
• Take only 1954 ESTs with available sequencing chromatograms
discard paralogs
• Discard 23 candidate SNPs for “technical reasons”
• Validate SNPs on population samples
Application des données de SNPs
• Etude de l’évolution– Histoire évolutionnaire des populations
• Empreinte génétique– Police criminelle et vérification parentale
• Marqueurs pour étude génotype/phénotype• Médecine individualisée
• La plupart des gènes contiennent des SNPs – 93% des gènes ont au moins un SNP– 39% des gènes en ont plus de 10
Types de SNPs• Génique, SNPs dans les exons
– non synonyme• Maintien ou altération de la fonction de la protéine
– synonyme• Maintien ou modification de la traduction
• Génique, SNPs dans les introns ou dans les parties régulatrices– SNPs dans les parties régulatrices
• Maintien ou modification de l’expression du gène– SNPs dans les introns
• Maintien ou modification de l’épissage• SNPs associés
– Habituellement dans les parties intergéniques
Termes associés avec les marqueurs génétiques
Liaison : comment deux marqueurs génétiques sont liés lors de la transmission.
Déséquilibre de liaison (LD) fait références aux allèles plutôt qu’aux marqueurs : si deux allèles (ou deux SNPs) sont hérités ensemble plus souvent que ce qui est prédit, on dit que les allèles sont en déséquilibre de liaison.
Haplotype est un ensemble séquentiel de SNPs (ou allèles) trouvés sur le même chromosome. Ces SNPs tendent à être transmis ensemble au cours de l’évolution.
Variations dans les chromosomes dans une population.Emergence de variation au cours de
l’évolution
Temps présent
mutation
Déséquilibre de liaison et haplotype
Adam
et
Eve
Une maladie génétique simple
• Un marqueur, avec deux allèles/haplotypes • Récessif – seul l’homozygote a un phénotype
malade• L’allèle récessif est en déséquilibre de liaison avec
les SNPs 1’ et 2’• Le génotype permet de prédire le phénotype
Une maladie génétique complexe
• Trois marqueurs, chacun avec deux allèles/haplotype block
• Phénotype est quantitative (gravité de la maladie (QTL, quantitative trait loci )
• L’information sur l’haplotype n’est pas un prédicteur certain mais peut être statistiquement corrélé (étude d’association)
• P1 et P2 sont deux populations différentes.
Etude d’associations
Malades Contrôle
Allèle 1 Allèle 2
Marqueur A est associé avec le
phénotype.
Marqueur A:Allèle 1 =Allèle 2 =
Exemples de SNPs associés à des maladies
Hypomagnesie primaire• Malades incapable de maintenir un niveau suffisant de Magnésium dans le sérum. • Géne en cause : sous unité g de Na/K ATPase (123G->A = Gly->Arg dans la région
trans-membranaire) – mutation empêche le ciblage de la protéine vers la membrane cellulaire.
SNPs mitochondriaux
• >50 SNPs mitochondriaux impliqués dans des maladies• Le plus souvent affecte des tissus à grande consommation d’énergie
BRCA1 (breast cancer-associated antigen 1)
• Mutation silencieuse modifiant l’épissage (A. Krainer, CSHL)• Exons contient des « exonic splicing enhancers » et des « exonic splicing
silencers » ce qui conduit à des épissages alternatifs aberrants.
Exemples de SNPs conduisant à des phénotypes altérés
Glucose-6-phosphate dehydrogenase et favisme• Premier enzyme dans la branche de l’oxydation des pentoses. Il réduit le NADP+ en NADPH• Différentes mutations inhibent partiellement ou complètement l’activité enzymatique• Les personnes (10%) avec un enzyme inactif ont une anémie hémolytique lorsqu’ils
consomment des fèves (elles contiennent de l’ H2O2 – NADPH est nécessaire pour détoxifier)
CytP450 mutations et réponse aux médicaments• Cytochrome P450 – métabolisent et activent de nombreux médicament• On divise la population en normal, lent et ultra-rapide métaboliseurs • Deux gènes important chez l’homme :
– 2D6 – requis pour plus de 40 médicaments– 2C19 – actives mephentyoin (épilepsie); 2-3% Caucasiens et 23% Asiatiques sont des
métaboliseurs lents.
Etude de la relation entre les variations génétiques et l’efficacité des médicaments
Drug dose (rel.)
Polymorphic drug-metabolizing enzymes