16
1/16 Ronéo 11 UE5 Cours 7 UE5 Génétique médicale Claire Vandiedonck Maitre de conférences à Paris Diderot Le 5/12/2017 de 13h30 à 15h30 Ronéotypeur : Sacha AUBERT Ronéoficheuse : Ana ANTILOGUS Cours 7 Maladies polygéniques/multifactorielles

Cours 7 Maladies polygéniques/multifactorielles · 4/16 Ronéo 11 – UE5 Cours 7 2. Pourquoi étudier la génétique des maladies à hérédité multifactorielle ? Ces maladies

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Cours 7 Maladies polygéniques/multifactorielles · 4/16 Ronéo 11 – UE5 Cours 7 2. Pourquoi étudier la génétique des maladies à hérédité multifactorielle ? Ces maladies

1/16 Ronéo 11 – UE5 Cours 7

UE5 – Génétique médicale Claire Vandiedonck – Maitre de conférences à Paris Diderot Le 5/12/2017 de 13h30 à 15h30 Ronéotypeur : Sacha AUBERT Ronéoficheuse : Ana ANTILOGUS

Cours 7 – Maladies polygéniques/multifactorielles

Page 2: Cours 7 Maladies polygéniques/multifactorielles · 4/16 Ronéo 11 – UE5 Cours 7 2. Pourquoi étudier la génétique des maladies à hérédité multifactorielle ? Ces maladies

2/16 Ronéo 11 – UE5 Cours 7

Sommaire :

I. Bases des maladies à hérédité multifactorielle 1. Maladie multifactorielle = maladie à hérédité complexe 2. Pourquoi étudier la génétique des maladies multifactorielles ? 3. Notion d’héritabilité 4. Evaluation des composantes génétique et environnementale

a. Exemple de facteurs environnementaux : le Diabète de type 1 b. Evaluation de la composante génétique

II. Diversité génétique humaine et déséquilibre de liaison

1. Polymorphisme génétique a. Types de marqueurs polymorphes b. Génotype de marqueurs polymorphes c. Equilibre de Hardy-Weinberg

2. Projet 1K génomes 3. Relations entre les variants

a. Détermination de la phase b. Haplotype et déséquilibre de liaison c. Evolution du DL d. Intérêts du DL

III. Méthode d’étude de l’hérédité multifactorielle : l’association allélique

1. Etudes de liaison 2. Etudes l’association génétique 3. Etudes pangénomiques

a. Exemple : le Wellcome Trust Case Control Consortium b. Problèmes inhérents au GWAS

4. Analyse fine a. Inconvénient du déséquilibre de liaison b. Comment affiner l’association

IV. Bilan des GWAS

Page 3: Cours 7 Maladies polygéniques/multifactorielles · 4/16 Ronéo 11 – UE5 Cours 7 2. Pourquoi étudier la génétique des maladies à hérédité multifactorielle ? Ces maladies

3/16 Ronéo 11 – UE5 Cours 7

I. Bases des maladies à hérédité multifactorielle Rappels : maladies monogéniques/mendéliennes Dans ce type de pathologie, on assiste plutôt à des mutations délétères (= variants pathogènes) de différents types selon la région du gène qui est touchée :

- Faux sens : remplacement d’un acide aminé par un autre, dans une région codante - Non-sens : remplacement d’un acide aminé par un codon STOP => protéine tronquée - Epissage : apparition ou disparition d’un site donneur ou accepteur d’épissage - Modification du cadre de lecture - Délétion - Expansion de triplets

Ces types de mutations ont pour conséquences des modifications importantes dans le fonctionnement du gène, et non pas des modifications subtiles. Il existe 3 modes de transmission mendélienne : autosomique dominant, autosomique récessif et récessif lié au sexe. Ces maladies sont étudiées par différentes méthodes :

- Analyse de liaison paramétrique puis clonage positionnel - WES (Whole Exome Sequencing) ou WGS (Whole Genome Sequencing)

1. Maladies multifactorielles = maladies à hérédité complexe

Les maladies à hérédité complexe impliquent très rarement de mutations uniques délétères qui vont avoir un effet drastique sur le gène. On assiste plutôt à des effets plus subtiles, non pas sur la fonction du gène, mais sur les niveaux d’expression des produits du gène, influencés par de multiples facteurs de susceptibilité :

- Combinaison de plusieurs gènes : maladies polygénique - Effet de l’environnement - Interaction gène x environnement

A gauche de cette échelle, sont représentée les maladies à influences uniquement génétiques, à droite

les maladies purement environnementales. Les maladies multifactorielles représentent toutes les

maladies qui se trouvent entre ces deux extrémités.

Page 4: Cours 7 Maladies polygéniques/multifactorielles · 4/16 Ronéo 11 – UE5 Cours 7 2. Pourquoi étudier la génétique des maladies à hérédité multifactorielle ? Ces maladies

4/16 Ronéo 11 – UE5 Cours 7

2. Pourquoi étudier la génétique des maladies à hérédité multifactorielle ? Ces maladies ont une grande importance en santé publique :

- Elles ont une prévalence élevée : cancer, diabète, obésité, maladies cardiovasculaires, AVC, maladie neuropsychiatrique, autoimmunité, inflammation etc.

- Chronicité importante - Traitement très coûteux

Ö Motive la recherche Objectif et enjeux de la recherche :

- Comprendre la biologie et identifier les mécanismes pathogènes : voies et réseaux de gènes et hétérogénéité des maladies

- Développer de nouveaux traitements - Découvrir des biomarqueurs => diagnostic précoce, prédire la réponse aux traitements Ö Le but est d’aller vers une médecine personnalisée, de précision (« passer de la population

à l’individu »)

/!\ On ne parle PAS de MEDECINE DE PREDICTION : il est impossible de dire qu’un individu donné va avoir une maladie multifactorielle !

3. Notion d’héritabilité Var(P) = Var(G) + Var(E) + 2 Cov(G, E) avec Var(P) : variance phénotypique, Var(G) : variance génétique, Var(E) : variance environnementale, Cov(G,E) : covariance

Ö La variation d’un trait phénotypique résulte de facteurs génétiques et environnementaux Héritabilité : Proportion de la variance phénotypique totale due aux effets génétiques

Ö H2 = Var(G)/Var(P) : plus la composante génétique augmente, plus l’héritabilité augmente (l’inverse pour la composante environnementale)

Ö Si h2 = 0 : pas d’effet génétique OU aucune variabilité génétique Ö Si h2 = 1 : pas d’effet de l’environnement OU pas de variabilité environnementale

4. Evaluation composantes génétiques et environnementales

Méthode épidémiologique : taux de concordance chez les jumeaux monozygotes (MZ) et dizygotes (DZ)

Ö on regarde le nombre de paires concordantes (les 2 jumeaux atteints / nombre total de paires)

Concordance = les 2 jumeaux sont atteints ; Discordance = 1 seul jumeau est atteint

S’il y a une discordance chez les MZ (donc avec le même fond génétique) => existence de facteurs environnementaux impliqués dans la maladie S’il concordance MZ > concordance DZ => existence de facteurs génétiques

Page 5: Cours 7 Maladies polygéniques/multifactorielles · 4/16 Ronéo 11 – UE5 Cours 7 2. Pourquoi étudier la génétique des maladies à hérédité multifactorielle ? Ces maladies

5/16 Ronéo 11 – UE5 Cours 7

a. Exemple de facteurs environnementaux : le Diabète de type 1 Dans cette forme de diabète, les agents infectieux peuvent avoir un effet prédisposant ou un effet protecteur de la maladie. Effet prédisposant :

- Activation des lymphocytes : ce qui va déclencher des infections chroniques - Inflammation associées aux oreillons : on trouve des traces du virus des oreillons chez des

nouveaux cas de DT1 - Réponse antivirale aux entérovirus, notamment le virus cocksackie qui présente un

tropisme pour les cellules bêta du pancréas ; de plus, certaines protéines du virus présentent des similarités avec les cellules des ilots de Langerhans, on a donc un mimétisme moléculaire (protéine virale 2C avec GAD65, protéine virale VP1 avec IA2)

Ö Réponse contre le virus, mais par rebond, réponse contre des antigènes du soi présents dans les cellules du pancréas, induisant le diabète.

Effet protecteur : - Hypothèse de l’hygiène : dans un environnement où l’hygiène est trop importante, il peut y

avoir une réponse immunitaire contre le soi, plutôt que contre les agents infectieux auxquels on est exposé

- Exemple de la souris NOD (non-obese diabetic) qui développe un modèle murin spontané de diabète SAUF quand elle est en présence de pathogène => rôle du microbiote

Il existe aussi des agents déclenchant : nourriture (lait de vache, gluten), stress, gestation, produits chimiques (pesticides, médicaments) ; et des agents aggravant : déficit en vit D, tabagisme

b. Evaluation de la composante génétique Etudes d’excès de cas familiaux => évaluer un risque relatif familial On compare le taux de récurrence de la maladie chez des apparentés (de la même famille) avec la proportion de cas dans la population générale.

Par exemple pour la 1ère ligne du

tableau : Le risque dans la population générale

d’avoir une hypertension est de 10%, le

risque pour des apparentés au 1er degré

de développer une hypertension est

quant à lui de 20-30% => le risque

relatif familial est alors de 2 à 3 (20-30

/ 10) = il y a 2 à 3 fois plus de risque

pour un individu de développer une

hypertension s’il a un apparenté au 1er degré avec une hypertension.

Les relations génotype-phénotype se sont pas évidentes et compliquent l’étude des maladies polygéniques. En effet, cette complexité peut venir :

- Du phénotype : o Il faut s’assurer d’avoir une spécificité du phénotype avec des critères d’inclusions

très précis o Un âge de début de la maladie parfois tardif : un individu contrôle (donc non

malade) peut, plus tard, déclarer la maladie

Page 6: Cours 7 Maladies polygéniques/multifactorielles · 4/16 Ronéo 11 – UE5 Cours 7 2. Pourquoi étudier la génétique des maladies à hérédité multifactorielle ? Ces maladies

6/16 Ronéo 11 – UE5 Cours 7

- Du génotype : o Multiplicité des gènes impliqués dans la maladie o Hétérogénéité génétique : pas forcément la même combinaison de gènes impliqués

entre les différents individus pour une même pathologie o Hétérogénéité allélique : pas forcément les mêmes allèles impliqués o Fréquence des allèles morbides qui est élevée dans la population générale

- De la relation génotype-phénotype : o Chaque variant a un impact très modeste sur le déclenchement (ou les

complications) de la maladie o Pliéotropie : effets multiples d’un même variant -> un génotype peut donner

plusieurs phénotype Tous ces facteurs vont conduire à un problème de puissance des études pour identifier les variants génétique prédisposant aux maladies multifactorielles. Un continuum des maladies mendéliennes aux maladies polygéniques :

- Pour les maladies mendéliennes : fréquence des variants très élevée chez les patients VS très faible chez les contrôles - Pour les maladies polygéniques : variants fréquents chez les patients ET les contrôles

A RETENIR

Page 7: Cours 7 Maladies polygéniques/multifactorielles · 4/16 Ronéo 11 – UE5 Cours 7 2. Pourquoi étudier la génétique des maladies à hérédité multifactorielle ? Ces maladies

7/16 Ronéo 11 – UE5 Cours 7

II. Diversité génétique humaine et déséquilibre de liaison Rappel : Le génome humain est diploïde, il comporte 46 chromosomes : 22 paires d’autosomes + 1 paires de gonosomes (chromosomes sexuels X et Y).

1. Polymorphisme génétique Définitions :

- Polymorphisme = variant : variation héréditaire de l’ADN o Diversité génétique : + de 80 millions de variants

validés - Locus : un endroit donné du génome (ex : marqueur M1)

o Peut être polymorphe - Allèle : chaque forme particulière que prend le polymorphisme

d’un locus (ex : allèle A et allèle G au marqueur M1) - Génotype : combinaison des deux allèles d’un locus (ex : A/A,

A/G ou G/A possibles au marqueur M1) - Haplotype : séquence d’allèles à des locus voisins situés sur un

même chromosome (ex : haplotype maternel GTC pour M1-

M2-M3 et haplotype paternel ATG pour M1-M2-M3) /!\ Ne pas confondre chromosomes homologues et brins

complémentaires de la double hélice d’ADN, sont représentés sur le schéma les chromosomes

homologues.

a. Types de marqueurs polymorphes

- SNPs (Single Nucleotide Polymorphisms) : variation à une seule position, un seul nucléotide

est modifié o Généralement bi-allélique o Typage automatisé par puce o Très haute densité, ce sont les polymorphismes les plus nombreux o Ils sont détectables par séquençage

- Indels : petites insertions/délétions (quelques NT)

- Variations structurales : o Des sortes d’insertions/délétions de

plus grandes tailles o Substitution o Inversion

- Microsatellites : o Motif de 2 à 4 bases répétées o Multi-allélique : très informatifs o Très nombreux : 1 toutes les 30

kb o Ils sont à la base de la 1ère carte de liaison génétique

Chaque ligne séquencée représente un allèle différent.

Page 8: Cours 7 Maladies polygéniques/multifactorielles · 4/16 Ronéo 11 – UE5 Cours 7 2. Pourquoi étudier la génétique des maladies à hérédité multifactorielle ? Ces maladies

8/16 Ronéo 11 – UE5 Cours 7

b. Génotypage de marqueurs polymorphes Par puce :

- Surtout pour les SNPs (mais aussi indels) - Hybridation de l’échantillon sur différentes sondes,

puis détection de la fluorescence selon les allèles -> hybridation à 1 seule sonde = monozygote, à 2 sondes = hétérozygote

- Les différents allèles sont connus au préalable - Peu coûteux

Par séquençage : - Différentes techniques : Sanger ou Nouvelle Génération (NGS) - Nouveaux variants découverts - Coûteux - Exhaustif

c. Equilibre de Hardy-Weinberg

Quand on fait du génotypage de marqueurs polymorphes, il est important vérifier cet équilibre. Les fréquences alléliques et génotypiques demeurent constantes d’une génération à l’autre. Soit un marqueur polymorphe avec les allèles A et a :

- Les fréquences alléliques à la génération n et n+1 sont égales : f(a) = p2 ; f(A) = q2 et p+q = 1

- Les fréquences génotypiques aux générations n et n+1 sont égales : f(aa) = p2 ; f(aA) = 2pq ; f(AA) = q2 et p2+2pq+q2 = 1

Conditions : - Population panmictique (= mariages au hasard) - Taille infinie - Absence de mutation et de sélection

Une absence d’équilibre de HW peut signifier :

- Une mauvaise qualité de génotypage - Une sélection ou consanguinité

2. Projet 1K génomes (2008-2015)

C’est un projet de séquençage d’un très grand nombre de marqueurs chez un très grand nombre d’individus. Au départ, le projet visait les 1000 génomes séquencés pour découvrir de nouveaux variants. A termes, 2504 génomes ont été séquencés (ce qui est considérable). Il se décomposait en 2 phases : une phase de séquençage + une phase d’analyse de la fréquence des variants dans les différentes populations.

Page 9: Cours 7 Maladies polygéniques/multifactorielles · 4/16 Ronéo 11 – UE5 Cours 7 2. Pourquoi étudier la génétique des maladies à hérédité multifactorielle ? Ces maladies

9/16 Ronéo 11 – UE5 Cours 7

Les chercheurs ont regardé la fréquence de l’allèle mineur MAF (l’allèle le moins représenté), ce qui donne des renseignements sur la fréquence des variants :

- En séquençage génome entier, ils ont pu détecter des MAF au-dessus de 1% - En séquençages des exons seulement, ils ont pu détecter des MAF à 0.1%

Résultats :

- Au total : o 88 millions de SNPs, la moitié inconnus (dont 24% d’Asie du Sud et 28% d’Afrique) o 3.6 millions d’indels o 60 000 variants structuraux

En ordonnée : le nombre de million de

variants par génome

Code couleur en fonction des

provenances : en orange l’Afrique

subsaharienne, en vert et violet l’Asie, en

bleu l’Europe et en rouge l’Amérique du

Sud

Ö On remarque une diversité génétique bien supérieur chez les subsahariens

- Génome typique : o 4-5 millions de sites polymorphes

� 99.9% de SNPs et petits indels � 2100-2500 variants structuraux

o Environ 20 millions de bases affectées, soit 0.6% du génome - La plupart des variants sont rares :

o Environ 64 millions avec MAF < 0.5% o Environ 12 millions avec MAF < 5%

De plus, on remarque que globalement, il y a plus de variabilité intra-population que inter-population.

3. Relations entre les variants Jusqu’ici on s’est intéressé à la génétique des populations en étudiant un marqueur donné, un locus

donné, on va maintenant aborder l’étude de la combinaison des variants pris 2 à 2, les fameux

haplotype dont on parlait plus haut, au sein desquels les allèles étaient en phase sur un chromosome.

a. Détermination de la phase

Dans cet exemple, on a pu déterminer les

allèles d’un individu pour deux loci situés

sur le même chromosome : SPN1 (les

allèles A et G) et SNP2 (allèles T et C).

Mais en réalité on ne sait pas si A est avec le T sur le même chromosome et le G avec le C ou si c’est

l’inverse (A avec C et G avec T).

Page 10: Cours 7 Maladies polygéniques/multifactorielles · 4/16 Ronéo 11 – UE5 Cours 7 2. Pourquoi étudier la génétique des maladies à hérédité multifactorielle ? Ces maladies

10/16 Ronéo 11 – UE5 Cours 7

Pour pouvoir déterminer cette phase, on se base sur des méthodes probabilistes en fonctions de la fréquence de relation, d’association d’allèle (= fréquence des différents haplotypes) dans la population générale.

Ces méthodes sont facilitées dans les familles car, connaissant la composition allélique des parents, on peut en déduire l’haplotype de la descendance. Ici, la mère étant homozygote, on déduit que le chromosome avec les allèles

A et C provient d’elle et donc que le chromosome avec les allèles G et T

provient du père => A et C sont en phase, G et T sont en phase. C’est d’autant plus facile quand on étudie plusieurs marqueurs sur plusieurs générations.

b. Haplotype et déséquilibre de liaison Attention ! : Ne pas confondre haplotype et déséquilibre de liaison L’haplotype est l’enchainement des allèles le long du chromosome ou d’une région chromosomique, il peut parental ou recombinant (recombinaison chromosomique chez la descendance). Le déséquilibre de liaison est une notion populationnelle, on étudie alors une population (et non plus une famille). Il s’est passé un grand nombre de génération avant d’arriver à celle que l’on étudie, et donc à la fréquence des haplotypes qui la compose. Le déséquilibre de liaison est déterminé à une génération n après n générations qui ont précédé celle étudiée. Les 4 points clés du déséquilibre de liaison :

- Association alléliques préférentielles entre deux locus différents - En présence de liaison : les locus sont génétiquement liés (sur le même chromosome) - Détecté à la génération n - Dans une population : c’est impossible à faire dans une famille puisqu’on parle de fréquence

des allèles Définition du déséquilibre de liaison Soient 2 locus A et B liés = sur un même chromosome

- Au locus A : on peut trouver les allèles A et a de fréquence f(A) = p et f(a) = 1-p - Au locus B : on peut trouver les allèles B et b de fréquence f(B) = q et f(b) = 1-q

Les fréquences sont mesurées dans une population de sujets non apparentés

Il existe alors 4 haplotypes possibles dans la population, les fréquences à l’équilibre de ces haplotypes sont :

- A/B avec f(A/B) = pq - A/b avec f(A/b) = p(1-q) - a/B avec f(a/B) = (1-p)q - a/b avec f(a/b) = (1-p)(1-q)

Il y a déséquilibre de liaison (DL) si les allèles des 2 locus ne sont pas associés indépendamment = la fréquence de l’haplotype étudié ne correspond pas à la fréquence attendue, la fréquence à l’équilibre D = freq haplotypique observée – freq à l’équilibre

Page 11: Cours 7 Maladies polygéniques/multifactorielles · 4/16 Ronéo 11 – UE5 Cours 7 2. Pourquoi étudier la génétique des maladies à hérédité multifactorielle ? Ces maladies

11/16 Ronéo 11 – UE5 Cours 7

Les valeurs varient entre 0 et 1

2 autres types de mesure du déséquilibre de liaison qui mettent en lumière 2 cas particuliers : - D’ = 1 (DL complet) si 1 haplotype sur les 4 est inexistant - r2 = 1 (DL parfait) si seuls 2 haplotypes existent => quand A est présent, il y a toujours B ;

quand a est présent il y a toujours b

c. Evolution du DL

- Au départ, il y n’y a qu’1 seul chromosome ancestral : 2 locus A et B => 1 haplotype - Mutations : apparition des allèles a et b => 3 haplotypes

o b est en DL complet avec A (l’inverse n’est pas vrai) o a est en DL complet avec B

- Recombinaison : apparition du 4ème haplotype a/b => dissipation du DL - Mutation supplémentaire sur un gène plus loin sur le chromosome portant l’haplotype a/b,

apparition de c o Le DL entre a et c est plus fort que le DL entre a et b : c est toujours avec a (DL très

fort) alors que b peut être présent avec a ou A La recombinaison est donc le principal facteur diminuant le DL MAIS le DL n’est pas 100% corrélé avec la distance physique. D’autres facteurs peuvent être impliqués :

- Facteurs démographiques o Croissance de la population : DL diminue (en augmentant le nombre de

recombinaisons) o Dérive génétique : mélange et migration de populations

- Sélection naturelle

d. Intérêts du DL Réduction de la liste des SNPs génotypés : En effet, on utilise alors des SNPs en r2 > 0.8 (ou SNP étiquette), donc en fort déséquilibre avec des marqueurs -> génotyper ces SNPs étiquettes revient à génotyper les marqueurs avec lesquels ils sont en DL : c’est le principe d’imputation.

Page 12: Cours 7 Maladies polygéniques/multifactorielles · 4/16 Ronéo 11 – UE5 Cours 7 2. Pourquoi étudier la génétique des maladies à hérédité multifactorielle ? Ces maladies

12/16 Ronéo 11 – UE5 Cours 7

III. Méthode d’étude de l’hérédité multifactorielle : l’association allélique

1. Etudes de liaison Liaison génétique : co-ségrégation des marqueurs plus souvent que le voudrait le hasard Etude de la co-ségrégation des marqueurs avec la maladie d’une génération à l’autre DANS LES FAMILLES. Les études liaison sont bien adaptées pour étudier des variants rares à effet fort => elles sont alors peu adaptées pour les maladies multifactorielles. On y étudie les marqueurs, les locus (quel que soit l’allèle considéré).

2. Etudes d’association génétique Recherche de marqueurs en DL avec le variant causal de la maladie. Les cas et contrôles sont issus d’une population (cas et contrôle). Les études d’association sont bien adaptées pour étudier les variants fréquents avec un faible impact sur la maladie. On y étudie les allèles.

Principes : l’étude repose sur l’association de l’allèle morbide au locus de la maladie avec les allèles des marqueurs voisins, on cherche alors à génotyper un variant en DL fort avec le variant causal.

- Comparaison des fréquences alléliques entre cas et contrôles : l’allèle surreprésenté chez les cas par rapport aux contrôles est celui qui est associé à la maladie.

- Test de Chi2 à 1ddl sur les observations des comptes des différents allèles -> on regarde l’Odds Ratio (OR) (= rapport des côtes de chaque allèle entre cas et contrôle)

o L’OR est généralement donné pour l’allèle mineur

o OR = 1 si l’allèle n’est pas du tout lié à la maladie

Page 13: Cours 7 Maladies polygéniques/multifactorielles · 4/16 Ronéo 11 – UE5 Cours 7 2. Pourquoi étudier la génétique des maladies à hérédité multifactorielle ? Ces maladies

13/16 Ronéo 11 – UE5 Cours 7

o Estimation avec l’intervalle de confiance (la formule n’est « bien évidemment pas à

apprendre ») Interprétation de l’association :

- L’allèle associé du marqueur est l’allèle causal = on a génotypé l’allèle causal

- L’allèle associé est DL avec l’allèle causal - Faux positif (test statistique)

3. Etude d’association pangénomique : GWAS

GWAS = Genome-Wide Association Study Pour une maladie, l’association est testée avec chacun des marqueurs identifiés dans le génome

En abscisse : les marqueurs, regroupés par chromosome.

En ordonnée : l’association (plus c’est haut, plus c’est génétiquement lié à la maladie) en –log10 de la

p-value.

La valeur de p (« p-value ») représente l’association génétique : plus elle est faible, plus les marqueurs

sont associés.

a. Exemple : le Wellcome Trust Case Control Consortium

Etude avec 2000 cas et 3000 contrôles pour 7 pathologies ! Les résultats ont montrés de nombreuses associations mais avec des effets modestes (OR < 1.5)

b. Problèmes inhérents au GWAS

Les populations de cas et contrôles doivent être homogènes -> la stratification des populations conduit à des faux positifs Dans les populations 1 et 2, l’allèle 2

n’est pas du tout associé à la

maladie, alors que dans la population

3 qui résulte du mélange des 1 et 2,

l’allèle est statistiquement associé =>

c’est un faux positif !

Page 14: Cours 7 Maladies polygéniques/multifactorielles · 4/16 Ronéo 11 – UE5 Cours 7 2. Pourquoi étudier la génétique des maladies à hérédité multifactorielle ? Ces maladies

14/16 Ronéo 11 – UE5 Cours 7

Pour éviter les erreurs et les faux positifs, il y a des précautions à prendre pour un GWAS : - Phénotype étudié doit être homogène et spécifique de la maladie - Population contrôle doit être bien choisie : comparable à la population cas en termes d’âge,

de sexe ratio, et de variabilité allélique o Pour cela, on fait un Analyse en Composante Principale : « classe » les populations

en fonction de leur variabilité génétique. - Allèles en équilibre de Hardy-Weinberg - Seuil fixé à p=5.10-8 - FONDAMENTAL : reproduire les résultats dans une cohorte indépendante (= on

recommence)

o Utiliser des échantillons de réplication indépendants -> crédibilité augmentée si investigations multiples :

� Dans le même groupe ethnique

� Puis dans un groupe ethnique différent (attention aux allèles population spécifique) : par exemple le gène PTPN22 associé aux maladies autoimmunes

est absents des populations asiatiques

4. Analyse fine

a. Inconvénient du Déséquilibre de Liaison

Le DL est nécessaire pour détecter une association entre deux allèles. Un DL fort est un atout pour détecter cette liaison allélique, mais c’est un inconvénient pour la localisation fine du marqueur.

b. Comment affiner l’association ? Réduire l’étendue du DL

- Augmenter la taille des échantillons : plus les échantillons sont grands plus ils reflèteront de recombinaisons, ce qui diminue le DL

- Tester l’association dans une autre population Densifier les variants dans la région

- Par imputation à partir d’un panel de référence (banques de séquençage) - Par séquençage chez les patients

Recourir à des phénotypes intermédiaires, si possible quantitatif (âge de début de la maladie, taux de lipide etc)

IV. Bilan des GWAS Aujourd’hui, les GWAS ont permis d’identifier plus de 1200 variants associés à 165 traits complexes. Ces variants sont la plupart du temps à effet modeste : OR~1.2. Absence de validation fonctionnelle : les variants sont finalement rarement identifiés. Ici un exemple pour la polyarthrite rhumatoïde :

on voit bien les effets faibles de chaque gène dans la maladie.

Page 15: Cours 7 Maladies polygéniques/multifactorielles · 4/16 Ronéo 11 – UE5 Cours 7 2. Pourquoi étudier la génétique des maladies à hérédité multifactorielle ? Ces maladies

15/16 Ronéo 11 – UE5 Cours 7

Forte association ne signifie pas forte prédiction individuelle : exemple de HLA-B27 dans la spondylarthrite ankylosante (SPA)

- Fort OR = 40 -> très forte association génétique - Variant présent chez 80-90% des patients (7% des témoins)

Ö Seulement 3-4% des B27 de la population générale vont développer un SPA ! Génétique des traits complexes : il y a une hérédité manquante qui pourrait provenir de

- Variants structurels - Interaction gène x gène : le gène pris tout seul n’a pas d’impact - Interaction gène x environnement - Epigénétique - Microbiote

Quelques succès des GWAS :

- Identifier de nouveaux traitements : traitement anti-TNF, anti IL-6, anti-CTLA4, anti-CD20 dans les maladies autoimmunes

o Découverte d’association avec des gènes ayant un rôle dans le mécanisme pathologique

o Exemple : psoriasis associé à IL-23R qui est impliqué dans la signalisation de la production d’IL-17 => succès du traitement des formes sévères par anticorps anti IL-17

- Comprendre l’inefficacité de certains traitements - Mieux ajuster les traitements = médecine personnalisée

Page 16: Cours 7 Maladies polygéniques/multifactorielles · 4/16 Ronéo 11 – UE5 Cours 7 2. Pourquoi étudier la génétique des maladies à hérédité multifactorielle ? Ces maladies

16/16 Ronéo 11 – UE5 Cours 7

Dédicace à la 6ème B du collège Rognoni