Analyse rétrospective de données de biopuces
Etudiants Pierre MARGUERITE Isabelle PHILIP
Etude de l’expression des gènes du tissu placentaire dans les grossesses diabétiques avec macrosomies par la technique des
« Microarrays ».
Tuteurs Pierre-Marie DANZE
Arnaud SCHLOESING DESS Bioinformatique – Lille
Plate-forme de génomique fonctionnelle
Projet Bioinformatique
16 avril 2004 DESS BIOINFORMATIQUE Pierre MARGUERITE - Isabelle PHILIP
2
Le projet bioinformatique
I. Les données de biopuces 1. Etude initiale 2. Analyse initiale
II. L’analyse rétrospective1. Différentes étapes2. Perspectives et recommandations
16 avril 2004 DESS BIOINFORMATIQUE Pierre MARGUERITE - Isabelle PHILIP
3
Etude initiale: présentation
•Gènes marqueurs d’une « grossesse macrosomique »
•Etude de transcriptome de tissus placentaires
•3 profils - 2 patientes • sans diabète - grossesse normale - témoins T1 et T2• diabète type 1 - macrosomie foetale - DM1 et DM2• diabète type 1 - sans macrosomie foetale - DSM1 et
DSM2
16 avril 2004 DESS BIOINFORMATIQUE Pierre MARGUERITE - Isabelle PHILIP
4
Etude : les biopuces
•5 lames
•1920 gènes
•3 dépôts (spots) identiques par gène - Triplicate
16 avril 2004 DESS BIOINFORMATIQUE Pierre MARGUERITE - Isabelle PHILIP
5
Analyse initiale
•Normalisation Lowess
•2 approches différentes•Comparaison intra/inter profil
•Ebauche d’analyse par classification
16 avril 2004 DESS BIOINFORMATIQUE Pierre MARGUERITE - Isabelle PHILIP
6
Analyse rétrospectiveDifférentes étapes
I. Normalisation
II. Sélection par un seuil d’expression sur lames DM
III. Confrontation des profils de patientes
IV. Classification
V. Dernière sélection : gènes candidats ?
16 avril 2004 DESS BIOINFORMATIQUE Pierre MARGUERITE - Isabelle PHILIP
7
Logiciel Jaguar
Logiciel MIDASLowess
Par bloc
Bruit de fond
Flags
Triplicates
Données normalisées
Normalisation
1920 gènes
50-60 %
100%
X 5
16 avril 2004 DESS BIOINFORMATIQUE Pierre MARGUERITE - Isabelle PHILIP
8
Normalisation : qualité des spots
• Spots écartés en fonction des flags
• Trop peu de signal (Cy3 et Cy5)• Biopuces non dédiées • -> 23% des spots
• Forme du spot non conforme (Cy3 ou Cy5)• 30% des spots
16 avril 2004 DESS BIOINFORMATIQUE Pierre MARGUERITE - Isabelle PHILIP
9
Sélection par un seuil d’expression sur lames
DM
•Rôle du seuil d’expression S• Ratio d’expression R = Log2(Cy5/Cy3) • - S < R < + S
•Quelle valeur de seuil ?DM1 DM2
S = 0,5 |Cy5| = 1,414 *|Cy3| 237 – 12 % 389 – 20%
S = 1 |Cy5| = 2 *|Cy3| 41 - 2% 55 – 3%
16 avril 2004 DESS BIOINFORMATIQUE Pierre MARGUERITE - Isabelle PHILIP
10
Confrontation des profils de patientes
T2
DM
DSM
T2 DM DSM
S = 0,5 => 58 gènes
S = 1 => 6 gènes
Confrontation - Profils d’expression des gènes
Rejet Rejet
4 confrontations différentes
16 avril 2004 DESS BIOINFORMATIQUE Pierre MARGUERITE - Isabelle PHILIP
11
Classification
• Classification hiérarchique non adaptée
• K-means• Différentes distances• Recherche du nombre de centres
• Sélection visuelle des clusters• Liste de 63 gènes
nécessité d’une dernière sélection
16 avril 2004 DESS BIOINFORMATIQUE Pierre MARGUERITE - Isabelle PHILIP
12
Dernière sélection : gènes candidats ?
•Gènes répondant à 2 critèresSeuil d’expression de 1 entre DM et T2Seuil d’expression de 1 entre DM et DSM
•AF055033
•NM_000457
•NM_003840
•NM_014517
•NM_001344
•NM_007218
•AK025844
•U80232
•D26067
•NM_013403
• Aucun gène identifié par l’analyse initiale
SynthèseNotre approche
1 2
Normalisation
Outils
Méthode
Finesse Local
Flags Oui
Bruit de fond Oui
Correction
Flags
Calcul médiane triplicate Oui
Suppre° pts +- 15% médiane
Oui
Triplicate Moyenne géométrique
Ratio d’intensité
Analyse
Seuil d'expression 0,5 1
Comparaison intra groupe Oui Non Non
Comparaison inter groupe
Résultat 14 gènes 2 à 10 gènes
Moyenne arithmétique
Log2 (moy. Cy5 / moy.Cy3)
Oui
Non
Midas
Lowess
Global
Non
Analyse initiale
Non
Suppression manuelle
Non
? ?
16 avril 2004 DESS BIOINFORMATIQUE Pierre MARGUERITE - Isabelle PHILIP
14
Perspectives et recommandations
• Impact du logiciel de lecture• Options de normalisation
• Traiter les spots rejetés / forme ?
• Choix du seuil d’expression
=> Etude avec biopuces de référence
• Multiples options faire des choix
• Nécessité d’un certain recul• Intention protocole, design, démarche
16 avril 2004 DESS BIOINFORMATIQUE Pierre MARGUERITE - Isabelle PHILIP
15
Bilan
•Apport technique • Biopuce• Normalisation• Classification
•Dialogue enrichissant avec les biologistes