View
780
Download
0
Category
Preview:
Citation preview
Funded by:
Rendre les standards de description de biopuces accessibles:
réalisation d'un module de conversion inter-standard
Pierre Marguerite – DESS Bioinformatique Lille
EBI – Microarray Informatics Team
4 mai– 31 octobre 2004
Funded by:
04/10/2004 - DESS Bioinformatique Pierre Marguerite
Microarray Informatics Team2
Sommaire
• L’Institut Européen de Bioinformatique
• l’équipe informatique Microarray
• La standardisation des données de biopuces?
• Le projet•Les standards de description d’agencement•Contribution
•Bilan
Heidelberg
HinxtonUK
Monterotondo
Hamburg
Grenoble
Service Research Training Industry
European Molecular Biology Laboratory
EBI
Services Banques de données
Recherche en bioinformatique et en biologie moleculaire
IndustriePromouvoir des standards
Formation
Funded by:
04/10/2004 - DESS Bioinformatique Pierre Marguerite
Microarray Informatics Team4
Heidelberg
HinxtonUK
Monterotondo
Hamburg
Grenoble
Service Research Training Industry
European Molecular Biology Laboratory
EBI
Services Banques de données
Recherche en bioinformatique et en biologie moleculaire
IndustriePromouvoir des standards
Formation
Funded by:
04/10/2004 - DESS Bioinformatique Pierre Marguerite
Microarray Informatics Team6
l’équipe Microarray MicroArray Informatics Team
• les résultats d’expériences de biopuces
• Une petite équipe : 26 développeurs, annotateurs, doctorants
• Un projet ArrayExpress – Banque de données publique de données de biopuces
– Déclinaison en toxicogénomique et nutrigénomique
• MGED– Standardisation des données de biopuces
Funded by:
04/10/2004 - DESS Bioinformatique Pierre Marguerite
Microarray Informatics Team7
ArrayExpress
Funded by:
04/10/2004 - DESS Bioinformatique Pierre Marguerite
Microarray Informatics Team8
l’équipe Microarray MicroArray Informatics Team
• les expériences de biopuces -> petite équipe : 26 développeurs, annotateurs
• Un projet ArrayExpress – Banque de données publique de données de
biopuces– Déclinaison en toxicogénomique et nutrigénomique
• Le consortium MGED– Standardisation des données de biopuces
Funded by:
04/10/2004 - DESS Bioinformatique Pierre Marguerite
Microarray Informatics Team9
la standardisation ?• Hétérogénéité des applications et des techniques• Des éléments non pris en compte
=> expériences non comparables
• Nombreux formats de données– Même données -> beaucoup de manipulation
• Différents termes -> pour la même signification
• Le même terme -> des concepts différents
MAGE
Ontologie MGED
Recommandations MIAME
Funded by:
04/10/2004 - DESS Bioinformatique Pierre Marguerite
Microarray Informatics Team10
Le projet
• Un constat : de plus en plus de données à traiter et un manque d’outils
• Outil de conversion des fichiers de description d’agencement
Funded by:
04/10/2004 - DESS Bioinformatique Pierre Marguerite
Microarray Informatics Team11
Outil de conversion
Funded by:
04/10/2004 - DESS Bioinformatique Pierre Marguerite
Microarray Informatics Team12
Les descriptions d’agencement• Informations initiales avant une expérience
– méta données (contacts, un numéro de version, …)– Feature: position sur une lame de biopuces, définie par
ses coordonnées– Reporter: élément déposé sur une feature, qui a
certaines caractéristiques,– Composites: séquences composites entre les « reporter
» vers une entité biologique. • 2 formats:
– MAGE-ML :XML– ADF (Array Design File) : fichiers tabulaires
Funded by:
04/10/2004 - DESS Bioinformatique Pierre Marguerite
Microarray Informatics Team13
MAGE-ML (MAGE-OM)
Funded by:
04/10/2004 - DESS Bioinformatique Pierre Marguerite
Microarray Informatics Team14
MAGE-ML (suite)
Funded by:
04/10/2004 - DESS Bioinformatique Pierre Marguerite
Microarray Informatics Team15
Array Design File
adh
adr
adc
Header
contacts
Informations techniques
Funded by:
04/10/2004 - DESS Bioinformatique Pierre Marguerite
Microarray Informatics Team16
Array Design File
adr
adc
Feature /Reporter
FeaturesReporters
Funded by:
04/10/2004 - DESS Bioinformatique Pierre Marguerite
Microarray Informatics Team17
Array Design File
Composite
CaractéristiquesLiens avec les reporters
Funded by:
04/10/2004 - DESS Bioinformatique Pierre Marguerite
Microarray Informatics Team18
Contribution• Application
– indépendante (pas de DB)
– Multi plateforme
• En 2 étapes:– Validation
– conversion
Funded by:
04/10/2004 - DESS Bioinformatique Pierre Marguerite
Microarray Informatics Team19
Validation (une étape obligatoire)
• Analyse syntaxique et lexicale des données– Définition de règles de validation – Utilisation de fichiers XML pour décrire les
structures des fichiers de données (ADF)
Vérification des termes de la ontologie MGEDVérification des banques de données approuvées
Rapport d’erreurs pour correction (standardisation des données)
Funded by:
04/10/2004 - DESS Bioinformatique Pierre Marguerite
Microarray Informatics Team20
Implémentation - choix techniques
-Utilisation de MAGE-stk (perl ou Java)-Simplicité d’installation-Multi plateforme
- Multiples formats de sortie
Funded by:
04/10/2004 - DESS Bioinformatique Pierre Marguerite
Microarray Informatics Team21
Problèmes rencontrés• Mémoire
– Beaucoup de données– Et leur redondance
• Flexibilité– Acceptation et correction d’éléments incorrects– Nouvelles versions des formats de descriptions– Support minimum pour futurs applications des
biopuces
Funded by:
04/10/2004 - DESS Bioinformatique Pierre Marguerite
Microarray Informatics Team22
Une adresse : http://www.ebi.ac.uk/adf
http://www.ebi.ac.uk/adf/
Funded by:
04/10/2004 - DESS Bioinformatique Pierre Marguerite
Microarray Informatics Team23
Bilan• Bilan pour l’équipe
– Premier outil de vérification complète des données de description
– Soulager le travail des annotateurs en déplaçant la validation des données de description à la source (biologistes ou fabricants)
• Un bilan personnel positif, mais douloureux– 6 mois en Angleterre– Gestion de projet– Nombreux contacts
Funded by:
04/10/2004 - DESS Bioinformatique Pierre Marguerite
Microarray Informatics Team24
Recommended