Rappel des objectifs du WP10
Mois 6 : cahier des charges de la bioinformatique pour un environnement transparent de calcul largement distribué
Mois 12 : cahier des charges pour un banc-test, sélection d’une application et document de planification
Mois 24 : rapport sur la première version d’une application biologique sur le banc-test
Mois 36 : rapport final incluant le compte-rendu de la deuxième version de l’application biologique sur le banc-test
Biologistes/Médecins Physiciens
Architecture Plate Hiérarchisée (CERN)
Données Copies multiples
Formats variables
Découpage des bases de données
Read/Write
Peu de copies
Peu de formats (4)
Idem
Read OU Write
Calcul Mise à jour quotidienne
Interactif -> Temps réel
Parallélisé (BLAST)
Pas de mise a jour
Batch
Pas de parallélisme
Comparaison des besoins des biologistes et des physiciens
Evaluation des environnements existants
Calcul distribué : Tests de Globus (Exposé Y. Legré, R. Météry) Contacts avec le Laboratoire d’Informatique de
Lille : FOCALE
Plates-formes bioinfo : Tests d’Applab (EBI) Contacts avec INRIA Grenoble
Une alternative pour le calcul distribué : FOCALE (LIFL)
Fédération de serveurs distants Approche composants Echange de données entre composants sur un
bus CORBA Interface graphique pour assembler les
composants (pipelining)
Generic component description
Trader entry properties (name = value) “name”=“mycomp”
Binary file path command line
I/O streams spec. Type, location...
Trader entry
Properties
Binary
File
Input Output
Factory
ConnectorC
omp
onen
t p
rod
uci
ng
dat
a
Com
pon
ent
con
sum
ing
dat
a
File
Socket
Console
Method
File
Socket
Console
Method
Con
nec
torO
utp
ut
Con
nec
torI
np
ut
CORBA
Any stream to any stream connectors
Un besoin à terme: la partition des bases de données
Objectif : accélérer tous les algorithmes de comparaison de séquences Exemple : BLAST, recherche d’homologie entre une séquence et
celles déjà annotées (9GB) Limitation : accès disque
Moyen : découper les bases de données biologiques sur plusieurs nœuds en local et sur la grille et paralléliser le BLAST
Outils existants ? Apport de DataGRID ? Besoin commun de partition avec les physiciens Besoin spécifique de parallélisme
WP 10 : organisation
Réunions bimensuelles Lyon, 10/1/01 : état de l’art en bioinformatique Prochaine réunion à Amsterdam le 7 Mars
Collaborations envisagées Avec EBI Avec LIFL : FOCALE
Draft d’un cahier des charges (N. Jacq)