Rappel des objectifs du WP10 Mois 6 : cahier des charges de la bioinformatique pour un environnement...

Preview:

Citation preview

Rappel des objectifs du WP10

Mois 6 : cahier des charges de la bioinformatique pour un environnement transparent de calcul largement distribué

Mois 12 : cahier des charges pour un banc-test, sélection d’une application et document de planification

Mois 24 : rapport sur la première version d’une application biologique sur le banc-test

Mois 36 : rapport final incluant le compte-rendu de la deuxième version de l’application biologique sur le banc-test

Biologistes/Médecins Physiciens

Architecture Plate Hiérarchisée (CERN)

Données Copies multiples

Formats variables

Découpage des bases de données

Read/Write

Peu de copies

Peu de formats (4)

Idem

Read OU Write

Calcul Mise à jour quotidienne

Interactif -> Temps réel

Parallélisé (BLAST)

Pas de mise a jour

Batch

Pas de parallélisme

Comparaison des besoins des biologistes et des physiciens

Evaluation des environnements existants

Calcul distribué : Tests de Globus (Exposé Y. Legré, R. Météry) Contacts avec le Laboratoire d’Informatique de

Lille : FOCALE

Plates-formes bioinfo : Tests d’Applab (EBI) Contacts avec INRIA Grenoble

Une alternative pour le calcul distribué : FOCALE (LIFL)

Fédération de serveurs distants Approche composants Echange de données entre composants sur un

bus CORBA Interface graphique pour assembler les

composants (pipelining)

Generic component description

Trader entry properties (name = value) “name”=“mycomp”

Binary file path command line

I/O streams spec. Type, location...

Trader entry

Properties

Binary

File

Input Output

Factory

ConnectorC

omp

onen

t p

rod

uci

ng

dat

a

Com

pon

ent

con

sum

ing

dat

a

File

Socket

Console

Method

File

Socket

Console

Method

Con

nec

torO

utp

ut

Con

nec

torI

np

ut

CORBA

Any stream to any stream connectors

Un besoin à terme: la partition des bases de données

Objectif : accélérer tous les algorithmes de comparaison de séquences Exemple : BLAST, recherche d’homologie entre une séquence et

celles déjà annotées (9GB) Limitation : accès disque

Moyen : découper les bases de données biologiques sur plusieurs nœuds en local et sur la grille et paralléliser le BLAST

Outils existants ? Apport de DataGRID ? Besoin commun de partition avec les physiciens Besoin spécifique de parallélisme

WP 10 : organisation

Réunions bimensuelles Lyon, 10/1/01 : état de l’art en bioinformatique Prochaine réunion à Amsterdam le 7 Mars

Collaborations envisagées Avec EBI Avec LIFL : FOCALE

Draft d’un cahier des charges (N. Jacq)

Recommended