60
Afin d’assurer une cohérence de l’organisation de la fonction informat FORMULAIRE DE DEMANDE D’HOMOLOGATION 2012 D’UN CENTRE AUTOMATISÉ DE TRAITEMENT DE L’INFORMATION (CATI) Un Cati (Centre automatisé de traitement de l’information) se définit comme une modalité d’organisation de la production informatique et de la production de services en soutien à la production scientifique sur une thématique donnée ou relative à l’appui à la recherche, nécessitant l’intégration de compétences informatiques adaptées pour conduire l’intégralité du processus (« de la donnée brute à la valorisation »). La mission du Cati se caractérise par le faisceau de critères cumulatifs suivant : 1. Le Cati exerce une mission de service destinée à une communauté (géographique, thématique…) selon des modalités Le formulaire suivant complété de tous documents utiles permet à la direction dont relève le Cati (Chef de département, Directeur d’Appui…) d’apporter les éléments nécessaires à la validation de ces critères. Ce dossier devra permettre ensuite à la Commission d’homologation de proposer ou non à la Présidente de l’Inra l’inscription du Centre parmi les Centres de traitements identifiés de l’Inra pour une durée maximale de 4 ans.

formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

  • Upload
    lythu

  • View
    214

  • Download
    1

Embed Size (px)

Citation preview

Page 1: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

Afin d’assurer une cohérence de l’organisation de la fonction informatique à l’Inra, à laquelle s’adosse le régime indemnitaire applicable aux fonctionnaires affectés au traitement de l’information, la Présidente de l’Inra a institué une Commission d’homologation des Centres automatisés de Traitement de l’Information. Cette commission est chargée de proposer à la Présidente de l’Inra une liste de ces Centres dont les services rendus répondent aux critères fixés et adaptés au contexte particulier de l’Inra.

FORMULAIRE DE DEMANDE D’HOMOLOGATION 2012D’UN CENTRE AUTOMATISÉ DE TRAITEMENT DE L’INFORMATION

(CATI)

Page 1 sur 42

Un Cati (Centre automatisé de traitement de l’information) se définit comme une modalité d’organisation de la production informatique et de la production de services en soutien à la production scientifique sur une thématique donnée ou relative à l’appui à la recherche, nécessitant l’intégration de compétences informatiques adaptées pour conduire l’intégralité du processus (« de la donnée brute à la valorisation »).

La mission du Cati se caractérise par le faisceau de critères cumulatifs suivant :

1. Le Cati exerce une mission de service destinée à une communauté (géographique, thématique…) selon des modalités contractualisées et publiées

2. Le collectif doit être organisé et dirigé,

3. Le service rendu doit être continu et mobiliser dans la durée le spectre adapté de compétences informatiques nécessaires.

Le formulaire suivant complété de tous documents utiles permet à la direction dont relève le Cati (Chef de département, Directeur d’Appui…) d’apporter les éléments nécessaires à la validation de ces critères. Ce dossier devra permettre ensuite à la Commission d’homologation de proposer ou non à la Présidente de l’Inra l’inscription du Centre parmi les Centres de traitements identifiés de l’Inra pour une durée maximale de 4 ans.

Page 2: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

I. Identification du Cati

Nom et nature du Cati (choisissez et renseignez une des options ci-dessous): BBRIC

Intitulé du Cati : Bioinformatique, Biodiversité, Représentation et Intégration des Connaissances  (BBRIC)

Centré ‘objet’(à préciser)

Traitement de l’information dans le cadre des recherches « des gènes aux communautés d’organismes ».

Centré ‘compétences’(à préciser)

Centré ‘services’(à préciser)

La notion de Cati ‘centré’ est défini dans le rapport « Propositions relatives à la reconfiguration de Catis 2012 et à leurs modalités de gouvernance», annexe de la note d’accompagnement.

Nom du(des) responsable(s) du Cati candidat à l’homologation : Nom, prénom, matricule, corps, grade, emploi type, fonctions informatiques actuelles pour les personnels Bap E ou disciplines pour les scientifiques.

Jérôme Gouzy, IR2 SPE, E1B22, Chef de projet ou expert en développement et déploiement d’applications.

Responsable de la Plateforme Bioinformatique LIPM/SPEhttp://lipm-bioinfo.toulouse.inra.fr depuis 2004

Responsable du CATI 1ère génération ‘BioInformatique des Plantes-Agresseurs-Symbiotes’ (BIPAS) – http://cati-bipas.toulouse.inra.fr 2008-2012

Représentant du département SPE au sein de la Cellule Bioinformatique de l’INRA. 46 publications de rang A en génomique et bioinformatique; 8 en premier ou dernier

nom; facteur H: 23 ; nombre total de citations: 4491 (source web of science)

Département(s) ou direction(s) pilote(s) du Cati (lorsque le Cati est ancré à plusieurs départements précisez le(s) département(s) leader(s) du pilotage) :

Santé des Plantes et Environnement (SPE) – département leader du pilotageBiologie Végétale (BV)

Renseignements concernant les unité(s) concernée(s) par le Cati :

Nom de l’unité Type Nom du directeur Centre Département

piloteLIPM UMR441 Dominique Roby Toulouse SPE

CBGP UMR1062 Flavie Vanlerberghe Montpellier SPE

UMR1355 Pierre Abad PACA SPE

Page 2 sur 42

Page 3: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

ISA (Sophia)

BF2I UMR203 Yvan RahbéClermont Ferrand (Lyon)

SPE

BIOGER-CPP UR1290 Marc-Henri Lebrun Versailles-Grignon SPE

IGEPP UMR1349 Denis Tagu Rennes SPE

IRHS UMR1345 Jean-Pierre Renou Angers-Nantes GAP

AE UR406 Yves Le Conte PACA (Avignon) SPE

BFP UMR1332 Thierry Candresse Bordeaux BVSAVE UMR1065 Denis Thiery Bordeaux SPELFP UR1199 Michel Rossignol Montpellier BVIJPB UMR1318 David Bouchez Versailles BV

B&PMP UMR0386 Alain Gojon Montpellier BVDGIMI UMR1333 Patrick Tailliez Montpellier SPE

II. Descriptif du Cati

1. Caractérisation de la mission du Cati :

1.1. Nature de la mission Cette description doit permettre de caractériser les missions du Cati candidat en termes d’objecti fs scienti f iques, de compétences, ou de services et/ou organisationnels à l ’appui desquels œuvre ce Cat i candidat (environ 20 lignes). Elle peut être, le cas échéant, accompagnée de tout document nécessaire.

Dans une perspective de biologie intégrative, l’informatique scientifique de nos départements doit offrir aux biologistes les outils et les méthodes bioinformatiques pour: structurer l’information, comprendre les données, représenter et transférer les connaissances tout au long du continuum d’intégration « des gènes aux communautés d’organismes ». La mission du CATI sera donc de développer, et de mettre en œuvre les solutions informatiques et bioinformatiques qui appuieront les questionnements et projets scientifiques des laboratoires des départements dont nous dépendons.

L’offre de services, de formation, de support à projets, de développement et de mise à disposition d’outils, de méthodes et d’expertises sera organisée selon 3 axes.

I) Organisation et régulation des génomes

Cet axe regroupe les activités liées aux analyses de données « omiques » : annotation structurale et fonctionnelles des génomes, analyse de l’expression et des régulations aux niveaux transcriptomique, protéomique et épigénétique.

II) Génomique comparative et caractérisation de la biodiversité

Ce deuxième axe regroupera les activités liées aux analyses multi-espèces. Tant pour le transfert de connaissances (génomique comparative), la classification et l’analyse évolutive des espèces (phylogénie, phylogénomique) et la caractérisation des espèces et des communautés d’espèces (phénotypes, barcodes, génomes, métagénomes).

III) Intégration et représentation des connaissances

Page 3 sur 42

Page 4: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

Les ruptures technologiques récentes permettent d’une part une analyse fine et simultanée des processus de régulation des deux partenaires des interactions pathogènes ou symbiotiques. D’autre part, les données d’expression et d’interaction se multiplient sur de nombreuses espèces et pour certaines espèces sur de nombreux génotypes. Cet axe prendra en charge les activités liées à l’intégration et à la représentation des connaissances (moléculaires, phénotypiques, spatiales). Cela impliquera la mise en œuvre de méthodes et d’outils de méta-analyse, de modélisation, de structuration, de représentation et de transfert de connaissances entre espèces.

Les compétences informatiques qui seront mises en œuvre par les membres du CATI balaient un spectre très large de l’ingénierie informatique : administration des systèmes et des bases de données, traitement du signal, modélisation, conception de bases de données, d’interfaces utilisateurs et de programmes d’analyses.

1.2. Communauté servie Identification de la communauté thématique et/ou géographique à qui les services sont destinés (environ 15 lignes).

Les laboratoires des départements participant au CATI définissent les organismes d’intérêt et les technologies pour la production des données, les biologistes de ces laboratoires forment donc le premier et principal cercle des utilisateurs des outils et services mis à disposition par le CATI.

Le deuxième cercle des utilisateurs biologistes est constitué de tous les utilisateurs anonymes qui accèdent aux ressources publiques que nous mettons à disposition soit via des bases de données, des serveurs web spécialisés, des portails intégratifs ou des services web.

La deuxième communauté servie est constituée par les bioinformaticiens de l’Institut ou d’ailleurs qui utilisent les outils bioinformatiques que nous développons ou les services web que nous mettons à disposition afin de proposer un accès normalisé aux données et services que nous maintenons.

1.3. Modes d’interaction et d’information prévus avec la communauté bénéficiaire du service :Environ 15 lignes

Interaction avec les DU

Nous soutenons la proposition d’un compte rendu annuel auprès des directeurs d’unités et des chefs de département. Ceci, afin que les responsables puissent avoir une vision globale des activités de tous les CATI.

Interaction avec les chercheurs

D’autre part, pour communiquer directement avec les chercheurs, nous prévoyons de coupler aux 2 assemblées générales annuelles (cf 2.2) destinées à la communication et aux échanges intra CATI, une journée supplémentaire qui serait destinée aux chercheurs de nos départements.

Cette journée thématique (soit 8 thèmes sur 4 ans), sera organisée en collaboration avec les services communication de nos départements respectifs pour assurer la plus large diffusion.

Page 4 sur 42

Page 5: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

Elle sera ouverte à tous les utilisateurs biologistes concernés par le thème proposé et aura pour vocation à la fois d’assurer la diffusion de nos outils mais aussi de recueillir en direct les demandes des chercheurs.

Ce mode d’interaction direct, à destination de personnes intéressées par un thème particulier, se substituerait à la mise en place d’un conseil des utilisateurs qui, vu la taille de la communauté, ne couvrirait les différents profils d’utilisateurs que de façon très superficielle et n’assurerait pas une diffusion efficace de l’information.

En outre, un des « projets structurants » de notre futur CATI proposera une solution technique d’interaction avec les utilisateurs dans le cadre d’une activité de service (projet « BBRIC WorkSpace » en Annexe).

Gestion des demandes

Pour les laboratoires relevant du CATI, les nouvelles demandes de soutien (analyse de données, construction de bases de données, participation à des projets en réponse à des appels d’offre, etc.), se feront via les membres du CATI lorsqu’un membre du CATI sera présent dans le laboratoire, via les responsables des plateaux/plateformes ou encore à travers le responsable du CATI dans les autres cas. Il n’est pas prévu d’appel d’offre à date fixe (les plateaux/plateformes existantes ont déjà leur politique) mais une analyse et un arbitrage au fil de l’eau des demandes par les responsables des organisations en place (au niveau du laboratoire, des plateformes ou du CATI). Cette organisation souple, validée dans le CATI de 1ere génération BIPAS, permet de s’adapter aux multiples calendriers des appels d’offre des agences de financement et propose ainsi aux laboratoires une réactivité compatible avec le contexte du monde de la recherche.

Diffusion

De plus, comme ces dernières années, nous continuerons à présenter les activités du CATI lorsque nous y serons invités. Nous avons créé un nouveau wiki (http://cati-bbric.toulouse.inra.fr) pour présenter les missions, l’organisation, les réalisations du réseau mais aussi les services disponibles aussi bien pour les biologistes que pour les bioinformaticiens à la recherche de solutions bioinformatiques.

Finalement, afin de participer à la visibilité de la bioinformatique de l’INRA, les outils les plus originaux ont également vocation à être publiés dans les revues spécialisées telles que « bioinformatics », «  BMC bioinformatics », etc. ; le plus souvent sous forme d’ « application note », de « software », de « databases » et parfois d’articles de recherche. Les publications académiques sont les vecteurs de communications les plus adaptés aux outils informatiques que nous développons et permettent de toucher une communauté bien plus large que l’Institut.

1.4. Modalités prévues d’évaluation du service rendu à la communauté :Environ 15 lignes

Notre organisation est un réseau dont les membres sont directement au contact d’une partie significative de la communauté servie composée des biologistes de nos laboratoires qui sont les premiers utilisateurs de nos développements informatiques. Dans ce cas, même si l’évaluation est difficilement quantifiable, elle se fait « en direct » et quotidiennement ce qui garantit l’adéquation de nos développements par rapport aux besoins des utilisateurs finaux.

Page 5 sur 42

Page 6: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

En outre les journées thématiques (cf 1.3) seront aussi l’occasion de capturer à un niveau plus large le niveau de satisfaction des utilisateurs sur chacun des thèmes abordés par le CATI.

Une grande partie de l’activité de service sera automatiquement mesurée lorsque le projet ‘BBRIC Workspace’ sera achevé et mis en production (cf Annexe pour une description).

Nous organiserons également le monitoring de nos serveurs web et de nos services web afin de mesurer plus précisément l’évolution du périmètre de la communauté servie.

D’autres indicateurs de la pertinence et de la reconnaissance du service rendu seront mesurés. Il s’agit en l’occurrence de la présence en tant que co-auteurs des membres du CATI sur des publications/posters de biologie et du nombre de citations de nos développements dans la bibliographie.

2. Organisation du Cati

2.1. Description du collectif de travail

Produire à cet effet, en utilisant le fichier Excel en annexe:- la liste nominative des agents participant au collectif de travail :

nom, prénom, matricule, corps, grade, emploi type, fonctions informatiques actuelles, bénéfice actuel éventuel de la PFI, pour les personnels temporaires la date de fin de leur contrat.

Matricule Nom usuel PrénomCode Grade Centre Unité PFI Code emploi

SPE BAP E 115428

QBAA-

PUYOULET Patrice AI23 CR CLERMONT

FERRA 0203 BF2I ANALYSE E3A21 19577

E CARRERE Sébastien IR2 31 CR TOULOUSE 0441 LIPM ANALYSE E1B22 110934

F COTTRET Ludovic IR2 31 CR TOULOUSE 0441 LIPM ANALYSE E1E25

17373J DA ROCHA Martine AI 21 CR PACA 1355 ISA ANALYSE E3B22 111066

ZDEHNE GARCIA Alexandre IE2 24 CR MONTPELLIER 1062 CBGP ANALYSE E2B22

19745M DELEURY Emeline IR2 21 CR PACA 1355 ISA

CHEF DE PROJET E1B22

20891H DORKELD Franck IR2 24 CR MONTPELLIER 1062 CBGP ANALYSE E1B22

15502A GAUTHIER Jean-Pierre IEHC 30 CR RENNES 1349 IGEPP ANALYSE E2B22

15086Y GOUZY Jerome IR2 31 CR TOULOUSE 0441 LIPM

CHEF DE PROJET E1B22

122044G GSCHLOESSL Bernhard IR2 24 CR MONTPELLIER 1062 CBGP ANALYSE E1B22

14109L HUARD Alain ATP2

34 CR ANGERS-NANTES 1345 IRHS E5XP1

17454X LEGEAI Fabrice IE2 30 CR RENNES 1349 IGEPP ANALYSE E2B22

15579J MORISON Nicolas AI 21 CR PACA 0406 AE ANALYSE E3C23 15205

C PIRY Sylvain IE1 24 CR MONTPELLIER 1062 CBGP ANALYSE E2B22 99604

Q SALLET Erika IE2 31 CR TOULOUSE 0441 LIPM ANALYSE E2B22 114928

X SENINET Imène IE2 24 CR MONTPELLIER 1333 DGIMI ANALYSE E2B22

14609E SIMON Adeline IE2 11 CR VERSAILLES 1290 BIOGER CPP ANALYSE E2B22

BV BAP E 19089

Z FIZAMES Cécile IE2 24 CR MONTPELLIER 0386 B&PMP ANALYSTE E2B22

18738 GARCIA Virginie IE2 22 CR BORDEAUX 1332 BFP ANALYSTE E2B22

Page 6 sur 42

Page 7: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

S 15340

Z TAUZIN Marc TREX 24 CR MONTPELLIER 1199 LPF ANALYSTE E4X21 21844

TTRAN NGOC

DANH Joseph AI 11 CR VERSAILLES 1318 IJPB ANALYSTE E3B22

BAP A INRA, BAP E CNRS ou Chercheurs en Bioinformatique

BLANCARD Dominique IRHC 22 CR BORDEAUX 1065 SAVE

BRIAND Martial AI34 CR ANGERS-

NANTES 1345 IRHS A3A23

LE BERRE Alain TREX 11 CR VERSAILLES 1290 BIOGER CPP

COURCELLE EmmanuelIR1

CNRS 31 CR TOULOUSE 0441 LIPMChef

d’exploitation E

RANCUREL CorinneIE2

CNRS 21 CR PACA 1355 ISA ANALYSTE E

DANCHIN EtienneCR1

INRA 21 CR PACA 1355 ISA

COLELLA StephanoCR1

INRA23 CR CLERMONT

FERRA 0203 BF2I

CHARLES Hubert

MdC INSA-Lyon

23 CR CLERMONT FERRA 0203 BF2I

2.2. Modes d’organisation et de gouvernance prévus du Cati(Organisation du travail et contraintes de service éventuelles, processus d’orientation et d’arbitrage, champs de responsabilité du responsable de Cati, modalités de dialogue entre le Cati et les DUs des personnels appartenant au Cati, affectation des moyens …)

Gouvernance

La responsabilité du CATI sera assumée par Jérôme Gouzy (IR SPE). Le responsable rendra compte à l’autorité du CATI.

L’autorité du CATI aura pour double rôle de valider la pertinence des projets et des réalisations par rapport aux stratégies scientifiques des départements et de garantir la cohérence de ses activité par rapport à l’organisation et à l’animation de la bioinformatique aux seins des départements, à l’INRA et en France.

Elle sera composée de : Olivier Le Gall, Chef du Département Santé des Plantes et Environnement (SPE) Frédéric Gaymard, Chef du Département Biologie Végétale (BV) Christine Gaspin qui anime la Cellule Bioinformatique et représente l’INRA au sein de

nombreuses instances nationales et internationales. Sébastien Aubourg, Directeur de Recherche à l’Unité de Recherche en Génomique

Végétale, expert bioinformatique en biologie végétale.

Modes d’organisation 

Nos missions conduisent la plupart d’entres nous à mener simultanément plusieurs projets de durées, de périmètres et de portée variables, et ce dans des contextes divers (Equipe, Laboratoire, Plateau, Plateforme, projet ANR, projet LABEX, projet Investissement d’Avenir, etc.). Certains contextes sont souples mais d’autres sont largement contraints par des engagements contractuels pris lors de la réponse à l’appel d’offre ou simplement contraints par la compétition/collaboration scientifique internationale. De plus, il est important de noter que de nombreux projets du CATI ont démarré avant cette période d’homologation et que beaucoup d’entre eux auront une durée de vie plus importante que les 4 ans de l’homologation.

Page 7 sur 42

Page 8: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

Cette variabilité se déclinant au niveau de l’organisation des projets, il semble, d’une part, difficile de définir un mode d’organisation « modèle » pour l’ensemble des projets du CATI et d’autre part de faire comme si l’organisation CATI pouvait ne pas tenir compte des organisations déjà existantes.

C’est pourquoi, nous proposons de structurer notre activité sur la base de projets, mais chacun des projets CATI (existant ou nouveau) aura une durée de vie propre, un périmètre et un mode de fonctionnement propre, sous la responsabilité du responsable du projet.

La mise en œuvre de méthodologies de génie logiciel permettant la meilleure réactivité et la satisfaction des utilisateurs ainsi que l’utilisation de bonnes pratiques de développement seront encouragées. Leur diffusion ne rentre pas dans le cadre du CATI étant donné que cet objectif fait déjà partie des missions des PEPI et de la formation permanente. Les choix liés à la gestion du processus de développement seront donc faits projet par projet et seront laissés au libre arbitre de chaque responsable de projet.

Trois types de projets sont et seront mis en œuvre par le CATI.

Les « projets phares », qui sont pour la plupart les ressources bioinformatiques identifiées comme critiques lors des audits du système d’information. Ce sont généralement des outils d’analyse ou des bases de données à durée de vie longue et à visibilité nationale ou internationale.

Une liste représentative de projets phares en cours est proposée en Annexe.

Les « projets structurants » couvriront au moins deux des trois axes déclinés par le CATI. Ce seront principalement de nouveaux projets.

Par exemple un projet centré autour des approches de phylogénomique et de génomique comparative pourrait couvrir les trois axes car ce sont des méthodes et outils utilisés aussi bien pour annoter les génomes, caractériser la biodiversité mais également pour transférer les connaissances entre espèces.

Un autre projet inter axes possible serait le projet de caractérisation par séquençage génomique de plusieurs centaines de représentants de la Collection Française de Bactéries associées aux Plantes (CIRM-CFBP) d’Angers (projet soumis à l’AIP Bioressources par P. Portier).

Les projets structurants seront également abordés d’un point de vue technologique (interoperabilité, applications orientés services, metacatalogues, moteurs de recherche, etc.) afin de mettre en place une architecture distribuée qui permettra, à terme, d’intégrer les différents types de données et niveaux de connaissances.

Un exemple de projet technologique structurant en cours de prototypage est décrit en Annexe (projet ‘BBRIC Workspace’), il s’agit de la mise en place d’un environnement partagé pour la gestion à long terme des résultats d’analyses, l’optimisation et la mesure de l’activité de service que nous assumons.

Le troisième type de projet pourrait s’intituler « Projet de développement d’expertise ». Il s’agirait de travailler seul ou à plusieurs en vue de développer et/ou formaliser une expertise technique ou méthodologique rare pour en faire bénéficier tout le CATI. Cela pourrait être purement informatique (ex : programmation GPU, virtualisation, évaluation de solutions « cloud ») ou sur un type d’analyse de données très pointu. Les experts du CATI qui auront formalisé leur expertise (documents, formations) joueront un rôle de référence important pour garantir le niveau de compétences global du CATI. Ce rôle et cette contribution à la

Page 8 sur 42

Page 9: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

communauté CATI seront reconnus et mis en valeur à chaque fois que le responsable du CATI sera sollicité pour donner son avis sur les agents. D’autre part, les expertises développées et formalisées dans le CATI seront proposées pour une plus large diffusion aux PEPIs. La mise en place de tels projets pourra se faire soit de façon spontanée soit pour mettre en place une réponse efficace et pertinente à un nouveau problème partagé par de nombreux projets scientifiques.

Interaction avec les DU

Afin de formaliser le « label CATI » des nouveaux projets avec les DU des participants, le porteur du projet fera la demande de labellisation auprès du responsable du CATI. A cet effet, à travers une fiche synthétique, il présentera les objectifs, la durée, les moyens, l’effort en ETP du projet. Si le projet est validé, le responsable du CATI signera et enverra le document aux DU concernés qui pourront alors valider ou pas la participation de leurs agents au projet.

Animation Inter-CATI bioinformatique

Il s’agit d’une mission de la cellule bioinformatique institutionnelle au sein de laquelle le responsable de CATI proposé est nommé, c’est pourquoi nous ne prévoyons rien dans ce sens dans le présent document.

2.3. Moyens prévus pour le fonctionnement du Cati(Fonctionnement courant, modalités d’obtention de compétences temporaires additionnelles, modalités éventuelles de participation à des contrats de recherche, modalités de mise à niveau des équipements, etc.) (environ 15 lignes).

Actuellement, les CATI ne sont pas une structure administrative pouvant apparaitre comme partenaire de projets non INRA (ex : ANR). C’est pourquoi nous solliciterons nos départements de tutelle pour financer les actions de coordination du CATI et de diffusion de l’information (ex : journées thématiques). Concernant le financement des projets, nous candidaterons soit dans le cadre des appels d’offre internes des départements mais aussi aux appels d’offre ciblés informatique de INRA (AO Base de Données par le passé). Pour certains projets majeurs et génériques, nous serons certainement amenés à soumettre hors appel d’offre mais dans ce cas nous demanderons le soutien de la cellule bioinformatique nouvellement crée.

De plus, notre activité s’inscrivant entièrement dans l’activité de nos unités d’affectation, une partie des ressources obtenues sur des contrats ANR ou investissements d’avenir sera utilisée au bénéfice des projets du CATI (ex : matériels).

Page 9 sur 42

Page 10: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

III. Demande d’homologation

Avis argumenté du responsable du Cati

La première génération de CATI a permis d’effectuer un premier pas dans la structuration de l’informatique au sein de l’INRA en se focalisant sur le regroupement d’informaticiens travaillant sur des problématiques proches. Or, la biologie intégrative nécessite une intégration des différents niveaux d’analyse, ce qui implique que les méthodes et les outils informatiques nécessaires soient mis en place pour analyser les données mais aussi pour stocker et représenter informations et connaissances. Les systèmes informatiques dont nous aurons besoin devront permettre des analyses multi-niveaux en intégrant des données de natures hautement hétérogènes (données moléculaires données phénotypiques). Le CATI BBRIC regroupe deux communautés d’informaticiens qui se sont structurées à travers les CATI BIPAS et CAPGEN mais qui désormais doivent et vont converger pour concevoir et mettre en place les systèmes informatiques intégrés sur lesquels les recherches de nos départements s’appuieront.Le capital dont nous disposons déjà est riche de nombreux outils et bases de données (cf Annexes) que nous devons continuer à maintenir et à faire évoluer car plusieurs de ces ressources critiques nécessitent un investissement sur le long terme. En outre nous devons assumer une lourde mais cruciale activité de service dans le domaine de l’analyse massive des données de séquences. Mais malgré cette activité d’ingénierie lourde et récurrente, nous allons utiliser le cadre du CATI BBRIC, et le large panel de compétences informatiques que nous représentons, pour optimiser notre activité actuelle mais aussi pour concevoir et mener les nouveaux projets informatiques qui constitueront les briques avec lesquelles nous pourrons construire le système d’information qui contribuera à répondre aux défis scientifiques auxquels nos départements sont confrontés. Nos compétences informatiques, notre conscience aigüe des besoins de la communauté servie, l’organisation que je me propose de coordonner, nos résultats, nos projets menés et à mener me conduisent à demander l’homologation de BBRIC comme « Centre Automatisé de Traitement de l’Information » INRA.

Fait à Castanet-Tolosan Le 6 juin 2012

Signature : Jérôme Gouzy

Page 10 sur 42

Page 11: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

Certificat du(des) département(s), direction(s) dont dépend le Cati

Je, soussigné(e)

Olivier Le Gall Chef du Département Santé des Plantes et Environnement

certifie la mission informatique exercée par le collectif de travail

Bioinformatique, Biodiversité, Représentation et Intégration des Connaissances  (BBRIC)

et demande l’homologation de ce collectif en tant que Cati de l’INRA.

Fait à Le

Signature :

Page 11 sur 42

Page 12: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

Certificat du(des) département(s), direction(s) dont dépend le Cati

Je, soussigné(e)

Frédéric Gaymard Chef du Département Biologie Végétale

certifie la mission informatique exercée par le collectif de travail

Bioinformatique, Biodiversité, Représentation et Intégration des Connaissances  (BBRIC)

et demande l’homologation de ce collectif en tant que Cati de l’INRA.

Fait à Le

Signature :

Page 12 sur 42

Page 13: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

Annexes

Projets développés et maintenus par les membres du CATI

Sommaire

Projets Phares.........................................................................................................................................2Axe 1: Organisation et régulation des génomes.....................................................................................................2ANAIS: Analysis of NimbleGen Arrays Interface...................................................................................................2BIOS : a BioInformatics Oriented Service architecture for RNA-seq analysis........................................................2CycADS annotation database system to support the development and update of enriched BioCyc databases........2FrameDP: sensitive peptide detection on noisy matured sequences.........................................................................2iANT : integrated ANnotation Tool..........................................................................................................................2Portail Meloidogyne incognita..................................................................................................................................2Legoo : A BIOINFORMATICS GATEWAY TOWARDS INTEGRATIVE LEGUME BIOLOGY.................................................2REMORA : un poisson pilote dans l'océan des web-services BioMOBY................................................................2ISYIP: Plate-forme bio-informatique pour la génomiques sur les insectes..............................................................2Axe 2 : Génomique comparative et caractérisation de la biodiversité...................................................................2ANATool : The Arabidopsis Natural Accession Tool..............................................................................................2CFBP : Collection Française de Bactéries associées aux Plantes.............................................................................2E-phytia et Di@gnoPlant® : un continuum de services du Web au terrain en protection des plantes.....................2Florapis : base de données photographiques et bibliographiques sur le butinage des abeilles domestiques............2Insectes du patrimoine...............................................................................................................................................2La base R-SYST : identification des espèces de groupes d'organismes d'intérêt.....................................................2Narcisse : navigateur de génomes comparés.............................................................................................................2SESAME: genotyping based on high-throughput multiplex amplicon sequencing..................................................2Axe 3: Intégration et Représentation des Connaissances.......................................................................................2MetExplore: Collaborative platform for building, analyzing, simulating and improving metabolic networks........2AgroBI-VTC.............................................................................................................................................................2Exemple de Projet Structurant du futur CATI.....................................................................2BBRIC WORKSPACE.............................................................................................................................................2

Page 13 sur 42

Page 14: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

Projets Phares

Page 14 sur 42

Page 15: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

Axe 1: Organisation et régulation des génomes

Page 15 sur 42

Page 16: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

ANAIS: Analysis of NimbleGen Arrays Interfacehttp://anais.versailles.inra.fr

Adeline Simon1, Eric Biot2

1UR1290 BIOGER−CPP, INRA, Grignon 2Institut Jean-Pierre Bourgin, UMR1318, INRA-AgroParisTech, Versailles, France

Contact: [email protected]

Publication : Simon A, Biot E. (2010). ANAIS: Analysis of NimbleGen Arrays Interface. Bioinformatics 2010 Oct; 26(19):2468-9.

Summary: ANAIS is a user-friendly web-based tool for the processing of NimbleGen expression data. The interface reads single-channel microarray files generated by NimbleGen platforms and produces easily interpretable graphical and numerical results. It provides biologists six turnkey analysis modules—normalization, probe to gene, quality controls, differential expression, detection, queries and clustering—to explore quickly, freely and without the need for computer programming, NimbleGen transcriptome data.

May 2012 inventory :- 206 users since july 2010- 442 projects currently on the server- 3 citing articles :

Title : Effector diversification within compartments of the Leptosphaeria maculans genome affected by Repeat-Induced Point mutations.

Author(s): Rouxel T. et al.Source : Nat Commun. 2011 Feb;2:202.

Title : Genomic Analysis of the Necrotrophic Fungal Pathogens Sclerotinia sclerotiorum and Botrytis cinerea

Author(s): Amselem A. et al.Source: PLoS Genetics. 2011 Aug;7(8):e1002230

Title : HdfR is a regulator in Photorhabdus luminescens that modulates metabolism and symbiosis with the nematode Heterorhabditis

Author(s) : Easom CA. and Clarke DJ.Source : Environmental Microbiology (2012) 14: 953

Page 16 sur 42

Page 17: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

BIOS : a BioInformatics Oriented Service architecture for RNA-seq analysis.

http://bios.toulouse.inra.fr

Coordinateurs : Jérôme Gouzy, Sebastien Carrere.

Keywords: web-services, service-oriented architecture (SOA), RNA-Seq.

[email protected], [email protected], [email protected], [email protected], [email protected], [email protected], [email protected], [email protected], [email protected], [email protected], [email protected], [email protected], [email protected], [email protected], [email protected], [email protected], [email protected] des Interactions Plantes-Microorganismes (LIPM), UMR INRA-CNRS 441/2594, F-31320 Castanet Tolosan, France ; 2Institut Jean-Pierre Bourgin, UMR1318, INRA-AgroParisTech, Versailles, France ; 3Intéractions Biotiques et Santé Végétale (IBSV), INRA UMR/CNRS 1301/6243, F-06903 Sophia-Antipolis, France.  ; 4Unité de Recherches sur les Espèces Fruitières (UREF), F-33883 Villenave d’Ornon, France ; 5Institut de Biologie Intégrative des plantes, UMR 5004-CNRS/0386-INRA/SupAgro/Univ. Montpellier 2, F-34060 Montpellier, France. ; 6BIO3P, UMR1099 INRA/Agrocampus Rennes/Univ. Rennes I ; 7INRA, UMR 102 Génétique et Ecophysiologie des Légumineuses, F-21065 Dijon, France ; 8Unité de Recherche en Génomique Végétale (URGV), UMR INRA 1165 – Univ. d'Evry Val d'Essonne - ERL CNRS 8196, F-91057 Evry, France ; 9Centre de Biologie et de Gestion des Populations (CBGP), UMR INRA-IRD-CIRAD-SupAgro, F-34988 Montferrier/Lez, France ; 10Biologie du fruit et Pathologie (BFP), UMR1332 INRA-Univ. Bordeaux I&II, F-, Bordeaux, France.

This article presents BIOS, a Service-Oriented Architecture (SOA) for RNA-seq analysis. Through a unified web interface, users build and parameterize their analysis workflow, accessing in a transparent way the data and/or the analytic services proposed by a network of eight servers distributed in eight laboratories. The BIOS network gives access to data of several species of agronomic interest (plants, insects, oomycetes, etc.) as well as permits the identification of differentially expressed transcripts based on data provided by the user in a very simple tabulated format. Five flash tutorials illustrate the proposed analysis programs which are adapted to the various technologies (Sanger, 454, Illumina) used for measurements of expression based on sequence counts with (1) or without replicates (2–4). The data and the analytic services are distributed; the communication between the application and the servers is performed by BioMoby (5) web-services registered in the BIOS central registry (ten web-services for data access, ten analytic web-services, one web-service for network management). In addition, BIOS web-services ensure the interoperability with external systems, allowing for example the integration of expression patterns from “gene report” applications. In order to guarantee a crucial and stable quality of service, the entire network is supervised, both at the hardware and software levels. Thus, functional tests of the web-services are carried out daily. The result of this monitoring is placed at the users' disposal in order to ensure the best possible quality of service and to provide a maximum of transparency.

The service-oriented architecture BIOS, applied to the RNA-seq problem, offers a great flexibility and scalability. Indeed, after being uploaded on one of the servers, data benefits immediately from all the analysis programs available on the network. Conversely, once a new program has been added on a node of the network it can immediately be used to analyze any data.

BIOS is currently used for the data analysis of eighteen species. To date, one publication citing BIOS has been published recently (Biomphalaria glabrata; 454 and illumina data; Deleury et al. Plos One 2012), another one should be submitted in the coming months (Rosa chinensis, Illumina data) and several others are in preparation. This website is free and open to all users and there is no login requirement (login gives access to unpublished data).

Page 17 sur 42

Page 18: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

CycADS annotation database system to support the development and update of enriched BioCyc databaseshttp://www.cycadsys.org/

Patrice Baa-Puyoulet1,4, Augusto F. Vellozo2,4, Jaime Huerta-Cepas3, Gérard Febvay1,4, Toni Gabaldon3, Marie-France Sagot2,4, Hubert Charles1,4 and Stefano Colella1,4

1 Biologie Fonctionnelle Insectes et Interactions, UMR203 INRA INSA Lyon BF2I, bat INSA Pasteur, 20 ave Albert Einstein, 69621, Villeurbanne Cedex, France 2 Laboratoire de Biométrie et Biologie Évolutive, UMR5558 CNRS Université Lyon 1, bat Grégor Mendel, 43 bd du 11 novembre 1918, 69622, Villeurbanne Cedex, France3 Centre for Genomic Regulation, Barcelona Biomedical Research Park, Barcelona, Spain 4 BAMBOO, INRIA Rhône-Alpes, France

Keywords: metabolism, arthropods, gene annotation, metabolic pathways.

1. The CycADS Software Project

The Cyc Annotation Database System (CycADS) project started in 2008 during the genome annotation for the pea aphid, Acyrthosiphon pisum. Since the early stages of the quest for all metabolism related genes/proteins in the genome, it was clear that an annotation data management system was needed to allow us (and others) to easily create and further update the BioCyc metabolism network reconstruction of the pea aphid. CycADS allows the collection of heterogeneous annotation information to create dedicated files that are processed with the PathwayTools Software (SRI International) to produce BioCyc interfaces.

2. From AcypiCyc to ArthropodaCyc

CycADS has been successfully used to generate AcypiCyc1, the pea aphid BioCyc database, and we decided to build a metabolic network database for other arthropods, for which the genome sequence is available. We kept the same workflow parameters for collecting data from all used annotation methods (Blast2GO, KAAS, PRIAM). The generated ArthropodaCyc2 database includes, at present, metabolic reconstructions for 11 arthropods: Acyrthosiphon pisum, Aedes aegypti, Anopheles gambiae, Apis mellifera, Culex quinquefasciatus, Daphnia pulex, Ixodes scapularis, Nasonia vitripennis, Pediculus humanus corporis, Tribolium castaneum and Drosophila melanogaster (for this last species, both the CycADS version and the FlyCyc database manually curated by the FlyBase team are available). Collecting and organizing information into databases is useful for the researchers studying the metabolism of their newly sequenced model organisms (more arthropod genomes will be sequenced in the near future through the i5K Arthropod Sequencing initiative), and it allows them to better understand different aspects of arthropod biology through comparative studies.Thanks to the CycADS software, we included, in each database, information on annotation sources and links to genomics databases (including AphidBase, BeetleBase, VectorBase, Hymenoptera Genome Database, FlyBase and wFleaBase). Future plans include adding other sequenced genomes to ArthropodaCyc and the generation of another BioCyc-like database centred on the arthropod endosymbiosis for which both host and symbiont genomes have been sequenced (a beta version of ArtSymbioCyc is already available).

Page 18 sur 42

Page 19: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

FrameDP: sensitive peptide detection on noisy matured sequenceshttp://iant.toulouse.inra.fr/FrameDP/

Jérôme Gouzy1, Sébastien Carrere1 and Thomas Schiex2,*1 Laboratoire Interactions Plantes Micro-organismes (LIPM) UMR441/2594, INRA/CNRS, F-31320 Castanet Tolosan, France2 Unité de Biométrie et d’Intelligence Artificielle UR 875, INRA, F-31320 Castanet Tolosan, France

Transcriptome sequencing represents a fundamental source of information for genome wide studies and transcriptome analysis and will become increasingly important for expression analysis as new sequencing technologies takes over array technology. The identification of the protein coding region in transcript sequences is a prerequisite for systematic amino acid level analysis and more specifically for domain identification. In this paper, we present FrameDP, a self training integrative pipeline for predicting CDS in transcripts which can adapt itself to different levels of sequence qualities.

Compared to the alternative prot4EST pipeline, FrameDP has strong qualitative advantages. The most important of all is its ability to self-train directly on EST clusters instead of requiring curated cDNA sets to train the underlying ESTScan and DECODER (Fukunishi and Hayashizaki, 2001) software. Thanks to FrameD, FrameDP also directly integrates the similarity information inside the CDS prediction process instead of performing separate predictions. Beyond this, FrameDP can use multiple Markov models and can handle degenerated sequences both for signals (STOP/START codons) and inside Markov models.

The PERL-CGI server provides life scientists with a user-friendly interface to the pipeline (limited to batches of fifty sequences). It also provides an automatic protein description based on InterPro domain content. The functional annotation capabilities rely on BioMoby web services and on the REMORA workflow manager (Carrere and Gouzy, 2006).

A package for large scale local application is provided under the CECILL2 open source licence. It includes FrameD, NCBI-BlastX and paraloop. The pipeline is controlled by a single program, configurable using one configuration file.

14 citations dans google scholar; 9 citations dans le WOS.

Page 19 sur 42

Page 20: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

iANT : integrated ANnotation Toolhttp://iant.toulouse.inra.fr/S.meliloti; http://iant.toulouse.inra.fr/R.solanacearum; http://iant.toulouse.inra.fr/X.species

Objectifs : Depuis 1998, la plateforme bioinformatique du Laboratoire des Interactions Plantes Micro-organismes développe des outils pour l'annotation semi-automatique structurale et fonctionnelle des génomes. iANT est à la fois une boîte à outils proposant des outils pour réaliser l'annotation et l'analyse des données de génomiques, ainsi qu'une plateforme permettant aux biologistes d'accéder à ces données, les modifier et les publier sous forme de portail web.

La boîte à outil propose une batterie de scripts documentés destinés à l'annotation fonctionnelle. Ces outils sont utilisés par les bioinformaticiens via leur intégration dans d'autres outils. La majorité est également disponible via la technologie des Web-services BioMOBY ou via la plateforme Mobyle.

La plateforme web destinée aux biologistes authentifiés permet à ces derniers de : modifier l'annotation structurale et fonctionnelle automatique des différents objets biologiques. rechercher des informations sur leur génome via un moteur de recherche et/ou via des outils d'analyse

de séquence classiques (serveur Blast, serveur PatScan) naviguer dans le génome via des représentations graphiques de ce dernier

lancer des analyses complexes via des workflows Remora

Développements: Les développements sont réalisés sur la Plateforme Bioinformatique du LIPM. Ils consistent principalement en la maintenance évolutive des outils (ex : migration SRS vers

Lucene, modèle des données orienté objet), l'intégration de nouveaux outils et l'automatisation du déploiement de portails web dans le cadre de projets de reséquençage d'organismes prokaryotes à grande échelle.

Références des publications des génomes ayant utilisé iANT :Galibert F, et al. The composite genome of the legume symbiont Sinorhizobium meliloti. Science. 2001 Jul 27;293(5530):668-72. Salanoubat M, et al. Genome sequence of the plant pathogen Ralstonia solanacearum. Nature. 2002 Jan 31;415(6871):497-502.Sullivan JT, et al. Comparative sequence analysis of the symbiosis island of Mesorhizobium loti strain R7A. J Bacteriol. 2002 Jun;184(11):3086-95. Saillard C, et al. The abundant extrachromosomal DNA content of the Spiroplasma citri GII3-3X genome. BMC Genomics. 2008 Apr 28;9:195. Pieretti I, et al. The complete genome sequence of Xanthomonas albilineans provides new insights into the reductive genome evolution of the xylem-limited Xanthomonadaceae. BMC Genomics. 2009 Dec 17;10:616.

Page 20 sur 42

Page 21: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

Portail Meloidogyne incognitaURL: http://www.inra.fr/meloidogyne_incognita/

Coordinateurs : Etienne Danchin, Jérôme Gouzy, Laetitia Perfus-Barbeoch

Auteurs : abad @sophia.inra.fr 1,2,3, [email protected], [email protected],2,3, [email protected],2,3, [email protected],2,3, [email protected],2,3,

[email protected], [email protected],2,3, [email protected],2,3

1 INRA, UMR 1355 ISA, 400 route des Chappes, F-06903, Sophia-Antipolis, France,2 CNRS, UMR 7254 ISA, 400 route des Chappes, F-06903, Sophia-Antipolis, France,3 Université de Nice-Sophia Antipolis, UMR ISA, 400 route des Chappes, F-06903, Sophia-Antipolis, France,4 Laboratoire des Interactions Plantes-Microorganismes (LIPM), UMR INRA-CNRS 441/2594, F-31320 Castanet Tolosan, France.

Mots clés : Outils Gmod, apollo, blast, Meloidogyne incognita, web-service,

Ce portail a été crée dans le cadre du projet de séquençage du génome de Meloidogyne incognita(1) en 2008. L'obtention de ce génome est une avancée majeure pour l'étude des nématodes parasites de plantes pour preuve l'article sur le génome a déjà été cité plus de 160 fois en moins de 4 ans. Le site «nematode.net«, dédié à l'étude des nématodes de façon générale et qui rassemble l'ensemble des ressources sur les nématodes, donne notre portail comme la référence pour l'accès aux données et aux analyses bioinformatiques réalisées lors du séquençage de Meloidogyne incognita.

On retrouve sur le portail les résultats à la fois de l'annotation automatisée (réalisé grâce à Eugene) et de l'annotation manuelle expertisée, visualisable grâce à deux «genome browsers» gbrowse et Apollo. Un serveur Blast est accessible permettant de faire des «blast» sur le génome, sur les différentes banques de séquence d'EST ou sur les protéines prédites de M. incognita. Les résultats des analyses effectuées sur le génome avec d'autres outils bioinformatiques (OrthoMCL, Interproscan, etc.) sont aussi accessibles sur le site. L'accès aux données est public à l'exception d'une partie qui n'est accessible uniquement qu'aux membres du consortium sous le contrôle d'un système de login/password.

(1) Abad P, Gouzy J, Aury J, Castagnone-Sereno P, Danchin EGJ, Deleury E & all: Genome sequence of the metazoan plant-parasitic nematode Meloidogyne incognita. Nat Biotechnol 2008, 26:909-915.

Page 21 sur 42

Page 22: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

Legoo : A BIOINFORMATICS GATEWAY TOWARDS INTEGRATIVE LEGUME BIOLOGYhttp://www.legoo.org

Marion Verdenaud1, Sébastien Carrere1, Sebastien Letort1,2, Emeline Deleury3, Vincent Jouffe1, Erika Sallet1,

Emmanuel Courcelle1, Olivier Stahl2, Vincent Savois4, Karine Gallardo4, Frédéric Debelle1, Thomas Faraut2 ,

Pascal Gamas1, Jérôme Gouzy*1

1 Laboratoire des Interactions Plantes Micro-organismes (LIPM), UMR441/2954 INRA/CNRS, F-31320

Castanet Tolosan2 Laboratoire Génétique Cellulaire UMR444, INRA/ENVT, F-31320 Castanet Tolosan3 Interactions biotiques en santé végétale, INRA/CNRS/Univ. Nice, F-06900 Sophia Antipolis4 Unité de Recherche en Génétique et Ecophysiologie des Légumineuses à Graines, INRA, F-21100 Dijon

Abstract

The integration of numerous and heterogeneous data produced by the legume community represents a challenge

that needs to be overcome to fully exploit the considerable investment and progress made by many laboratories

worldwide. Our goal is to provide and to ensure the interoperability of bioinformatics resources that are required

to integrate and interpret such data. LEGOO is a web portal which is based on the protocol BioMoby both to

permit the interoperability between the different resources and to make available data and software within the

bioinformatics community. The

portal provides a unified entry

point to numerous bioinformatics

resources including a knowledge

base that represents and structures

published results. It provides a

comparative genome browser to

facilitate knowledge transfer

between models and crops, which

can be achieved by integrating

genetic maps and genomic

sequences as well as overlaying

expression data. The portal also

provides several genomic tools to

exploit and combine the results of

various technologies that have

been developed in recent years. Finally, several workflows are provided allowing data and software to be

combined to address frequent requests, such as promoter sequences analysis for sets of co-regulated genes.

Page 22 sur 42

Page 23: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

REMORA : un poisson pilote dans l'océan des web-services BioMOBY

http://lipm-bioinfo.toulouse.inra.fr/remora

Objectifs :En bioinformatique comme dans d'autres domaines scientifiques, l'intéropérabilité des systèmes informatiques est devenu un élément clé pour accéder non seulement à la masse d'informations mais également aux outils qui permettront de la traiter et de l'intégrer. Durant ces dernières années, deux technologies ont émergé parallèlement pour répondre à ces questions: les grilles de calcul ou de données d'une part, les web-services d'autres part. L'utilisation de ces technologies ne se justifiera vraiment en bioinformatique que lorsque les biologistes pourront accéder de façon intuitive à ces ressources informatiques pour récupérer, analyser et intégrer les données nécessaires à leurs recherches et ce avec le maximum de transparence et de fiabilité. Or, répondre à ce besoin nécessite le développement d'interfaces utilisateurs adaptées car malheureusement, les outils d'ores et déjà disponibles comme Taverna sont destinés principalement à des utilisateurs informaticiens et, pour rester génériques, sont relativement complexes à mettre en œuvre pour un utilisateur non programmeur. C'est à la suite de ce constat que nous avons développé en 2006 le serveur web REMORA. Dans un premier temps, REMORA tire parti du typage, avec sémantique bioinformatique, des entrées sorties des web-services BioMOBY pour permettre la découverte des ressources, puis via une interface la plus simplifiée possible, rend possible la génération étape par étape et l'exécution de chaînes de traitement complexes. De plus, afin de partager l'effort de développement, REMORA autorise l'enregistrement sur le site des workflows les plus fréquemment utilisés qui sont alors réutilisable via le serveur REMORA ou via d'autres portails web (iANT, Narcisse) mais également, pour les projets pour lesquels la veille est critique, la ré-exécution périodique des chaînes de traitement.

Référence : Carrere S, Gouzy J. REMORA: a pilot in the ocean of BioMoby web-services. Bioinformatics. 2006 Apr 1;22(7):900-1.

44 citations (google scholar) ; 22 citations (WOS)

Page 23 sur 42

Page 24: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

ISYIP: Plate-forme bio-informatique pour la génomiques sur les insectes

Centres (Sites) INRA Rennes, plateforme Genouest, INRIA/IRISADépartements SPE

Responsable : F. Legeai

ISyIP (Information System for Insect Pests) is a central platform for sharing resources and standards critical to guarantee data integration and interoperability, and to improve the coherence of the protocols set up by its various partners engaged into the genomics and post-genomics analysis of agricultural relevant insects (pest and their parasitoids) genomics and postegenomics. . Apart from giving access to the data, the main utility of this to settle an environment to allow a larger community to elaborate complex genomics analyses, browsing, mixing or crossing heterogeneous data. Since 5 years, ISyIP, is including LepidoDB http://www.inra.fr/lepidodb (386 visitors in 2011) and http://www.aphidabse.org (8514 visitors in 2011) and develops expertise and pipelines for NGS data management (e.g., cleaning, mapping, assembly, SNP discovery, differential expression analysis, smallRNA prediction and annotation). The team benefits from the housing of the Genouest platform, an IBISA platform, member of RENABI (French network of bioinformatics platforms).

The platform aims at developing particular treatments for heterogeneous genomics dataset embracing a large panel of “omics” (e.g. genomics, transcriptomics, epigenomics, methylomics or proteogenomics). These treatments are covering different skills and hence necessitates a strong collaboration with the INRIA GenScale team headed by D. Lavenier. For instance, it includes the mapping and assembly of a very large number of reads implying the development of advanced algorithms able to fit, within a reasonable time, with particular large scaled data (paired-ends or mate-pair, genome, mRNAs, short RNAs or short polypeptides issued from proteomics experiments). It also needs the development of new strategies to compare resequenced genomes in order to predict and study structural variants.

Finally, although exploring all these data separately remains already challenging, it is also focusing in elaborating strategies for comparing enhanced integrated genomes to emphasize the role of epigenetics states in the gene regulation, especially in the context of reproductive polyphenism of aphid or host-plant specialization of spodoptera frugiperda.

The IsyIP platform will be involved in an increasing number of project generating a large set of various data. For instance, it will host and analyses 4 reference genomes (Myzus persicae, spodoptera frugiperda, diabrotica virgifera, hyposother didymator), and the re-sequencing of 40 strains of pea aphid and the rice-variant of spodoptera frugiperda as well as tens of transcriptomics data. Furthermore, this platform takes part of the i5K project for the sequencing of 5000 insect genomes.

At INRA SPE, ISyIP is working has a strong partnership with the laboratories DGIMI in Montpellier, PISC in Versailles, ISA in Sophia Antipolis, BF2I in Lyon and IGEPP in Rennes.

Page 24 sur 42

Page 25: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

Axe 2 : Génomique comparative et caractérisation de la biodiversité

Page 25 sur 42

Page 26: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

ANATool : The Arabidopsis Natural Accession Toolhttps://www.versailles.inra.fr/ijpb/crb/anatool

Matthieu Simon1, Adeline Simon2, Fréderic Martins3, Lucy Botran1, Sébastien Tisné1, Fabienne Granier1, Olivier Loudet1 and Christine Camilleri1

1Institut Jean-Pierre Bourgin, UMR1318 INRA-AgroParisTech, F-78000 Versailles, France2BIOGER, UR1290 INRA-AgroParisTech, 78850 Thiverval-Grignon, France3Plateforme Génomique, Génopole Toulouse/Midi-Pyrénées, 31326 Castanet-Tolosan, France

Contact for biology: [email protected] Contact for bioinformatics: [email protected]

Publication : Simon M, Simon A, Martins F, Botran L, Tisné S, Granier F, Loudet O, Camilleri C (2012). DNA fingerprinting and new tools for fine-scale discrimination of Arabidopsis thaliana accessions. Plant J. 2012 Mar;69(6):1094-101.

Summary: The Arabidopsis Natural Accession Tool web interface was developed for the Arabidopsis community to provide access to all fingerprinting data obtained on natural accessions managed at the Arabidopsis thaliana Resource Centre for Genomics at INRA Versailles, France. The genotyping assay was performed at the Genomics facility at INRA Toulouse, France using a GoldenGate assay which interrogates all 384 SNPs simultaneously and VeraCode technology was used for reading. The final data matrix of 341 informative markers for 591 accessions is available through the ANATool interfaceThe smallest number of markers that uniquely defines each haplotype was defined. This pattern is called a fingerprint and is composed of a combination of different SNPs for each haplotype.From the ANATool interface, four types of queries can be submitted to (1) find the fingerprint of a given accession; (2) find genotypes from a selection of accessions and markers; (3) find accessions from a selection of markers and genotypes; and (4) find the minimal marker set required to distinguish among a set of given accessions. Optimized SNP sets are also available to quickly fingerprint natural accessions of Arabidopsis. Thus, ANATool is a simple, readily accessible and fast (only DNA fragments need to be sequenced) tool for confirming the identity of accessions at any laboratory working on Arabidopsis.The development of ANATool was funded by INRA and by the French national biomedical, biological and agricultural research infrastructures network GIS-IBiSA.

Page 26 sur 42

Page 27: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

CFBP : Collection Française de Bactéries associées aux Plantes

Page 27 sur 42

Page 28: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

Url : http://www.angers.inra.fr/cfbp/

- 6000 souches bactériennes pathogènes, commensales, ou symbiotiques de plantes - Créée en 1973 - Certification ISO 9001 - Centre de Ressources Biologiques - Une large communauté d’utilisateurs : reconnaissance nationale et internationale Un catalogue des ressources disponibles :

PhyloSearch : un outil en ligne d’aide à l’identification :

Richer JM, Baumard A, Portier P, Briand M, Fischer-Le Saux M Séquences « requêtes » Arbre phylogénétique Base de séquences de référence

Bases de données disponibles: - Xanthomonas – gyrB (Young et al., 2008) et rpoD (Fargier et al., 2011) - Pseudomonas – rpoB (Ait Tayeb et al., 2005) - A venir: gyrB, rpoD: Yamamoto et al., 2000

Alimenté à partir de l’outil de gestion de la collection (Base de données FileMaker Pro) :

E-phytia et Di@gnoPlant® : un continuum de services du Web au terrain en protection des plantesDans un objectif de réduction des traitements phytosanitaires sur les cultures, l’identification précoce et fiable d’une maladie, la détection des bio-agresseurs émergents s’avèrent des étapes cruciales en santé végétale. Elles permettent notamment d’ajuster au diagnostic la ou les méthode(s) de protection les plus pertinentes. Notre équipe de recherche INRA de l’unité Santé et Agroécologie du Vignoble de Bordeaux a mis au point sous l’appellation Di@gnoPLant®, plusieurs applications en protection des

Page 28 sur 42

Page 29: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

plantes pour smartphones et tablette, qui permettent l’identification et la localisation des maladies au champ.Lors de l’apparition de symptômes sur une culture ou au jardin, l’agriculteur, le technicien ou le particulier peut désormais avoir recours, via un smartphone ou une tablette, à un ensemble de connaissances et d’expertises INRA en protection des plantes. Chaque outil de Di@gnoplant permet :

- d’identifier les maladies sur une culture donnée grâce à un module d’identification par l’image selon la nature des symptômes, des signes ou des ravageurs observés ;

- de renseigner l’utilisateur sur les caractéristiques de ces maladies à partir d’un référentiel de connaissances INRA organisé sous la forme de fiches détaillant les symptômes, la biologie du bioagresseur en cause et les méthodes de protection optimisées à la situation parasitaire.

Nous avons voulu constituer un continuum d’outils de diagnostic/conseil accessibles sur le web grâce à e-phytia®, mais aussi sur le terrain via les nouveaux outils d’information et de communication que sont les smartphones et les tablettes. Ainsi, un utilisateur peut réaliser directement un diagnostic au champ, voire prendre quelques photos des symptômes et les envoyer à une structure spécialisée pour le confirmer. Plusieurs applications inter-actives Di@gnoplant® sont maintenant disponibles sur plateformes Apple ou Android et permettent d’identifier les maladies des salades, de la tomate, de la vigne et du tabac. D’autres applications sont en cours de construction portant sur les légumes (aubergine, poivron, melon, courgette, concombre…) et d’autres cultures.

Un module complémentaire de géolocalisation des maladies est en cours de développement sous l’appellation VigiPl@nt ; il pourra être couplé ou non aux applications de Di@gnoPlant®. Il facilitera l’épidémio-surveillance des bioagresseurs sur le territoire et contribuera à la détection des bio-agresseurs émergents. Grâce à un smartphone, un observateur sera en mesure de déclarer la présence d’un bioagresseur dans une culture géolocalisée, ainsi que quelques éléments du contexte parasitaire (type de culture, variété touchée, incidence de la maladie…). Il pourra aussi connaître quelle est la pression parasitaire pour une ou plusieurs maladies dans une zone de production donnée. Enfin, des versions en langue étrangère de plusieurs applications de DiagnoPlant® sont en cours de préparation.

Page 29 sur 42

Page 30: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

Florapis : base de données photographiques et bibliographiques sur le butinage des

abeilles domestiqueshttp://www.florapis.org/

Ce projet est porté par le Laboratoire Pollinisation et Écologie des Abeilles de l’Unité de Recherche 406 Abeilles et Environnement de l’Inra PACA à Avignon. Il est suivi par - Bernard Vaissière, Chef de projet, Chargé de Recherche, et- Nicolas Morison, Bio-informaticien, Assistant-Ingénieur.

Florapis est une étude de science participative. Elle a pour mission première de constituer une base de données photographiques et bibliographiques pour documenter le butinage des abeilles domestiques sur la flore française métropolitaine, avec une attention particulière pour les espèces de plantes rares, protégées ou patrimoniales. L’originalité de notre approche réside dans le fait que les données proviendront d’un réseau de correspondants disséminés sur le territoire et avec une formation botanique et/ou apicole confirmée. Ces données seront par ailleurs validées par des experts du domaine.

La mise en place d’une plateforme WEB pour constituer cette base de données vise à permettre de recueillir un grand nombre d’informations de qualité scientifique éprouvée et sur une échelle spatiale importante. La collecte de données est standardisée, ce qui permettra ensuite de les analyser selon différents critères tout en obtenant un jeu de données le plus représentatif possible. L’avantage d’utiliser ce type d’approche est que les données sont recueillies beaucoup plus rapidement et que le coût financier est bien moindre que si l’on avait employé des techniques de suivi scientifique classique.

Le lancement de la plateforme est prévu pour juin 2012.

Page 30 sur 42

Page 31: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

Les données de cette base seront à terme reliées aux autres connaissances taxonomiques, phénotypiques et génomiques produite par les partenaires du réseau R-SYST.

Page 31 sur 42

Page 32: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

Site web Insectes du patrimoinehttp://www1.montpellier.inra.fr/cbgp/insectes-du-patrimoine

Ce site est issue du partenariat CBGP/CICRP : Centre Interrégional de Conservation et de Restauration du Patrimoine Marseille Belle de Mai (http://www.cicrp.fr/). Il vise la communauté des personnels chargé de la sauvegarde des collections. Il a pour but de regrouper des informations sur les insectes présentant une menace pour la conservation du patrimoine culturel.

Ce site intègre différents niveaux d’information (voir figure) :Des fiches de description d’espèces présentant des informations généralistes (répartition, développement,

traits de vies et dégâts occasionnés. Il présente des clefs de détermination ainsi qu’un outil d’identification moléculaire (ce qui fait son originalité).

Cet outil a été construit avec un CMS classique (DRUPAL) qui permet à la fois de présenter des informations sous forme de fiches et d’intégrer des outils spécifiques développé sous forme de modules redistribuables.

Le maintien et l’alimentation de ce site sont actuellement assurés pat - Franck Dorkeld, IR INRA- Fabien Fohrer entomologiste CICRP.

La liste des espèces présentent sur ce site sera accessible à partir des outils développées au sein du réseau R-SYST.

Page 32 sur 42

Page 33: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

La base R-SYST : identification des espèces de groupes d'organismes d'intérêthttp://w3.pierroton.inra.fr/r-syst/

Cette base de données se place dans le cadre du réseau R-SYST. L'objectif de ce réseau est de développer un outil informatique (pour les scientifiques et les professionnels non spécialistes) permettant d'identifier les espèces de groupes d'organismes d'intérêt pour l'INRA (arbres, insectes, champignons, micro-algues et bactéries). Son développement s'appuie sur un réseau de compétences en taxonomie, biologie moléculaire et bioinformatique.

Cette base est en cours d’implantation sur un réseau de serveurs implantés dans plusieurs unités des départements SPE et EFPA.

Ces bases sont accessibles à partir du site web du réseau R-SYST.

Le développement de la base de données et ses interfaces sont assurés par P.Chaumeil à Bordeaux.

L’alimentation de la base et son implantation sur chaque site est assuré actuellement par plusieurs membre du CATI (P.Robin, M.Briand, F.Dorkeld… ) ainsi que par les informaticiens présents sur chaque site..

Page 33 sur 42

Page 34: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

Narcisse : navigateur de génomes comparés http://narcisse.toulouse.inra.fr

Concepteur(s) : Thomas Faraut, Jérôme Gouzy, Emmanuel Courcelle Laboratoire(s):

o Laboratoire de Génétique Cellulaire - INRA Toulouse o Laboratoire des Interactions Plantes-microorganismes – INRA/CNRS Toulouse

Fonctionnalités générales du logiciel

Narcisse est un outil de comparaison de génomes entièrement séquencés doté d’un navigateur permettant d’explorer à différentes échelles, des nucléotides aux chromosomes, les résultats de comparaison.

Il repose sur le principe de comparaison exhaustive de génomes deux-à-deux, à la fois au niveau nucléique et au niveau protéique. Cet outil a essentiellement deux composantes :

1. Un pipeline de comparaison de génomes: à partir de génomes entièrement séquencés et de leurs annotations, il procède à l’identification de similitudes locales (alignements locaux à l’aide d’un outil spécifique développé par l’équipe) puis à la reconstruction de segments conservés à différents niveaux de résolution.

2. Un navigateur de génomes comparés qui permet d’exploiter les différents niveaux de conservation identifiés par le processus décrit ci-dessus. Ce navigateur permet en particulier d’étudier aussi bien les conservations locales dans le voisinage des gènes que des conservations de segments chromosomiques. De nombreuses représentations sont proposées : dotplot, représentation de cartes comparées, représentation circos. La possibilité d’ajouter des données personnelles et de réaliser des comparaisons avec ses propres séquences permet d’adapter le navigateur à des besoins propres.

Nous maintenons une installation donnant accès aux comparaisons de génomes animaux, végétaux, de champignons et aussi de bactéries, à partir des données publiques. Il est par ailleurs possible d'accéder à ces données par l'intermédiaire de services Web Biomoby.

Narcisse peut être téléchargé et installé localement afin de répondre à des besoins spécifiques. Une API, qui repose sur l’API d’Ensembl, permet d’accéder facilement aux données génomiques, tandis qu'une API développée spécialement permet quant à elle d'accéder aux données de comparaison.

Courcelle E, Beausse Y, Letort S, Stahl O, Fremez R, Ngom-Bru C, Gouzy J, Faraut T (2008). Narcisse: a mirror view of conserved syntenies. Nucleic Acids Res 36(Database issue):D485-90.

Page 34 sur 42

Page 35: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

SESAME: genotyping based on high-throughput multiplex amplicon sequencingEmese Meglécz 1 ,* † , Sylvain Piry 2 ,†, Erick Desmarais 3 , Maxime Galan 2 , André Gilles 1 , Emmanuel Guivier 2 , Nicolas Pech 1 and Jean-François Martin 2

1Aix-Marseille Université, CNRS, IRD, UMR 6116 – IMEP, Equipe Evolution, Génome et Environnement, 13331 Marseille Cedex 3, 2UMR CBGP (INRA/IRD/Cirad/Montpellier SupAgro), Campus international de Baillarguet, CS 30016, F-34988 Montferrier-sur-Lez cedex and 3Université Montpellier 2, CNRS, UMR 5554 – Institut des Sciences de l'Evolution – Montpellier – CC 065, 34095 Montpellier Cedex 05, France  AbstractSummary: Characterizing genetic diversity through genotyping short amplicons is central to evolutionary biology. Next-generation sequencing (NGS) technologies changed the scale at which these type of data are acquired. SESAME is a web application package that assists genotyping of multiplexed individuals for several markers based on NGS amplicon sequencing. It automatically assigns reads to loci and individuals, corrects reads if standard samples are available and provides an intuitive graphical user interface (GUI) for allele validation based on the sequences and associated decision-making tools. The aim of SESAME is to help allele identification among a large number of sequences.

Availability: SESAME and its documentation are freely available under the Creative Commons Attribution-NonCommercial-ShareAlike 3.0 Unported Licence for Windows and Linux from http://www1.montpellier.inra.fr/CBGP/NGS/ or http://tinyurl.com/ngs-sesame.

SESAME (SEquence Sorter & AMplicon Explorer): genotyping based on high-throughput multiplex amplicon sequencing. Meglécz E, Piry S, Desmarais E, Galan M, Gilles A, Guivier E, Pech N, Martin JF. Bioinformatics. 2011 Jan 15;27(2):277-8. Epub 2010 Nov 16.

Page 35 sur 42

Page 36: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

Axe 3: Intégration et Représentation des Connaissances

Page 36 sur 42

Page 37: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

MetExplore: Collaborative platform for building, analyzing, simulating and improving metabolic networks http://metexplore.toulouse.inra.fr

Project Coordination : Fabien Jourdan1, Jean-Charles Portais2,3,4

Executive coordination : Ludovic Cottret5

Development and maintenance : Ludovic Cottret5, Florence Vinson1

1 : INRA, UMR1331, Toxalim, F-31000 Toulouse, France2 : Université de Toulouse; INSA,UPS,INP; LISBP, 135 Avenue de Rangueil, F-31077 Toulouse, France 3 : INRA, UMR792, Ingénierie des Systèmes Biologiques et des Procédés, F-31400 Toulouse, France 4 : CNRS, UMR5504, F-31400 Toulouse, France5 : Laboratoire des Interactions Plantes-Microorganismes (LIPM), UMR INRA-CNRS 441/2594, F-31320 Castanet Tolosan, France 

The availability of complete genome sequences for several organisms offers an invaluable resource for the reconstruction of biochemical networks in organisms at the genome scale level. These genome-scale networks are essential for high-throughput “omics” data interpretation, and they can be converted into metabolic models for simulating the operation of cellular metabolism in response to different stimuli.MetExplore allows the import, annotation and modification of metabolic networks by several users in a collaborative way. The metabolic networks used to establish models can be duplicated from the MetExplore database or imported from external SBML files. Several computational analyses can be performed on the public or private MetExplore networks. First, mapping functions allow to highlight metabolites (by their mass or their identifier) or reactions (by the associated gene names) onto a global view of the metabolic network. Secondly, MetExplore offers graph-based functions including choke point analysis, computation of biosynthetic capacity and potential precursor identification for any set of selected metabolites. At last, flux balance analysis (FBA) functions were introduced in MetExplore to simulate flux distributions in metabolic networks under different environmental/genetic conditions. Strength of MetExplore is to provide a user-friendly tabular view that helps to fill in the FBA parameters by making easier the selection of reactions by their names, the metabolites, the genes or, the metabolic pathways. The FBA-based functions provided in MetExplore include i) computing of optimal functions, ii) knock out analysis, iii) robustness analysis, iv) identification of essential and live reactions, and v) flux variability analysis (FVA).

MetExplore has been running since June 2009, it has been visited 3404 times by 1406 distinct visitors and has been intensively tested and used by three INRA units in Toulouse and Lyon, and by members of four international laboratories: Lyon University (France), Glasgow University (United Kingdom), LNCC (Brazil), ETH (Switzerland).Reference:MetExplore: a web server to link metabolomic experiments and genome-scale metabolic networks. Cottret L, Wildridge D, Vinson F, Barrett MP, Charles H, Sagot MF, Jourdan F. Nucleic Acids Res. 2010

Page 37 sur 42

Page 38: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

AgroBI-VTChttp://www.bordeaux.inra.fr/umr619/AgrobiVTC/www/

An integrative genomics approach for deciphering the complex interactions between ascorbate metabolism and fruit growth and composition in tomato.

Very few reports have studied the interactions between ascorbate and fruit metabolism. In order to get insights into the complex relationships between ascorbate biosynthesis/recycling and other metabolic pathways in the fruit, we undertook a fruit systems biology approach. To this end, we have produced tomato transgenic lines altered in ascorbate content and redox ratio by RNAi-targeting several key enzymes involved in ascorbate biosynthesis (2 enzymes) and recycling (2 enzymes). In the VTC (ViTamin C) Fruit project, we then generated phenotypic and genomic (transcriptome, proteome, metabolome) data from wild type and mutant tomato fruit at two stages of fruit development, and developed or implemented statistical and bioinformatic tools as a web application (named VTC Tool box) necessary to store, analyse and integrate experimental data in tomato. By using Kohonen's self-organizing maps (SOMs) to cluster the biological data, pair-wise Pearson correlation analyses and simultaneous visualization of transcript/protein and metabolites (MapMan), this approach allowed us to uncover major relationships between ascorbate and other metabolic pathways.

Références:Garcia V, Stevens R, Gil L, Gilbert L, Gest N, Petit J, Faurobert M, Maucourt M, Deborde C, Moing A, Poessel JL, Jacob D, Bouchet JP, Giraudel JL, Gouble B,Page D, Alhagdow M, Massot C, Gautier H, Lemaire-Chamley M, de Daruvar A, Rolin D, Usadel B, Lahaye M, Causse M, Baldet P, Rothan C. An integrative genomics approach for deciphering the complex interactions between ascorbate metabolism and fruit growth and composition in tomato. C R Biol. 2009 Nov;332(11):1007-21.

Mounet F, Moing A, Garcia V, Petit J, Maucourt M, Deborde C, Bernillon S, Le Gall G, Colquhoun I, Defernez M, Giraudel J-L, Rolin D, Rothan C, Lemaire-Chamley M (2009) Plant Physiology 149 (3): 1505-1528

Page 38 sur 42

Page 39: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

Exemple de Projet Structurant du futur CATI

Page 39 sur 42

Page 40: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

BBRIC WORKSPACE

Objectifs :Fournir un outil de mise à disposition de résultats d'analyses bioinformatiques permettant dans le cadre de l'activité de service :

1) aux biologistes de- tracer les analyses effectuées sur la durée d’un projet (typiquement plusieurs années)- rechercher par mot clé (les mots indexés) des analyses- rechercher via les métadonnées (date, fournisseur, titre)- visualiser les résultats sous forme d'arborescence- résumé des métadonnées et des fichiers de/des analyse/s dans lesquels le mot clé a été trouvé - si un fichier README est présent à la racine de l'analyse, son contenu est affiché - de partager facilement des résultats- d'utiliser ces résultats au travers d'autres application (ex : moteur de workflow type galaxy, mobyle, etc.)- télécharger le zip de l'analyse complète

2) aux bioinformaticiens- de simplifier/normaliser l'envoi de résultats depuis des serveurs identifiés par le système- de tracer les analyses effectuées- d'établir des rapports de service (ex : nombre d'analyses effectuées par utilisateur)

Périmètre :- Activité de service bioinformatique des membres du CATI- Utilisateurs

1. les biologistes et bioinformaticiens des laboratoires associés au CATI2. les collaborateurs externes (autre département, autre EPST, Privé)

HORS PERIMETRE: - les développements spécifiques de portail, bases de données etc …- la gestion des fichiers bruts des données de séquences.- la mise à disposition de workflows d’analyse pour les biologistesCes trois points sont traités dans d’autres projets de portée locale, département, CATI, INRA.

Exemple de scénario :1. Le bioinformaticien réalise une analyse bioinformatique sur un serveur, les résultats sont contenus dans

une archive ou un répertoire2. Le bioinformaticien valide le résultat, choisit les résultats à fournir au biologiste et documente l'analyse

via un fichier README3. Le bioinformaticien commite le répertoire/l'archive sur le WORKSPACE du département du biologiste

via un script en ligne de commande4. Le biologiste reçoit un courriel le prévenant d'un dépôt d'analyse5. Le biologiste s'authentifie sur le site web du WORKSPACE6. Le biologiste accède aux résultats sur le site

1. il choisit de supprimer l'analyse2. il choisit de télécharger l'analyse3. il choisit de partager l'analyse via un lien hypertexte

Page 40 sur 42

Page 41: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

Prototype :

Note : dans l’exemple test, ‘carrere’ est à la fois ‘le bioinformaticien’ et ‘le biologiste’

1. [Bioinformaticien] 1.a. Envoi de données

1.b. Résumés

2. [Utilisateur] 2.a. Authentification - Authentification via l'annuaire institutionnel + autorisation via annuaire local

Page 41 sur 42

Page 42: formulaire pour demande d' homologation caticati-bbric.toulouse.inra.fr/lib/exe/fetch.php/form_cati... · Web viewUn exemple de projet technologique structurant en cours de prototypage

2.b. Recherche de résultats- Listing des dernières analyses, quicksearch, recherche multi-critères

2.c. Accès aux résultats

Page 42 sur 42