21
REICHSTADT Matthieu UMRH 03/10/2013 Bases de données phénotypique et ontologie JAS PHASE 03/10/2013

Bases de données phénotypique et ontologie

  • Upload
    sammy

  • View
    26

  • Download
    0

Embed Size (px)

DESCRIPTION

Bases de données phénotypique et ontologie . JAS PHASE 03/10/2013. Les bases de données phénotypiques. Phénotype: état de caractères observables chez un organisme vivant. Il est considéré soit : - PowerPoint PPT Presentation

Citation preview

Page 1: Bases de données phénotypique et ontologie

REICHSTADT Matthieu UMRH 03/10/2013

Bases de données phénotypique et ontologie JAS PHASE 03/10/2013

Page 2: Bases de données phénotypique et ontologie

2

Les bases de données phénotypiques

• Phénotype: état de caractères observables chez un organisme vivant.

• Il est considéré soit :– pour un seul caractère, à l'échelle moléculaire, cellulaire, ou

macroscopique (ex : morphologie des cellules)– comme l'ensemble des états des caractères observables d'un

individu (phénome) (ex : phénotype Salers versus Bretonne pie noire)

• Le phénotype est la résultante de l’expression du génotype et de l’influence de son environnement– (P = G + E)

Page 3: Bases de données phénotypique et ontologie

3

Phénotypage haut-débit

• Méthode de détermination de phénotypes mesurables de façon répétable, automatisable et rapide de sorte que le processus de mesure génère un grand nombre de données.

• 2 composantes :– Le Phénotypage horizontal, systématique– Le Phénotypage vertical ou ciblé

Page 4: Bases de données phénotypique et ontologie

4

Types de phénotypages

• Horizontal– Grand nombre d’animaux / peu de variables– Ex: poids des animaux dans une expérience

• Vertical– Peu d’individus / beaucoup de variables– Ex: génomique, métabolomique

Page 5: Bases de données phénotypique et ontologie

5

Les bases de données phénotypiques

• De toutes sortes• Exemple:

– BIF-Beef: base de données phénotypique de l’UMRH • Mesures carcasse (Horizontal)• Mesures biologiques (Vertical)

– Aladin: SI ruminant• Gestion des troupeaux• Gestion de l’Alimentation• Gestion des expériences

Page 6: Bases de données phénotypique et ontologie

6

Les bases de données phénotypiques

• A quoi ressemble une « bonne » base?

Information Méthode

Conditions

Mesure

Page 7: Bases de données phénotypique et ontologie

7

Les bases de données phénotypiques

• Problème: format des données / accès aux donnéesNécessité pour une base d’avoir un format fixe et

compatible avec d’autres bases

Comment assurer ceci?Utilisation des ontologies

Page 8: Bases de données phénotypique et ontologie

8

Les ontologies

• Définition:– Représentation formelle d'un ensemble de phénotypes, et

des relations entre ces phénotypes• Les concepts et les relations dans une ontologie sont clairement

définis• Les concepts sont organisés de manière structurée (souvent une

structure hiérarchique)• Le sens d'un terme est utilisé de façon univoque• Les termes utilisés doivent être lisibles par des machines

(permettant l’automatisation de la mesure ou de l’utilisation de l’information)

Page 9: Bases de données phénotypique et ontologie

9

Les ontologies

• Ontologies utilisées à l’INRA:– ATOL (Animal Trait Ontology for Livestock)– EOL (Environment Ontology for Livestock)

• Site web du projet:– www.atol-ontology.com

• Visualisation des ontologies• Téléchargement des ontologies (versioning)

Page 10: Bases de données phénotypique et ontologie

10

Les ontologies

• But du projet ATOL:– Disposer d’une ontologie de référence pour le phénotypage des

animaux d’élevage et partagée par la communauté scientifique et enseignante internationale

– Disposer d’un langage utilisable par les programmes informatiques (gestion des bases de données, analyse sémantique, modélisation…)

– Avoir des caractères les plus génériques possibles pour les vertébrés d’élevage

– Rendre l’ontologie la plus opérationnelle possible et proche des techniques de mesure

– Structurer la base à des fins de production animale

Page 11: Bases de données phénotypique et ontologie

11

Comment relier les 2 concepts

• Chaque projet/structure a son propre modèle de données + Système applicatif

• Les projets doivent suivre les règles définies par les ontologies

• Plusieurs approches:– A posteriori: la conception du MCD précède la recherche ou la

conception de l’ontologie partagée– A priori: l’ontologie est supposée existante lorsque la base de

données est conçue– Directes: la structure de l’ontologie définit directement la structure

de la base de données

Page 12: Bases de données phénotypique et ontologie

12

Les bases de données à base ontologique (BDBO)

• Ontologies et données sont stockées dans la BdD• Mêmes principes de traitement (insertion mises à jour,

requêtes, …)• Association données – concept de l’ontologie

Ensemble multi-parties: BdD, ontologie, méta-schémapermet de rendre générique le traitement sur

les ontologiesExemple: OntoDB

Page 13: Bases de données phénotypique et ontologie

13

Le sparql endpoint

• La BdD est considérée comme un graphe RDF (Resource Description Framework ou « sujet – prédicat – objet »), à travers lequel on accède au contenu de la base

Entrepôt « virtuel » vue sémantique de la base

• Langage SPARQL: Simple Protocol and RDF Query language permet de consulter les données

Possibilité de rechercher des informations en partant de l’ontologie

Page 14: Bases de données phénotypique et ontologie

14

Les entrepôts de données

• Définition:– Ensemble de données historisées variant dans le temps,

organisé par sujets, consolidé dans une base de données unique, géré dans un environnement de stockage particulier, aidant à la prise de décision

• 3 fonctions essentielles– collecte de données de bases existantes et chargement– gestion des données dans l’entrepôt– analyse de données pour la prise de décision

Page 15: Bases de données phénotypique et ontologie

15

Les entrepôts de données

Page 16: Bases de données phénotypique et ontologie

16

Les entrepôts de données

• Associés à la prise en compte des ontologies, ils permettent de rapprocher des bases au contenu et au format différents

• Exemple concret possible– SI existants à l’UMRH différents

• Bases de données différentes• Contenu différent• Interface différente

Similarités associables à un DWH

Page 17: Bases de données phénotypique et ontologie

17

Travail à effectuer

+BdD

ontologie

BDBO

Les infos référentielles des bases de données sont indexées sur l’ontologie

Page 18: Bases de données phénotypique et ontologie

18

Travail à effectuer

BDBO

Passage dans un entrepôt de données

BDBO +

DWH

Page 19: Bases de données phénotypique et ontologie

19

Travail à effectuerTravail à effectuer

+La base est transformée en shéma RDF, pour le web sémantique

DWH R2D

Page 20: Bases de données phénotypique et ontologie

20

Travail à effectuerTravail à effectuer

+Le schéma RDF est analysé en utilisant un langage de requête approprié (SPARQL)

R2D

Page 21: Bases de données phénotypique et ontologie

21

Merci de votre attention