35
JOURNÉES IGEC – NOVEMBRE 2011 GESTION DE DONNÉES MULTI- ECHELLES Pascal Neveu (INRA MISTEA – équipe Gamma) Anne Tireau (INRA MISTEA – équipe Gamma) Mathias Chouet (INRA EGFV / MISTEA – équipe Gamma) Contact : [email protected]

Journées IGEC – novembre 2011 Gestion de données Multi-Echelles

  • Upload
    edan

  • View
    30

  • Download
    0

Embed Size (px)

DESCRIPTION

Journées IGEC – novembre 2011 Gestion de données Multi-Echelles. Pascal Neveu (INRA MISTEA – équipe Gamma) Anne Tireau (INRA MISTEA – équipe Gamma ) Mathias Chouet (INRA EGFV / MISTEA – équipe Gamma) Contact : [email protected]. Observations Multi-Echelles. Site. Parcelle. - PowerPoint PPT Presentation

Citation preview

Page 1: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

JOURNÉES IGEC – NOVEMBRE 2011

GESTION DE DONNÉES MULTI-ECHELLES

Pascal Neveu (INRA MISTEA – équipe Gamma)

Anne Tireau (INRA MISTEA – équipe Gamma)

Mathias Chouet (INRA EGFV / MISTEA – équipe Gamma)

Contact : [email protected]

Page 2: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

OBSERVATIONS MULTI-ECHELLES

Site

Serre

PotZone, Placettebloc

Parcelle

Page 3: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

OBSERVATIONS MULTI-ECHELLES

Site

Serre

PotZone, Placettebloc

PlanteOrgane

Tissus

Parcelle

Page 4: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

OBSERVATIONS MULTI-ECHELLES

Site

Serre

PotZone, Placettebloc

PlanteOrgane

Tissus

Cellule

Génome

Parcelle

Page 5: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

BASES DE DONNÉES EXISTANTES

Plante

Cellule

Génome

Site

SerrePotZone, Placette

Parcelle

Page 6: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

BASES DE DONNÉES EXISTANTES

Plante

Cellule

Génome

Site

SerrePotZone, Placette

Parcelle

Page 7: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

BASES DE DONNÉES EXISTANTES

Plante

Cellule

Génome

Site

SerrePotZone, Placette

Parcelle

Page 8: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

BASES DE DONNÉES EXISTANTES

Plante

Cellule

Génome

Site

SerrePotZone, Placette

Parcelle

Page 9: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

BASES DE DONNÉES EXISTANTES

Plante

Cellule

Génome

Site

SerrePotZone, Placette

Parcelle

Page 10: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

BASES DE DONNÉES EXISTANTES

Plante

Cellule

Génome

Site

SerrePotZone, Placette

Parcelle

Page 11: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

BASES DE DONNÉES EXISTANTES

Plante

Cellule

Génome

Site

SerrePotZone, Placette

Parcelle

Page 12: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

SUITE D’OUTILS MUTUALISÉS

Plante

Cellule

Génome

Site

SerrePotZone, Placette

Parcelle

Page 13: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

COUCHE LOGIQUE « ESPÈCE »

Plante

Cellule

Génome

Site

SerrePotZone, Placette

Parcelle

Page 14: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

QUELQUES CARACTÉRISTIQUES DES DONNÉES MULTI-ÉCHELLES

La même donnée peut être observée à différents niveaux (simultanément ou pas)

« Priorité » au niveau le plus proche

Le nombre de niveaux peut varier

Page 15: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

QUELQUES CARACTÉRISTIQUES DU MULTI-ÉCHELLES

Illustration :

Quel est le cumul d’eau entre deux stades phénologiques ?

Quel est le nombre de jours dépassant 35 degrés entre les dates de semis et de récolte ?

Quelles sont les situations où des plantes ont reçu moins de 10 mm d'eau, durant les 200 degrés jours avant la date de floraison ?

Page 16: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

QUELLES SONT LES SITUATIONS OU DES PLANTES ONT REÇU MOINS DE 10 MM D'EAU, DURANT LES 200 DEGRÉS JOURS AVANT LA DATE DE FLORAISON ?

Pour chaque année et chaque plante observée en parcelle ou en serre :

1. Obtenir le génotype2. Obtenir la date de floraison 3. Déterminer la période pour 200 degrés

jours 4. Calculer le cumul d’eau sur cette période5. Filtrer les plantes qui ont reçu moins de

10 mm d’eau6. Retourner la liste des plantes…

Page 17: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

QUELLES SONT LES SITUATIONS OÙ DES PLANTES ONT REÇU MOINS DE 10 MM D'EAU, DURANT LES 200 DEGRÉS JOURS AVANT LA DATE DE FLORAISON ?

Pour chaque année et chaque plante observée en parcelle ou en serre :

1. Obtenir le génotype2. Obtenir la date de floraison 3. Déterminer la période pour 200 degrés jours 4. Calculer le cumul d’eau sur cette période5. Filtrer les plantes qui ont reçu moins de 10

mm d’eau6. Retourner la liste des plantes…

Problème : à quel niveau ces données sont observées

comment y accéder dans des bases de données relationnelles !

Page 18: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

QUELLES SONT LES SITUATIONS OÙ DES PLANTES ONT REÇU MOINS DE 10 MM D'EAU, DURANT LES 200 DEGRÉS JOURS AVANT LA DATE DE FLORAISON ?

Site

PlacetteSous-placette

Plante

Parcelle

Date de Floraison Irrigation

Pluie

Page 19: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

QUELLES SONT LES SITUATIONS OÙ DES PLANTES ONT REÇU MOINS DE 10 MM D'EAU, DURANT LES 200 DEGRÉS JOURS AVANT LA DATE DE FLORAISON ?

Pour une base de données relationnelles :o Nécessite des développements

informatiques

Pour plusieurs bases de données relationnelles : une bonne généricité Appréhender de nombreuses sources de

données Gérer des volumes de données importants

=> Devient problème informatique difficile

Page 20: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

MÉTHODE PROPOSÉE : UNE APPROCHE PAR GRAPHE SÉMANTIQUE

Parcelle Plante

Organe

Cellule

Tissus

Page 21: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

MÉTHODE PROPOSÉE : UNE APPROCHE PAR GRAPHE SÉMANTIQUE

Parcelle Plante

Organe

Cellule

contient

estConstitué

estConstitué

Tissus

estConstitué

Page 22: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

INFÉRENCE ( UTILISATION DE LA TRANSITIVITÉ)APPROCHE PAR GRAPHE SÉMANTIQUE

Parcelle Plante

Organe

Cellule

contient

estConstitué

estConstitué

Tissus

estConstitué estConstitué

estConstitué

Page 23: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

Site

Parcelle

Placette

Plante

QUELLES SONT LES SITUATIONS OÙ DES PLANTES ONT REÇU MOINS DE 10 MM D'EAU, DURANT LES 200 DEGRÉS JOURS AVANT LA DATE DE FLORAISON ?

Pluie

IrrigationDate de floraison

Page 24: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

QUELLES SONT LES SITUATIONS OÙ DES PLANTES ONT REÇU MOINS DE 10 MM D'EAU, DURANT LES 200 DEGRÉS JOURS AVANT LA DATE DE FLORAISON ?

GÉNÉRATION DU GRAPHE SÉMANTIQUE ENTRE LES ÉCHELLES

Site

Parcelle

Placette

Plante

contient

contient

contient

Pluie

IrrigationDate de floraison

Page 25: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

QUELLES SONT LES SITUATIONS OÙ DES PLANTES ONT REÇU MOINS DE 10 MM D'EAU, DURANT LES 200 DEGRÉS JOURS AVANT LA DATE DE FLORAISON ?

GÉNÉRATION DU GRAPHE SÉMANTIQUE : LES ÉVÉNEMENTS

Site

Parcelle

Placette

Plante

contient

contient

contient

Pluie

IrrigationDate de floraison

se produit

se produitse produit

Page 26: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

QUELLES SONT LES SITUATIONS OÙ DES PLANTES ONT REÇU MOINS DE 10 MM D'EAU, DURANT LES 200 DEGRÉS JOURS AVANT LA DATE DE FLORAISON ?

GÉNÉRATION DU GRAPHE SÉMANTIQUE : EXEMPLE DE PECH-ROUGE

Pech-Rouge

La Clape

contient

Page 27: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

QUELLES SONT LES SITUATIONS OÙ DES PLANTES ONT REÇU MOINS DE 10 MM D'EAU, DURANT LES 200 DEGRÉS JOURS AVANT LA DATE DE FLORAISON ?

GÉNÉRATION DU GRAPHE SÉMANTIQUE : EXEMPLE DE PECH-ROUGE

Pech-Rouge

La Clape

PLA_18

contient

contient

Page 28: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

QUELLES SONT LES SITUATIONS OÙ DES PLANTES ONT REÇU MOINS DE 10 MM D'EAU, DURANT LES 200 DEGRÉS JOURS AVANT LA DATE DE FLORAISON ?

GÉNÉRATION DU GRAPHE SÉMANTIQUE : EXEMPLE DE PECH-ROUGE

Pech-Rouge

La Clape

PLA_18

PL_P18_22

contient

contient

contient

Page 29: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

QUELLES SONT LES SITUATIONS OÙ DES PLANTES ONT REÇU MOINS DE 10 MM D'EAU, DURANT LES 200 DEGRÉS JOURS AVANT LA DATE DE FLORAISON ?

GÉNÉRATION DU GRAPHE SÉMANTIQUE : EXEMPLE DE PECH-ROUGE

Pech-Rouge

La Clape

PLA_18

PL_P18_22

contient

contient

contient

Floraison_PLA_18

se produit

Page 30: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

QUELLES SONT LES SITUATIONS OÙ DES PLANTES ONT REÇU MOINS DE 10 MM D'EAU, DURANT LES 200 DEGRÉS JOURS AVANT LA DATE DE FLORAISON ?

GÉNÉRATION DU GRAPHE SÉMANTIQUE : EXEMPLE DE PECH-ROUGE

Pech-Rouge

La Clape

PLA_18

PL_P18_22

contient

contient

contient

Pluie_11/04/11

Irrig_15/06/11Floraison_PLA_18

Irrig_10/05/11

se produit

se produit

se produitse produit

Page 31: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

QUELLES SONT LES SITUATIONS OÙ DES PLANTES ONT REÇU MOINS DE 10 MM D'EAU, DURANT LES 200 DEGRÉS JOURS AVANT LA DATE DE FLORAISON ?

GÉNÉRATION DU GRAPHE SÉMANTIQUE : APRÈS INFÉRENCE

Pech-Rouge

La Clape

PLA_18

PL_P18_22

contient

contient

contient

Pluie_11/04/11

Irrig_15/06/11Floraison_PLA_18

Irrig_10/05/11

Irrig_15/06/11

Irrig_10/05/11

Pluie_11/04/11

Floraison_PLA_18

se produit

se produit

se produitse produit

se produit

se produit

se produit

se produit

Page 32: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

GRAPHE EST FORMALISÉ (RDF/RDF-S/OWL)

Etapes :

Le moteur Corese (INRIA) charge graphe Les règles suivantes sont appliquées : Transitivité de contient Si un Evénement E se produit sur A et A

contient B Alors E se produit sur B.

Production du graphe inféré

Interrogation du graphe inféré (SPARQL)

Page 33: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

QUELLES SONT LES SITUATIONS OÙ DES PLANTES ONT REÇU MOINS DE 10 MM D'EAU, DURANT LES 200 DEGRÉS JOURS AVANT LA DATE DE FLORAISON ?

Approche « graphe sémantique »1. Pour chaque plante et année :

1. Obtenir le génotype2. Lire la date de floraison au niveau de la plante3. Déterminer la période pour 200 degrés jours 4. Calculer le cumul d’eau sur cette période au niveau de

la plante5. Filtrer les plantes qui ont reçu moins de 10 mm d’eau6. Retourner la liste des plantes…

PL_P18_22

Irrig_15/06/11

Irrig_10/05/11

Pluie_11/04/11

Floraison_PLA_18

se produit

se produit

se produit

se produit

Page 34: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

PERSPECTIVES

Affiner les concepts et les relations sémantiques

Elargir le nombre de concepts

Passer d’un prototype à un produit diffusable

Valoriser rapidement au sein de projets et de réseaux

Accompagner la diffusion

Implémenter des fonctionnalités pour permettre la répartition.

Page 35: Journées IGEC – novembre  2011 Gestion de données Multi-Echelles

CONCLUSIONS

Généricité grâce à la séparation entre connaissance et traitements(formalisation des concepts et des règles)

Méthode pour sources hétérogènes

Favorise la mutualisation et les collaborations

Précision et efficacité accrues des interrogations dans un contexte multi-échelles.