26
.01 .01 TERATEC – Atelier nouvelles approches Big Data en Agriculture – 29 juin 2016 - C. Pichot Systèmes d'information pour la gestion de données agronomiques et environnementales : enjeux et stratégie dans le cadre des recherches de l'INRA sur les agro-écosystèmes. Christian Pichot INRA-PACA Estelle Ancelet, Marion Bardy, Patrick Bertuzzi, Pierre Cellier, Antoine Schellenberger, Michèle Tixier-Boichard, Benoît Toutain

Systèmes d'information pour la gestion de données ... · de code source Langages de programmation Outil de virtualisation Logiciels libres (sauf vmware) soutenus par une communauté

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Systèmes d'information pour la gestion de données ... · de code source Langages de programmation Outil de virtualisation Logiciels libres (sauf vmware) soutenus par une communauté

.01.01TERATEC – Atelier nouvelles approches Big Data en Agriculture – 29 juin 2016 - C. Pichot

Systèmes d'information pour la gestionde données agronomiques et environnementales :

enjeux et stratégie dans le cadre desrecherches de l'INRA

sur les agro-écosystèmes.

Christian PichotINRA-PACA

Estelle Ancelet, Marion Bardy, Patrick Bertuzzi, Pierre Cellier,Antoine Schellenberger, Michèle Tixier-Boichard, Benoît Toutain

Page 2: Systèmes d'information pour la gestion de données ... · de code source Langages de programmation Outil de virtualisation Logiciels libres (sauf vmware) soutenus par une communauté

.02.02TERATEC – Atelier nouvelles approches Big Data en Agriculture – 29 juin 2016 - C. Pichot

✔ Croissance démographique, développement économique

=> pression sur les services rendus par les écosystèmes* Alimentation* Eau* (bio)énergie* Cadre de vie

✔ Changement global

Usage des terres => destruction d'habitatsIntensification agricole => pollution des ressourcesClimat : * fort réchauffement, régimes des pluies modifiés

* GES : limitation des productions et séquestration du carbone

Contexte sociétal et environnemental

Sécurité alimentaire, production durable et environnement

Page 3: Systèmes d'information pour la gestion de données ... · de code source Langages de programmation Outil de virtualisation Logiciels libres (sauf vmware) soutenus par une communauté

.03.03TERATEC – Atelier nouvelles approches Big Data en Agriculture – 29 juin 2016 - C. Pichot

Connaître l'état et le fonctionnement des agro/éco-systèmespour proposer des alternatives de gestion

● Observations et expérimentations● Modélisation● Analyse de scénarios d'évolution écologique et économique● Intégration de connaissances à l'échelle du système, en tenant compte des

interactions, sur des moyens et longs termes

Un enjeu majeur de maîtrise des données !

Production – gestion – valorisation - partage* caractéristiques des écosystèmes* processus qui les gouvernent

Quels défis pour la Recherche ?

Page 4: Systèmes d'information pour la gestion de données ... · de code source Langages de programmation Outil de virtualisation Logiciels libres (sauf vmware) soutenus par une communauté

.04.04TERATEC – Atelier nouvelles approches Big Data en Agriculture – 29 juin 2016 - C. Pichot

Les données : au cœur de la connaissance

Experimentationmanipulatingparameters in situ/natura ex situ

ObservationMonitoring (long term)parameters in situ

Modeling

data

Prediction, services to users

Choose/adjustparameters

Choose/adjustparameters

Page 5: Systèmes d'information pour la gestion de données ... · de code source Langages de programmation Outil de virtualisation Logiciels libres (sauf vmware) soutenus par une communauté

.05.05TERATEC – Atelier nouvelles approches Big Data en Agriculture – 29 juin 2016 - C. Pichot

Des recherches sur l'Agriculture, l'Alimentation et l'Environnement

Une problématique de « Big data » :

- parfois en volume(capteurs de flux, phénotypage haut débit, image satellite/aérienne, génomique)

- souvent en hétérogénéité de données

Développement de SI pour la gestionde données agronomiques

et environnementales à l'INRA

Page 6: Systèmes d'information pour la gestion de données ... · de code source Langages de programmation Outil de virtualisation Logiciels libres (sauf vmware) soutenus par une communauté

.06.06TERATEC – Atelier nouvelles approches Big Data en Agriculture – 29 juin 2016 - C. Pichot

Des SI environnementaux thématiques, aux contours des grands réseaux expérimentaux

Agro-météo

Les sols

Pratiques agricoleset pesticides

Ecosystèmes'moins' anthropisés

Le climat

SOERE

..et des plateformes de modélisation

Page 7: Systèmes d'information pour la gestion de données ... · de code source Langages de programmation Outil de virtualisation Logiciels libres (sauf vmware) soutenus par une communauté

.07.07TERATEC – Atelier nouvelles approches Big Data en Agriculture – 29 juin 2016 - C. Pichot

Des données agro-climatiques

● Unité de service « AgroClim »Réseau des stations et SIPartenariat Météo-France

=> réseau d'intérêt commun=> Convention 'recherche'

- Système d'information Gestion/Fourniture de données

Webservices et interopérabilitéBDD et modélisation

Température, pluie, vent, humidité,rayonnement. Données horaires

https://intranet.inra.fr/climatik/do/welcome

Page 8: Systèmes d'information pour la gestion de données ... · de code source Langages de programmation Outil de virtualisation Logiciels libres (sauf vmware) soutenus par une communauté

.08.08TERATEC – Atelier nouvelles approches Big Data en Agriculture – 29 juin 2016 - C. Pichot

Des données sur les sols (1/3)

- Unité de service « InfoSol »Missions nationalesMesures, gestion données et échantillons,statistiques globales et d'indicateurs

Inventaire Gestion et Conservation des Sols (IGCS)=> Référentiel Régional Pédologique (1/250 000e) 80 % territoire métropolitain couvert

Réseau de Mesure de la Qualité des Sols (RMQS)=> suivi long terme 2240 points sur un maillage 16 x 16 km

Analyses agronomiques=> BDD des analyses de terre (BDAT)

> 2 millions échantillons

Conservatoire européen d'échantillons

Page 9: Systèmes d'information pour la gestion de données ... · de code source Langages de programmation Outil de virtualisation Logiciels libres (sauf vmware) soutenus par une communauté

.09.09TERATEC – Atelier nouvelles approches Big Data en Agriculture – 29 juin 2016 - C. Pichot

Des données sur les sols (2/3)

- Système d'information

Collecte/traitement/diffusion de données

Applications thématiques

Croisements de couches thématiques

Valorisation cartographiqueet webservices

Saisie & Collecte

Décisionnel

ValorisationDiffusion

DBGSF DBETM DBATDBGSF DoneSol

Page 10: Systèmes d'information pour la gestion de données ... · de code source Langages de programmation Outil de virtualisation Logiciels libres (sauf vmware) soutenus par une communauté

.010.010TERATEC – Atelier nouvelles approches Big Data en Agriculture – 29 juin 2016 - C. Pichot

Données sur les agrosystèmeset les pesticides (1/3)

- INRA, ONEMA, MinistèreUnité de service « InfoSol » et UMR AgroEcologie

Plan national « Ecophyto » – Grenelle de l'environnement Ministère Agriculture, Recherche et Filière agricole

Pratiques agricoles économes en pesticides=> Référentiel de pratiques et impacts

Basé sur le réseau de suivi DEPHY=> 1900 FERMEs et 180 sites EXPE.6 filières : grandes cultures,polyculture-élevage, cultures légumières,arboriculture, viticulture, horticulture

Multiples partenaires

Page 11: Systèmes d'information pour la gestion de données ... · de code source Langages de programmation Outil de virtualisation Logiciels libres (sauf vmware) soutenus par une communauté

.011.011TERATEC – Atelier nouvelles approches Big Data en Agriculture – 29 juin 2016 - C. Pichot

Données sur les agrosystèmeset les pesticides (2/3)

- Système d'information « Agrosyst »

Valoriser les données sur les systèmes de culture innovants

Description du système de culture Exploitation agricole, itinéraire technique, décisionnel, production, environnement

Indicateur de performancefréquence des traitements, environnement,économie, énergie, GES, NPK

Identification des systèmes économes

Production de références

Page 12: Systèmes d'information pour la gestion de données ... · de code source Langages de programmation Outil de virtualisation Logiciels libres (sauf vmware) soutenus par une communauté

.012.012TERATEC – Atelier nouvelles approches Big Data en Agriculture – 29 juin 2016 - C. Pichot

Données sur les agrosystèmeset les pesticides (3/3)

BDD et référentiels

Fort potentiel dans le cadre du big data et de l'intelligence artificielle

WEBSaisie,

Indicateurscommunication

Page 13: Systèmes d'information pour la gestion de données ... · de code source Langages de programmation Outil de virtualisation Logiciels libres (sauf vmware) soutenus par une communauté

.013.013TERATEC – Atelier nouvelles approches Big Data en Agriculture – 29 juin 2016 - C. Pichot

Données des observatoires en environnement (1/3)

- SOERE – AllEnviSystèmes d’observation et d’expérimentation au long terme pour la recherche en environnement

Sites instrumentés de suivi de écosystèmes

LacsSOERE OLA

PrairiesSOERE ACBB

ForetsSOERE F-ORE-T

Page 14: Systèmes d'information pour la gestion de données ... · de code source Langages de programmation Outil de virtualisation Logiciels libres (sauf vmware) soutenus par une communauté

.014.014TERATEC – Atelier nouvelles approches Big Data en Agriculture – 29 juin 2016 - C. Pichot

SOERE ACBB(grassland & crops)

SOERE OLAalpine lakes(

F-ORE-T(Forests)

Données physiques GHG fluxes(CO2 ; H2O, N2O; CH4) Meteorological data, Soil Temp and humidity, texture,

...chimiques- Soil chemical comp (C,N,P,K)- Water chemical quality parameters(N, C, T, pH,O2, ..)

….biologiquesBiodiversity : floristic, microbes, worms,

phytoplancton, zooplanction, fishMolecular barcodingSoil microorganisms (metagenomics)Biomass assessment

- … de gestion management practices : crop systems,

livestock farming systems

Données des observatoires en environnement (2/3)

Page 15: Systèmes d'information pour la gestion de données ... · de code source Langages de programmation Outil de virtualisation Logiciels libres (sauf vmware) soutenus par une communauté

.015.015TERATEC – Atelier nouvelles approches Big Data en Agriculture – 29 juin 2016 - C. Pichot

Données des observatoires en environnement (3/3)

- Système d'information à architecture modulaire

« zooplankton »module

« Physico-chemical »module

« managmt practice »module

KernelAll common features

«xx »module

«meteorology

Kernel Kernel

«meteorology

SI SOERE Lacs

SI SOERE forêts

Page 16: Systèmes d'information pour la gestion de données ... · de code source Langages de programmation Outil de virtualisation Logiciels libres (sauf vmware) soutenus par une communauté

.016.016TERATEC – Atelier nouvelles approches Big Data en Agriculture – 29 juin 2016 - C. Pichot

Ressources et organisation pour le développement des SI environnementaux

- Structures mutualiséesUnité de Service (Infosol et Agroclim)Centre de Traitement Automatisé de l'Information (CATI) :

Bases de données, IDS et Modélisation

- Pilotage stratégique par réseau thématique

- Infrastructures matérielles Cadre du Schéma Directeur des SI de l'INRA,

partage des ressources physiques, virtualisation des serveurs

- Développement en interne et sous traitanceForte interaction informaticiens / réseau thématiquePartage de logiciels et technologiesMéthodologie « Agile »

Page 17: Systèmes d'information pour la gestion de données ... · de code source Langages de programmation Outil de virtualisation Logiciels libres (sauf vmware) soutenus par une communauté

Technologies

.01715/03/2016

Système d’exploitation

BDD

Gestionnaire de code source

Langages de programmation

Outil de virtualisation

Logiciels libres (sauf vmware)

soutenus par une communauté importante

Gestionnaires d’anomalies

Qualité et Documentation

Évaluation Infosol : bilan du pôle SI / Estelle Ancelet, Antoine Schellenberger, Benoît Toutain

SOL AgroSyst

SOERE

Climat

Page 18: Systèmes d'information pour la gestion de données ... · de code source Langages de programmation Outil de virtualisation Logiciels libres (sauf vmware) soutenus par une communauté

.018.018TERATEC – Atelier nouvelles approches Big Data en Agriculture – 29 juin 2016 - C. Pichot

Intégration des SI et développementde services transversaux

- Caractériser les ressources disponiblesMétadonnées pour le porter à connaissance

- Développer l'interopérabilité des SI● webservices ad hoc● sémantique (thésaurus et ontologie)

- Contribuer aux infrastructures de recherche européennes

- Contribuer à l'Open Data et l'Open SciencePublication des données (DOI et data paper)Exploitation des données disponibles (fouille...)

Page 19: Systèmes d'information pour la gestion de données ... · de code source Langages de programmation Outil de virtualisation Logiciels libres (sauf vmware) soutenus par une communauté

.019.019TERATEC – Atelier nouvelles approches Big Data en Agriculture – 29 juin 2016 - C. Pichot

Une palette de services pour l'expérimentation en environnement

Intégration des SI :l'infrastructure AnaEE-France

Page 20: Systèmes d'information pour la gestion de données ... · de code source Langages de programmation Outil de virtualisation Logiciels libres (sauf vmware) soutenus par une communauté

.020.020TERATEC – Atelier nouvelles approches Big Data en Agriculture – 29 juin 2016 - C. Pichot

porter à connaissance

accéder aux ressources

...distribuées et très hétérogènes

Intégration des SI :l'infrastructure AnaEE-France

Page 21: Systèmes d'information pour la gestion de données ... · de code source Langages de programmation Outil de virtualisation Logiciels libres (sauf vmware) soutenus par une communauté

.021.021TERATEC – Atelier nouvelles approches Big Data en Agriculture – 29 juin 2016 - C. Pichot

Porter à connaissance

Directive européenne INSPIRE

Accès générique aux données

Open Science

Systèmes d'Information -BDD

Mutualisation des développements

et des infrastucture

Interopérabilité - webservices

SI des SOERE

SI dispos à façon PF modélisation

Une infrastructure distribuéede SI interopérables

Page 22: Systèmes d'information pour la gestion de données ... · de code source Langages de programmation Outil de virtualisation Logiciels libres (sauf vmware) soutenus par une communauté

.022.022TERATEC – Atelier nouvelles approches Big Data en Agriculture – 29 juin 2016 - C. Pichot

Porter à connaissance

Directive européenne INSPIRE

Accès générique aux données

Open Science

Systèmes d'Information -BDD

Mutualisation des développements

et des infrastucture

Interopérabilité - webservices

Catalogue de découverte

Qui, Quoi, Où, Quand ?

Portail d'accès

Métadonnées d'exploitation

et sémantique

SI des SOERE

SI dispos à façon PF modélisation

Une infrastructure distribuéede SI interopérables

Page 23: Systèmes d'information pour la gestion de données ... · de code source Langages de programmation Outil de virtualisation Logiciels libres (sauf vmware) soutenus par une communauté

.023.023TERATEC – Atelier nouvelles approches Big Data en Agriculture – 29 juin 2016 - C. Pichot

Un catalogue pourla découverte des ressources

1) Conformité avec directive INSPIRE2) Mots clés issus de thésaurus3) Interopératibilité et moisonnage (-> géocatalogue national)

Page 24: Systèmes d'information pour la gestion de données ... · de code source Langages de programmation Outil de virtualisation Logiciels libres (sauf vmware) soutenus par une communauté

.024.024TERATEC – Atelier nouvelles approches Big Data en Agriculture – 29 juin 2016 - C. Pichot

- Directe et ad hoc par webservice

- Généralisée via la sémantique

SI SOERE ACBB PF modélisation

Développer l'interopérabilitédes éléments distribués

Page 25: Systèmes d'information pour la gestion de données ... · de code source Langages de programmation Outil de virtualisation Logiciels libres (sauf vmware) soutenus par une communauté

.025.025TERATEC – Atelier nouvelles approches Big Data en Agriculture – 29 juin 2016 - C. Pichot

Annotation sur une ontologie

Portail d'accès aux ressources

Page 26: Systèmes d'information pour la gestion de données ... · de code source Langages de programmation Outil de virtualisation Logiciels libres (sauf vmware) soutenus par une communauté

.026.026TERATEC – Atelier nouvelles approches Big Data en Agriculture – 29 juin 2016 - C. Pichot

Merci pour votre attention