11
Territoires, Environnement, Télédétection et Information Spatiale Unité Mixte de Recherche AgroParisTech - Irstea - Cirad Gestion massive des données Mathieu Roche (Cirad) Maguelonne Teisseire (Irstea) Journes 2014 du Labex Agro

Mathieu Roche (Cirad) Maguelonne Teisseire (Irstea) Agro Days 2014/04 April AM... · analyse, fouille de données) Quels types de données€? ... Fouille données textuelles hétérogènes

Embed Size (px)

Citation preview

Page 1: Mathieu Roche (Cirad) Maguelonne Teisseire (Irstea) Agro Days 2014/04 April AM... · analyse, fouille de données) Quels types de données€? ... Fouille données textuelles hétérogènes

Territoires, Environnement, Télédétection et Information Spatiale

Unité Mixte de Recherche AgroParisTech - Irstea - Cirad

Gestion massive des données

Mathieu Roche (Cirad)Maguelonne Teisseire (Irstea)

Journees 2014 du Labex Agro

Page 2: Mathieu Roche (Cirad) Maguelonne Teisseire (Irstea) Agro Days 2014/04 April AM... · analyse, fouille de données) Quels types de données€? ... Fouille données textuelles hétérogènes

2

Big Data

Les 3VVolume

Dans le contexte des recherches à TETIS :

- Données images : aujourd’hui une dizaine d’images par an (satellites SPOT, Landsat, etc.), une image tous les 5 jours d’ici trois ans (Sentinel-2)

- Autres données (textes, numériques, etc)

Page 3: Mathieu Roche (Cirad) Maguelonne Teisseire (Irstea) Agro Days 2014/04 April AM... · analyse, fouille de données) Quels types de données€? ... Fouille données textuelles hétérogènes

3

Big Data

Les 3V

Volume• Données massives

Variété• Données hétérogènes « syntaxiquement » et « sémantiquement »

Vélocité• Données disponibles par flux

… et d'autres V

Versatilité, Véracité, Visualisation, Valorisation, Vivification, etc.

=> creation d'un GdR CNRS autour de cette thematique

Page 4: Mathieu Roche (Cirad) Maguelonne Teisseire (Irstea) Agro Days 2014/04 April AM... · analyse, fouille de données) Quels types de données€? ... Fouille données textuelles hétérogènes

Processus :

collecte des données (acquisition, indexation, qualité, etc.),

accès aux données/informations (interrogation, visualisation, etc.),

exploration des données/informations/connaissances  (intégration, analyse, fouille de données)

Quels types de données ?

Big Data et traitement

Page 5: Mathieu Roche (Cirad) Maguelonne Teisseire (Irstea) Agro Days 2014/04 April AM... · analyse, fouille de données) Quels types de données€? ... Fouille données textuelles hétérogènes

5

Images

Images satellitaires Vers une mise à disposition de gros volume de données… mais peu de

méthode d’analyse ! Fouille d’images satellites (Remote Sensing Image Mining) avec une

perspective temporelle et spatiale encore peu explorée

Page 6: Mathieu Roche (Cirad) Maguelonne Teisseire (Irstea) Agro Days 2014/04 April AM... · analyse, fouille de données) Quels types de données€? ... Fouille données textuelles hétérogènes

6

Quelles données/informations utiliser ?

Informations radiométriques, texturales et temporelles

- Carte culture / non culture- Distance au village- Taille de la parcelle- etc.

Informations statiques

TELEDETECTION TERRAIN

BD Terrain :- Relevés parcellaires- Contour GPS- Culture au sol- Itinéraire technique…

Typologie des systèmes de cultureClasse A : riz irriguéClasse B : riz pluvial de tavy (colline)Classe C : maïsClasse D : manioc…

SPOT date n(10 – 20 m)

Pleaides(mono-date)(0.7 m)

SPOT date 1

SPOT date 2SPOT date 3

Page 7: Mathieu Roche (Cirad) Maguelonne Teisseire (Irstea) Agro Days 2014/04 April AM... · analyse, fouille de données) Quels types de données€? ... Fouille données textuelles hétérogènes

7

Fouille d'images

Détection automatique de dynamiques spatio-temporelles à partir de séries d’images satellitaires

Fusion d'images satellitaires pour la production de séries temporelles d’images à résolution spatiale élevée

Page 8: Mathieu Roche (Cirad) Maguelonne Teisseire (Irstea) Agro Days 2014/04 April AM... · analyse, fouille de données) Quels types de données€? ... Fouille données textuelles hétérogènes

8

Combinaison images et textes

Projet Animitex (CNRS Mastodons)Exploiter des données textuelles massives et hétérogènes permettant de compléter l’analyse des images satellitaires

Contexte Limite des algorithmes de classification pour une analyse fine des images

(par exemple, distinguer les types de cultures, fonction des batiments, etc.) Investissement humain conséquent

Page 9: Mathieu Roche (Cirad) Maguelonne Teisseire (Irstea) Agro Days 2014/04 April AM... · analyse, fouille de données) Quels types de données€? ... Fouille données textuelles hétérogènes

9

Fouille données textuelles hétérogènesProjet Senterritoire (MSH-M) 2ème phase ANR 2014

La perception de l’aménagement d’un territoireLa perception de l’aménagement d’un territoire

1ère Phase

Extraction des entités spatiales

2ème Phase

Identification des opinions des acteurs

E. Kergosien, B. Laval, M. Roche, M. Teisseire: Are opinions expressed in land-use planning documents? International Journal of Geographical Information Science 28(4): 739-762 (2014)

Page 10: Mathieu Roche (Cirad) Maguelonne Teisseire (Irstea) Agro Days 2014/04 April AM... · analyse, fouille de données) Quels types de données€? ... Fouille données textuelles hétérogènes

10

Fouille données textuelles hétérogènes

La fouilles de textes pour l'agriculture

Veille épidémiologique

Collaboration UMR CMAEE (Controle des maladies animales, exotiques et émergentes)

Extraction d'information dans les ressources bibliographiques

Collaboration avec l'UMR IATE (Ingénierie des Agro-polymères et Technologies Émergentes)

Methodologie :

Processus : Acquisition de données, recherche d'information, extraction d'information (combinaison d'approches linguistiques et statistiques)

Page 11: Mathieu Roche (Cirad) Maguelonne Teisseire (Irstea) Agro Days 2014/04 April AM... · analyse, fouille de données) Quels types de données€? ... Fouille données textuelles hétérogènes

11

Conclusion