27
Génération de population Génération de population agricole à partir de données agricole à partir de données agrégées et d’un panel agrégées et d’un panel représentatif de fermes. représentatif de fermes. réalisé par Mickaël Bourion au LISC, Cemagref de Clermont Ferrand sous la direction de Thierry Faure DESS SIAD année 2001-2002 10 septembre 2002

Génération de population agricole à partir de données agrégées et dun panel représentatif de fermes. réalisé par Mickaël Bourion au LISC, Cemagref de Clermont

Embed Size (px)

Citation preview

Page 1: Génération de population agricole à partir de données agrégées et dun panel représentatif de fermes. réalisé par Mickaël Bourion au LISC, Cemagref de Clermont

Génération de population agricole à partir Génération de population agricole à partir de données agrégées et d’un panel de données agrégées et d’un panel

représentatif de fermes.représentatif de fermes.

réalisé par

Mickaël Bourion

au LISC, Cemagref de Clermont Ferrand

sous la direction de

Thierry Faure

DESS SIAD année 2001-2002

10 septembre 2002

Page 2: Génération de population agricole à partir de données agrégées et dun panel représentatif de fermes. réalisé par Mickaël Bourion au LISC, Cemagref de Clermont

SommaireSommaire• IntroductionIntroduction

• I. Analyse de données

• II. Les méthodes de génération de population

• III. L’application

• Conclusion - Perspectives

Page 3: Génération de population agricole à partir de données agrégées et dun panel représentatif de fermes. réalisé par Mickaël Bourion au LISC, Cemagref de Clermont

Le contexte du stage

• Le CIAT (Centre International de l’Agriculture Tropicale)

• Données de recensement : Confidentielles ! Seuls sont disponibles:- Données agrégées- Echantillons

• Nécessité de créer une application générant une population à partir de ces données

Introduction

Page 4: Génération de population agricole à partir de données agrégées et dun panel représentatif de fermes. réalisé par Mickaël Bourion au LISC, Cemagref de Clermont

Objectifs de l’étude

• Développer un outil réalisant la reconstruction de population

• Utiliser la population agricole complète du Honduras :- Comme exemple pour l’application- Pour étudier ses caractéristiques - Pour manipuler les méthodes d’agrégation

Introduction

Page 5: Génération de population agricole à partir de données agrégées et dun panel représentatif de fermes. réalisé par Mickaël Bourion au LISC, Cemagref de Clermont

Spécifications du programme

• Outil générique (échelles et paramètres variables)

• Opération « inverse » : générer une population à partir d’un échantillon

• Programme en sources libres

• Localisation en 3 langues

Introduction

Page 6: Génération de population agricole à partir de données agrégées et dun panel représentatif de fermes. réalisé par Mickaël Bourion au LISC, Cemagref de Clermont

• Introduction

• I. Analyse de donnéesI. Analyse de données

• II. Les méthodes de génération de population

• III. L’application

• Conclusion - Perspectives

Page 7: Génération de population agricole à partir de données agrégées et dun panel représentatif de fermes. réalisé par Mickaël Bourion au LISC, Cemagref de Clermont

Présentation des données• Le Honduras plus de 300 000 exploitations

3 échelles administratives :

I. Analyse de données

HondurasHonduras

Département 1Département 1 Département 2Département 2 Département 18Département 18

Municipalité 100Municipalité 100 Municipalité 101Municipalité 101 Municipalité 124Municipalité 124

Village 10001Village 10001

Village 10023Village 10023

Village 10095Village 10095

Page 8: Génération de population agricole à partir de données agrégées et dun panel représentatif de fermes. réalisé par Mickaël Bourion au LISC, Cemagref de Clermont

Présentation des données

• 3 matrices de paramètres :

- Exploitations (surfaces, usage des terres…)

- Producteurs (âge, sexe, condition juridique…)

- Productions (quantités et types…)

I. Analyse de données

Page 9: Génération de population agricole à partir de données agrégées et dun panel représentatif de fermes. réalisé par Mickaël Bourion au LISC, Cemagref de Clermont

Mise en œuvre d’algorithmes avec Scilab

• Formatage des données

• Agrégations

• Corrélations entre paramètres

I. Analyse de données

Page 10: Génération de population agricole à partir de données agrégées et dun panel représentatif de fermes. réalisé par Mickaël Bourion au LISC, Cemagref de Clermont

Résultats• Agrégations• Corrélations entre paramètres : Données

trop disparates

I. Analyse de données

Répartition des tailles de fermes selon des classes (Ha) par département

0%

20%

40%

60%

80%

100%

Code département

su

rfa

ce

(H

a)

10000 et +

5000 à 10000

1000 à 5000

500 à 1000

100 à 500

50 à 100

10 à 50

5 à 10

1 à 5

0 à 1

Page 11: Génération de population agricole à partir de données agrégées et dun panel représentatif de fermes. réalisé par Mickaël Bourion au LISC, Cemagref de Clermont

• Introduction

• I. Analyse de données

• II. Les méthodes de génération de II. Les méthodes de génération de populationpopulation

• III. L’application

• Conclusion - Perspectives

Page 12: Génération de population agricole à partir de données agrégées et dun panel représentatif de fermes. réalisé par Mickaël Bourion au LISC, Cemagref de Clermont

Principe de la méthode utilisée

• Multiplication des prototypes d’un échantillon par des coefficients

• Choix optimal de ces coefficients pour respecter les contraintes des données agrégées

• Besoin d’un algorithme de minimisation des erreurs

II. Les méthodes de génération de population

Page 13: Génération de population agricole à partir de données agrégées et dun panel représentatif de fermes. réalisé par Mickaël Bourion au LISC, Cemagref de Clermont

Principe de la méthode utiliséeII. Les méthodes de génération de population

Prototype 1

Prototype 2

Prototype 3

Prototype 1Prototype 1

Prototype 2Prototype 2

Prototype 3Prototype 3

Prototype 3

Ferme 1

Ferme 2

Ferme 4

Ferme 5

Ferme 6

Ferme 7

Ferme 8

Ferme 3

P’ (échantillon)

P’’ (pop générée)

P (pop initiale)

Σ fermes = 8

Σ productions = 150

P (données agrégées)

Prototype 2

Page 14: Génération de population agricole à partir de données agrégées et dun panel représentatif de fermes. réalisé par Mickaël Bourion au LISC, Cemagref de Clermont

2 types d’algorithmes

II. Les méthodes de génération de population

• Algorithme quadratique : pour générer une population à partir d’un échantillon.

• Algorithme de type Monte Carlo (non analytique) : pour générer un échantillon à partir d’une population entière

Page 15: Génération de population agricole à partir de données agrégées et dun panel représentatif de fermes. réalisé par Mickaël Bourion au LISC, Cemagref de Clermont

Algorithme de minimisation quadratique

• Formulation du problème

Transformation min (0.5*xt*Q*x+pt*x) I*x=N

• Pour le programme : Algorithme de « R »

II. Les méthodes de génération de population

Nxn

i

i1

))(()((min 2

11

2

11i

ik

n

i

ki

Pk

K

ki

n

i

ki

Pk

K

kx

xQaQxani

Contrainte(s) :

+ …

producteursproducteurs productionsproductions

Page 16: Génération de population agricole à partir de données agrégées et dun panel représentatif de fermes. réalisé par Mickaël Bourion au LISC, Cemagref de Clermont

Algorithmes de type Monte Carlo

• Hill climbing

• recuit simulé (simulated annealing)P(δE) = exp (-δE / T)

• Algorithme génétique

• …

II. Les méthodes de génération de population

Page 17: Génération de population agricole à partir de données agrégées et dun panel représentatif de fermes. réalisé par Mickaël Bourion au LISC, Cemagref de Clermont

• Introduction

• I. Analyse de données

• II. Les méthodes de génération de population

• III. L’applicationIII. L’application

• Conclusion - Perspectives

Page 18: Génération de population agricole à partir de données agrégées et dun panel représentatif de fermes. réalisé par Mickaël Bourion au LISC, Cemagref de Clermont

Les modules du programme

• Module Population

• Module Statistiques

• Module Minimisation

III. L’application

Page 19: Génération de population agricole à partir de données agrégées et dun panel représentatif de fermes. réalisé par Mickaël Bourion au LISC, Cemagref de Clermont

III. L’application

Diagramme UML

Page 20: Génération de population agricole à partir de données agrégées et dun panel représentatif de fermes. réalisé par Mickaël Bourion au LISC, Cemagref de Clermont

L’arborescence de répertoires

III. L’application

HondurasHonduras

Département 1Département 1 Département 2Département 2 Département 18Département 18

Municipalité 100Municipalité 100 Municipalité 101Municipalité 101 Municipalité 124Municipalité 124

Village 10001Village 10001

Village 10023Village 10023

Village 10095Village 10095

Prototype.txtPrototype.txt

DonnéesAgreg.txtDonnéesAgreg.txt

Info.txtInfo.txt

ProtoGénérés.txtProtoGénérés.txt

Page 21: Génération de population agricole à partir de données agrégées et dun panel représentatif de fermes. réalisé par Mickaël Bourion au LISC, Cemagref de Clermont

L’interface : onglet population

III. L’application

Page 22: Génération de population agricole à partir de données agrégées et dun panel représentatif de fermes. réalisé par Mickaël Bourion au LISC, Cemagref de Clermont

L’interface : Fenêtre de visualisation de l’arbre

III. L’application

Page 23: Génération de population agricole à partir de données agrégées et dun panel représentatif de fermes. réalisé par Mickaël Bourion au LISC, Cemagref de Clermont

L’interface : onglet Statistiques

III. L’application

Page 24: Génération de population agricole à partir de données agrégées et dun panel représentatif de fermes. réalisé par Mickaël Bourion au LISC, Cemagref de Clermont

Aspects du module Plan d’expérience

III. L’application

Génération de Génération de populationpopulation

Génération Génération d’échantillond’échantillon

Région étudiéeRégion étudiée

paramètres à minimiserparamètres à minimiser

types des données types des données agrégées agrégées (qualitatif/ quantitatif)(qualitatif/ quantitatif)

seuil d’erreur seuil d’erreur (pour chaque (pour chaque paramètre)paramètre)

Zone d’explorationZone d’exploration

Algorithme 1Algorithme 1

GénérerGénérer

Algorithme 2Algorithme 2

Page 25: Génération de population agricole à partir de données agrégées et dun panel représentatif de fermes. réalisé par Mickaël Bourion au LISC, Cemagref de Clermont

• Introduction

• I. Analyse de données

• II. Les méthodes de génération de population

• III. L’application

• Conclusion - PerspectivesConclusion - Perspectives

Page 26: Génération de population agricole à partir de données agrégées et dun panel représentatif de fermes. réalisé par Mickaël Bourion au LISC, Cemagref de Clermont

Conclusion

• Acquisition de nouveaux outils

• Bilan de l’analyse de données

• Bilan de l’application - résultats

Conclusion - Perspectives

Page 27: Génération de population agricole à partir de données agrégées et dun panel représentatif de fermes. réalisé par Mickaël Bourion au LISC, Cemagref de Clermont

Perspectives

• Documentation• Essais et comparaisons des 2 algorithmes• Module plan d’expérience

• Module Visualisation (Java Analysis Studio)• Projet « ouvert »

- Statistiques évoluées (AFC, Clustering)

- ajouts de nouvelles fonctions…

Conclusion - Perspectives