30
PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE Laurent CARRARO mars 06

PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE

  • Upload
    mikaia

  • View
    102

  • Download
    0

Embed Size (px)

DESCRIPTION

PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE. Laurent CARRARO mars 06. Plan. Introduction Formalisation Le phénomène réel Le simulateur Les problèmes à résoudre Métamodèles et géostatistique Modèles pour l’apprentissage Caractéristiques des expériences numériques - PowerPoint PPT Presentation

Citation preview

Page 1: PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE

PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE

Laurent CARRARO

mars 06

Page 2: PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE

2/30

L. Carraro - mars 06

Plan

IntroductionFormalisation

Le phénomène réelLe simulateurLes problèmes à résoudre

Métamodèles et géostatistiqueModèles pour l’apprentissageCaractéristiques des expériences numériquesRappels de géostatistiqueComputer experiments et géostatistique

Conclusions

Page 3: PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE

3/30

L. Carraro - mars 06

Plan

IntroductionFormalisation

Le phénomène réelLe simulateurLes problèmes à résoudre

Métamodèles et géostatistiqueModèles pour l’apprentissageCaractéristiques des expériences numériquesRappels de géostatistiqueComputer experiments et géostatistique

Conclusions

Page 4: PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE

4/30

L. Carraro - mars 06

Exemple : exploration pétrolière

Objectifs :découvrir, évaluer et produire des réservoirs pétroliers.

objets complexes, difficilement accessibles, mal connus.

nécessité d’investir des sommes colossales.

Risques financiers énormes

nécessité de développer une méthode

de gestion des incertitudes subsurface.

Page 5: PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE

5/30

L. Carraro - mars 06

Problèmes à résoudre

Trois types de problèmesPropagation des incertitudes

Calage/qualification de codes

Optimisation

Enjeux et objectifsAnalyses de risques pour prise de décision

Maximiser la rentabilité

Page 6: PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE

6/30

L. Carraro - mars 06

Exploration pétrolière

évaluation de la production

y1(t), y2(t),…, yn(t)

caractéristiques du réservoir

scénario(s) de production

SIMULATEUR

Page 7: PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE

7/30

L. Carraro - mars 06

Problèmes direct et inverse

En phase d’appréciation / développementQuel impact les incertitudes sur les caractéristiques du réservoir peuvent avoir sur l’évaluation de la production et des réserves?

Direct : propagation des incertitudes

caractéristiques du réservoir évaluation de la production

En phase de productionComment la connaissance de la production passée, avec ses erreurs de mesures, peut aider à mieux connaître les caractéristiques du réservoir et à affiner les prédictions de production?

Inverse : calage

Page 8: PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE

8/30

L. Carraro - mars 06

Plan

IntroductionFormalisation

Le phénomène réelLe simulateurLes problèmes à résoudre

Métamodèles et géostatistiqueModèles pour l’apprentissageCaractéristiques des expériences numériquesRappels de géostatistiqueComputer experiments et géostatistique

Conclusions

Page 9: PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE

9/30

L. Carraro - mars 06

Le phénomène réel

Il est caractérisé par :

des variables d’intérêt yréel

exemple : production de pétrole cumulée à venir

des variables d’environnement venv

variables subies et mal connues, de grande dimension

exemple : caractéristiques du sous-sol

des variables de contrôle ucont

variables pouvant être fixées par l’utilisateur pour atteindre divers objectifs

Page 10: PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE

10/30

L. Carraro - mars 06

Ces variables sont liées selon le schéma fonctionnel suivant :

),( contenvréelréel uvfy =

Variables d’environnement venv

Variables de contrôle ucont

Variables d’intérêt yréelfréel

Le phénomène réel

Page 11: PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE

11/30

L. Carraro - mars 06

Plan

IntroductionFormalisation

Le phénomène réelLe simulateurLes problèmes à résoudre

Métamodèles et géostatistiqueModèles pour l’apprentissageCaractéristiques des expériences numériquesRappels de géostatistiqueComputer experiments et géostatistique

Conclusions

Page 12: PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE

12/30

L. Carraro - mars 06

La fonction fréel est approchée par un simulateur.

Une nouvelle classe de variables, les variables de simulation, apparaît pour :

paramétrer le simulateur et/ou l’ajuster (« tuning parameters »)

Ainsi :

ysim est la réponse estimée par le simulateur

uenv est une approximation des variables d’environnement de

venv

ucont représente les variables de contrôle

usim est le vecteur des variables de simulation

)( envenv vu ϕ=

Le simulateur

Page 13: PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE

13/30

L. Carraro - mars 06

avec pour forme fonctionnelle :

)/,( simcontenvsimsim uuufy =

Variables d’environnement uenv

Variables de contrôle ucont

Variables d’intérêt ysimfsim

Variables de simulation usim

Le simulateur

Page 14: PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE

14/30

L. Carraro - mars 06

Plan

IntroductionFormalisation

Le phénomène réelLe simulateurLes problèmes à résoudre

Métamodèles et géostatistiqueModèles pour l’apprentissageCaractéristiques des expériences numériquesRappels de géostatistiqueComputer experiments et géostatistique

Conclusions

Page 15: PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE

15/30

L. Carraro - mars 06

Les problèmes à résoudre

Propagation d’incertitudesComment propager les incertitudes affectant la variable uenv

sur la réponse ysim ?

Problèmes inversesCalage de paramètres / d’historique

Les variables de contrôle sont fixées et le phénomène réel est observé. Comment ajuster les paramètres d’environnement et/ou de simulation pour reproduire les observations ?

Optimisation des variables de contrôleLes variables de modélisation et d’environnement sont fixées et

un ou plusieurs critères à maximiser introduits. Quel niveau des variables de contrôle ucont  maximise les critères ?

Page 16: PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE

16/30

L. Carraro - mars 06

Difficultés à surmonter

Dimension des variables du problèmeIl faut réduire la taille des variables en présence

Analyses de sensibilités (globales)

Temps de calcul de fsim

Renault : simulation d’un cycle d’explosion dans un cylindre. Quelques heures de calcul pour simuler une fraction de secondes.

ONERA: une simulation de soufflerie à Mach 3 dure plusieurs semaines.

Page 17: PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE

17/30

L. Carraro - mars 06

Démarche adoptée

Approximation du simulateurOn remplace le simulateur fsim par une fonction plus simple, notée fapp. C’est la surface de réponse.

La réponse yapp donnée par la fonction fapp est liée aux variables d’environnement xenv, de contrôle ucont et d’approximation uapp par :

Plan d’expériences numériquesPour construire la fonction approchée fapp, le simulateur est évalué sur un jeu de variables d’environnement, qui constitue un plan d’expériences numériques.

)/,( appcontenvappapp uuxfy =

Page 18: PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE

18/30

L. Carraro - mars 06

En résumé

fapp

fsim

X

Y fréel

ObservationsRéponses

Points d’évaluation du simulateur

Page 19: PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE

19/30

L. Carraro - mars 06

Plan

IntroductionFormalisation

Le phénomène réelLe simulateurLes problèmes à résoudre

Métamodèles et géostatistiqueModèles pour l’apprentissageCaractéristiques des expériences numériquesRappels de géostatistiqueComputer experiments et géostatistique

Conclusions

Page 20: PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE

20/30

L. Carraro - mars 06

Modèles pour l’apprentissage

Historiquement : reconnaissance des formes

Domaine frontière - data mining :informatique

neurosciences

statistiques

Apprentissage supervisé :apprendre une relation, une classification,

à partir d’une base d’exemples,

et d’informations a priori

Page 21: PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE

21/30

L. Carraro - mars 06

Quelques modèles du data mining

Modèles paramétriques :Régression linéaireRégression non linéaire

Modèles non paramétriques :Lissage et splinesmodèles semi-paramétriques (GAM, PPR…)réseaux de neuronesmachines à support vectoriel (SVM)arbres de régression et forêts aléatoiresbagging et boosting

Page 22: PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE

22/30

L. Carraro - mars 06

Plan

IntroductionFormalisation

Le phénomène réelLe simulateurLes problèmes à résoudre

Métamodèles et géostatistiqueModèles pour l’apprentissageCaractéristiques des expériences numériquesRappels de géostatistiqueComputer experiments et géostatistique

Conclusions

Page 23: PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE

23/30

L. Carraro - mars 06

Expériences numériques

Les variables d’environnement sont inconnues, mais on peut les fixer !!

Les points sur le bord du plan d’expériences sont de probabilité nulle.

Problème des plans d’expériences factoriels.

Répétabilité : fsim est une fonction !

Page 24: PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE

24/30

L. Carraro - mars 06

Plan

IntroductionFormalisation

Le phénomène réelLe simulateurLes problèmes à résoudre

Métamodèles et géostatistiqueModèles pour l’apprentissageCaractéristiques des expériences numériquesRappels de géostatistiqueComputer experiments et géostatistique

Conclusions

Page 25: PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE

25/30

L. Carraro - mars 06

Rappels de géostatistique

Origine : statistique minièreFormalisme :

Variable régionalisée : z(x), x de dim 1,2 ou 3Hypothèse : z(x) est la réalisation d’une fonction aléatoire Z(x)

Observations : z(xi) ou z(xi)+i, pour 1in

Modèles stationnaires, avec dérive :Z(x) = t(x) + Y(x)

t est la tendanceY est un processus stationnaire gaussien centrécov(Y(x), Y(x+h)) = 2 R(h)

Page 26: PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE

26/30

L. Carraro - mars 06

Plan

IntroductionFormalisation

Le phénomène réelLe simulateurLes problèmes à résoudre

Métamodèles et géostatistiqueModèles pour l’apprentissageCaractéristiques des expériences numériquesRappels de géostatistiqueComputer experiments et géostatistique

Conclusions

Page 27: PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE

27/30

L. Carraro - mars 06

Métamodèles et géostatistique

On écrit :fsim(uenv) = t(uenv) + y(uenv)

Commentaires :L’alea sur y est une traduction de la régularité supposée de la fonction

le krigeage est une méthode d’interpolation

t est estimée par les techniques de data mining

R aussi, à partir de la nuée variographique

estimation du métamodèle et de son incertitude

Page 28: PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE

28/30

L. Carraro - mars 06

Plan

IntroductionFormalisation

Le phénomène réelLe simulateurLes problèmes à résoudre

Métamodèles et géostatistiqueModèles pour l’apprentissageCaractéristiques des expériences numériquesRappels de géostatistiqueComputer experiments et géostatistique

Conclusions

Page 29: PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE

29/30

L. Carraro - mars 06

Conclusions… et perspectives

Projet DICE (Deep Inside Computer Experiments)

Géostatistique :à adapter aux grandes dimensions

krigeage bayésien

Théorie des plans d’expériences à reconstruire dans ce contexte :

Suites à faible discrépance

Propriétés des projections des plans d’expériences sur des sous-espaces

Page 30: PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE

30/30

L. Carraro - mars 06

Eléments bibliographiques

Carraro L., Corre B., Helbert C., Roustant O. (2005), Construction d’un critère d’optimalité pour plans d’expériences numériques dans le cadre de la quantification d’incertitudes, Revue de Statistique Appliquée, LIII (4), p. 87-103.Cressie N.A.C. (1993), Statistics for spatial data, Wiley series in probability and mathematical statistics.Hastie T., Tibshirani R., Friedman J. (2001), The elements of statistical learning, Springer.Jones D.R., Schonlau M., Welch W.J. (1998), Efficient global optimization of expensive black-box functions, J. of Global Optimization, 13, p. 455-492.Oakley J.E., O'Hagan A. (2004), Probabilistic sensitivity analysis of complex models: a Bayesian approach, J. R. Statist. Soc. B, 66, 3, p. 751-769.Sacks J., Welch W.J., Mitchell T.J., Wynn H.P. (1989), Design and analysis of computer experiments, Statist. Science, 4, p. 409-435.Saltelli A., Tarantola S., Campolongo F., Ratto M. (2004) Sensitivity Analysis in Practice: A Guide to Assessing Scientific Models, Wiley.Santner T.J., Williams B.J., Notz W.I. (2003), The design and analysis of computer experiments, Springer Series in Statistics.Vapnik V. (1998), Statistical learning theory, Wiley.Walter E., Pronzato L. (1994), Identification de modèles paramétriques à partir de données expérimentales, Masson.