View
102
Download
0
Category
Preview:
DESCRIPTION
PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE. Laurent CARRARO mars 06. Plan. Introduction Formalisation Le phénomène réel Le simulateur Les problèmes à résoudre Métamodèles et géostatistique Modèles pour l’apprentissage Caractéristiques des expériences numériques - PowerPoint PPT Presentation
Citation preview
PLANS D’EXPERIENCES NUMERIQUES, APPRENTISSAGE ET GEOSTATISTIQUE
Laurent CARRARO
mars 06
2/30
L. Carraro - mars 06
Plan
IntroductionFormalisation
Le phénomène réelLe simulateurLes problèmes à résoudre
Métamodèles et géostatistiqueModèles pour l’apprentissageCaractéristiques des expériences numériquesRappels de géostatistiqueComputer experiments et géostatistique
Conclusions
3/30
L. Carraro - mars 06
Plan
IntroductionFormalisation
Le phénomène réelLe simulateurLes problèmes à résoudre
Métamodèles et géostatistiqueModèles pour l’apprentissageCaractéristiques des expériences numériquesRappels de géostatistiqueComputer experiments et géostatistique
Conclusions
4/30
L. Carraro - mars 06
Exemple : exploration pétrolière
Objectifs :découvrir, évaluer et produire des réservoirs pétroliers.
objets complexes, difficilement accessibles, mal connus.
nécessité d’investir des sommes colossales.
Risques financiers énormes
nécessité de développer une méthode
de gestion des incertitudes subsurface.
5/30
L. Carraro - mars 06
Problèmes à résoudre
Trois types de problèmesPropagation des incertitudes
Calage/qualification de codes
Optimisation
Enjeux et objectifsAnalyses de risques pour prise de décision
Maximiser la rentabilité
6/30
L. Carraro - mars 06
Exploration pétrolière
évaluation de la production
y1(t), y2(t),…, yn(t)
caractéristiques du réservoir
scénario(s) de production
SIMULATEUR
7/30
L. Carraro - mars 06
Problèmes direct et inverse
En phase d’appréciation / développementQuel impact les incertitudes sur les caractéristiques du réservoir peuvent avoir sur l’évaluation de la production et des réserves?
Direct : propagation des incertitudes
caractéristiques du réservoir évaluation de la production
En phase de productionComment la connaissance de la production passée, avec ses erreurs de mesures, peut aider à mieux connaître les caractéristiques du réservoir et à affiner les prédictions de production?
Inverse : calage
8/30
L. Carraro - mars 06
Plan
IntroductionFormalisation
Le phénomène réelLe simulateurLes problèmes à résoudre
Métamodèles et géostatistiqueModèles pour l’apprentissageCaractéristiques des expériences numériquesRappels de géostatistiqueComputer experiments et géostatistique
Conclusions
9/30
L. Carraro - mars 06
Le phénomène réel
Il est caractérisé par :
des variables d’intérêt yréel
exemple : production de pétrole cumulée à venir
des variables d’environnement venv
variables subies et mal connues, de grande dimension
exemple : caractéristiques du sous-sol
des variables de contrôle ucont
variables pouvant être fixées par l’utilisateur pour atteindre divers objectifs
10/30
L. Carraro - mars 06
Ces variables sont liées selon le schéma fonctionnel suivant :
),( contenvréelréel uvfy =
Variables d’environnement venv
Variables de contrôle ucont
Variables d’intérêt yréelfréel
Le phénomène réel
11/30
L. Carraro - mars 06
Plan
IntroductionFormalisation
Le phénomène réelLe simulateurLes problèmes à résoudre
Métamodèles et géostatistiqueModèles pour l’apprentissageCaractéristiques des expériences numériquesRappels de géostatistiqueComputer experiments et géostatistique
Conclusions
12/30
L. Carraro - mars 06
La fonction fréel est approchée par un simulateur.
Une nouvelle classe de variables, les variables de simulation, apparaît pour :
paramétrer le simulateur et/ou l’ajuster (« tuning parameters »)
Ainsi :
ysim est la réponse estimée par le simulateur
uenv est une approximation des variables d’environnement de
venv
ucont représente les variables de contrôle
usim est le vecteur des variables de simulation
)( envenv vu ϕ=
Le simulateur
13/30
L. Carraro - mars 06
avec pour forme fonctionnelle :
)/,( simcontenvsimsim uuufy =
Variables d’environnement uenv
Variables de contrôle ucont
Variables d’intérêt ysimfsim
Variables de simulation usim
Le simulateur
14/30
L. Carraro - mars 06
Plan
IntroductionFormalisation
Le phénomène réelLe simulateurLes problèmes à résoudre
Métamodèles et géostatistiqueModèles pour l’apprentissageCaractéristiques des expériences numériquesRappels de géostatistiqueComputer experiments et géostatistique
Conclusions
15/30
L. Carraro - mars 06
Les problèmes à résoudre
Propagation d’incertitudesComment propager les incertitudes affectant la variable uenv
sur la réponse ysim ?
Problèmes inversesCalage de paramètres / d’historique
Les variables de contrôle sont fixées et le phénomène réel est observé. Comment ajuster les paramètres d’environnement et/ou de simulation pour reproduire les observations ?
Optimisation des variables de contrôleLes variables de modélisation et d’environnement sont fixées et
un ou plusieurs critères à maximiser introduits. Quel niveau des variables de contrôle ucont maximise les critères ?
16/30
L. Carraro - mars 06
Difficultés à surmonter
Dimension des variables du problèmeIl faut réduire la taille des variables en présence
Analyses de sensibilités (globales)
Temps de calcul de fsim
Renault : simulation d’un cycle d’explosion dans un cylindre. Quelques heures de calcul pour simuler une fraction de secondes.
ONERA: une simulation de soufflerie à Mach 3 dure plusieurs semaines.
17/30
L. Carraro - mars 06
Démarche adoptée
Approximation du simulateurOn remplace le simulateur fsim par une fonction plus simple, notée fapp. C’est la surface de réponse.
La réponse yapp donnée par la fonction fapp est liée aux variables d’environnement xenv, de contrôle ucont et d’approximation uapp par :
Plan d’expériences numériquesPour construire la fonction approchée fapp, le simulateur est évalué sur un jeu de variables d’environnement, qui constitue un plan d’expériences numériques.
)/,( appcontenvappapp uuxfy =
18/30
L. Carraro - mars 06
En résumé
fapp
fsim
X
Y fréel
ObservationsRéponses
Points d’évaluation du simulateur
19/30
L. Carraro - mars 06
Plan
IntroductionFormalisation
Le phénomène réelLe simulateurLes problèmes à résoudre
Métamodèles et géostatistiqueModèles pour l’apprentissageCaractéristiques des expériences numériquesRappels de géostatistiqueComputer experiments et géostatistique
Conclusions
20/30
L. Carraro - mars 06
Modèles pour l’apprentissage
Historiquement : reconnaissance des formes
Domaine frontière - data mining :informatique
neurosciences
statistiques
Apprentissage supervisé :apprendre une relation, une classification,
à partir d’une base d’exemples,
et d’informations a priori
21/30
L. Carraro - mars 06
Quelques modèles du data mining
Modèles paramétriques :Régression linéaireRégression non linéaire
Modèles non paramétriques :Lissage et splinesmodèles semi-paramétriques (GAM, PPR…)réseaux de neuronesmachines à support vectoriel (SVM)arbres de régression et forêts aléatoiresbagging et boosting
22/30
L. Carraro - mars 06
Plan
IntroductionFormalisation
Le phénomène réelLe simulateurLes problèmes à résoudre
Métamodèles et géostatistiqueModèles pour l’apprentissageCaractéristiques des expériences numériquesRappels de géostatistiqueComputer experiments et géostatistique
Conclusions
23/30
L. Carraro - mars 06
Expériences numériques
Les variables d’environnement sont inconnues, mais on peut les fixer !!
Les points sur le bord du plan d’expériences sont de probabilité nulle.
Problème des plans d’expériences factoriels.
Répétabilité : fsim est une fonction !
24/30
L. Carraro - mars 06
Plan
IntroductionFormalisation
Le phénomène réelLe simulateurLes problèmes à résoudre
Métamodèles et géostatistiqueModèles pour l’apprentissageCaractéristiques des expériences numériquesRappels de géostatistiqueComputer experiments et géostatistique
Conclusions
25/30
L. Carraro - mars 06
Rappels de géostatistique
Origine : statistique minièreFormalisme :
Variable régionalisée : z(x), x de dim 1,2 ou 3Hypothèse : z(x) est la réalisation d’une fonction aléatoire Z(x)
Observations : z(xi) ou z(xi)+i, pour 1in
Modèles stationnaires, avec dérive :Z(x) = t(x) + Y(x)
t est la tendanceY est un processus stationnaire gaussien centrécov(Y(x), Y(x+h)) = 2 R(h)
26/30
L. Carraro - mars 06
Plan
IntroductionFormalisation
Le phénomène réelLe simulateurLes problèmes à résoudre
Métamodèles et géostatistiqueModèles pour l’apprentissageCaractéristiques des expériences numériquesRappels de géostatistiqueComputer experiments et géostatistique
Conclusions
27/30
L. Carraro - mars 06
Métamodèles et géostatistique
On écrit :fsim(uenv) = t(uenv) + y(uenv)
Commentaires :L’alea sur y est une traduction de la régularité supposée de la fonction
le krigeage est une méthode d’interpolation
t est estimée par les techniques de data mining
R aussi, à partir de la nuée variographique
estimation du métamodèle et de son incertitude
28/30
L. Carraro - mars 06
Plan
IntroductionFormalisation
Le phénomène réelLe simulateurLes problèmes à résoudre
Métamodèles et géostatistiqueModèles pour l’apprentissageCaractéristiques des expériences numériquesRappels de géostatistiqueComputer experiments et géostatistique
Conclusions
29/30
L. Carraro - mars 06
Conclusions… et perspectives
Projet DICE (Deep Inside Computer Experiments)
Géostatistique :à adapter aux grandes dimensions
krigeage bayésien
Théorie des plans d’expériences à reconstruire dans ce contexte :
Suites à faible discrépance
Propriétés des projections des plans d’expériences sur des sous-espaces
30/30
L. Carraro - mars 06
Eléments bibliographiques
Carraro L., Corre B., Helbert C., Roustant O. (2005), Construction d’un critère d’optimalité pour plans d’expériences numériques dans le cadre de la quantification d’incertitudes, Revue de Statistique Appliquée, LIII (4), p. 87-103.Cressie N.A.C. (1993), Statistics for spatial data, Wiley series in probability and mathematical statistics.Hastie T., Tibshirani R., Friedman J. (2001), The elements of statistical learning, Springer.Jones D.R., Schonlau M., Welch W.J. (1998), Efficient global optimization of expensive black-box functions, J. of Global Optimization, 13, p. 455-492.Oakley J.E., O'Hagan A. (2004), Probabilistic sensitivity analysis of complex models: a Bayesian approach, J. R. Statist. Soc. B, 66, 3, p. 751-769.Sacks J., Welch W.J., Mitchell T.J., Wynn H.P. (1989), Design and analysis of computer experiments, Statist. Science, 4, p. 409-435.Saltelli A., Tarantola S., Campolongo F., Ratto M. (2004) Sensitivity Analysis in Practice: A Guide to Assessing Scientific Models, Wiley.Santner T.J., Williams B.J., Notz W.I. (2003), The design and analysis of computer experiments, Springer Series in Statistics.Vapnik V. (1998), Statistical learning theory, Wiley.Walter E., Pronzato L. (1994), Identification de modèles paramétriques à partir de données expérimentales, Masson.
Recommended