Upload
others
View
10
Download
0
Embed Size (px)
Citation preview
17 décembre 07 2
Plan
Compétences acquises domaines scientifiques compétences transverses
Domaines ou activités accessibles : immédiatement au prix d’adaptations faciles via des efforts conséquents
Conclusion
17 décembre 07 3
Cartographie (domaines scientifiques)
Complexité croissante
spatial
temporel
statique
monodim
linéaire
multidim
non linéaire
multidim
17 décembre 07 4
Cartographie (domaines scientifiques)
Cours 1A
spatial
temporel
statique
monodim
linéaire
multidim
non linéaire
multidim
séries chros
anal. données
plans exp.
régression
proc
essu
s
projet
17 décembre 07 5
Cartographie
Compétences transverses Questionnement sur un problème
– Compréhension– Prise en compte du contexte, des contraintes– Rapport coût/qualité
Communication– écrite– orale
Travail en groupe
17 décembre 07 6Domaines ou activitésaccessibles immédiatement
Etudes de données expérimentales laboratoires (industrie, santé…) mise en évidence de facteurs importants service qualité
Prévisions prévisions de vente ou de consommation finance, assurances prévisions de coûts
17 décembre 07 7Domaines ou activitésaccessibles immédiatement
Aide à la décision construction d’indicateurs probabilisation de décisions sociétés de conseil (finance, risques…)
Appui méthodologique à un autre domaine mécanique, matériaux procédés, environnement santé
17 décembre 07 8Domaines ou activitésaccessibles facilement
Statistical Process Control. Traitement statistique du signal. Séries temporelles multidimensionnelles,
économétrie. Régression non linéaire. Méthodes non paramétriques en petite
dimension.
17 décembre 07 9
Aller plus loin ?
Cours 1A
séries chros
anal. données
spatial
temporel
statique
monodim
linéaire
multidim
non linéaire
multidim
plans exp.
régression
proc
essu
s
géostatistique linéaire géostatistique non linéaire
traitement du signal - filtrage
analyse d’images
Apprentissage statistique :réseaux de neurones
support vector machinesbagging, boosting
calc
ul st
ocha
stiq
uepr
oces
sus,
cham
ps d
e M
arko
v
compression, ondelettes
17 décembre 07 10
Aller plus loin ?
Cours 1A
séries chros
anal. données
spatial
temporel
statique
monodim
linéaire
multidim
non linéaire
multidim
plans exp.
régression
proc
essu
s
géostatistique linéaire géostatistique non linéaire
traitement du signal - filtrage
analyse d’images
Apprentissage statistique :réseaux de neurones
support vector machinesbagging, boosting
calc
ul st
ocha
stiq
uepr
oces
sus,
cham
ps d
e M
arko
v
compression, ondelettes
17 décembre 07 11Filtrage de Kalmanet modèles d’état
Modèle d’état : équation d’état équation d’observationYn : vecteur p*1 observé au temps nXn : vecteur q*1 décrivant le système au temps nEn, Fn : vecteurs de résidus aléatoires
Modèle discret d’équation différentiellebruitée, avec mesure.
!
Xn
= FXn"1 +G#
n
Yn
=HXn
+ Fn
17 décembre 07 12
Cas d’un ARMA(2,1)
!
Xn
=xn
xn"1
#
$ %
&
' ( , En
=)n
)n"1
#
$ %
&
' ( , Yn = x
n
!
Xn
="1
"2
1 0
#
$ %
&
' ( Xn)1 +
1 )*1
0 0
#
$ %
&
' ( En
Yn
= 1 0[ ] Xn
!
xn" #
1xn"1 " #2 xn"2 = $
n"%
1$n"1
17 décembre 07 13
Problèmes traités
Filtrage :E(Xn/Y1,…,Yn) = ?
Prévision :E(Xn+h/Y1,…,Yn) = ?Var(Xn+h/Y1,…,Yn) = ?Loi de Xn+h/Y1,…,Yn) = ?
Algorithme de Kalman, valable en temps continu(ED stochastiques), non stationnaire.
Applications innombrables aux pbs temps réel (cf.aéronautique)
Vers le contrôle…
17 décembre 07 14
Géostatistique
Historique : exploitation minière (or) D. Krige, G. Matheron Modélisation de phénomènes spatiaux :
– Géométrie en 2D ou 3D (ou ND !)– Observations non régulières
Observation d’une fonction y(x) en certainspoints x de l’espace.
Objectif = prévoir y(x) pour des x non observésou inobservables.
17 décembre 07 15
Modèle probabiliste
y(x) est supposé être la réalisation d’un processusgaussien Y(x) tel que :
γ est le (demi-) variogramme du processus
Si Var(Y(x)) = σ2 :!
E Y(x)[ ] =m
E Y(x + h) "Y(x)( )2[ ] = 2 #(h)
!
cov(Y(x),Y(x + h)) = "2 # $(h)
17 décembre 07 19
Applications
Tous les domaines qui mettent en œuvre desvariables spatiales non totalementaccessibles : Mines, pétrole, gaz Environnement Halieutique Computer experiments …
17 décembre 07 22
Vers l’apprentissage statistique
Arbres de régression :Principe :
– Première séparation :Parmi tous les prédicteurs et tous les niveaux, trouver
ceux qui séparent la réponse en deux groupes lesplus hétérogènes (déviance)
– Séparations suivantes :Recommencer dans chaque sous-groupe– Elagage de l’arbreRemonter dans l’arbre et couper les branches
homogènes.
17 décembre 07 23
Exemple : données de spam
1 réponse qualitative : spam ou pas spam 57 prédicteurs : fréquence d’apparition de
caractères ou de mots. 4601 observations
NB :X. = ; X..3=!X..1=( X..4=$X..2=[ X..5=#
17 décembre 07 27
Modèles de ruine
Origine : assurances sinistres, conceptionde barrages, fils d’attentes…
Réserve de risque Z(t)au temps t :Z(t) = x + βt - X(t)– x = capital initial– β = taux (constant) de primes d’assurances entrantes– X(t) = montant des sinistres cumulé au temps t
!
X(t) = Xk
k=1
Nt
"
17 décembre 07 28
Hypothèses et premiers éléments
– (Nt)t est un processus de Poisson homogèned’intensité λ
– Les variables Xk sont i.i.d. d’espérance µ
Et par suite :
Donc on doit avoir!
E(X(t) /Nt) = µN
t
!
E(Z(t)) = x +"t # $µt
!
" > #µ
17 décembre 07 29
Vers la théorie de la ruine
Explicitation du lien entre x et P(T<+∞)T = instant de ruine = Inf{t, Z(t)<0}
Difficulté du problème : Théorique (voir martingales) Numérique (processus à sauts) Introduction de la réassurance…