39
Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Embed Size (px)

Citation preview

Page 1: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Modélisation de valeurs extrêmes

Université de Liège : octobre 2002Daniel Justens

HEFF/Cooremans Bruxelles

Page 2: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Positionnement

• Utilisation des modèles mathématiques en finance, en gestion et en actuariat.

• Ecarts entre les prévisions théoriques et le réel observé : non-adéquation du modèle ?

• Cas particulier des valeurs extrêmes

Page 3: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Exemple 1 : rendements boursiers

• Présentation du cas de l’indice DAX entre 1996 et 2000 : 902 observations journalières.

• Moyenne observée : 0,00097151• Ecart-type observé : 0,01458286

• Modélisation des rendements par une distribution normale ?

Page 4: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Rendements journaliers DAX entre 1996 et 2000

Fonctions de répartition observée (1) et normale (2)

0

0,2

0,4

0,6

0,8

1

-0,1 -0,05 0 0,05 0,1

Série1

Série2

Page 5: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Aspect des queues de courbe

Valeurs extrêmes à gauche avec en série 1 les observations et en série 2 la distribution normale

0

0,05

0,1

0,15

0,2

0,25

-0,1 -0,08 -0,06 -0,04 -0,02 0

Série1

Série2

Page 6: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Intervalle interquartile

0

0,2

0,4

0,6

0,8

1

-0,01 -0,005 0 0,005 0,01 0,015

Série1

Série2

Valeurs centrales

Page 7: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Valeurs à droite

Rendements maxima

0,88

0,92

0,96

1

0 0,01 0,02 0,03 0,04 0,05 0,06 0,07

Série1

Série2

Page 8: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Distributions de Pareto-Lévy

Vilfredo Pareto (1848 - 1923)

• Sociologue, qui se consacre dès 1890 à une modélisation « pure » de l’économie qui selon lui doit s’étudier comme la physique.

Paul Lévy (1886 - 1971)

• Mathématicien, qui étudie les distributions stables vers 1930.

Page 9: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Retour aux sources

Distributions de Pareto de base :

pour x 1 et avec a > 0

On en tire :

axxF

11)(

1)(

ax

axf

Page 10: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Moments de la distribution

• On vérifie que :

lorsque n < a

et que :

lorsque n a

• On en tire (a>2) :

na

aXE n

][

][ nXE

)]2()1[(][

2

aa

aXVAR

Page 11: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Adaptation de la distribution

• But : obtenir une fonction de répartition tendant vers 1 en + comme 1- x -a et vers 0 en - comme |x| - b (a et b > 0).

• Idée : travailler avec les fonctions réciproques. En effet, il est facile de représenter la fonction g de R0

+ dans R :

g(x) = x -1/a - x 1/b

Page 12: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Représentation de y = x-1 -x1/2

2 4 6 8

-2

2

4

6

8

Page 13: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Inversion des axes

0

1

2

3

4

5

6

7

8

9

10

-5 0 5 10

Page 14: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Construction de la répartition

• On a défini une fonction g(x) de manière implicite :

x = g(x) -1/a - g(x) 1/b

• Cette fonction g(x) a en - le comportement de |x|b et en + le comportement de x -a.

• Etudions la fonction : )(1

1

xg

Page 15: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Suite...

• Cette dernière tend vers 0 en - comme |x|-b

et vers 1 en + comme 1- x -a

Conclusion :

Forme implicite de la fonction de répartition

)(1

)(1

)(1

1

xg

xg

xg

Page 16: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Cas particulier : a=b

• Dans ce cas, on arrive aisément à une forme explicite. En effet, l’équation devient :

x = g(x) -1/a - g(x) 1/a

Posons g(x) 1/a = Y. L ’équation devient

x =1/Y - Y ou encore : (x + Y)Y = 1

Y2 + x Y -1 = 0

Page 17: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Suite ...

Y2 + x Y -1 = 0dont la solution est évidente :

On en tire :

2

42

xxY

a

xxxF

24

1

1)(

2

Page 18: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Ajustements

• Recherche ouverte : étude théorique de ces distributions avec une paramétrisation

• Méthodes d’ajustements autres que moindre carrés de façon à privilégier les queues de courbe

Page 19: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Ajustements du DAX : a = 270

0

0,2

0,4

0,6

0,8

1

-0,1 -0,05 0 0,05 0,1

distruni

distrinor

distripar

Page 20: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Ajustements : à gauche avec a = 220

0

0,02

0,04

0,06

0,08

0,1

0,12

-0,1 -0,08 -0,06 -0,04 -0,02 0

distruni

distrinor

distripar

Page 21: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Ajustements : à droite avec a = 270

0,84

0,86

0,88

0,9

0,92

0,94

0,96

0,98

1

1,02

0 0,01 0,02 0,03 0,04 0,05 0,06 0,07

Série1

Série2

Série3normale

Pareto

Page 22: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Exemple 2 : tarification automobile

• “A priori” clustering and bonus-malus system

• The “number of claims” distributions

• The problem of the classical models

Page 23: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

The mixed Poisson distributionsLet X be the number of claims occurring in a unit period.Let be the risk parameter (expecting number of claims) with probability distribution U().We assume that for a given risk parameter , the random variables pk() giving the number of claims follow a Poisson distribution.

Page 24: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Moments of mixed Poisson distributions

• Mean :

E[X] = E[

• Variance

VAR[X] = E + VAR

Page 25: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

The model of Lemaire (1977)

• The underlying distribution follows a Gamma distribution :

• In this case, we have :

Page 26: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Mixed Poisson family

Underlying distribution transition Probabilities

Negative exponential Geometrical

Erlang P-Erlang

Inverse Gaussian P-inverse gaussian

Page 27: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Fitting the data (1)

• The Belgian case :

son,thegeometricandtheP-Erlangdistributions,andtoÂ2;0:95=5:991fortheothers.Numb.claimsBelgianobs.PoissonNeg.Bin.Geom.P-ErlangP-Inv.Gauss.00.9065570.9038600.9066260.9081990.9060970.90657310.0863760.0913630.0862130.0833740.0871830.08635620.0065810.0046180.0066530.0076540.0062910.00652930.0004020.0001560.0004740.0007030.0004040.00049640.0000840.0000390.0000320.0000650.0000240.000040Â2336.0510.1742.3718.057.30

Page 28: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Underlying distributions

Page 29: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Distributions tails

Page 30: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Fitting the data (2)

• The Italian case :P-Erlang distributions, and to  =9:49 for theothers.

Accid italian obs. Poisson Neg. Bin. Geom. P-Erlang P-Inv.Gauss.0 0.863100 0.844503 0.863140 0.855427 0.850233 0.8618351 0.111161 0.142727 0.111305 0.123672 0.132499 0.1142962 0.020405 0.012061 0.020366 0.017880 0.015486 0.0185513 0.004030 0.000679 0.004093 0.002585 0.001609 0.0038904 0.000929 0.000029 0.000859 0.000374 0.000157 0.0009595 0.000246 0.000001 0.000185 0.000054 0.000015 0.0002616 0.000129 0.000000 0.000031 0.000008 0.000001 0.000075Â2 728 343 339.08 5886.5 28 532 323.47

Page 31: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Rational underlying distributions

• Let us work with :

• We also have :

Page 32: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Quadratic case

• We put :

so that we get :

• Which gives :

Page 33: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Cubic case

• We now put :

• And compute :

Page 34: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

The Belgian case

Accid belgian observ. Neg. bin. quadratic cubic0 0.906557 0.906626 0.913576 0.9057471 0.086376 0.086213 0.077322 0.0874412 0.006581 0.006653 0.007275 0.0062173 0.000402 0.000474 0.001167 0.0005054 0.000084 0.000032 0.000328 0.000065

Page 35: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Graphically

.

Quadratic

Negative binomial cubic

observations

Page 36: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Distributions tails

Page 37: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

The Italian case

Accid ital. obs. Neg. bin. quadratic cubic0 0.863100 0.863140 0.856316 0.8434441 0.111161 0.111305 0.121074 0.1380532 0.020405 0.020366 0.017101 0.0160973 0.004030 0.004093 0.003413 0.0019574 0.000929 0.000859 0.001029 0.0003195 0.000246 0.000185 0.000424 0.0000786 0.000129 0.000031 0.000214 0.000052

Page 38: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Comparison of the models

Cubic

Quadratic

Negative binomial

Page 39: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Conclusions

• Difference between theoretical and practical point of view : problem of the infinite variance

• Many other distributions possible

• Mixed geometrical distributions

• Open research