49
Arthur CHARPENTIER, Statistique de l’assurance, sujets sp´ eciaux, STT 6705V Statistique de l’assurance, STT 6705 Statistique de l’assurance II Arthur Charpentier Universit´ e Rennes 1 & Universit´ e de Montr´ eal [email protected] ou ou [email protected] http ://freakonometrics.blog.free.fr/ 1er septembre 2010 1

Slides udm-010910

Embed Size (px)

DESCRIPTION

 

Citation preview

Page 1: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Statistique de l’assurance, STT 6705Statistique de l’assurance II

Arthur Charpentier

Universite Rennes 1 & Universite de Montreal

[email protected] ou ou [email protected]

http ://freakonometrics.blog.free.fr/

1er septembre 2010

1

Page 2: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

References

Denuit, M. & Charpentier, A. (2005). Mathematiques de l’assurance non-vie, tome

II. Economica.

Charpentier, A., Goulet, V. & Planchet, F. (2010). Actuariat avec R. Springer

Verlag (a paraıtre)

Denuit, M. Marechal, X., Pitrebois, S. & Wahlin, J.F. (2009). Actuarial

Modelling of Claim Counts : Risk Classification, Credibility and Bonus-Malus Systems.

Wiley.

Frees, E. (2009). Regression Modeling with Actuarial and Financial Applications.

Cambridge University Press.

de Jong, P. & Helle, G. (2008). Generalized Linear Models for Insurance Data.

Cambridge University Press.

Kaas, R., Goovaerts, M., Dhaene, J. & Denuit, M. (2006). Modern Actuarial Risk

Theory. Springer Verlag.

2

Page 3: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Bareme du cours

Le bareme pour l’evaluation du cours consistera en– un projet (50) de tarification– un projet (25) de provisionnement– un projet (25) de mortalite prospective

3

Page 4: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Programmation et langage

Les graphiques presentes en cours, et les applications sont programmes en R.

Les codes seront mis en ligne sur le blog, ainsi que les bases de donnees.

4

Page 5: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Plan du cours

• Introduction generale• La tarification a priori• Les provisions pour sinistres a payer (IBNR)• Les tables de mortalite prospectives

5

Page 6: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

• Plan du cours

• Introduction generale

◦ Le modele collectif en tarification, E(∑N

i=1 Yi

)= E(N) · E(Yi)

◦ Les modeles lineaires generalises, E(Yi|Xi) = g−1(Xi)◦ Les modeles dynamiques Yi,t

• La tarification a priori

• Les provisions pour sinistres a payer (IBNR)

• Les tables de mortalite prospectives

6

Page 7: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Le modele collectif

En tarification, on cherche a predire la charge totale de sinistre sur une annee decouverture. Soit N le nombre (aleatoire) de sinistres survenu sur un an, etY1, · · · , YN les couts des sinistres (si N > 0). La charge totale annuelle estS = Y1 + · · ·+ YN . Sous des hypotheses d’independance,

E(S) = E(N) · E(Yi)

La probabilite P peut etre remplacee par n’importe quelle mesure garantissantl’independance, et l’identique distribution des nombres et des couts,

E(S|X ) = E(N |X ) · E(Yi|X )

ou X designe le facteur d’heterogeneite (i.e. la classe tarifaire). Un proxy seraobtenu a l’aide de variables de tarificaiton {X1, · · · , Xk}

E(S|X1, · · · , Xk) = E(N |X1, · · · , Xk) · E(Yi|X1, · · · , Xk)

◦7

Page 8: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Le modele lineaire generalise

En econometrie lineaire (classique), on cherche a approcher E(Y |X1, · · · , Xk) parune forme lineaire

Y = β0 + β1X1 + · · ·+ βkXk + ε = Xβ + ε

ou generallement ε est suppose N (0, σ2), i.e.

(Y |X) ∼ N (Xβ, σ2)

Or les modeles gaussiens ne sont pas appropries en assurance. On peut considererun modele Poisson,

(N |X) ∼ P(exp(Xβ))

i.e. on change la loi et le lien entre E(Y ) et le score Xβ

8

Page 9: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Les approches dynamiques

En provisionnement, on s’interessera aux cadences de paiements, i.e. combien aete paye l’annee t pour les sinistres survenus l’annee i, Yi,t.

En assurance-vie, on s’interessera aux nombres de deces l’anne t d’individus d’agei.

Le vieillissement des sinistres et des assures se visualise classiquement via undiagramme de Lexis.

9

Page 10: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Lexis diagram in insurance

Lexis diagrams have been designed to visualize dynamics of life among severalindividuals, but can be used also to follow claims’life dynamics, from theoccurrence until closure,

in life insurance in nonlife insurance

10

Page 11: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Lexis diagram in insurance

but usually we do not work on continuous time individual observations(individuals or claims) : we summarized information per year occurrence untilclosure,

in life insurance in nonlife insurance

11

Page 12: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Lexis diagram in insurance

individual lives or claims can also be followed looking at diagonals, occurrenceuntil closure,occurrence until closure,occurrence until closure,occurrence untilclosure,

in life insurance in nonlife insurance

12

Page 13: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Lexis diagram in insurance

and usually, in nonlife insurance, instead of looking at (calendar) time, we followobservations per year of birth, or year of occurrence occurrence untilclosure,occurrence until closure,occurrence until closure,occurrence until closure,

in life insurance in nonlife insurance

13

Page 14: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Lexis diagram in insurance

and finally, recall that in standard models in nonlife insurance, we look at thetransposed triangle occurrence until closure,occurrence until closure,occurrenceuntil closure,occurrence until closure,

in life insurance in nonlife insurance

14

Page 15: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Lexis diagram in insurance

note that whatever the way we look at triangles, there are still three dimensions,year of occurrence or birth, age or development and calendar time,calendar timecalendar time

in life insurance in nonlife insurance

15

Page 16: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Lexis diagram in insurance

and in both cases, we want to answer a prediction question...calendar timecalendar time calendar time calendar time calendar time calendar time calendartime calendar timer time calendar time

in life insurance in nonlife insurance

16

Page 17: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

What can be modeled in those triangles ?

In life insurance,• Li,j , number of survivors born year i, still alive at age j• Di,j , number of deaths of individuals born year i, at age j, Di,j = Li,j −Li,j−1,• Ei,j , exposure, i.e. i, still alive at age j(if we cannot work on cohorts, exposure is needed).

In nonlife insurance,• Ci,j , total claims payments for claims occurred year i, seen after j years,• Yi,j , incremental payments for claims occurred year i, Yi,j = Ci,j − Ci,j−1,• Ni,j , total number of claims occurred year i, seen after j years,◦

17

Page 18: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

• Plan du cours

• Introduction generale• La tarification a priori◦ Tarification a priori vs. a posteriori◦ Les variables explicatives : par classes vs. continues◦ Modeliser la frequence de sinistres : regression de Poisson◦ La non declaration de sinistres et les modeles a inflation de zeros◦ Modeliser les couts de sinistres : regression Gamma vs. lognormale◦ Ecreter les gros sinistres

• Les provisions pour sinistres a payer (IBNR)• Les tables de mortalite prospectives

18

Page 19: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Tarification a priori vs. a posteriori

A la fin de l’annee t, on souhaite estimer la prime a demander a l’assure,

πt = E(St+1|X )

En assurance a priori, on recherche un proxi de X , i.e. la classe de risque, a l’aidede variables exogenes, X1, · · · , Xk, alors qu’en assurance a posteriori, un proxi deX est obtenu a l’aide de l’historique de l’assure, Yt−h, · · · , Yt−1, Yt.

19

Page 20: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Les variables explicatives

Les variables explicatives peuvent etre discretes (classes ou facteurs)....

5%

6%

7%

8%

9%

10%

20

Page 21: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Les variables explicatives

... mais aussi continues...

● ●

● ● ●● ● ●

●● ● ● ● ● ● ● ● ● ●

● ●

●● ● ● ● ● ● ●

● ● ● ● ● ●● ●

● ●●

● ● ●● ●

●● ●

● ●●

● ● ●

●●

●●

● ● ●

20 40 60 80 100

0.00

0.05

0.10

0.15

0.20

0.25

0.30

Age du conducteur principal

Fré

quen

ce a

nnue

lle d

e si

nist

re

21

Page 22: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Les variables explicatives

... que l’on pourra chercher a lisser

20 40 60 80 100

0.02

0.04

0.06

0.08

0.10

0.12

Age du conducteur principal

Fré

quen

ce a

nnue

lle d

e si

nist

res

3 degrés de liberté5 degrés de liberté10 degrés de liberté

22

Page 23: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Les variables explicatives

On parlera aussi des arbres de regression afin de constituer des classes (e.g.d’age)◦

|zone:bcdef

puissance < 5.5

zone:bdf zone:bce

agevehicule < 10.5

puissance < 7.5

agevehicule < 2.5

0.001162 0.003053

0.004648 0.002260

0.001323

0.004592

0.004274

0.005648

23

Page 24: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Les nombres de sinistres N

La loi la plus classique pour modeliser les nombres de sinistres est la loi dePoisson,

P(N = n) =e−λλk

k!qui verifie E(N) = Var(N) (equidispersion). Cette loi est de la familleexponentielle,

P(N = n) = exp(n log λ− λ

1− log(n!)

)avec comme parametre naturel, θ = log λ = log E(Y ).

24

Page 25: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

La surdispersion et la non-declaration

Si N ∼ P(λ), alors E(N) = Var(N).

Si N suit une loi Poisson melange, de facteur d’heterogeneite (inobservable) Θ,i.e. (N |Θ) ∼ P(λΘ), alors E(N) < Var(N) En pratique, si la variance est plusgrande que l’esprance, c’est qu’il reste de l’heterogeneite au sein des classes.

Il est possible d’utiliser une loi binomiale negative, ou quasi-Poisson

P(N = n) = exp(n log λ− λ

ϕ− log(n!)

)avec ϕ ∈ R+ le parametre de surdispersion.

25

Page 26: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

La surdispersion et la non-declaration

Il est aussi possible de considerer un modele a inflation de zeros,

P(Ni = k) =

πi + [1− πi] · pi(0) si k = 0,

[1− πi] · pi(k) si k = 1, 2, · · ·

Si pi correspond un modele Poissonnien, on peut alors montrer facilement que

Var(Ni) = πiµi + πiµ2i [1− πi] > E(Ni) = [1− πi]µi

26

Page 27: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

La surdispersion et la non-declaration

si

P(Ni = k|Xi) =

πi(Xi) + [1− πi(Xi)] · pi(0|Xi) si k = 0,

[1− πi(Xi)] · pi(k|Xi) si k = 1, 2, · · ·

la forme de πi(Xi) est ici ◦

20 30 40 50 60 70 80

0.5

0.6

0.7

0.8

0.9

Age du conducteur princpal

Pro

babi

lité

de n

e pa

s dé

clar

er u

n si

nist

re

27

Page 28: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Les couts de sinistres

La loi Gamma est une loi de la famille exponentielle mais pas la loi lognormale.

Mais si log Y = Xβ+ (modele lognormale), alors

E(Y ) = exp(Xβ +

12σ2

)6= exp (Xβ)

28

Page 29: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Les gros sinistres

Il est possible de mutualiser les gros sinistres parmi tous les assures, passeulement ceux de la classe tarifaire, ◦

29

Page 30: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

20 30 40 50 60 70 80 90

0.2

0.8

1.4

Age du conducteur principal

Impa

ct r

elat

if

20 30 40 50 60 70 80 90

0.2

0.8

1.4

Age du conducteur principal

Impa

ct r

elat

if

30

Page 31: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

• Plan du cours

• Introduction generale• La tarification a priori• Les provisions pour sinistres a payer (IBNR)◦ La problematique des provisions, et les IBNR◦ La methode Chain Ladder◦ Le modele de Mack, E(Ci,t) = λt · Ci,t−1

◦ Les modeles factoriels, E(Yi,t) = exp[αi + βt]◦ Incertitude a ultime vs. incertitude a un an◦ Bornhuter-Ferguson, Cape-Code et les modeles bayesiens

• Les tables de mortalite prospectives

31

Page 32: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Introduction au provisionnement

“ Les provisions techniques sont les provisions destinees a permettre le reglementintegral des engagements pris envers les assures et beneficaires de contrats. Ellessont liees a la technique meme de l’assurance, et imposees par la reglementation.”

32

Page 33: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Chain Ladder

0 1 2 3 4 5

0 3209 4372 4411 4428 4435 4456

1 3367 4659 4696 4720 4730

2 3871 5345 5398 5420

3 4239 5917 6020

4 4929 6794

5 5217

et et

0 1 2 3 4 5

0 3209 4372 4411 4428 4435 4456

1 3367 4659 4696 4720 4730 4752.4

2 3871 5345 5398 5420 5430.1 5455.8

3 4239 5917 6020 6046.15 6057.4 6086.1

4 4929 6794 6871.7 6901.5 6914.3 6947.1

5 5217 7204.3 7286.7 7318.3 7331.9 7366.7

Le montant total de provision est 2427 ◦.

33

Page 34: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Le modele de Mack

H1 E (Ci,j+1|Ci,1, ..., Ci,j) = λj · Cij pour tour i = 0, 1, .., n et j = 0, 1, ..., n− 1

H2 (Ci,j)j=1,...,n et (Ci′,j)j=1,...,n sont independant pour i 6= i′.

H3 Var (Ci,j+1|Ci,1, ..., Ci,j) = Ci,jσ2j pour tout i = 0, 1, ..., n et j = 0, 1, ..., n− 1

E(

[Ri − Ri]2|Fi)

= R2i

(n−i−1∑k=0

σ2i+k

λ2i+k

∑C·,i+k

+σ2n−1

[λn−1 − 1]2∑C·,i+k

)◦

34

Page 35: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Les modeles factoriels

Assume thatYi,j ∼ P(µi,j) where µi,j = exp[αi + βj ].

the occurrence factor αi the development factor βj

35

Page 36: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

The log-Poisson regression model

Assume thatYi,j ∼ P(µi,j) where µi,j = exp[αi + βj ].

It is then extremely simple to calibrate the model,◦

Yi,j = exp[αi + βj ] Yi,j = exp[αi + βj ]

on past observations on the future

36

Page 37: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Modeliser l’incertitude

0 2 4 6 8 10

02

46

8

37

Page 38: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Bootstrap and GLM log-Poisson in triangles

Total amount of reserves ('000 000$)

10 15 20 25 30

(log-Poisson + bootstrap versus lognormal distribution + Mack) ◦

38

Page 39: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Les modeles bayesiens

39

Page 40: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

• Plan du cours •

• Introduction generale• La tarification a priori• Les provisions pour sinistres a payer (IBNR)• Les tables de mortalite prospectives◦ La modelisation de la mortalite en actuariat, hpx = P(T > x+ h|T > x)◦ Lecture transversale ou longitudinale du diagramme de Lexis◦ Le modele de Lee & Carter, E(µi,t) = exp[αi + βiγt]◦ De la modelisation du taux de deces aux tables prospectives

40

Page 41: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Les notions classiques en assurance vie

Pour calculer la probabilite de survie, on note que

hpx = P(T > x+ h|T > x) = P(T > x+ 1|T > x) · · ·P(T > x+ h|T > x+ h− 1)

i.e.

hpx = 1px · 1px+1 · · · 1px+h−1 =h−1∏i=0

px+i

autrement dit seul le vecteur des px suffit pour calculer toutes les probabilites.

Mais ces probabilites ne prennent pas en compte le vieilissement, i.e.

hptx = Pt(T > x+ h|T > x) = Pt(T > x+ 1|T > x) · Pt+1(T > x+ 2|T > x+ 1)

· · ·Pt+h−1(T > x+ h|T > x+ h− 1)

41

Page 42: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Lecture transversable vs. lecture longitudinale

Taux de mortalite µx,t, ◦

Age

0

20

4060

80

Année

1900

1920

1940

19601980

2000

taux de mortalité

−8

−6

−4

−2

42

Page 43: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Le modele de Lee & Carter

Assume here that E(D|α,β,γ) = Var(D|α,β,γ), thus a Poisson model can beconsidered. Then

Dj,t ∼ P(Ej,t · µj,t) where µj,t = exp[αj + βjγt]

the age factors (αj , βj) the time factor t

43

Page 44: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

A stochastic model for mortality

Two sets of parameters depend on the age, α = (α0, α1, · · · , α110) andβ = (β0, β1, · · · , β110).

●●

●●

●●●●●●

●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●●●

0 20 40 60 80

●●

●●

●●●●●●

●●

●●

●●

●●●●●

●●

●●

●●

●●

●●

●●

●●

●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●

0 20 40 60 80

44

Page 45: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

A stochastic model for mortality

and one set of parameters depends on the time, γ = (γ1899, γ1900, · · · , γ2005).

●●●●●●●●●

●●●

●●

●●

●●●●●●●

●●●

●●●●●●●●●●

●●

●●

●●

●●

●●●●●

●●●●

●●

●●●●●●

●●●●●●●●●●●●

●●●●

●●●●

●●●●

●●●●●●

●●●●

●●

1900 1920 1940 1960 1980 2000

45

Page 46: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Errors and predictions

exp[αj + βj γt] exp[αj + βj γt]

on past observations on the future

46

Page 47: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Forecasting γ

Based on γ = (γ1899, · · · , γ2005), we need to forecast γ = (γ2006, · · · , γ2050).

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●

●●●●

●●●

●●●●●●●●●●●●●●●●●●

●●●

●●

●●●●

●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●

1900 1950 2000 2050

47

Page 48: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Forecasting γ

Classically integrated ARIMA processes are considered, ◦

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●

●●●●

●●●

●●●●●●●●●●●●●●●●●●

●●●

●●

●●●●

●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●

1900 1950 2000 2050

48

Page 49: Slides udm-010910

Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V

Des taux de deces aux tables

49