394
Modélisation des distributions de sinistres avec R

Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Embed Size (px)

Citation preview

Page 1: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Modélisation des distributionsde sinistres avec R

Page 2: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez
Page 3: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Modélisation des distributionsde sinistres avec R

Vincent GouletProfesseur titulaire | École d’actuariat | Université Laval

Notes de cours | Code R | Exercices— édition 2013

Page 4: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

© 2013 Vincent Goulet

Cette création est mise à disposition selon le contrat Paternité-Partage à l’identique2.5 Canada de Creative Commons. En vertu de ce contrat, vous êtes libre de :

x partager — reproduire, distribuer et communiquer l’œuvre ;

x remixer — adapter l’œuvre ;

x utiliser cette œuvre à des fins commerciales.

Selon les conditions suivantes :

Attribution — Vous devez attribuer l’œuvre de la manière indiquée parl’auteur de l’œuvre ou le titulaire des droits (mais pas d’une manière quisuggérerait qu’ils vous soutiennent ou approuvent votre utilisation del’œuvre).Partage à l’identique — Si vous modifiez, transformez ou adaptez cetteœuvre, vous n’avez le droit de distribuer votre création que sous unelicence identique ou similaire à celle-ci.

Code sourceLe code source LATEX et R de ce document est disponible à l’adresse https://svn.

fsg.ulaval.ca/svn-pub/vgoulet/documents/distributions_sinistres/ ou encommuniquant directement avec l’auteur.

CouvertureTornade de catégorie F5 à l’approche de la ville de Elie, Manitoba, le 22 juin 2007.

Crédit photo : Justin1569 via Wikimedia CommonsInfographie : Marie-Pier Laliberté, Véronique Tardif

Page 5: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Introduction

Ce document traite de modélisation statistique des montants de sinistres enassurance de dommages. Il s’agit de mes notes du cours Mathématiques actuariellesIARD I offert à l’École d’actuariat de l’Université Laval auxquelles j’ai intégré ducode informatique ainsi que le recueil d’exercices de Cossette et collab. (2009).

Les notes et les exercices de cet ouvrage ont atteint un niveau de maturitéenviable. Si c’est le cas, c’est parce que j’ai eu le privilège de bâtir sur du matérielde grande qualité développé au fil des ans par les professeurs Hélène Cossette,François Dufresne, José Garrido, Michel Jacques et Jacques Rioux, ainsi que par lechargé de cours Mathieu Pigeon alors qu’il étudiait à la maîtrise en actuariat aumilieu des années 2000.

La matière est divisée en sept chapitres. Le premier est un chapitre de rap-pels des notions de base en analyse, en probabilité et en statistique. Le chapitre 2traite des fondements de la modélisation en assurance de dommages, en particu-lier le traitement mathématique des franchises, limite supérieure et coassurance,ainsi que de l’effet de l’inflation sur la fréquence et la sévérité des sinistres. Lesaspects plus statistiques apparaissent au chapitre 3 avec la modélisation non para-métrique. Le chapitre 4 étudie les principales distributions utilisées en assurancede dommages et la création de nouvelles distributions à partir des lois usuelles.Les chapitres 5 et 6 portent quant à eux sur l’estimation paramétrique et les testsd’adéquation des modèles. Enfin, le chapitre 7 propose une brève incursion dans lamodélisation des distributions de fréquence des sinistres.

Les termes anglais ordinary deductible et franchise deductible utilisés dans lestextes de référence usuels en actuariat ont posé quelques soucis de traduction. Pourle premier, j’utilise l’expression «franchise forfaitaire» recommandée par Béguin(1990). Pour le second terme, beaucoup moins répandu, j’ai opté pour l’expression«franchise atteinte» suggérée, entre autres, dans Charbonnier (2004).

La présentation fait une large place aux considérations numériques auxquellestout actuaire praticien se retrouvera rapidement confronté. Parce que j’estime qu’ils’agit du meilleur outil aujourd’hui disponible pour faire l’analyse, le traitement et lamodélisation de données de sinistres, les exemples et illustrations sont entièrement

v

Page 6: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

vi Introduction

réalisés dans l’environnement statistique R (R Development Core Team, 2013). Auxfonctionnalités de base du système R pour nos fins s’ajoutent celles du packageactuar (Dutang et collab., 2008). D’ailleurs, plusieurs fonctions du package ont étédéveloppées à l’origine spécifiquement pour ce matériel.

L’étude du document implique quelques allers-retours entre le texte et lessections de code informatique présentes à la fin de certains chapitre. Les sautsvers ces sections sont clairement indiqués dans le texte par des mentions mises enévidence par le symbole¸.

Chaque chapitre comporte des exercices. Les réponses de ceux-ci se trouvent àla fin de chacun des chapitres, alors que les solutions complètes sont regroupées àl’annexe E. En consultation électronique, le numéro d’un exercice est un hyperlienvers sa solution, et vice versa.

On trouvera également à la fin de chaque chapitre (sauf le premier) une listenon exhaustive d’exercices proposés dans Klugman et collab. (2012a). Des solutionsde ces exercices sont offertes dans Klugman et collab. (2012b).

L’annexe A présente la paramétrisation des lois de probabilité continues etdiscrètes utilisée dans les exercices. L’information qui s’y trouve est en plusieurspoints similaire à celle des annexes A et B de Klugman et collab. (2008, 2012a),mais la paramétrisation des lois est dans certains cas différente. Le lecteur est doncfortement invité à la consulter.

L’annexe B explique comment configurer R pour faciliter l’installation et l’ad-ministration de packages externes. Enfin, les annexes C et D offrent des tables dequantiles des lois normale et khi carré.

Je remercie d’avance les lecteurs qui voudront bien me faire part de toute erreurou omission dans les notes, les exercices ou leurs solutions.

Vincent GouletQuébec, septembre 2013

Page 7: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Table des matières

Introduction v

1 Rappels d’analyse, de probabilité et de statistique 11.1 Limites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.2 Développement en séries . . . . . . . . . . . . . . . . . . . . . . . . . . 61.3 Variable aléatoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91.4 Densités conjointes, marginales et conditionnelles . . . . . . . . . . 161.5 Concepts de convergence . . . . . . . . . . . . . . . . . . . . . . . . . 171.6 Transformation de variables aléatoires . . . . . . . . . . . . . . . . . . 191.7 Échantillon aléatoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291.8 Quantiles et statistiques d’ordre . . . . . . . . . . . . . . . . . . . . . . 331.9 Estimation : introduction et propriétés . . . . . . . . . . . . . . . . . . 351.10 Estimation : méthodes . . . . . . . . . . . . . . . . . . . . . . . . . . . 401.11 Propriétés de l’estimateur du maximum de vraisemblance . . . . . . 421.12 Estimation par intervalles, ou intervalles de confiance . . . . . . . . 431.13 Tests d’hypothèses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 451.14 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

2 Modélisation en assurance IARD 552.1 Processus de modélisation . . . . . . . . . . . . . . . . . . . . . . . . . 562.2 Données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 562.3 Importation de données dans R . . . . . . . . . . . . . . . . . . . . . . 602.4 Variables aléatoires pour données incomplètes . . . . . . . . . . . . . 622.5 Franchises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 632.6 Espérance limitée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 682.7 Espérance résiduelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . 732.8 Rapport d’élimination de perte . . . . . . . . . . . . . . . . . . . . . . 742.9 Limite supérieure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 762.10 Coassurance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

vii

Page 8: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

viii Table des matières

2.11 Inflation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 812.12 Franchise, limite, coassurance et inflation . . . . . . . . . . . . . . . . 872.13 Code informatique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 872.14 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

3 Modélisation non paramétrique 973.1 Statistiques descriptives . . . . . . . . . . . . . . . . . . . . . . . . . . 983.2 Fonctions de répartition et de probabilité empiriques . . . . . . . . . 1003.3 Estimateurs de la fonction de survie . . . . . . . . . . . . . . . . . . . 1113.4 Estimateur par noyaux . . . . . . . . . . . . . . . . . . . . . . . . . . . 1253.5 Statistiques descriptives empiriques . . . . . . . . . . . . . . . . . . . 1283.6 Code informatique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1333.7 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141

4 Modèles paramétriques potentiels 1494.1 Famille gamma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1494.2 Famille bêta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1534.3 Familles et paramètres d’échelle . . . . . . . . . . . . . . . . . . . . . 1554.4 Création de distributions à partir de distributions connues . . . . . . 1564.5 Fonctions R pour les lois de probabilité . . . . . . . . . . . . . . . . . 1674.6 Valeurs extrêmes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1674.7 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173

5 Modélisation paramétrique 1815.1 Méthode des moments . . . . . . . . . . . . . . . . . . . . . . . . . . . 1825.2 Méthode des quantiles . . . . . . . . . . . . . . . . . . . . . . . . . . . 1845.3 Méthode du maximum de vraisemblance . . . . . . . . . . . . . . . . 1855.4 Maximisation numérique de la fonction de vraisemblance . . . . . . 1915.5 Estimation par intervalle . . . . . . . . . . . . . . . . . . . . . . . . . . 2035.6 Estimation par distance minimale . . . . . . . . . . . . . . . . . . . . 2125.7 Code informatique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2165.8 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222

6 Tests d’adéquation 2336.1 Tests graphiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2336.2 Tests statistiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2386.3 Choix d’un modèle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2476.4 Code informatique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2486.5 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250

Page 9: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Table des matières ix

7 Modèles de fréquence 2557.1 Fonction génératrice des probabilités . . . . . . . . . . . . . . . . . . 2557.2 Principales distributions discrètes . . . . . . . . . . . . . . . . . . . . 2567.3 Estimation et tests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2617.4 Familles (a,b,0) et (a,b,1) . . . . . . . . . . . . . . . . . . . . . . . . . 2637.5 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 264

A Paramétrisation des lois de probabilité 269A.1 Famille bêta transformée . . . . . . . . . . . . . . . . . . . . . . . . . . 270A.2 Famille gamma transformée . . . . . . . . . . . . . . . . . . . . . . . . 273A.3 Autres distributions continues . . . . . . . . . . . . . . . . . . . . . . . 276A.4 Distributions discrètes de la famille (a,b,0) . . . . . . . . . . . . . . . 278

B Installation de packages dans R 281

C Table de quantiles de la loi normale 283

D Table de quantiles de la loi khi carré 285

E Solutions des exercices 287Chapitre 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287Chapitre 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 300Chapitre 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313Chapitre 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333Chapitre 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345Chapitre 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 364Chapitre 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 371

Bibliographie 379

Page 10: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez
Page 11: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

1 Rappels d’analyse, de probabilitéet de statistique

Objectifs du chapitre

x Calculer la limite d’une fonction.x Calculer le développement en série de Taylor d’une fonction et son intervalle de

convergence.x Définir et calculer les principales quantités liées à une variable aléatoire (densité,

fonction de répartition, espérance, densités conjointe et marginale, fonctions géné-ratrices des moments et des probabilités).

x Déterminer la loi de la transformation d’une variable aléatoire.x Définir, calculer et déterminer la distribution des principales quantités liées à un

échantillon aléatoire (moyenne, variance, statistiques d’ordre).x Définir les principales caractéristiques d’un estimateur (biais, efficacité, conver-

gence, exhaustivité).x Définir, calculer et établir les caractéristiques des estimateurs ponctuels des mo-

ments et du maximum de vraisemblance.x Définir et déterminer un intervalle de confiance pour une quantité.x Établir un test d’hypothèses pour une quantité donnée. Définir et calculer les princi-

pales quantités liées au test (hypothèses nulle et alternative, erreur de type I, erreurde type II, niveau de confiance, valeur p).

Le but de ce chapitre est de revoir certaines notions d’analyse, de probabilité etde statistique importantes pour la suite. Il est possible que certaines de ces notionssoient moins familières au lecteur que d’autres. Nous reviendrons en temps et lieusur les éléments les plus complexes.

Pour de plus amples détails, consulter Hogg et collab. (2005), Klugman et collab.(2012a, chapitres 2, 3 et 10), Klugman et collab. (2008, chapitres 2, 3 et 12), Klugmanet collab. (2004, chapitre 2) ou tout autre bon livre de statistique mathématique.

1

Page 12: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

2 Rappels d’analyse, de probabilité et de statistique

1.1 Limites

Cette section rappelle simplement deux résultats importants en analyse mathé-matique.

1.1.1 Théorème du «sandwich»

Parfois, lorsqu’il n’est pas possible de calculer directement la limite d’unefonction f (x), on peut la calculer indirectement en utilisant le théorème dit du«sandwich» .

Théorème 1.1. Soient f (x), g (x) et h(x) des fonctions et la relation g (x) ≤ f (x) ≤h(x) valide pour tout x dans un intervalle ouvert contenant le point c, sauf peut-êtreau point x = c lui-même. Si

limx→c

g (x) = limx→c

h(x) = L,

alorslimx→c

f (x) = L.

Démonstration. On commence par traiter le cas où la limite est approchée par ladroite. Soit

limx→c+ g (x) = lim

x→c+ h(x) = L.

Alors, pour tout ε > 0, il existe δ > 0 tel que pour tout x, l’inégalité c < x < c +δimplique

L−ε< g (x) < L+ε

et

L−ε< h(x) < L+ε.

Ces deux inégalités, combinées à g (x) ≤ f (x) ≤ h(x), donnent

L−ε< g (x) ≤ f (x) ≤ h(x) < L+εL−ε< f (x) < L+ε−ε< f (x)−L < ε.

On peut donc en conclure que, pour tout x, l’inégalité c < x < c +δ implique

| f (x)−L| < ε.

Page 13: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

1.1. Limites 3

Comme on peut prendre ε aussi près de 0 qu’on le désire, on peut en conclure que

limx→c+ f (x) = L.

Les cas où la limite est approchée par la gauche et par les deux côtés se traitent dela même façon.

Exemple 1.1. Soit la relation

1− x2

6< x sin(x)

2−2cos(x)< 1

pour toutes les valeurs de x proches de 0. On souhaite évaluer

limx→0

x sin(x)

2−2cos(x).

Or, par le théorème précédent, limx→0 1 = 1,

limx→0

1− x2

6= 1

et donc

limx→0

x sin(x)

2−2cos(x)= 1.

La figure 1.1 présente le graphique de la fonction et des deux bornes.

1.1.2 Règle de l’Hôpital

La règle de l’Hôpital permet de réaliser des calculs de limites lorsque des formesindéterminées (∞∞ , 0

0 , 0×∞, etc.) sont rencontrées.

Théorème 1.2. Soit f (x) et g (x) deux fonctions différentiables sur un intervalleouvert I , sauf éventuellement en un point x = c. On suppose que, sur I , on ag (x) 6= 0 pour x 6= c. Si, dans ces conditions, limx→c f (x) = limx→c g (x) = 0, ou encorel i mx→c f (x) =±∞ et limx→c g (x) =±∞, alors la limite de

f (x)

g (x)

peut être calculée à l’aide de la règle

limx→c

f (x)

g (x)= lim

x→c

f ′(x)

g ′(x)

si la dernière limite existe.

Page 14: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

4 Rappels d’analyse, de probabilité et de statistique

−2 −1 0 1 2

0.65

0.75

0.85

0.95

x

f(x)

FIG. 1.1: Fonction f (x) = x sin(x)/(2−2cos(x)) (trait plein) et les bornes y = 1−x2/6et y = 1 (traits brisés)

Exemple 1.2. Considérer

limx→2

2x2 −5x +2

x2 −4.

En utilisant la procédure habituelle, on obtient la forme indéterminée 00 . On voit

par contre à la figure 1.2 que la limite semble exister en ce point. En utilisant larègle de l’Hôpital, on obtient

limx→2

2x2 −5x +2

x2 −4= lim

x→2

4x −5

2x

= 3

4.

Page 15: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

1.1. Limites 5

0.0 0.5 1.0 1.5 2.0 2.5 3.0

−0.

50.

00.

51.

0

x

f(x)

FIG. 1.2: Fonction f (x) = (2x2 −5x +2)/(x2 −4) autour du point x = 2

Exemple 1.3. La limite

limx→0+ x ln(x)

résulte en une indétermination 0×−∞. On voit par contre à la figure 1.3 que lalimite à droite semble exister en ce point. Il suffit de procéder comme suit :

limx→0+ x ln(x) = lim

x→0+ln(x)

1/x

= limx→0+

1/x

−1/x2

= limx→0+−x

= 0.

Page 16: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

6 Rappels d’analyse, de probabilité et de statistique

0.0 0.5 1.0 1.5 2.0

0.0

0.5

1.0

x

f(x)

FIG. 1.3: Fonction f (x) = x ln(x) autour du point x = 0

1.2 Développement en séries

On appelle série de puissances une série de la forme

∞∑n=0

an(x − c)n = a0 +a1(x − c)+a2(x − c)2 + . . .

où x est une variable et où les ai et c sont des constantes. Le but de cette section estd’exprimer certaines fonctions sous la forme de séries de puissances. Ces dernièressont utilisées, entre autres, par les calculatrices pour évaluer des fonctions trigono-métriques. Elles peuvent également être utilisées pour calculer numériquementcertaines intégrales définies difficiles à évaluer autrement.

Page 17: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

1.2. Développement en séries 7

1.2.1 Série de Taylor

Soit une fonction f (x) que l’on souhaite développer autour du point x = c. Lafonction f (x) doit être différentiable indéfiniment en x = c. On pose alors

f (x) = a0 +a1(x − c)+a2(x − c)2 +a3(x − c)3 + . . .

On calcule ensuite les dérivées :

f ′(x) = a1 +2a2(x − c)+3a3(x − c)2 +4a4(x − c)3 + . . .

f ′′(x) = 2a2 +6a3(x − c)+12a4(x − c)2 + . . .

f ′′′(x) = 6a3 +24a4(x − c)+ . . . ,

d’où on trouve que a0 = f (c), a1 = f ′(c), a2 = f ′′(c)2! , a3 = f ′′′(c)

3! , et ainsi de suite. Laformule générale pour la série, ou le développement, de Taylor est alors

f (x) =∞∑

n=0

f (n)(c)

n!(x − c)n .

Exemple 1.4. On calcule le développement en série de Taylor de la fonction ln(x)autour du point x = 1. On a f (x) = ln(x), f (1) = 0, f ′(x) = 1/x, f ′(1) = 1, f ′′(x) =−1/x2, f ′′(1) = −1, f ′′′(x) = 2/x3, f ′′′(1) = 2, f (4)(x) = −6/x4, f (4)(1) = −6, et ainside suite. On obtient donc, pour c = 1,

ln(x) = (x −1)− (x −1)2

2+ 2(x −1)3

6− 6(x −1)4

24+ . . .

=∞∑

n=1(−1)n+1 (x −1)n

n.

Il est à noter que lorsque c = 0, le développement de Taylor porte parfois le nomde développement de Maclaurin.

1.2.2 Intervalle de convergence

Lorsque que l’on attribue à la variable x d’une série une valeur numérique, ildevient alors possible de déterminer si la série diverge ou converge. On appelleintervalle de convergence d’une série de puissances l’ensemble des valeurs de xpour lesquelles la série converge.

Pour déterminer cet intervalle, on évalue

limn→∞

|un+1||un |

= limn→∞

∣∣∣∣un+1

un

∣∣∣∣= |H |

et on utilise comme critère

Page 18: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

8 Rappels d’analyse, de probabilité et de statistique

x si |H | < 1, la série converge ;

x si |H | > 1, la série diverge ; et

x si |H | = 1, on ne peut rien conclure.

Exemple 1.5. Soit la série entière

∞∑n=0

xn = 1+x +x2 +x3 +x4 + . . .

On a

limn→∞

|un+1||un |

= limn→∞

∣∣∣∣un+1

un

∣∣∣∣= lim

n→∞

∣∣∣∣ xn+1

xn

∣∣∣∣= lim

n→∞|x|= |x|.

Il faut vérifier pour x = 1 et x =−1. On a

1−1+1−1+ . . .

qui diverge et1+1+1+1+ . . .

qui diverge également. L’intervalle de convergence est donc (−1,1).

On conclut cette section avec trois théorèmes (présentés sans démonstration)concernant les développements en séries de puissances.

Théorème 1.3. Une série de puissances est une fonction continue à l’intérieur de sonintervalle de convergence.

Théorème 1.4. Une série de puissance peut être dérivée terme par terme à l’intérieurde son intervalle de convergence.

Théorème 1.5. Un série de puissances peut être intégrée terme par terme à l’intérieurde son intervalle de convergence.

Exemple 1.6. On a vu que l’intervalle de convergence de la série

f (x) = 1+x +x2 +x3 +x4 + . . .

Page 19: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

1.3. Variable aléatoire 9

Expérience Variable aléatoire

Lancer de deux dés Somme des faces supérieuresLancer de 25 pièces de monnaie Nombre de facesÉcrasement d’un avion Montant des dégâts au sol

TAB. 1.1: Exemples de variables aléatoires

est (−1,1). On a alors, à l’intérieur de cet intervalle que

g (x) =∫ 1/2

0f (x)d x

=∫ 1/2

01d x +

∫ 1/2

0x d x +

∫ 1/2

0x2 d x +

∫ 1/2

0x3 d x + . . .

= x + x2

2+ x3

3+ . . . |1/2

0

= 1

2+ 1

8+ 1

24+ . . . .

1.3 Variable aléatoire

Soit X , une variable aléatoire. Il s’agit d’une fonction qui, à chaque élémentde l’espace fondamentalΩ d’une expérience aléatoire, associe un nombre réel. Letableau 1.1 présente quelques exemples de variables aléatoires.

1.3.1 Fonction de répartition

Soit F (x), la fonction de répartition de la variable aléatoire X . Il s’agit de laprobabilité que X soit plus petite ou égale à une valeur donnée, c’est-à-dire

F (x) = Pr[X ≤ x].

De manière formelle, la fonction F (x) est une fonction de répartition si etseulement si les trois conditions suivantes sont respectées :

1. F (x) est non-décroissante ;

2. F (x) est continue par la droite, c’est-à-dire que pour tout point x0, la valeurlimite de F (x) lorsque x s’approche de x0 par la droite est F (x0) ;

3. limx→−∞ F (x) = 0 et limx→∞ F (x) = 1.

La figure 1.4 présente un exemple de fonction de répartition.

Page 20: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

10 Rappels d’analyse, de probabilité et de statistique

0 1 2 3 4 5

0.0

0.2

0.4

0.6

0.8

1.0

x

F(x

)

FIG. 1.4: Fonction de répartition

1.3.2 Fonction de survie

Soit S(x), la fonction de survie de la variable aléatoire X . Il s’agit de la probabilitéque X soit plus grande qu’une valeur donnée, c’est-à-dire

S(x) = 1−F (x) = Pr[X > x].

La fonction de survie doit satisfaire les trois conditions suivantes :

1. S(x) est non-croissante ;

2. S(x) est continue par la droite ;

3. limx→−∞ S(x) = 1 et limx→∞ S(x) = 0.

De manière générale, la fonction de survie est le complément à l’unité de lafonction de répartition. La figure 1.5 présente un exemple de fonction de survie.

Page 21: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

1.3. Variable aléatoire 11

0 1 2 3 4 5

0.0

0.2

0.4

0.6

0.8

1.0

x

S(x

)

FIG. 1.5: Fonction de survie

1.3.3 Densité et fonction de probabilité

Soit f (x), la fonction de densité de probabilité (f.d.p.) de la variable aléatoirecontinue X . De manière formelle, f (x) est une densité de probabilité si et seulementsi elle satisfait les deux conditions suivantes :

1. f (x) ≥ 0 pour toutes les valeurs de X appartenant àΩ ;

2.∫Ω f (x)d x = 1.

Pour les variables aléatoires discrètes, on définit plutôt Pr[X = x], la fonction demasse de probabilité (f.m.p.). La f.m.p. doit satisfaire les deux conditions suivantes :

1. Pr[X = x] ≥ 0 pour toutes les valeurs de X appartenant àΩ ; et

2.∑ΩPr[X = x] = 1.

Dans le cas continu, la fonction de densité est la dérivée de la fonction de réparti-tion.

La figure 1.6 présente un exemple de fonction de densité de probabilité.

Page 22: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

12 Rappels d’analyse, de probabilité et de statistique

0 1 2 3 4 5

0.0

0.2

0.4

0.6

x

f(x)

FIG. 1.6: Fonction de densité de probabilité

1.3.4 Taux d’incidence

Le taux d’incidence (hazard rate en anglais) h(x) (ou λ(x)) d’une variable aléa-toire X est défini comme le ratio de la densité et de la fonction de survie, c’est-à-dire

h(x) = f (x)

S(x)

=−S′(x)

S(x)

=− d

d xlnS(x).

Le taux d’incidence porte aussi parfois le nom de force de mortalité et est alorsgénéralement noté µ(x).

La fonction de survie peut être retrouvée à partir du taux d’incidence :

S(x) = e−∫ x

0 h(y)d y .

Page 23: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

1.3. Variable aléatoire 13

D’autre part, le taux d’incidence cumulé de la variable aléatoire X est définitcomme

H(x) =∫ x

−∞h(t )d t

=− lnS(x).

1.3.5 Espérance et moments

L’espérance d’une variable aléatoire est une mesure de sa tendance centrale.Pour une variable aléatoire continue, on a

E [g (X )] =∫ ∞

−∞g (x) f (x)d x,

et pour une variable aléatoire discrète

E [g (X )] =∞∑

x=−∞g (x)Pr[X = x].

Cette dernière expression peut être vue comme une moyenne pondérée des valeursde g (x). Si E [|g (X )|] =∞, on dit que E [g (X )] n’existe pas.

Le théorème suivant énonce quelques propriétés importantes de l’opérateurespérance.

Théorème 1.6. Soit X une variable aléatoire, a, b et c des constantes et g1(x) et g2(x)deux fonctions quelconques. On a alors les propriétés suivantes :

i) E [·] est un opérateur linéaire :

E [ag1(X )+bg2(X )+ c] = aE [g1(X )]+bE [g2(X )]+ c.

ii) Si g1(x) ≥ 0 pour tout x, alors E [g1(X )] ≥ 0.

iii) Si g1(x) ≥ g2(x) pour tout x, alors E [g1(X )] ≥ E [g2(X )].

iv) Si a ≤ g1(x) ≤ b pour tout x, alors a ≤ E [g1(X )] ≤ b.

On nomme, lorsqu’il existe, moment d’ordre k de la variable aléatoire X l’espé-rance de cette dernière élevée à la puissance k. On a

µ′k = E [X k ]

=∫ ∞

−∞xk f (x)d x

Page 24: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

14 Rappels d’analyse, de probabilité et de statistique

ou

µ′k =

∞∑x=−∞

xk Pr[X = x].

Le moment d’ordre 1 est la moyenne de la variable aléatoire. On note souventsimplement µ′

1 =µ= E [X ].De même, on nomme, lorsqu’il existe, moment central d’ordre k de la variable

aléatoire l’espérance de la différence entre cette dernière et la moyenne, élevée àla puissance k. Il s’agit donc d’une mesure de la dispersion de X autour de sonespérance. On a

µk = E [(X −E [X ])k ]

=∫Ω

(x −µ)k f (x)d x

ou

=∑Ω

(x −µ)k Pr[X = x].

Le moment central d’ordre 2 est la variance : µ2 = E [(X −µ)2] = Var[X ]. Si X estune variable aléatoire dont la variance est finie et a et b sont des constantes, alors

Var[aX +b] = a2Var[X ]

Les moments et moments centraux sont reliés entre eux. Par exemple,

µ2 = E [(X −µ)2]

= E [X 2]−2µE [X ]+µ2

=µ′2 −µ2.

On nomme coefficient de variation d’une variable aléatoire X le rapport de laracine carrée du moment central d’ordre 2 sur le moment d’ordre 1 :

CV(X ) =p

Var[X ]

E [X ]= µ1/2

2

µ.

On nomme coefficient d’asymétrie (skewness) la mesure

γ1(X ) = E [(X −µ)3]

Var[X ]3/2= µ3

µ3/22

.

Page 25: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

1.3. Variable aléatoire 15

Si la distribution d’une variable aléatoire est symétrique autour de sa moyenne,alors tous les moments centraux impairs sont nuls et, a fortiori, γ1 = 0. En assuranceIARD, on travaille très majoritairement avec des distributions dont le coefficientd’asymétrie est positif, c’est-à-dire dont la queue droite est plus lourde que la queuegauche.

Le coefficient d’aplatissement, ou coefficient d’excès (kurtosis), est une mesurede l’épaisseur des queues d’une distribution. Le coefficient est définit ainsi :

γ2(X ) = E [(X −µ)4]

Var[X ]2 = µ4

µ22

.

La valeur de référence est la loi normale, dont le coefficient d’aplatissement vaut 3.Si le coefficient d’une distribution est supérieur à 3, les queues de celle-ci sont pluslourde que la loi normale.

Remarque. Certains ouvrages définissent plutôt le coefficient d’aplatissement defaçon à attribuer un coefficient nul à la loi normale : γ2(X ) =µ4/µ2

2 −3.

1.3.6 Fonction génératrice des moments

Pour une variable aléatoire X , la fonction génératrice des moments est donnéepar

MX (t ) = E [e t X ]

lorsque l’espérance existe (ce qui n’est pas le cas pour de nombreuses distributions.La fonction porte ce nom parce que sa ke dérivée évaluée en 0 est égale au ke

moment de la variable aléatoire. En effet,

M (k)X (t ) = d k

d t kE [e t X ]

= E

[d k

d t ke t X

]= E [X k e t X ],

d’où M (k)X (0) = E [X k ].

Page 26: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

16 Rappels d’analyse, de probabilité et de statistique

1.3.7 Fonction génératrice des probabilités

La fonction génératrice des probabilités d’une variable aléatoire X discrète estdéfinie ainsi :

PX (t ) = E [t X ]

=∞∑

x=0t x Pr[X = x]

= Pr[X = 0]+Pr[X = 1]t +Pr[X = 2]t 2 + . . .

En comparant cette dernière identité au développement de Taylor de la fonction P ,on observe que

P (k)X (0) = Pr[X = k]

k !,

d’où le nom de la fonction.

Théorème 1.7. Si deux variables aléatoires X et Y ont la même fonction génératricedes probabilités, alors elles ont la même loi.

Exemple 1.7. La fonction génératrice des probabilités d’une variable aléatoire Xobéissant à une distribution de Poisson de paramètre λ est

PX (t ) = E [t X ]

=∞∑

x=0e−λ

λx

x!t x

= e−λ∞∑

x=0

(λt )x

x!

= e−λeλt

= eλ(t−1).

1.4 Densités conjointes, marginales et conditionnelles

Soient X et Y deux variables aléatoires. Leur densité conjointe est notée fX Y (x, y)dans le cas continu et Pr[X = x,Y = y] dans le cas discret.

Dans le cas continu, les densités marginales sont

fX (x) =∫ ∞

−∞f (x, y)d y

Page 27: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

1.5. Concepts de convergence 17

et

fY (y) =∫ ∞

−∞f (x, y)d x.

Les densités conditionnelles sont

fX |Y (x|y) = fX Y (x, y)

fY (y)

et

fY |X (y |x) = fX Y (x, y)

fX (x).

La règle de Bayes permet d’exprimer la densité de X |Y en fonction de celle de Y |X :

fX |Y (x|y) = fY |X (y |x) fX (x)

fY (y).

Enfin, la loi des probabilités totales permet de calculer une densité marginale àpartir d’une distribution conditionnelle :

fX (x) =∫ ∞

−∞fX |Y (x|y) fY (y)d y.

Les équations ci-dessus sont similaires dans le cas discret.

Définition 1.1 (Loi normale multivariée). Soit X1, . . . , Xn des variables aléatoiresobéissant à des lois normales avec µi = E [Xi ] et σi j = Cov(Xi , X j ). On note x =x1, . . . , xn, µ= µ1, . . . ,µn et Σ = [σi j ]n×n . Le vecteur aléatoire X = X1, . . . , Xn aune densité normale multivariée si, et seulement si,

fX1,...,Xn (x1, . . . , xn) = 1

(2π)n/2|Σ|1/2e−(x−µ)′Σ−1(x−µ)/2.

1.5 Concepts de convergence

La notion de convergence en théorie des probabilités s’apparente à celle deconvergence d’une série de puissance. Cependant, il y plusieurs façons de définirla convergence d’une suite de variables aléatoires. Nous en présentons trois dansles sous-sections suivantes. Mais, tout d’abord, rappelons un résultat importantpour la poursuite de la discussion.

Théorème 1.8 (Inégalité de Chebychev). Soit X une variable aléatoire et g (x) unefonction non-négative. Alors, pour tout r > 0, on a

Pr[g (X ) ≥ r ] ≤ E [g (X )]

r.

Page 28: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

18 Rappels d’analyse, de probabilité et de statistique

Démonstration. On a

E [g (X )] =∫ ∞

−∞g (x) fX (x)d x.

Comme g (x) est une fonction non-négative, on obtient

E [g (X )] ≥∫

x:g (x)≥r g (x) fX (x)d x

≥ r∫

x:g (x)≥r fX (x)d x

= r Pr[g (X ) ≥ r ],

d’où

Pr[g (X ) ≥ r ] ≤ E [g (X )]

r.

1.5.1 Convergence en probabilité

Ce type de convergence est le plus faible et il est généralement facile à vérifier.Une suite de variables aléatoires X1, X2, . . . converge en probabilité vers une variablealéatoire X si, pour tout ε> 0,

limn→∞Pr[|Xn −X | ≥ ε] = 0

ou, de manière équivalente,

limn→∞Pr[|Xn −X | < ε] = 1.

Il faut donc qu’à partir d’un certain point dans la suite, la probabilité que la distanceentre les deux variables aléatoires soit aussi proche de 0 qu’on le désire soit de 1.

Il est à noter qu’il n’est pas nécessaire que les variables aléatoires X1, X2, . . .soient indépendantes et/ou identiquement distribuées.

1.5.2 Convergence presque certaine

Ce type de convergence est plus fort que la convergence en probabilité (c’est-à-dire que la convergence presque certaine implique la convergence en probabilité,mais que l’inverse n’est pas nécessairement vrai). Une suite de variables aléatoiresX1, X2, . . . converge presque certainement vers une variable aléatoire X si, pour toutε> 0, on a

Pr[

limn→∞|Xn −X | < ε

]= 1.

Page 29: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

1.6. Transformation de variables aléatoires 19

Théorème 1.9. Soit X1, X2, . . . une suite de variables aléatoires indépendantes etidentiquement distribuées avec E [Xi ] =µ et Var[Xi ] <∞. On définit

Xn = 1

n

n∑i=1

Xi .

On a alors, pour tout ε> 0,

Pr[

limn→∞|Xn −µ| < ε

]= 1.

Ce résultat sera moins utilisé dans la suite.

1.5.3 Convergence en distribution

La convergence en distribution est la plus faible des trois types de convergenceprésentés dans cette section. Une suite de variables aléatoires X1, X2, . . . convergeen distribution vers une variable aléatoire X si

limn→∞FXn (x) = FX (x)

pour tous les points où FX (x) est continue.

1.6 Transformation de variables aléatoires

Cette section porte sur les transformations de variables aléatoires, soit desfonctions d’une ou plusieurs variables aléatoires. En termes mathématiques, étantdonné la distribution conjointe des variables aléatoires X1, . . . , Xn , on cherche àdéterminer la fonction de probabilité ou de densité de la variable aléatoire Y =u(X1, . . . , Xn).

Voici quelques exemples de transformations fréquemment rencontrées :

Y = X 2

Y = X −E [X ]pVar[X ]

Y = X1 +·· ·+Xn

nY = FX (X ).

Il existe trois techniques principales pour déterminer la distribution de la trans-formation Y :

1. la technique de la fonction de répartition ;

2. la technique du changement de variable ;

3. la technique de la fonction génératrice des moments.

Page 30: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

20 Rappels d’analyse, de probabilité et de statistique

1.6.1 Technique de la fonction de répartition

C’est la technique la plus simple, mais pas toujours la plus facile d’emploi. Eneffet, la fonction de répartition de certaines lois de probabilité est compliquée,voire n’existe pas sous forme explicite (penser ici aux lois normale et gamma, parexemple).

L’idée consiste simplement à calculer la fonction de répartition de la transfor-mation avec

FY (y) = Pr[Y ≤ y]

= Pr[u(X1, . . . , Xn) ≤ y],

puis à calculer la densité (ou la fonction de probabilité) par différenciation :

fY (y) = F ′Y (y).

Il importe de noter que le domaine de définition de la transformation n’est pasnécessairement le même que celui de ou des variables aléatoires de départ.

Exemple 1.8. Soit

fX (x) =

6x(1−x), 0 < x < 1

0, ailleurs,

c’est-à-dire X ∼ Bêta(2,2). On détermine la densité de Y = X 3. On a

FY (y) = Pr[X 3 ≤ y]

= Pr[X ≤ y1/3]

= FX (y1/3)

=∫ y1/3

06x(1−x)d x

= 3y2/3 −2y, 0 < y < 1,

et donc

fY (y) = F ′Y (y)

=

2y−1/3 −2, 0 < y < 1

0, ailleurs.

Page 31: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

1.6. Transformation de variables aléatoires 21

Exemple 1.9. Soit X une variable aléatoire continue quelconque avec fonction derépartition FX (x) et Y = aX +b, où a et b sont des constantes réelles. On a

FY (y) = Pr[aX +b ≤ y]

= FX

(y −b

a

)et, par conséquent,

fY (y) = 1

afX

(y −b

a

).

La transformation Y = X + b représente une translation de X , vers la droite sib > 0 et vers la gauche si b < 0. En assurance, b pourra être interprété comme unefranchise.

La transformation Y = aX n’est quand à elle qu’un changement d’échelle — parexemple un changement d’unité monétaire. Si a > 1 on a une dilatation, alors quele cas où 0 < a < 1 est une contraction.

Exemple 1.10. Soit X une variable aléatoire continue quelconque avec densitéfX (x). On cherche la densité de Y = |X |. Premièrement, il convient de remarquerque Y est définie au plus sur les réels positifs, même si X est définie sur tout l’axedes réels. Par la technique de la fonction de répartition,

FY (y) = Pr[|X | ≤ y]

= Pr[−y < X < y]

= FX (y)−FX (−y)

et

fY (y) =

fX (y)+ fX (−y), y > 0

0, ailleurs.

Par exemple, soit X ∼ N (0,1), c’est-à-dire

fX (x) =φ(x)

= 1p2π

e−12 x2

.

La densité de Y = |X | est alors

fY (y) =φ(y)+φ(−y)

= 2φ(y)

= 2p2π

e−12 y2

, y > 0.

Page 32: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

22 Rappels d’analyse, de probabilité et de statistique

Exemple 1.11. Soit Y = X1 + X2, où X1 et X2 sont deux variables aléatoires indé-pendantes chacune distribuée uniformément sur l’intervalle (0,1). On a donc

fX1 X2 (x1, x2) = fX1 (x1) = fX2 (x2) = 1, 0 < x1 < 1,0 < x2 < 1.

Le domaine de définition de Y sera l’intervalle (0,2). Le domaine d’intégrationétant un carré, il faut distinguer quatre cas.

1. Si y ≤ 0, on a clairement FY (y) = 0.

2. Si 0 < y < 1, on a

FY (y) =∫ y

0

∫ y−x2

0d x1 d x2

= 1

2y2.

3. Si 1 < y < 2, alors

FY (y) = (y −1)(1)+∫ 1

y−1

∫ y−x2

0d x1 d x2

= 1− 1

2(2− y)2.

4. Enfin, si y ≥ 2, clairement FY (y) = 1.

Par conséquent, on a

FY (y) =

0, y ≤ 012 y2, 0 < y ≤ 1

1− 12 (2− y)2, 1 < y < 2

1, y > 2

et

fY (y) =

0, y ≤ 0

y, 0 < y ≤ 1

2− y, 1 < y < 2

0, y > 2.

Page 33: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

1.6. Transformation de variables aléatoires 23

1.6.2 Technique du changement de variable

Cette technique est étroitement liée au changement de variable en intégration.Il convient toutefois de faire une distinction entre les cas discret et continu.

Cas discret

On considère la transformation Y = u(X ). Dans le cas discret, il suffit générale-ment de faire la substitution :

Pr[Y = y] = Pr[u(X ) = y]

= Pr[X = u−1(y)].

Les probabilités ne changent donc pas, elles ne sont qu’affectées à d’autres valeurs.

Exemple 1.12. Soit la variable aléatoire X avec fonction de probabilité

Pr[X = x] =

116 , x = 04

16 , x = 16

16 , x = 24

16 , x = 31

16 , x = 4.

On cherche la fonction de probabilité de Y = (X −2)2. Les valeurs possibles de Ysont y = 0,1 et 4. On a

Pr[Y = y] = Pr[(X −2)2 = y]

= Pr[X =±py +2]

et donc

Pr[Y = 0] = Pr[X = 2] = 6

16

Pr[Y = 1] = Pr[X = 1]+Pr[X = 3] = 10

16

Pr[Y = 1] = Pr[X = 0]+Pr[X = 4] = 2

16.

Page 34: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

24 Rappels d’analyse, de probabilité et de statistique

Cas continu

Le cas continu est beaucoup plus délicat. On considère toujours la transforma-tion Y = u(X ) avec les hypothèses suivantes :

x la fonction u(·) est différentiable ;

x la fonction u(·) est soit croissante, soit décroissante sur tout le domaine de fX (x).

Ainsi, l’inverse u−1(·) = w(·) de la fonction u existe et est différentiable.

Théorème 1.10. Soit fX (x) la fonction de densité de probabilité en x d’une variablealéatoire X et y = u(x) une fonction satisfaisant les hypothèses ci-dessus. Alors ladensité de la variable aléatoire Y = u(X ) est

fY (y) = fX (u−1(y)) |(u−1(y))′|= fX (w(y)) |w ′(y)|,

où w(y) = u−1(y) et en supposant u′(x) 6= 0.

Démonstration. On considère le cas où u est une fonction croissante. Alors

Pr[a < Y < b] = Pr[u−1(a) < X < u−1(b)]

=∫ w(b)

w(a)fX (x)d x

puis, avec le changement de variable y = u(x) ⇔ x = w(y) et donc d x = w ′(y)d y

Pr[a < Y < b] =∫ b

afX (w(y)) w ′(y)d y,

d’où fY (y) = fX (w(y)) w ′(y). Si u est décroissante, alors

fY (y) =− fX (w(y)) w ′(y)

= fX (w(y)) |w ′(y)|car w ′(y) < 0.

Exemple 1.13. Soit Y = −2ln(X ) où X ∼ U (0,1). En premier lieu, il importe despécifier qu’au domaine (0,1) de la variable aléatoire X correspond le domaine(0,∞) pour la transformation Y . On a u(x) =−2ln(x), d’où w(y) = u−1(y) = e−y/2

et w ′(y) =−12 e−y/2. Par le théorème 1.10, on obtient

fY (y) = fX (e−y/2)

∣∣∣∣−1

2e−y/2

∣∣∣∣= 1

2e−y/2

= 1/2

Γ(1)y1−1e−y/2, y > 0,

Page 35: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

1.6. Transformation de variables aléatoires 25

soit Y ∼ Gamma(1, 12 ) ≡χ2(2).

Exemple 1.14. Soit la variable aléatoire X avec fonction de répartition FX (x) enx. Considérer la transformation Y = FX (X ). On remarque tout d’abord que peuimporte le domaine de la variable aléatoire X , le domaine de la transformation sera(0,1). On a u(x) = FX (x) et w(y) = F−1

X (y), d’où

w ′(y) = 1

u′(w(y))

= 1

fX (F−1(y))

= 1

fX (x).

Par conséquent,

fY (y) = fX (F−1(y))

∣∣∣∣ 1

fX (x)

∣∣∣∣= fX (x)

∣∣∣∣ 1

fX (x)

∣∣∣∣= 1, 0 < y < 1,

soit Y ∼U (0,1). Ce résultat est particulièrement utile en simulation.

Exemple 1.15. On cherche la distribution de Y = Z 2, où Z ∼ N (0,1). La variablealéatoire Z étant définie sur R, la transformation y = z2 n’est pas bijective. Le trucconsiste ici à d’abord définir la transformation X = |Z |, de sorte que X soit définiesur les réels positifs seulement. De l’exemple 1.10, on sait que

fX (x) = 2p2π

e−12 y2

.

Par la suite, on définit Y = X 2 = |Z |2 = Z 2, une transformation bijective de X dontle domaine de définition est R+. On a alors u(x) = x2 pour x > 0, soit w(y) =p

y etw ′(y) = 1

2 z−1/2, d’où

fY (y) = fX (p

y)

∣∣∣∣ y−1/2

2

∣∣∣∣= 1p

2πe−y/2

= ( 12 )1/2

Γ( 12 )

y1/2 e−y/2, y > 0,

soit Y ∼χ2(1).

Page 36: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

26 Rappels d’analyse, de probabilité et de statistique

1.6.3 Technique du changement de variable --- deux variables etplus

Il s’agit simplement ici de généraliser les concepts étudiés à la section précé-dente à des transformations impliquant plusieurs variables aléatoires.

L’idée reste la même sinon qu’il faut s’assurer que la transformation compteautant de nouvelles variables que d’anciennes. Ainsi, si l’on part de la distributionconjointe de deux variables aléatoires X1 et X2, il faudra trouver la distributionconjointe de deux nouvelles variables aléatoires Y1 = u1(X1, X2) et Y2 = u2(X1, X2).Plus souvent qu’autrement, seule la distribution de la variable Y1 est d’intérêt.Il suffit alors de définir Y2 comme une variable muette (dummy), par exempleY2 = X2.

Cas discret

Si la transformation Y1 = u1(X1, X2) et Y2 = u2(X1, X2) est bijective, alors sim-plement

Pr[Y1 = y1,Y2 = y2] = Pr[u1(X1, X2] = y1,u2(X1, X2) = y2)

= Pr[X1 = w1(y1, y2], X2 = w2(y1, y2)),

w1(y1, y2) = u−11 (x1, x2)

w2(y1, y2) = u−12 (x1, x2).

Les fonctions de probabilité marginales sont alors obtenues en sommant :

Pr[Y1 = y1] =∞∑

y2=−∞Pr[Y1 = y1,Y2 = y2]

Pr[Y2 = y2] =∞∑

y1=−∞Pr[Y1 = y1,Y2 = y2].

Exemple 1.16. Trouver la distribution de Y = X1 + X2 si X1 ∼ Poisson(λ1), X2 ∼Poisson(λ2) et X1 et X2 sont indépendantes. Cet exemple requiert l’utilisationd’une variable muette. On définit Y2 = X2. On a

Y1 = X1 +X2

Y2 = X2⇔ X1 = Y1 −Y2

X2 = Y2.

Page 37: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

1.6. Transformation de variables aléatoires 27

Le domaine de Y1 est donc 0,1,2, . . . , alors que celui de Y2 est 0,1, . . . ,Y1. Ainsi,

Pr[Y1 = y1,Y2 = y2] = Pr[X1 +X2 = y1, X2 = y2]

= Pr[X1 = y1 − y2, X2 = y2]

= Pr[X1 = y1 − y2]Pr[X2 = y2]

= λy1−y2

1 e−λ1

(y1 − y2)!

λy2

2 e−λ2

y2!

et donc

Pr[Y1 = y1] =y1∑

y2=0

λy1−y2

1 λy2

2 e−(λ1+λ2)

(y1 − y2)! y2!

= e−(λ1+λ2)

y1!

y1∑y2=0

y1!

(y1 − y2)! y2!λ

y1−y2

1 λy2

2

= e−(λ1+λ2)

y1!

y1∑y2=0

(y1

y2

y1−y2

1 λy2

2

= e−(λ1+λ2)

y1!(λ1 +λ2)y1 ,

soit Y ∼ Poisson(λ1 +λ2).

Cas continu

On généralise le théorème 1.10 afin de trouver la distribution conjointe (etéventuellement les distributions marginales) de Y1 = u1(X1, X2) et Y2 = u2(X1, X2).On suppose que

x toutes les premières dérivées partielles de u1 et u2 existent sur le domaine de X1

et X2 ;

x la transformation est bijective.

Ces hypothèses garantissent que les fonctions inverses w1 = u−11 et w2 = u−1

2existent.

Théorème 1.11. Soit fX1 X2 (x1, x2) la fonction de densité de probabilité conjointeen (x1, x2) des variables aléatoires X1 et X2 et y1 = u1(x1, x2), y2 = u2(x1, x2) desfonctions satisfaisant les hypothèses ci-dessus. Alors la densité conjointe des variablesaléatoires Y1 = u1(X1, X2) et Y2 = u2(X1, X2) est

fY1Y2 (y1, y2) = fX1 X2 (w1(y1, y2), w2(y1, y2)) |J |,

Page 38: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

28 Rappels d’analyse, de probabilité et de statistique

J =

∣∣∣∣∣∣∣∣∣∂x1

∂y1

∂x1

∂y2

∂x2

∂y1

∂x2

∂y2

∣∣∣∣∣∣∣∣∣est appelé le Jacobien de la transformation.

Exemple 1.17. Soit deux variables aléatoires indépendantes X1 ∼ Gamma(α,1) etX2 ∼ Gamma(η,1), ainsi que les variables aléatoires Y1 = X1 +X2 et Y2 = X1/(X1 +X2). Tout d’abord, on a

fX1 X2 (x1, x2) = 1

Γ(α)Γ(η)xα−1

1 xη−12 e−x1−x2 , x1 > 0, x2 > 0.

De plus,

Y1 = X1 +X2

Y2 = X1

X1 +X2

⇔ X1 = Y1Y2

X2 = Y1(1−Y2)

et donc

∂x1

∂y1= y2

∂x1

∂y2= y1

∂x2

∂y1= 1− y2

∂x2

∂y2=−y1,

d’où le Jacobien de la transformation est

J =∣∣∣∣ y2 y1

1− y2 −y1

∣∣∣∣=−y1.

Le domaine de Y1 est R+ alors que celui de Y2 est limité à l’intervalle (0,1). Parle théorème 1.11,

fY1Y2 (y1, y2) = fX1 X2 (y1 y2, y1(1− y2)) |−y1|= 1

Γ(α)Γ(η)y1(y1 y2)α−1(y1(1− y2))η−1e−y1 y2−y1(1−y2)

= 1

Γ(α)Γ(η)yα+η−1

1 yα−12 (1− y2)η−1e−y1

= g (y1)h(y2)

Page 39: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

1.7. Échantillon aléatoire 29

où g (·) et h(·) sont des fonctions quelconques. Ainsi, Y1 et Y2 sont des variablesaléatoires indépendantes. De plus,

fY1 (y1) =∫ 1

0fY1Y2 (y1, y2)d y2

= yα+η−11 e−y1

∫ 1

0

1

Γ(α)Γ(η)yα−1

2 (1− y2)η−1 d y2

= 1

Γ(α+η)yα+η−1

1 e−y1 , y1 > 0

et

fY2 (y1, y2) = fY1Y2 (y1, y2)

fY1 (y1, y2)

= Γ(α+η)

Γ(α)Γ(η)yα−1

2 (1− y2)η−1, 0 < y2 < 1.

On a donc Y1 = X1 +X2 ∼ Gamma(α+η,1) et Y2 = X1/(X1 +X2) ∼ Bêta(α,η).

1.6.4 Technique de la fonction génératrice des moments

Cette technique s’avère tout spécialement puissante pour déterminer la dis-tribution (marginale) d’une combinaison linéaire de variables aléatoires indépen-dantes. La technique repose sur le théorème suivant.

Théorème 1.12. Soit X1, . . . , Xn des variables aléatoires indépendantes et Y = X1 +·· ·+Xn . Alors

MY (t ) =n∏

i=1MXi (t ).

Il est laissé en exercice de refaire les exemples 1.16 et 1.17 (distribution de Y1

seulement) à l’aide de la technique de la fonction génératrice des moments.

1.7 Échantillon aléatoire

Dans cette section, nous définissons plusieurs termes importants en inférencestatistique, dont

x statistique ;

x échantillon aléatoire.

Page 40: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

30 Rappels d’analyse, de probabilité et de statistique

Nous étudierons également la distribution de deux fonctions de variables aléatoiresimportantes, soit la moyenne et la variance de l’échantillon (ou empiriques ; samplemean et sample variance).

Considérer la mise en contexte suivante : on aimerait déterminer si une piècede monnaie est équilibrée (pile et face équiprobables) ou non. On définit doncd’abord une variable aléatoire

X : résultat du lancer d’une pièce de monnaie (1 pour pile, 0 pourface).

x On sait que X ∼ Bernoulli(p), mais il y a incertitude sur la valeur de p.

x On décide de lancer la pièce 100 fois. On définit alors

Xi : résultat du lancer i = 1, . . . ,100

et Xi ∼ Bernoulli(p).

x On lance la pièce 100 fois. Les valeurs x1, . . . , x100 forment un échantillon aléatoired’une population Bernoulli.

x On définit la fonction de variables aléatoires (et donc variable aléatoire elle-même)

Y = X1 +·· ·+X100

100

dans l’espoir que la probabilité que Y soit près de p,

Pr[p −ε< Y < p +ε],

soit grande. Y est une statistique.

x On calcule la valeur de la statistique pour notre échantillon

y = x1 +·· ·+x100

100.

x On essaie d’inférer quelque chose à partir de ce résultat, par exemple que p = y .

1.7.1 Quelques définitions

Définition 1.2 (Statistique). Une statistique est une fonction d’une ou plusieursvariables aléatoires qui ne dépend pas de paramètres inconnus.

Remarques.

Page 41: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

1.7. Échantillon aléatoire 31

1. Par exemple,

Y = 1

n(X1 +·· ·+Xn)

est une statistique, mais

Y = X −µσ

ne l’est pas si µ et σ sont inconnus.

2. Puisque toute fonction de variables aléatoires est une variable aléatoire :

x une statistique est une variable aléatoire ;

x une statistique a une distribution.

3. Si une statistique ne doit pas être définie en fonction de paramètres inconnus,sa distribution peut, elle, dépendre de paramètres inconnus.

Définition 1.3 (Échantillon aléatoire). Soit X1, . . . , Xn des variables aléatoires mu-tuellement indépendantes et identiquement distribuées (i.i.d.) avec fonction derépartition F (·). Alors ces variables aléatoires forment un échantillon aléatoire dela distribution F (·).

Il importe de remarquer, ici, qu’on a un échantillon aléatoire si, et seulement si,les variables aléatoires sont indépendantes et identiquement distribuées.

Définition 1.4 (Moyenne et variance de l’échantillon). Soit X1, . . . , Xn un échan-tillon aléatoire. Alors

X = 1

n

n∑i=1

Xi

est la moyenne de l’échantillon et

S2 = 1

n

n∑i=1

(Xi − X )2

est la variance de l’échantillon.

Remarques.

1. La moyenne et la variance de l’échantillon peuvent être définies pour tout typed’échantillon, pas seulement pour un échantillon aléatoire.

2. La variance de l’échantillon est parfois définie ainsi :

S2 = 1

n −1

n∑i=1

(Xi − X )2.

Nous verrons plus loin la différence entre ces deux définitions.

Page 42: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

32 Rappels d’analyse, de probabilité et de statistique

3. Il importe de distinguer les variables aléatoires fonctions d’un échantillon aléa-toire X et S2 de

x = 1

n

n∑i=1

xi

et

s2 = 1

n

n∑i=1

(xi − x)2,

des réalisations de ces deux variables aléatoires obtenues à partir d’une réalisa-tion de l’échantillon aléatoire.

1.7.2 Distribution de la moyenne de l’échantillon

Soit X1, . . . , Xn un échantillon aléatoire d’une population avec moyenne µ etvariance σ2. Il est alors simple de démontrer que

E [X ] =µ

Var[X ] = σ2

n.

Puisque Var[X ] → 0 quand n → ∞, la distribution de X est de plus en plusconcentrée autour de sa moyenne quand n augmente. En fait, le théorème suivantétablit que X converge en probabilité (sous-section 1.5.1) vers µ.

Théorème 1.13 (Loi (faible) des grands nombres). Soit X1, . . . , Xn un échantillonaléatoire d’une population avec moyenne µ et variance σ2. Alors

limn→∞Pr[µ−ε< X <µ+ε] = 1.

Le résultat suivant est un des plus importants de la théorie des probabilités. Ilétablit la convergence en distribution (sous-section 1.5.3) de la distribution de Xvers celle d’une loi normale.

Théorème 1.14 (Théorème central limite). Soit X1, . . . , Xn un échantillon aléatoired’une population avec moyenne µ et variance σ2. Alors la distribution de

Z = X −µσ/

pn

= (X1 +·· ·+Xn)−nµ

σp

n

tend vers une loi normale centrée réduite lorsque n →∞, c’est-à-dire

Pr[Z ≤ z]n→∞−→ Φ(z).

Page 43: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

1.8. Quantiles et statistiques d’ordre 33

Remarques.

1. Le Théorème central limite (TCL) n’affirme pas que Xn→∞−→ N (0,1) puisque

Var[X ]n→∞−→ 0.

2. En revanche, le TCL affirme que lorsque n → ∞, il est raisonnable de fairel’approximation X ∼ N (µ,σ2/n) ou encore, de manière équivalente, X1 +·· ·+Xn ∼ N (nµ,nσ2).

3. L’approximation est généralement bonne dès que n ≥ 30 et ce, peu importe ladistribution de X .

1.7.3 Distribution de la variance de l’échantillon

On rappelle, sans le démontrer, un résultat sur la distribution de la varianced’un échantillon tiré d’une loi normale.

Théorème 1.15. Soit X et S2 la moyenne et la variance, respectivement, d’un échan-tillon de taille n tiré d’une population normale de moyenne µ et variance σ2. Alors,

i) X ∼ N (µ,σ2/n)

ii) nS2/σ2 ∼χ2(n −1)

iii) X et S2 sont indépendantes.

1.8 Quantiles et statistiques d’ordre

Le 100pe quantile d’une distribution F (·) est la valeur de x tel que

limh→0

F (x −h) ≤ p ≤ F (x).

Pour une distribution continue, cela se résume au point x tel que F (x) = p.

x Quand p = 0,01,0,02, . . . ,0,99,1, on parle de centile (1er, 2e, . . ., 100e).

x Quand p = 0,25,0,50,0,75,1, on parle de quartile (1er, 2e, 3e, 4e).

x Le 50e centile, ou 2e quartile est aussi appelé la médiane de la distribution F .

Les quantiles sont les valeurs théoriques. Au niveau de l’échantillon, on a lesstatistiques d’ordre. Soit X1, . . . , Xn un échantillon aléatoire. Alors les statistiquesd’ordre de l’échantillon sont X(1) ≤ X(2) ≤ ·· · ≤ X(n), soit les valeurs de X1, . . . , Xn

classées en ordre croissant.

Page 44: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

34 Rappels d’analyse, de probabilité et de statistique

1.8.1 Distribution du maximum

On cherche la distribution de X(n) = max(X1, . . . , Xn). Or,

FX(n) (x) = Pr[X(n) ≤ x]

= Pr[X1 ≤ x, . . . , Xn ≤ x]

= (FX (x))n

d’où

fX(n) (x) = n(F (x))n−1 f (x).

1.8.2 Distribution du minimum

De même, on trouve que la distribution de X(1) = min(X1, . . . , Xn) est

fX(1) (x) = n(1−F (x))n−1 f (x).

1.8.3 Distribution de la ke statistique d’ordre

Trouver la distribution explicite d’une statistique d’ordre est en général unproblème ardu. Le théorème ci-dessous ne peut par exemple servir que pour desdistributions très simples — comme l’uniforme ou l’exponentielle — ou pour detrès petits échantillons.

Théorème 1.16. Soit X1, . . . , Xn un échantillon aléatoire d’une fonction de densitéde probabilité f (x) avec fonction de répartition correspondante F (x), et soit X(1) ≤X(2) ≤ ·· · ≤ X(n) les statistiques d’ordre de cet échantillon. Alors,

fX(1),...,X(n) (x1, . . . , xn) = n! f (x1) · · · f (xn), x1 ≤ ·· · ≤ xn

fX(k),X(r ) (x, y) = n!

(k −1)!(r −k −1)!(n − r )!(F (x))k−1·

(F (y)−F (x))r−k−1(1−F (y))n−r f (x) f (y), x ≤ y

fX(k) (x) = n!

(k −1)!(n −k)!(F (x))k−1(1−F (y))n−k f (x)

1.8.4 Fonctions R liées aux statistiques d’ordre

Il existe dans R plusieurs fonctions permettant de travailler avec les statistiquesd’ordre d’un échantillon : summary, quantile, max, min, median, range, diff, sort,order et rank.

Page 45: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

1.9. Estimation : introduction et propriétés 35

1.9 Estimation : introduction et propriétés

Nous abordons maintenant l’inférence statistique à proprement parler. Lesproblèmes d’inférence statistique se divisent en deux grandes classes :

1. Estimation : déterminer la valeur d’un ou plusieurs paramètres d’une distribu-tion. On distingue :

a) l’estimation ponctuelle, où l’on cherche une valeur pour un paramètre ;

b) l’estimation par intervalle, où l’on cherche des limites à l’intérieur desquellesse trouve un paramètre.

2. Tests d’hypothèses : déterminer si l’on accepte ou rejette une valeur ou unensemble de valeurs d’un paramètre.

En estimation ponctuelle, on utilise une statistique comme estimateur d’unparamètre de la distribution de la population. De manière générale, on considèrela variable aléatoire X avec fonction de densité de probabilité fX (x;θ), où θ est leparamètre inconnu de la distribution. L’estimation de θ suit les étapes suivantes :

1. On définit X1, . . . , Xn , un échantillon aléatoire de f (x;θ).

2. On définit Θ= T (X1, . . . , Xn) une fonction T (·) de X1, . . . , Xn comme estimateurde θ.

3. Une fois l’expérience effectuée, on a les observations x1, . . . , xn .

4. La valeur de l’estimation est θ = t (x1, . . . , xn).

Ainsi, un estimateur est une statistique. Par conséquent

x c’est une variable aléatoire (Θ est la variable aléatoire et θ sa réalisation) ;

x on peut étudier la distribution et autre propriétés statistiques d’un estimateur.

Les propriétés étudiées dans ce document sont :

x biais : en moyenne, l’estimateur tombe-t-il sur la vraie valeur du paramètre ?

x efficacité : les valeurs de l’estimateur sont-elles concentrées autour de la moyenne ?

x convergence : la probabilité est-elle forte d’estimer le paramètre correctement ?

x exhaustivité ; l’estimateur extrait-il toute l’information pour la définition et desexdisponible de l’échantillon ?

1.9.1 Biais

Une statistique Θ= T (X1, . . . , Xn) est un estimateur sans biais d’un paramètre θsi, et seulement si,

E [Θ] = θ.

Page 46: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

36 Rappels d’analyse, de probabilité et de statistique

Lorsqu’un estimateur est biaisé, le biais est défini comme

b(θ) = E [Θ]−θ.

De plus, on dit qu’un estimateur est asymptotiquement sans biais si

limn→∞b(θ) = 0.

Enfin, l’erreur quadratique moyenne (MSE) d’un estimateur est définie comme

MSE(Θ) = E [Θ−θ)2] = b(θ)2 +Var[Θ].

Exemple 1.18. Soit X1, . . . , Xn un échantillon aléatoire issu d’une loi exponentielletranslatée avec fonction de densité de probabilité

f (x;µ) = e−(x−µ), x >µ.

On cherche un estimateur sans biais pour µ. Essayons d’abord avec X . Pour faciliterles calculs, définissons toutefois d’abord la variable aléatoire X = µ+Y , où Y ∼Exponentielle(1). Ainsi,

E [X ] =µ+E [Y ]

=µ+1

et par conséquent

E [X ] = E [X ] =µ+1.

La moyenne de l’échantillon est donc un estimateur biaisé de µ. Par contre, X −1est un estimateur sans biais.

Intuitivement, X(1) = min(X1, . . . , Xn) devrait aussi constituer un estimateurraisonnable de µ. Or, par le résultat de la sous-section 1.8.2, on a fY(1) (y) = ne−ny etdonc Y(1) ∼ Exponentielle(n) ⇒ E [Y(1)] = n−1. Par conséquent,

E [X(1)] =µ+E [Y(1)]

=µ+ 1

n.

Le minimum est donc un estimateur biaisé, mais asymptotiquement sans biais duparamètre µ d’une loi exponentielle translatée.

Page 47: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

1.9. Estimation : introduction et propriétés 37

Exemple 1.19. Puisque

nS2

σ2 ∼χ2(n −1)

on a que

E

[nS2

σ2

]= n −1

et donc

E [S2] = n −1

nσ2,

d’où S2 est un estimateur biaisé de σ2. Le biais est −σ2/n, donc S2 tend à sousestimer la variance de la population. Puisque ce biais tend vers zéro quand n →∞,S2 est asymptotiquement sans biais pour σ2.

En revanche,

S2 = n

n −1S2

= 1

n −1

n∑i=1

(Xi − X )2

est un estimateur sans biais de σ2.

La propriété d’absence de biais est souvent une sorte de «condition mini-male» à rencontrer au moment de choisir un estimateur. Il faut toutefois demeurerconscient des limitations suivantes :

1. La propriété d’absence de biais est généralement perdue lors d’une transfor-mation, c’est-à-dire que si Θ est un estimateur sans biais de θ, il n’y a pas degarantie que g (Θ) sera sans biais pour g (θ). Par exemple, S2 est sans biais pourσ2, mais S est biaisé pour σ.

2. Comme on a pu le voir en partie à l’exemple 1.18, il existe une multitude d’esti-mateurs sans biais d’un paramètre θ. Quel estimateur choisir alors ?

3. Il peut exister un meilleur estimateur biaisé, c’est-à-dire un estimateur qui, bienque biaisé, a une plus petite variance.

Page 48: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

38 Rappels d’analyse, de probabilité et de statistique

1.9.2 Efficacité

Entre deux estimateurs Θ1 et Θ2 d’un paramètre θ, on préférera généralementl’estimateur ayant la plus faible variance. Le théorème suivant donne une borneinférieure pour la variance d’un estimateur sans biais.

Théorème 1.17 (Borne, ou inégalité, de Rao–Cramér). Soit X1, . . . , Xn un échan-tillon aléatoire d’une distribution f (x;θ) dont le domaine de définition ne dépendpas de θ, et soit Θ un estimateur sans biais de θ. Alors,

Var[Θ] ≥ 1

nE[( ∂∂θ

ln f (X ))2] .

Définition 1.5 (Estimateur efficace). Un estimateur sans biais Θ de θ est dit efficacesi, et seulement si, sa variance atteint la borne de Rao–Cramér.

Définition 1.6 (Efficacité et efficacité relative). L’efficacité d’un estimateur Θ estle ratio entre la borne de Rao–Cramér et la variance de l’estimateur. On définitégalement l’efficacité relative de deux estimateurs Θ1 et Θ2 par

Var[Θ1]

Var[Θ2].

Remarques.

1. Lorsque la variance d’un estimateur atteint la borne de Rao–Cramér, on ditqu’il s’agit d’un estimateur sans biais à variance (uniformément) minimale(ENBAVUM, BLUE en anglais).

2. Le dénominateur de la borne de Rao-Cramér,

I (θ) = nE[( ∂∂θ

ln f (X ))2]

est appelé l’information (de Fisher) de l’échantillon.

3. Selon la forme de f (x;θ), il est souvent plus simple de calculer la borne deRao–Cramér avec

Var[Θ] ≥ 1

−nE[ ∂2

∂θ2 ln f (X )] .

Page 49: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

1.9. Estimation : introduction et propriétés 39

1.9.3 Convergence

La convergence est une propriété asymptotique assurant que la probabilité est«grande» que Θ estime θ correctement.

Définition 1.7 (Estimateur convergent). La statistique Θ = T (X1, . . . , Xn) est unestimateur convergent (consistent) de θ si, et seulement si,

limn→∞Pr[|Θ−θ| < ε] = 1

pour tout ε> 0.

Remarque. La manière la plus simple de prouver la convergence d’un estimateurest la suivante : si Θ est sans biais pour θ et que

limn→∞Var[Θ] = 0,

alors par l’inégalité de Chebyshev, Θ est convergent. En effet, E [Θ] = θ et donc

Pr[|Θ−θ| ≥ ε] ≤ Var[Θ]

ε2 ,

d’où limn→∞ Var[Θ] = 0 ⇒ limn→∞ Pr[|Θ−θ| ≥ ε] = 0.

1.9.4 Exhaustivité

On peut omettre cette section lors d’une première lecture. Son contenu est placé ici à titre deréférence.

Une statistique Θ= T (X1, . . . , Xn) est un estimateur exhaustif (sufficient) de θsi elle résume toute l’information nécessaire à l’estimation de θ contenue dansl’échantillon aléatoire X1, . . . , Xn .

Définition 1.8 (Statistique exhaustive). Soit X1, . . . , Xn un échantillon aléatoired’une distribution f (x;θ). Soit Y = T (X1, . . . , Xn) une statistique dont la fonctionde densité de probabilité est g (y ;θ). Alors Y est une statistique exhaustive pour θsi, et seulement si,

f (x1, . . . , xn ;θ)

g (t (x1, . . . , xn);θ)= h(x1, . . . , xn)

ne dépend pas de θ.

La définition 1.8 signifie qu’une fois la valeur de la statistique connue, la distri-bution de X1, . . . , Xn ne dépend plus de θ et donc qu’il ne subsiste dans l’échantillonplus aucune information sur θ.

La propriété d’exhaustivité est habituellement démontrée avec le théorème defactorisation.

Page 50: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

40 Rappels d’analyse, de probabilité et de statistique

Théorème 1.18 (Théorème de factorisation). Soit X1, . . . , Xn un échantillon aléa-toire d’une distribution f (x;θ). Soit Y = T (X1, . . . , Xn) une statistique dont la fonc-tion de densité de probabilité est g (y ;θ). Alors Y est une statistique exhaustive pourθ si, et seulement si, on peut trouver deux fonctions non négatives u et v tel que

f (x1, . . . , xn ;θ) = u(t (x1, . . . , xn);θ)v(x1, . . . , xn).

Exemple 1.20. Soit X ∼ Bêta(θ,1), c’est-à-dire

f (x;θ) = Γ(θ+1)

Γ(θ)xθ−1

= θxθ−1, 0 < x < 1,θ > 0.

On démontre que∏n

i=1 Xi est une statistique exhaustive pour θ. En effet, on a

f (x1, . . . , xn ;θ) =n∏

i=1θxθ−1

= θn(x1x2 · · ·xn)θ−1

= θn(x1x2 · · ·xn)θ1

x1x2 · · ·xn

= u(y ;θ) v(x1, . . . , xn),

où y = ∏ni=1 xi , u(y ;θ) = θn yθ et v(x1, . . . , xn) = (x1x2 · · ·xn)−1. Par le théorème de

factorisation, Y =∏ni=1 Xi est donc une statistique exhaustive pour θ.

1.10 Estimation : méthodes

On se tourne maintenant vers l’étude de méthodes pour développer des esti-mateurs du ou des paramètres d’une distribution.

1.10.1 Méthode des moments

La méthode des moments est la plus simple et intuitive technique d’estimationet parfois la seule vraiment disponible.

L’idée est très simple : égaler les moments de la population (moments «théo-riques») aux moments empiriques. Le ke moment empirique d’un échantillonx1, . . . , xn est

mk = 1

n

n∑i=1

xki .

Si la distribution de la population compte r paramètres à estimer, on résoutdonc le système à r équations

mk = E [X k ], k = 1, . . . ,r.

Page 51: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

1.10. Estimation : méthodes 41

1.10.2 Méthode du maximum de vraisemblance

La très puissante et populaire méthode du maximum de vraisemblance a étéproposée par R. A. Fisher. Les estimateurs du maximum de vraisemblance (EMV)jouissent de plusieurs belles propriétés :

x exhaustifs (lorsqu’ils existent) ;

x asymptotiquement sans biais et à variance minimale.

L’idée consiste ici à choisir les paramètres de la distribution de façon à maximi-ser la probabilité d’observer l’échantillon donné.

Définition 1.9 (Fonction de vraisemblance). Si x1, . . . , xn sont les observations d’unéchantillon aléatoire X1, . . . , Xn issu d’une distribution f (x;θ), alors la fonction devraisemblance de l’échantillon est

L(θ) = f (x1, . . . , xn ;θ)

=n∏

i=1f (xi ;θ)

pour des valeurs de θ sur le domaine adéquat.

L’estimateur du maximum de vraisemblance maximise donc L(θ) ou, de ma-nière équivalente, la log-vraisemblance

l (θ) = lnL(θ).

Exemple 1.21. Soit la loi exponentielle de densité

f (x) = θe−θx , x > 0.

La fonction de vraisemblance d’un échantillon aléatoire tiré de cette loi est

L(θ) =n∏

i=1θeθxi

= θne−θ∑n

i=1 xi

et la fonction de log-vraisemblance est

l (θ) = n lnθ−θn∑

i=1xi ,

d’où

d

dθl (θ) = n

θ−

n∑i=1

xi .

Page 52: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

42 Rappels d’analyse, de probabilité et de statistique

En égalant la dérivée à zéro et en résolvant pour θ, on trouve

θ = n∑ni=1 xi

= 1

x.

Par conséquent, l’EMV du paramètre θ est

Θ= 1

X.

On remarque que :

1. Puisque∑n

i=1 Xi ∼ Gamma(n,θ), alors Θ= X ∼ Gamma(n,nθ), d’où

E [Θ] = nθ

n −1= n

n −1θ

Var[Θ] = n2θ2

(n −1)2(n −2).

Par conséquent,

x Θ est asymptotiquement sans biais ;

x limn→∞ Var[Θ] = 0, donc Θ est convergent.

En fait, pour tous les cas intéressants l’EMV est un estimateur convergent.

2. Il est facile de vérifier que la borne de Rao–Cramér est θ2/n. Par conséquent

Efficacité(Θ) = n3

(n −1)2(n −2)

et donc, par une application de la règle de l’Hôpital,

limn→∞Efficacité(Θ) = 1,

d’où l’EMV est asymptotiquement l’ENBAVUM de θ.

1.11 Propriétés de l’estimateur du maximum devraisemblance

En plus d’être convergent et asymptotiquement sans biais, l’EMV possèdeplusieurs «belles» propriétés qui en font un choix populaire pour l’estimation deparamètres.

Page 53: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

1.12. Estimation par intervalles, ou intervalles de confiance 43

1.11.1 Invariance

Si Θ est l’EMV du paramètre θ, alors g (Θ) est l’EMV de g (θ), où g est unefonction quelconque. Cette propriété fait par exemple en sorte que l’EMV de l’écarttype est simplement la racine carrée de l’EMV de la variance.

1.11.2 Exhaustivité

Soit X1, . . . , Xn un échantillon aléatoire d’une fonction de densité de probabilitéf (x;θ). S’il existe

x une statistique exhaustive T (X1, . . . , Xn) pour θ

x un estimateur du maximum de vraisemblance unique Θ pour θ,

alors Θ est une fonction de la statistique exhaustive T (X1, . . . , Xn).

1.11.3 Efficacité

Sous des hypothèses de régularité, on a

Θ∼ N (θ, I (θ)−1)

quand n →∞. Par conséquent, l’EMV est asymptotiquement sans biais et efficace.De plus, si un estimateur efficace existe pour θ, alors cet estimateur est l’EMV.

1.12 Estimation par intervalles, ou intervalles deconfiance

Un estimateur ponctuel d’un paramètre ne nous donne pas toute l’informationsur un paramètre. Par exemple :

x quelle est la taille de l’échantillon sur lequel est basée l’estimation ?

x quelle est l’erreur possible dans l’estimation ?

Avec la réponse à la première question, l’estimation par intervalles permet derépondre à la seconde.

L’exemple classique d’une estimation par intervalle — ou d’un intervalle deconfiance — est le résultat d’un sondage :

«Le parti Untel recueille 42 % des intentions de vote pour la prochaineélection. On a interrogé pour ce sondage 1011 personnes ; la marged’erreur est de 3 %, 19 fois sur 20.»

Page 54: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

44 Rappels d’analyse, de probabilité et de statistique

En termes mathématiques (peu rigoureux), cette phrase dit que, si θ représente leniveau d’appui du parti Untel au soir de l’élection,

Pr[0,39 < θ < 0.45] = 0,95,

avec n = 1011 et θ = 0,42.De manière générale, un intervalle de confiance a la forme suivante :

Pr[T1(X1, . . . , Xn) < θ < T2(X1, . . . , Xn)] = 1−α,

où T1(X1, . . . , Xn) et T2(X1, . . . , Xn) sont des statistiques et 1−α est le niveau deconfiance de l’intervalle. La chose importante à remarquer ici est que ce sont lesbornes de l’intervalles qui sont les variables aléatoires dans l’expression ci-dessus.

La construction d’un intervalle de confiance n’est en général pas très compli-quée :

x choisir une statistique selon le paramètre à estimer (X pour la moyenne, S2 pourla variance) ;

x si la distribution de la statistique est symétrique autour de θ, construire unintervalle symétrique ;

x sinon, essayer de minimiser la longueur de l’intervalle (pas toujours fait enpratique, ou l’on opte plutôt pour la simplicité de calcul) ;

x si n est grand, utiliser le Théorème central limite.

Exemple 1.22. Lors de l’étude d’un groupe témoin atteint d’une maladie grave, ona observé que 136 des 400 personnes faisant partie du groupe sont décédées aucours de l’année suivant le diagnostic de la maladie. En supposant la probabilité dedécès sur un horizon d’un an identique d’une personne à l’autre, on cherche unintervalle de confiance à 95 % pour la taux de morbidité dans ce groupe, c’est-à-direpour le paramètre θ d’une loi Binomiale(n,θ). Posons donc X ∼ Binomiale(n,θ),où X représente alors le nombre de personnes décédant dans l’année.

Lorsque n est petit, il est relativement compliqué (il n’existe pas de solutionexplicite) de trouver un intervalle de confiance de niveau 1−α pour θ. Pour n grand,cependant, on peut utiliser le Théorème central limite : quand n →∞,

X ∼ N (nθ,nθ(1−θ)).

Par conséquent,

Pr

[zα/2 < X −nθp

nθ(1−θ)< zα/2

]= 1−α

Page 55: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

1.13. Tests d’hypothèses 45

ou, de manière équivalente,

Pr

X

n− zα/2

√θ(1−θ)

n< θ < X

n+ zα/2

√θ(1−θ)

n

= 1−α.

Afin de pouvoir obtenir simplement des valeurs numériques pour les bornesinférieure et supérieure de l’intervalle de confiance pour θ, on remplace ce para-mètre dans les racines carrées par son estimateur du maximum de vraisemblance,Θ= X /n. Un intervalle de confiance approximatif de niveau 1−α est doncΘ− zα/2

√Θ(1− Θ)

n,Θ+ zα/2

√Θ(1− Θ)

n,

.

Dans cet exemple où n = 400 est grand, on peut utiliser l’approximation ci-dessus. On a donc 1−α= 0,95 ⇒ z0,025 = 1,96 et x = 136, d’où

0,34−1,96

√(0,34)(0,66)

400< θ < 0,34+1,96

√(0,34)(0,66)

400

m0,294 < θ < 0,386

avec approximativement une probabilité de 95 %. Exprimé autrement, la probabi-lité de décès est de 0,34±0,046, 19 fois sur 20.

1.13 Tests d’hypothèses

Reprenons le contexte de l’exemple 1.22, à savoir que 136 des 400 personnesatteintes d’une maladie grave décèdent dans l’année suivant le diagnostic de lamaladie, soit une proportion de θ = 0,34. Un nouveau médicament que l’on espèreefficace contre la maladie est découvert. Afin d’évaluer si le médicament est effi-cace ou non, celui-ci est administré aux nouveaux cas de la maladie. On voudrapar la suite comparer la nouvelle proportion de décès avec celle observée avantl’utilisation du médicament.

En termes plus mathématiques, on voudra tester si θ < 0,34 chez les gens ayantpris le nouveau médicament. On formule donc deux hypothèses statistiques :

H0 : θ = 0,34 (le médicament est inefficace)

H1 : θ < 0,34 (le médicament est efficace).

Page 56: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

46 Rappels d’analyse, de probabilité et de statistique

L’hypothèse H0 est appelée l’hypothèse nulle, alors que H1 est l’hypothèse al-ternative. L’hypothèse H0 est dite simple parce qu’elle spécifie entièrement la dis-tribution, alors que H1 est composée puisqu’elle ne spécifie qu’une partie de ladistribution. En général H0 est simple et H1 est composée, comme c’est le cas ici,mais toutes les combinaisons sont possibles.

Le but principal d’un test d’hypothèse consiste à définir un ensemble de règlespour décider si l’on doit accepter ou rejeter H0.

Remarque. Formellement, on n’«accepte» pas l’hypothèse nulle H0. On dit plutôtqu’étant donné les observations recueillies, on ne la «rejette pas».

Il est décidé que si la proportion de décès dans l’année suivant le diagnostic dela maladie et la prise du nouveau médicament est de 0,30 ou moins, le médicamentsera jugé efficace. On a ainsi défini une région critique. Si la valeur de la statistiquecalculée à partir d’un échantillon tombe dans la région critique, on rejette H0.

Cette règle a des conséquences. Si θ ≤ 0,30, on déclarera le médicament efficace(rejet de H0), mais ce pourrait être à tort. On appelle erreur de type I le fait derejeter H0 quand elle est vraie. La probabilité de faire une telle erreur est le seuil designification α d’un test :

α= Pr[faire une erreur de type I]

= Pr[rejeter H0 alors qu’elle est vraie].

Comme dans la théorie des intervalles de confiance, 1−α représente le niveau deconfiance du test. Dans l’exemple sous étude,

α= Pr[Θ≤ 0,30;θ = 0,34],

où Θ= X /n et X est le nombre de décès. Si n est grand, alors approximativement

Θ∼ N

(θ,θ(1−θ)

n

).

Ainsi, pour n = 400,

α≈ Pr

[Z ≤ 0,3−0,34p

(0,34)(0.66)/400

]= 0,046,

où Z ∼ N (0,1).Inversement, si θ > 0,30 on ne rejettera pas H0. Le médicament sera jugé ineffi-

cace, alors qu’il peut l’être. Le fait de ne pas rejeter l’hypothèse H0 alors qu’elle estfausse est appelé une erreur de type II. Cette probabilité est notée β :

β= Pr[faire une erreur de type II]

= Pr[ne pas rejeter H0 alors qu’elle est fausse].

Page 57: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

1.13. Tests d’hypothèses 47

Puisque l’hypothèse alternative est composite dans cet exemple, la probabilité defaire une erreur de type II est une fonction de θ :

β(θ) = Pr

[X

n> 0,30;θ,θ < 0,34

].

En suivant la même procédure que ci-dessus, on trouve par exemple β(0,20) ≈ 0,β(0,30) = 0,5 et β(0,33) = 0,90.

On constate donc qu’avec la région critique choisie (θ ≤ 0,30), la probabilité dedéclarer le médicament efficace alors qu’il ne l’est pas n’est que de α= 4,6 %. Parcontre, si le médicament réduit la proportion de décès seulement entre 0,30 et 0,34,on voit que la probabilité de le déclarer inefficace alors qu’il l’est est très grande.C’est là une caractéristique des erreurs de type I et II : si on diminue la probabilitéde l’une, on augmente la probabilité de l’autre. La seule façon de diminuer les deuxprobabilités simultanément consiste à augmenter la taille de l’échantillon.

À un seuil de signification α= 0,046 correspond une région critique θ < 0,30.Supposons que l’on observe θ = 0,28. Quel seuil de signification correspond à cettevaleur, si n = 400 ? On a

Pr[Θ≤ 0,28;θ = 0,34] ≈ Pr

[Z ≤ 0,28−0,34p

(0,34)(0,66)/400

]= 0,0057.

Cette valeur est appelée la valeur p du test, et elle représente le seuil de significationmaximal auquel on peut rejeter H0 étant donné la valeur de la statistique obtenueavec un échantillon. Autrement dit, étant donné θ = 0,28, on serait prêt à rejeter H0

avec un niveau de confiance d’au moins 99,43 %.La valeur p doit-elle être grande ou petite ? Cela dépend si l’on souhaite ou non

rejeter l’hypothèse nulle ! Par exemple, si

H0 : ajustement d’un modèle à des données est bon

H1 : ajustement n’est pas bon,

alors on cherchera à avoir une valeur p très grande, de façon à ne pas rejeter H0.Par contre, dans une situation où

H0 : droite de régression n’explique pas les données

H1 : droite de régression explique les données,

on souhaitera habituellement rejeter H0, alors la valeur p devrait être petite pourune statistique donnée.

Page 58: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

48 Rappels d’analyse, de probabilité et de statistique

Remarque. Il est plus facile de se rappeler de la signification de la valeur p ainsi :1−p est le niveau de confiance avec lequel on peut rejeter l’hypothèse nulle H0.

Un test d’hypothèse compte toujours quatre grandes étapes :

1. Formuler H0 et H1 et fixer le seuil de signification α (habituellement 0,10, 0,05ou 0,01).

2. À partir de la distribution de la statistique de test appropriée (en général celleutilisée pour construire un intervalle de confiance), déterminer la région critiqueC de niveau α.

3. Calculer la valeur de la statistique de test pour l’échantillon aléatoire disponible.

4. Vérifier si la valeur de la statistique de test tombe dans la région critique. Si oui,rejeter H0. Sinon, ne pas rejeter H0.

Un intervalle de confiance est en fait un ensemble de tests. Il est donc tout à faitéquivalent de faire un test d’hypothèse et de construire un intervalle de confiancepour ensuite vérifier si la valeur cible se trouve à l’intérieur de l’intervalle ou non.

Page 59: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

1.14. Exercices 49

1.14 Exercices

1.1 On a l’inégalité1

2− x2

24< 1−cos(x)

x2 < 1

2

vraie pour toutes valeurs de x près de 0. Calculer

limx→0

1−cos(x)

x2

et faire le graphique de la fonction et des deux bornes pour −2 ≤ x ≤ 2.

1.2 Calculer

limx→0

x

ln(x +1).

1.3 Calculer limx→0(1+x)1/x .

1.4 a) Déterminer laquelle des expressions, x ou ln(x), tend la plus rapidementvers l’infini lorsque x tend vers l’infini.

b) Répéter la partie a) avec x et ex .

1.5 Il faut parfois élargir l’ensemble des nombres réels à celui des nombres com-plexes. Un nombre complexe z se présente souvent sous la forme d’une somme

z = a +bi

où a et b sont des nombres réels et i est un nombre imaginaire particulier telque

i 2 =−1.

De là, il découle que

i 3 = (i 2)(i )

= (−1)(i )

=−i

i 4 = (i 2)(i 2)

= (−1)(−1)

= 1

i 5 = i

i 6 =−1

Page 60: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

50 Rappels d’analyse, de probabilité et de statistique

et ainsi de suite. À partir du développement connu de ex ,

ex = 1+x + x2

2!+ x3

3!+ x4

4!+ . . . ,

démontrer l’identité d’Euler e iπ =−1 en suivant les étapes suivantes.

a) Développer autour de c = 0 la fonction f (x) = cos(x).

b) Développer autour de c = 0 la fonction f (x) = sin(x).

c) Développer, en remplaçant x par i x la fonction f (x) = e i x .

d) Démontrer l’identité e i x = cos(x)+ i sin(x).

e) Démontrer l’identité e iπ =−1.

1.6 Soit la fonction

F (x) = 1

1+e−x −∞< x <∞.

Démontrer qu’il s’agit d’une fonction de répartition.

1.7 Soit X , une variable aléatoire continue avec fonction de densité f (x) et fonc-tion de répartition F (x). On choisit une valeur quelconque x0 et on définit lafonction

g (x) = f (x)

1−F (x0) , x ≥ x0

0, x < x0.

On suppose que F (x0) < 1. Démontrer que g (x) est une densité de probabilité.

1.8 Soit X , une variable aléatoire avec une distribution de Pareto(α,λ) :

f (x) = αλα

(x +λ)α+1 , x > 0,α> 0,λ> 0.

Calculer la fonction de survie S(x) = 1−F (x) et en faire le graphique pour α= 2et λ= 3000.

1.9 Soit X , une variable aléatoire avec une distribution Binomiale(n, p), c’est-à-dire que

Pr[X = x] =(

n

x

)px (1−p)n−x , x = 0,1, . . . .

Déterminer la distribution de la variable aléatoire Y = n −X .

1.10 Soit X ∼ N (µ,σ2). La variable aléatoire Y = e X est distribuée selon la loilog-normale.

Page 61: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

1.14. Exercices 51

a) Exprimer la fonction de densité de probabilité et la fonction de répartitionde Y en fonction de celles de X .

b) Calculer Var[Y ].

1.11 La distribution de Cauchy a comme fonction de densité de probabilité

f (x) = 1

π

1

1+x2 , −∞< x <∞.

Démontrer que l’espérance de cette distribution n’existe pas, c’est-à-dire queE [|X |] =∞.

1.12 Soit X , une variable aléatoire avec densité Poisson(λ) et soit g (x), une fonctiontelle que −∞< E [g (X )] <∞ et −∞< g (−1) <∞. Démontrer que E [λg (X )] =E [X g (X −1)].

1.13 Soient X et Y , deux variables aléatoires continues. On définit

M = max(X ,Y )

m = min(X ,Y ).

Démontrer que E [M ] = E [X ]+E [Y ]−E [m].

1.14 Soit X , une variable aléatoire avec densité

fX (x) = 7e−7x , 0 < x <∞,

et soit Y = 4X +3. Calculer la densité de Y en utilisant la technique de lafonction de répartition.

1.15 Soit X , une variable aléatoire avec densité

fX (x) = x2/9, 0 < x < 3.

Trouver la fonction de densité de probabilité de Y = X 3.

1.16 Soit X , une variable aléatoire avec distribution N (0,σ2). Trouver la distribu-tion de Y = X 2.

1.17 Pour une densité quelconque, démontrer que si la densité est symétrique parrapport à un point a, alors le coefficient d’asymétrie est 0.

1.18 Soit X , une variable aléatoire avec densité

f (x) = e−x , x > 0.

Calculer son coefficient d’asymétrie.

Page 62: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

52 Rappels d’analyse, de probabilité et de statistique

1.19 Soit X , une variable aléatoire avec densité

f (x) = 1

2, −1 < x < 1.

Calculer son coefficient d’aplatissement et commenter.

1.20 Déterminer la fonction génératrice des moments de la densité

f (x) = 2x

c2 , 0 < x < c.

1.21 Soit X1 et X2 les moyennes de deux échantillons aléatoires indépendants detaille n d’une population avec variance σ2, trouver une valeur de n telle que

Pr[|X1 − X2| < σ

5

]≈ 0,99.

1.22 Soit X la moyenne d’un échantillon de taille 100 issu d’une loi χ2(50).

a) Trouver la distribution exacte de X .

b) Calculer à l’aide d’un logiciel statistique la valeur exacte de Pr[49 < X < 51].

c) Calculer une valeur approximative de la probabilité en b).

1.23 Soit Θ, un estimateur de la variance d’une loi de Pareto(3,1000). Sachant queE [Θ] = 749500 et que Var[Θ] = 750, trouver le biais et l’erreur quadratiquemoyenne de Θ.

1.24 Soit X1, . . . , Xn , un échantillon aléatoire d’une population avec moyenne µ etvariance σ2.

a) Démontrer que l’estimateur T (X ) =∑ni=1 ai Xi est un estimateur sans biais

de µ si∑n

i=1 ai = 1.

b) On nomme les estimateurs de la forme en a) des estimateurs sans biaislinéaires. Parmi ceux-ci, trouver celui avec la plus petite variance.

1.25 Soit X1, . . . , Xn un échantillon aléatoire d’une distribution avec moyenne µ etvariance σ2. Démontrer que n−1 ∑n

i=1(Xi −µ)2 est un estimateur sans biais deσ2.

1.26 Soit X , une observation d’une population dont la densité est

f (x;θ) =(θ

2

)|x|(1−θ)1−|x|, x =−1,0,1; 0 ≤ θ ≤ 1.

Soit l’estimateur

T (X ) =

2, x = 1

0, ailleurs.

Démontrer que T (X ) est un estimateur sans biais pour θ.

Page 63: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

1.14. Exercices 53

1.27 Soit X ∼ Binomiale(n, p). Démontrer que

nX

n

(1− X

n

)est un estimateur biaisé de la variance de X . Calculer le biais de l’estimateurci-dessus.

1.28 Calculer l’efficacité de X comme estimateur du paramètre λ d’une distribu-tion de Poisson.

1.29 Deux experts tentent d’évaluer le montant des dommages causés par unouragan. La variable aléatoire X représente l’évaluation du premier expert etla variable aléatoire Y représente l’évaluation faite par le second expert. Onsuppose que les deux experts travaillent de façon indépendante. Les donnéessuivantes sont connues : E [X ] = 0,8z, E [Y ] = z, Var[X ] = z2, et Var[Y ] = 1,5z2,où z représente le vrai montant des dommages. On considère une classed’estimateurs pour z de la forme

Z =αX +βY .

Déterminer les valeurs de α et β qui feront de X l’estimateur sans biais àvariance uniformément minimale de z.

1.30 Soit

f (x;θ) = 1

θx(1−θ)/θ, 0 < x < 1,θ > 0.

a) Identifier cette distribution.

b) Démontrer que l’estimateur du maximum de vraisemblance de θ est

θ =− 1

n

n∑i=1

ln Xi .

c) Démontrer que θ est un estimateur sans biais de θ.

Réponses

1.1 12

1.2 1

1.3 e

Page 64: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

54 Rappels d’analyse, de probabilité et de statistique

1.4 a) x plus rapide que ln(x) b) ex plus rapide que x

1.8 S(x) = ( xx+λ

)α1.9 Binomiale(n,1−p)

1.10 a) FY (x) = FX (ln x), fY (x) = x−1 fX (ln x) b) e2µ+σ2(eσ

2 −1)

1.14 fY (y) = 74 e−

74 (y−3), y > 3

1.15 fY (y) = 127 , 0 < y < 27

1.16 Gamma( 12 , 1

2σ−2)

1.18 2

1.19 9/5

1.20 2(ct )−2(ct2tc −e tc +1)

1.21 332

1.22 a) Gamma(2500,50) b) 0,682722 c) 0,6826

1.23 Biais : −500 ; MSE : 250750

1.24 a) X

1.28 1

1.29 α= 0,6122, β= 0,5102.

1.30 a) Bêta(1/θ,1)

Page 65: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

2 Modélisation en assurance IARD

Objectifs du chapitre

x Distinguer les données de sinistres individuelles des données groupées et choisirquel type utiliser selon le contexte.

x Connaître les définitions et l’effet sur les données de sinistres des modificationsde couverture suivantes : franchise forfaitaire, franchise atteinte, limite de police,coassurance, inflation.

x Définir les variables aléatoires du montant payé par sinistre et du montant payépar paiement en présence d’une ou plusieurs des modifications de couverturesci-dessus.

x Calculer des quantités liées aux variables aléatoires pour données modifiées : den-sité, quantiles, moments, moments limités, espérance résiduelle.

x Mesurer l’effet de l’introduction d’une modification de contrat pour l’assureur àl’aide du rapport d’élimination de perte.

x Évaluer l’effet de l’inflation sur la fréquence et la sévérité des sinistres.x Créer, modifier et indicer des données individuelles et des données groupées avec

R.x Créer et utiliser des fonctions R pour calculer la fonction de densité ou la fonction

de répartition d’une variable aléatoire pour données modifiées.

Ce document traite de modélisation en assurance IARD, avec une emphasesur la modélisation des montants de sinistres. Il convient donc de débuter par unecourte discussion du processus de modélisation lui-même.

Nous baserons notre modélisation sur des données historiques de sinistres.Ces données peuvent se présenter sous différentes formes. De plus, les donnéesen assurance IARD ont ceci de particulier que les polices comportent souventune franchise, une limite ou une clause de coassurance. Les montants de sinistressont également soumis à l’inflation. Ce chapitre présente donc les définitionsmathématiques de ces modifications aux contrats d’assurance et il étudie leur effetsur les opérations de l’assureur.

55

Page 66: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

56 Modélisation en assurance IARD

2.1 Processus de modélisation

Un modèle est une description plus ou moins simplifiée d’une réalité. Le mo-dèles actuariels peuvent être de plusieurs types :

x coûts des réparation après incendie d’une maison ;

x fréquence des accidents automobiles ;

x décès de personnes dans une population ;

x coûts pour la couverture pour médicament ; ou

x garantie de rendement d’un fonds, etc.

Le modèle permet de prévoir les coûts futurs d’un système d’assurance et de mesu-rer le risque relatif à ces prévisions. En réalisant la modélisation, il faut toutefoistrouver un certain équilibre entre simplicité et vraisemblance du modèle.

Le processus de modélisation compte les étapes suivantes :

1. trouver un modèle (sous forme paramétrique ou non) décrivant «bien» les don-nées disponibles ;

2. calibrer le modèle, par exemple en estimant ses paramètres ;

3. valider le modèle, par exemple en mesurant l’ajustement à l’aide de tests statis-tiques ;

4. au besoin, répéter les étapes ci-dessus pour un ou plusieurs modèles alternatifs ;

5. choisir un modèle selon un ou des critères déterminés ;

6. adapter le modèle pour utilisation future, pour tenir compte de l’inflation, parexemple.

2.2 Données

Les données en assurance dommages se présentent principalement sous deuxformes :

Individuelles Le montant individuel de chaque sinistre est connu :

141,16,46,40,351.

C’est évidemment la forme la plus répandue, surtout maintenant que l’espacede stockage des données n’est plus tellement un facteur limitatif ;

Groupées Les montants de sinistres individuels sont inconnus. On ne dispose qued’un sommaire du nombre de sinistres par intervalle. Un jeu de donnéesgroupées révèle généralement qu’il y a eu n j sinistres dans l’intervalle decoûts (c j−1,c j ], j = 1, . . . ,r (avec possiblement cr =∞). Par exemple :

Page 67: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

2.2. Données 57

Intervalle Nombre d’observations

(0,25] 30(25,50] 31(50,100] 57(100,150] 42(150,250] 65(250,500] 84

Les données groupées contiennent moins d’information que les donnéesindividuelles, mais elles sont plus compactes à entreposer. Elles sont aujour-d’hui peu utilisées en pratique pour le stockage, mais leur étude demeurepertinente du fait que plusieurs procédures statistiques requièrent un regrou-pement des données individuelles (pensons seulement à l’histogramme).

De plus, les contrats d’assurance IARD comportent souvent différentes modali-tés visant à réduire la charge financière de l’assureur. Par exemple :

x une franchise qui élimine les petites réclamations et permet d’éviter une fré-quence trop élevée de sinistres entraînant beaucoup de frais administratifs ;

x une limite supérieure qui permet à l’assureur de connaître le montant maximalqu’il va payer ;

x une coassurance qui responsabilise l’assuré.

De ce fait, les montants réels des sinistres diffèrent parfois des montants enre-gistrés dans les bases de données de l’assureur. L’assureur doit donc travailler avecdes données incomplètes. On entend par données incomplètes le fait que l’on neconnaît pas la valeur exacte de tous les sinistres survenus ainsi que leur nombre. Ilexiste principalement deux types de données incomplètes :

Tronquées Les observations sous (troncature par le bas) ou au-dessus (troncaturepar le haut) d’un certain seuil sont complètement exclues de l’ensemble desdonnées. Le cas le plus fréquent en assurance est la troncature par le bascausée par une franchise ;

Censurées L’existence d’observations sous (censure par le bas) ou au-dessus (cen-sure par le haut) d’un certain seuil est connue, mais par leurs valeurs exactes.Le cas le plus fréquent en assurance est la censure par le haut causée par unelimite de police.

Soit X la variable aléatoire du montant réel des sinistres et Y celle du montantenregistré dans les bases de données de l’assureur. En modélisant des donnéesincomplètes, l’actuaire a deux choix :

Page 68: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

58 Modélisation en assurance IARD

1. ajuster un modèle à la variable aléatoire Y . Peu utile, surtout si les conditionsdu contrat changent ;

2. utiliser les données de Y pour extrapoler la distribution de X . Plus utile etraisonnable si la franchise est relativement faible ou la limite élevée.

Une description mathématique plus détaillée des différentes modificationspossibles aux contrats sera faite plus loin, mais on présente un premier exempleillustrant l’importance de tenir compte des modalités des contrats dans la modéli-sation des sinistres.

Exemple 2.1. Un assureur a enregistré les dix montants de sinistres suivants :

130,200,260,310,450,500,520,700,700,700.

L’actuaire souhaite modéliser les montants à l’aide d’une variable aléatoire X ayantcomme distribution une loi exponentielle de paramètreλ, c’est-à-dire avec fonctionde densité de probabilité

fX (x) =λe−λx , x > 0.

Une technique d’estimation paramétrique comme la méthode des moments ou laméthode du maximum de vraisemblance (méthodes qui seront présentées dansun chapitre ultérieur) conduit au résultat

λ= 1

x= 1

447.

Il faut maintenant tenter de vérifier de façon simple si le modèle semble conve-nir aux données. On va donc comparer la distribution ajustée, une distributionexponentielle de moyenne 447, avec une représentation intuitive de la densité desdonnées, l’histogramme. La figure 2.1 présente le résultat. La distribution ajustée necorrespond pas très bien à l’histogramme des données. D’une part, la distributionexponentielle est définie sur [0,∞) alors que l’étendue des données empiriques est

> range(x)

[1] 130 700

D’autre part, l’échantillon ne semble pas provenir de la loi ajustée. Comparer àcet effet l’histogramme de la figure 2.1 à ceux de la figure 2.2, créés à partir d’échan-tillons aléatoire de taille 10 tirés d’une distribution exponentielle de moyenne 447.Malgré la petite taille des échantillons, la ressemblance est minime.

Enfin, la présence dans l’échantillon de trois données de même valeur, 700,suggère la présence d’une limite au contrat. En effet, la probabilité d’obtenir, pourle modèle considéré, dix valeurs inférieures ou égales à 700 est

(FX (700))10 = (1−e−700/447)10 = 0,0960.

Page 69: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

2.2. Données 59

Histogram of x

x

Den

sity

0 200 400 600 800 1000

0.00

000.

0010

0.00

200.

0030

FIG. 2.1: Comparaison entre l’histogramme des données et la densité ajustée

Histogram of y

y

Den

sity

0 500 1000 1500 2000 2500

0.00

000.

0004

0.00

080.

0012

Histogram of y

y

Den

sity

0 500 1000 1500 2000

0.00

000.

0004

0.00

080.

0012

Histogram of y

y

Den

sity

0 200 400 600 800 1000

0.00

000.

0010

0.00

20

FIG. 2.2: Histogrammes de trois échantillons tirés d’une loi exponentielle demoyenne 447

Page 70: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

60 Modélisation en assurance IARD

On a donc un modèle qui présente une probabilité de moins de 10 % qu’un casaussi «extrême» que l’échantillon se présente.

On va maintenant répéter la modélisation des données, mais en tenant comptecette fois de la toute vraisemblable limite de 700 $ au contrat. Pour ce faire, il nefaut plus considérer les montants présentés plus haut comme étant les montantsréels des sinistres, mais comme étant les montants que l’assureur a payés. Soit Y lavariable aléatoire du montant payé par l’assureur. Il s’agit d’une variable aléatoirecensurée par le haut. Dans le cas d’une limite supérieure de 700, on a

Y =

X , X ≤ 700

700, X > 700.

Nous verrons plus loin que la fonction de densité de probabilité de la variablealéatoire Y est

fY (y) =

fX (y), 0 ≤ y < 700

1−FX (700), y = 700

0, y > 700.

=

λe−λy , 0 ≤ y < 700

1−e−700λ, y = 700

0, y > 700.

L’estimation par la méthode du maximum de vraisemblance du paramètre λde cette dernière densité donne

λ= 1

637,51.

Selon le modèle, la proportion de données qui atteignent la limite est donc

fY (700; λ) = 1−e−700/637,51 = 0,3335,

soit une valeur près de celle observée. Si l’on considère maintenant uniquement lesdonnées sous la limite, on obtient l’histogramme et la densité ajustée à la figure 2.3.Le modèle semble déjà mieux représenter les données.

2.3 Importation de données dans R

Les données sont rarement entrées directement au clavier dans R. Pour lesimporter d’une source externe, on utilisera préférablement la fonction scan. Dans

Page 71: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

2.3. Importation de données dans R 61

Histogram of x[x < 700]

x[x < 700]

Den

sity

0 100 200 300 400 500 600 700

0.00

000.

0005

0.00

100.

0015

0.00

200.

0025

FIG. 2.3: Comparaison entre l’histogramme des données sous la limite et la densitécensurée ajustée

son utilisation la plus simple, celle-ci lit un fichier texte dans lequel se trouvent lesdonnées, une par ligne ou séparées par des blancs, en omettant les lignes débutantpar le caractère spécifié dans l’argument comment.char. Le résultat est placé dansun vecteur.

Par exemple, pour importer les données du fichier donnees.txt représenté à lafigure 2.4, on fera simplement 1 :

> x <- scan("donnees.txt", comment.char = "#")

> x

[1] 141 16 46 40 351

Les fonctions de type read.table ou read.csv permettent d’importer desjeux de données plus complexes comptant plusieurs variables. Cependant, il faut

1. Si le fichier ne se trouve pas dans le dossier de travail, il faut préciser le chemin d’accès complet.

Page 72: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

62 Modélisation en assurance IARD

# Les lignes débutant par # sont des commentaires. Les données

# peuvent se trouver à la suite l'une de l'autre ou sur des

# lignes différentes.

141

16

46

40

351

FIG. 2.4: Exemple de fichier de données à importer dans R avec scan()

noter que ces fonctions retournent un data frame. L’indicage et le traitement desdata frames étant plus lent que celui des vecteurs simples, il est recommandé detransformer ses données dans ce dernier format, si possible.

Pour plus d’informations sur l’importation de données dans R, consulter lemanuel R Data Import/Export, distribué avec R et disponible dans le site CRAN.

¸ Consulter le code informatique de la section 2.13 pour des illustra-tions de la création, de l’importation et du traitement des donnéesindividuelles et groupées avec R.

2.4 Variables aléatoires pour données incomplètes

La modélisation de données incomplètes nécessite l’introduction des variablesaléatoires suivantes :

x X : la variable aléatoire du montant réel d’un sinistre.

x Y P : la variable aléatoire du montant payé par paiement par l’assureur. S’il n’ypas de paiement pour un sinistre, la variable aléatoire n’est pas définie (aucunedonnée n’apparaît dans les bases de l’assureur). Normalement, cette variablealéatoire est strictement positive.

x Y S : la variable aléatoire du montant payé par sinistre par l’assureur. S’il n’y pasde paiement pour un sinistre, la variable aléatoire prend une valeur de 0. Elle estdonc définie même si aucun paiement n’est effectué.

Exemple 2.2. Soit un portefeuille de polices d’assurance habitation des franchisesde 1000 $. Ces polices génèrent les montants de sinistres suivants au cours d’une

Page 73: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

2.5. Franchises 63

Variable aléatoire Valeurs

X 750 900 1 200 5 000 10 000Y P 200 4 000 9 000Y S 0 0 200 4 000 9 000

TAB. 2.1: Définitions des variables aléatoires dans l’exemple 2.2

période : 1 200, 5 000, 750, 10 000, 900. Le tableau 2.1 présente les valeurs desvariables aléatoires X , YP et YS .

2.5 Franchises

On distingue deux principales sortes de franchises dans les contrats d’assuranceIARD :

1. Franchise forfaitaire (ou absolue, ordinaire, à déduire ; ordinary deductible) :lorsqu’un sinistre dépasse la franchise, l’assureur ne paie que l’excédent decelle-ci ;

2. Franchise atteinte (franchise deductible en anglais) : lorsqu’un sinistre dépassela franchise, l’assureur paie le sinistre en entier.

On note le montant de la franchise par d .

2.5.1 Franchise forfaitaire

La variable du montant payé par paiement est une troncature par le bas et unetranslation de la variable aléatoire du montant du sinistre, conditionnellement à ceque ce sinistre dépasse la franchise. On a donc

Y P =

X −d , X > d

ou, pour faire ressortir plus clairement la nature conditionnelle de la variablealéatoire Y P :

Y P = X −d |X > d .

Par conséquent,

FY P (x) = Pr[Y P ≤ x]

= Pr[X −d ≤ x|X > d ]

Page 74: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

64 Modélisation en assurance IARD

0 2 4 6 8 10

0.00

0.10

0.20

0.30

x

f X(x

)

(a) sans franchise

0 2 4 6 8 10

0.00

0.10

0.20

0.30

x

f YP(x

)(b) avec franchise

FIG. 2.5: Densité de la distribution du montant payé par paiement sans et avecfranchise forfaitaire. La portion en gras est celle qui est commune aux deux courbes.

= Pr[d < X ≤ x +d ]

Pr[X > d ]

=0, x < 0

FX (x +d)−FX (d)

1−FX (d), x ≥ 0

et, en dérivant,

fY P (x) =0, x < 0

fX (x +d)

1−FX (d), x ≥ 0.

La figure 2.5 montre l’effet d’une franchise forfaitaire sur la densité de Y P . Onvoit que suite à l’introduction de la franchise : 1) une partie de la densité (cellesous la franchise) est supprimée ; 2) la densité est translatée vers la gauche ; 3) lesvaleurs de la densité sont augmentées d’un facteur (1−FX (d))−1 afin que l’aire sousla courbe soit toujours égale à 1.

La variable aléatoire du montant payé par sinistre a ceci de différent qu’elleest définie lorsque qu’un sinistre n’atteint pas la franchise : l’assureur sait qu’unsinistre est survenu, mais il ne paie rien. La définition de la variable aléatoire est

Page 75: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

2.5. Franchises 65

donc

Y S =

0, X ≤ d

X −d , X > d

ou, de manière équivalente,

Y S = max(X −d ,0).

La distribution de Y S est mixte, c’est-à-dire qu’elle est continue pour Y S > 0 etqu’elle a une masse de probabilité égale à Pr[X ≤ d ] en 0. En effet,

FY S (x) = Pr[Y S ≤ x]

=

Pr[X ≤ d ], x = 0

Pr[X ≤ x +d ], x > 0

=

FX (d), x = 0

FX (x +d), x > 0

et

fY S (x) =

FX (d), x = 0

fX (x +d), x > 0.

La figure 2.6 montre l’effet d’une franchise forfaitaire sur la densité de Y S . Cettefois, suite à l’introduction de la franchise : 1) l’aire sous la densité d’origine entre 0et la franchise est maintenant entièrement concentrée en 0 ; 2) la densité au-dessusde la franchise est translatée vers la gauche ; 3) les valeurs de la densité ne sont pasautrement modifiées puisque l’aire totale sous la densité est toujours égale à 1.

Remarque. On a la relation suivante entre les variables aléatoires du montant payépar sinistre et du montant payé par paiement :

Y P = Y S |Y S > 0.

2.5.2 Franchise atteinte

Les variables aléatoires Y P et Y S sont essentiellement les mêmes avec unefranchise atteinte, à l’exception de la translation qui disparaît puisque l’assureurpaie la totalité des sinistres qui dépassent la franchise. On a donc

Y P = X |X > d ,

Page 76: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

66 Modélisation en assurance IARD

0 2 4 6 8 10

0.00

0.10

0.20

0.30

x

f X(x

)

(a) sans franchise

0 2 4 6 8 10

0.00

0.10

0.20

0.30

x

f YS(x

)

(b) avec franchise

FIG. 2.6: Densité de la distribution du montant payé par sinistre sans et avecfranchise forfaitaire

d’où

FY P (x) =0, x < d

FX (x)−FX (d)

1−FX (d), x ≥ d

et

fY P (x) =0, x < d

fX (x)

1−FX (d), x ≥ d .

La figure 2.7 montre l’effet d’une franchise forfaitaire sur la densité de Y P .De même, la définition de la variable aléatoire Y S est maintenant

Y S =

0, X ≤ d

X , X > d .

Il y a toujours une masse à 0, mais la densité est nulle sur (0,d). En effet, L’assureurpeut «payer» un montant de 0, mais jamais un montant entre 0 et le montant de lafranchise. Ainsi,

FY S (x) =

FX (d), x = 0

FX (x), x > d

Page 77: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

2.5. Franchises 67

0 2 4 6 8 10

0.00

0.10

0.20

0.30

x

f X(x

)

(a) sans franchise

0 2 4 6 8 10

0.00

0.10

0.20

0.30

x

f YP(x

)

(b) avec franchise

FIG. 2.7: Densité de la distribution du montant payé par paiement sans et avecfranchise atteinte

et

fY S (x) =

FX (d), x = 0

fX (x), x > d .

On a donc la relationY P = Y S |Y S > d .

La figure 2.8 montre l’effet d’une franchise forfaitaire sur la densité de Y S .La figure 2.9 réunit pour fins de comparaison les densités de Y P et Y S pour les

deux types de franchise.

2.5.3 Fonction coverage

La fonction coverage du package actuar permet d’obtenir facilement les fonc-tions de répartition et fonctions de densité sous diverses combinaisons de modifi-cations de couverture. On donne en argument à la fonction

x fX (·) (si nécessaire) ;

x FX (·) (si nécessaire) ;

x la franchise d ;

Page 78: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

68 Modélisation en assurance IARD

0 2 4 6 8 10

0.00

0.10

0.20

0.30

x

f X(x

)

(a) sans franchise

0 2 4 6 8 10

0.00

0.10

0.20

0.30

x

f YS(x

)

(b) avec franchise

FIG. 2.8: Densité de la distribution du montant payé par sinistre sans et avecfranchise atteinte

x le type de franchise (franchise = FALSE ou franchise = TRUE) ;

x la variable aléatoire modifiée souhaitée (per.loss = FALSE ou per.loss = TRUE)

et la fonction retourne une nouvelle fonction pour calculer fY P (x) ou fY S (x) en toutx.

La fonction permet aussi d’ajouter les modifications suivantes : limite supé-rieure, coassurance, inflation.

¸ Pour des exemples d’utilisation de la fonction coverage, consulter lecode informatique de la section 2.13.

2.6 Espérance limitée

Soit X la variable aléatoire du montant d’un sinistre. On définit X ∧u, la variablealéatoire du montant limité à u :

X ∧u = min(X ,u)

=

X , X < u

u, X ≥ u.

Page 79: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

2.6. Espérance limitée 69

0 2 4 6 8 10

0.00

0.10

0.20

0.30

x

f YP(x

)

(a) Y P , franchise forfaitaire

0 2 4 6 8 10

0.00

0.10

0.20

0.30

x

f YS(x

)

(b) Y S , franchise forfaitaire

0 2 4 6 8 10

0.00

0.10

0.20

0.30

x

f YP(x

)

(c) Y P , franchise atteinte

0 2 4 6 8 10

0.00

0.10

0.20

0.30

x

f YS(x

)

(d) Y S , franchise atteinte

FIG. 2.9: Densités des variables aléatoires Y P et Y S selon le type de franchise

Page 80: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

70 Modélisation en assurance IARD

L’espérance de X ∧u est l’espérance limitée de X (limited expected value, LEV) :

E [X ∧u] ≡ E [X ;u].

Par définition de la variable aléatoire, on a

E [X ;u] =∫ u

0x f (x)d x +u

∫ ∞

uf (x)d x

=∫ u

0x f (x)d x +u(1−F (u)).

De plus,

E [X ;u] =∫ u

0

∫ x

0f (x)d y d x +u(1−F (u))

=∫ u

0

∫ u

yf (x)d x d y +u(1−F (u))

=∫ u

0(F (u)−F (y))d y +u(1−F (u))

= uF (u)−∫ u

0F (x)d x +

∫ u

0d x −uF (u)

=∫ u

0(1−F (x))d x.

Remarque. Ce résultat vaut aussi lorsque u →∞, c’est-à-dire

E [X ] =∫ ∞

0(1−F (x))d x,

à condition que X > 0.

Exemple 2.3. L’espérance limitée à u de la distribution de Pareto avec fonction derépartition

F (x) = 1−(

λ

λ+x

)α, x > 0

et fonction de densité

f (x) = αλα

(λ+x)α+1 , x > 0

Page 81: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

2.6. Espérance limitée 71

est, si α 6= 1,

E [X ;u] =∫ u

0(1−F (x))d x

=∫ u

0

λ+x

)αd x

= λ

α−1

[(λ

x +λ)α−1∣∣∣∣0

u

= λ

α−1

[1−

u +λ)α−1]

.

Exemple 2.4. Soit Y ∼ N (µ,σ2). La distribution de la variable aléatoire X = eY estappelée log-normale de paramètres µ et σ2. On a

FX (x) = Pr[eY ≤ x]

= Pr[Y ≤ ln x]

=Φ(

ln x −µσ

),

oùΦ(·) est la fonction de répartition d’une N (0,1), et

fX (x) = 1

(ln x −µσ

)= 1p

2πσ

1

xexp

− 1

2

(ln x −µσ

)2 .

On a donc

E [X ; x] =∫ x

0x f (y)d y +x(1−F (x))

=∫ x

(ln y −µσ

)d y +x(1−F (x)).

Or, avec le changement de variable z = ln y ,∫ x

0x f (y)d y =

∫ ln x

−∞ezφ

( z −µσ

)d z

= 1p2πσ

∫ ln x

−∞ez exp

− 1

2

( z −µσ

)2 d z

= 1p2πσ

∫ ln x

−∞exp

− z2 −2µz +µ2 −2σ2z

2σ2

d z

Page 82: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

72 Modélisation en assurance IARD

puis, en complétant le carré dans l’exposant,

∫ x

0x f (y)d y = 1p

2πσ

∫ ln x

−∞exp

− (z −µ−σ2)2 −2µσ2 −2σ4

2σ2

d z

= 1p2πσ

∫ ln x

−∞exp

2µσ2 +σ4

2σ2

exp

− 1

2

(z −µ−σ2

σ

)2 d z

= eµ+σ2/2

∫ ln x

−∞φ

(z −µ−σ2

σ

)d z

= eµ+σ2/2Φ

(ln x −µ−σ2

σ

).

Ainsi, on obtient

E [X ; x] = eµ+σ2/2Φ

(ln x −µ−σ2

σ

)+x

[1−Φ

(ln x −µσ

)], x > 0.

Exemple 2.5. Soit Y S le montant payé par sinistre pour une franchise forfaitairede d . Puisque

fY S (y) =

FX (d), y = 0

fX (y +d), y > 0,

on a

E [Y S] = 0×FX (d)+∫ ∞

0y fX (y +d)d y

=∫ ∞

d(x −d) fX (x)d x

=∫ ∞

dx fX (y)d x −d(1−FX (d))

=∫ ∞

0x fX (x)d x −

∫ d

0x fX (x)d x −d(1−FX (d))

= E [X ]−E [X ;d ].

On peut aussi astucieusement procéder ainsi : on a

Y S =

0, X ≤ d

X −d , X > d

Page 83: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

2.7. Espérance résiduelle 73

ou, de manière équivalente,

Y S =

X −X , X ≤ d

X −d , X > d

= X − (X ∧d),

d’où E [Y S] = E [X ]−E [X ;d ].Il est laissé en exercice de vérifier que

E [Y p ] = E [X ]−E [X ;d ]

1−FX (d).

2.7 Espérance résiduelle

L’espérance résiduelle représente l’excédent moyen des valeurs d’une variablealéatoire supérieures à x. En termes de durée de vie, l’espérance résiduelle estappelée espérance de vie future d’un individu d’âge x. Mathématiquement, on a

e(x) = E [X −x|X > x]

=∫ ∞

x(y −x) fX |X>x (y)d y

= 1

1−FX (x)

∫ ∞

x(y −x) fX (y)d y.

Or, tel que vu à l’exemple 2.5 :∫ ∞

x(y −x) fX (y)d y = E [X ]−E [X ; x],

d’où

e(x) = E [X ]−E [X ; x]

1−FX (x).

Toujours de l’exemple 2.5, on a donc que, pour une franchise forfaitaire d ,

E [Y P ] = e(d)

et

E [Y S] = (1−FX (d))e(d).

Pour une franchise atteinte, on remplace simplement e(d) par e(d)+d dans lesexpressions ci-dessus.

Page 84: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

74 Modélisation en assurance IARD

2.8 Rapport d’élimination de perte

Le rapport d’élimination de perte (loss elimination ratio, LER) est une mesure del’efficacité pour l’assureur de l’introduction ou de l’augmentation d’une franchise(et, par extension, de toute autre modification apportée à un contrat).

Le LER est le rapport entre la diminution des coûts espérés suite à une modifi-cation apportée au contrat et les coûts espérés sans celle-ci :

LER = E [diminution des coûts]

E [coûts sans modification]

ou, de manière équivalente,

LER = 1− E [coûts après modification]

E [coûts sans modification].

Exemple 2.6. Soit X la variable aléatoire du montant des sinistres et Y la variablealéatoire du montant des sinistres suite à l’introduction d’une franchise de d . Onsait que E [Y ] = E [X ]−E [X ;d ]. Le rapport d’élimination de perte lié à l’introductionde la franchise est donc

LER = E [X ]−E [Y ]

E [X ]

= E [X ]− (E [X ]−E [X ;d ])

E [X ]

= E [X ;d ]

E [X ].

Exemple 2.7. Les sinistres suivants sont survenus pour un contrat d’assurance :

5,10,15,20.

Si l’assureur introduit une franchise de 10 dans le contrat, il économisera les mon-tants suivants sur chacun des sinistres ci-dessus :

5,10,10,10.

Son rapport d’élimination de perte sera donc

LER = 5+10+10+10

5+10+15+20= 0,70.

Page 85: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

2.8. Rapport d’élimination de perte 75

De manière équivalente, les coûts de l’assureur avec la franchise seront de

0,0,5,10,

d’où

LER = 1− 5+10

5+10+15+20= 0,70.

Exemple 2.8. Soit X ∼ Exponentielle(0,001), de sorte que E [X ] = 1000. On a unefranchise de d = 500. Si l’assureur souhaite doubler son rapport d’élimination deperte, à combien doit-il augmenter sa franchise ?

Le LER pour une franchise de d est

LER = E [X ;d ]

E [X ].

Or, si X ∼ Exponentielle(λ), alors

E [X ;d ] =∫ d

0(1−F (x))d x

=∫ d

0e−λx d x

= 1−e−λu

λ.

Avec λ= 0,001 et d = 500, on a donc

LER = 1000(1−e−0,5)

1000= 0,3935.

Pour doubler ce rapport, on doit trouver la valeur de d tel que

1000(1−e−d/1000)

1000= 0,7870.

En résolvant, on trouve d = 1546.

Page 86: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

76 Modélisation en assurance IARD

2.9 Limite supérieure

En introduisant une limite supérieure dans un contrat d’assurance, un assureurplace un maximum sur le montant qu’il paiera pour un sinistre unique. Commeles variables aléatoires du montant payé par paiement (Y P ) et du montant payépar sinistre (Y S) sont équivalentes dans ce contexte, on notera simplement Y lemontant payé par l’assureur.

L’introduction d’une limite est une censure par le haut de la variable aléatoiredu montant d’un sinistre, X . Soit u la limite supérieure. Alors on a

Y = min(X ,u)

=

X , X ≤ u

u, X > u,

d’où

FY (x) =

Pr[X ≤ x], 0 ≤ x < u

1, x ≥ u,

=

FX (x), 0 ≤ x < u

1, x ≥ u,

et

fY (x) =

fX (x), 0 ≤ x < u

1−FX (u), x = u

0, x > u.

La figure 2.10 montre la fonction de répartition et la fonction de densité d’unevariable aléatoire limitée.

Remarques.

1. La limite est un concept dual de la franchise forfaitaire : l’effet de la franchisesur la variable aléatoire du montant payé par l’assureur est celui d’une limitesur la variable aléatoire du montant reçu par l’assuré.

2. Il n’existe pas, en pratique, de limite analogue à la franchise atteinte : qui achè-terait un contrat qui ne paie rien si un sinistre dépasse la limite ?

Les contrats d’assurance comportent souvent à la fois une franchise forfaitaire det une limite supérieure u. Il importe alors de préciser dans quel ordre s’appliquentles quantités. En général, la limite s’applique avant la franchise :

Page 87: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

2.9. Limite supérieure 77

0 2 4 6 8 10

0.0

0.2

0.4

0.6

0.8

1.0

x

FY(x

)

(a) fonction de répartition

0 2 4 6 8 10

0.00

0.10

0.20

0.30

x

f Y(x

)

(b) fonction de densité

FIG. 2.10: Fonction de répartition et fonction de densité de probabilité de la distri-bution du montant payé par l’assureur avec une limite supérieure

x le sinistre maximal couvert est u ;

x le montant payable maximal est u −d .

La variable aléatoire du montant payé par paiement, Y P , est définie comme

Y P = min(X ,u)−d |X > d

=

X −d , d < X ≤ u

u −d , X > u.

On dit que la variable aléatoire Y P est égale à la variable aléatoire X tronquée versle bas à d , translatée à gauche et censurée par le haut à u. La fonction de répartition

Page 88: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

78 Modélisation en assurance IARD

est

FY p (x) = Pr[min(X ,u) ≤ x +d |X > d ]

= Pr[d < min(X ,u) ≤ x +d ]

Pr[X > d ]

=

FX (x +d)−FX (d)

1−FX (d), 0 ≤ x < u −d

1−FX (d)

1−FX (d), x ≥ u −d

=

FX (x +d)−FX (d)

1−FX (d), 0 ≤ x < u −d

1, x ≥ u −d .

En dérivant, on obtient la densité

fY P (x) =

0, x < 0fX (x +d)

1−FX (d), 0 ≤ x < u −d

1−FX (u)

1−FX (d), x = u −d

0, x > u −d .

La figure 2.11 montre l’effet combiné d’une franchise forfaitaire et d’une limitesur la fonction de répartition de Y P .

La variable aléatoire du montant payé par sinistre, Y S , est

Y S = max(min(X ,u)−d ,0)

=

0, X ≤ d

X −d , d < X ≤ u

u −d , X > u.

On a donc

FY S (x) =

FX (d), x = 0

FX (x +d), 0 < x < u −d

1, x ≥ u −d ,

Page 89: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

2.9. Limite supérieure 79

0 2 4 6 8 10

0.0

0.2

0.4

0.6

0.8

1.0

x

FX(x

)

(a) sans franchise ni limite

0 2 4 6 8 10

0.0

0.2

0.4

0.6

0.8

1.0

x

FY

P(x

)

(b) avec franchise et limite

FIG. 2.11: Fonction de répartition de la distribution du montant payé par paiementsans et avec franchise forfaitaire et limite

et

fY S (x) =

FX (d), x = 0

fX (x +d), 0 < x < u −d

1−FX (u), x = u −d

0, x > u −d .

La figure 2.12 montre l’effet combiné d’une franchise forfaitaire et d’une limitesur la fonction de répartition de Y S .

Exemple 2.9. Soient X la variable aléatoire représentant le montant des sinistres,u = 100, une limite supérieure ajouté au contrat et Y , la variable aléatoire représen-tant le montant payé par l’assureur. On a donc

Y = min(X ,100).

Calculer le rapport d’élimination de perte si les sinistres suivants sont survenus :

50,100,150,200.

Page 90: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

80 Modélisation en assurance IARD

0 2 4 6 8 10

0.0

0.2

0.4

0.6

0.8

1.0

x

FX(x

)

(a) sans franchise ni limite

0 2 4 6 8 10

0.0

0.2

0.4

0.6

0.8

1.0

x

FY

S(x

)(b) avec franchise et limite

FIG. 2.12: Fonction de répartition de la distribution du montant payé par sinistresans et avec franchise forfaitaire et limite

On a

LER = 0+0+50+100

50+100+150+200

= 50+100+150+200

50+100+150+200− 50+100+100+100

50+100+150+200

=50+100+150+200

450+100+150+200

4

−50+100+100+100

450+100+150+200

4

= 1− E [X ;100]

E [X ]

= 0,30.

L’ajout d’une limite supérieure de 100 au contrat permet donc à l’assureur d’élimi-ner 30 % de la charge financière liée à ce contrat.

2.10 Coassurance

Une coassurance α représente la proportion du montant d’un sinistre qui seraassumé par l’assureur :

Y =αX , 0 ≤α≤ 1,

Page 91: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

2.11. Inflation 81

0 2 4 6 8 10

0.0

0.1

0.2

0.3

x

f X(x

)

(a) sans coassurance

0 2 4 6 8 10

0.0

0.1

0.2

0.3

x

f Y(x

)

(b) avec coassurance

FIG. 2.13: Densité de la distribution du montant payé sans et avec coasurance

d’où

fY (x) = 1

αfX

( x

α

).

L’effet de la coassurance est une contraction de la distribution de X . La figure 2.13montre cet effet sur la densité de Y .

De manière générale, la coassurance est appliquée en dernier. Combinée avecune franchise forfaitaire et une limite, on a donc

Y P =α(min(X ,u)−d)|X > d

=α(X −d), d < X ≤ u

α(u −d), X > u.

2.11 Inflation

Les modèles pour les montants de sinistres sont construits à partir d’obser-vations survenues un certain nombre d’années dans le passé. En général, il estnécessaire d’ajuster les modèles obtenus afin de les amener au niveau actuel del’expérience de pertes. De plus, on peut être intéressé à faire une projection dumodèle afin de refléter les sinistres anticipés dans une période future.

Page 92: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

82 Modélisation en assurance IARD

0 200 400 600 800

0.00

00.

001

0.00

20.

003

x

f X(x

)

(a) sans inflation

0 200 400 600 800

0.00

00.

001

0.00

20.

003

x

f Z(x

)(b) avec inflation

FIG. 2.14: Densité de la distribution du montant payé sans et avec inflation

2.11.1 Effet de l’inflation

Soit X , la variable aléatoire représentant le montant d’un sinistre. On cherchela distribution de

Z = (1+ r )X ,

où r ≥ 0 est le taux d’inflation pour la période d’intérêt. (La méthode pour déter-miner r n’est pas étudiée ici.) La variable aléatoire Z est une dilatation de X . Paranalogie avec le cas de la coassurance, on a

FZ (x) = Pr[Z ≤ x]

= Pr[

X ≤ x

1+ r

]= FX

( x

1+ r

)et

fZ (x) = 1

1+ rfX

( x

1+ r

).

La figure 2.14 montre l’effet de l’inflation sur la densité de Z .

Exemple 2.10. On modélise le montant des sinistres par une distribution de Paretode paramètres α= 2 et λ= 100. Si le taux d’inflation est de 5 % par année pendant

Page 93: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

2.11. Inflation 83

trois ans, trouver la probabilité que, dans trois ans, le montant d’un sinistre soitinférieur ou égal à 500 $.

On a X ∼ Pareto(2,100) et Z = (1,05)3X = 1,157625X . Il est laissé en exercice devérifier que Z ∼ Pareto(2,115,7625). Par conséquent,

Pr[Z ≤ 500] = 1−(

115,7625

500+115,7625

)2

= 0,9647.

On pourrait aussi procéder sans trouver la distribution de Z :

Pr[Z ≤ 500] = Pr

[X ≤ 500

1,157625

]= 1−

(100

100+431,9188

)2

= 0,9647.

On peut vérifier le résultat ci-dessus avec R et actuar :

> F <- coverage(cdf = ppareto, inflation = 1.05^3 - 1)

> F(500, 2, 100)

[1] 0.9646565

Exemple 2.11. Un assureur modélise le montant d’un sinistre par une Pareto deparamètres α = 2 et λ = k. Le contrat comporte une franchise de 2k. Calculer lerapport d’élimination de perte avant et après une inflation de 100 %.

Avant l’inflation, on a

LER = E [X ;2k]

E [X ]

=k

2−1

(1−

(k

2k+k

)2−1 )k

2−1

= 2k

2k +k

= 2

3.

Page 94: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

84 Modélisation en assurance IARD

Posons Z = 2X comme étant la variable aléatoire du montant d’un sinistre aprèsinflation. On a Z ∼ Pareto(2,2k) et donc

LER = E [Z ;2k]

E [Z ]

= 2k

2k +2k

= 1

2.

2.11.2 Effet de levier pour une franchise

L’inflation augmente les coûts des sinistres. Si les contrats comportent unefranchise et que celle-ci demeure inchangée, alors l’effet de l’inflation est amplifié :

x la fréquence des sinistres augmente puisque certains sinistres qui ne dépassaientpas la franchise vont maintenant la dépasser ;

x c’est la portion des sinistres en excédent de la franchise qui augmente.

Pour illustrer le second point, considérer le cas suivant : le remboursement pourun sinistre de 600 avec une franchise de 500 est 100 ; après 10 % d’inflation il estmaintenant de 160, une augmentation de 60 %.

Afin de tenir compte à la fois de la fréquence des sinistres et de leur sévérité,nous allons démontrer que la prime pure après inflation est supérieure à la seuleprime pure ajustée pour l’inflation.

Soit un contrat comportant une franchise de d qui demeure fixe d’une année àl’autre. Par contre, les sinistres subissent l’effet d’un taux d’inflation r . Pour le voletsévérité des sinistres, le montant payé par paiement par l’assureur passe de

Y P = X −d |X > d

à

V P = Z −d |Z > d ,

où Z = (1+ r )X . On a donc

V P = (1+ r )X −d |X > d1+r .

On souhaite calculer E [V P ], le coût moyen des sinistres après inflation. On saitque

E [Y S] = E [X ]−E [X ;d ]

Page 95: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

2.11. Inflation 85

et

E [Y p ] = E [X ]−E [X ;d ]

1−FX (d).

Or, en définissant d’abord

V S = max(Z −d ,0)

= Z −min(Z ,d)

= (1+ r )X −min((1+ r )X ,d)

= (1+ r )X − (1+ r )min(X , d1+r )

= (1+ r )(X −min(X , d1+r ))

on trouve immédiatement que

E [V S] = (1+ r )(E [X ]−E [X ; d1+r ])

et, par analogie,

E [V P ] = (1+ r )(E [X ]−E [X ; d1+r ])

1−FX ( d1+r )

.

Tournons-nous maintenant vers le volet fréquence des sinistres. Soit p, l’es-pérance de la fréquence des sinistres. On a alors que p(1−FX (d)) est l’espérancede la fréquence des paiements (la fréquence des sinistres pour lesquels l’assureureffectue un paiement). Après inflation, l’espérance de la fréquence des paiementsdevient

p(1−FZ (d)) = p(1−FX ( d1+r )).

Par conséquent, si la prime pure avant inflation est

π= p(1−FX (d))E [Y P ]

= p(1−FX (d))

(E [X ]−E [X ;d ]

1−FX (d)

)= p(E [X ]−E [X ;d ]),

elle devient, après l’inflation,

π= p(1−FZ (d))E [V P ]

= p(1−FX ( d1+r ))

(1+ r )(E [X ]−E [X ; d1+r ])

1−FX ( d1+r )

= p(1+ r )(E [X ]−E [X ; d1+r ]).

Page 96: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

86 Modélisation en assurance IARD

Or, puisque, pour r > 0,E [X ; d

1+r ] ≤ E [X ;d ],

on a que

π≥ (1+ r )p(E [X ]−E [X ;d ])

et donc

π≥ (1+ r )π.

En résumé, si un contrat d’assurance comporte une franchise et que celle-cidemeure inchangée alors que les sinistres subissent une certaine inflation, la primepure subit une augmentation supérieure au taux d’inflation. C’est l’effet de levierde l’inflation.

On remarquera en terminant que si le montant de la franchise d est ajusté pourdevenir (1+ r )d , la prime pure subit une augmentation égale à l’inflation.

2.11.3 Effet de levier pour une limite supérieure

L’imposition d’une limite supérieure dans un contrat d’assurance protège l’as-sureur contre les effets de l’inflation. En effet, si la limite demeure constante alorsque le coût des sinistres augmente, le résultat net équivaut à abaisser la limite.Intuitivement, l’effet de levier de l’inflation pour une limite supérieure sera à l’avan-tage de l’assureur. Il ne reste qu’à établir que la baisse des coûts sera supérieure àl’inflation.

Clairement, la fréquence des sinistres n’est pas affectée par l’inflation dans uncontrat ne comportant qu’une limite supérieure u. Par contre, le montant payé parpaiement par l’assureur passe de

Y = min(X ,d)

à

V = min(Z ,u)

= min((1+ r )X ,u)

= (1+ r )min(X , u1+r ).

Par conséquent,

E [V ] = (1+ r )E [X ; u1+r ]

≤ (1+ r )E [X ;u],

Page 97: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

2.12. Franchise, limite, coassurance et inflation 87

d’où

E [V ] ≤ (1+ r )E [Y ].

Une limite supérieure a donc un effet modérateur sur la hausse de la primepure lorsque les sinistres augmentent avec l’inflation. Par contre, si le montant dela limite u est ajusté pour devenir (1+ r )u, la prime pure subit une augmentationégale à l’inflation.

2.12 Franchise, limite, coassurance et inflation

On traite ici du cas général où un contrat présente une franchise forfaitaire d ,une limite supérieure u, une coassurance α et un taux d’inflation r . La variablealéatoire du montant payé par sinistre est alors

Y S =αmax(min((1+ r )X ,u)−d ,0)

=

0, X < d

1+r

α((1+ r )X −d), d1+r ≤ X < u

1+r

α(u −d), X ≥ u1+r ,

et celle du montant payé par paiement est

Y P =α[min((1+ r )X ,u)−d ]|X > d1+r

=α((1+ r )X −d), d

1+r ≤ X < u1+r

α(u −d), X ≥ u1+r .

Consulter la vignette "coverage" du package actuar pour les expressions et lesgraphiques des fonctions de répartition et des fonctions de densité de probabilitédes variables aléatoires du montant payé par paiement et du montant payé parsinistre, avec une franchise forfaitaire et une franchise à atteindre, ainsi qu’unelimite.

2.13 Code informatique

###

### DONNÉES INDIVIDUELLES ET GROUPÉES

###

## Le vecteur simple (ou atomique) créé avec la fonction 'c' est encore

Page 98: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

88 Modélisation en assurance IARD

## le meilleur mode de stockage des données individuelles:

x <- c(30, 70, 130, 200, 260, 310, 450, 500, 520, 700, 830, 1070)

## Pour illustrer la procédure d'importation de données individuelles

## avec 'scan', on crée un fichier de données à partir de l'objet 'x'

## ci-dessus, puis on lit ces données avec 'scan' et on les stocke

## dans un nouvel objet.

write(x, "donnees.dat", ncol = 1) # création du fichier

(y <- scan("donnees.dat")) # importation dans y

unlink("donnees.dat") # nettoyage: suppression du fichier

## Pour tronquer (par le bas) les données, il suffit de sélectionner

## les observations au-dessus d'un certain seuil. Pour censurer (par

## le haut), on remplace les données au-dessus d'un seuil par ce

## seuil. La manière la plus simple de procéder est à l'aide de la

## fonction 'pmin'.

x[x > 100] # troncature par le bas à 100

pmin(x, 700) # censure par le haut à 700

pmin(x[x > 100], 700) # les deux modifications

## Le traitement informatique des données groupées nécessite une

## méthode de stockage standard puisqu'il existe plusieurs différentes

## manières de les représenter dans un ordinateur: utiliser une

## matrice ou une liste, apparier les valeurs de n_j avec les c_j

## - 1 ou avec les c_j, omettre ou non la valeur de c_0, etc. Le

## package actuar fournit des outils pour stocker, manipuler et

## résumer les données groupées. Avec des fonctions d'extraction, de

## remplacement et de sommaire spécifiques, la manipulation des

## données groupées se révèle aussi simple que celle des données

## individuelles.

library(actuar) # charger le package

## Création d'un objet contenant des données groupées. On fournit deux

## vecteurs: les bornes des classes et les fréquences dans chaque

## classe. Les classes sont supposées contiguës. Puisqu'il faut

## fournir la borne inférieure de la première classe, le premier

## vecteur compte un élément de plus que le second. Les étiquettes des

## colonnes ("Classe" et "Frequence", ci-dessous) sont arbitraires.

(x <- grouped.data(Classe = c(10, 12, 14, 18, 23),

Frequence = c(3:1, 1)))

## Exemples de manipulations possibles avec de tels objets.

xx <- x # copie de travail

xx[, 1] # bornes des classes

xx[, 2] # fréquences

Page 99: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

2.13. Code informatique 89

xx[c(1, 2), 2] <- c(4, 1); xx # changement de fréquences

xx[1, 1] <- c(9, 13); xx # changement de bornes

###

### FONCTION 'coverage'

###

## La fonction provient du package actuar. Il faut le charger en

## mémoire si ce n'était pas fait précédemment.

library(actuar)

## La fonction 'coverage' retourne une fonction pour calculer la f.r.

## ou la f.d.p. de la variable aléatoire du montant payé par paiement

## ou payé par sinistre modifiée par une franchise (ordinaire ou à

## atteindre), une limite, de la coassurance ou l'inflation.

##

## On examine les quatre combinaisons possibles de variables

## aléatoires et de franchise. On suppose que la variable aléatoire X

## a une distribution gamma. Le montant de la franchise est d = 1.

##

## 1. Montant par paiement et franchise ordinaire (cas par défaut)

f <- coverage(dgamma, pgamma, deductible = 1) # création de l'objet

mode(f) # c'est une fonction

f # code de la fonction

f(0, 3) # calcul en x = 0

f(5, 3) # calcul en x = 5

dgamma(5 + 1, 3)/pgamma(1, 3, lower = FALSE) # idem

curve(dgamma(x, 3), from = 0, to = 10, ylim = c(0, 0.3)) # originale

curve(f(x, 3), from = 0.1, col = "blue", add = TRUE) # modifiée

## 2. Montant par sinistre et franchise ordinaire

f <- coverage(dgamma, pgamma, deductible = 1, per.loss = TRUE)

f(0, 3) # masse à 0

pgamma(1, 3) # idem

curve(dgamma(x, 3), from = 0, to = 10, ylim = c(0, 0.3)) # originale

curve(f(x, 3), from = 0.1, col = "blue", add = TRUE) # modifiée

points(0, f(0, 3), pch = 16, col = "blue") # masse à 0

## 3. Montant par paiement et franchise à atteindre

f <- coverage(dgamma, pgamma, deductible = 1, franchise = TRUE)

f(0, 3) # x = 0

f(0.5, 3) # 0 < x < 1

f(1, 3) # x = 1

f(5, 3) # x > 1

dgamma(5, 3)/pgamma(1, 3, lower = FALSE) # idem

Page 100: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

90 Modélisation en assurance IARD

curve(dgamma(x, 3), from = 0, to = 10, ylim = c(0, 0.3)) # originale

curve(f(x, 3), from = 1.1, col = "blue", add = TRUE) # modifiée

curve(f(x, 3), from = 0, to = 1, col = "blue", add = TRUE) # 0 < x < 1

## 4. Montant par sinistre et franchise à atteindre

f <- coverage(dgamma, pgamma, deductible = 1,

per.loss = TRUE, franchise = TRUE)

f(0, 3) # masse à 0

pgamma(1, 3) # idem

f(0.5, 3) # 0 < x < 1

f(1, 3) # x = 1

f(5, 3) # x > 1

curve(dgamma(x, 3), from = 0, to = 10, ylim = c(0, 0.3)) # originale

curve(f(x, 3), from = 1.1, col = "blue", add = TRUE) # modifiée

points(0, f(0, 3), pch = 16, col = "blue") # masse à 0

curve(f(x, 3), from = 0.1, to = 1, col = "blue", add = TRUE) # 0 < x < 1

## La vignette (fichier PDF) contient les formules générales pour

## toutes les modifications possibles.

vignette("coverage")

2.14 Exercices

2.1 Les montants suivants représentent les coûts associés aux réparations automo-biles de 12 contrats :

579,110,842,213,98,445,1332,162,131,276,312,482.

Les contrats présentent une franchise forfaitaire de 250 $. Calculer le rapportd’élimination de perte (LER) de l’assureur.

2.2 Les montants suivants représentent les coûts associés à des accidents automo-biles pour huit contrats :

86000,123000,423000,43000,213000,28000,52000,178000.

Les contrats présentent une limite supérieure de 100000 $. Calculer le rapportd’élimination de perte de l’assureur.

2.3 Pour un portefeuille dont le montant d’un sinistre obéit à une loi exponentiellede paramètre 0,02, trouver le rapport d’élimination de perte découlant del’introduction des limites de couvertures suivantes.

a) Une franchise atteinte de 10.

b) Une franchise forfaitaire de 10.

Page 101: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

2.14. Exercices 91

2.4 On suppose que le montant d’un sinistre obéit à une distribution gamma deparamètresα= 4 et λ= 0,1. Un assureur a signé un traité avec un réassureur oùce dernier s’engage à payer l’excédent de 100 sur chacun des sinistres. Trouverle rapport d’élimination de perte de l’assureur.

2.5 Dans un groupe d’assurés, les sinistres suivants sont survenus :

20,50,80,80,80,85,90,110,150,240,360,400.

Trouver le rapport d’élimination de perte de l’assureur si celui-ci a instauréune franchise forfaitaire de 70 et s’il limite ses paiements à 200.

2.6 Soit X , la variable aléatoire représentant le montant d’un sinistre. On sait queE [X ] = 2000, que E [X ;30000] = 1640,79 et que le rapport d’élimination deperte de l’assureur pour un contrat avec une franchise forfaitaire de 100 est de0,0465. Trouver le rapport d’élimination de perte de l’assureur pour un contratavec une franchise forfaitaire de 100 et une limite supérieure de 30000.

2.7 Soit X , une variable aléatoire représentant le montant d’un sinistre tel que

fX (x) = e−2x + e−x

2, x > 0.

a) Trouver E [X ;d ].

b) Soit N , une variable aléatoire représentant la fréquence des sinistres. Calcu-ler la prime pure (fréquence moyenne multipliée par la sévérité moyenne)pour une franchise de d = 0,25 et une fréquence moyenne de un sinistretous les 10 ans.

c) Si on observe un taux d’inflation de 5 %, que devient la prime pure ?

2.8 On suppose que le montant d’un sinistre obéit à une loi Pareto de paramètresα= 1,5 et λ= 2500.

a) Calculer le montant moyen des sinistres payé par un assureur pour uncontrat de réassurance avec une rétention de 50000.

b) Trouver le rapport d’élimination de perte pour le réassureur si la rétentionest de 100000.

2.9 Soit Y P la variable aléatoire du montant payé par paiement pour un contratd’assurance avec une franchise forfaitaire de d et X est la variable aléatoire dumontant d’un sinistre. Démontrer que

E [Y P ] = E [X ]−E [X ;d ]

1−FX (d),

où E [X ;d ] = E [min(X ,d)] est l’espérance limitée de X à d . Interpréter le résul-tat.

Page 102: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

92 Modélisation en assurance IARD

2.10 Un assureur décide de modéliser X , la variable aléatoire du montant d’unsinistre, par une distribution Weibull de paramètres τ = 3 et λ = 1/15. Tra-cer (idéalement de manière informatique, à l’aide du package actuar) lesgraphiques des variables aléatoires suivantes.

a) La variable aléatoire du montant payé par sinistre pour un contrat avecune franchise forfaitaire de 10.

b) La variable aléatoire du montant payé par paiement pour une franchiseatteinte de 10 et une limite supérieure de 40.

c) La variable aléatoire du montant du sinistre avec une coassurance de 80 %.

Page 103: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

2.14. Exercices 93

2.11 Un assureur dispose des informations suivantes :

x le montant d’un sinistre pour l’année 1990 obéit à une loi Pareto de para-mètres α= 1,5 et λ= 1500 ;

x un taux d’inflation de 5 % par année a été observé entre 1990 et 1992 et de6 % par année entre 1992 et 1995 ; et

x une franchise de 500 est introduite en 1995.

a) Calculer le rapport d’élimination de perte pour l’assureur en 1995.

b) L’assureur paie un sinistre en 1995. Déterminer la probabilité qu’il paieplus de 2000 $

c) Déterminer la charge espérée par sinistre de l’assureur s’il avait décidé en1995 de ne pas payer plus de 3500 $ par sinistre (en plus de la franchise de500 $).

2.12 Le tableau ci-dessous présente, sous forme groupée, les montants payés parsinistre pour des sinistres en assurance habitation couverts par des contratsayant une limite supérieure de 300000 $.

Montant payé Nombre Montant moyen

0 – 2 500 41 13892 500 – 7 500 48 4661

7 500 – 12 500 24 999112 500 – 17 500 18 1548217 500 – 22 500 15 2023222 500 – 32 500 14 2661632 500 – 47 500 16 4027847 500 – 67 500 12 5641467 500 – 87 500 6 74985

87 500 – 125 000 11 106851125 000 – 225 000 5 184735225 000 – 300 000 4 264025

300 000 3 300000

Pour modéliser les données, on utilise une distribution log-normale de para-mètres µ et σ2. À l’aide d’une technique d’estimation quelconque, on trouveque µ= 9,356 et σ= 1,596.

a) Estimer le montant payé espéré.

b) Estimer le pourcentage de changement dans le montant payé par paie-ment espéré si l’on observe une inflation de 10 % des sinistres.

Page 104: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

94 Modélisation en assurance IARD

c) Estimer le pourcentage de réduction dans le montant payé espéré si l’ondécide d’ajouter une franchise de 1000 $ au contrat de base (on ne tientplus compte de l’inflation).

2.13 Soit X , la variable aléatoire représentant le montant d’un sinistre en respon-sabilité professionnelle pour un médecin. On suppose que la compagnied’assurance achète un traité de réassurance de rétention δ par réclamation,c’est-à-dire que le réassureur paie l’excédent des pertes au-dessus de δ pourchaque réclamation. Si l’on suppose que X a une distribution de Pareto(α,λ),démontrer que la distribution du montant payé par paiement du réassureura une distribution de Pareto de paramètres α et λ+δ.

2.14 On suppose que le montant d’un sinistre obéit à une loi exponentielle deparamètre 3, c’est-à-dire que

f (x) = 3−3x , x > 0.

On introduit une franchise forfaitaire de 0,2. Lorsque l’assureur effectue unpaiement, quelle est la probabilité qu’il soit de plus de 0,50 ?

2.15 Une compagnie décide d’acheter deux contrats d’assurance pour l’année àvenir. Le montant moyen des sinistres pour une année est de 11100 $. Lapolice A a une franchise forfaitaire de 5000 $ et ne présente pas de limite,alors que la police B a une limite de 5000 $ et ne présente pas de franchise.Pour la police A, l’espérance de la variable aléatoire du montant payé parsinistre, Y S , est de 6500 $ et l’espérance de la variable aléatoire du montantpayé par paiement, Y P , est de 10000 $. Sachant qu’un sinistre d’un montantplus petit ou égal à 5000 $ s’est produit, calculer l’espérance de la variablealéatoire du montant payé par paiement pour le contrat B.

2.16 Un assureur utilise une distribution binomiale négative de paramètres r = 3 etθ = 1/6 pour modéliser la fréquence des sinistres par année et une distributionde Weibull de paramètres τ = 0,3 et λ = 1/1000 pour modéliser la sévéritédes sinistres. Il décide également d’appliquer une franchise forfaitaire de 200.Déterminer le nombre espéré de paiements que fera l’assureur par année.

2.17 Pour un contrat comportant une franchise forfaitaire de d , une limite supé-rieure de u et une coassurance de α, la variable aléatoire du montant payépar sinistre, Y S , est donnée à partir de la variable aléatoire du montant d’unsinistre, X , par

Y S =

0, X < d

α(X −d), d ≤ X < u

α(u −d), X ≥ u.

Page 105: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

2.14. Exercices 95

a) Démontrer que E [Y S] =α(E [X ;u]−E [X ;d ]).

b) Trouver Var[Y S].

c) Trouver l’expression générale de l’espérance du montant payé par sinistreà la suite d’une inflation de 100r %.

2.18 Soient Y S , la variable aléatoire du montant payé par sinistre, X , la variablealéatoire du montant d’un sinistre, d une franchise forfaitaire et u, une limitesupérieure. Démontrer la relation E [Y S] = E [X ;u]−E [X ;d ] à l’aide d’inté-grales, et non par une définition astucieuse de la variable aléatoire Y S .

2.19 Le ratio de perte (loss ratio) R est défini comme étant le montant total dessinistres payés pendant l’année, S, divisé par le montant total des primesreçues pendant l’année, π. Une compagnie d’assurance souhaite bien en-tendu conserver ce ratio sous un certain niveau pour ne pas être en difficultéfinancière. Pour ce faire, elle offre un bonus B à ses agents à la fin de l’annéesi le ratio de perte pour l’année est inférieur à 75 %. Le montant du bonus estcalculé comme suit :

B = max

(0,π

(0,75−R

3

)).

Calculer le montant espéré du bonus si π= 600000 et que la distribution dela variable aléatoire S est une Pareto avec paramètres α= 3 et λ= 700000.

2.20 Soit X , une variable aléatoire représentant le montant d’un sinistre. Un assu-reur souhaite connaître les paiements à sa charge pour un contrat d’assuranceincluant une franchise décroissante (disappearing deductible). Dans ce typede contrat, l’assuré assume en entier tout sinistre inférieur à d et l’assureurassume en entier tout sinistre supérieur à d∗. Entre d et d∗, le paiementeffectué par l’assureur est une fonction linéaire du montant d’un sinistre.

a) Définir la variable aléatoire Y P représentant le montant payé par paiementpour un contrat avec une franchise décroissante.

b) Trouver l’expression générale en termes de E [X ], E [X ; x] et FX (x) du mon-tant payé par paiement espéré.

Exercices proposés dans LossModels, 4e éd.

3.5, 3.7, 3.8, 3.9, 3.11, 3.15, 8.1 8.2, 8.3, 8.5 8.7 8.8 8.11, 8.12, 8.14, 8.16, 8.17, 8.18,8.19, 8.23, 8.24, 8.25, 8.26, 8.27. 8.28

Page 106: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

96 Modélisation en assurance IARD

Réponses

2.1 0,4946

2.2 0,4686

2.3 a) 0,0175 b) 0,1813

2.4 0,0034

2.5 0,567

2.6 0,226

2.7 a) (3−e−2d −2e−d )/4 b) 0,0541 c) 0,0576

2.8 a) 1091,09 b) 0,8438

2.11 a) 0,1069 b) 0,4107 c) 1255,23

2.12 a) 33962 b) +8,04 % c) −2,87 %

2.14 0,22

2.15 3857

2.16 8,0925

2.17 a) α2(E [X 2;u2]−E [X 2;d 2]−2dE [X ;u]+2dE [X ;d ])−α2(E [X ;u]−E [X ;d ])2

b) α(1+ r )(E [X ;u/(1+ r )]−E [X ;d/(1+ r )])

2.19 76559,55

2.20 a) (E [X ]+d/(d∗−d)E [X ;d∗]−d∗/(d∗−d)E [X ;d ])/(1−FX (d))

Page 107: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

3 Modélisation non paramétrique

Objectifs du chapitre

x Définir les statistiques descriptives les plus usuelles d’un échantillon de montants desinistres : moments et moments centraux, espérance résiduelle, espérance limitée,quantiles.

x Définir et calculer la fonction de répartition empirique et la fonction de masse deprobabilité empirique pour des données individuelles.

x Définir et calculer la fonction de répartition empirique, l’ogive et l’histogrammepour des données groupées.

x Définir et calculer les estimateurs de Nelson–Åalen et de Kaplan–Meier de la fonc-tion de survie à partir d’un échantillon de données tronquées et censurées.

x Calculer la variance de l’estimateur de Kaplan–Meier en un point et construire unintervalle de confiance pour la fonction de survie.

x Définir et calculer un estimateur par noyaux de la fonction de densité ou de lafonction de répartition sous-jacente d’un échantillon de données.

x Calculer les statistiques descriptives empiriques à partir d’une estimation de lafonction de répartition.

x Déterminer un intervalle de confiance pour un quantile.x Calculer les quantités énoncées ci-dessus avec R et créer des graphiques des esti-

mateurs de la fonction de densité, de la fonction de répartition et de l’espérancelimitée.

Dans ce chapitre, on développe directement à partir des données des estima-teurs de la fonction de répartition, de la fonction de densité et de certaines quan-tités liées d’une variable aléatoire sans faire d’hypothèse quant à la distributioncomplète de cette variable aléatoire. C’est l’approche non paramétrique.

Cette approche a comme avantages d’être flexible et de bien prendre en comptela disparité des données. De plus, elle peut être très précise lorsque le nombre dedonnées est grand. Par contre, elle est souvent moins efficace qu’une approcheparamétrique et l’inférence statistique qui en résulte est plus compliquée.

97

Page 108: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

98 Modélisation non paramétrique

3.1 Statistiques descriptives

Les statistiques ci-dessous décrivent rapidement la distribution d’une variablealéatoire. Elles sont habituellement estimées à partir d’un échantillon de la variablealéatoire, souvent de manière non paramétrique.

La plupart de ces éléments ont déjà été présentés à la section 1.3.

3.1.1 Moments

Lorsqu’il existe, on nomme moment d’ordre k de la variable aléatoire X l’espé-rance de cette dernière élevée à la puissance k :

µ′k = E [X k ]

=∫ ∞

0xk dF (x).

En particulier, le premier moment est E [X ] =µ=µ′1.

3.1.2 Moments centraux

On nomme, lorsqu’il existe, moment central d’ordre k de la variable aléatoire Xl’espérance de la différence entre cette dernière et la moyenne, élevée à la puissancek. Il s’agit donc d’une mesure de la dispersion de X autour de son espérance. On a

µk = E [(X −E [X ])k ]

=∫ ∞

0(x −µ)k dF (x).

En particulier, on définit les quantités suivantes :

x variance :

σ2 = Var[X ]

=µ2

=µ′2 −µ2;

x coefficient de variation :

CV(X ) =p

Var[X ]

E [X ]

= σ

µ;

Page 109: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

3.1. Statistiques descriptives 99

x coefficient d’asymétrie (skewness) :

γ1(X ) = E [(X −µ)3]

Var[X ]3/2

= µ3

σ3 ;

x coefficient d’aplatissement ou coefficient d’excès (kurtosis) :

γ2(X ) = E [(X −µ)4]

Var[X ]2

= µ4

σ4 .

3.1.3 Espérances résiduelle et limitée

L’espérance résiduelle est utile pour mesurer l’épaisseur relative des queues desdistributions. Nous avons établi son lien avec l’espérance limitée à la section 2.7,soit :

e(x) = E [X −x|X > x]

= 1

1−F (x)

∫ ∞

x(y −x)dF (y)

= E [X ]−E [X ; x]

1−F (x).

L’espérance limitée est la moyenne des valeurs censurées à x d’une variablealéatoire.

Plus intéressante pour décrire des données, l’espérance résiduelle représentequant à elle l’excédent moyen des valeurs d’une variable aléatoire au-dessus dex. Ainsi, plus cette espérance est grande (pour un même x), plus la queue de ladistribution est lourde. Voir la figure 3.1, inspirée de Hogg et Klugman (1984), pourune comparaison de la fonction d’espérance résiduelle pour quelques lois usuelles.

Nous verrons plus loin comment estimer les espérances limitée et résiduelleà partir des données. On pourra ensuite utiliser ces estimations pour identifierdes modèles potentiels pour les données. Par exemple, si l’espérance résiduelleempirique croît plus ou moins linéairement, on favorisera la loi de Pareto commemodèle.

3.1.4 Quantiles

La définition «robuste» de quantile est la suivante : πp est le 100pe quantiled’une distribution F (·) si, et seulement si,

limh→0

F (πp −h) ≤ p ≤ F (πp ).

Page 110: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

100 Modélisation non paramétrique

0 500 1000 1500

050

010

0015

00

x

e(x)

Paret

o

Exponentielle

Gamma (α > 1)

Weibull (τ > 1)

Weibull (τ < 1),

log−normale

FIG. 3.1: Espérance résiduelle pour quelques lois usuelles

Ainsi, tout nombre pour lequel la fonction de répartition vaut au moins p est le100pe quantile de la distribution. Pour une distribution continue, cela se résumeau point πp tel que F (πp ) = p. Par contre, le quantile n’est pas unique pour les fonc-tions de répartition non strictement croissantes, comme les fonctions en escalierdes variables aléatoires discrètes.

Par exemple, pour la fonction de répartition représentée à la figure 3.2, on a3 ≤π0,6 < 4.

3.2 Fonctions de répartition et de probabilitéempiriques

La première étape d’un processus de modélisation consiste souvent à tracerdes graphiques tels que ceux présentés à la figure 3.3 permettant de déterminer glo-balement la distribution des données. Les fonctions sous-jacentes à ces graphiques

Page 111: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

3.2. Fonctions de répartition et de probabilité empiriques 101

0 1 2 3 4 5

0.0

0.2

0.4

0.6

0.8

1.0

x

F(x

)

FIG. 3.2: Exemple de fonction de répartition en escalier pour laquelle les quantilesne sont pas uniques

constituent en fait des estimateurs de la fonction de répartition et de la fonction dedensité de probabilité.

À partir de ce point et jusqu’au chapitre 7 où l’on étudiera la modélisation de lafréquence des sinistres, on pose que X représente la variable aléatoire (continue)du montant d’un sinistre avec fonction de répartition F (x). L’assureur disposed’observations X1, . . . , Xn (sous forme individuelle ou groupée). Par convention, onsuppose que X1, . . . , Xn forme un échantillon aléatoire de la variable aléatoire X .

3.2.1 Données individuelles

Pour construire la fonction de répartition empirique, Fn(x), et la fonction demasse de probabilité empirique, fn(x), on attribue à chacune des données unpoids de 1/n. Si l’on définit IA comme une fonction indicatrice valant 1 lorsque lacondition A est vraie, et 0 sinon, alors on a

Fn(x) = #X j ≤ x

n= 1

n

n∑j=1

IX j≤x

et, par différentiation,

fn(x) = #X j = x

n= 1

n

n∑j=1

IX j=x.

Page 112: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

102 Modélisation non paramétrique

0 500 1000 1500

0.0

0.2

0.4

0.6

0.8

1.0

ecdf(dental)

x

Fn(

x)

Histogram of dental

dental

Den

sity

0 500 1000 1500 2000

0.00

00.

001

0.00

20.

003

0.00

4

FIG. 3.3: Exemple de fonction de répartition empirique (gauche) et d’histogramme(droite) de données individuelles

Tel que mentionné ci-dessus, ces fonctions sont des estimateurs de la fonction derépartition et de la fonction de densité de probabilité, dans l’ordre, c’est-à-dire quenous considérerons que

F (x) = Fn(x)

f (x) = fn(x).

On peut démontrer quelques propriétés de l’estimateur Fn de la fonction derépartition. Soit

B j = IX j≤x =

1, X j ≤ x

0, sinon

et

Y =n∑

j=1B j

= nFn(x).

On a Pr[B j = 1] = F (x) et B j ∼ Bernoulli(F (x)), d’où

Y = nFn(x) ∼ Binomiale(n,F (x)).

Page 113: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

3.2. Fonctions de répartition et de probabilité empiriques 103

Ainsi

E [Fn(x)] = E [Y ]

n

= nF (x)

n= F (x)

et

Var[Fn(x)] = Var[Y ]

n2

= nF (x)(1−F (x))

n2

= F (x)(1−F (x))

n.

Par conséquent,

x Fn est un estimateur sans biais de F ;

x puisque limn→∞ Var[Fn(x)] = 0, Fn est un estimateur convergent de F .

Exemple 3.1. De 1990 à 1999, un assureur a enregistré les données concernant lafréquence des vols commis dans un centre commercial de la région de Québec :

0,0,0,0,0,1,1,1,1,3.

La fonction de répartition empirique est

F10(x) =

0, x < 0

5/10, 0 ≤ x < 1

9/10, 1 ≤ x < 3

1, x ≥ 3.

et la fonction de masse de probabilité empirique est

f10(x) =

5/10, x = 0

4/10, x = 1

1/10, x = 3

0, ailleurs.

Les graphiques de ces fonctions sont présentés à la figure 3.4.

Page 114: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

104 Modélisation non paramétrique

−1 0 1 2 3 4

0.0

0.2

0.4

0.6

0.8

1.0

ecdf(x)

x

Fn(x

)

(a) fonction de répartition

0.0 0.5 1.0 1.5 2.0 2.5 3.0

x

f n(x

)(b) fonction de probabilité

FIG. 3.4: Fonctions de répartition et de masse de probabilité empiriques pour lesdonnées de l’exemple 3.1

¸ La distribution de base de R contient toutes les fonctions nécessairespour créer et manipuler des fonctions de répartition et de probabi-lité empiriques pour des données individuelles. Consulter le codeinformatique de la section 3.6 pour des illustrations.

3.2.2 Données groupées

De manière générale, les données groupées se présentent sous la forme d’untableau donnant le nombre de sinistres n j se trouvant dans l’intervalle de montants(c j−1,c j ], j = 1, . . . ,r ; voir le tableau 3.1.

Remarques.

1. Les classes sont fermées à droite et ouvertes à gauche plus ou moins arbitraire-ment. C’est la convention que nous utiliserons.

2. La dernière classe peut ne pas être fermée, c’est-à-dire que cr =∞. Cela com-plique toutefois certaines procédures numériques et il est souvent nécessaire defermer la dernière classe arbitrairement.

3. Dans la notation, on pose n =∑rj=1 n j .

Page 115: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

3.2. Fonctions de répartition et de probabilité empiriques 105

Classe Fréquence

(c0,c1] n1

(c1,c2] n2...

...(c j−1,c j ] n j...

...(cr−1,cr ] nr

TAB. 3.1: Représentation générale d’un ensemble de données groupées

On a donc

Fn(c0) = 0

Fn(c j ) = 1

n

j∑i=1

ni , j = 1, . . . ,r.

Il est toutefois un peu ennuyeux de garder la fonction de répartition empiriqueconstante à l’intérieur des classes. On va donc supposer que les observations sontréparties uniformément à l’intérieur de chaque classe. Il en résulte un estimateurlisse de la fonction de répartition où les valeurs connues sont reliées par des seg-ments de droite. Ce résultat est appelé une ogive ; voir une illustration à la figure 3.5.

La pente d’un segment de droite est

Fn(ck )−Fn(ck−1)

ck − ck−1

et l’équation d’un segment est

Fn(x) =(

c j −x

c j − c j−1

)Fn(c j−1)+

(x − c j−1

c j − c j−1

)Fn(c j )

= Fn(c j−1)+ Fn(c j )−Fn(c j−1)

c j − c j−1(x − c j−1)

pour c j−1 ≤ x ≤ c j .Par conséquent, l’ogive Fn(x) est définie ainsi :

Fn(x) =

0, x ≤ c0(c j −x)Fn(c j−1)+ (x − c j−1)Fn(c j )

c j − c j−1, c j−1 < x ≤ c j

1, x > cr .

Page 116: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

106 Modélisation non paramétrique

0 1000 2000 3000 4000

0.0

0.2

0.4

0.6

0.8

1.0

ogive(gdental)

x

F(x

)

FIG. 3.5: Exemple d’ogive

Le calcul de l’ogive requiert donc que cr <∞.

L’ogive peut aussi servir comme estimateur lisse de la fonction de répartitionde données individuelles. Il faut alors regrouper les données dans des classesarbitraires. Attention, toutefois, de ne pas choisir des données comme limites declasses, sinon l’ogive sur-estimera la fonction de répartition, tel qu’illustré à lafigure 3.6.

La dérivée d’une ogive est un histogramme :

f (x) =

0, x ≤ c0Fn(c j )−Fn(c j−1)

c j − c j−1= n j

n(c j − c j−1), c j−1 < x ≤ c j

0, x > cr .

Page 117: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

3.2. Fonctions de répartition et de probabilité empiriques 107

0 500 1000 1500

0.0

0.2

0.4

0.6

0.8

1.0

ecdf(dental)

x

Fn(

x)

FIG. 3.6: Illustration d’une ogive sur-estimant la fonction de répartition

Soit

Y =n∑

i=1IXi≤c j−1

= nFn(c j−1)

∼ Binomiale(n,FX (c j−1))

et

Z =n∑

i=1Ic j−1<Xi≤c j

= n(Fn(c j−1)−Fn(c j ))

∼ Binomiale(n,FX (c j−1)−Fn(c j )).

Page 118: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

108 Modélisation non paramétrique

On a donc

Fn(x) = Y (c j − c j−1)+Z (x − c j−1)

n(c j − c j−1),

d’où

E [Fn(x)] = F (c j−1)(c j − c j−1)+ (F (c j )−F (c j−1))(x − c j−1)

(c j − c j−1)

6= F (x).

Ainsi, Fn(x) est un estimateur biaisé de F (x).Pour l’histogramme, on a

fn(x) = Z

n(c j − c j−1),

d’où

E [ fn(x)] = F (c j )−F (c j−1)

c j − c j−1

6= f (x)

et f (x) est un estimateur biaisé de f (x).De plus, on a

Var[Fn(x)] = Var[Y ]

n2 +(

x − c j−1

c j − c j−1

)2 Var[Z ]

n2

+2

(x − c j−1

c j − c j−1

)Cov(Y , Z )

n2 ,

Var[Y ] = nF (c j−1)(1−F (c j−1)),

Var[Z ] = n(F (c j )−F (c j−1))(1−F (c j )+F (c j−1))

et

Cov(Y , Z ) =−nF (c j−1)(F (c j )−F (c j−1)).

Pour l’histogramme, on a

Var[ f (x)] = (F (c j )−F (c j−1))(1−F (c j )+F (c j−1))

n(c j − c j−1)2 .

Page 119: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

3.2. Fonctions de répartition et de probabilité empiriques 109

Exemple 3.2. Soit les données individuelles suivantes :

11,13,11,11,17,19,13.

La fonction de répartition empique et la fonction de masse de probabilité empiriquesont :

F7(x) =

0, x < 11

3/7, 11 ≤ x < 13

5/7, 13 ≤ x < 17

6/7, 17 ≤ x < 19

1, x ≥ 19

f7(x) =

3/7, x = 11

2/7, x = 11

1/7, x = 17

1/7, x = 19

0, ailleurs.

Voir la figure 3.7 (a) pour le graphique conjoint de F7(x) et f7(x).Si l’on groupe les données dans les classes (10,12], (12,14], (14,18] et (18,23],

on obtient le jeu de données suivant :

Classe Fréquence

(10,12] 3(12,14] 2(14,18] 1(18,23] 1

L’équation de l’ogive est donc

F7(x) =

0, x ≤ 103

14 (x −10), 10 < x ≤ 1217 (x −9), 12 < x ≤ 141

28 (x +6), 14 < x ≤ 181

35 (x +12), 18 < x ≤ 23

1, x > 23

Page 120: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

110 Modélisation non paramétrique

10 12 14 16 18 20

0.0

0.2

0.4

0.6

0.8

1.0

ecdf(x)

x

Fn(

x)

(a) données individuelles

Histogram of xg

xg

Den

sity

10 12 14 16 18 20 22

0.0

0.2

0.4

0.6

0.8

1.0

(b) données groupées

FIG. 3.7: Fonctions de répartition et de masse de probabilité empiriques, ogive ethistogramme pour les données de l’exemple 3.2

alors que celle de l’histogramme est

f7(x) =

0, x ≤ 103

14 , 10 < x ≤ 1217 , 12 < x ≤ 141

28 , 14 < x ≤ 181

35 , 18 < x ≤ 23

0, x > 23.

Les graphiques de l’ogive et de l’histogramme se trouvent à la figure 3.7 (b).

¸ Compléter l’exemple en exécutant le code informatique de la sec-tion 3.6 correspondant à ce segment de matière.

Page 121: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

3.3. Estimateurs de la fonction de survie 111

3.3 Estimateurs de la fonction de survie

Les estimateurs de cette section sont principalement utilisés dans le domainede l’analyse de survie. C’est pourquoi on s’intéresse plus particulièrement à l’esti-mation de la fonction de survie de la variable aléatoire X , notée S(x) = 1−F (x), oùF est la fonction de répartition.

Il est utile d’adopter la terminologie de l’analyse de survie afin de présenter lesestimateurs de manière simple et intuitive. Ainsi, dans ce domaine, on interprèteles observations x1, . . . , xn d’une variable aléatoire X comme les durées de vie desujets (des personnes, des machines, des composants, des logiciels, peu importe)d’un groupe témoin. Une donnée est tronquée à gauche lorsque l’on sait qu’ellen’a pu être observée à une valeur inférieure à son point de troncature, soit dèslors qu’un sujet joint le groupe témoin à un âge supérieur à 0. Elle peut aussi êtrecensurée à droite lorsque le sujet quitte le groupe témoin avant la fin de l’étude ous’il survit au-delà de la durée de l’étude.

Par exemple, considérons une étude sur un nouveau traitement contre le can-cer. Un patient joint le groupe témoin à l’âge de 42 ans, puis, pour des raisonspersonnelles, quitte l’étude après 5 ans. L’observation pour ce patient est une duréecensurée de 47 tronquée (à gauche) à 42. Pour un autre patient décédé durantl’étude à 72 ans après 8 ans de traitements expérimentaux, l’observation est unedurée de 72 (non censurée) tronquée à 64.

Le parallèle entre les durées de vie et les montants de sinistres en assuranceIARD est assez facile à faire. La principale différence réside dans le fait que lespoints de troncature et de censure peuvent varier par sujet en analyse de survie,alors que c’est moins souvent le cas des franchises et des limites en assurance.

3.3.1 Définition du groupe risque

Les estimateurs non paramétriques de la fonction de survie sont basés sur lenombre de sujets faisant toujours partie du groupe témoin à différents momentsdans le temps.

Soit x1, . . . , xn un échantillon aléatoire de la variable aléatoire X et y1 < ·· · < yk

les k (k ≤ n) valeurs uniques et triées de l’échantillon. Soit également

s j =n∑

i=1Ixi=y j ,

le nombre de fois que la donnée y j apparaît dans l’échantillon. On a donc∑k

j=1 s j =n. La variable s j représente le nombre de décès à la durée y j . Enfin, on définit r j

comme le nombre de sujets dans le groupe témoin juste avant les s j décès à la

Page 122: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

112 Modélisation non paramétrique

j y j s j r j

1 0,8 1 82 2,9 2 73 3,1 1 54 4,0 2 45 4,1 1 26 4,8 1 1

TAB. 3.2: Valeurs de y j , s j et r j , j = 1, . . . ,6, pour les données de l’exemple 3.3

durée y j . Dans le cas de données non tronquées ni censurées, on a

r j =n∑

i=1Ixi≥y j

=k∑

i= jsi .

On nomme également r j le groupe risque à l’observation y j .Si la donnée j est censurée (à droite) à u j , on la note u j . Avec des données

censurées, on a donc

r j =n∑

i=1Ixi≥y j +

n∑i=1

Iui≥y j

=k∑

i= jsi +

n∑i=1

Iui≥y j .

La possibilité de troncature complique un peu le calcul du groupe risquepuisque, pour chaque durée (observation) y j , il faut compter le nombre de su-jets se trouvant dans le groupe témoin à ce moment et qui sont toujours en vie. End’autres termes, il faut exclure du calcul tous les sujets dont l’âge d’entrée dans legroupe (le point de troncature) est supérieur à y j . Nous donnerons la définitionmathématique du groupe risque dans ce cas à la sous-section 3.3.3.

Exemple 3.3. Soit les huit données

0,8, 2,9, 2,9, 3,1, 4,0, 4,0, 4,1, 4,8.

On a six données différentes. Le tableau 3.2 donne les valeurs de y j , s j et r j , j =1, . . . ,6.

Page 123: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

3.3. Estimateurs de la fonction de survie 113

Remarque. Avec la notation ci-dessus, la fonction de répartition empirique est

Fn(x) =

0, x < y1

1− r j

n, y j−1 ≤ x < y j , j = 2, . . . ,k

1, x > yk .

3.3.2 Estimateur de Nelson-Åalen

L’estimateur de Nelson–Åalen est une alternative à la fonction de répartitionempirique comme estimateur de la fonction de survie dans le cas de donnéescomplètes. On peut aussi l’utiliser avec des données censurées à droite.

De la section 1.3, on connait le taux d’incidence

h(x) = f (x)

S(x)

=−S′(x)

S(x)

=− d

d xlnS(x),

où S(x) = 1−F (x) est la fonction de survie de la variable aléatoire X . On définit deplus le taux d’incidence cumulé H(x)

H(x) =∫ x

−∞h(y)d y

=− lnS(x).

La fonction de taux d’incidence cumulé est donc étroitement liée à la fonction desurvie S(x). L’estimateur de Nelson-Åalen exploite ce lien pour estimer la fonctionde survie.

L’estimateur de Nelson–Åalen du taux d’incidence cumulé est

H(x) =

0, x < y1j−1∑i=1

si

ri, y j−1 ≤ x < y j , j = 2, . . . ,k

k∑i=1

si

ri, x ≥ yk .

Par la suite, un estimateur de la fonction de survie est

S(x) = e−H(x).

Page 124: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

114 Modélisation non paramétrique

Pour la fonction de répartition, on a évidemment

F (x) = 1−e−H(x).

Remarque. On observe que

si

ri= si /n

ri /n

= si /n

1− (1− ri /n)

= fn(yi )

1−Fn(yi−1),

d’où une formule alternative de l’estimateur de Nelson–Åalen du taux d’incidencecumulé est

H(x) =

0, x < y1j−1∑i=1

fn(yi )

1−Fn(yi−1), y j−1 ≤ x < y j , j = 2, . . . ,k

k∑i=1

fn(yi )

1−Fn(yi−1), x ≥ yk ,

où y0 < y1 est un nombre quelconque tel que Fn(y0) = 0. La fonction R de lafigure 3.8 (voir aussi le code informatique de la section 3.6) utilise cette dernièreformule pour construire une fonction pour calculer H(x) en tout x.

Exemple 3.4. À partir des données de l’exemple 3.3, l’estimation de Nelson–Åalende la fonction de taux d’incidence cumulé est

H(x) =

0, 0 ≤ x < 0,818 = 0,125, 0,8 ≤ x < 2,9

0,125+ 27 = 0,411, 2,9 ≤ x < 3,1

0,411+ 15 = 0,611, 3,1 ≤ x < 4,0

0,411+ 24 = 1,111, 4,0 ≤ x < 4,1

1,111+ 12 = 1,611, 4,1 ≤ x < 4,8

1,611+ 11 = 2,611, x ≥ 4,8

Page 125: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

3.3. Estimateurs de la fonction de survie 115

naalen <- function(x)

Fn <- ecdf(x)

y <- knots(Fn)

fn <- diff(c(0, Fn(y)))

res <- approxfun(y,

cumsum(fn / c(1, head(1 - Fn(y), -1))),

yleft = 0, f = 0, rule = 2,

method = "constant")

class(res) <- c("stepfun", class(res))

res

FIG. 3.8: Fonction R qui retourne une fonction pour calculer l’estimateur de Nelson–Åalen H(x) en tout x

et l’estimation de la fonction de survie est

S(x) = e−H(x)

=

0, 0 ≤ x < 0,8

0,8825, 0,8 ≤ x < 2,9

0,6632, 2,9 ≤ x < 3,1

0,5430, 3,1 ≤ x < 4,0

0,3293, 4,0 ≤ x < 4,1

0,1997, 4,1 ≤ x < 4,8

0,0735, x ≥ 4,8.

Ces deux fonctions sont tracées à la figure 3.9.

On peut faire un grand nombre de calculs en analyse de survie, dont celuide l’estimateur de Nelson–Åalen, dans R avec les fonctions du package survival(Therneau, 2013). (Ce package est distribué avec R.)

Page 126: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

116 Modélisation non paramétrique

0 1 2 3 4

0.0

0.5

1.0

1.5

2.0

2.5

x

H(x

)

(a) taux d’incidence cumulé

0 1 2 3 4

0.0

0.2

0.4

0.6

0.8

1.0

x

S(x

)(b) fonction de survie

FIG. 3.9: Estimations de Nelson–Åalen de la fonction de taux d’incidence cumulé etde la fonction de survie pour les données de l’exemple 3.4

¸ Voir le code informatique de la section 3.6 pour une introduction aucalcul de l’estimateur de Nelson–Åalen avec les fonctions du packagesurvival.

Klugman et collab. (2012a, p. 233) justifient succinctement que, sous des hypo-thèses raisonnables, H(x) est un estimateur sans biais de H(x) et que

Var[H(y j )] ≈j∑

i=1

si

r 2i

.

3.3.3 Estimateur de Kaplan-Meier

L’estimateur de Kaplan–Meier — aussi communément appelé estimateur produit-limite — est principalement utilisé comme estimateur de la fonction de survie enprésence de données tronquées et censurées.

L’idée, assez simple au demeurant, derrière l’estimateur de Kaplan–Meier est lasuivante. S’il y a r1 sujets dans le groupe témoin juste avant la durée y1 et que s1

Page 127: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

3.3. Estimateurs de la fonction de survie 117

décès (ou départs) surviennent à y1, alors la probabilité (empirique) de survivreplus de y1 est

r1 − s1

r1= 1− s1

r1.

De même, la probabilité (toujours empirique) de survivre aussi plus de y2 est(r1 − s1

r1

)(r2 − s2

r2

),

et ainsi de suite jusqu’à yk . On obtient alors un estimateur de la fonction de survie.À la notation introduite à la sous-section 3.3.1, on ajoute d j , le point de tronca-

ture de la donnée j , ou l’âge d’entrée dans le groupe témoin du sujet j . Ainsi, pourdes données tronquées et censurées, le groupe risque à y j est

r j = # sujets sortis du groupe à ou après y j

−# sujets non encore entrés dans le groupe à y j

=n∑

i=1Ixi≥y j +

n∑i=1

Iui≥y j −n∑

i=1Idi≥y j

ou, de manière équivalente

r j = # sujets dans le groupe entrés avant y j

−# sujets sortis du groupe avant y j

=n∑

i=1Idi<y j −

n∑i=1

Ixi<y j −n∑

i=1Iui<y j .

L’estimateur de Kaplan–Meier de la fonction de survie d’une variable aléatoireest

Sn(t ) =

1, 0 ≤ t < y1∏ j−1

i=1

(ri − si

ri

), y j−1 ≤ t < y j , j = 2, . . . ,k∏k

i=1

(ri − si

ri

)ou 0, t ≥ yk .

Il convient de discuter de la valeur de Sn(t) pour t ≥ yk . Si sk = rk (toutes lespersonnes décèdent à l’âge yk ), alors il est raisonnable de poser Sn(yk ) = 0. Parcontre, s’il y a des données censurées dans l’échantillon (survivants au-delà de lapériode d’observation), alors il est plus raisonnable de poser

Sn(t ) =k∏

i=1

(ri − si

ri

)

Page 128: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

118 Modélisation non paramétrique

pour t ≥ yk . Afin de faire décroître exponentiellement la fonction de survie vers 0, ilest aussi suggéré d’utiliser

Sn(t ) =( k∏

i=1

(ri − si

ri

))t/w,

où w = max(x1, . . . , xn ,u1, . . . ,un), pour t ≥ yk .

Remarque. Si les données de l’échantillon ne sont ni tronqués, ni censurées, alorsr1 = n et r j = r j−1 − s j−1. L’estimateur de Kaplan–Meier est alors identique à lafonction de survie empirique 1−Fn(t ).

Klugman et collab. (2012a, p. 229–231) démontrent que

E [Sn(y j )] = S(y j )

S(y1)

et donc que l’estimateur est sans biais à y j . On démontre également que

Var[Sn(y j )] = S(y j )2

S(y1)2

[j∏

i=1

(1+ S(y j−1)−S(y j )

r j S(y j )

)−1

].

Or, cette formule est complexe et difficile à utiliser. On peut lui préférer l’approxi-mation

Var[Sn(y j )

]≈ S(y j )2

S(y1)2

j∑i=1

(S(yi−1)−S(yi )

ri S(yi )

).

Ceci dit, cette formule n’est pas d’un plus grand secours en pratique puisquela fonction de survie est inconnue. On utilisera donc plutôt l’approximation deGreenwood

Var[Sn(y j )] = Sn(y j )2j∑

i=1

si

ri (ri − si ).

Exemple 3.5. On réutilise les données de l’exemple 3.3, mais en ajoutant commeinformation que les données j = 1,3,8 sont censurées. Autrement dit, on a lesdonnées

0,8+, 2,9, 2,9+, 3,1+, 4,0, 4,0, 4,1, 4,8+,

où un signe + en indice indique une donnée censurée. Aucune donnée n’est tron-quée, donc d j = 0 pour tout j . L’échantillon contient un total de huit données, soitquatre observations x2 = 2,9, x5 = x6 = 4,0, x7 = 4,1 et quatre données censuréesu1 = 0,8, u3 = 2,9, u4 = 3,1, u8 = 4,8. Le tableau 3.3 présente les calculs des groupesrisque, soit les valeurs des quantités y j , s j et r j . On a

Page 129: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

3.3. Estimateurs de la fonction de survie 119

j y j s j r j

1 2,9 1 4+4−0 = 72 4,0 2 3+1−0 = 43 4,1 1 1+1−0 = 2

TAB. 3.3: Calculs des groupes risque pour les données de l’exemple 3.5

S8(t ) =

1, 0 ≤ t < 2,97−1

7 = 67 , 2,9 ≤ t < 4,0(6

7

)(4−24

)= 37 , 4,0 ≤ t < 4,1

37

(2−12

)= 314 , t ≥ 4,1.

La figure 3.10 présente l’estimateur de la fonction de survie obtenu ci-dessus.

Exemple 3.6. On peut calculer l’estimateur de Kaplan–Meier dans R avec la fonc-tion survfit du package survival. Dans cet exemple, on reproduit simplement lesrésultats des exemples 12.1 et 12.2 de Klugman et collab. (2012a).

¸ Consulter le code informatique de la section 3.6 pour les calculs.

Exemple 3.7. On a les données de survie suivantes, présentées sous forme d’inter-valles (d j , x j ] ou (d j ,u j ], les données censurées étant identifiées par un signe + enindice :

(0, 0,1] (0, 0,5] (0, 0,8] (0, 0,8+] (0, 1,8] (0, 1,8]

(0, 2,1] (0, 2,5] (0, 2,8] (0, 2,9+] (0, 2,9+] (0, 3,9]

(0, 4,0+] (0, 4,0] (0, 4,1] (0, 4,8+] (0, 4,8] (0, 4,8]

(0, 5,1] (0, 5,1] (0, 5,1] (0, 5,1] (0, 5,1] (0, 5,1]

(0, 5,1] (0, 5,1] (0, 5,1] (0, 5,1] (0, 5,1] (0, 5,1]

(0,3, 5,1] (0,7, 5,1] (1,0, 4,1+] (1,8, 3,1+] (2,1, 3,9] (2,9, 5,1]

(2,9, 4,8] (3,2, 4,0+] (3,4, 5,1] (3,9, 5,1]

On a un total de 12 observations. Le tableau 3.4 présente les valeurs de y j , s j

et r j pour j = 1, . . . ,12. L’estimateur de Kaplan–Meier de la fonction de survie est

Page 130: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

120 Modélisation non paramétrique

0 1 2 3 4

0.0

0.2

0.4

0.6

0.8

1.0

t

S8(t

)

FIG. 3.10: Estimateur de Kaplan–Meier de la fonction de survie pour les données del’exemple 3.5

donc :

S40(t ) =

1, 0 ≤ t < 0,12930 = 0,967, 0,1 ≤ t < 0,5

0,967( 2930 ) = 0,934, 0,5 ≤ t < 0,8

0,934( 2930 ) = 0,903, 0,8 ≤ t < 1,8

0,903( 2729 ) = 0,841, 1,8 ≤ t < 2,1

0,841( 2728 ) = 0,811, 2,1 ≤ t < 2,5

0,811( 2728 ) = 0,782, 2,5 ≤ t < 2,8

0,782( 2627 ) = 0,753, 2,8 ≤ t < 3,9

0,753( 2527 ) = 0,697, 3,9 ≤ t < 4,0

0,697( 2526 ) = 0,670, 4,0 ≤ t < 4,1

0,670( 2223 ) = 0,641, 4,1 ≤ t < 4,8

0,641( 2021 ) = 0,550, 4,8 ≤ t < 5,1

0,550( 017 ) = 0, t ≥ 5,1.

Page 131: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

3.3. Estimateurs de la fonction de survie 121

j y j s j r j

1 0,1 1 302 0,5 1 31−1 = 303 0,8 1 32−2 = 304 1,8 2 33−4 = 295 2,1 1 34−6 = 286 2,5 1 35−7 = 287 2,8 1 35−8 = 278 3,9 2 39−12 = 279 4,0 1 40−14 = 26

10 4,1 1 40−17 = 2311 4,8 3 40−19 = 2112 5,1 17 40−23 = 17

TAB. 3.4: Calculs des groupes risque pour les données de l’exemple 3.7

Cet estimateur est représenté à la figure 3.11On souhaite estimer la valeur de

2q3 = S(3)−S(5)

S(3).

Une estimation naturelle est

2q3 = S40(3)−S40(5)

S40(3)

= 0,753−0,550

0,753

= 0,270.

La variance de l’estimateur 2q3 est toutefois compliquée à calculer puisque l’ona des variables aléatoires au numérateur et au dénominateur de son expression. Lasolution usuelle — et raisonnable — à ce problème consiste à calculer la varianceconditionnellement à la valeur de la probabilité de survie au temps 3, de sorte queS(3) devient une constante. Ainsi,

Var[2q3|S40(3) = 0,753] = Var[S40(5)]

(0,753)2 .

On utilise l’approximation de Greenwood pour Var[S40(5)]. Seulement, on consi-dère maintenant la survie jusqu’au temps 3 comme accomplie. De plus, 5 n’est pas

Page 132: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

122 Modélisation non paramétrique

0 1 2 3 4 5

0.0

0.2

0.4

0.6

0.8

1.0

t

S40

(t)

FIG. 3.11: Estimateur de Kaplan–Meier de la fonction de survie pour les données del’exemple 3.7

une observation, comme la formule de Greenwood le suppose. Par convention, onse reporte à la plus grande observation inférieure ou égale à 5 pour le calcul. Parconséquent, seuls les termes si et ri correspondant aux durées 3 ≤ t ≤ 5 entrentdans le calcul de la variance. On obtient donc

Var[2q3|S40(3) = 0,753] =(

S40(5)

0,753

)2 11∑i=8

si

ri (ri − si )

=(

0,550

0,753

)2 [2

27(25)+ 1

26(25)+ 1

23(22)+ 3

22(19)

]= 0,00728.

(Cet exemple est l’exercice 12.16 de Klugman et collab. (2012a) avec une légèremodification des données pour clarifier le contexte.)

Page 133: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

3.3. Estimateurs de la fonction de survie 123

3.3.4 Estimation pour de grands échantillons

L’estimateur de Kaplan–Meier requiert plusieurs tris et décomptes des données.Pour les très gros échantillons, cela peut résulter en un temps de calcul prohibitif. Ilest alors possible de faire l’approximation présentée sommairement ici. On trouverade plus amples détails dans Klugman et collab. (2012a, section 12.4).

On détermine d’abord des intervalles dont les bornes sont c0 < c1, · · · < ck .Soit d j , j = 0, . . . ,k − 1, le nombre d’observations tronquées à une valeur dansl’intervalle [c j ,c j+1), u j , le nombre d’observations censurées à une valeur dansl’intervalle (c j ,c j+1] et x j , le nombre de données non-censurées dont la valeur setrouve dans l’intervalle (c j ,c j+1]. Avec les classes appropriées, toutes les donnéesde l’échantillon seront tronquées, d’une part, et censurées ou non censurée, d’autrepart. On a donc

n =k−1∑j=0

d j =k−1∑j=0

(u j +x j ),

où n est la taille de l’échantillon.Pour pouvoir calculer simplement l’estimateur, on suppose que toutes les

données non-censurées dans un intervalle ont la même valeur, disons c∗j , De plus,on suppose que cette valeur est telle que tous les points de troncature compris danscet intervalle sont inférieurs à c∗j et que tous les points de censure sont supérieursà c∗j . Le groupe risque de l’intervalle j = 0, . . . ,k −1 est alors

r j =

d0, j = 0∑ ji=0 di −∑ j−1

i=0 (ui +xi ), j = 1, . . . ,k.

Lorsque les points de troncature et de censure se trouvent à l’intérieur des inter-valles plutôt qu’aux bornes, on utilise parfois plutôt

r j =

(d0 −u0)/2, j = 0

(d j −u j )/2+∑ j−1i=0 (di −ui −xi ), j = 1, . . . ,k.

Enfin, on calcule l’estimateur de la fonction de survie en c0,c1, . . . ,ck avec

S(c j ) =

1, j = 0∏ j−1

i=0

(r j −x j

r j

), j = 1, . . . ,k.

Exemple 3.8. On a observé 19 sinistres, dont six avaient une franchise de 250, sixune franchise de 500 et sept une franchise de 1 000. De plus, trois sinistres, demontants 1 000, 2 750 et 5 500, ont atteint la limite de la police d’assurance. Pour les

Page 134: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

124 Modélisation non paramétrique

j (c j ,c j+1) d j x j u j r j

0 (250,500) 6 1 0 61 (500,1000) 6 2 1 6+6−1 = 112 (1000,2750) 7 4 1 11+7−3 = 153 (2750,5500) 0 7 1 15+0−5 = 104 (5500,6000) 0 1 0 10+0−8 = 25 (6000,10000) 0 1 0 2+0−1 = 1

TAB. 3.5: Calculs des groupes-risque pour les données de l’exemple 3.8

16 autres sinistres, un se trouve dans l’intervalle (250,500), deux dans (500,1000),quatre dans (1000,2750), sept dans (2750,5500), un dans (5500,6000) et un dans(6000,10000). On veut estimer la probabilité de payer plus de 5 500 pour un contratavec une franchise de 500.

Puisqu’un paiement de 5 500 correspond à un sinistre de 6 000, on cherche

Pr[X > 6000|X > 500] = S(6000)

S(500).

On estime la fonction de survie avec la méthode de Kaplan–Meier pour grandséchantillons. Le tableau 3.5 présente les calculs des groupes risque pour ces don-nées. On a donc

S(250) = 1

S(500) = 5

6= 0,833

S(1000) = (0,833)

(9

11

)= 0,682

S(2750) = (0,682)

(11

15

)= 0,500

S(5500) = (0,500)

(3

10

)= 0,150

S(6000) = (0,150)

(1

2

)= 0,075

S(10000) = (0,075)

(0

1

)= 0.

Ainsi, une estimation de la probabilité recherchée est

S(6000)

S(500)= 0,075

0,833= 0,090.

Page 135: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

3.4. Estimateur par noyaux 125

(Cet exemple est l’exercice 12.35 de Klugman et collab. (2012a), lui-mêmeinspiré du problème 26 de l’examen C de mai 2007.)

3.4 Estimateur par noyaux

Les techniques d’estimation de la fonction de répartition étudiées jusqu’à main-tenant résultent en des fonctions discrètes (exception faite de l’ogive, bien sûr).Cela peut être vu comme un problème lorsque la variable aléatoire sous-jacenteest continue et que le nombre de données est faible. La technique d’estimationpar noyaux permet d’estimer la fonction de répartition (ou la fonction de densité)par une fonction lisse et continue. De plus, elle est flexible, d’une écriture mathé-matique relativement simple et conviviale et elle permet une meilleure prise encompte de la contribution des observations situées dans le voisinage d’un point x.

Un estimateur lissé par noyaux est obtenu en remplaçant chaque donnée del’échantillon par une variable aléatoire continue et en attribuant un poids de 1/n àchacune de ces variables aléatoires. Celles-ci doivent être identiques à un change-ment d’échelle ou de position près (fonction de la donnée associée). La distributioncontinue utilisée pour chaque variable aléatoire est appelée le noyau. Ultimement,c’est comme si une donnée tirée de cet estimateur était d’abord tirée de la densitéempirique, puis ensuite d’une densité centrée à la valeur obtenue.

Formellement, l’idée est d’attribuer à chacune des données une distributiondont la moyenne sera la donnée (ce n’est pas obligatoire, mais cela permet à la dis-tribution lissée et à la distribution empirique d’avoir la même moyenne) plutôt queson poids 1/n. Comme dans les sections précédentes, y1 < ·· · < yk , représententles k (k ≤ n) données uniques et triées de l’échantillon x1, . . . , xn . Soit ky (x) unefonction de densité de probabilité de moyenne y (le noyau) et Ky (x) la fonction derépartition correspondante. Les estimateurs par noyaux sont de la forme

f (x) =s∑

j=1fn(y j )ky j (x)

et

F (x) =s∑

j=1fn(y j )Ky j (x).

Ainsi, f (x) est un mélange discret des noyaux ky1 (x), . . . ,kyk (x). La figure 3.12 fournitun exemple.

Les noyaux les plus courants sont les suivants.

Page 136: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

126 Modélisation non paramétrique

0 2 4 6 8 10 12

0.00

0.05

0.10

0.15

x

Den

sity

FIG. 3.12: Six noyaux gaussiens (traits brisés) et leur somme (trait plein)

1. Noyau uniforme Le noyau à la donnée y est une distribution uniforme sur unintervalle de largeur 2b autour de y :

ky (x) =

0, x < y −b1

2b, y −b ≤ x ≤ y +b

0, x > y +b,

Ky (x) =

0, x < y −bx − y +b

2b, y −b ≤ x ≤ y +b

1, x > y +b.

2. Noyau triangulaire Le noyau à la donnée y est une distribution triangulaire sur

Page 137: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

3.4. Estimateur par noyaux 127

un intervalle de largeur 2b autour de y :

ky (x) =

0, x < y −bx − y +b

b2 , y −b ≤ x ≤ y

y −x +b

b2 , y ≤ x ≤ y +b

0, x > y +b,

Ky (x) =

0, x < y −b(x − y +b)2

2b2 , y −b ≤ x ≤ y

1− (y−x+b)2

2b2 , y ≤ x ≤ y +b

1, x > y +b.

3. Noyau gamma Le noyau à la donnée y est une distribution gamma de paramètrede forme α et de moyenne y :

ky (x) = (α/y)αxα−1e−αx/y

Γ(α), x > 0.

Une petite valeur de α représente une distribution étendue, et vice versa.

4. Noyau d’Epanechnikov Le noyau à la donnée y est :

ky (x) =

0, x < y −b3

4b

(1−

( x − y

b

)2), y −b ≤ x ≤ y +b

0, x > y +b.

5. Noyau normal, ou gaussien Le noyau à la donnée y est une distribution normalede moyenne y et de variance b2 :

ky (x) =φ( x − y

b

), −∞< x <∞

Ky (x) =Φ( x − y

b

), −∞< x <∞,

où φ(·) et Φ(·) sont, dans l’ordre, la fonction de densité de probabilité et lafonction de répartition de la distribution N (0,1).

Dans tous les cas sauf le noyau gamma, la valeur b représente la largeur debande de l’estimateur par noyaux. Silverman (1986) suggère d’utiliser, du moinsdans un premier temps,

b = 0,9min(σ,R/1,34)

n1/5,

Page 138: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

128 Modélisation non paramétrique

où σ est l’écart type estimé et R = π0.75 − π0,25 est l’espace inter-quartile estimé.C’est la valeur utilisée par défaut dans la fonction density de R (Venables et Ripley,2002, section 5.6).

Exemple 3.9. La fonction density de R permet de calculer l’estimateur par noyauxpour tous les noyaux présentés ci-dessus, sauf le noyau gamma.

¸ Voir le code informatique de la section 3.6 pour des exemples d’utili-sation et la comparaison de divers noyaux avec l’histogramme pourun jeu de données.

3.5 Statistiques descriptives empiriques

Pour estimer les statistiques descriptives de la section 3.1, il suffit de remplacerla fonction de répartition théorique F (x) par un estimateur : Fn(x), Fn(x), F (x), etc.En général, on utilise la fonction de répartition empirique ou l’ogive.

3.5.1 Moments

Pour un ensemble de données individuelles, on a

µ′k =

∫ ∞

0xk dFn(x)

=n∑

i=1xk

j fn(x j )

= 1

n

n∑i=1

xkj .

En particulier,

µ= x

σ2 = µ′2 − µ2

= 1

n

n∑j=1

x2j − x2

=∑n

j=1(x j − x)2

n= s2.

Page 139: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

3.5. Statistiques descriptives empiriques 129

Pour un ensemble de données groupées, on a plutôt

µ′k =

∫ ∞

0xk dFn(x)

=r∑

j=1

∫ c j

c j−1

xk fn(x)d x

Ce calcul est compliqué de manière générale. Par contre, on a∫ c j

c j−1

x fn(x)d x = n j

n(c j − c j−1)

∫ c j

c j−1

x d x

=n j (c2

j − c2j−1)

2n(c j − c j−1)

= n j (c j + c j−1)

2n

d’où

µ=n∑

j=1

n j

n

(c j + c j−1

2

).

Pour les moments centraux, on a

µk =∫ ∞

0(x − µ)k dFn(x)

= 1

n

n∑i=1

(x j − µ)k

et

µ′k =

r∑j=1

∫ c j

c j−1

(x j − µ)k fn(x)d x

3.5.2 Espérance limitée

On a, pour des données individuelles,

E [X ;u] =∫ u

0x dFn(x)+u(1−Fn(u))

= 1

n

∑x j<u

x j +u(1−Fn(u))

= 1

n

n∑j=1

min(x j ,u).

Page 140: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

130 Modélisation non paramétrique

Encore ici, le calcul pour les données groupées est plus compliqué, surtoutlorsque la limite se trouve à l’intérieur d’une classe. Ainsi, pour c j−1 < u ≤ c j ,

E [X ;u] =∫ u

0x dFn(x)+u(1− Fn(u))

=r∑

i=1

∫ ci

ci−1

min(x,u) fn(x)d x

. =j−1∑i=1

∫ ci

ci−1

x fn(x)d x +∫ u

c j−1

x fn(x)d x

+u∫ c j

ufn(x)d x +u

r∑i= j+1

∫ ci

ci−1

fn(x)d x

=j−1∑i=1

ni

n

(ci + ci−1

2

)+ n j

n

( u2 − c2j−1

2(c j − c j−1)

)+ n j

n

(u(c j −u)

c j − c j−1

)+u

r∑i= j+1

ni

n

=j−1∑i=1

ni

n

(ci + ci−1

2

)+ n j

n

(c j−1 +u

2

)(u − c j−1

c j − c j−1

)+u

n j

n

(c j −u

c j − c j−1

)+u

r∑i= j+1

ni

n.

Exemple 3.10. Les classes [0,100), [100,200) et [200,500) contiennent respective-ment 5, 10, et 2 données. Pour estimer E [X ;120], on sépare la classe [100,200) endeux classes : [100,120) et [120,200). Les données sont réparties proportionnelle-ment entre les deux classes. On obtient alors

E [X ;120] = 5

17(50)+ 10

17

(120−100

200−100

)(100)

+ 10

17

(200−120

200−100

)(120)+ 2

17(120)

= 1670

17.

Page 141: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

3.5. Statistiques descriptives empiriques 131

3.5.3 Espérance résiduelle

Pour les données individuelles, on a

e(x) = 1

1−Fn(x)

∫ ∞

x(y −x)dFn(y)

= 1

n(1−Fn(x))

∑x j>x

(x j −x)

= 1∑x j>x 1

∑x j>x

(x j −x).

De manière générale, on peut aussi utiliser

e(x) = µ− E [X ; x]

1−Fn(x).

3.5.4 Quantiles

Les quantiles empiriques sont obtenus directement de Fn(x) ou Fn(x). Puisquel’ogive est continue, on a que le 100pe quantile de données groupées est la valeurπp (unique) telle que

Fn(πp ) = p.

La fonction de répartition empirique de données individuelles n’est pas conti-nue. Le quantile empirique n’est donc pas unique. En général, on calcule un esti-mateur lisse du quantile. Il n’y a toutefois pas de définition universelle du quantilelisse. La version retenue dans Klugman et collab. (2012a, section 13.1) est uneinterpolation linéaire entre la b(n +1)pce et la d(n +1)pee statistique d’ordre :

πp = (1−h)x( j ) +hx( j+1)

avec

j = b(n +1)pch = (n +1)p − j .

Exemple 3.11. Soit l’échantillon aléatoire x1, . . . , x10. On recherche le 30e centile(p = 0,3). On veut donc approximativement 3 données sous le centile et 7 au-dessus.Puisque l’on ne peut choisir x(3,3), on prend

π0,3 = 0,7x(3) +0,3x(4).

Page 142: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

132 Modélisation non paramétrique

Remarques.

1. La définition de πp limite1

n +1≤ p ≤ n

n +1.

2. Par défaut, R utilise plutôt

j = b1+ (n −1)pch = 1+ (n −1)p − j ,

de sorte que toute valeur de 0 ≤ p ≤ 1 est admissible (avec x(n+1) ≡ x(n)).

¸ Consulter le code informatique de la section 3.6 pour des illustrationsdes différentes fonctions disponibles dans R et dans actuar pourcalculer les statistiques descriptives empiriques.

3.5.5 Intervalle de confiance pour un quantile

Soit X1, . . . , Xn un échantillon aléatoire d’une variable X , X(1) < ·· · < X(n) lesstatistiques d’ordre cet échantillon et

N =n∑

j=1IX j≤πp

le nombre de données inférieures ou égales au quantile πp .Puisque Pr[X ≤πp ] = FX (πp ) = p, on a que

N ∼ Binomiale(n, p).

Or,

Pr[N = i ] = Pr[X (i )i ≤πp < X(i+1)]

=(

n

i

)p i (1−p)n−i .

Ainsi, (X(i ), X(i+1)) est un intervalle de confiance à 100(1−α) % pour πp , où

1−α=(

n

i

)p i (1−p)n−i .

Page 143: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

3.6. Code informatique 133

En général, (X(i ), X( j )) est un intervalle de confiance pour πp de niveau 1−α, où

1−α= Pr[X(i ) ≤πp < X( j )]

= Pr[N = i ∪·· ·∪N = j −1]

= Pr[i ≤ N < j ]

=j−1∑k=i

(n

k

)pk (1−p)n−k .

En d’autres termes, si l’on trouve des valeurs i et j tel que Pr[i ≤ N < j ] = Pr[i ≤N ≤ j −1] = 1−α, alors (X(i ), X( j )) est un intervalle de confiance pour πp de niveau1−α.

Pour les grands échantillons, on utilise l’approximation normale avec correctionpour la continuité, c’est-à-dire que si np > 0,5 et np(1−p) > 0,5, alors

Pr[N = i ] ≈ Pr

[i − 1

2≤W < i + 1

2

],

où W ∼ N (np,np(1−p)). Par conséquent,

Pr[Yi ≤πp < Y j ] ≈ Pr

[i − 1

2≤W < j −1+ 1

2

].

3.6 Code informatique

###

### FONCTIONS DE RÉPARTITION ET DE PROBABILITÉ EMPIRIQUES

###

## DONNÉES INDIVIDUELLES

## On va travailler avec les données "dental" fournies dans la

## première édition de Loss Models. Il s'agit de 10 montants de

## réclamation en assurance dentaire avec une franchise de 50. Ces

## données sont distribuées avec actuar.

data(dental, package = "actuar") # charger les données

dental # les données

## Fonction de répartition empirique. La fonction 'ecdf' de R retourne

## une fonction pour calculer la fonction de répartition empirique en

## un point quelconque. Les fonctions génériques 'summary', 'knots' et

## 'plot' comportent des méthodes pour les objets de classe "ecdf". La

## rubrique d'aide de 'ecdf' contient plusieurs exemples.

Page 144: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

134 Modélisation non paramétrique

(Fn <- ecdf(dental)) # définition de la f.r. empirique

summary(Fn) # sommaire (peu utile)

knots(Fn) # les noeuds de la fonction

Fn(knots(Fn)) # évaluation aux noeuds

Fn(c(20, 150, 1000)) # évaluation en d'autres points

## Graphiques de la fonction de répartition empirique, du plus simple

## à des plus élaborés.

plot(Fn)

plot(Fn, verticals = TRUE)

plot(Fn, verticals = TRUE, do.points = FALSE)

plot(Fn, verticals = TRUE,

col.h = "blue", col.p = "red", col.v = "bisque",

pch = 20)

abline(v = knots(Fn), lty = 2, col = "gray90")

abline(h = Fn(knots(Fn)), lty = 2, col = "gray90")

plot(Fn, col.h = "blue", col.p = "red", pch = 18)

segments(knots(Fn), 0, knots(Fn), Fn(knots(Fn)), col = "gray90")

## Fonction de probabilité empirique: utiliser la fonction 'table'

## pour déterminer la fréquence de chaque valeur dans l'échantillon.

table(dental)

(fn <- table(dental)/length(dental))

plot(dental, fn, type = "h")

## On peut aussi calculer et tracer un histogramme pour des données

## individuelles avec la fonction 'hist'. Spécifier l'option 'prob =

## TRUE' pour graduer l'axe des ordonnées en probabilités plutôt qu'en

## fréquences. Les classes sont déterminées automatiquement, mais

## peuvent être changées avec l'option 'breaks'.

hist(dental) # histogramme par défaut

hist(dental, plot = FALSE)$counts # fréquence par classe

hist(dental, plot = FALSE)$density # fréq. relative par classe

hist(dental,

breaks = c(0, 25, 100, 500, 1000, 2000)) # autres classes

## DONNÉES GROUPÉES

## On va utiliser les données "grouped dental" de Loss Models qui sont

## distribuées avec actuar.

library(actuar) # charger le package

data(gdental) # charger les données

gdental # les données

Page 145: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

3.6. Code informatique 135

## La fonction 'ogive' de actuar est l'analogue de 'ecdf' pour les

## données groupées.

(Gn <- ogive(gdental)) # définition

summary(Gn) # sommaire

knots(Gn) # les bornes

Gn(knots(Gn)) # évaluation aux bornes

Gn(c(20, 150, 1000)) # évaluation en d'autres points

plot(Gn) # graphique

## Pour l'histogramme de données groupées, le package définit une

## méthode de 'hist' pour les objets de classe 'grouped.data'.

hist(gdental) # aussi simple que cela

###

### ESTIMATEURS DE LA FONCTION DE SURVIE

###

## ESTIMATEUR DE NELSON-AALEN

## Définition d'une fonction 'naalen' et d'une méthode de 'plot'.

## L'objet retourné par 'naalen' hérite de la classe 'stepfun', ce qui

## fournit automatiquement des méthodes de 'print', 'summary' et

## 'knots', entre autres.

naalen <- function(x)

Fn <- ecdf(x)

y <- knots(Fn)

fn <- diff(c(0, Fn(y)))

res <- approxfun(y, cumsum(fn / c(1, head(1 - Fn(y), -1))),

yleft = 0, f = 0, rule = 2,

method = "constant")

class(res) <- c("naalen", "stepfun", class(res))

attr(res, "call") <- sys.call()

res

## Méthode de 'plot' pour faire le graphique. Voir ?plotmath pour les

## annotations mathématiques qu'il est possible de faire sur des

## graphiques.

plot.naalen <- function (x, ..., ylab = expression(paste(hat(H), "(x)")),

verticals = FALSE)

plot.stepfun(x, ..., ylab = ylab, verticals = verticals)

Page 146: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

136 Modélisation non paramétrique

## On peut aussi calculer l'estimateur de Nelson-Aalen dans R avec les

## fonctions 'Surv' et 'survfit' du package d'analyse de survie

## survival. Celui-ci est distribué avec R.

library(survival)

## La fonction d'estimation de la fonction de survie est 'survfit'. Le

## premier argument de la fonction est une formule dont le côté gauche

## est un objet de classe 'Surv' contenant les données et créé avec la

## fonction du même nom. Dans notre contexte, le côté droit de la

## formule est simplement 1.

##

## Pour des données complètes, comme c'est le cas dans cet exemple, il

## suffit de passer le vecteur des observations à 'Surv'.

x <- c(0.8, 2.9, 2.9, 3.1, 4.0, 4.0, 4.1, 4.8) # données brutes

Surv(x) # données "de survie"

## On calcule ensuite l'estimateur de la fonction de survie par la

## méthode de Nelson-Aalen avec la fonction 'survfit'. Pour ce faire,

## il faut spécifier le type d'estimation "fleming-harrington".

fit <- survfit(Surv(x) ~ 1, type = "fl") # ajustement du modèle

summary(fit) # fonction de survie estimée

plot(fit) # graphique de S(x) estimée

plot(fit, fun = "cumhaz") # graphique de H(x) estimée

## ESTIMATEUR DE KAPLAN-MEIER

## On peut calculer l'estimateur de Kaplan--Meier dans R avec les

## fonctions 'Surv' et 'survfit' du package survival. Nous l'avons

## chargé en mémoire précédemment.

##

## La fonction d'estimation de la fonction de survie est 'survfit'.

## Cependant, elle requiert des données sous forme d'objet de type

## 'Surv', créé avec la fonction du même nom.

##

## Pour nos besoins, il suffit de connaître les trois premiers

## arguments de 'Surv'. Il s'agit, dans l'ordre, de:

##

## time: vecteur des points de troncature d_j (j = 1, ..., n) si

## les données sont tronquées et censurées, ou valeur de

## l'argument 'time2' si les données ne sont que censurées;

## time2: vecteur des observations x_j et des données censurées

## u_j (j = 1, ..., n);

## event: vecteur indiquant si la donnée j (j = 1, ..., n) est une

## observation x_j (1, "décès") ou une donnée censurée u_i

## (0, "vivant").

Page 147: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

3.6. Code informatique 137

##

## On définit un objet contenant les données D2 de Loss Models.

d <- c(rep(0, 30), 0.3, 0.7, 1.0, 1.8, 2.1, 2.9, 2.9, 3.2, 3.4, 3.9)

x <- c(0.1, 0.5, 0.8, 0.8, 1.8, 1.8, 2.1, 2.5, 2.8, 2.9, 2.9, 3.9,

4.0, 4.0, 4.1, 4.8, 4.8, 4.8, rep(5.0, 12), 5.0, 5.0, 4.1,

3.1, 3.9, 5.0, 4.8, 4.0, 5.0, 5.0)

e <- rep(0, 40); e[c(4, 10, 11, 13, 16, 33, 34, 38)] <- 1

Surv(d, x, e) # objet contenant les données

## On peut ensuite passer ces données à 'survfit' sans autre argument.

## Par défaut, la fonction ajuste les données avec l'estimateur de

## Kaplan-Meier.

(fit <- survfit(Surv(d, x, e) ~ 1)) # ajustement du modèle

(sfit <- summary(fit)) # fonction de survie estimée

plot(fit) # graphique de S_n(t)

## L'objet 'sfit' défini ci-dessus est une liste comportant, entre

## autres, les éléments suivants:

##

## surv: valeurs de S_n(y_j), j = 1, ..., k;

## time: valeurs de y_j;

## n.risk: valeurs de r_j;

## n.event: valeurs de s_j;

## std.err: approximations de Greenwood de Var[S_n(y_j)].

##

## On va comparer les valeurs de l'élément 'std.err' avec le calcul

## fait à partir de la formule présentée à la section 3.3.3.

## [Remarque: la fonction 'with' ci-dessous permet de faire des

## calculs "à l'intérieur" d'une liste ou d'un data frame,

## c'est-à-dire en utilisant directement les noms des éléments de la

## liste.]

sfit$std.err^2 # valeurs obtenues avec 'survfit'

with(sfit, # calcul manuel

surv^2 * cumsum(n.event/(n.risk * (n.risk - n.event))))

## Il est laissé en exercice de reproduire les résultats de l'exemple

## 3.5 avec 'survfit'.

###

### ESTIMATION PAR NOYAUX

###

## On va comparer l'histogramme et divers estimateurs par noyaux du

## jeu de données suivant.

x <- c(10, 25, 40, 50, 100, 205, 208, 250, 768, 1045, 1067,

Page 148: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

138 Modélisation non paramétrique

1104, 1590, 1780, 1967, 1987, 2000, 2000, 2560, 2789,

5067, 5896, 5890, 6980, 7000)

## Histogramme. On le sauvegarde dans un objet 'h' pour pouvoir le

## réutiliser plusieurs fois.

h <- hist(x, breaks = c(0, 500, 1500, 2500, 3000, 6000, 7000))

## La fonction 'density' de R calcule l'estimateur par noyaux d'un jeu

## de données. La fonction supporte tous les noyaux présentés dans la

## section 3.4 sauf le noyau gamma, ainsi que quelques autres. Outre

## un vecteur de données, la fonction a deux arguments principaux:

##

## bw: la largeur de bande;

## kernel: le type de noyau à utiliser ("gaussian", "epanechnikov",

## "rectangular", "triangular", ...).

##

## La paramétrisation des noyaux dans R est légèrement différente de

## celle des notes: l'écart type du noyau est toujours égal à la

## largeur de bande. L'argument 'bw' ne correspond donc pas tout à

## fait à notre paramètre b, sauf dans le cas du noyau gaussien. La

## largeur de bande par défaut est calculée par la fonction 'bw.nrd0'.

bw.nrd0(x) # largeur de bande par défaut

R <- diff(quantile(x, c(0.25, 0.75))) # espace interquartile

0.9 * min(sd(x), R/1.34)/length(x)^0.2 # vérification

(fg <- density(x, kernel = "gaussian")) # noyau gaussien

plot(fg) # graphique

## Séparation du périphérique graphique en quatre parties (deux lignes

## et deux colonnes) pour accueillir autant de graphiques. La fonction

## 'par' sert à régler les multiples paramètres graphiques. La fonction

## retourne les paramètres précédents, que l'on sauvegarde pour les

## rétablir plus tard.

op <- par(mfrow = c(2, 2))

## Comparaison de plusieurs noyaux avec la largeur de bande par

## défaut.

plot(h); lines(density(x, kernel = "r"), col = "red") # uniforme

plot(h); lines(density(x, kernel = "t"), col = "red") # triangulaire

plot(h); lines(density(x, kernel = "e"), col = "red") # Epanechnikov

plot(h); lines(density(x, kernel = "g"), col = "red") # gaussien

## Plus que le type de noyau, c'est surtout la largeur de bande qui a

## un impact sur l'estimateur. Plus la bande est large et plus

## l'estimateur est lisse puisque les noyaux se chevauchent davantage.

plot(density(x, kernel = "r", adjust = 0.25)) # 25 % du défaut

Page 149: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

3.6. Code informatique 139

plot(density(x, kernel = "r", adjust = 0.50)) # 50 % du défaut

plot(density(x, kernel = "r", adjust = 1.25)) # 125 % du défaut

plot(density(x, kernel = "r", adjust = 1.50)) # 150 % du défaut

## Même exercice, mais avec le noyau d'Epanechnikov.

plot(density(x, kernel = "e", adjust = 0.25)) # 25 % du défaut

plot(density(x, kernel = "e", adjust = 0.50)) # 50 % du défaut

plot(density(x, kernel = "e", adjust = 1.25)) # 125 % du défaut

plot(density(x, kernel = "e", adjust = 1.50)) # 150 % du défaut

## Rétablir les anciens paramètres graphiques.

par(op)

###

### STATISTIQUES DESCRIPTIVES EMPIRIQUES

###

## On va illustrer avec les données 'dental' et 'gdental' les

## différentes fonctions disponibles dans R et dans actuar pour

## calculer les statistiques descriptives empiriques.

library(actuar)

data(dental)

data(gdental)

## SOMMAIRE DE DONNÉES INDIVIDUELLES

## La fonction 'summary' fournit rapidement et simplement les minimum,

## maximum, médiane, 2e et 3e quartiles ainsi que la moyenne de

## données individuelles.

summary(dental)

## MOMENTS

## On a des fonctions pour accéder aux moments empiriques les plus

## usuels.

mean(dental) # moyenne

var(dental) # variance (sans biais)

sd(dental) # écart type

## actuar fournit également une méthode de 'mean' pour les données

## groupées.

mean(gdental)

## Plus généralement, la fonction 'emm' de actuar permet de calculer

## n'importe quel moment (non centré) et ce, pour des données

Page 150: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

140 Modélisation non paramétrique

## individuelles ou groupées.

(mu <- emm(dental)) # moyenne

emm(dental, 2) - emm(dental)^2 # variance (biaisée)

emm(dental - mu, 3)/sd(dental)^3 # asymétrie

emm(gdental, 2) - emm(gdental)^2 # variance données groupées

## ESPÉRANCE LIMITÉE

## actuar fournit la fonction 'elev' pour calculer la fonction

## d'espérance limitée empirique en n'importe quelle limite (données

## individuelles et groupées). Le fonctionnement est similaire à

## 'ecdf' et 'ogive'.

(lev <- elev(dental)) # définition

lev(knots(lev)) # calcul en chacun des points

lev(1200) # calcul en un point quelconque

mean(pmin(dental, 1200)) # vérification

plot(lev) # graphique

## Pour illustrer avec des données groupées, on vérifie le résultat de

## l'exemple 3.10.

x <- grouped.data(cj = c(0, 100, 200, 500), nj = c(5, 10, 2))

elev(x)(120) # = 1670/17

## QUANTILES

## La fonction 'quantile' de R calcule les quantiles empiriques pour

## des données individuelles selon l'un de sept (!) algorithmes

## différents. Sans autre argument, la fonction retourne les quartiles

## de l'échantillon selon l'algorithme 7 présenté dans les remarques

## de la section 3.5.4. «Notre» algorithme est le numéro 6.

quantile(dental) # utilisation simple

quantile(dental, c(0.45, 0.80)) # autres quantiles

y <- sort(dental) # statistiques d'ordre

0.3 * y[3] + 0.7 * y[4] # algorithme de R

quantile(dental, 0.30) # vérification

0.7 * y[3] + 0.3 * y[4] # notre algorithme

quantile(dental, 0.3, type = 6) # numéro 6

## Pour des données groupées, la méthode de 'quantile' définie par

## actuar retourne simplement l'inverse de l'ogive.

quantile(gdental) # utilisation simple

quantile(gdental, c(0.45, 0.80)) # autres quantiles

ogive(gdental)(quantile(gdental)) # inverse de l'ogive

Page 151: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

3.7. Exercices 141

3.7 Exercices

3.1 Un assureur présente les coûts (en millions de $) créés par les écrasements demétéorites :

3,5,5,6,8,8,8,8,9,10,10,11,11,11,16,21,23,26,29,36.

a) Faire des graphiques de la fonction de répartition empirique et de la fonc-tion de masse de probabilité empirique du coût des écrasements.

b) À partir des bornes c0 = 2, c1 = 7, c2 = 12, c3 = 22 et c4 = 38, écrire l’équationde l’ogive.

c) En utilisant les mêmes bornes qu’en b), écrire l’équation de l’histogramme.

3.2 Le tableau ci-dessous présente les sinistres enregistrés par un assureur.

Classe Nombre de sinistres

(0,50] 36(50,150] x

(150,250] y(250,500] 84

(500,1000] 80(1000,∞) 0

Total n

Soit Fn(·) l’ogive correspondant à ces données. Sachant que Fn(90) = 0,21 etFn(210) = 0,51, déterminer la valeur de x.

3.3 Pour 500 sinistres, un assureur a enregistré la distribution présentée au tableauci-dessous.

Classe Nombre de sinistres

(0,500] 200(500,1000] 110

(1000,2000] x(2000,5000] y

(5000,10000](10000,25000]

(25000,∞)

Soit Fn(·) l’ogive correspondant à ces données. Sachant que F500(1500) = 0,689et F500(3500) = 0,839, calculer la valeur de y .

Page 152: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

142 Modélisation non paramétrique

3.4 Au cours de la dernière année, la compagnie d’assurance Big Company aremboursé les sinistres présentés dans le tableau ci-dessous.

Classe Nombre de sinistres

0 – 1 000 161 000 – 3 000 223 000 – 5 000 25

5 000 – 10 000 1810 000 – 25 000 1025 000 – 50 000 5

50 000 – 100 000 3100 000 et plus 1

Tracer l’ogive de ces données et calculer, à la main et avec R, la probabilité quele montant d’une réclamation soit compris entre 2000 $ et 6000 $. Expliquer letraitement réservé à la dernière classe.

3.5 Un assureur a enregistré les montants de sinistres suivants au cours de ladernière année :

80,153,162,267,410.

Soit F (x) l’estimateur avec noyaux uniformes de bande 50 de la fonction derépartition et soit F5(x) la fonction de répartition empirique. Calculer |F5(150)−F (150)|.

3.6 Un assureur estime la densité des données 150,210,240,300 à l’aide d’unestimateur avec noyaux triangulaires de largeur de bande 50.

a) Calculer la moyenne de f (x).

b) Tracer le graphique de f (x).

3.7 Un échantillon est composé des valeurs 5,7,4,5,9,8,3,5,4,10. Évaluer aupoint 6,2 un estimateur de la densité avec

a) noyaux uniformes et largeur de bande 0,5.

b) noyaux uniformes et largeur de bande 1.

c) noyaux uniformes et largeur de bande 2.

d) noyaux uniformes et largeur de bande 3.

e) noyaux triangulaires et largeur de bande 0,5.

f) noyaux triangulaires et largeur de bande 1.

g) noyaux triangulaires et largeur de bande 2.

Page 153: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

3.7. Exercices 143

3.8 Pour l’échantillon 2,4,6,8,10, on construit un estimateur lissé de la densitéde probabilité avec noyaux triangulaires. Quelle est la plus petite largeur debande qui assure que f (5) = 0,01 ?

3.9 Un assureur a enregistré les montants suivants (en 1000000 $) liés à des catas-trophes naturelles :

2,2,2,2,2,2,2,2,2,2,2,2,3,3,3,3,4,4,4,5,5,5,5,

6,6,6,6,8,8,9,15,17,22,23,24,24,25,27,32,43.

a) Tracer le graphique de la fonction de répartition empirique F40.

b) En utilisant les bornes c0 = 1,5, c1 = 2,5, c2 = 6,5, c3 = 29,5, et c4 = 49,5,tracer l’ogive des données sur le même graphique que pour la sous-questionprécédente. L’ajustement semble-t-il bon ? Détailler. Le choix des bornessemble-il correct ?

c) Tracer l’histogramme des données en utilisant les mêmes classes qu’en b).

d) Calculer la moyenne et l’écart type empiriques.

3.10 Un assureur a enregistré les montants de sinistres suivants (en millions) :

1,2,2,4,6,6,6,8,8,10.

Construire un intervalle de confiance de niveau 0,95 pour F (4).

3.11 Le tableau ci-dessous présente les sinistres censurés à droite enregistrés parun assureur pendant l’année 2002.

Montant Nombre de sinistres Groupe-risque

500 3 52800 10 40

1200 11 191700 2 6

Calculer l’estimateur de F (1200) basé sur l’estimateur de Nelson–Åalen Hn(1200).

3.12 Le tableau ci-dessous présente les sinistres enregistrés par un assureur pen-dant l’année 2006.

Montant Nombre de sinistres Groupe-risque

1000 1 203400 1 194500 1 187500 1 17

15000 1 1617500 1 15

Page 154: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

144 Modélisation non paramétrique

a) Déterminer l’estimateur de Nelson-Åalen, Hn(x), pour les six valeurs dutableau.

b) On va maintenant tenter d’appliquer la méthode d’estimation par noyauxau taux d’incidence. Pour une fonction de densité, l’estimateur par noyauxest

f (x) =s∑

j=1fn(y j )k j (x),

que l’on peut aussi écrire sous la forme

f (x) = 1

b

s∑j=1

fn(y j )k j

( x − y j

b

)en définissant k j sur l’intervalle [−1,1]. Par analogie, pour le taux d’inci-dence, on va utiliser

h(x) = 1

b

s∑j=1

hn(y j )k j

( x − y j

b

),

en estimant hn(y j ) par ∆Hn(y j ). En utilisant un noyau uniforme, c’est-à-dire

k(x) =

1/2, −1 ≤ x ≤ 1

0, ailleurs

et une largeur de bande de 6000, calculer h(10000).

3.13 Un assureur a enregistré les 30 réclamations suivantes : deux réclamationsde 2000 $, six réclamations de 4000 $, 12 réclamations de 6000 $ et 10 récla-mations de 8000 $. Donner la valeur de l’estimateur empirique du coefficientd’asymétrie et son interprétation.

3.14 Le tableau ci-dessous présente les réclamations enregistrées par un petitassureur automobile pendant une année.

Montant enregistré Fréquence

100 1200 4300 10400 4500 1

Page 155: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

3.7. Exercices 145

Calculer les estimateurs empiriques du coefficient d’asymétrie et du coeffi-cient d’aplatissement.

3.15 Soit l’échantillon suivant

12,16,20,23,26,28,30,32,33,35,36,38,39,40,41,43,45,47,50,57.

a) Calculer l’estimateur lissé du soixantième centile.

b) Calculer l’estimateur lissé du troisième quartile.

3.16 On a les données groupées présentées dans le tableau ci-dessous. En suppo-sant que les données sont distribuées uniformément sur chacun des inter-valles, calculer une estimation empirique de E [min(X ,320)].

Classe Nombre de données

(0,50] 20(50,100] 34

(100,200] 22(200,500] 24

3.17 On dispose d’un échantillon de cinq données d’une distribution continue. Àpartir de cet échantillon, un intervalle de confiance non paramétrique pourla médiane est construit, dont les bornes sont les 2e et 4e statistiques d’ordrede l’échantillon. Quel est le niveau de confiance de cet intervalle ?

3.18 On dispose d’un échantillon de taille 500 d’une distribution continue. À partirde cet échantillon, un intervalle de confiance non paramétrique pour lamédiane est construit, dont les bornes sont les statistiques d’ordre X(240) etX(260) de l’échantillon. Quel est le niveau de confiance de cet intervalle ?

3.19 Un assureur a enregistré les montants de sinistres suivants (en milliers) :

1,1,1,2,2,3,5,6,9,10,12,15,15,20,30,32,33,33,35,40.

Déterminer le niveau de confiance de l’intervalle [10,20) pour π0,55.

3.20 Soit Y ∼ Gamma(α,λ) et X = eY . On a

fY (y) = λα

Γ(α)yα−1e−λy , y > 0.

a) Déterminer la distribution de X .

Page 156: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

146 Modélisation non paramétrique

b) Soit α= 1 et l’estimateur

λ= X

X −1.

Évaluer empiriquement le biais de cet estimateur de la façon suivante :

1. Choisir une valeur de λ plus grande que 1 (la solution est construiteavec λ= 5).

2. Simuler des observations x( j )1 , . . . , x( j )

n de la variable X dont la distribu-tion a été déterminée en a).

3. Répéter les étapes 2 et 3 pour j = 1,2, . . . ,r .

4. Calculer le biais moyen

5. Estimer le biais comme suit :

bλ(λ) = 1

r

r∑j=1

λ( j ) −λ.

Faire cette estimation pour

i) n = 10 et r = 1000 ;

ii) n = 1000 et r = 100 ; et

iii) n = 1000 et r = 1000.

Discuter de l’impact du nombre d’observations dans l’échantillon et dunombre de répétitions dans la simulation.

c) En utilisant les estimateurs de la partie b) ii), tracer la fonction de réparti-tion empirique de λ.

d) En utilisant les estimateurs de la partie c) et les classes calculées auto-matiquement par la fonction hist, tracer l’histogramme et l’ogive de ladistribution de λ.

e) Calculer les 45e et 70e quantiles lissés des données de la partie c).

Exercices proposés dans LossModels, 4e éd.

11.2, 11.3, 11.4, 11.6, 11.7, 11.8, 11.9, 11.10, 12.2, 12.3, 12.6, 12.7, 12.8, 12.11, 12.12,12.14, 12.18, 12.19, 12.22, 12.25, 12.28, 12.29, 12.31, 12.34, 12.35, 3.1, 3.2, 3.4, 3.13,3.14, 3.16, 13.9, 13.10

Page 157: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

3.7. Exercices 147

Réponses

3.1 a)

F20(x) =

0, x ≤ 2

(x −2)/25, 2 < x ≤ 7

(x −5)/10, 7 < x ≤ 12

(x +58)/100, 12 < x ≤ 22

(x +42)/80, 22 < x ≤ 38

1, x > 38

b)

f20(x) =

0, x ≤ 2

1/25, 2 < x ≤ 7

1/10, 7 < x ≤ 12

1/100, 12 < x ≤ 22

1/80, 22 < x ≤ 38

0, x > 38.

3.2 120

3.3 81

3.4 0,396

3.5 0,17

3.6 a) 225

3.7 a) 0 b) 0,05 c) 0,125 d) 0,1333 e) 0 f) 0,02 g) 0,095

3.8 1,0264

3.9 a) 9,225 et 10,2369

3.10 (0,0964,0,7036)

3.11 0,5880

3.12 a) 0,05, 0,1026, 0,1582, 0,2170, 0,2795, 0,3462 b) 0,00001449

3.13 −0,559

3.14 γ1 = 0, γ2 = 3,125

3.15 a) 38,6 b) 42,5

Page 158: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

148 Modélisation non paramétrique

3.16 134,54

3.17 0,625

3.18 0,6287

3.19 0,6208

3.20 a) Log-gamma(α,λ)

Page 159: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

4 Modèles paramétriquespotentiels

Objectifs du chapitre

x Définir et connaître les principales caractéristiques (densité, fonction de répartition,moments, espérance limitée) des lois gamma et bêta à la base des familles dedistributions du même nom.

x Déterminer la distribution d’une fonction d’une ou plusieurs variables aléatoires eten calculer les principales caractéristiques.

x Démontrer l’effet d’un changement de paramètre sur une distribution de sévérité.x Appliquer les techniques suivantes pour créer de nouvelles distributions : multipli-

cation par une constante, élévation à une puissance, exponentielle et logarithme,mélanges continus et discrets, raccordement.

x Caractériser les modèles de montants de sinistres en fonction de leurs valeursextrêmes.

Dans ce chapitre, nous allons développer des modèles qui pourront être utiliséspour représenter les montants des sinistres. Les modèles paramétriques potentielsdevront permettre de représenter une variable aléatoire qui est toujours positive,qui peut prendre des valeurs sur l’intervalle (0,∞) et qui est continue. De plus, ilfaudra trouver des façons de caractériser les valeurs extrêmes.

4.1 Famille gamma

Les distributions de la famille gamma sont parmi les plus utilisées en actuariat.On rappelle ici quelques résultats importants à leur propos.

La distribution gamma est continue et définie sur l’intervalle (0,∞), ce quien fait un choix intéressant pour la modélisation des montants de sinistres en

149

Page 160: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

150 Modèles paramétriques potentiels

assurance IARD. Soit X ∼ Gamma(α,λ). Dans cet ouvrage, nous utilisons la para-métrisation suivante :

fX (x) = λα

Γ(α)xα−1e−λx , x > 0,

Γ(α) =∫ ∞

0tα−1e−t d t

est la fonction gamma. De plus,

FX (x) =∫ x

0

λα

Γ(α)yα−1e−λy d y.

Or, en posant u =λy dans cette intégrale, on obtient

FX (x) = 1

Γ(α)

∫ λx

0uα−1e−u du

= Γ(α;λx),

Γ(α; x) = 1

Γ(α)

∫ x

0tα−1e−t d t , α> 0, x > 0

est la fonction gamma incomplète.On rencontre également fréquemment la paramétrisation alternative où θ =

1/λ, c’est-à-dire avec fonction de densité de probabilité

fX (x) = 1

θαΓ(α)xα−1e−x/θ, x > 0.

Lorsque α= 1, la distribution est appelée une exponentielle. Lorsque α= r /2 etλ= 1/2, la distribution est appelée une khi carré avec r degrés de liberté. Le modede la distribution est en x = 0 si α≤ 1 et en x > 0 si α> 1. Voir la figure 4.1 pour uneillustration de chaque cas. Enfin, une distribution gamma avec paramètre α entierest également nommée Erlang.

Les deux résultats suivants permettent d’évaluer la fonction de densité deprobabilité et la fonction de répartition, en particulier lorsque le paramètre α estun entier.

Théorème 4.1. Soit Γ(α) la fonction gamma. Alors

Γ(α+1) =αΓ(α).

Page 161: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

4.1. Famille gamma 151

0 1 2 3 4 5

0.0

0.5

1.0

1.5

2.0

x

f X(x

)

(a) α≤ 1

0 1 2 3 4 5

0.0

0.2

0.4

0.6

x

f X(x

)

(b) α> 1

FIG. 4.1: Densités gamma pour différentes valeurs du paramètre α

Démonstration. En intégrant par parties, on obtient

Γ(α+1) =∫ ∞

0t (α+1)−1e−t d t

= tα(−e−t )|∞0 +∫ ∞

0αtα−1e−t d t

= 0+αΓ(α)

=αΓ(α).

Théorème 4.2. Soit Γ(α; x) la fonction gamma incomplète. Si α est un entier, alors

Γ(α; x) = 1−α−1∑j=0

x j e−λx

j !.

Démonstration. On démontre le résultat par induction (Klugman et collab., 2012a,annexe A) ou encore en intégrant

1

Γ(α)

∫ x

0tα−1e−t d t

par parties à α−1 reprises.

Page 162: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

152 Modèles paramétriques potentiels

Du théorème précédent, on a que si le paramètre α est un entier, alors

FX (x) = 1−α−1∑j=0

(λx) j e−λx

j !.

Exemple 4.1. Soit X ∼ Gamma(4,2). Alors

FX (2,5) = 1−e−53∑

j=0

5 j

j !

= 1−e−5(1+5+ 25

2+ 125

6

)= 0,7349741.

On peut vérifier ce résultat avec R :

> pgamma(2.5, 4, 2)

[1] 0.7349741

Le moment d’ordre k de la distribution gamma est

E [X k ] = λα

Γ(α)

∫ ∞

0xα+k−1e−λx d x

= λα

Γ(α)

Γ(α+k)

λα+k

∫ ∞

0

λα+k

Γ(α+k)xα+k−1e−λx d x

= Γ(α+k)

Γ(α)λk

pour k >−α. Si k ∈Z (entier positif ou négatif), ce résultat se réduit à

E [X k ] =

α(α+1) · · · (α+k −1)

λk, k ≥ 1

1, k = 0

λ|k|

(α−1)(α−2) · · · (α−|k|) , k ≤−1, |k| <α.

Page 163: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

4.2. Famille bêta 153

De plus, l’espérance limitée est

E [X ; x] = 1

Γ(α)

∫ x

0(λy)α+1−1e−λy d y +x(1−FX (x))

= 1

λΓ(α)

∫ λx

0uαe−u du +x(1−FX (x))

= Γ(α+1)

λΓ(α)Γ(α+1;λx)+x(1−FX (x))

= α

λΓ(α+1;λx)+x(1−Γ(α;λx)).

4.2 Famille bêta

La distribution bêta est continue et définie sur un intervalle fini. Elle est doncrarement utilisée pour la modélisation des montants de sinistres. Par contre, ellejoue un rôle important dans la création de nouvelles distributions, comme nousle verrons plus loin. Lorsque son domaine est restreint à l’intervalle (0,1), elle estsouvent utilisée comme modèle pour une probabilité.

On débute la présentation avec une version de la distribution bêta à troisparamètres, où le troisième paramètre est la borne supérieure du support de ladistribution. Ainsi, soit X ∼ Bêta(α,β,θ) une variable aléatoire avec fonction dedensité de probabilité

f (x) = Γ(α+β)

Γ(α)Γ(β)

1

θ

( x

θ

)α−1 (1− x

θ

)β−1

= 1

β(α,β)

1

θ

( x

θ

)α−1 (1− x

θ

)β−1, 0 < x < θ,

β(a,b) =∫ 1

0t a−1(1− t )b−1 d t

= Γ(a)Γ(b)

Γ(a +b)

est la fonction bêta. La fonction de répartition est

F (x) =β(α,β; x/θ),

β(a,b; x) = 1

β(a,b)

∫ x

0t a−1(1− t )b−1 d t , a > 0, b > 0, 0 < x < 1

Page 164: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

154 Modèles paramétriques potentiels

0.0 0.2 0.4 0.6 0.8 1.0

0.95

1.05

1.15

1.25

x

f X(x

)

(a) α=β< 1

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.5

1.0

1.5

x

f X(x

)(b) α>β> 1

FIG. 4.2: Densités bêta pour différentes valeurs des paramètres α et β

est la fonction bêta incomplète régularisée.La version la plus usuelle de la loi bêta a θ = 1. Lorsqueα=β= 1, la distribution

est appelée une uniforme.Dès que α< 1 ou β< 1, la fonction de densité de probabilité est concave vers

le haut. Lorsque les deux paramètres sont strictement supérieurs à 1, la fonctionest plutôt concave vers le bas. Enfin, la distribution est symétrique lorsque α=β,asymétrique à gauche (γ1(X ) < 0) lorsque α>β et asymétrique à droite (γ1(X ) > 0)lorsque β>α. Voir la figure 4.2 pour des illustrations.

Le moment d’ordre k est

E [X k ] = Γ(α+β)

Γ(α)Γ(β)

∫ θ

0

xk

θ

( x

θ

)α−1 (1− x

θ

)β−1d x

= θkΓ(α+β)

Γ(α)Γ(β)

∫ 1

0uα+k−1(1−u)β−1 du

= θkΓ(α+β)Γ(α+k)

Γ(α)Γ(α+β+k)

pour k >−α. Si k ∈Z+ (entier positif), ce résultat se réduit à

E [X k ] = θkα(α+1) · · · (α+k −1)

(α+β)(α+β+1) · · · (α+β+k −1).

Page 165: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

4.3. Familles et paramètres d’échelle 155

L’espérance limitée est, quant à elle,

E [X ; x] = θΓ(α+β)

Γ(α)Γ(β)

∫ x/θ

0uα+1−1(1−u)β−1 du +x(1−FX (x))

= θΓ(α+β)Γ(α+1)

Γ(α)Γ(α+β+1)β(α,β; x/θ)+x(1−FX (x))

= θα

α+β β(α+1,β; x/θ)+x(1−β(α,β; x/θ)).

4.3 Familles et paramètres d’échelle

La notion de paramètre d’échelle d’une distribution a déjà été abordée ici et làde manière informelle. On donne ici une définition formelle.

Définition 4.1 (Famille d’échelle). Une famille de distributions est une familled’échelle si pour toute variable aléatoire X membre de cette famille, Y = c X estaussi membre de la famille.

Définition 4.2 (Paramètre d’échelle). Une famille d’échelle possède un paramètred’échelle si pour toute variable aléatoire X membre de cette famille et Y = c X , lesparamètres de Y sont identiques à ceux de X , à l’exception du paramètre d’échelle,qui est égal à c fois le paramètre d’échelle de X .

Klugman et collab. (2012a), dans leur l’annexe A, ont choisi une paramétrisationdes lois de probabilité telle que θ est toujours un paramètre d’échelle. Nous nesuivons pas cette convention en tout temps, en grande partie par habitude, maisaussi en partie afin d’avoir la même paramétrisation que les fonctions de lois deprobabilité de R.

Exemple 4.2. Soit X ∼ Gamma(α,λ) et Y = c X . On a alors

FY (x) = Pr[Y ≤ x]

= Pr[c X ≤ x]

= Pr[X ≤ x/c]

= FX (x/c)

= Γ(α;λx/c),

d’où Y ∼ Gamma(α,λ/c). La famille gamma est donc une famille d’échelle. Parcontre, λ n’est pas un paramètre d’échelle. C’est plutôt θ = 1/λ qui est un paramètred’échelle pour la famille gamma.

Page 166: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

156 Modèles paramétriques potentiels

Exemple 4.3. La famille bêta est une famille d’échelle et, de ses trois paramètres, θest un paramètre d’échelle. En effet, si X ∼ Bêta(α,β,θ) et Y = c X , alors

FY (x) = FX (x/c)

=β(α,β; x/(cθ)),

d’où Y ∼ Bêta(α,β,cθ).

Exemple 4.4. Soit X ∼ Pareto(α,λ) et Y = c X . Alors

FY (x) = FX (x/c)

= 1−(

λ

λ+x/c

)α= 1−

(cλ

cλ+x

)α,

d’où Y ∼ Pareto(α,cλ). Le paramètre λ constitue donc un paramètre d’échelle dela distribution de Pareto.

4.4 Création de distributions à partir de distributionsconnues

L’idée ici est de créer de nouvelles distributions par diverses transformationsde distributions connues, en particulier les lois gamma et bêta.

4.4.1 Multiplication par une constante

La multiplication par une constante équivaut essentiellement à un changementd’échelle. En général, c’est une transformation qui est combinée avec une autreplus complexe.

Soit X , une variable aléatoire avec densité fX (x) et Y = c X , c > 0. On a alors

FY (y) = Pr[Y ≤ y]

= Pr[

X ≤ y

c

]= FX (y/c)

et

fY (y) = 1

cfX (y/c).

Exemple 4.5. Il est simple de vérifier que si X ∼ Exponentielle(1), alors Y = X /λ∼Exponentielle(λ).

Page 167: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

4.4. Création de distributions à partir de distributions connues 157

4.4.2 Élévation à une puissance

Soit X , une variable aléatoire strictement positive (FX (0) = 0) et Y = X 1/τ. Siτ> 0, alors

FY (y) = FX (yτ)

fY (x) = τyτ−1 fx (yτ).

Si τ< 0, alors on a

FY (y) = 1−FX (yτ)

fY (y) =−τyτ−1 fX (yτ).

On utilise généralement la terminologie suivante :

x τ> 0 : la distribution de Y est la distribution de X transformée ;

x τ=−1 : la distribution de Y est la distribution de X inverse ;

x τ< 0 : la distribution de Y est la distribution de X transformée inverse.

Exemple 4.6. Soit X ∼ Exponentielle(1) et

Y = X 1/τ

λ, τ> 0,

soit une transformation suivie d’un changement d’échelle. Alors

FY (y) = FX ((λy)τ)

= 1−e−(λy)τ ,

et

fY (y) = τλτyτ−1e−(λy)τ ,

d’où Y ∼ Weibull(τ,λ). Attention : la Weibull est parfois paramétrée de telle sorteque

f (x) = τλyτ−1e−λyτ ,

ce qui correspond plutôt à la transformation Y = (X /λ)1/τ.Si τ< 0, on a

FY (y) = 1−FX ((λy)τ)

= e−(λy)τ

= e−(λy)−τ∗

,

Page 168: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

158 Modèles paramétriques potentiels

avec τ∗ =−τ. On a alors Y ∼ Weibull inverse(τ∗,λ).Enfin, si τ=−1, on a

FY (y) = 1−FX

(1

λy

)= e−1/(λy),

soit Y ∼ Exponentielle inverse(λ).

Exemple 4.7. La famille gamma transformée est une extension de la famille gammaobtenue par transformation d’une variable aléatoire gamma. Soit X ∼ Gamma(α,1)et

Y = X 1/τ

λ.

Si τ> 0, alors

FY (y) = Γ(α; (λy)τ)

et

fY (y) = λτα

Γ(α)τyατ−1e−(λy)τ ,

et l’on dit que Y ∼ Gamma transformée(α,τ,λ). Lorsque ατ ≤ 1, le mode de ladistribution est en y = 0. Lorsque ατ> 1, le mode de la densité est alors en y > 0(voir la figure 4.3).

Outre la gamma transformée elle-même, les principaux membres de la famillegamma transformée sont :

1. Weibull(τ,λ) lorsque α= 1 ;

2. Gamma(α,λ) lorsque τ= 1 ;

3. Exponentielle(λ) lorsque α= τ= 1.

Les relations entre les membres de la famille sont illustrées à la figure 4.4.Si τ< 0 dans la transformation ci-dessus et τ∗ =−τ, alors on obtient

FY (y) = 1−Γ(α; (λy)−τ∗)

et

fY (y) = τ∗e−(λy)−τ∗

λτ∗αyατ∗+1Γ(α)

,

qui sont les fonctions de répartition et de densité de probabilité de la distributionGamma transformée inverse de paramètresα,λ et τ∗. Le mode de cette distributionest toujours strictement positif. Les membres de cette famille sont les distributionsinverses de celles de la figure 4.4.

Page 169: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

4.4. Création de distributions à partir de distributions connues 159

0 1 2 3 4 5

0.0

0.2

0.4

0.6

0.8

1.0

x

f(x)

(a) ατ= 1

0 1 2 3 4 5

0.0

0.2

0.4

0.6

0.8

x

f(x)

(b) ατ> 1

FIG. 4.3: Fonction de densité de probabilité de la loi gamma transformée

HHHHHHHj

HHHHH

HHj

Gamma transforméeα,τ,λ

α= 1

Weibullτ,λ

τ= 1

Exponentielleλ

α= 1

Gammaα,λ

τ= 1

FIG. 4.4: Relations entre les membres de la famille gamma transformée

Page 170: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

160 Modèles paramétriques potentiels

Exemple 4.8. On peut élargir la famille bêta par le biais d’une transformation. SoitX ∼ Bêta(τ,α) et

Y = θ(

X

1−X

)1/γ

.

Par la technique du changement de variable, on obtient

fY (y) = Γ(α+τ)

Γ(α)Γ(τ)

γ(y/θ)γτ

y(1+ (y/θ)γ)α+τ, y > 0,

d’où

FY (y) = Γ(α+τ)

Γ(α)Γ(τ)

∫ y

0

γ(x/θ)γτ

y(1+ (x/θ)γ)α+τd x.

Or, avec le changement de variable u = v/(1+v), v = (x/θ)γ (de sorte que 0 < u < 1),on obtient

FY (y) = Γ(α+τ)

Γ(α)Γ(τ)

∫ u

0uτ−1(1−u)α−1 du

=β(τ,α;u).

La distribution de la variable aléatoire Y est une bêta transformée de paramètresα, γ, τ et θ. La famille bêta transformée compte plusieurs membres dont, entreautres :

1. Burr(α,γ,θ) lorsque τ= 1 ;

2. Pareto généralisée(α,τ,θ) lorsque γ= 1 ;

3. Pareto(α,θ) lorsque γ= τ= 1.

Ces relations sont illustrées à la figure 4.5.De l’exemple 1.17, si X1 ∼ Gamma(τ,1), X2 ∼ Gamma(α,1) et X1 et X2 sont

indépendantes, alors Z = X1/(X1 +X2) ∼ Bêta(τ,α). Puisque

Z

1−Z= X1

X2,

on peut aussi définir la bêta transformée comme la distribution de

Y = θ(

X1

X2

)1/γ

.

Remarque. La distribution inverse gaussienne n’est pas l’inverse d’une normale.Le terme «inverse» provient plutôt de la relation entre les fonctions génératricesdes cumulants des deux lois.

Page 171: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

4.4. Création de distributions à partir de distributions connues 161

HHHH

HHHHj6

?

HHHH

HHHHHj?

6

?

?

HHHHHH

HHj

Bêta transforméeα,γ,τ,θ

α= 1

Burr inverseγ,τ,θ

γ= τ

Paralogistique inverseτ,θ

γ=α

Pareto inverseτ,θ

γ= 1

Pareto généraliséeα,τ,θ

τ= 1

Paretoα,θ

τ= 1

Burrα,γ,θ

γ=α

Paralogistiqueα,θ

α= τ

Log-logistiqueγ,θ

α= 1γ= 1 τ

= 1

FIG. 4.5: Relations entre les membres de la famille bêta transformée

4.4.3 Exponentielle (et logarithme)

Soit X , une variable aléatoire strictement positive (FX (0) = 0) et Y = e X . On aalors

FY (y) = FX (ln y)

et

fY (y) = 1

yfX (ln y), y > 0.

La distribution ainsi créée est dite «log-loi», dans la mesure où la distribution delnY est loi.

Remarque. Si la fonction génératrice des moments de X existe, il est alors simplede calculer les moments de Y puisque E [Y k ] = E [ek X ] = MX (k).

Exemple 4.9. Soit X ∼ Gamma(α,λ) et Y = e X . Premièrement, puisque X est défi-nie sur [0,∞), le domaine de Y est [1,∞). On a

fY (y) = λα(ln y)α−1

yλ+1Γ(α), y > 1

F (x) = Γ(α;λ ln x).

On dit que Y ∼ Log-gamma(α,λ). Pour modéliser des montants de sinistre, onutilise normalement Y −1.

Page 172: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

162 Modèles paramétriques potentiels

4.4.4 Mélanges de distributions

Un mélange de distributions (mixture of models) est le résultat du calcul de ladistribution marginale d’une distribution dont un (ou plusieurs) des paramètresest considéré comme une variable aléatoire.

Soit X |Θ= θ une variable aléatoire avec fonction de densité (ou de masse) deprobabilité f (x|θ) etΘ une variable aléatoire avec fonction de densité (ou de masse)de probabilité u(θ). Alors, par la loi des probabilités totales,

fX (x) =∫ ∞

−∞f (x|θ)u(θ)dθ

est la densité marginale de X .

Exemple 4.10. Soit X |Θ= θ ∼ Exponentielle(θ) etΘ∼ Gamma(α,λ). On a alors

fX (x) = λα

Γ(α)

∫ ∞

0θα−1e−λθθe−θx dθ

= λα

Γ(α)

∫ ∞

0θα+1−1e−(x+λ)θ dθ

= λα

Γ(α)

Γ(α+1)

(x +λ)α+1

∫ ∞

0

(x +λ)α+1

Γ(α+1)θα+1−1e−(x+λ)θ dθ

= αλα

(x +λ)α+1 ,

d’où X ∼ Pareto(α,λ).

Remarques.

1. LorsqueΘ est une variable aléatoire continue, on parle de mélange continu.

2. Un autre mélange (continu) bien connu est le suivant : si

X |Θ= θ ∼ Poisson(θ)

Θ∼ Gamma(α,λ)

alors X ∼ Binomiale négative(α,λ/(λ+1)).

3. On a les relations

E [X ] = E [E [X |Θ]]

Var[X ] = E [Var[X |Θ]]+Var[E [X |Θ]].

Page 173: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

4.4. Création de distributions à partir de distributions connues 163

Considérons le cas particulier suivant :Θ∼ Bernouilli(p), la variable aléatoireX |Θ= 1 a comme densité f1(x) et la variable aléatoire X |Θ= 0 a comme densitéf2(x). Alors

fX (x) =1∑

θ=0f (x|θ)pθ(1−p)1−θ

= p f1(x)+ (1−p) f2(x).

Ce mélange est appelé un «mélange discret».De manière générale, la fonction de densité d’un mélange discret de n densités

est

fX (x) =n∑

i=1pi fi (x),

où p1, . . . , pn ∈ [0,1] et∑n

i=1 pi = 1. On remarque que

FX (x) =n∑

i=1pi Fi (x)

et

E [X k ] =n∑

i=1pi E [X k

i ].

Remarque. La densité fX (x) = ∑ni=1 pi fXi (x) n’est pas la densité de la variable

aléatoire X =∑ni=1 pi Xi . Il s’agit de deux concepts entièrement différents. Dans le

premier, la probabilité associée à une valeur de X est un mélange des probabilitésassociées à cette même valeur par les densités f1, . . . , fn . En revanche, la relationX =∑n

i=1 pi Xi signifie que les valeurs possibles de X sont un mélange des valeurspossibles de X1, . . . , Xn .

Exemple 4.11. Les mélanges discrets sont très souvent utilisés pour créer de nou-velles distributions aux caractéristiques particulières que l’on ne retrouve pas chezles distributions d’usage courant.

Par exemple, la figure 4.6 montre qu’un mélange de deux distributions log-normales peut résulter en une fonction de densité de probabilité bimodale, maisayant néanmoins une queue similaire à celle d’une log-normale.

À la figure 4.7, on a créé une distribution en mélangeant une loi de Poissonavec une distribution binomiale négative avec un paramètre r < 1. Il en résulte unedistribution similaire à la Poisson, mais avec une queue sensiblement plus lourde :le maximum effectif (le 99,999e quantile pour être plus précis) de la distribution estainsi passé de 10 dans le cas de la Poisson pure, à près de 58 dans le mélange.

Page 174: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

164 Modèles paramétriques potentiels

0 50 100 150 200 250

0.00

00.

010

0.02

0

Lognormale(µ = 3,575, σ = 0,637)

x

f(x)

0 50 100 150 200 250

0.00

00.

010

Lognormale(µ = 4,555, σ = 0,265)

x

f(x)

0 50 100 150 200 250

0.00

00.

006

0.01

2

Mélange

x

f(x)

FIG. 4.6: Fonctions de densité de probabilité de deux log-normales et de leur mé-lange

Page 175: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

4.4. Création de distributions à partir de distributions connues 165

0 5 10 15 20

0.00

0.10

0.20

Poisson(2)

x

f(x)

0 5 10 15 20

0.00

0.15

0.30

Binomiale négative(0,3, 0,035)

x

f(x)

0 5 10 15 20

0.00

0.10

0.20

Mélange

x

f(x)

FIG. 4.7: Fonctions de probabilité d’une Poisson, d’une binomiale négative et deleur mélange

Page 176: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

166 Modèles paramétriques potentiels

4.4.5 Raccordement de distributions

Dans un mélange la densité en un point x provient en partie de chacune desdistributions du mélange. Dans un raccordement de distributions (spliced distri-butions, ou splicing), la densité en x provient de l’une ou l’autre des distributionsselon la valeur de x.

Soit fi , i = 1, . . . ,n, une fonction de densité sur l’intervalle (ci−1,ci ). Ainsi∫ ci

ci−1

fi (x)d x = 1

et on suppose que les intervalles (ci−1,ci ) sont disjoints. La fonction de densitéde probabilité de la variable aléatoire X résultat du raccordement des n densitésf1, . . . , fn est

fX (x) =

p1 f1(x), c0 < x < c1

p2 f2(x), c1 < x < c2...

...

pn fn(x), cn−1 < x < cn ,

où pi ∈ [0,1] et∑n

i=1 pi = 1.En pratique, il peut être difficile de trouver des distributions dont le support est

fini et limité à un intervalle (ci−1,ci ). Ainsi, de manière plus générale, si gi (x) estune densité de probabilité sur un intervalle plus grand que (ci−1,ci ) et Gi (x) est lafonction de répartition correspondante, alors on définit

fi (x) =

gi (x)

Gi (ci )−G(ci−1), ci−1 < x < ci

0, ailleurs.

Ainsi, la fonction fi demeure une fonction de densité sur (ci−1,ci ).

Remarques.

1. On peut considérer les points de raccordement connus ou encore comme desparamètres à estimer. Dans ce dernier cas, il faut veiller à ne pas ajouter unnombre excessif de paramètres au modèle.

2. Il n’y a aucune garantie que la densité résultant d’un raccordement est continue.Pour y arriver, on doit avoir

pi fi (ci ) = pi+1 fi+1(ci )

pour i = 1, . . . ,n −1.

Page 177: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

4.5. Fonctions R pour les lois de probabilité 167

Exemple 4.12. Soit X une variable aléatoire dont la densité est le raccordementd’une densité Gamma(2,0,1) sur l’intervalle (0,20) et d’une densité Gamma(16,0,4)sur l’intervalle (30,50) avec p1 = 0,6 et p2 = 0,4. On a donc

g1(x) = 0,01xe−0,1x , x > 0

g2(x) = 0,416

Γ(16)x15e0,4x , x > 0

et

fX (x) =

0,6

g1(x)

G1(20), 0 < x < 20

0,4g2(x)

G2(50)−G2(30), 30 ≤ x ≤ 50.

La figure 4.8 présente la densité de cette distribution.

4.5 Fonctions R pour les lois de probabilité

Le système R comporte des fonctions pour calculer les fonctions de densité,de répartition et de quantile de plusieurs lois de probabilité, de même que desfonctions pour générer des nombres aléatoires de ces lois. Pour une racine foo, lesfonctions R sont nommées, dans l’ordre, dfoo, pfoo, qfoo et rfoo.

Le package actuar fournit les fonctions d, p, q et r pour toutes les lois de pro-babilité de l’annexe A de Klugman et collab. (2012a) qui ne se trouvent pas déjàdans R, à l’exception de l’inverse gaussienne et de la log-t mais avec en plus lalog-gamma (Hogg et Klugman, 1984).

Le tableau 4.1 dresse la liste des lois de probabilité supportées par R et actuaret qui sont couramment utilisées pour la modélisation des montants de sinistres.On trouvera à l’annexe A les fonctions de densité et de répartition de ces lois, ainsique le nom des arguments des fonctions R correspondant à leurs paramètres.

En plus des fonctions d, p, q et r, actuar ajoute des fonctions m, lev et mgf pourcalculer, dans l’ordre, les moments théoriques, les moments limités et la fonctiongénératrice des moments, lorsqu’elle existe. Ces nouvelles fonctions sont définiespour toutes les lois du tableau 4.1 en plus des suivantes : bêta, khi carré, normale(sauf lev), uniforme et l’inverse gaussienne du package SuppDists (Wheeler, 2013).

4.6 Valeurs extrêmes

La caractérisation des distributions par leur comportement dans les valeursextrêmes est tout spécialement important en sciences actuarielles du fait de l’inci-dence financière des très grands sinistres.

Page 178: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

168 Modèles paramétriques potentiels

0 10 20 30 40 50

0.00

0.02

Gamma(2, 0.1)

x

g 1(x

)

0 10 20 30 40 50

0.00

0.02

0.04

Gamma(16, 0.4)

x

g 2(x

)

0 10 20 30 40 50

0.00

0.02

Raccordement

x

f(x)

FIG. 4.8: Fonction de densité de probabilité de deux lois gamma et leur raccorde-ment

Page 179: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

4.6. Valeurs extrêmes 169

Famille Loi Racine (alias)

Bêta transformée Bêta transformée trbeta (pearson6)Burr burr

Log-logistique llogis

Paralogistique paralogis

Pareto généralisée genpareto

Pareto pareto (pareto2)Burr inverse invburr

Pareto inverse invpareto

Paralogistique inverse invparalogis

Gamma transformée Gamma transformée trgamma

Gamma transformée inverse invtrgamma

Gamma* gamma

Gamma inverse invgamma

Weibull* weibull

Weibull inverse invweibull (lgompertz)Exponentielle* exp

Exponentielle inverse invexp

Autre Log-normale* lnorm

Log-gamma lgamma

Pareto translatée pareto1

Bêta généralisée genbeta

TAB. 4.1: Lois de probabilité pertinentes pour la modélisation de montants desinistres supportées par R et actuar. Les lois identifiées par un astérisque (*) sontincluses dans le système R de base.

Cette section présente diverses manières de classer les lois de probabilité selonle poids de leur queue.

4.6.1 Moments

On a

E [X k ] =∫ ∞

0xk f (x)d x.

Si E [X k ] <∞ pour toutes les valeurs de k, alors c’est que f (x) décroît à l’infini plusrapidement que xk ne croît. Par contre, si E [X k ] =∞ pour k ≥ k0, alors f (x) décroît

Page 180: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

170 Modèles paramétriques potentiels

plus vite que xk ne croît pour k ≤ k0, mais décroît moins vite que xk ne croît pourk > k0.

Si tous les moments existent, on dit alors que la distribution a une queuelégère (gamma transformée, gamma, exponentielle, Weibull, bêta transformée aveck <αγ, bêta, log-normale). Par contre, si les moments supérieurs n’existent pas, ladistribution a alors une queue lourde ou épaisse (gamma inverse, bêta transforméeavec k ≥αγ).

Cette méthode donne une indication de l’épaisseur de la queue, mais elle n’estpas toujours précise.

4.6.2 Comparaison des fonctions de survie

L’idée est que si S(x) est grand pour x grand, on est en présence d’une queueépaisse. Puisque, par définition,

limx→∞SX (x) = 0,

il s’agit d’un concept relatif. Il faut donc comparer les taux de décroissance desfonctions de survie de deux distributions. On évalue

limx→∞

S1(x)

S2(x)= lim

x→∞f1(x)

f2(x).

Si le résultat est une constante c , les deux distributions ont des queues comparables.Si le résultat est 0, la queue de f1 est plus légère. Si le résultat est ∞, la queue de f2

est plus légère.

Exemple 4.13. Soit f1 la fonction de densité de probabilité d’une loi Gamma(α,λ)et f2 celle d’une loi Pareto(τ,θ). En éliminant les termes qui ne dépendent pas de x,on a

limx→∞

f1(x)

f2(x)= lim

x→∞xα−1e−λx

(x +θ)−τ−1

= limx→∞e(τ+1)ln(x+θ)+(α−1)ln x−λx .

Or, puisque x →∞ plus rapidement que ln x,

limx→∞

f1(x)

f2(x)= 0.

La distribution de Pareto a donc la queue la plus lourde.

Page 181: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

4.6. Valeurs extrêmes 171

4.6.3 Taux d’incidence

Il est également possible d’utiliser le taux d’incidence pour comparer les queuesdes distributions. On a

h(x) = f (x)

S(x)

= F ′(x)

S(x)

= limt→0

F (x + t )−F (x)

tS(x)

= limt→0

Pr[x < X ≤ x + t |X > x]

t.

Ainsi, on peut interpréter h(x)t comme la probabilité d’avoir un «incident» (sinistre,décès) à x sachant que l’on a «survécu» jusqu’à x. Donc, si le taux d’incidence estpetit, la probabilité d’avoir un incident est faible ou, inversement, la probabilité desurvivre est grande. On a donc une queue lourde.

De manière générale, si h(x) est décroissant (DFR), on est en présence d’unedistribution avec queue lourde. Si h(x) est croissant (IFR), on est en présence d’unedistribution avec queue légère.

De plus, puisque

h(x) =− d

d xlnS(x)

et

S(x) = e−∫ x

0 h(y)d y , x ≥ 0,

il y a bijection entre le taux d’incidence et la distribution. Par conséquent, si h1(x) <h2(x) pour tout x, alors

S1(x) > S2(x)

et la queue de la distribution f1 est plus lourde que celle de f2.Si S(x) est difficile à évaluer, on peut tirer profit du fait que

1

h(x)= S(x)

f (x)

=∫ ∞

x f (t )d t

f (x)

=∫ ∞

0

f (x + y)

f (x)d y.

Donc, si f (x + y)/ f (x) est croissant en x pour tout y , le taux d’incidence h(x) estdécroissant et f a une queue lourde.

Page 182: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

172 Modèles paramétriques potentiels

Exemple 4.14. Soit

f (x) = λα

Γ(α)xα−1e−λx , x ≥ 0

la fonction de densité de probabilité d’une loi Gamma(α,λ). On n’a pas de formuleexplicite pour la fonction de survie. En revanche,

f (x + y)

f (x)= (x + y)α−1e−λ(x+y)

xα−1e−λx

=(1+ y

x

)α−1e−λy .

Cette dernière fonction est croissante en x si α < 1 et décroissante en x si α > 1.Ainsi, la distribution gamma est IFR (queue légère) si α> 1 et DFR (queue lourde)si α< 1. Si α= 1 (distribution exponentielle), le taux d’incidence est constant.

4.6.4 Espérance résiduelle

De la sous-section 3.1.3, on sait que l’espérance résiduelle est

e(x) = E [X −x|X > x]

= E [X ]−E [X ; x]

1−FX (x).

Or, puisque

E [X ; x] =∫ x

0(1−F (y))d y

=∫ x

0S(y)d y,

on peut aussi exprimer l’espérance résiduelle sous la forme

e(x) =∫ ∞

x S(y)d y

S(x).

De plus, par une application de la règle de l’Hôpital,

limx→∞e(x) = lim

x→∞

∫ ∞x S(y)d y

S(x)

= limx→∞

−S(x)

− f (x)

= limx→∞

1

h(x).

Page 183: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

4.7. Exercices 173

Si la fonction d’espérance résiduelle, e(x), est croissante, on dit que f est IMRLet qu’elle possède une queue épaisse. Dans le cas contraire, f est dite DMRL et ellepossède une queue légère.

En résumé, f est la fonction de densité de probabilité d’une loi avec queueépaisse si

x h(x) est décroissant en x (DFR) ;

x fX (x + y)/ fX (x) est croissant en x ;

x S(x + y)/S(x) est croissant en x ; et

x e(x) est croissante en x (IMRL).

Exemple 4.15. Soit X ∼ Exponentielle(λ), c’est-à-dire que S(x) = e−λx . On a

e(x) =∫ ∞

x e−λy d y

e−λx

= 1

λ,

une constante.

Exemple 4.16. Soit X ∼ Pareto(α,λ), c’est-à-dire que

S(x) =(

λ

λ+x

)α.

On a

e(x) =∫ ∞

x (λ+ y)−αd y

(λ+x)−α

= (λ+x)−α+1

(α−1)(λ+x)−α

= λ+x

α−1,

d’où la Pareto est IMRL.

4.7 Exercices

4.1 Soit X , une variable aléatoire avec densité Pareto(α,λ) représentant le montantd’un sinistre et c > 0, une constante. Démontrer que la distribution de Y = c Xest une distribution Pareto(α,cλ).

Page 184: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

174 Modèles paramétriques potentiels

4.2 Soit X , une variable aléatoire avec fonction de densité

f (x) = 1

2θe−|x/θ|, −∞< x <∞.

Trouver la fonction de répartition de Y = e X .

4.3 Il existe une relation intéressante entre les fonctions de répartition des loisgamma et Poisson. Soit X , une variable aléatoire avec densité Gamma(α,β) etα un entier. Démontrer que

Pr[X ≤ x] = Pr[Y ≥α],

où Y ∼ Poisson(x/β). Utiliser la paramétrisation de la loi gamma où le secondparamètre est un paramètre d’échelle.

4.4 Soit X , une variable aléatoire avec densité de Pareto généralisée(α,τ,λ). Dé-montrer que la distribution de

Y = X

X +λest une distribution bêta et identifier les paramètres de cette loi.

4.5 Soit X , une variable aléatoire telle que X ∼ Pareto(α,1). Trouver la fonction derépartition de la variable aléatoire

Y = 5X −1/4

et identifier cette distribution ainsi que ses paramètres.

4.6 Soit X , une variable aléatoire avec densité Gamma(α,λ).

a) Trouver la fonction de densité de Y = e X .

b) Trouver E [Y ] et Var[Y ].

c) Est-ce que tous les moments existent ?

4.7 Soit X , une variable aléatoire et i (0 ≤ i ≤ 1), le taux d’inflation pour l’année2006. Pour chacune des lois ci-dessous, trouver la distribution de Y = (1+ i )X :

a) X ∼ Pareto(α,λ).

b) X ∼ Burr(α,γ,θ).

c) X ∼ Log-gamma(α,λ).

4.8 Soit X , une variable aléatoire avec densité Pareto(α,λ). Trouver la fonction dedensité de

Y = X 1/τ, τ> 0.

Page 185: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

4.7. Exercices 175

4.9 Un assureur modélise des données à l’aide de la variable aléatoire X qui a unedistribution de Pareto de paramètres α et θ. On pose

Y = ln(1+X /θ).

Déterminer la distribution de Y .

4.10 Un assureur automobile a dans sa base de données les montants des sinistresde 2004. Il estime que les sinistres obéissaient alors à une loi Burr(α= 0,5,γ=2,θ = 3). Pour s’en servir le premier janvier 2007, il se doit de les mettre à jourselon les considérations suivantes :

x 2005 : inflation de 4 % ;

x 2006 : inflation de 4,5 % ; et

x nouvelles taxes de 16 %.

Quelle est la probabilité d’avoir un sinistre supérieur à 4 en 2007 ?

4.11 Soit X , la variable aléatoire représentant le montant d’un sinistre (en millions)pour l’année 2006. Sa fonction de densité de probabilité est

f (x) = 3x−4, x ≥ 1.

On observe qu’une inflation de 10 % affecte uniformément tous les sinistresde 2006 à 2007.

a) Trouver la fonction de répartition du montant des sinistres en 2007.

b) Trouver la probabilité que le montant d’un sinistre en 2007 soit supérieurà 2200000 $.

4.12 Pour un assuré d’un certain groupe, le nombre de sinistres suit une loi Binomiale(10,θ).Sachant que, dans ce groupe, le paramètre θ est tiré d’une distribution uni-forme sur l’intervalle (0,1), trouver la probabilité qu’un assuré pris au hasardait plus de six sinistres au cours d’une période.

4.13 Soit X , une variable aléatoire telle que la distribution conditionnelle de Xétant donné le paramètreΘ= θ est une distribution Gamma(τ,θ), oùΘ obéità une loi gamma de paramètres α et λ. Trouver la distribution de X .

4.14 On suppose que X a une distribution conditionnelle géométrique telle que

Pr[X = x|Θ= θ] = θ(1−θ)x−1, x = 1,2, . . .

et θ est une réalisation de la variable aléatoireΘ de loi Bêta(α,β). Démontrerque la fonction de masse de probabilité de X est

Pr[X = x] = Γ(α+β)Γ(α+1)Γ(β+x −1)

Γ(α)Γ(β)Γ(α+β+x).

Page 186: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

176 Modèles paramétriques potentiels

4.15 On suppose que X a une distribution conditionnelle de Weibull(τ,θ1/τ) telleque

f (x|Θ= θ) = τθxτ−1e−θxτ , x > 0.

Aussi, on suppose queΘ∼ Gamma(α,λ). Démontrer que la distribution mar-ginale de X est une Burr(α,τ,λ1/τ).

4.16 On suppose que le montant d’un sinistre pour un groupe d’assurés a unedistribution Burr(5,1,λ). Si λ est une réalisation de la variable aléatoire Λpour ce groupe d’assurés et que l’on suppose queΛ∼ Gamma(10,2), trouverl’espérance et la variance du montant d’un sinistre pour un assuré pris auhasard.

4.17 Soit le taux d’échec suivant pour le montant d’un sinistre pour une valeurdonnée de θ,

λ(x|θ) = 3

x +θ ,

où x est la réalisation de la variable aléatoire X représentant le montant d’unsinistre et θ est la réalisation de la variable aléatoireΘ oùΘ∼ Gamma(10,0,01).Trouver l’espérance et la variance du montant d’un sinistre pris au hasard.

4.18 Comparer les queues des lois Gamma(α,λ) et Log-normale(µ,σ2).

4.19 Soit X , une variable aléatoire représentant le montant d’un sinistre et l’espé-rance de vie résiduelle suivante

e(x) = 2000+2x.

Pour un contrat d’assurance comportant une limite supérieure de 10000,trouver le ratio d’élimination de perte (LER) de l’assureur.

4.20 Le tableau ci-dessous présente l’espérance de vie résiduelle pour certainesvaleurs de x.

x e(x)

0 44 79 10,75

14 14,5

a) À quelle distribution peut-on associer ces données et quelles sont lesvaleurs de ses paramètres ?

b) Trouver E [X ;10].

Page 187: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

4.7. Exercices 177

4.21 On construit une distribution raccordée sur les sous-intervalles (0,2), (2,8)et (8,16) avec les poids respectifs 0,5, 0,20 et 0,30. Dans chacun des sous-intervalles, on utilise une distribution gamma, de moyenne égale au pointmilieu du sous-intervalle et de variance égale à 1. Écrire la densité de probabi-lité obtenue sur (0,16). La réponse sera en fonction de la gamma incomplète.

4.22 On construit un modèle raccordé avec une distribution uniforme sur l’inter-valle (0,10) et une loi de Pareto de paramètres α= 3 et λ= 100 sur le reste desvaleurs positives. Quels poids doivent être accordés aux distributions pourque la densité obtenue soit continue ?

4.23 a) Comparer les queues d’une distribution Weibull(λ,τ) et d’une distributionWeibull inverse(θ,α) en utilisant les critères suivants :

i) l’existence des moments ; et

ii) la comparaison des fonctions de survie.

b) En utilisant une distribution Weibull et une distribution Weibull inversedont les moyennes et variances sont égales, comparer graphiquement lesqueues des distributions.

4.24 Soit Y , une variable aléatoire telle que

fY (y) = SX (y)

E [X ]

pour une variable aléatoire X quelconque. On dit qu’une telle distribution estéquilibrée. Démontrer que

MY (t ) = MX (t )−1

tE [X ]

lorsque MX (t) existe. Astuce 1 : intégrer par parties. Astuce 2 : l’existence deMX (t ) signifie que l’intégrale

MX (t ) =∫ ∞

0e t x fX (x)d x

converge.

4.25 Un assureur modélise ses sinistres par une variable aléatoire X avec densité

f (x) = (1+2x2)e−2x , x ≥ 0.

a) Calculer la fonction de survie SX (x).

b) Calculer le taux d’incidence h(x).

Page 188: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

178 Modèles paramétriques potentiels

c) Calculer la fonction d’espérance résiduelle e(x).

d) Calculer limx→∞ h(x).

e) Calculer limx→∞ e(x).

f ) Démontrer que e(x) est une fonction strictement décroissante, mais queh(x) n’est pas une fonction strictement croissante.

Exercices proposés dans LossModels, 4e éd.

5.1, 5.3, 5.4, 5.5, 5.7, 5.9, 5.13, 5.17, 5.18, 5.19, 5.20, 5.21, 5.22, 5.23, 3.25, 3.26, 3.27

Réponses

4.2 FY (y) = 12 e ln(y)/θ I0<y<1 + (1− 1

2 e ln(y)/θ)Iy≥1

4.4 Bêta(τ,α)

4.5 Burr inverse(α,4,5)

4.6 a) Log-gamma(α,λ) b) E [Y ] = (λ/(λ−1))α, Var[Y ] = (λ/(λ−2))α− (λ(λ−1))2α

c) Non

4.7 a) Pareto(α, (1+ i )λ) b) Burr(α,γ, (1+ i )θ) c) fY (y) = λα(1+ i )λ(ln(y)− ln(1+i ))α−1 y−λ−1/Γ(α)

4.8 Burr(α,τ,λ1/τ)

4.9 Exponentielle(α)

4.10 0,6870

4.11 a) F (x) = 1−1,331x−3, x ≥ 1,1 b) 0,125

4.12 4/11

4.13 X ∼ Pareto généralisée(α,τ,λ)

4.16 5/4 et 145/48

4.17 500, 850000

4.18 La queues de la distribution log-normale est plus lourde que celle de la distri-bution gamma.

4.19 0,30

4.20 a) Pareto(7/3,16/3) b) 3,0215

Page 189: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

4.7. Exercices 179

4.21

fX (x) =

0,5e−x

Γ(1;2), 0 < x ≤ 2

0,2

Γ(25;40)−Γ(25;10)

525x25−1e−5x

Γ(25), 2 < x ≤ 8

0,3

Γ(144;192)−Γ(144;96)

12144x144−1e−12x

Γ(144), 8 < x ≤ 16

4.22 3/14

4.25 a) (1+x +x2)e−2x

b) 2− (1+2x)/(1+x +x2)

c) (1+x +0,5x2)/(1+x +x2)

Page 190: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez
Page 191: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

5 Modélisation paramétrique

Objectifs du chapitre

x Estimer les paramètres d’une distribution du montant des sinistres à partir dedonnées individuelles ou groupées, modifiées ou non, en utilisant l’une ou l’autredes méthodes suivantes : la méthode des moments, la méthode des quantiles, laméthode du maximum de vraisemblance, la méthode de la distance minimale.

x Estimer la variance de l’estimateur du maximum de vraisemblance et s’en servirpour déterminer et calculer un intervalle de confiance pour des paramètres d’unedistribution.

x Pour les cas requérant une optimisation numérique, calculer les divers estimateursci-dessus avec R.

L’approche paramétrique consiste à choisir un modèle connu pour le phéno-mène sous étude. Ce modèle comportera habituellement des paramètres qu’ilfaudra déterminer d’une manière ou une autre. En général, on optera pour unetechnique ayant un certain degré d’objectivité et se basant sur des observations duphénomène.

En termes plus statistiques, on cherche à estimer le vecteur de paramètresθ = (θ1, . . . ,θp )′ d’une fonction de densité de probabilité ou fonction de masse deprobabilité f (x;θ) à partir d’un échantillon aléatoire X1, . . . , Xn de la population.

Un estimateur ponctuel de θ est une fonction θ = T (X1, . . . , Xn) de l’échantillon.Toute statistique est un estimateur ponctuel.

De plus, on se rappelle qu’un estimateur, T (X1, . . . , Xn), est une fonction del’échantillon (une variable aléatoire), alors qu’une estimation, T (x1, . . . , xn), est uneréalisation d’un estimateur (un nombre) obtenue en considérant un échantillon enparticulier.

On classe les techniques d’estimation étudiées dans ce chapitre en deux grandesclasses :

181

Page 192: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

182 Modélisation paramétrique

1. techniques basées sur la reproduction de certaines caractéristiques des donnéespar les mêmes caractéristiques du modèle (moments, quantiles, etc.) ;

2. techniques basées sur l’optimisation d’un critère objectif (vraisemblance, dis-tance).

Une autre technique d’estimation qui repose sur des principes forts différentsest l’estimation bayesienne. Celle-ci n’est toutefois pas abordée dans cet ouvragepuisqu’il est davantage pertinent d’en discuter lors de l’étude de la théorie de lacrédibilité. Pour les intéressés, Klugman et collab. (2012a, chapitre 15) traitentbrièvement du sujet.

5.1 Méthode des moments

La méthode des moments est probablement la plus ancienne méthode utiliséepour faire de l’estimation ponctuelle (Karl Pearson, fin 1800). C’est une méthoded’estimation simple et intuitive, mais les estimateurs obtenus possèdent générale-ment peu de «belles» propriétés.

On suppose que l’on dispose d’un échantillon aléatoire X1, . . . , Xn d’une popu-lation distribuée selon une fonction de répartition F (x;θ).

Pour déterminer les estimateurs des moments des paramètres θ1, . . . ,θp , onimpose que les p premiers moments théoriques soient identiques aux p premiersmoments empiriques. On doit donc résoudre

E [X k ] = µ′k = 1

n

n∑i=1

X ki , k = 1, . . . , p,

Lorsqu’il y a deux paramètres à estimer (p = 2), on doit donc résoudre

E [X ] = X

E [X 2] = µ′2

ou, de manière équivalente,

E [X ] = X

Var[X ] = σ2

avec, comme au chapitre 3,

σ2 = µ′2 − X 2

= 1

n

n∑i=1

(Xi − X )2.

Page 193: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

5.1. Méthode des moments 183

Il n’y a aucune garantie que la solution au système d’équations soit unique oumême qu’elle n’existe.

Bien qu’ils ne réunissent peu de propriétés d’optimalité souhaitables pour desestimateurs ponctuels, les estimateurs des moments demeurent populaires, si cen’est qu’à titre de points de départ pour d’autres méthodes.

On remarquera que pour les lois inverse, il vaut souvent mieux utiliser lesmoments négatifs (k =−1,−2, . . . ).

Il n’y a pas de mise en œuvre à proprement parler de la méthode des momentsdans R. La fonction emm présentée dans le code informatique du chapitre 3 peuttoutefois servir à calculer les valeurs des moments empiriques µ′

k pour k = 1, . . . , p.

Exemple 5.1. Soit X1, . . . , Xn un échantillon aléatoire. Déterminer les estimateursdes moments des paramètres des lois suivantes :

a) Exponentielle(λ). On pose simplement

E [X ] = 1

λ= µ′

1 = X ,

d’où λ= X −1.

b) Gamma(α,λ). On pose

E [X ] = α

λ= X

Var[X ] = α

λ2

=(αλ

) 1

λ= σ2,

d’où

α= X 2

σ2

λ= X

σ2 .

c) Pareto(α,λ). On a

E [X ] = λ

α−1= X

Var[X ] = αλ2

(α−1)2(α−2)

=(

λ

α−1

)2 ( α

α−2

)= σ2.

Page 194: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

184 Modélisation paramétrique

En résolvant pour α et λ, on obtient

α= 2σ2

σ2 − X 2

λ= X (σ2 + X 2)

σ2 − X 2.

5.2 Méthode des quantiles

La méthode des quantiles (percentile matching) est similaire à la méthode desmoments, sauf que l’on égale cette fois les quantiles théoriques et empiriques. Soitg1, . . . , gp des quantiles quelconques. Les estimateurs des paramètres θ1, . . . ,θp sontalors la solution de

πgi = πgi , i = 1, . . . , p

ou, de manière équivalente,

F (πgi ) = gi , i = 1, . . . , p.

Ci-dessus, πg est le 100g e quantile empirique lissé présenté à la section 3.5.

Exemple 5.2. On a les données

5,6,8,9,10,12,15

et l’on souhaite estimer le paramètre d’une distribution exponentielle en préservantle 80e quantile lissé. On a n = 7, g = 0,8, (n +1)g = 6,4 et donc

π0,8 = 0,6X(6) +0,4X(7)

= (0,6)(12)+ (0,4)(15)

= 13,2.

L’estimateur du paramètre λ de l’exponentielle est tel que

F (13,2) = 1−e−13,2λ = 0,8,

d’oùλ= 0,1219.

À titre de comparaison, l’estimateur de la méthode des moments est

λ= 1

x= 0,1077.

Page 195: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

5.3. Méthode du maximum de vraisemblance 185

5.3 Méthode du maximum de vraisemblance

L’estimation à l’aide des méthodes des moments et des quantiles est souventfacile à réaliser, mais les estimateurs ainsi obtenus n’ont pas souvent de bonnespropriétés, la principale raison étant que ces techniques n’utilisent qu’une petitepartie de l’information contenue dans l’échantillon pour réaliser l’estimation. Laméthode du maximum de vraisemblance permet d’utiliser une plus grande partiede l’information contenue dans l’échantillon. Ceci est particulièrement importantlorsqu’une population a une queue épaisse.

5.3.1 Données individuelles

Soit X1, . . . , Xn un échantillon aléatoire d’une distribution avec fonction derépartition F (x;θ), où θ est un vecteur de paramètres de longueur p.

De manière plus ou moins rigoureuse mathématiquement, nous dirons que lafonction de vraisemblance L(θ; x1, . . . , xn) ≡ L(θ) représente la probabilité d’obser-ver l’échantillon x1, . . . , xn . En fait, si F est discrète, on a bel et bien

L(θ) = Pr[X1 = x1, . . . , Xn = xn]

=n∏

i=1Pr[Xi = xi ]

=n∏

i=1(F (xi ;θ)−F (x−

i ;θ)).

Si F est continue, Pr[Xi = xi ] = 0 et f (xi ;θ) n’est pas une probabilité. Néan-moins, on peut trouver un intervalle (ai ,bi ] tel que ai < xi ≤ bi , d’où

L(θ) =n∏

i=1(F (bi ;θ)−F (a−

i ;θ)).

Or, si δi = bi −ai est petit, alors

F (bi ;θ)−F (a−i ;θ) ≈ f (xi ;θ)δi

et donc

L(θ) =n∏

i=1f (xi ;θ)δi

∝n∏

i=1f (xi ;θ).

Page 196: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

186 Modélisation paramétrique

L’estimateur du maximum de vraisemblance (EMV) de θ est la valeur θ quimaximise la fonction de vraisemblance L(θ) sur son domaine de définition.

De plus, θ maximise L(θ) si, et seulement si, θ maximise la fonction de log-vraisemblance l (θ) = lnL(θ).

On définit les fonctions de score

S j (θ) = ∂

∂θ jlnL(θ), j = 1, . . . , p.

La maximisation de L(θ) se résume donc à résoudre les équations normales

S j (θ) = 0, j = 1, . . . , p.

En général, ces équations ne sont pas linéaires. La résolution du système d’équa-tions nécessite donc des méthodes numériques de type Newton–Raphson. Nousverrons comment cela peut se faire avec R à la section 5.4.

Exemple 5.3. Soit X1, . . . , Xn un échantillon aléatoire tiré d’une distribution ex-ponentielle de paramètre λ. La fonction de vraisemblance du paramètre λ estdonc

L(λ) =n∏

i=1λe−λxi

=λne−λ∑n

i=1 xi ,

d’où

l (λ) = n lnλ−λn∑

i=1xi

et donc

S(λ) = n

λ−

n∑i=1

xi .

En résolvant S(λ) = 0, on obtient que

λ= n∑ni=1 Xi

= 1

X.

Page 197: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

5.3. Méthode du maximum de vraisemblance 187

Exemple 5.4. Soit X1, . . . , Xn un échantillon aléatoire tiré d’une distribution Log-normale(µ,σ2), c’est-à-dire que

f (x) = 1p2πσ2x

exp− 1

2

( ln x −µσ

)2, x > 0.

Pour trouver les estimateurs du maximum de vraisemblance de µ et σ2, on posed’abord

L(µ,σ2) = (2πσ2)−n/2

(n∏

i=1xi

)−1

exp− 1

2

n∑i=1

( ln xi −µσ

)2ou, de manière équivalente,

l (µ,θ) =−n

2ln(2πσ2)−

n∑i=1

ln xi − 1

2σ2

n∑1

(ln xi −µ)2.

Ainsi,

S1(µ,σ2) = 1

σ2

n∑1

(ln xi −µ)

S2(µ,σ2) = − n

2σ2 + 1

2µ4

n∑1

(ln xi −µ).

De S1(µ,σ2) = S2(µ,σ2) = 0, on trouve

µ= 1

n

n∑1

ln xi

σ2 = 1

n

n∑1

(ln xi − µ)2.

Exemple 5.5. Soit X1, . . . , Xn un échantillon aléatoire tiré d’une distribution inversegaussienne de paramètres µ et θ, c’est-à-dire que

f (x) =√

θ

2πx3 exp− θ(x −µ)2

2µ2x

, x > 0.

Pour trouver les estimateurs du maximum de vraisemblance de µ et θ, on pose

L(µ,θ) =(θ

)n/2 ( n∏1

x−3/2i

)exp

− θ

2µ2 −n∑

i=1

(xi −µ)2

xi

Page 198: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

188 Modélisation paramétrique

ou encore

l (µ,θ) = lnL(µ,θ)

= n

2ln

)− 3

2

n∑i=1

ln xi − θ

2µ2

n∑i=1

(xi −µ)2

xi.

On a donc

S1(µ,θ) = ∂

∂µl (µ,θ)

= θ

µ3

n∑i=1

(xi −µ)2

xi+ θ

µ2

(n −µ

n∑1

x−1i

)et

S2(µ,θ) = ∂

∂θl (µ,θ)

= n

2θ− 1

2µ2

n∑i=1

(xi −µ)2

xi.

Or, puisquen∑

i=1

(xi −µ)2

xi= n x −2µn +µ2

n∑i=1

x−1i ,

la solution de l’équation S1(µ,θ) = 0 donne µ= X . Par la suite, la solution de S2(µ,θ)donne

θ = n∑ni=1 x−1

i −n x−1

= n∑ni=1(x−1

i − x−1).

Exemple 5.6. Un assureur a enregistré les montants payés suivants :

6,11,15,18,20,20,20,20.

Le contrat prévoyait une limite de 20 par contrat. Trouver l’estimateur du maximumde vraisemblance de λ pour une distribution Exponentielle.

On a

L(λ) = f (6) f (11) f (15) f (18)(1−F (20))4

=λ4e−50λ(e−20λ)4

=λ4e−130λ

Page 199: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

5.3. Méthode du maximum de vraisemblance 189

et

l (λ) = 4ln(λ)−130λ,

d’où

l ′(λ) = 4

λ−130.

On trouve donc λ= 4/130.

Exemple 5.7. Un réassureur souhaite faire la modélisation du montant payé envertu d’un contrat de réassurance avec une franchise (ordinaire) de d et une limitede u. L’assureur lui transmet les montants de sinistres X1, X2, . . . , Xn .

Si X est la variable aléatoire du montant d’un sinistre, la variable Y du montantpayé par le réassureur est

Y =

0, X < d

X −d d ≤ X < u

u −d X ≥ u

= max(min(X ,u)−d ,0).

On a donc

fY (x) =

FX (d), x = 0

fX (x +d), 0 ≤ x < u

1−FX (u), x = u −d .

On suppose que r données sont nulles, que s se trouvent dans l’intervalle(0,u−d) et que t sont égales à u−d , où r + s+ t = n. Pour simplifier la notation, onsuppose que les données sont triées en ordre croissant.

La fonction de vraisemblance est

L(θ) =n∏

i=1fY (xi )

= (FX (d))r

(s∏

i=1fX (xr+i +d)

)(1−FX (u))t .

Page 200: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

190 Modélisation paramétrique

5.3.2 Données groupées

Dans le cas de données groupées, où n j représente le nombre de données dansla classe (c j−1,c j ], j = 1, . . . ,r , la probabilité qu’une donnée tombe dans l’intervalle(c j−1,c j ] est F (c j )−F (c j−1). La fonction de vraisemblance est donc

L(θ) =r∏

j=1[F (c j )−F (c j−1)]n j ,

alors que la fonction de log-vraisemblance est

l (θ) =r∑

j=1n j ln[F (c j )−F (c j−1)].

5.3.3 Propriétés de l’estimateur du maximum de vraisemblance

Une première propriété importante et très utile de l’estimateur du maximumde vraisemblance est celle d’invariance : pour toute fonction bijective g , si θ estl’EMV de θ, alors g (θ) est l’EMV de g (θ), soit

g (θ) = g (θ).

Par exemple, l’EMV de σ estpσ2.

Soit X1, . . . , Xn un échantillon aléatoire d’une distribution avec fonction dedensité de probabilité f (x;θ) (on suppose p = 1 pour le moment afin de simplifierla présentation). Soit aussi

θn = T (X1, . . . , Xn),

un estimateur sans biais quelconque de θ. Sous des conditions généralementsatisfaites mais souvent difficiles à établir 1, on a que

Var[θn] ≥ 1

I (θ),

I (θ) = nE

[( ∂∂θ

ln f (X ;θ))2

]=−nE

[∂2

∂θ2 ln f (X ;θ)

]= information de Fisher.

1. Voir le théorème 13.5 de Klugman et collab. (2012a) pour les conditions exactes.

Page 201: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

5.4. Maximisation numérique de la fonction de vraisemblance 191

La valeur I−1(θ) est la borne de Rao–Cramér. Lorsque

Var[θn] = 1

I (θ),

on dit de l’estimateur θn qu’il est efficace.

Remarque. Lorsque les variables aléatoires X1, . . . , Xn sont identiquement distri-buées, on a les expressions équivalentes suivantes pour l’information :

I (θ) = E

[( ∂∂θ

l (θ; X1, . . . , Xn))2

]=−E

[∂2

∂θ2 l (θ; X1, . . . , Xn)

].

Si θn est l’estimateur du maximum de vraisemblance de θ, alors on peut dé-montrer que

E [θn]n→∞−→ θ

Var[θn]n→∞−→ 1

I (θ),

d’où l’EMV est asymptotiquement sans biais et efficace. De plus, on a que, asymp-totiquement toujours,

θn ∼ N (θ, I−1(θ)).

Lorsque p > 1, les résultats demeurent les mêmes, sauf que la distribution estune normale multivariée :

θn ∼ N (θ, I−1(θ)),

où I (θ) est la matrice d’information p ×p dont l’élément en position (r, s), r, s =1, . . . , p, est

I (θ)r s =−nE

[∂2

∂θr∂θsln f (X ;θ)

]=−E

[∂2

∂θr∂θsln l (θ; X1, . . . , Xn)

].

5.4 Maximisation numérique de la fonction devraisemblance

Contrairement à ce que les exemples de la section précédente pourraient laissercroire, on ne peut toujours trouver explicitement le maximum de la fonction devraisemblance.

Page 202: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

192 Modélisation paramétrique

Exemple 5.8. Soit X1, . . . , Xn un échantillon aléatoire d’une loi gamma avec fonc-tion de densité de probabilité

f (x;α,λ) = λα

Γ(α)xα−1e−λx , x > 0,α> 0,λ> 0.

On cherche les estimateurs du maximum de vraisemblance des paramètres α et λ.La fonction de log-vraisemblance est, ici,

l (α,λ) =n∑

i=1ln f (xi ;α,λ)

=n∑

i=1(α lnλ− lnΓ(α)+ (α−1)ln xi −λxi )

= nα lnλ−n lnΓ(α)+ (α−1)n∑

i=1ln xi −λ

n∑i=1

xi .

Les EMV sont obtenus en résolvant le système d’équations

S1(α,λ) = ∂

∂αl (α,λ) = n lnλ−n

Γ′(α)

Γ(α)+

n∑i=1

ln xi = 0

S2(α,λ) = ∂

∂λl (α,λ) = nα

λ−

n∑i=1

xi = 0.

Ce système d’équations n’a pas de solution explicite.

Remarques.

1. La valeur numérique de la fonction gamma Γ(x) peut être obtenue dans R avecgamma().

2. La fonction

ψ(x) = d

d xlnΓ(x) = Γ

′(x)

Γ(x)

est appelée fonction digamma. Sa valeur numérique est obtenue dans R avecdigamma(). Dans le même ordre d’idée, la fonction

ψ1(x) = d

d xψ(x) = d 2

d x2 lnΓ(x)

est la fonction trigamma et on l’évalue dans R avec trigamma().

Lorsqu’il n’existe pas de solution explicite au problème de maximisation dela fonction vraisemblance, il faut s’en remettre à des méthodes numériques. Unefaçon de faire consiste à trouver la solution de l ′(θ) = 0 à l’aide de l’algorithme deNewton–Raphson. Il faut utiliser la version multivariée de l’algorithme si θ est unvecteur de deux paramètres ou plus.

Page 203: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

5.4. Maximisation numérique de la fonction de vraisemblance 193

5.4.1 Méthode de Newton-Raphson multivariée

La méthode de Newton–Raphson multivariée est similaire à la méthode univa-riée, sauf qu’elle fait appel à des notions simples de calcul matriciel.

On considère le système à n équations non linéaires et n inconnues

f1(x1, . . . , xn) = 0

f2(x1, . . . , xn) = 0

...

fn(x1, . . . , xn) = 0.

Soit x = (x1, . . . , xn). On peut alors écrire, de manière plus compacte,

f1(x) = 0

f2(x) = 0

...

fn(x) = 0

ou encore f (x) = 0, avec

f (x) =

f1(x)...

fn(x)

= ( f1(x), . . . , fn(x))′.

De plus, soit

J (x) =

∂ f1(x)

∂x1

∂ f1(x)

∂x2. . .

∂ f1(x)

∂xn

∂ f2(x)

∂x1

∂ f2(x)

∂x2. . .

∂ f2(x)

∂xn...

......

∂ fn(x)

∂x1

∂ fn(x)

∂x2. . .

∂ fn(x)

∂xn

=

[∂ fi (x)

∂x j

]n×n

.

Alors la solution du système d’équations f (x) = 0 est obtenu par convergence de lasuite

xk = xk−1 − J (xk−1)−1 f (xk−1), k = 1,2, . . . ,

Page 204: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

194 Modélisation paramétrique

où x0 = (x10, . . . , xn0) est un vecteur de valeurs de départ.On peut utiliser comme critère d’arrêt de la procédure itérative

‖xk −xk−1‖∞ = ‖J (xk−1)−1 f (xk−1)‖∞ < ε,

où‖x‖∞ = max

1≤i≤n|xi |.

Dans le contexte de la méthode du maximum de vraisemblance, les fonctionsf1(x), . . . , fn(x) ci-dessus correspondent aux fonctions de score S1(θ), . . . ,Sp (θ). Deplus, on peut souvent accélérer la convergence de l’algorithme en remplaçant leJacobien

J (θ) =[∂

∂θ jSi (θ)

]p×p

par la matrice d’information

I (θ) =−E [J (θ)]

=−E

[∂2

∂θi∂θ jl (θ)

].

5.4.2 Maximisation numérique avec R

Virtuellement tous les logiciels mathématiques ou statistiques modernes pro-posent des outils d’optimisation de fonctions — linéaires ou non — et de sommesde carrés. Ceci rend la programmation de l’algorithme de Newton–Raphson inutiledans la grande majorité des cas. Le Solveur d’Excel est un tel outil. Le chapitre 7 deGoulet (2012) présente les fonctions d’optimisation disponibles dans R. Plusieursdes exemples de ce chapitre portent d’ailleurs sur l’évaluation numérique d’estima-teurs du maximum de vraisemblance. La principale fonction d’optimisation de Rest optim.

Exemple 5.9. On simule un échantillon de taille 100 d’une loi gamma de para-mètres α= 5 et λ= 2, puis on estime ensuite les paramètres de la distribution parle maximum de vraisemblance à l’aide de la fonction optim de R. La fonction àminimiser est

−l (α,λ) =−n∑

i=1ln f (xi ;α,λ).

Les principaux arguments de optim() sont :

x par, un vecteur contenant les valeurs initiales des paramètres ; et

x fn, la fonction à minimiser.

Page 205: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

5.4. Maximisation numérique de la fonction de vraisemblance 195

Le premier argument de fn doit être le vecteur des paramètres. On peut passer desvaleurs à fn (les données, par exemple) par le biais de l’argument ’...’ de optim().

Pour cet exemple, on a donc

> x <- rgamma(100, 5, 2)

> f <- function(p, x) -sum(dgamma(x, p[1], p[2], log = TRUE))

> optim(c(1, 1), f, x = x)

$par

[1] 5.106083 2.042060

$value

[1] 145.1755

$counts

function gradient

73 NA

$convergence

[1] 0

$message

NULL

(L’argument log = TRUE de la fonction dgamma permet de calculer plus précisémentle logarithme de la densité.)

¸ La section 5.7 contient le code informatique pour répéter l’exempleci-dessus.

La fonction fitdistr du package MASS (Venables et Ripley, 2002) offre uneinterface simplifiée de optim() faite spécifiquement pour la maximisation d’unefonction de vraisemblance. Autrement dit, la fonction estime les paramètres d’uneloi de probabilité univariée par la méthode du maximum de vraisemblance. Elleest très simple à utiliser pour les distributions les plus courantes. En effet, les dis-tributions suivantes sont reconnues simplement par leur nom : bêta, binomialenégative, Cauchy, exponentielle, F, gamma, khi carré, log-normale, logistique, nor-male, t (Student), uniforme et Weibull. Pour toute autre loi de probabilité, il suffit

Page 206: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

196 Modélisation paramétrique

de fournir la fonction de densité (ou de masse) de probabilité en argument àfitdistr().

Exemple 5.10. On répète l’estimation des paramètres de la loi gamma pour l’échan-tillon aléatoire simulé à l’exemple 5.9. La distribution gamma étant reconnue parfitdistr(), il suffit d’en spécifier le nom :

> fitdistr(x, "gamma")

shape rate

5.1044237 2.0414616

(0.6995568) (0.2940095)

Les valeurs entre parenthèses sont les écarts types estimés des estimateurs.

¸ La section 5.7 contient le code informatique pour répéter l’exempleci-dessus.

Exemple 5.11. Soit

> set.seed(2)

> x <- rpareto(100, 5, 4000)

un échantillon aléatoire de taille 100 d’une loi de Pareto avec paramètres α = 5et λ = 4000. On veut estimer les paramètres par la méthode du maximum devraisemblance à partir de cet échantillon.

Les équations à résoudre pour trouver les estimateurs du maximum de vrai-semblance de α et λ sont

n

α+n lnλ−

n∑i=1

ln(xi +λ) = 0 (5.1)

λ− (α+1)

n∑i=1

(xi +λ)−1 = 0. (5.2)

Ce système d’équations n’a pas de solution explicite. On aura donc recours à l’opti-misation numérique avec la fonction fitdistr.

Les estimateurs des moments deα et λ seront utilisés comme valeurs de départdans fitdistr(). De l’annexe A de Klugman et collab. (2008, 2012a), on sait que

Page 207: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

5.4. Maximisation numérique de la fonction de vraisemblance 197

les estimateurs des moments sont

α= 2(m2 −m21)

m2 −2m21

λ= m2m1

m2 −2m21

,

où mk = n−1 ∑ni=1 X k

i . Pour l’échantillon simulé ci-dessus, on obtient

> m <- emm(x, c(1, 2))

> (alpha.mme <- 2 * (m[2] - m[1]^2)/(m[2] - 2 * m[1]^2))

[1] 7.15714

> (lambda.mme <- (prod(m))/(m[2] - 2 * m[1]^2))

[1] 6256.726

Le résultat de fitdistr() est donc :

> fitdistr(x, dpareto,

+ start = list(shape = alpha.mme,

+ scale = lambda.mme))

shape scale

7.170763 6256.725402

( 21.931933) (21840.466242)

Lorsque l’on tente d’estimer des paramètres strictement positifs comme ceuxd’une Pareto, il n’est pas rare d’être confronté à des soucis de convergence lorsquela fonction d’optimisation s’égare dans les valeurs négatives. On peut pallier à ceproblème avec le truc suivant : plutôt que d’estimer les paramètres eux-mêmes, onestime leurs logarithmes. Ceux-ci demeurent alors valides sur tout l’axe des réels.C’est l’Astuce Ripley expliquée à la section 11.6 de Goulet (2013).

Bien que pas nécessaire pour l’échantillon simulé ci-dessus, on illustre cetteapproche en définissant d’abord une nouvelle fonction de densité paramétrée enfonction de lnα et lnλ :

> f <- function(x, lshape, lscale)

+ dpareto(x, exp(lshape), exp(lscale))

Le résultat de fitdistr() avec cette fonction est

> (fit <- fitdistr(x, f,

+ start = list(lshape = log(alpha.mme),

+ lscale = log(lambda.mme))))

Page 208: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

198 Modélisation paramétrique

lshape lscale

1.8165661 8.5646370

(0.7320815) (0.8431280)

Les valeurs obtenues ci-dessus sont les logarithmes des paramètres. Les estimationsde α et λ elles-mêmes sont :

> exp(unname(fit$estimate))

[1] 6.150701 5242.936212

(La fonction unname enlève les noms d’un objet qui, s’ils étaient encore présents,porteraient ici à confusion.)

Il peut arriver que l’estimation des paramètres ne se passe pas aussi bien que ci-dessus. Dans un tel cas, on peut essayer d’utiliser l’information dont nous disposonssur les dérivées partielles (5.1) et (5.2) pour trouver les estimations du maximum devraisemblance. D’une part, on peut passer ces dérivées (le gradient de la fonctionà minimiser) directement à optim() par le biais de l’argument gr ; consulter larubrique d’aide pour de plus amples informations. D’autre part, si l’on isole α dans(5.2), on obtient ici

α= λ∑n

i=1(xi + λ)−1

n − λ∑ni=1(xi + λ)−1

et l’équation (5.1) devient alors

n

α+n ln λ−

n∑i=1

ln(xi + λ) = 0,

où α est remplacé par la fonction de λ ci-dessus. Le problème de maximisations’est transformé en un problème de recherche de racine que l’on peut résoudrenumériquement à l’aide de la fonction uniroot.

On définit d’abord la fonction dont on cherche la racine :

> g <- function(b, x)

+

+ n <- length(x)

+ x <- x + b

+ u <- b * sum(1/x)

+ n * (n - u)/u + n * log(b) - sum(log(x))

+

On trouve ensuite la racine avec uniroot() sur l’intervalle (0,max(x1, . . . , xn)) :

Page 209: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

5.4. Maximisation numérique de la fonction de vraisemblance 199

> (lambda <- uniroot(g, lower = 1E-10, upper = max(x), x = x)$root)

[1] 5242.957

> (alpha <- 1/(-1 + length(x)/(lambda * sum(1/(x + lambda)))))

[1] 6.150723

¸ La section 5.7 contient le code informatique pour répéter l’exempleci-dessus.

Exemple 5.12. Supposons que dans un échantillon de taille n, m valeurs sontcensurées à une valeur u. On souhaite ajuster une loi Burr de paramètres α, γ et θ àces données par la méthode du maximum de vraisemblance. On a

f (x) = αγxγ−1

θγ(1+ (x/θ)γ)α+1 , x > 0

et

F (x) = 1− 1

(1+ (x/θ)γ)α, x > 0.

Pour simplifier la notation, on suppose que les données x1, . . . , xn−m sont celles quine sont pas censurées.

On cherche donc à estimer les paramètres de la loi de la variable aléatoireX ∼ Burr(α,γ,θ) à partir d’observations de la variable aléatoire Y = min(X ,u) dontla fonction de densité de probabilité est

g (x) =

f (x), y < u

1−F (u), x ≥ u.

La fonction de vraisemblance est donc

L(α,γ,θ) =(

n−m∏i=1

αγθ−γxγ−1i

(1+ (xi /θ)γ)α+1

)(1

(1+ (u/θ)γ)α

)m

Page 210: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

200 Modélisation paramétrique

et la fonction de log-vraisemblance est

l (α,γ,θ) = (n −m)(lnαγ−γ lnθ)

+ (γ−1)n−m∑i=1

ln xi

− (α+1)n−m∑i=1

ln(1+ (xi /θ)γ)

−mα ln(1+ (u/θ)γ).

Ainsi,

S1(α,γ,θ) = n −m

α−m ln(1+ (xi /θ)γ)

−m∑

i=1ln(1+ (u/θ)γ),

S2(α,γ,θ) = n −m

γ− (n −m) lnθ+

n−m∑i=1

ln xi

− (α+1)n−m∑i=1

(xi /θ)γ ln(xi /θ)

1+ (xi /θ)γ

−mα(u/θ)γ ln(u/θ)

1+ (u/θ)γ

et

S3(α,γ,θ) =− (n −m)γ

θ+ (α+1)γ

θ

n−m∑i=1

(xi /θ)γ

1+ (xi /θ)γ

+ mαγ

θ

(u/θ)γ

1+ (u/θ)γ.

Pour trouver les estimations des paramètres α, γ et θ, il faut résoudre le sys-tème à trois équations et trois inconnues avec la méthode de Newton–Raphsonmultivariée. On peut également minimiser numériquement la fonction de log-vraisemblance négative avec les fonctions optim ou fitdistr. Dans ce cas, lafonction coverage permet d’obtenir facilement la densité g (x) ci-dessus :

> g <- coverage(dburr, pburr, limit = u)

Exemple 5.13. Un assureur a enregistré les données suivantes provenant de contratscomportant une franchise de 75 et une limite de 800 :

Page 211: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

5.4. Maximisation numérique de la fonction de vraisemblance 201

280,48 460,26 60,41 725,00 340,34 166,08 485,60199,15 45,56 118,10 493,15 239,10 241,55 218,60

725 48,60 204,77 710,67 8,75 225,37 123,8025,30 588,26 27,90 197,68 281,80 370,60 371,34

229,94 240,00 389,96 725 100,45 564,15 29,40142,98 350,30 41,68 260,80 369,10 134,54 312,08

725 253,15 452,59 14,80 327,20 119,42 68,2590,84 725 2,39 160,67 86,55 55,43 369,39

107,23 93,39 725 42,20 138,50 191,94 266,05372,72 52,36 111,30 40,30 70,50 81,01 725

On souhaite ajuster une distribution de Pareto à ces données par la méthodedu maximum de vraisemblance. En supposant que les données ci-dessus sontstockées dans le vecteur x, une combinaison des fonctions coverage et fitdistrnous fournit des estimations de λ et α :

> f <- coverage(dpareto, ppareto, deductible = 75, limit = 800)

> fitdistr(x, f, start = list(shape = 1, scale = 1), method = "N")

shape scale

11.72099 3125.70221

( 15.65693) (4526.98265)

Ici, on a spécifié la méthode d’optimation à utiliser (Nelder–Mead) parce que celleutilisée par défaut par fitdistr() ne converge pas. Consulter l’aide de optim()

pour plus de détails sur les diverses méthodes d’optimisation disponibles.

¸ La section 5.7 contient le code informatique pour répéter l’exempleci-dessus.

Exemple 5.14. On souhaite ajuster, par la méthode du maximum de vraisemblance,des distributions exponentielle et gamma aux données groupées suivantes récoltéespar un assureur :

Page 212: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

202 Modélisation paramétrique

Classe Nombre de données

(0,1] 4(1,2] 3(2,4] 3(4,8] 4(8,12] 2(12,16] 0(16,20] 1(20,∞] 3

Sans méthode numérique, il est difficilement envisageable de maximiser lesfonctions de log-vraisemblance

l (θ) =r∑

j=1n j ln(F (c j ;θ)−F (c j−1;θ)).

Puisque la fonction fitdistr ne supporte pas les données groupées, on va utiliserles fonctions d’optimisation directement. En premier lieu, on définit les données :

> x <- grouped.data(cj = c(0, 1, 2, 4, 8, 12, 16, 20, Inf),

+ nj = c(4, 3, 3, 4, 2, 0, 1, 3))

Pour la distribution exponentielle, qui ne compte qu’un seul paramètre, ilest préférable, pour des raisons de stabilité, de minimiser la log-vraisemblancenégative avec optimize(). On obtient :

> ll <- function(p, x)

+ -drop(crossprod(x[, 2], log(diff(pexp(x[, 1], p)))))

> optimize(ll, lower = 0, upper = 2, x = x)

$minimum

[1] 0.1248713

$objective

[1] 40.66936

Pour la distribution gamma, on utilise optim() :

> ll <- function(p, x)

+ -drop(crossprod(x[, 2], log(diff(pgamma(x[, 1], p[1], p[2])))))

> optim(c(1, 1), ll, x = x)

Page 213: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

5.5. Estimation par intervalle 203

$par

[1] 0.58211645 0.06674133

$value

[1] 39.26542

$counts

function gradient

79 NA

$convergence

[1] 0

$message

NULL

¸ La section 5.7 contient le code informatique pour répéter l’exempleci-dessus.

5.5 Estimation par intervalle

Un estimateur par intervalle d’un paramètre θ (scalaire pour le moment) est uncouple de statistiques (L,U ) telles que

Pr[L < θ <U ] = 1−α.

(Note : L et U sont les variables aléatoires, ci-dessus.)Un estimateur par intervalle peut être vu comme une mesure de la précision

d’un estimateur ponctuel θ.En général, toutefois, les estimateurs par intervalle sont difficiles à calculer. On

a une solution relativement simple pour les estimateurs du maximum de vraisem-blance puisque l’on connait leur distribution asymptotique.

5.5.1 Estimateur du maximum de vraisemblance univarié

De la sous-section 5.3.3, on sait que, lorsque n →∞,

θ ∼ N (θ,Var[θ]),

Page 214: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

204 Modélisation paramétrique

avec

Var[θ] = 1

I (θ).

Par conséquent, pour de grands échantillons,

Pr

−zα/2 < θ−θ√Var[θ]

< zα/2

= 1−α,

où zα est le 100(1−α)e centile d’une N (0,1). On peut réécrire cette expression sousla forme

Pr

[θ− zα/2

√Var[θ] < θ < θ+ zα/2

√Var[θ]

]= 1−α,

d’où (θ− zα/2

√Var[θ], θ+ zα/2

√Var[θ]

)est un estimateur par intervalle de θ.

De manière équivalente, on peut dire que

θ ∈ θ± zα/2

√Var[θ]

et donc que l’intervalle ci-dessus est un intervalle de confiance de niveau 1−α pourθ.

Plus souvent qu’autrement, la variance Var[θ] dépend de θ ou est carrémentinconnue parce que trop difficile à calculer. On doit alors utiliser une approximation.On considère deux possibilités.

1. L’information I (θ) est connue, mais dépend de θ d’une manière «compliquée».Dans un tel cas, on remplace θ par son estimation θ, ce qui donne une estimationde la variance :

Var[θ] = 1

I (θ).

En principe, un intervalle de confiance pour θ est alors

θ± tα/2,n−1

√Var[θ].

En pratique, dans la mesure où n doit déjà être grand, on utilise simplement

θ± zα/2

√Var[θ].

Page 215: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

5.5. Estimation par intervalle 205

2. L’information est inconnue, par exemple si l’espérance est trop compliquée.Dans un tel cas, on remplace l’espérance par une moyenne empirique : c’estl’information observée. On a alors

Var[θ] = 1

I (θ)

avec

I (θ) =n∑

i=1

( ∂∂θ

ln f (xi ;θ)∣∣∣θ=θ

)2

=−n∑

i=1

∂2

∂θ2 ln f (xi ;θ)∣∣∣θ=θ

ou, de manière équivalente,

I (θ) =( ∂∂θ

l (θ; xi , . . . , xn)∣∣∣θ=θ

)2

=− ∂2

∂θ2 l (θ; xi , . . . , xn)∣∣∣θ=θ

Exemple 5.15. Soit X1, . . . , Xn un échantillon aléatoire d’une distribution Weibullde paramètre de forme τ connu. On cherche un estimateur par intervalle du para-mètre d’échelle θ. On a

f (x) = τθ−τxτ−1e−(x/θ)τ

ln f (x) = lnτ−τ lnθ+ (τ−1)ln x −( x

θ

)τet

∂θln f (x) =−τ

θ+ τ

θ

( x

θ

)τ∂2

∂θ2 ln f (x) = τ

θ2 − τ(τ+1)

θ2

( x

θ

)τ.

Par conséquent,

S(θ) = ∂

∂θl (θ)

=n∑

i=1

∂θln f (xi )

=−τθ

(n −

∑ni=1 xτiθτ

).

Page 216: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

206 Modélisation paramétrique

En posant S(θ) = 0, on obtient

θ =(∑n

i=1 xτin

)1/τ

.

De plus, en réalisant que (X /θ)τ ∼ Exponentielle(1), on a

I (θ) = nτ2

θ2

Var[θ] = θ2

nτ2

et

Var[θ] = θ2

nτ2 .

Un intervalle de confiance de niveau 1−α pour θ est donc(∑ni=1 xτi

n

)1/τ

± zα/2θ

τp

n.

Pour les données dental, τ= 2 et 1−α= 0,95, on obtient

θ =(

2930683

10

)1/2

= 541,36√Var[θ] =

p2930683

20= 85,5962,

d’où θ ∈ (373,59,709,13). On obtient les mêmes résultats avec fitdistr :

> fitdistr(dental, "weibull", shape = 2)

scale

541.31341

( 85.57799)

En pratique, il n’est pas rare que l’on souhaite estimer non pas pour θ, mais pourune fonction h(θ) de θ. Par la propriété d’invariance de l’estimateur du maximumde vraisemblance, on sait que h(θ) = h(θ),

mais qu’en est-il d’un intervalle de confiance pour cette estimation ? En général, ils’agit d’un calcul difficile car la distribution de h(θ) peut être très compliquée. Pour

Page 217: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

5.5. Estimation par intervalle 207

simplifier le travail, il existe une méthode, la méthode delta, qui est valide pour ngrand.

En négligeant les termes de degré deux et plus dans le développement de Taylorde h(θ) autour de θ, on a

h(θ) ≈ h(θ)+h′(θ)(θ−θ).

Ainsi, puisque θ est asymptotiquement sans biais,

E [h(θ)] = h(θ)

et

Var[h(θ)] = [h′(θ)]2Var[θ].

On a donc, lorsque n →∞,

h(θ) ∼ N(h(θ), [h′(θ)]2Var[θ]

),

d’où un intervalle de confiance (ou estimateur par intervalle) de h(θ) est

h(θ)±1,96√

[h′(θ)]2Var[θ].

Exemple 5.16. Trouver un intervalle de confiance approximatif de niveau 1−αpour la probabilité qu’une observation d’une distribution exponentielle dépasse700 à partir des données dental.

On cherche un estimateur par intervalle pour

h(λ) = Pr[X > 700] = e−700λ.

On sait que

λ= 1

X

Var[λ] = λ2

n.

Par la méthode delta, on a

Var[h(λ)] = (−700e−700λ)2λ2

n

= 490000λ2e−1400λ

n

Page 218: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

208 Modélisation paramétrique

et

Var[h(λ)] = 490000e−1400/X

nX 2.

Pour les données dental, on a

x = 335,5

h(λ) = e−700/335,5 = 0,124

Var[h(λ)] = 490000e−1400/335,5

10(335,5)2 = 0,006707.

Un intervalle de confiance à 95 % pour Pr[X > 700] est donc 0,124±1,96p

0,006707ou 0,124±0,161.

5.5.2 Estimateur du maximum de vraisemblance multivarié

Les idées restent essentiellement les mêmes lorsque plusieurs paramètres sontestimés simultanément par la méthode du maximum de vraisemblance. On saitque, toujours asymptotiquement,

θ ∼ Normale multivariée(θ, I−1(θ)).

Si l’on considère une fonction h(θ1, . . . ,θp ) ≡ h(θ), la méthode delta dit que

h(θ) ∼ Normale multivariée(h(θ),hT I−1(θ)h),

h =∇h(θ)

=

∂θ1h(θ)

...∂

∂θph(θ)

.

Un intervalle de confiance de niveau 1−α pour h(θ) est donc

h(θ)± zα/2

√hT I−1(θ)h.

Page 219: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

5.5. Estimation par intervalle 209

Exemple 5.17. Trouver un estimateur par intervalle à 95 % de la moyenne d’unedistribution log-normale, soit de

h(µ,σ2) = eµ+σ2/2.

On a déjà obtenu à l’exemple 5.4

µ= 1

n

n∑1

ln xi

σ2 = 1

n

n∑1

(ln xi − µ)2.

L’estimateur (ponctuel) du maximum de vraisemblance de h(µ,σ2) est donc

h(µ, σ2) = eµ+σ2/2.

De plus,

∂2

∂µ2 ln f (X ;µ,σ2) =− 1

σ2

∂2

∂(σ2)2 ln f (X ;µ,σ2) = 1

2σ4 − (ln X −µ)2

σ6

∂2

∂µ∂σ2 ln f (X ;µ,σ2) =− ln X −µσ4 ,

d’où, en réalisant que ln X ∼ N (µ,σ2),

I (µ,σ2) = n

σ2 0

0n

2σ4

et

I−1(µ,σ2) =

σ2

n0

02σ4

n

.

Enfin,

h =[

∂∂µ h(µ,σ2)∂∂σ2 h(µ,σ2)

]= eµ+σ

2/2[

112

].

Page 220: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

210 Modélisation paramétrique

On a donc que, lorsque n →∞,

E [h(µ, σ2)] = eµ+σ2/2

Var[h(µ, σ2)] = hT I−1(µ,σ2)h

= e2µ+σ2(σ2

n+ σ4

2n

),

d’où un estimateur par intervalle avec un niveau de confiance approximatif de 95 %de la moyenne du log-normale est

eµ+σ2/2 ±1,96eµ+σ

2/2

√σ2

n+ σ4

2n.

Exemple 5.18. Soit X1, . . . , Xn un échantillon aléatoire tiré d’une distribution Pa-reto inverse de paramètres τ et θ. On cherche un intervalle de confiance pourl’estimateur du maximum de vraisemblance du mode de cette distribution. Toutd’abord, on a

f (x; t ,θ) = τθxτ−1

(x +θ)τ+1

et le mode est

m = θ(τ−1)

2.

Par la propriété d’invariance de l’estimateur du maximum de vraisemblance, onaura

m = θ(τ−1)

2.

Il faut toutefois trouver les estimateurs de τ et de θ.

On a

l (τ,θ) =n∑

i=1ln f (xi ;τ,θ)

= n lnτ+n lnθ+ (τ−1)n∑

i=1ln xi

− (τ+1)n∑

i=1ln(xi +θ)

Page 221: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

5.5. Estimation par intervalle 211

et

S1(τ,θ) = n

τ+

n∑i=1

ln xi −n∑

i=1ln(xi +θ)

S2(τ,θ) = n

θ− (τ+1)

n∑i=1

1

xi +θEn posant ces deux équations égales à 0, on peut trouver que

τ= n∑ni=1(ln(xi +θ)− ln xi )

,

mais il n’y a pas de formule explicite pour θ.Afin de déterminer la matrice d’information, on calcule

∂2

∂τ2 l (τ,θ) = ∂

∂τS1(τ,θ) =− n

τ2

∂2

∂θ2 l (τ,θ) = ∂

∂θS2(τ,θ) =− n

θ2 + (τ+1)n∑

i=1

1

(xi +θ)2

∂2

∂τ∂θl (τ,θ) = ∂

∂θS1(τ,θ) =−

n∑i=1

1

xi +θ.

Pour la suite, on aura besoin du résultat suivant :

E [(X +θ)−k ] =∫ ∞

0

1

(x +θ)k

τθxτ−1

(x +θ)τ+1 d x

=∫ ∞

0

τθxτ−1

(x +θ)τ+k+1d x

= τ

τ+k

∫ ∞

0x−k (τ+k)θxτ

(x +θ)τ+k+1d x

= τ

τ+kE [X −k ],

où X ∼ Pareto inverse(τ+k,θ). Ainsi, en supposant que τ> 2, on obtient

E [(X +θ)−1] =( τ

τ+1

)(θ−1Γ(τ)Γ(2)

Γ(τ+1)

)= 1

θ(τ+1)

et

E [(X +θ)−2] =( τ

τ+2

)(θ−2Γ(τ)Γ(3)

Γ(τ+2)

)= 2

θ2(τ+1)(τ+2).

Page 222: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

212 Modélisation paramétrique

Par conséquent,

E

[∂2

∂τ2 l (τ,θ; X1, . . . , Xn)

]=− n

τ2

E

[∂2

∂θ2 l (τ,θ; X1, . . . , Xn)

]=− nτ

θ2(τ+2)

E

[∂2

∂τ∂θl (τ,θ; X1, . . . , Xn)

]=− n

θ(τ+1)

et la matrice d’information est donc

I (τ,θ) =

n

τ2

n

θ(τ+1)n

θ(τ+1)

θ2(τ+2)

.

Enfin, en posant h(τ,θ) = θ(τ−1)/2, on a

h =[ ∂∂τ h(τ,θ)∂∂θ h(τ,θ)

]= 1

2

τ−1

].

Un intervalle de confiance approximatif de niveau 1−α pour le mode de la distri-bution Pareto inverse est donc

θ

(τ−1

2

)± zα/2

√hT I−1(τ, θ)h,

h = 1

2

τ−1

].

¸ Pour un exemple d’évaluation numérique de l’intervalle de confianceà partir de données, voir le code informatique de la section 5.7.

5.6 Estimation par distance minimale

L’estimation par distance minimale est une autre technique d’estimation pa-ramétrique basée sur un critère à optimiser. L’idée, ici, consiste à choisir les para-mètres d’une distribution de manière à minimiser une certaine distance entre lafonction de répartition théorique F (x;θ) et la fonction de répartition empirique

Page 223: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

5.6. Estimation par distance minimale 213

Fn(x). Cette technique est populaire auprès des actuaires, notamment parce qu’elleest particulièrement bien adaptée aux données groupées.

En règle générale, la minimisation de distance est une procédure numérique.Pour ce faire, le package actuar fournit la fonction mde, dont l’interface et le fonc-tionnement est très similaire à fitdistr. Elle permet d’ajuster des modèles à desdonnées par la méthode de distance minimale selon l’une des trois mesures dedistance présentées ci-dessous.

5.6.1 Distance de Cramér-von Mises

Soit y1 < y2 < ·· · < yk des points arbitraires et w1, . . . , wk des nombres positifsarbitraires qui serviront de poids. La forme générale de la statistique (ou distance)de Cramér–von Mises est

d(θ) =k∑

j=1w j [F (y j ,θ)−Fn(y j )]2.

Les poids permettent de donner plus d’importance à certains points par rapportà d’autres. En général, on choisit des poids égaux, soit w1 = ·· · = wk = 1. Si l’onsouhaite donner plus de poids aux données dans les queues de la distribution, unchoix populaire est

w j = n

F (y j )(1−F (y j )).

La figure 5.1 représente cette fonction pour une distribution gamma.Pour des données individuelles, on prend y j = x j , j = 1, . . . ,n. L’estimateur de

Cramér-von Mises de θ est donc la valeur θ qui minimise

d(θ) =n∑

j=1w j [F (x j ,θ)−Fn(x j )]2.

Pour des données groupées, on minimise la distance aux bornes des classes,c’est-à-dire que y j = c j , j = 1, . . . ,r . On a alors

d(θ) =r∑

j=1w j [F (c j ,θ)−Fn(c j )]2.

Exemple 5.19. Soit les données

1,3,7,11,22,23,44,51.

On souhaite ajuster une distribution exponentielle à ces données en minimisant ladistance de Cramér-von Mises avec des poids de 1. Puisque

F (x) = 1−e−λx

Page 224: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

214 Modélisation paramétrique

0.0 0.5 1.0 1.5 2.0 2.5 3.0

050

0000

1000

000

1500

000

yj

wj

FIG. 5.1: Fonction de poids donnant plus d’importance aux données dans lesqueues

et

F8(x) =

0, x < 1

1/8, x = 1

2/8, x = 3

3/8, x = 7

4/8, x = 11

5/8, x = 22

6/8, x = 23

7/8, x = 44

1, x ≥ 51

,

on a que la distance à minimiser est

d(λ) =(

7

8−e−λ

)2

+(

6

8−e−3λ

)2

+·· ·+ (e−51λ)2.

On voit immédiatement la nécessité de faire appel à des procédures numériques.

Page 225: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

5.6. Estimation par distance minimale 215

5.6.2 Distance du khi carré modifié

Cette distance est basée sur une statistique utilisée dans les tests d’adéquationdes modèles. Elle ne s’emploie que pour les données groupées (ou après avoirgroupé des données individuelles). L’estimateur est obtenu en minimisant

d(θ) =r∑

j=1w j [n(F (c j ;θ)−F (c j−1;θ))−n j ]2,

où n =∑rj=1 n j et, en général, w j = 1/n j .

SoitE j (θ) = n(F (c j ;θ)−F (c j−1;θ).

Cette quantité représente le nombre espéré de données dans l’intervalle (c j−1,c j ].Sous sa forme la plus usuelle, la statistique du khi carré modifié est donc

d(θ) =r∑

j=1

(E j (θ)−n j )2

n j.

On voit ainsi plus clairement que les paramètres sont choisis de manière à mini-miser l’écart entre le nombre observé de données dans chacune des classes del’échantillon et le nombre de données selon le modèle théorique.

Dans la mesure où le terme n j se retrouve au dénominateur, il n’est pas possibled’avoir des classes vides. Si le cas se présente, il faut regrouper de manière arbitrairecertaines classes de façon à avoir au moins une donnée dans chacune des classes.

5.6.3 Distance de sévérité moyenne par couche

Cette technique est particulièrement indiquée dans un contexte de réassurance,où l’on souhaite que le modèle réflète le plus fidèlement possible les coûts partranche d’assurance indiqués par les données. C’est aussi une technique applicableuniquement à des données groupées.

L’estimateur de sévérité moyenne par couche minimal (layer average severity,LAS) de θ est la valeur qui minimise la distance

d(θ) =r∑

j=1w j [LAS(c j−1,c j ;θ)−LASn(c j−1,c j )]2,

LAS(c j−1,c j ;θ) = E [min(X ,c j );θ]−E [min(X ,c j−1);θ]

LASn(c j−1,c j ) = E [X ;c j ]− E [X ;c j−1]

Page 226: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

216 Modélisation paramétrique

et w1, . . . , wr sont des poids arbitraires. Il s’agit donc d’une comparaison entre lessinistres moyens par classe entre le modèle théorique et le modèle empirique.

¸ Le code informatique de la section 5.7 correspondant à cette sectionfournit des exemples d’utilisation de la fonction mde de actuar pourévaluer numériquement des estimateurs par distance minimale.

5.7 Code informatique

###

### ESTIMATION PAR LA MÉTHODE DU MAXIMUM DE VRAISEMBLANCE

###

## EXEMPLE 5.9

##

## Estimation du maximum de vraisemblance pour les paramètre d'une

## distribution gamma avec 'optim'. Aux fins de l'évaluation

## numérique, on simule un échantillon aléatoire d'une loi gamma.

x <- rgamma(100, 5, 2)

## On minimise la fonction de log-vraisemblance négative directement

## avec la fonction 'optim'.

##

## Les principaux arguments de 'optim' sont:

##

## par: un vecteur contenant les valeurs initiales des paramètres;

## fn: fonction à minimiser. Le premier argument de fn doit être

## le vecteur des paramètres.

##

## On peut passer des valeurs à 'fn' (les données, par exemple) par le

## biais de l'argument '...' de 'optim'.

##

## Note: l'argument 'log = TRUE' de 'dgamma' permet de calculer plus

## précisément le logarithme de la densité.

f <- function(p, x) -sum(dgamma(x, p[1], p[2], log = TRUE))

optim(c(1, 1), f, x = x)

## EXEMPLE 5.10

##

## Estimation du maximum de vraisemblance pour les paramètre d'une

## distribution gamma avec 'fitdistr'. La fonction se trouve dans le

## package MASS.

Page 227: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

5.7. Code informatique 217

library(MASS)

## La distribution gamma étant reconnue par 'fitdistr', il suffit d'en

## spécifier le nom en argument. La fonction préparera la fonction de

## log-vraisemblance et choisira des valeurs de départ appropriées.

fitdistr(x, "gamma")

## EXEMPLE 5.11

##

## On estime les paramètres d'une loi Pareto par la méthode du maximum

## de vraisemblance pour l'échantillon simulé ci-dessous avec la

## fonction 'rapreto' du package actuar.

library(actuar) # charger le package

set.seed(2) # toujours le même échantillon

x <- rpareto(100, 5, 4000)

## Les estimateurs des moments de $\alpha$ et $\lambda$ seront

## utilisés comme valeurs de départ dans 'fitdistr'.

m <- emm(x, c(1, 2)) # deux premiers moments

(alpha.mme <- 2 * (m[2] - m[1]^2)/(m[2] - 2 * m[1]^2))

(lambda.mme <- (prod(m))/(m[2] - 2 * m[1]^2))

## Estimation avec 'fitdistr'. Pas de problème de convergence ici.

fitdistr(x, dpareto,

start = list(shape = alpha.mme,

scale = lambda.mme))

## Lorsque la fonction d'optimisation s'égare dans les valeurs

## négatives des paramètres, on peut utiliser le truc suivant: plutôt

## que d'estimer les paramètres eux-mêmes, on estime leurs

## logarithmes. Ceux-ci demeurent alors valides sur tout l'axe des

## réels.

f <- function(x, lshape, lscale)

dpareto(x, exp(lshape), exp(lscale))

(fit <- fitdistr(x, f,

start = list(lshape = log(alpha.mme),

lscale = log(lambda.mme))))

## Les valeurs obtenues ci-dessus sont les logarithmes des paramètres.

exp(unname(fit$estimate))

## Dans le cas présent, on peut réduire le problème de maximisation en

## deux dimensions à un problème de recherche de racine en une seule

## dimension. On définit d'abord la fonction dont on cherche la racine.

g <- function(b, x)

Page 228: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

218 Modélisation paramétrique

n <- length(x)

x <- x + b

u <- b * sum(1/x)

n * (n - u)/u + n * log(b) - sum(log(x))

## On trouve ensuite la racine avec la fonction 'uniroot' sur

## l'intervalle (0, max(x)).

(lambda <- uniroot(g, lower = 1E-10, upper = max(x), x = x)$root)

(alpha <- 1/(-1 + length(x)/(lambda * sum(1/(x + lambda)))))

## EXEMPLE 5.13

##

## On a des données de contrats d'assurance comportant une franchise

## de 75 et une limite de 800.

x <- c(280.48, 460.26, 60.41, 725.00, 340.34, 166.08, 485.60,

199.15, 45.56, 118.11, 493.15, 239.14, 241.55, 218.62,

725.00, 48.61, 204.77, 710.67, 8.75, 225.37, 123.82,

25.31, 588.26, 27.90, 197.68, 281.83, 370.61, 371.34, 229.94,

240.12, 389.96, 725.00, 100.45, 564.15, 29.40, 40.30,

142.98, 350.30, 41.68, 260.81, 369.12, 134.54, 312.08,

725.00, 253.15, 70.50, 452.59, 14.82, 327.22, 119.42,

81.01, 68.25, 90.84, 725.00, 2.39, 160.67, 86.55,

55.43, 369.39, 107.23, 93.39, 725.00, 725.00, 42.20,

138.52, 191.94, 266.05, 372.72, 52.36, 111.30)

## On utilise 'coverage' pour obtenir la densité des données

## modifiées.

f <- coverage(dpareto, ppareto, deductible = 75, limit = 800)

## On utilise la fonction obtenue ci-dessus dans 'fitdistr' comme

## n'importe quelle autre fonction de densité.

fitdistr(x, f, start = list(shape = 1, scale = 1), method = "N")

## EXEMPLE 5.14

##

## On a des données groupées.

(x <- grouped.data(cj = c(0, 1, 2, 4, 8, 12, 16, 20, Inf),

nj = c(4, 3, 3, 4, 2, 0, 1, 3)))

## Sans méthode numérique, il est difficilement envisageable de

## maximiser la fonction de log-vraisemblance de données groupées.

## Puisque 'fitdistr' ne supporte pas les données groupées, on va

## utiliser les fonctions d'optimisation directement.

Page 229: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

5.7. Code informatique 219

##

## Pour la distribution exponentielle, qui ne compte qu'un seul

## paramètre, il est préférable, pour des raisons de stabilité, de

## minimiser la log-vraisemblance négative avec 'optimize'.

ll <- function(p, x)

-drop(crossprod(x[, 2], log(diff(pexp(x[, 1], p)))))

optimize(ll, lower = 0, upper = 2, x = x)

## Pour la distribution gamma, on utilise 'optim'.

ll <- function(p, x)

-drop(crossprod(x[, 2], log(diff(pgamma(x[, 1], p[1], p[2])))))

optim(c(1, 1), ll, x = x)

## EXEMPLE 5.18

##

## On va estimer le mode d'une loi de Pareto inverse. Tout d'abord, on

## se donne un échantillon aléatoire.

x <- c(90.82003234, 231.758342, 173.4952009, 54.7016874, 54.38717678,

66.55649132, 64.70525857, 32.11372382, 35.88995236, 26.64007571,

8.280677022, 83.11710111, 29.28489668, 111.4226552, 333.1536616,

15.12569074, 20.51796335, 1528.253204, 3949.025475, 157.9228822,

589.2324663, 19.36586191, 240.2328439, 933.7527217, 17.30204671,

74.09253268, 415.8841427, 105.1575175, 107.0157345, 26.10984817,

122.0857254, 5741.30212, 103.0847097, 45.98989544, 72.65399999,

164.0558806, 22.70259283, 134.9358282, 46.27191635, 21.16168539,

197.7311518, 370.8642329, 24.64028934, 158.6333192, 265.8701389,

36.57753616, 93.74525458, 78.60172397, 414.4440064, 27.38132725,

19.06459196, 674.4456707, 35.19132876, 142.709182, 133.6359018,

36.93977257, 776.530798, 16.76115168, 156.5600435, 611.6450772,

39.40947269, 63.68927339, 7.940722739, 369.4104142, 80.48188255,

16.0094895, 42.00656883, 40.99255559, 476.4875828, 49.38945828,

6.619740386, 23.99096566, 82.07584813, 115.3190035, 52.15234121,

92.26137298, 74.27839338, 48.19953415, 862.6692288, 25.62765813,

32.54815008, 101.2846802, 156.8140847, 17.51911039, 25.5251894,

48.68906566, 29.34124106, 34.95065775, 26.81550197, 66.34696211,

1815.299926, 19.67448744, 13.45007344, 44.73622845, 31.62093256,

30.81908273, 148.7958437, 20.07293494, 609.9016668, 27.14996816)

## Pour fins de comparaison, nous allons calculer les EMV des

## paramètres de forme et d'échelle d'abord en utilisant la formule

## explicite obtenue dans l'exemple, puis par minimisation numérique

## de la fonction de log-vraisemblance négative.

##

## Dans le premier cas, on doit d'abord calculer l'estimateur du

## paramètre d'échelle numériquement. Pour ce faire, on définit la

Page 230: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

220 Modélisation paramétrique

## fonction dont on doit trouver la racine. Nous avons choisi, ici, la

## seconde fonction de score.

f <- function(scale, x)

n <- length(x)

xps <- x + scale

shape <- n/sum(log(xps) - log(x))

n/scale - (shape + 1) * sum(1/xps)

## On trouve ensuite la racine de cette fonction avec 'uniroot', ce

## qui donne l'EMV du paramètre d'échelle. Puis, on calcule l'EMV du

## paramètre de forme à partir de la formule obtenue dans l'exemple.

(hscale <- uniroot(f, lower = 2, upper = 4, x = x)$root) # EMV de scale

(hshape <- length(x)/sum(log(x + hscale) - log(x))) # EMV de shape

## Puisque nous avons obtenu la formule explicite de la matrice

## d'information, on peut calculer son estimation avec les estimateurs

## ci-dessus.

n <- length(x)

matrix(c(n/hshape^2,

rep(n/(hscale * (hshape + 1)), 2),

n * hshape/(hscale^2 * (hshape + 2))),

nrow = 2)

## On se tourne maintenant vers l'approche entièrement numérique.

fit <- fitdistr(x, dinvpareto, start = list(shape = 1, scale = 1))

fit$estimate # estimateurs

solve(fit$vcov) # information observée

## Comparaisons de l'histogramme des données et de la distribution

## ajustée: tout d'abord pour toute l'étendue des données, puis

## seulement pour le coeur de la distribution.

br <- c(0, 25, 50, 100, 250, 500, 1000, 2000, 4000, 6000)

hist(x, breaks = br)

curve(dinvpareto(x, fit$estimate[1], fit$estimate[2]), from = 0.1,

add = TRUE, col = "blue", lwd = 2)

hist(x, breaks = br, xlim = c(0, 1000))

curve(dinvpareto(x, fit$estimate[1], fit$estimate[2]), from = 0.1,

add = TRUE, col = "blue", lwd = 2)

## Nous avons obtenu essentiellement les mêmes résultats par

## l'approche entièrement numérique. Nous utiliserons donc les valeurs

## de l'objet 'fit' dans la suite.

Page 231: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

5.7. Code informatique 221

##

## Le calcul d'un l'intervalle de confiance à 95 % pour le mode exige

## quelques lignes de programmation.

(m <- fit$estimate[2] * (fit$estimate[1] - 1)/2) # mode estimé

h <- c(fit$estimate[2], fit$estimate[1] - 1)/2 # gradient estimé

s <- sqrt(drop(crossprod(h, fit$vcov)) %*% h) # écart-type estimé

c(m - 1.96 * s, m + 1.96 *s) # intervalle

###

### ESTIMATION PAR DISTANCE MINIMALE

###

## L'interface de la fonction 'mde' de actuar est très similaire à

## celle de 'fitdistr'. Outre les donnée, la fonction requiert en

## argument:

##

## - la mesure de distance à utiliser ("CvM", "chi-square" ou "LAS");

## - une fonction pour calculer la fonction de répartition théorique

## ou l'espérance limitée théorique;

## - des valeurs de départ;

## - des poids, le cas échéant.

##

## On va ajuster par la méthode de la distance minimale une

## distribution exponentielle aux données groupées d'assurance

## dentaire.

gdental

## La moyenne des données nous donnera une idée de la valeur de départ

## à fournir à la fonction de minimisation de distance.

mean(gdental)

## Estimateur de la distance de Cramér-von Mises. On peut utiliser des

## données individuelles ou des données groupées avec cette distance.

## On fournit à 'mde' la fonction de répartition théorique; 'mde' se

## chargera de construire l'ogive et la fonction de distance à

## minimiser, puis d'appler 'optim' pour effectuer la minimisation

## numérique.

mde(gdental, pexp, start = list(rate = 1/200), measure = "CvM")

## Pour éviter l'avertissement lors d'une optimisation sur un seul

## paramètre, on peut utiliser la méthode de type quasi-Newton "BFGS".

mde(gdental, pexp, start = list(rate = 1/200),

measure = "CvM", method = "BFGS")

## Estimateur de la distance du khi carré modifié.

Page 232: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

222 Modélisation paramétrique

mde(gdental, pexp, start = list(rate = 1/200), measure = "chi-square")

## Estimateur de la distance de la sévérité moyenne par couche.

mde(gdental, levexp, start = list(rate = 1/200), measure = "LAS")

## La minimisation ne réussit pas toujours aussi bien que ci-dessus.

## En fait, les techniques de distance minimale sont plutôt instables

## numériquement. Par exemple, si l'on essaie plutôt d'ajuster une loi

## de Pareto aux données, l'optimisation ne converge pas.

mde(gdental, ppareto, start = list(shape = 3, scale = 600),

measure = "CvM")

## Tout comme pour le maximum de vraisemblance, travailler avec le

## logarithme des paramètres peut aider.

f <- function(x, lshape, lscale) ppareto(x, exp(lshape), exp(lscale))

(p <- mde(gdental, f, measure = "CvM",

start = list(lshape = log(3), lscale = log(600))))

exp(p$estimate)

## Superposition de l'histogramme des données et de la distribution de

## Pareto ajustée.

hist(gdental)

curve(dpareto(x, exp(p$estimate[1]), exp(p$estimate[2])), from = 0.1,

add = TRUE, col = "blue", lwd = 2)

5.8 Exercices

5.1 Soit X , une variable aléatoire représentant le montant d’un sinistre. On suppose

X |Λ=λ∼ Exponentielle(λ)

Λ∼ Gamma(α,β).

Les sinistres suivants ont été observés :

1,10,200,1000,5000.

Estimer α et β par la méthode des moments.

5.2 On dispose d’un échantillon aléatoire avec deux données inférieures à 2000et quatre données entre 2000 et 5000. Les données supérieures à 5000 n’ontpas été enregistrées. Écrire la fonction de vraisemblance pour un modèle de loiexponentielle.

Page 233: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

5.8. Exercices 223

5.3 Un assureur automobile a enregistré les montants de sinistres suivants :

1000,850,750,1100,1250,900.

Il souhaite utiliser une distribution Gamma(α,1/θ) pour les représenter. Esti-mer les paramètres de cette distribution à l’aide de la méthode des moments.

5.4 Un actuaire dispose d’un échantillon aléatoire tiré d’une distribution log-logistique. Dans cet échantillon, 80 % des données sont supérieures à 100et 20 % des données sont supérieures à 400. Calculer les estimateurs des para-mètres de la distribution à l’aide de la méthode des quantiles.

5.5 Soit x1, . . . , xn un échantillon aléatoire d’une population dont la fonction derépartition est

FX (x) = xp , 0 < x < 1.

Déterminer l’estimateur de p par la méthode des moments.

5.6 Pendant une année, un assureur a enregistré les montants de sinistres suivants :

500,1000,1500,2500,4500.

Il décide de modéliser ces données par une loi Log-normale(µ,σ). En utilisantla méthode des moments, estimer les paramètres µ et σ. Calculer ensuite laprobabilité d’avoir un sinistre supérieur à 4500.

5.7 Soit X , une variable aléatoire avec densité

f (x) =β−2xe−12 ( x

β)2

, x > 0,β> 0.

L’espérance de cette variable aléatoire est donnée par βp

2π/2. On a observéles cinq valeurs suivantes :

4,9,1,8,3,4,6,9,4,0.

Déterminer l’estimateur de β à l’aide de la méthode des moments.

5.8 On suppose que la distribution du montant des sinistres obéit à une loi Weibull(τ,λ)de paramètres inconnus.

a) Sachant que 50 % des sinistres sont supérieurs à 1000 $ et que 75 % dessinistres sont supérieurs à 500 $, estimer τ et λ par la méthode des quantiles.

b) À partir des estimations obtenues en a), estimer le 80e centile.

Page 234: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

224 Modélisation paramétrique

5.9 Soit X , la variable aléatoire représentant le montant d’un sinistre. On sup-pose que le montant d’un sinistre pour un λ fixé obéit à une distributionExponentielle(λ) et que λ est une réalisation de la variable aléatoire Λ, oùΛ ∼ Gamma(α,β). À la suite d’une expérience, on observe que 0,1 % des si-nistres sont supérieurs à 450 et que 87,5 % des sinistres sont inférieurs à 50.Trouver l’équation, uniquement fonction de β, que l’on doit résoudre pourestimer β et qui, après avoir été résolue, permet d’estimer le paramètre α.

5.10 Pour des contrats en assurance automobile avec les modalités suivantes, on aobservé pour l’année 1999 :

x un rapport d’élimination de perte de 0,56 avec une franchise forfaitaire ded = 200 ;

x un rapport d’élimination de perte de 0,32 avec une franchise atteinte ded = 200 ;

x un rapport d’élimination de perte de 0,79 avec une franchise forfaitaire ded = 500 ;

x un rapport d’élimination de perte de 0,52 avec une franchise atteinte ded = 500.

On a aussi observé que le montant moyen d’un sinistre est de 200 $. Si onsuppose une loi de Weibull(τ,λ) pour modéliser le montant d’un sinistre,estimer les paramètres τ et λ par la méthode des quantiles.

5.11 Un assureur a déterminé que 20 % des sinistres de son portefeuille sontsupérieurs à 50 $ et que 10 % des sinistres sont supérieurs à 55 $. D’après cesdonnées, estimer A et B (à l’aide de la méthode des quantiles) pour

fX (x) =

1

b −a, a < x < b

0, ailleurs.

5.12 On a enregistré n essais indépendants X1, . . . , Xn de la variable aléatoire X ∼Bernoulli(p). Trouver l’estimateur du maximum de vraisemblance pour p.

5.13 Soit X1, . . . , Xn , un échantillon aléatoire provenant d’une loi normale de para-mètres µ et σ2 inconnus.

a) Trouver les estimateurs du maximum de vraisemblance de µ et σ2.

b) Démontrer que µ et σ2 ont approximativement une distribution normaleconjointe avec moyennes µ et σ2 et variances σ2/n et 2σ4/n.

c) Trouver l’approximation de la distribution de l’estimateur h(µ, σ2) de

h(µ,σ2) = Pr[X ≤ c] =Φ(c −µσ

).

Page 235: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

5.8. Exercices 225

5.14 Soit X , une variable aléatoire représentant les montants de sinistres dont onpossède un échantillon de taille n. La fonction de densité de probabilité de Xest

f (x) = 2θxe−θx2, x > 0.

Déterminer l’estimateur du maximum de vraisemblance de θ.

5.15 Un assureur possède un échantillon aléatoire x1, . . . , xn et il souhaite modéli-ser la variable aléatoire sous-jacente à l’aide de la fonction

F (x) = xp , 0 < x < 1.

a) Déterminer l’estimateur du maximum de vraisemblance de p.

b) Quelle est la variance asymptotique de l’estimateur du maximum de vrai-semblance de p ?

c) À partir de la réponse obtenue en b), déterminer un intervalle de confiancede niveau 95 % pour p.

d) Déterminer l’estimateur du maximum de vraisemblance de E [X ].

e) À partir de la réponse obtenue en d), déterminer un intervalle de confiancede niveau 95 % pour E [X ].

5.16 La variable aléatoire X a la densité suivante :

f (x) =αλα(λ+x)−α−1, x > 0.

On sait que λ= 1000. À partir de l’échantillon

43,145,233,396,777,

déterminer l’estimation du maximum de vraisemblance de α.

5.17 Quatre observations sont faites d’une variable aléatoire dont la densité est

f (x) = 2λxe−λx2, x > 0.

La seule information dont on dispose est qu’une des quatre observations estinférieure à 2. Calculer une estimation du maximum de vraisemblance de λ.

5.18 Un échantillon de taille 40 a été tiré d’une population dont la densité est

f (x) = (2πθ)−1/2e−x2/(2θ), −∞< x <∞.

À partir de cet échantillon, on détermine une estimation du maximum devraisemblance de θ : θ = 2. Déterminer une approximation de l’erreur qua-dratique de θ.

Page 236: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

226 Modélisation paramétrique

5.19 On suppose que X obéit à une distribution log-gamma :

f (x) = λ2 ln(x)

xλ+1, x > 1.

a) Trouver l’estimateur des moments de λ.

b) Trouver l’estimateur du maximum de vraisemblance de λ.

5.20 Soit l’échantillon suivant provenant d’une distribution Gamma(5,λ) :

2,20,5,4,19.

a) Trouver l’estimateur du maximum de vraisemblance de λ et en calculer lavaleur.

b) Trouver la variance de λ si λ= 58 .

5.21 Le tableau ci-dessous présente les sinistres payés en 1999. On pose l’hypo-thèse que la sévérité d’un sinistre est distribuée selon une loi de Pareto deparamètres α et 1. Déterminer l’équation finale permettant de trouver l’esti-mateur du maximum de vraisemblance de α.

Montant Nombre de sinistres

(0,2] 2(2,5] 0

(5,11] 1(11,∞) 1

5.22 Le tableau ci-dessous présente les sinistres payés par un assureur. On poseque la distribution de X est une exponentielle de paramètre β inconnu. Quelest l’estimateur du maximum de vraisemblance de β ?

Montant Nombre de sinistres

(0,1] 1(1,2] 0

(2,∞) 1

5.23 Soit X1, . . . , Xn un échantillon aléatoire provenant d’une loi Weibull de densité

f (x) = 2λxe−λx2, x > 0.

On estime Pk = Pr[X ≤ k] par la méthode du maximum de vraisemblance.

Page 237: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

5.8. Exercices 227

a) Déterminer Pk .

b) Déterminer la variance de l’estimateur trouvé en a).

c) Si X1 = X2 = 10 et X3 = 15, calculer Pr[P10 ≤ 12 ].

5.24 Sachant qu’un échantillon aléatoire X1, . . . , X50 provenant d’une distributionde Pareto(α,λ) a conduit aux estimations α= 1,5 et λ= 1500 par la méthodedu maximum de vraisemblance, estimer les variances des estimateurs α et λainsi que leur covariance.

5.25 On suppose que le montant d’un sinistre obéit à une loi de Pareto(α,λ). Pen-dant une année, on observe 50 sinistres. À l’aide des montants des 50 sinistres,on obtient α= 2, λ= 4, Var[α] = 24 et Var[λ] = 40. Si la covariance entre les es-timateurs α et λ est 10, trouver un intervalle de confiance de niveau α= 0,15pour Pr[X > 10].

5.26 Soit X la variable aléatoire représentant le montant d’un sinistre. On observeles sinistres suivants en assurance automobile :

25,88,33,62,44,75,47,53.

On suppose que X ∼ Exponentielle(λ).

a) Estimer la variance de la distribution de l’estimateur du maximum devraisemblance de E [X ;50].

b) Estimer la variance de la distribution de l’estimateur du maximum devraisemblance de π0,95.

5.27 Soit X , une variable aléatoire indiquant si une expérience est un succès (1)ou un échec (0) et dont la distribution est une loi de Bernoulli de paramètreα. On sait que la distribution a priori du paramètre α est une loi U (0,1). On aobservé un succès en trois essais.

a) Calculer l’estimateur bayesien α si la fonction de perte choisie est l’erreurquadratique.

b) Trouver l’estimation bayesienne de la probabilité que α se retrouve entre0,2 et 0,4.

5.28 On suppose que X |Θ= θ obéit à une loi de Poisson(θ) et que la distribution apriori deΘ est une loi Gamma(α,λ). Pour un échantillon de taille n, trouverl’estimateur bayesien θ si la fonction de perte choisie est l’erreur quadratique.

5.29 On suppose que X |A =α∼ Pareto(α,1) et que la distribution a priori de A estune Exponentielle(3).

a) Trouver la distribution a posteriori de A.

Page 238: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

228 Modélisation paramétrique

b) Calculer α à partir de l’échantillon 2,1,2,3,3,4 si la fonction de pertechoisie est l’erreur quadratique.

5.30 On suppose que X |B =β∼ Exponentielle(β) et que la distribution a priori deB est une Gamma(2,3). On a l’échantillon aléatoire suivant :

6,11,8,13,9

a) Calculer l’estimateur bayesien du paramètre β si la fonction de perte estl’erreur quadratique.

b) Répéter la partie a) avec la fonction de perte valeur absolue de l’erreur. Onfournit les valeurs

Γ(7;4,734) = 0,2 Γ(7;5,411) = 0,3 Γ(7;6,039) = 0,4

Γ(7;6,670) = 0,5 Γ(7;7,343) = 0,6.

5.31 Au cours d’une session, les étudiants en actuariat font des devoirs informa-tiques. En faisant ces devoirs, il leur arrive de rester bloqués. Le nombrede fois où un étudiant reste bloqué dans un devoir suit une distributionBinomiale(3,θ), où l’on suppose que θ est uniformément distribué sur l’inter-valle (0,25,0,75). Deux étudiants sont restés bloqués chacun deux fois pendantun certain devoir.

a) Trouver l’estimateur bayesien de θ avec une fonction de perte quadratique.

b) Déterminer la probabilité a posteriori que θ se retrouve dans l’intervalle(0,6,0,7).

5.32 Pour des contrats d’assurance comportant une rétention de 1,5 millions, 40catastrophes ont été déclarées au réassureur. Le réassureur suppose que lesmontants de sinistres obéissent à une loi de Pareto(α,λ). Soit Y la variablealéatoire représentant un montant de sinistre déclaré au réassureur (en mil-lions). À l’aide des montants qui lui ont été déclarés, le réassureur a estimé lesparamètres α et λ par la méthode du maximum de vraisemblance. Il a obtenuα= 5,084 et λ= 28,998.

a) Trouver, par la méthode du maximum de vraisemblance, l’estimation dePr[Y > 29,5].

b) Si la matrice variance-covariance de (α, λ) est[23,92 167,07

167,07 1199,32

],

estimer la variance de l’estimateur de Pr[Y > 29,5] utilisé en a).

Page 239: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

5.8. Exercices 229

5.33 Soit X la variable aléatoire représentant le montant d’un sinistre. On supposeX ∼ Exponentielle(λ). Pour des contrats d’assurance comportant une fran-chise forfaitaire de 100 $ et une limite supérieure de 3000 $, les montants desinistres suivants ont été payés par l’assureur :

100,200,250,425,515,630,1000,1500,2900,2900.

Estimer le montant espéré d’un sinistre par la méthode du maximum devraisemblance.

5.34 Un assureur signe un traité de réassurance excess-of-loss de plein 150, c’est-à-dire que l’assureur ne paie que les 150 premiers dollars de chaque sinistre etle réassureur se charge de l’excédent. Cet assureur veut calculer combien luicoûterait la hausse du plein à 200, mais il ignore la distribution du coût dessinistres. L’assureur a payé les montants suivants :

10,70,100,105,110,150,150,150

et il suppose que le coût des sinistres est distribué comme suit :

f (x) =λe−λx , x > 0

0, ailleurs.

Quel est l’estimateur du maximum de vraisemblance de λ en supposant queles trois montants de 150 de l’échantillon proviennent d’un montant payésupérieur à 150 $ ?

5.35 On dispose d’un échantillon tiré d’une loi exponentielle présentant deuxobservations entre 0 et 2, quatre observations entre 2 et 5 et trois observa-tions entre 5 et 8. Estimer le paramètre de la loi par la méthode de Cramér–von Mises avec poids unitaires.

Exercices proposés dans LossModels, 4e éd.

13.1, 13.2, 13.3, 13.4, 13.6, 13.8, 13.11, 13.12, 13.15, 13.20, 13.22, 13.23, 13.24, 13.25,13.26, 13.29, 13.33, 13.37, 13.38, 13.39, 13.40, 13.46, 13.47, 13.48, 13.51, 13.52, 13.53,13.57, 13.58, 13.59, 13.60, 13.62, 13.64, 13.65, 13.66, 13.68, 13.70, 13.71, 13.72, 13.73,13.75

Page 240: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

230 Modélisation paramétrique

Réponses

5.1 α= 3,45, β= 3048,87

5.2 L(λ) = [(1−e−2000λ)2(e−2000λ−e−5000λ)4]/(1−e−5000λ)6

5.3 α= 34,83, θ = 27,99

5.4 γ= 2, θ = 200

5.5 x/(1− x)

5.6 µ= 7,40, σ= 0,6368 et 0,056

5.7 3,3511

5.8 a) τ= 1,2687, λ= 0,000747 b) 1947

5.9 β(β+450)0,3010 =β0,3010(β+50)

5.10 τ= 0,48, λ= 0,01,

5.11 a = 10, b = 60

5.12 p = X

5.13 a) µ = X , σ2 = S2 b) h(µ, σ2) ∼ N (h(µ,σ2),V ), V = φ2((c − µ)/σ)(1/n + (c −µ)2/(2nσ2))

5.14 n/∑n

i=1 x2i

5.15 a) −n/∑n

i=1 ln xi b) p2/n c) p ±1,96p/p

n d) p/(1+ p) e) p/(1+ p)±1,96p(1+p)−2/

pn

5.16 3,8629

5.17 14 ln 4

3

5.18 0,20

5.19 a)√

X /(√

X −1) b) 2n/∑n

i=1 ln(Xi )

5.20 a) 1/2 b) 1/64

5.21 L(α) = (1− (1/3)α)2((1/6)α− (1/12)α)(1/12)α

5.22 ln(1,5)

5.23 a) 1−e−λk2, λ= n/

∑ni=1 X 2

i b) k4λ2e−2λk2/n c) 0,4875

5.24 Var[α] = 0,28133, Var[λ] = 656250, Cov(α, λ) = 393,75

5.25 (0,0,7653)

5.26 a) 20,68 b) 3196

Page 241: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

5.8. Exercices 231

5.27 a) 0,4 b) 0,3432

5.28 (α+∑ni=1 Xi )/(λ+n)

5.29 a) Gamma(n +1,3+∑n

i=1 ln(1+xi ))

b) 0,68

5.30 a) 0,14 b) 0,1334

5.31 a) 0,5668 b) 0,3055

5.32 a) 0,0365 b) 0,00057

5.33 1302,50

5.34 0,0059

5.35 0,2286

Page 242: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez
Page 243: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

6 Tests d’adéquation

Objectifs du chapitre

x Évaluer l’adéquation d’un modèle de sévérité des sinistres aux données à l’aidede divers tests graphiques (comparaison des distributions empirique et théorique,graphique quantile-quantile) et statistiques (Kolmogorov–Smirnov, khi carré, ratiodes vraisemblances).

x Calculer la valeur du critère bayesien de Schwarz et du critère d’information deAkaike.

x Choisir le modèle le plus approprié à partir des résultats des tests et critères ci-dessus.

L’objectif ultime d’une modélisation est généralement de déterminer un modèlepour les données. Ce chapitre présente des méthodes permettant d’évaluer desmodèles et de les comparer entre eux.

Par définition, un modèle est toujours une approximation de la réalité. Le butest donc de déterminer si un modèle est assez bon pour permettre de résoudre leproblème posé, ou s’il doit être rejeté.

6.1 Tests graphiques

L’idée ici est de comparer graphiquement une caractéristique du modèle pos-tulé avec la caractéristique empirique correspondante.

6.1.1 Comparaison des fonctions théoriques et empiriques

La manière sans doute la plus simple et intuitive de juger de la qualité d’unmodèle consiste à comparer les fonctions de répartition théorique et empirique,ou encore l’histogramme et la fonction de densité du modèle. Un modèle seraconsidéré comme bon si la fonction théorique suit relativement bien la fonction

233

Page 244: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

234 Tests d’adéquation

empirique. Évidemment, il s’agit ici d’un critère très subjectif qui permet seulementune classification plutôt grossière en bons, acceptables et mauvais modèles.

Exemple 6.1. Soit l’échantillon

30,38,34,29,35,34,29,39,20,37,

21,27,37,18,37,34,17,28,38,32.

On ajuste des distributions gamma et log-normale à ces données par la méthodedu maximum de vraisemblance :

> x <- c(30, 38, 34, 29, 35, 34, 29, 39, 20, 37,

+ 21, 27, 37, 18, 37, 34, 17, 28, 38, 32)

> (fit.g <- fitdistr(x, "gamma")$estimate)

shape rate

17.2322211 0.5613102

> (fit.ln <- fitdistr(x, "lognormal")$estimate)

meanlog sdlog

3.394966 0.252984

La figure 6.1 présente une comparaison entre la fonction de répartition empiriqueet les fonctions de répartition théoriques des deux modèles. La figure 6.2 reprendla même idée avec l’histogramme et les fonctions de densité. Les deux modèlesprésentent un ajustement passable aux données. Toutefois, à la lumière de ces deuxgraphiques, il n’est pas clair qu’un des deux modèles est meilleur que l’autre.

¸ On trouvera le code R pour créer les graphiques des figures 6.1 et 6.2à la section 6.4.

6.1.2 Graphique quantile-quantile

Le graphique quantile–quantile, mieux connu sous son vocable anglais Q-Qplot, est une comparaison visuelle des quantiles empiriques et des quantiles théo-riques d’un modèle. Dans un graphique des premiers en fonction des seconds, unalignement des points signifiera que l’ajustement du modèle est bon. Le graphiquequantile–quantile est plus communément utilisé pour vérifier si des quantités sontdistribuées selon une loi normale, mais on peut facilement généraliser l’idée àtoute autre loi de probabilité.

Page 245: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

6.1. Tests graphiques 235

15 20 25 30 35 40

0.0

0.2

0.4

0.6

0.8

1.0

ecdf(x)

x

Fn(

x)

FIG. 6.1: Comparaison entre la fonction de répartition empirique des données del’exemple 6.1 et la fonction de répartition ajustée d’une loi gamma (trait plein) etd’une loi log-normale (trait brisé)

Pour les quantiles empiriques, on utilise les statistiques d’ordre de l’échantillon,soit les données

y1 ≤ y2 ≤ ·· · ≤ yn

triées en ordre croissant. Quant aux quantiles théoriques, il faut choisir des proba-bilités adéquates où évaluer la fonction de quantile théorique. Dans la littérature,on recommande d’évaluer en des points

j −a

n +1−2a,

pour j = 1, . . . ,n et où a est une valeur quelconque dans l’intervalle [0,1]. Les pointsdu graphique quantile–quantile sont donc(

y j ,F−1(

j +a

n +1−2a

)), j = 1, . . . ,n,

Page 246: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

236 Tests d’adéquation

Histogram of x

x

Den

sity

0 10 20 30 40

0.00

0.02

0.04

0.06

FIG. 6.2: Comparaison entre l’histogramme des données de l’exemple 6.1 et ladensité ajustée d’une loi gamma (trait plein) et d’une loi log-normale (trait brisé)

où F−1 est l’inverse de la fonction de répartition du modèle postulé.Dans R, la fonction ppoints permet de calculer les points où l’on évaluera la

fonction F−1. La valeur par défaut de a est 1/2 lorsque n > 10 et 3/8 sinon.Tel que mentionné précédemment, une droite à 45 degrés indiquera une corres-

pondance parfaite entre les quantiles empiriques et théoriques. Plus le graphiquequantile–quantile s’éloigne de cette droite et moins le modèle est bon.

Exemple 6.2. Soit l’échantillon

10,12,13,15,18,20,22,23,29.

On ajuste des distributions exponentielle et log-normale à ces données par laméthode du maximum de vraisemblance :

Page 247: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

6.1. Tests graphiques 237

10 15 20 25

1015

2025

Theoretical Quantiles

Sam

ple

Qua

ntile

s

FIG. 6.3: Graphique quantile–quantile des données de l’exemple 6.2 pour desmodèles log-normale (cercles pleins) et exponentielle (cercles vides)

> x <- c(10, 12, 13, 15, 18, 20, 22, 23, 29)

> (fit.e <- fitdistr(x, "exponential")$estimate)

rate

0.05555556

> (fit.ln <- fitdistr(x, "lognormal")$estimate)

meanlog sdlog

2.837825 0.327125

La figure 6.3 présente le graphique quantile–quantile combiné des deux modèles.On constate que la distribution log-normale fournit un meilleur ajustement pour cepetit échantillon. Le graphique de la figure 6.4 confirme d’ailleurs cette conclusion.

Page 248: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

238 Tests d’adéquation

Histogram of x

x

Den

sity

10 15 20 25 30

0.00

0.02

0.04

0.06

0.08

0.10

FIG. 6.4: Comparaison de l’histogramme des données de l’exemple 6.2 et la densitéajustée d’une loi log-normale (trait plein) et d’une loi exponentielle (trait brisé)

¸ On trouvera le code R pour créer les graphiques des figures 6.3 et 6.4à la section 6.4.

6.2 Tests statistiques

On se rappelera de la section 1.13 que le but d’un test statistique consiste àvérifier si l’on doit ou non rejeter une hypothèse nulle H0 en faveur d’une hypo-thèse alternative H1. Pour ce faire, on choisit une statistique T (X1, . . . , Xn) d’unéchantillon aléatoire X1, . . . , Xn dont la distribution est connue (au moins approxi-mativement ou asymptotiquement) sous H0. À partir de cette distribution, on peut

Page 249: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

6.2. Tests statistiques 239

déterminer une région critique C ; lorsque la valeur T (x1, . . . , xn) de la statisquetombe dans cette région critique pour un échantillon donné, l’hypothèse H0 estrejetée. On note

α= Pr[T (X1, . . . , Xn) ∈C ; H0],

le seuil de signification du test (ou 1−α le niveau de confiance du test).Une manière plus utile de rendre compte des résultats d’un test est par le biais

de sa valeur p. Celle-ci représente le seuil de signification maximal auquel on peutrejeter H0 étant donné la valeur de la statistique obtenue avec un échantillon. Parexemple, si la région critique est C = x1, . . . , xn ;T (x1, . . . , xn) > c, alors la valeur pest la probabilité

p = Pr[T (X1, . . . , Xn) > T (x1, . . . , xn); H0].

La façon la plus simple de se rappeler de la signification de la valeur p est lasuivante : 1−p est le niveau de confiance avec lequel on peut rejeter l’hypothèsenulle H0.

Dans notre contexte, on a un échantillon aléatoire X1, . . . , Xn provenant d’unedistribution (inconnue) avec fonction de répartition F et l’on cherche à déterminersi cette distribution est F0 ≡ F0(x; θ) ou non. On cherche donc une statistiqueT (X1, . . . , Xn) permettant de tester les hypothèses

H0 : F = F0

H1 : F 6= F0.

Pour réaliser ce test, un point de départ naturel est de choisir la fonction Tcomme étant une certaine mesure de distance d entre les données et le modèle,c’est-à-dire entre Fn et F0. Ainsi, T (X1, . . . , Xn) = d(Fn ,F0) ≥ 0 et les petites valeursde d devraient privilégier H0. En d’autres termes, puisque l’on souhaite ne pasrejeter H0 (le modèle obtenu est adéquat), on favorisera les grandes valeurs p dansles tests. On ne rejette pas H0 si p >α.

6.2.1 Test de Kolmogorov-Smirnov

La statistique de Kolmogorov–Smirnov, Dn , est directement construite à partirde la notion de distance de Kolmogorov–Smirnov entre deux fonctions de répar-tition. Cette distance est définie comme la plus grande différence entre les deuxfonctions. La statistique est donc

Dn = maxx

|Fn(x)−F0(x)|.

Page 250: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

240 Tests d’adéquation

0.6 0.8 1.0 1.2 1.4 1.6

0.4

0.5

0.6

0.7

0.8

x

Fn(

x)

Fn(x) − F0(x)

Fn(x−) − F0(x)

FIG. 6.5: Calcul de la statistique de Kolmogorov–Smirnov

Comme la fonction de répartition empirique, Fn , est une fonction en escalier, ilfaut évaluer les différences avant et après chacun des sauts. En pratique, on a donc

Dn = max1≤ j≤n

(|Fn(x j )−F0(x j )|, |Fn(x j−)−F0(x j )|),

où x j− représente un point juste à la gauche de x j . La figure 6.5 illustre cette idée.

On rejette l’hypothèse H0 (et donc le modèle) lorsque la valeur de la statistiqueexcède la valeur critique c . Celle-ci est donnée dans le tableau 6.1 pour divers seuilsde signification.

Remarque. Les valeurs critiques du tableau 6.1 sont valides pour les échantillonsde taille supérieure à 15 et dans la mesure où la loi F0 est entièrement déterminée,c’est-à-dire que ses paramètres n’ont pas été estimés à partir de données. Dans lecas contraire, les valeurs critiques sont plus petites.

Page 251: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

6.2. Tests statistiques 241

α c

0,20 1,073/p

n0,10 1,223/

pn

0,05 1,358/p

n0,02 1,518/

pn

0,01 1,629/p

n

TAB. 6.1: Valeurs critiques pour la statistique de Kolmogorov–Smirnov

On peut construire un intervalle de confiance de niveau 1−α pour F à partirde la statististique de Kolmogorov–Smirnov. En effet, on a que

Pr[Dn ≤ c] = Pr[maxx

|Fn(x)−F0(x)| ≤ c] = 1−α,

d’où, pour tout x,

1−α= Pr[|Fn(x)−F (x)| ≤ c]

= Pr[−c ≤ Fn(x)−F (x) ≤ c]

= Pr[Fn(x)− c ≤ F (x) ≤ Fn(x)+ c].

Dans R, la fonction ks.test permet, pour un échantillon donné, de calculer lavaleur de la statistique et la valeur p du test. Pour un petit échantillon, n < 100, ilest possible d’obtenir la valeur p exacte et la valeur p de la distribution limite, alorsque pour un grand échantillon, uniquement la valeur p asymptotique est donnée.

Exemple 6.3. Un assureur souhaite modéliser les données suivantes :

2,5,7,10,11,12,18

par une distribution exponentielle de paramètre λ= 0,108. On vérifie l’adéquationde ce modèle avec la statistique de Kolmogorov–Smirnov (malgré le petit échan-tillon) pour un seuil de signification de 20 %.

La fonction de répartition du modèle est

F0(x) = 1−e−0,108x , x > 0,

Page 252: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

242 Tests d’adéquation

x j |Fn(x j )−F0(x j )| |Fn(x j−)−F0(x j )|2 0,0514 0,19435 0,1315 0,27447 0,1019 0,2447

10 0,0890 0,231811 0,0191 0,123712 0,1308 0,012118 0,1431 0,0003

TAB. 6.2: Différences entre les fonctions de répartition théorique et empirique

alors que la fonction de répartition empirique est

F7(x) =

0, x < 2

1/7, x ≤ 2

2/7, x ≤ 5

3/7, x ≤ 7

4/7, x ≤ 10

5/7, x ≤ 11

6/7, x ≤ 12

1, x ≥ 18.

Le tableau 6.2 présente les différences entre les fonctions de répartition. La valeur dela statistique D7 est la plus grande différence de ce tableau. On a donc D7 = 0,2744.La valeur critique du test est c = 1,073/

p7 = 0,4056 > 0,2744. On ne rejette donc

pas le modèle.Ce résultat est confirmé par les valeurs p asymptotique et exacte telles que

calculées par la fonction ks.test :

> x <- c(2, 5, 7, 10, 11, 12, 18)

> ks.test(x, pexp, rate = 0.108, exact = TRUE)

One-sample Kolmogorov-Smirnov test

data: x

D = 0.2744, p-value = 0.5752

alternative hypothesis: two-sided

> ks.test(x, pexp, rate = 0.108, exact = FALSE)

Page 253: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

6.2. Tests statistiques 243

0 5 10 15 20

0.0

0.2

0.4

0.6

0.8

1.0

x

Fn(

x)

FIG. 6.6: Fonctions de répartition empirique et théorique et bornes de l’intervallede confiance

One-sample Kolmogorov-Smirnov test

data: x

D = 0.2744, p-value = 0.6677

alternative hypothesis: two-sided

La figure 6.6 présente une comparaison entre la fonction de répartition em-pirique et la fonction de répartition théorique. Les lignes pointillées indiquentles bornes de l’intervalle de confiance calculé avec la statistique de Kolmogorov–Smirnov. On constate visuellement que l’hypothèse nulle n’est pas rejetée puisquela fonction de répartition empirique se trouve à l’intérieur des bornes à plus de80 %.

Page 254: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

244 Tests d’adéquation

6.2.2 Test du khi carré de Pearson

Le test du khi carré est valide uniquement pour des données groupées ; onregroupera donc arbitrairement les données individuelles. Soit n j le nombre dedonnées dans la classe (c j−1,c j ], j = 1, . . . ,r et

∑rj=1 n j = n. La statistique est

Q =r∑

j=1

(E j −n j )2

E j,

oùE j = n(F (c j ; θ)−F (c j−1; θ)).

Asymptotiquement, la statistique Q obéit à une loi χ2(r − p −1), où p est lenombre de paramètres estimés. On rejette donc H0 si, et seulement si, la valeur dela statistique est supérieure au 100(1−α)e quantile d’une telle loi.

On considère généralement que ce test est valide si le nombre espéré de don-nées dans chacune des classes est supérieur à 5. Si ce n’est pas le cas, il faut regrou-per des classes.

Exemple 6.4. Supposons que l’on a les données groupées suivantes :

Intervalle Fréquence

(0−5] 60(5−20] 25(20−∞) 15

Si l’on ajuste une loi de Pareto(1,10) à ces données, on a

FX (x) = 1− 10

10+x= x

10+x

et

E1 = 100(F (5)−F (0)) = 33,33

E2 = 100(F (20)−F (5)) = 33,33

E3 = 100(1−F (20)) = 33,33,

d’où la statistique du khi carré est

Q = (60−33,33)2

33,33+ (25−33,33)2

33,33+ (15−33,33)2

33,33

= 33,50.

Page 255: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

6.2. Tests statistiques 245

6.2.3 Test du ratio des vraisemblances

Le test du ratio des vraisemblances (likelihood ratio test ; LRT) est un test statis-tique basé sur la fonction de vraisemblance permettant de vérifier si un paramètred’une distribution appartient ou non à un sous-espaceΘ0 de l’espaceΘ des valeurspossibles des paramètres. La forme générale du test est la suivante :

H0 : θ ∈Θ0

H1 : θ ∈Θc0,

oùΘc0 est le complément deΘ0. La statistique du test est

T =−2ln

(supΘ0L(θ; X1, . . . , Xn)

supΘL(θ; X1, . . . , Xn)

),

où L(θ; X1, . . . , Xn) =∏ni=1 f (Xi ;θ) est la fonction de vraisemblance de l’échantillon

X1, . . . , Xn . Par les propriétés des logarithmes, on peut aussi écrire la statistiqueainsi :

T =−2

[supΘ0

l (θ; X1, . . . , Xn)− supΘ

l (θ; X1, . . . , Xn)

],

avec l (θ; X1, . . . , Xn) = lnL(θ; X1, . . . , Xn), la fonction de log-vraisemblance.On peut démontrer que la statistique T a une distribution χ2(1). On rejette

donc l’hypothèse H0 avec un niveau de confiance 1−α lorsque T >χ2α(1).

Exemple 6.5. Soit X1, . . . , Xn un échantillon aléatoire d’une distribution exponen-tielle avec fonction de densité de probabilité f (x;λ) =λe−λx pour x > 0. L’espacedes valeurs possibles du paramètre estΘ=R+. Supposons que l’on veut tester

H0 :λ=λ0

H1 :λ 6=λ0,

où λ0 est une valeur quelconque. Dans ce cas, le sous-espaceΘ0 est λ0.La fonction de vraisemblance est

L(λ; X1, . . . , Xn) ≡ L(λ) =n∏

i=1λe−λXi =λne−λnX .

Or, on sait (voir l’exemple 5.3) que cette fonction trouve son maximum dans R+

lorsque λ= X −1. La statistique du test LRT est donc, ici,

T =−2ln

(L(λ0)

L(X −1)

)

=−2ln

(λn

0 e−λ0nX

X −ne−n

)=−2n(lnλ0 + ln X )n −2n +2λ0nX .

Page 256: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

246 Tests d’adéquation

Le 95e centile d’une distributionχ2 avec un degré de liberté est 3,8415. On rejetteraitdonc l’hypothèse H0 si T > 3,8415 pour un échantillon et une valeur de λ0 donnés.

Exemple 6.6. On a un échantillon aléatoire de 20 valeurs d’une distribution de Pa-reto de paramètre α= 2 et λ inconnu. L’estimateur du maximum de vraisemblancede λ est 7,0. On sait également que

∑20i=1 ln(xi +7,0) = 49,01 et

∑20i=1 ln(xi +3,1) =

39,30. On souhaite tester

H0 :λ= 3,1

H1 :λ 6= 3,1.

On vérifie aisément que la fonction de log-vraisemblance est

l (λ) = n lnα+nα lnλ− (α+1)n∑

i=1ln(xi +λ)

= 20ln2+40lnλ−320∑

i=1ln(xi +λ).

Le maximum de cette fonction surΘ=R+ est atteint à l’estimateur du maximumde vraisemblance, λ = 7,0. Or, l (7,0) = −55,33. Sur le sous-espace Θ0 = 3,1, lemaximum est évidemment atteint à 3,1 et L(3,1) =−58,78.

La valeur de la statistique du test du ratio des vraisemblances est donc T =−2(−58,78+55,33) = 6,90. Puisque 6,90 >χ2

0,05(1) = 3,8415, on rejette l’hypothèseH0. La valeur p du test est Pr[T > 6,90] = 0,0086, ce qui correspond à un niveau deconfiance de 99,14 % dans le rejet de H0.

On peut interpréter la statistique du test LRT comme le rapport entre le maxi-mum de la fonction de vraisemblance sur un sous-espace restreint (Θ0) et le maxi-mum de cette même fonction sur tout l’espace des valeurs possibles des paramètres(Θ). Or, on sait que ce dernier maximum est atteint lorsque θ = θ, l’estimateur dumaximum de vraisemblance. Si l’on note θ0 l’estimateur du maximum de vrai-semblance sur le sous-espace restreintΘ0, la statistique du test peut s’écrire plussimplement ainsi :

T =−2ln

(L(θ0; X1, . . . , Xn)

L(θ; X1, . . . , Xn)

)=−2[l (θ0; X1, . . . , Xn)− l (θ; X1, . . . , Xn)].

Dans notre contexte, il n’est pas très intéressant de tester si un paramètre estégal ou non à une certaine valeur. Nous sommes davantage intéressés à compa-rer l’ajustement de deux distributions. Le test du ratio des vraisemblances nous

Page 257: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

6.3. Choix d’un modèle 247

permet de faire cette comparaison, mais dans la mesure où une distribution estun cas spécial de l’autre. En effet, la maximisation de la fonction de vraisemblancesur un sous-espace restreint s’apparente alors à fixer la valeur d’un ou plusieursparamètres de la distribution générale. La distribution de la statistique est toujoursune χ2, mais le nombre de degrés de liberté est égal à la différence entre le nombrede paramètres libres sous H1 et le nombre de paramètres libres sous H0.

Exemple 6.7. La distribution de Pareto est un cas spécial de la distribution dePareto généralisée lorsque τ= 1. Ainsi, le test H0 : les données proviennent d’unedistribution de Pareto(α,θ) versus H1 : les données proviennent d’une distribu-tion de Pareto généralisée(α,τ,θ) se ramène essentiellement au test du ratio desvraisemblances

H0 : τ= 1

H1 : τ 6= 1,

avec l (α,τ,θ; X1, . . . , Xn) la fonction de log-vraisemblance de la distribution Paretogénéralisée. Soit α0 et θ0 les estimateurs du maximum de vraisemblance des para-mètres de la distribution de Pareto et soit α1, τ1 et θ1, ceux des paramètres de ladistribution de Pareto généralisée. La statistique du test ci-dessus est alors

T =−2[l (α0,1, θ0; X1, . . . , Xn)− l (α1, τ1, θ1; X1, . . . , Xn)].

Sa distribution est une χ2 avec 3−2 = 1 degré de liberté.

6.3 Choix d’un modèle

Lire la section 16.5 de Klugman et collab. (2012a) ou Klugman et collab. (2008).

6.3.1 Critère bayesien de Schwarz

Classer des modèles par la valeur de leur fonction de log-vraisemblance a l’effetpernicieux de favoriser les modèles avec un plus grand nombre de paramètres,ce qui entre en violation avec le principe de parsimonie. Le critère bayesien deSchwarz (SBC) propose donc de classer les modèles selon leurs fonctions de log-vraisemblance réduites d’une quantité (p/2) lnn, où p est le nombre de paramètresdu modèles et n est la taille de l’échantillon. On a donc

SBC = l − p

2lnn,

où l est la fonction de log-vraisemblance.

Page 258: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

248 Tests d’adéquation

6.3.2 Critère d’information de Akaike

La statistique AIC (An Information Criterion) de Akaike (1974) est similaire aucritère bayesien de Schwarz et vise les mêmes buts. On a

AIC =−l +2p

et on favorise la plus petite statistique.

6.4 Code informatique

###

### TESTS GRAPHIQUES

###

## EXEMPLE 6.1

##

## Comparaison des courbes empiriques et théoriques d'un modèle pour

## un petit échantillon de données.

x <- c(30, 38, 34, 29, 35, 34, 29, 39, 20, 37,

21, 27, 37, 18, 37, 34, 17, 28, 38, 32)

## Le package MASS est nécessaire pour le calcul des EMV.

library(MASS)

## On ajuste des lois gamma et log-normale à ces données par la

## méthode du maximum de vraisemblance.

(fit.g <- fitdistr(x, "gamma")$estimate)

(fit.ln <- fitdistr(x, "lognormal")$estimate)

## Comparaison entre la fonction de répartition empirique et les

## fonctions de répartition théoriques des deux modèles. La façon la

## plus simple de tracer ces dernières est généralement avec la

## fonction 'curve'.

plot(ecdf(x))

curve(pgamma(x, fit.g[1], fit.g[2]), add = TRUE,

lwd = 2, col = "darkblue")

curve(plnorm(x, fit.ln[1], fit.ln[2]), add = TRUE,

lwd = 2, col = "darkred")

## Même idée avec l'histogramme et les fonctions de densité. Si les

## classes sont égales dans l'histogramme, ne pas oublier d'ajouter

## l'option 'prob = TRUE' dans l'appel de 'hist'.

hist(x, breaks = c(0, 20, 25, 28, 30, 32, 34, 37, 40))

Page 259: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

6.4. Code informatique 249

curve(dgamma(x, fit.g[1], fit.g[2]), add = TRUE,

lwd = 2, col = "darkblue")

curve(dlnorm(x, fit.ln[1], fit.ln[2]), add = TRUE,

lwd = 2, col = "darkred")

## EXEMPLE 6.2

##

## On ajuste des distributions exponentielle et log-normale à un petit

## échantillon par la méthode du maximum de vraisemblance et on

## compare leur ajustement avec des graphiques quantile-quantile.

x <- c(10, 12, 13, 15, 18, 20, 22, 23, 29)

(fit.e <- fitdistr(x, "exponential")$estimate)

(fit.ln <- fitdistr(x, "lognormal")$estimate)

## La fonction 'ppoints' calcule les points où l'on évaluera la

## fonction de quantile théorique. Par défaut, a = 3/8 si le nombre de

## données est inférieur ou égal à 10 (comme c'est le cas ici) et a =

## 1/2 sinon. On peut fixer la valeur de a nous-mêmes.

(y <- ppoints(length(x))) # avec 'ppoints'

(seq_along(x) - 3/8)/(length(x) + 0.25) # idem

## La fonction 'qqnorm' trace un graphique quantile-quantile pour des

## données normales. De manière plus générale, 'qqplot' trace un

## graphique quantile-quantile entre deux jeux de données. Pour nos

## besoins, il suffit de lui fournir les données et les quantiles

## théoriques.

##

## On commence avec le graphique de la log-normale.

qqplot(qlnorm(y, fit.ln[1], fit.ln[2]), x,

pch = 16, col = "darkblue",

xlab = "Theoretical Quantiles",

ylab = "Sample Quantiles")

## Pour ajouter le graphique de l'exponentielle au graphique existant,

## on doit utiliser la fonction 'points' et renverser l'ordre des

## arguments.

points(qexp(y, fit.e), x, pch = 16, col = "darkred")

## Enfin, ajout de la droite y = x.

abline(0, 1)

## L'ajustement de la log-normale est bien meilleur, comme en fait foi

## la comparaison des densités avec l'histogramme.

hist(x, breaks = c(10, 12, 18, 25, 30))

Page 260: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

250 Tests d’adéquation

curve(dlnorm(x, fit.ln[1], fit.ln[2]), add = TRUE,

lwd = 2, col = "darkblue")

curve(dexp(x, fit.e), add = TRUE,

lwd = 2, col = "darkred")

6.5 Exercices

6.1 On suppose que la variable aléatoire représentant le montant d’un sinistre aune distribution de Pareto avec paramètres α= 2 et λ= 1000. Un échantillonde taille 10 présente trois données entre 0 et 250, deux données entre 250 et 500,trois données entre 500 et 1000 et deux données supérieures à 1000. Appliquerle test du khi carré à un seuil de signification de 10 % même si les nombres desinistres attendus dans chaque classe ne sont pas supérieurs à cinq.

6.2 Le tableau ci-dessous présente un échantillon de 1000 données groupées.

Intervalle Nombre de données

(0,3] 180(3,7,5] 180

(7,5,15] 235(15,40] 255(40,∞) 150

Une loi de Pareto a été ajustée à ces données et les estimateurs obtenus sontα = 3,5 et λ = 50. Quel est le seuil de signification le plus élevé (parmi 5 %,2,5 %, 1 % et 0,5 %) auquel on ne rejette pas ce modèle avec le test du khi carré ?

6.3 On dispose de l’échantillon aléatoire 0,1, 0,4, 0,8, 0,8, 0,9 et on veut y ajusterla distribution avec fonction de densité de probabilité

f (x) = 1+2x

2, 0 ≤ x ≤ 1.

Calculer la statistique de Kolmogorov–Smirnov et réaliser un test avec un seuilde signification de 5 %.

6.4 La compagnie d’assurance Great Company a obtenu les montants de sinistressuivants :

1,1,2,2,2,2,3,3,4,8.

a) Trouver la distribution empirique.

b) Si le montant d’un sinistre obéit à une loi de Pareto(2,2), calculer la distancede Cramér–von Mises avec poids unitaires.

Page 261: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

6.5. Exercices 251

c) Un compétiteur sujet aux mêmes sinistres, Greater Company, a perdu toutesles données sur ses sinistres. Dans un élan de sollicitude, Great Companylui fournit ses données, mais sous la forme restreinte ci-dessous.

Montants des sinistres Nombre de sinistres

(0,2] 6(0,4] 9(0,8] 10

Calculer la distance de Cramér–von Mises avec poids unitaires.

6.5 Soit la distribution avec fonction de densité de probabilité

f (x) = x

2, 0 ≤ x ≤ 2,

et soit l’échantillon tiré de cette densité 0,5, 1, 1,25, 1,5. Calculer la statistiquede Kolmogorov–Smirnov.

6.6 On veut tester si

fX (x) =

x50 , 0 < x < 10

0, ailleurs

est un bon modèle pour les données suivantes :

1, 4, 6, 9, 8, 7, 9,5.

Utiliser la statistique de Kolmogorov–Smirnov avec un seuil de signification de5 %. (Utiliser la valeur critique c = 1,36/

pn même si n < 15.)

6.7 En supposant que les données du tableau ci-dessous sont associées à une loide Pareto(1,8), calculer la statistique de Pearson.

Intervalle Fréquence

(0,5] 10(5,20] 5

(20,∞) 5

6.8 On a observé les sinistres suivants en assurance habitation :

125,550,550,700.

On hésite entre les distributions Gamma(3,0,01) et Gamma(3,5,0,01) pour mo-déliser le montant d’un sinistre. Utiliser la statistique de Kolmogorov–Smirnov

Page 262: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

252 Tests d’adéquation

pour guider le choix de la distribution. Voici quelques valeurs de la Gammaincomplète : Γ(3,5;1,25) = 0,0729, Γ(3,5;5,51) = 0,8614, Γ(3,5;7) = 0,9488. Deplus, pour α entier, on a

Γ(α; x) = 1−α−1∑j=0

x j e−x

j !.

6.9 On a observé les sinistres du tableau ci-dessous en assurance médicaments. Dé-terminer, à l’aide de la statistique de Pearson, si l’hypothèse d’une distributionavec taux d’échec constant

λ(x) = 0,01, x > 0

est appropriée à un niveau de confiance de 95 %.

Montants des sinistres Nombre de sinistres

[0,25) 10[25,40) 5[40,60) 10[60,80) 5[80,∞) 20

6.10 On détient les informations du tableau ci-dessous sur l’expérience de sinistresd’un portefeuille d’assurance.

Montants de sinistres Fréquence

[0,25) 10[25,50) 12[50,100) 12[100,200) 11[200,∞) 5

On hésite entre une loi de Pareto(1,5, 50) et une loi de Weibull(0,01, 1) pour ladistribution du montant d’un sinistre.

a) Quel modèle privilégier si on utilise la distance de Cramér–von Mises avecpoids unitaires pour guider le choix ?

b) Si la statistique de Pearson avait été utilisée au lieu de la distance deCramér–von Mises, l’hypothèse de la loi Pareto(1,5,50) aurait-elle été reje-tée à un niveau de confiance α= 0,05 ?

Page 263: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

6.5. Exercices 253

c) Si l’on obtient une distance de Cramér–von Mises de 0,01 lorsque l’onsuppose X ∼ Log-normale(µ= 65,σ2 = 5500), est-ce que, selon cette sta-tistique, le choix de cette distribution est meilleur que le choix de la distri-bution de Pareto(1,5,50) ?

6.11 Au départ d’une course de chevaux, il y a habituellement huit positions de dé-part et la position numéro 1 est la plus proche de la palissade. On soupçonnequ’un cheval a plus de chances de gagner quand il porte un numéro faible,c’est-à-dire lorsqu’il est plus proche de la palissade intérieure. Le tableauci-dessous présente les résultats pour 144 courses.

Numéro 1 2 3 4 5 6 7 8

Gains 29 19 18 25 17 10 15 11

a) Poser les hypothèses à tester (hypothèse nulle et hypothèse alternative).

b) La comparaison de la distribution observée à la distribution théoriques’effectue par un test de Kolmogorov–Smirnov. Que peut-on en conclure ?

6.12 À partir d’un échantillon contenant 100 données, un assureur obtient lesrésultats présentés dans le tableau ci-dessous pour cinq modèles postulés.Déterminer le meilleur modèle selon le critère bayesien de Schwarz.

Modèle Nombre de paramètres Log-vraisemblance

Pareto généralisée 3 −219,1Burr 3 −219,2Pareto 2 −221,2Log-normale 2 −221,4Exponentielle inverse 1 −224,4

Exercices proposés dans LossModels, 4e éd.

16.1, 16.2, 16.3, 16.4, 16.5, 16.8, 16.9, 16.11, 16.12, 16.15, 16.16

Réponses

6.1 Q = 0,7740

6.2 0,5 %

Page 264: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

254 Tests d’adéquation

6.3 D = 0,32

6.4 a) 0,3478 b) 0,0242

6.5 0,4375

6.6 D = 0,1329

6.7 1,1667

6.8 Gamma(3,5,0,01)

6.9 Q = 1,8179

6.10 a) Weibull b) oui c) oui

6.11 a) D = 0,132

6.12 Pareto

Page 265: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

7 Modèles de fréquence

Objectifs du chapitre

x Définir et connaître les principales caractéristiques (fonction de masse de probabi-lité, fonction de répartition, moments) des modèles de fréquence les plus usuels enactuariat : loi de Poisson, loi binomiale négative, loi géométrique, loi binomiale.

x Estimer les paramètres des lois mentionnées ci-dessus et choisir quel modèle utiliserdans un contexte donné.

x Définir les familles de lois de probabilité discrètes (a,b,0) et (a,b,1) et en identifierles principaux membres.

Le but de ce chapitre est de présenter différents modèles pour la fréquencedes sinistres. Les distributions candidates doivent être des distributions discrètesdéfinies sur les valeurs 0,1,2, . . .

Soit N , la variable aléatoire qui représente le nombre de sinistres pendant unepériode fixée. On a que N ∈N et on pose

pk = Pr[N = k], k = 0,1,2, . . .

7.1 Fonction génératrice des probabilités

La fonction génératrice des probabilités d’une distribution discrète est

PN (t ) = E [t N ] =∞∑

k=0pk t k .

On a, par exemple,

PN (e t ) = E [e t N ] = MN (t )

255

Page 266: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

256 Modèles de fréquence

et

PN (1) = E [1N ] = 1.

Comme son nom l’indique, la fonction génératrice des probabilités permet degénérer les probabilités d’une variable aléatoire. En effet, la dérivée d’ordre k de lafonction génératrice des probabilités est

P (k)N (z) =

∞∑j=k

j !

( j −k)!z j−k p j

et donc

P (k)N (0) = k !pk ,

d’où

pk = 1

k !P (k)

N (0).

De plus, on a

P (k)N (1) = E [(N )(N −1) · · · (N −k +1)]

et donc

E [N ] = P (1)N (1)

Var[N ] = P (2)N (1)+P (1)

N (1)− (P (1)N (1))2.

7.2 Principales distributions discrètes

On présente dans cette section les principales caractéristiques des lois de pro-babilité les plus souvent utilisées pour le dénombrement des sinistres en assurance.L’annexe A reprend bon nombre des résultats ci-dessous dans une forme pluscompacte.

7.2.1 Loi de Poisson

La fonction de masse de probabilité de la loi de Poisson de paramètre λ, parfoisappelé le paramètre d’intensité, est

pk = λk e−λ

k !, k = 0,1, . . . ,

Page 267: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

7.2. Principales distributions discrètes 257

avec λ> 0. De plus,

Pr[N ≤ k] =k∑

j=0p j

=k∑

j=0

λ j e−λ

j !

= 1−Γ(k +1;λ),

où Γ() est la fonction gamma incomplète.La fonction génératrice des moments est

MN (t ) = eλ(e t−1),

et la fonction génératrice des probabilités est

PN (t ) = eλ(t−1), λ> 0.

La distribution de Poisson a la propriété d’avoir une espérance égale à sa va-riance :

E [N ] = Var[N ] =λ.

Le théorème suivant établit que la somme de variables aléatoires Poisson indé-pendantes est aussi Poisson.

Théorème 7.1. Soit Ni i=1,...,k une suite de variables aléatoires indépendantes tellesque Ni ∼ Poisson(λi ) et soit N = N1 +·· ·+Nk . Alors,

N ∼ Poisson(λ1 +·· ·+λk ).

Démonstration. En utilisant la fonction génératrice des probabilités, on a

PN (z) = E [zN ]

= E [zN1+···+Nk ]

= E [zN1 . . . zNk ]

= E [zN1 ] . . .E [zNk ]

=k∏

i=1PNi (z)

= e(z−1)(λ1+···+λk ),

d’où N ∼ Poisson(λ1 + . . .+λk ).

Page 268: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

258 Modèles de fréquence

De manière similaire, le théorème suivant établit que la distribution de Poissonest infiniment divisible.

Théorème 7.2. Si on décompose l’ensemble des sinistres en m catégories possiblesde probabilités respectives q1, . . . , qm (

∑mi=1 qi = 1) et si Ni est le nombre de sinistres

dans la catégorie i , alors si N ∼ Poisson(λ), les variables aléatoires N1, . . . , Nm sontindépendantes et telles que Ni ∼ Poisson(λqi ), i = 1, . . . ,m.

Démonstration. On trouve d’abord la distribution des variables aléatoires Ni , i =1, . . . ,m. Pour N = n fixé, on a Ni |N = n ∼ Binomiale(n, qi ). Ainsi, la distributionconjointe est

N1, . . . , Nm |N = n ∼ Multinomiale(n, q1, . . . , qm).

On a alors

Pr[Ni = ni ] =∞∑

n=ni

Pr[Ni = ni |N = n]Pr[N = n]

=∞∑

n=ni

(n

ni

)qni

i (1−qi )n−ni

(λne−λ

n!

)

= e−λqni

i

ni !

∞∑n=ni

1

(n −ni )!(1−qi )n−niλn

= (λqi )ni e−λ

ni !

∞∑n=ni

λn−ni (1−qi )n−ni

(n −ni )!

= (λqi )ni e−λ

ni !

∞∑j=0

[λ(1−qi )] j

j !

= (λqi )ni e−λ

ni !eλ(1−qi )

= (λqi )ni e−λqi

ni !,

d’où Ni ∼ Poisson(λqi ).De plus,

Pr[N1 = n1, . . . , Nm = nm] = Pr[N1 = n1, . . . , Nm = nm |N = n]Pr[N = n]

=(

n!

n1! · · ·nm !qn1

1 · · ·qnmm

)λne−λ

n!

=(

(λq1)n1 e−λq1

n1!

)· · ·

((λqm)nm !e−λpm

nm !

).

Page 269: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

7.2. Principales distributions discrètes 259

Ainsi, la distribution conjointe est le produit des distributions marginales et, parconséquent, les variables aléatoires N1, . . . , Nm sont stochastiquement indépen-dantes.

Exemple 7.1. Soit un portefeuille d’assurance automobile pour lequel la fréquencedes sinistres a une distribution de Poisson de moyenne 1000. On évalue que 65 %des accidents sont causés par des jeunes conducteurs et que 35 % des accidentssont causés par les conducteurs plus agés. (Il faut noter, ici, que cela ne signifie pasque le portefeuille contient 65 % de jeunes conducteurs et 35 % de conducteursplus vieux.)

Par le théorème précédent, on a donc les modèles suivants pour la distribu-tions des sinistres du portefeuille global (N ), des jeunes conducteurs (NJ ) et desconducteurs plus agés (NV ) :

N ∼ Poisson(1000)

NJ ∼ Poisson(650)

NV ∼ Poisson(350).

7.2.2 Binomiale négative

La fonction de masse de probabilité de la loi binomiale négative avec para-mètres r > 0 et 0 ≤ θ ≤ 1 est

Pr[N = k] = Γ(r +k)

Γ(k +1)Γ(r )θr (1−θ)k , k = 0,1, . . .

Si le paramètre de forme r est entier, alors la binomiale négative s’interprète commela distribution du nombre d’échecs avant d’obtenir r succès dans une série d’expé-riences de Bernoulli avec probabilité de succès θ. On a alors

Γ(r +k)

Γ(k +1)Γ(r )=

(k + r −1

r −1

).

La queue de la distribution binomiale négative est passablement lourde lorsquer < 1.

La distribution a également la propriété souvent souhaitable d’avoir une va-riance supérieure à son espérance. En effet,

E [N ] = r (1−θ)

θ≤ r (1−θ)

θ2 = Var[N ] ,

Page 270: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

260 Modèles de fréquence

avec égalité dans le cas peu intéressant où θ = 1.La distribution binomiale négative cultive des liens étroits avec la distribution

gamma. En effet, la première est l’analogue discret de la seconde (voir la distribu-tion géométrique, plus bas). De plus, la binomiale négative résulte d’un mélange(continu) entre une distribution de Poisson et la gamma.

7.2.3 Géométrique

La distribution géométrique est un cas spécial de la binomiale négative avecr = 1. On a donc

Pr[N = k] = θ(1−θ)k , k = 0,1, . . .

Elle s’interprète comme la distribution du nombre d’échecs avant le premier succèsdans une suite d’expériences de Bernoulli.

La distribution géométrique est l’analogue discret de la distribution exponen-tielle. En effet, soit X une variable aléatoire distribuée selon une loi exponentielle demoyenne 1/λ. Le support de la variable aléatoire [X ] (où [ ] représente la fonctionpartie entière) est l’ensemble des nombres naturels. De plus,

Pr[[X ] = x] = Pr[x ≤ X < x +1]

=∫ x+1

xλe−λy d y

= FX (x +1)−FX (x)

= e−λx −e−λ(x+1)

= e−λx (1−e−λ)

= θ(1−θ)x ,

avec θ = 1−e−λ. Ainsi, la partie entière d’une loi exponentielle est une loi géomé-trique. On peut en déduire le lien semblable entre les lois gamma et binomialenégative.

7.2.4 Binomiale

La binomiale de paramètres n = 0,1, . . . et 0 ≤ θ ≤ 1 est la distribution dunombre de succès parmi n expériences de Bernoulli. La fonction de masse deprobabilité est

Pr[N = k] =(

n

k

)θk (1−θ)n−k , k = 0,1, . . . ,n.

La loi binomiale convient rarement pour la distribution du nombre de sinistresdans un portefeuille puisque son support est fini. De plus, elle tend rapidement vers

Page 271: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

7.3. Estimation et tests 261

une normale lorsque n augmente. Enfin, on note que son espérance est supérieureà sa variance. En effet,

E [N ] = nθ > nθ(1−θ) = Var[N ].

7.3 Estimation et tests

L’estimation des paramètres des lois discrètes n’est pas très différent de celle deslois continues. On utile principalement les méthodes des moments et du maximumde vraisemblance. À ce propos, pour les lois discrètes, la fonction de vraisemblancereprésente réellement la probabilité d’observer un échantillon donné.

Pour l’estimation, on dispose d’un échantillon de la variable aléatoire N quipeut être soit le nombre de sinistres d’un portefeuille pour plusieurs périodes, soitles nombres de sinistres de plusieurs portefeuilles sur une période. On pose que nest la taille de l’échantillon. Il faut faire attention, car n ne représente pas le nombretotal de sinistres.

Soit nk le nombre de fois où la valeur k apparaît. On a donc

n =∞∑

k=0nk

et le nombre total de sinistres est∑∞

k=0 knk .On notera que pour la distribution binomiale, le paramètre n est généralement

considéré connu. Il est donc rare qu’il fasse l’objet d’une procédure d’estimation.Quant à l’adéquation entre des modèles de fréquence et les données, elle est

généralement mesurée avec le test du khi carré de Pearson. En effet, celui-ci seprête tout naturellement à l’exercice puisqu’il compare des fréquences observéeset modélisées. De plus, le test de Kolmogorov-Smirnov n’est valide que pour desdistributions continues.

Exemple 7.2. Un assureur a enregistré les 30 catastrophes les plus coûteuses de1970 à 1995 compilées dans le tableau 7.1. Les années absentes du tableau sont desannées où aucune catastrophe ne fut enregistrée. On souhaite ajuster une distribu-tion de Poisson à ces données par la méthode du maximum de vraisemblance.

Tout d’abord, la fonction de vraisemblance est

L(λ) =∞∏

k=0pnk

k

=∞∏

k=0

(λk e−λ

k !

)nk

Page 272: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

262 Modèles de fréquence

Année Fréquence Année Fréquence Année Fréquence

1970 1 1980 1 1991 31973 1 1983 2 1992 21974 2 1988 2 1993 31976 1 1989 3 1994 11979 1 1990 3 1995 4

TAB. 7.1: Fréquence des catastrophes les plus coûteuses, 1970–1995

alors que la fonction de log-vraisemblance est

l (λ) =∞∑

k=0nk ln(pk )

=∞∑

k=0nk (k ln(λ)− ln(k !)−λ) .

En dérivant l’une ou l’autre de ces fonctions, on obtient aisément l’estimateur dumaximum de vraisemblance du paramètre λ :

λ= 1

n

∞∑k=0

knk .

Ici, on a n = 26 observations (les années de 1970 à 1995, inclusivement) ré-parties ainsi : n0 = 11, n1 = 6, n2 = 4, n3 = 4, n4 = 1 et nk = 0 pour tout k ≥ 5. Parconséquent,

λ= 30

26.

Notre modèle pour la fréquence annuelle des catastrophes coûteuses est doncN ∼ Poisson(30/26).

Pour vérifier l’adéquation entre ce modèle et les données, on utilise le test dukhi carré. On rappelle que pour que ce test soit valide, la fréquence de chaque«classe» devrait être supérieure à 5. Pour ce faire, nous regroupons les valeurs 2, 3 et4.

Soit

pk = λk e−λ

k !

la probabilité d’observer la valeur k selon le modèle et npk la fréquence espérée decette valeur dans un échantillon de taille n. Le tableau 7.2 présente les résultats descalculs nécessaires pour effectuer le test du khi carré. On a alors

Page 273: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

7.4. Familles (a,b,0) et (a,b,1) 263

k pk npk nk

0 0,3154 8,20 111 0,3639 9,46 6

2+ 0,3297 8,34 9

TAB. 7.2: Quantités nécessaires pour le test du khi carré de l’exemple 7.2

Loi a b p0

Poisson 0 λ e−λ

Binomiale −θ/(1−θ) (n +1)θ/(1−θ) (1−θ)n

Binomiale Négative 1−θ (r −1)(1−θ) θr

Géométrique 1−θ 0 θ

TAB. 7.3: Paramètres des membres de la famille (a,b,0)

Q = (11−8,20)2

8,20+ (6−9,46)2

9,46+ (9−8,34)2

8,34

= 2,2738.

La statistique du test a une distribution khi carré avec 3−1−1 = 1 degré de liberté.Le 95e centile d’une loi χ2(1) étant 3,8415, on ne rejette pas le modèle.

7.4 Familles (a,b,0) et (a,b,1)

Soit N une variable aléatoire discrète avec une distribution quelconque et,comme précédemment, Pr[N = k] = pk . On dit que la distribution de N est membrede la famille (ou classe) (a,b,0) s’il est possible de trouver deux constantes a et btelles que

pk

pk−1= a + b

k, k = 1,2,3, . . . ,

avec

p0 = 1−∞∑

k=1pk .

On peut démontrer que les seuls membres de cette famille sont les distributionsbinomiale, binomiale négative, géométrique et de Poisson. Le tableau 7.3 présenteles valeurs des paramètres a, b et p0 pour ces lois.

Page 274: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

264 Modèles de fréquence

On peut réécrire la relation liant les probabilités successives des membres de lafamille (a,b,0) sous la forme

kpk

pk−1= ak +b, k = 1,2, . . .

On remarque que la partie de droite de cette égalité est l’équation d’une droite depente a et d’ordonnée à l’origine b. Or, du tableau 7.3, cette pente est nulle pourune distribution de Poisson, négative pour une distribution binomiale et positivepour une distribution binomiale négative. Cela suggère une procédure graphiquepour choisir quelle distribution devrait être utilisée pour modéliser la fréquence : ils’agit de déterminer la pente d’un graphique de

kpk

pk−1= k

nk

nk−1

en fonction de k.Un peu plus généralement, on dit que la distribution de N est membre de la

famille (ou classe) (a,b,1) s’il est possible de trouver deux constantes a et b tellesque

pk

pk−1= a + b

k, k = 2,3, . . .

On remarque que la relation récursive débute cette fois à k = 2 plutôt qu’à k = 1. Lavaleur de p0 est donc quelconque.

Les rapports entre les probabilités successives des membres de cette famillesont les mêmes que ceux des membres de la famille (a,b,0). Le comportement desdistributions est donc similaire. En revanche, la probabilité à zéro diffère et permetune plus grande flexibilité. Si p0 = 0, on dit que la distribution est «zéro tronquée».Il peut être très utile dans certaines applications de pouvoir exclure la possibilitéde ne pas avoir de sinistres. Lorsque p0 > 0 (et que la probabilité est différente de lavaleur correspondante du tableau 7.3), on dit que la distribution est «modifiée àzéro».

Les sections 6.5 et 6.6 de Klugman et collab. (2012a) offrent plus de détails surles familles (a,b,0) et (a,b,1) ainsi que des exemples utiles pour mieux comprendrele mécanisme de récursivité.

7.5 Exercices

7.1 Un assureur décide de modéliser la fréquence des sinistres par une distributionN ∼ Binomiale(m,θ) dont le paramètre m est connu.

a) Démontrer que l’estimateur du maximum de vraisemblance de θ est sansbiais.

Page 275: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

7.5. Exercices 265

b) Déterminer directement la variance de cet estimateur.

c) Déterminer la variance de cet estimateur en calculant l’information deFisher.

d) Déterminer un intervalle de confiance approximatif de niveau 1−α pour laparamètre θ.

7.2 Un portefeuille de la compagnie Great Big Company comptant 10000 risques aproduit les fréquences de sinistres présentées dans le tableau ci-dessous.

Fréquence Nombre de risques

0 9 0481 9052 453 2

4+ 0

a) Déterminer l’estimateur du maximum de vraisemblance du paramètre λd’une loi de Poisson ainsi qu’un intervalle de confiance de niveau 95 % pource paramètre.

b) Soit une distribution géométrique de paramètre β= (1−θ)/θ, c’est-à-direque

Pr[N = k] = βk

(β+1)k+1, k = 0,1, . . .

Déterminer l’estimateur du maximum de vraisemblance du paramètre βainsi qu’un intervalle de confiance de niveau 95 % pour ce paramètre.

c) Déterminer les estimateurs de la méthode des moments des paramètresd’une distribution binomiale négative avec fonction de masse de probabilité

Pr[N = k] =(

k + r −1

r −1

)βk

(β+1)k+r, k = 0,1, . . .

d) Répéter la partie c) pour les estimateurs du maximum de vraisemblance enutilisant une procédure numérique.

7.3 Un assureur offre un contrat couvrant les accidents automobiles causés pardes hommes et par des femmes. L’information pour 1000 polices est présentéedans le tableau ci-dessous.

Page 276: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

266 Modèles de fréquence

Fréquence Hommes Femmes

0 901 9471 92 502 5 23 1 14 1 0

5+ 0 0

a) Déterminer l’estimateur du maximum de vraisemblance du paramètre λd’une loi de Poisson pour la variable N1, le nombre de sinistres causéspar des hommes, et la variable N2, le nombre de sinistres causés par desfemmes.

b) En supposant que N1 et N2 sont des variables indépendantes, déterminerun modèle pour N = N1 +N2.

7.4 Le tableau ci-dessous présente des données de fréquence annuelle d’accidentspour un portefeuille d’assurance automobile.

Fréquence Nombre de risques

0 8611 1212 133 34 15 06 1

7+ 0

a) Ajuster une distribution Binomiale(7,θ) à ces données en estimant le para-mètre θ par la méthode du maximum de vraisemblance.

b) Ajuster plutôt une distribution binomiale négative aux données par la mé-thode des moments. Utiliser la paramétrisation de l’exercice 7.2 c)).

c) Répéter la partie b) en estimant plutôt par la méthode du maximum devraisemblance.

7.5 Démontrer que la distribution Binomiale négative(r,β(β+1)−1) est le résultatdu mélange continu de distributions de Poisson suivant

N |Λ=λ∼ Poisson(λ)

Λ∼ Gamma(r,β).

Page 277: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

7.5. Exercices 267

7.6 Un assureur modélise la fréquence des sinistres par une distribution Binomialenégative(3,1/6). La sévérité des sinistres est modélisée par une distributionExponentielle(0,01). Si une franchise de 20 $ est ajoutée au contrat, calculerE [N∗], l’espérance de la fréquence modifiée.

7.7 Un portefeuille d’assurance compte 1000 contrats. Le tableau ci-dessous ré-sume l’information connue à propos de la fréquence des sinistres.

Nombre de sinistres Nombre de contrats

0 1001 2672 3113 2084 875 236 4

7+ 0

Parmi les distributions binomiale, Poisson, binomiale négative, normale etgamma, laquelle semble la plus appropriée pour modéliser ces données ?

7.8 Un assureur enregistre tous les jours d’une année (365 jours) le nombre de ré-clamations qu’il reçoit. Les données recueillies sont présentées dans le tableauci-dessous. L’assureur utilise une distribution de Poisson de moyenne 0,6 pourmodéliser la variable aléatoire du nombre quotidien de sinistres. Déterminerla statistique de Pearson.

Nombre de sinistres Nombre de jours

0 2091 1112 333 74 35 2

Exercices proposés dans LossModels, 4e éd.

6.1, 6.2, 6.3, 13.18, 13.19, 14.1, 14.2, 14.3, 14.6, 14.7, 14.8

Page 278: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

268 Modèles de fréquence

Réponses

7.1 a) θ(1−θ)/(nm) b) θ(1−θ)/(nm) c) θ± zα/2

√θ(1− θ)/(mn)

7.2 a) 0,1001±1,96p

0,1001/10000 b) 0,1001±1,96p

0,1001(1,1001)/10000 c) r =55,67, β= 0,0018 d) r = 52,73, µ= 0,1001

7.3 a) λ1 = 0,109 et λ2 = 0,057 b) N ∼ Poisson(0,166)

7.4 a) 0,0237 b) r = 0,4715, β= 0,3521 c) r = 0,6561, µ= 0,166

7.6 12,28

7.7 Binomiale

7.8 2,85

Page 279: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

A Paramétrisation des loisde probabilité

Cette annexe précise la paramétrisation des lois de probabilité continues etdiscrètes utilisée dans les énoncés des exercices. Dans certains cas, elle est diffé-rente de celle présentée dans les annexes A et B de Klugman et collab. (2012a). Enparticulier, nous utilisons toutes les distributions de la famille gamma transforméeavec un paramètre de taux (λ) plutôt qu’un paramètre d’échelle (θ). De plus, l’ordredes paramètres est différent.

En plus de la fonction de densité de probabilité et de la fonction de répartition,l’annexe fournit les éléments suivants pour chaque loi : la racine foo des fonctionsdfoo, pfoo, qfoo, rfoo, mfoo et levfoo telles que définies dans R et actuar ; lesnoms des arguments de ces fonctions correspondant à chacun des paramètresde la loi ; le ke moment (ainsi que l’espérance et la variance pour les cas les plususuels) ; l’espérance limitée (lois continues seulement) ; la fonction génératrice desmoments M(t ), lorsqu’elle existe ; la fonction génératrice des probabilités P (z) (loisdiscrètes seulement).

Dans les formules ci-dessous,

Γ(α; x) = 1

Γ(α)

∫ x

0tα−1e−t d t , α> 0, x > 0

avec

Γ(α) =∫ ∞

0tα−1e−t d t

est la fonction gamma incomplète, alors que

β(a,b; x) = 1

β(a,b)

∫ x

0t a−1(1− t )b−1 d t , a > 0, b > 0, 0 < x < 1

avec

β(a,b) =∫ 1

0t a−1(1− t )b−1 d t = Γ(a)Γ(b)

Γ(a +b)

269

Page 280: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

270 Paramétrisation des lois de probabilité

est la fonction bêta incomplète régularisée.Sauf avis contraire, les paramètres sont strictement positifs et les fonctions sont

définies pour x > 0.

A.1 Famille bêta transformée

A.1.1 Bêta transformée (α,γ,τ,θ)

Racine : trbeta, pearson6Paramètres : shape1 (α), shape2 (γ), shape3 (τ), rate (λ= 1/θ), scale (θ)

f (x) = γuτ(1−u)α

xβ(α,τ), u = v

1+ v, v =

( x

θ

)γF (x) =β(τ,α;u)

E [X k ] = θkΓ(τ+k/γ)Γ(α−k/γ)

Γ(α)Γ(τ), −τγ< k <αγ

E [X ; x] = θΓ(τ+1/γ)Γ(α−1/γ)

Γ(α)Γ(τ)β(τ+1/γ,α−1/γ;u)+x(1−F (x))

A.1.2 Burr (α,γ,θ)

Racine : burr

Paramètres : shape1 (α), shape2 (γ), rate (λ= 1/θ), scale (θ)

f (x) = αγuα(1−u)

x, u = 1

1+ v, v =

( x

θ

)γF (x) = 1−uα

E [X k ] = θkΓ(1+k/γ)Γ(α−k/γ)

Γ(α), −γ< k <αγ

E [X ; x] = θΓ(1+1/γ)Γ(α−1/γ)

Γ(α)β(1+1/γ,α−1/γ;u)+xuα

A.1.3 Burr inverse (τ,γ,θ)

Racine : invburr

Paramètres : shape1 (τ), shape2 (γ), rate (λ= 1/θ), scale (θ)

f (x) = τγuτ(1−u)

x, u = v

1+ v, v =

( x

θ

)γF (x) = uτ

Page 281: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

A.1. Famille bêta transformée 271

E [X k ] = θkΓ(τ+k/γ)Γ(1−k/γ)

Γ(τ), −τγ< k < γ

E [X ; x] = θΓ(τ+1/γ)Γ(1−1/γ)

Γ(α)β(τ+1/γ,1−1/γ;u)+x(1−uτ)

A.1.4 Pareto généralisée (α,τ,θ)

Racine : genpareto

Paramètres : shape1 (α), shape2 (τ), rate (λ= 1/θ), scale (θ)

f (x) = uτ(1−u)α

xβ(α,τ), u = v

1+ v, v = x

θ

F (x) =β(τ,α;u)

E [X k ] = θkΓ(τ+k)Γ(α−k)

Γ(α)Γ(τ), −τ< k <α

E [X ] = θτ

α−1, α> 1

Var[X ] = θ2τ(τ+α−1)

(α−1)2(α−2), α> 2

E [X ; x] = θτ

α−1β(τ+1,α−1;u)+x(1−F (x))

A.1.5 Pareto (α,θ)

Racine : pareto, pareto2Paramètres : shape (α), scale (θ)

f (x) = αuα(1−u)

x, u = 1

1+ v, v = x

θ

F (x) = 1−uα

E [X k ] = θkΓ(k +1)Γ(α−k)

Γ(α), −1 < k <α

E [X ] = θ

α−1, α> 1

Var[X ] = θ2α

(α−1)2(α−2), α> 2

E [X ; x] =

θ

α−1

[1−

x +θ)α−1]

, α 6= 1

−θ ln

x +θ)

, α= 1

Page 282: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

272 Paramétrisation des lois de probabilité

A.1.6 Pareto inverse (τ,θ)

Racine : invpareto

Paramètres : shape (τ), scale (θ)

f (x) = τuτ(1−u)

x, u = v

1+ v, v = x

θ

F (x) = uτ

E [X k ] = θkΓ(τ+k)Γ(1−k)

Γ(τ), −τ< k < 1

E [X ; x] = θkτ

∫ u

0

1− yd y +x(1−uτ)

A.1.7 Log-logistique (γ,θ)

Racine : llogis

Paramètres : shape (γ), rate (λ= 1/θ), scale (θ)

f (x) = γu(1−u)

x, u = v

1+ v, v =

( x

θ

)γF (x) = u

E [X k ] = θkΓ(1+k/γ)Γ(1−k/γ), −γ< k < γE [X ; x] = θΓ(1+1/γ)Γ(1−1/γ)β(1+1/γ,1−1/γ;u)+x(1−u)

A.1.8 Paralogistique (α,θ)

Racine : paralogis

Paramètres : shape (α), rate (λ= 1/θ), scale (θ)

f (x) = α2uα(1−u)

x, u = 1

1+ v, v =

( x

θ

)αF (x) = 1−uα

E [X k ] = θkΓ(1+k/α)Γ(α−k/α)

Γ(α), −γ2 < k <α2

E [X ; x] = θΓ(1+1/α)Γ(α−1/α)

Γ(α)β(1+1/α,α−1/α;u)+xuα

A.1.9 Paralogistique inverse (τ,θ)

Racine : invparalogis

Paramètres : shape (τ), rate (λ= 1/θ), scale (θ)

Page 283: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

A.2. Famille gamma transformée 273

f (x) = τ2uτ(1−u)

x, u = v

1+ v, v =

( x

θ

)τF (x) = uτ

E [X k ] = θkΓ(τ+k/τ)Γ(1−k/τ)

Γ(τ), −τ2 < k < τ

E [X ; x] = θΓ(τ+1/τ)Γ(1−1/τ)

Γ(τ)β(τ+1/τ,1−1/τ;u)+x(1−uτ)

A.2 Famille gamma transformée

A.2.1 Gamma transformée (α,τ,λ)

Racine : trgamma

Paramètres : shape1 (α), shape2 (τ), rate (λ), scale (θ = 1/λ)

f (x) = τuαe−u

xΓ(α), u = (λx)τ

F (x) = Γ(α;u)

E [X k ] = Γ(α+k/τ)

λkΓ(α), k >−ατ

E [X ; x] = Γ(α+1/τ)

λΓ(α)Γ(α+1/τ;u)+x(1−Γ(α;u))

A.2.2 Gamma transformée inverse (α,τ,λ)

Racine : invtrgamma

Paramètres : shape1 (α), shape2 (τ), rate (λ), scale (θ = 1/λ)

f (x) = τuαe−u

xΓ(α), u = (λx)−τ

F (x) = 1−Γ(α;u)

E [X k ] = Γ(α−k/τ)

λkΓ(α), k <ατ

E [X ; x] = Γ(α−1/τ)

λΓ(α)(1−Γ(α−1/τ;u))+xΓ(α;u)

A.2.3 Gamma (α,λ)

Racine : gamma

Paramètres : shape (α), rate (λ), scale (θ = 1/λ)

Page 284: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

274 Paramétrisation des lois de probabilité

f (x) = uαe−u

xΓ(α), u =λx

F (x) = Γ(α;u)

E [X k ] = Γ(α+k)

λkΓ(α), k >−α

E [X ] = α

λ

Var[X ] = α

λ2

E [X ; x] = Γ(α+1)

λΓ(α)Γ(α+1;u)+x(1−Γ(α;u))

M(t ) =(

λ

λ− t

A.2.4 Gamma inverse (α,λ)

Racine : invgamma

Paramètres : shape (α), rate (λ), scale (θ = 1/λ)

f (x) = uαe−u

xΓ(α), u = (λx)−1

F (x) = 1−Γ(α;u)

E [X k ] = Γ(α−k)

λkΓ(α), k <α

E [X ; x] = Γ(α−1)

λΓ(α)(1−Γ(α+1;u))+xΓ(α;u)

A.2.5 Weibull (τ,λ)

Racine : weibull

Paramètres : shape (τ), scale (θ = 1/λ)

f (x) = τue−u

x, u = (λx)τ

F (x) = 1−e−u

E [X k ] = Γ(1+k/τ)

λk, k >−τ

E [X ; x] = Γ(1+1/τ)

λΓ(1+1/τ;u)+xe−u

Page 285: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

A.2. Famille gamma transformée 275

A.2.6 Weibull inverse (τ,λ)

Racine : invweibull, lgompertzParamètres : shape (τ), rate (λ), scale (θ = 1/λ)

f (x) = τue−u

x, u = (λx)−τ

F (x) = e−u

E [X k ] = Γ(1−k/τ)

λk, k < τ

E [X ; x] = Γ(1−1/τ)

λ(1−Γ(1−1/τ;u))+x(1−e−u)

A.2.7 Exponentielle (λ)

Racine : exp

Paramètre : rate (λ)

f (x) = ue−u

x, u =λx

F (x) = 1−e−u

E [X k ] = Γ(k +1)

λk, k >−1

E [X ] = 1

λ

Var[X ] = 1

λ2

E [X ; x] = 1−e−u

λ

M(t ) = λ

λ− t

A.2.8 Exponentielle inverse (λ)

Racine : invexp

Paramètres : rate (λ), scale (θ = 1/λ)

f (x) = ue−u

x, u = (λx)−1

F (x) = e−u

E [X k ] = Γ(1−k)

λk, k < 1

Page 286: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

276 Paramétrisation des lois de probabilité

A.3 Autres distributions continues

A.3.1 Normale (µ,σ2)

Racine : norm

Paramètres : mean (−∞<µ<∞), sd (σ)

f (x) = 1p2πσ

exp− 1

2

( x −µσ

)2 , −∞< x <∞

F (x) =Φ( x −µ

σ

), Φ(x) = 1p

∫ x

−∞e−y2

d y

E [X ] =µVar[X ] =σ2

M(t ) = eµt+σ2t 2/2

A.3.2 Log-normale (µ,σ2)

Racine : lnorm

Paramètres : meanlog (α), sdlog (σ)

f (x) = 1p2πσ

1

xexp

− 1

2

(ln x −µσ

)2 F (x) =Φ

(ln x −µσ

)E [X k ] = ekµ+k2σ2/2

E [X ] = eµ+σ2/2

Var[X ] = e2µ+σ2(eσ

2 −1)

A.3.3 Log-gamma (α,λ)

Racine : lgamma

Paramètres : shapelog (α), ratelog (λ)

f (x) = λα(ln x)α−1

xλ+1Γ(α), x > 1

F (x) = Γ(α;λ ln x), x > 1

Page 287: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

A.3. Autres distributions continues 277

E [X k ] =(

λ

λ−k

)αE [X ] =

λ−1

)αVar[X ] =

λ−2

)α−

λ−1

)2α

E [X ; x] =(

λ

λ−1

)αΓ(α; (λ−1)ln x)+x(1−Γ(α;λ ln x))

A.3.4 Pareto translatée (α,θ)

Racine : pareto1

Paramètres : shape (α), min (θ)

f (x) = αθα

xα+1 , x > θ

F (x) = 1−(θ

x

)α, x > θ

E [X k ] = αθk

α−k, k <α

E [X ; x] = αθ

α−1− θ

(α−1)xα−1

Cette loi est également appelée Pareto à un paramètre. Seul α est considéré commeun véritable paramètre de la distribution. Le paramètre θ est la borne inférieure dusupport de la distribution et est en général considéré connu.

A.3.5 Bêta généralisée (α,β,τ,θ)

Racine : genbeta

Paramètres : shape1 (α), shape2 (β), shape3 (τ), rate (λ= 1/θ), scale (θ)

f (x) = τuα(1−u)β−1

xβ(α,β), u =

( x

θ

)τ, 0 < x < θ

F (x) =β(α,β;u)

E [X k ] = θkΓ(α+β)Γ(α+k/τ)

Γ(α)Γ(α+β+k/τ), k >−ατ

E [X ; x] = θΓ(α+β)Γ(α+1/τ)

Γ(α)Γ(α+β+1/τ)β(α+1/τ,β;u)+x(1−β(α,β;u))

Page 288: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

278 Paramétrisation des lois de probabilité

A.3.6 Bêta (α,β)

Racine : beta

Paramètres : shape1 (α), shape2 (β)

f (x) = Γ(α+β)

Γ(α)Γ(β)xα−1(1−x)β−1, 0 < x < 1

F (x) =β(α,β; x)

E [X k ] = Γ(α+β)Γ(α+k)

Γ(α)Γ(α+β+k), k >−α

E [X ] = α

α+βVar[X ] = αβ

(α+β)2(α+β+1)

E [X ; x] = Γ(α+β)Γ(α+1)

Γ(α)Γ(α+β+1)β(α+1,β;u)+x(1−β(α,β; x))

A.4 Distributions discrètes de la famille (a,b,0)

A.4.1 Binomiale (n,θ)

Racine : binom

Paramètres : size (n), prob (θ)

Pr[X = x] =(

n

x

)θx (1−θ)n−x , n entier, 0 < θ < 1, x = 0,1, . . . ,n

E [X ] = nθ

Var[X ] = nθ(1−θ)

M(t ) = (1−θ+θe t )n

P (z) = (1−θ(z −1))n

A.4.2 Binomiale négative (r,θ)

Racine : nbinom

Paramètres : size (r ), prob (θ), mu (µ= r (1−θ)/θ)

Pr[X = x] =(

x + r −1

r −1

)θr (1−θ)x , 0 < θ < 1, x = 0,1, . . .

Page 289: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

A.4. Distributions discrètes de la famille (a,b,0) 279

E [X ] = r (1−θ)

θ

Var[X ] = r (1−θ)

θ2

M(t ) =(

θ

1− (1−θ)e t

)r

P (z) = (1− (1−θ)z)−r

A.4.3 Géométrique (θ)

Racine : nbinom

Paramètre : prob (θ)

Pr[X = x] = θ(1−θ)x , 0 < θ < 1, x = 0,1, . . .

E [X ] = 1−θθ

Var[X ] = 1−θθ2

M(t ) = θ

1− (1−θ)e t

P (z) = (1− (1−θ)z)−1

A.4.4 Poisson (λ)

Racine : pois

Paramètre : lambda (λ)

Pr[X = x] = λx e−λ

x!, x = 0,1, . . .

E [X ] =λVar[X ] =λ

M(t ) = eλ(e t−1)

P (z) = eλ(z−1)

Page 290: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez
Page 291: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

B Installation de packages dans R

Plusieurs exercices de ce recueil requièrent l’utilisation du package actuar(Dutang et collab., 2008). Le package doit être installé depuis le site ComprehensiveR Archive Network (CRAN ; http://cran.r-project.org). Cette annexe expliquecomment configurer R pour faciliter l’installation et l’administration de packagesexternes.

Les instructions ci-dessous sont centrées autour de la création d’une biblio-thèque personnelle où seront installés les packages R téléchargés de CRAN. Ilest fortement recommandé de créer une telle bibliothèque. Cela permet d’éviterd’éventuels problèmes d’accès en écriture dans la bibliothèque principale et deconserver les packages intacts lors des mises à jour de R. Nous montrons égalementcomment spécifier le site miroir de CRAN pour éviter d’avoir à le répéter à chaqueinstallation de package.

1. Identifier le dossier de départ de l’utilisateur. En cas d’incertitude, examiner lavaleur de la variable d’environnement HOME 1, depuis R avec la commande

> Sys.getenv("HOME")

ou, pour les utilisateurs de Emacs, directement depuis l’éditeur avec

M-x getenv RET HOME RET

Nous référerons à ce dossier par le symbole ~.

2. Créer un dossier qui servira de bibliothèque de packages personnelle. Dans lasuite, nous utiliserons ~/R/library.

3. Dans un fichier nommé ~/.Renviron (donc situé dans le dossier de départ),enregistrer la ligne appropriée ci-dessous :

R_LIBS_USER="~/R/library

1. Pour les utilisateurs de GNU Emacs sous Windows, la variable est créée par l’assistant d’instal-lation de Emacs lorsqu’elle n’existe pas déjà.

281

Page 292: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

282 Installation de packages dans R

Au besoin, remplacer le chemin ~/R/library par celui du dossier créé à l’étapeprécédente. Utiliser la barre oblique avant (/) dans le chemin pour séparer lesdossiers.

4. Dans un fichier nommé ~/.Rprofile, enregistrer l’option suivante :

options(repos = "http://cran.ca.r-project.org")

Si désiré, remplacer la valeur de l’option repos par l’URL d’un autre site miroirde CRAN.

Les utilisateurs de GNU Emacs voudront ajouter une autre option. Le code àentrer dans le fichier ~/.Rprofile sera plutôt

options(repos = "http://cran.ca.r-project.org",

menu.graphics = FALSE)

Consulter la rubriques d’aide de Startup pour les détails sur la syntaxe et l’emplace-ment des fichiers de configuration, celles de library et .libPaths pour la gestiondes bibliothèques et celle de options pour les différentes options reconnues par R.

Après un redémarrage de R, la bibliothèque personnelle aura préséance sur labibliothèque principale et il ne sera plus nécessaire de préciser le site miroir deCRAN lors de l’installation de packages. Ainsi, la simple commande

> install.packages("actuar")

téléchargera le package actuar depuis de le miroir canadien de CRAN et l’installeradans le dossier ~/R/library. Pour charger le package en mémoire, on fera

> library("actuar")

On peut arriver au même résultat sans utiliser les fichiers de configuration.Renviron et .Rprofile. Il faut cependant recourir aux arguments lib et reposde la fonction install.packages et à l’argument lib.loc de la fonction library.Consulter les rubriques d’aide de ces deux fonctions pour de plus amples informa-tions.

Page 293: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

C Table de quantilesde la loi normale

Pr[X ≤ x] =Φ(x) =∫ x

−∞1p2π

e−y2/2 d y

Φ(−x) = 1−Φ(x)

x Φ(x) x Φ(x) x Φ(x)

0,00 0,500 1,10 0,864 2,05 0,9800,05 0,520 1,15 0,875 2,10 0,9820,10 0,540 1,20 0,885 2,15 0,9840,15 0,560 1,25 0,894 2,20 0,9860,20 0,579 1,282 0,900 2,25 0,9880,25 0,599 1,30 0,903 2,30 0,9890,30 0,618 1,35 0,911 2,326 0,9900,35 0,637 1,40 0,919 2,35 0,9910,40 0,655 1,45 0,926 2,40 0,9920,45 0,674 1,50 0,933 2,45 0,9930,50 0,691 1,55 0,939 2,50 0,9940,55 0,709 1,60 0,945 2,55 0,9950,60 0,726 1,645 0,950 2,576 0,9950,65 0,742 1,65 0,951 2,60 0,9950,70 0,758 1,70 0,955 2,65 0,9960,75 0,773 1,75 0,960 2,70 0,9970,80 0,788 1,80 0,964 2,75 0,9970,85 0,802 1,85 0,968 2,80 0,9970,90 0,816 1,90 0,971 2,85 0,9980,95 0,829 1,95 0,974 2,90 0,9981,00 0,841 1,96 0,975 2,95 0,9981,05 0,853 2,00 0,977 3,00 0,999

283

Page 294: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez
Page 295: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

D Table de quantilesde la loi khi carré

Pr[X ≤ x] =∫ x

0

1

Γ(r /2)2r /2y r /2−1e−r /2 d x

Pr[X ≤ x]

r 0,01 0,025 0,05 0,95 0,975 0,99

1 0,000 0,001 0,004 3,841 5,024 6,6352 0,020 0,051 0,103 5,991 7,378 9,2103 0,115 0,216 0,352 7,815 9,348 11,3454 0,297 0,484 0,711 9,488 11,143 13,2775 0,554 0,831 1,145 11,070 12,833 15,0866 0,872 1,237 1,635 12,592 14,449 16,8127 1,239 1,690 2,167 14,067 16,013 18,4758 1,646 2,180 2,733 15,507 17,535 20,0909 2,088 2,700 3,325 16,919 19,023 21,666

10 2,558 3,247 3,940 18,307 20,483 23,20911 3,053 3,816 4,575 19,675 21,920 24,72512 3,571 4,404 5,226 21,026 23,337 26,21713 4,107 5,009 5,892 22,362 24,736 27,68814 4,660 5,629 6,571 23,685 26,119 29,14115 5,229 6,262 7,261 24,996 27,488 30,57816 5,812 6,908 7,962 26,296 28,845 32,00017 6,408 7,564 8,672 27,587 30,191 33,40918 7,015 8,231 9,390 28,869 31,526 34,80519 7,633 8,907 10,117 30,144 32,852 36,191

suite page suivante

285

Page 296: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

286 Table de quantiles de la loi khi carré

Pr[X ≤ x]

r 0,01 0,025 0,05 0,95 0,975 0,99

20 8,260 9,591 10,851 31,410 34,170 37,56621 8,897 10,283 11,591 32,671 35,479 38,93222 9,542 10,982 12,338 33,924 36,781 40,28923 10,196 11,689 13,091 35,172 38,076 41,63824 10,856 12,401 13,848 36,415 39,364 42,98025 11,524 13,120 14,611 37,652 40,646 44,31426 12,198 13,844 15,379 38,885 41,923 45,64227 12,879 14,573 16,151 40,113 43,195 46,96328 13,565 15,308 16,928 41,337 44,461 48,27829 14,256 16,047 17,708 42,557 45,722 49,58830 14,953 16,791 18,493 43,773 46,979 50,892

Page 297: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

E Solutions des exercices

Plusieurs solutions faisant appel à R utilisent des fonctions des packages actuar(Dutang et collab., 2008) et MASS (Venables et Ripley, 2002). On suppose donc queles packages ont été chargés en mémoire avec

> library("actuar")

> library("MASS")

Chapitre 1

1.1 On a

limx→0

1

2= 1

2

et

limx→0

1

2− x2

24= 1

2.

En utilisant le théorème «sandwich», on obtient donc directement

limx→0

1−cos(x)

x2 = 1

2.

La figure E.1 présente le graphique de la fonction et des deux bornes, ainsi quele code R pour créer ce graphique.

1.2 Il suffit d’appliquer la règle de l’Hôpital :

limx→0

x

ln(x +1)= lim

x→0

d x/d x

d ln(x +1)/d x

= limx→0

1

1/(x +1)

= 1.

287

Page 298: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

288 Solutions des exercices

> f <- function(x) (1 - cos(x))/(x^2)

> g <- function(x) 0.5 - x^2/24

> curve(f, from = -2, to = 2, lwd = 2)

> curve(g, add = TRUE, lty = 2)

> abline(h = 0.5, lty = 2)

−2 −1 0 1 2

0.35

0.40

0.45

0.50

x

f(x)

FIG. E.1: Fonction f (x) = (1−cos(x))/x2 (trait plein) et les bornes y = 12 −x2/24 et

y = 12 (traits brisés)

Page 299: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 289

1.3 Il faut faire quelques modifications avant de pouvoir utiliser la règle de l’Hôpi-tal. On passe d’abord à la forme logarithmique

y = (1+x)1/x

ln(y) = ln(1+x)1/x

= ln(1+x)

x,

pour ensuite calculer la limite à l’aide de la règle de l’Hôpital

limx→0

ln(y) = limx→0

d ln(1+x)/d x

d x/d x

= limx→0

ln(1+x)

x

= limx→0

1/(1+x)

1= 1

et enfin revenir à la forme exponentielle

limx→0

y = limx→0

(1+x)1/x

= e1

= e.

1.4 a) On utilise la règle de l’Hôpital pour évaluer

limx→∞

x

ln(x)= lim

x→∞d x/d x

d ln(x)/d x

= limx→∞

1

1/x= lim

x→∞x

=∞.

Il est donc possible de conclure que le numérateur tend plus rapidementvers l’infini que le dénominateur, c’est-à-dire que x tend plus rapidementvers l’infini que ln(x).

b) De manière similaire,

limx→∞

x

ex = limx→∞

d x/d x

dex /d x

= limx→∞

1

ex

= 0,

Page 300: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

290 Solutions des exercices

d’où ex tend plus rapidement vers l’infini que x.

1.5 a) On a f (x) = cos(x), f (0) = 1, f ′(x) = −sin(x), f ′(0) = 0, f ′′(x) = −cos(x),f ′′(0) =−1, f ′′′(x) = sin(x), f ′′′(0) = 0, et ainsi de suite. On obtient donc

cos(x) = 1− x2

2!+ x4

4!− . . .

b) On a f (x) = sin(x), f (0) = 0, f ′(x) = cos(x), f ′(0) = 1, f ′′(x) = −sin(x),f ′′(0) = 0, f ′′′(x) =−cos(x), f ′′′(0) =−1, et ainsi de suite. On obtient donc

sin(x) = x − x3

3!+ x5

5!− . . .

c) On obtient

e i x = 1+ i x + i 2x2

2!+ i 3x3

3!+ i 4x4

4!+ i 5x5

5!+ . . .

= 1+ i x − x2

2!− i

x3

3!+ x4

4!+ i

x5

5!− . . . .

En regroupant les termes, on obtient

e i x =(1− x2

2!+ x4

4!− . . .

)+ i

(x − x3

3!+ x5

5!− . . .

)d) Des résultats obtenus en a), b) et c), on a directement

e i x = cos(x)+ i sin(x).

e) En posant x =π dans le résultat en d), on obtient

e iπ = cos(π)+ i sin(π)

=−1+ i (0)

=−1.

1.6 Il faut démontrer que la fonction F (x) est non décroissante, que sa limite àdroite est 1, que sa limite à gauche est 0 et qu’elle est continue (à droite).Clairement, on a limx→−∞ F (x) = 0, et limx→∞ F (x) = 1. De plus,

F ′(x) = e−x

(1+e−x )2 > 0,

qui implique que la fonction est non décroissante.

Page 301: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 291

1.7 La fonction g (x) est clairement positive. Il faut démontrer que l’intégrale sur latotalité du domaine de cette fonction est 1 :∫ ∞

x0

g (x)d x =∫ ∞

x0

f (x)

1−F (x0)d x

=∫ ∞

x0f (x)d x

1−F (x0)

= 1−F (x0)

1−F (x0)

= 1.

1.8 On a

S(x) = Pr[X > x]

=∫ ∞

x

αλα

(t +λ)α+1 d t

=(

λ

x +λ)α

.

La figure E.2 présente le graphique de cette fonction.

1.9 On a que Y = n −X si, et seulement si, X = n −Y . Ainsi,

Pr[Y = y] = Pr[X = n − y]

=(

n

n − y

)pn−y (1−p)n−(n−y)

=(

n

y

)(1−p)y pn−y , y = 0,1, . . . ,

d’où Y ∼ Binomiale(n,1−p).

1.10 a) On a Y = e X où X ∼ N (µ,σ2). Par conséquent,

FY (x) = Pr[Y ≤ x]

= Pr[e X ≤ x]

= Pr[X ≤ ln x]

= FX (ln x)

et

fY (x) = F ′Y (x)

= 1

xfX (ln x).

Page 302: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

292 Solutions des exercices

> library(actuar)

> curve(ppareto(x, shape = 2, scale = 3000, lower.tail = FALSE), from = 0, to = 5000, ylab = "S(x)", lwd = 2)

0 1000 2000 3000 4000 5000

0.2

0.4

0.6

0.8

1.0

x

S(x

)

FIG. E.2: Fonction de survie d’une distribution Pareto(2,3000)

b) La fonction génératrice des moments de X est MX (t ) = eµt+σ2t 2/2. On a

Var[Y ] = E [Y 2]−E [Y ]2

= E [e2X ]−E [e X ]2

= MX (2)−M 2X (1)

= e2µ+2σ2 −e2µ+σ2

= e2µ+σ2(eσ

2 −1).

Page 303: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 293

1.11 On a

E [|X |] =∫ ∞

−∞|x|π

1

1+x2 d x

=∫ 0

−∞−x

π

1

1+x2 d x +∫ ∞

0

x

π

1

1+x2 d x

= 2

π

∫ ∞

0

x

1+x2 d x

= lima→∞

2

π

∫ a

0

x

1+x2 d x

= lima→∞ ln(1+a2)

=∞.

1.12 On utilise la définition de l’espérance :

E [λg (X )] =∞∑

x=0λg (x)

e−λλx

x!

=∞∑

x=0g (x)

(e−λλx+1

x!

)(x +1

x +1

)

=∞∑

x=0(x +1)g (x)

e−λλx+1

(x +1)!.

Il faut maintenant faire un glissement d’indice et ajouter un terme pourobtenir

E[λg (X )

]= ∞∑x=1

xg (x −1)e−λλx

x!

=∞∑

x=0xg (x −1)

e−λλx

x!

= E [X g (X −1)].

1.13 Il suffit de remarquer que M +m = X +Y . Le résultat découle ensuite directe-ment par linéarité de l’espérance : E [M ]+E [m] = E [X ]+E [Y ].

Page 304: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

294 Solutions des exercices

1.14 On utilise la technique de la fonction de répartition :

FY (y) = Pr[Y ≤ y]

= Pr[4X +3 ≤ y]

= Pr

[X ≤ y −3

4

]= FX

(y −3

4

)= 1−e

7(

y−34

).

La densité est alors

fY (y) = F ′Y (y) = 7

4e−

74 (y−3), y > 3.

1.15 On utilise la technique de la fonction de répartition :

FY (y) = Pr[Y ≤ y]

= Pr[

X 3 ≤ y]

= Pr[

X ≤ y13

]= 1

9

∫ y13

0x2 d x

= y

27.

On trouve donc que

fY (y) = F ′Y (y) = 1

27, 0 ≤ y ≤ 27.

1.16 Selon l’énoncé, X ∼ N (0,σ2) et Y = X 2. Il faut voir que Y = X 2 n’est pas unetransformation bijective (à une valeur de Y correspond plus d’une valeur deX ). On pose W = |X | et on trouve la densité de W à l’aide de la technique dela fonction de répartition :

FW (w) = Pr[|X | ≤ w]

= Pr[−w ≤ X ≤ w]

= FX (w)−FX (−w)

Page 305: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 295

et donc

fW (w) = fX (w)+ fX (−w)

= 2

σp

2πe−x2/(2σ2).

On pose maintenant Y =W 2 = |X |2 = X 2 et on trouve la densité de Y par latechnique du changement de variable :

fY (y) = fW (y1/2)

∣∣∣∣ d

d yy1/2

∣∣∣∣= fW (y1/2)

∣∣∣∣ 1

2p

y

∣∣∣∣= 2

σp

2πe−y/(2σ2)

(1

2p

y

)= (2σ2)−1/2

Γ( 12 )

y−1/2e−y/(2σ2)

puisquepπ≡ Γ( 1

2 ). On a donc que Y ∼ Gamma( 12 , 1

2σ−2). De manière équiva-

lente, on peut aussi poser X =σZ , où Z ∼ N (0,1), et utiliser le résultat connuque Z 2 ∼χ2(1) ≡ Gamma( 1

2 , 12 ).

1.17 Si X est une variable aléatoire dont la distribution est symétrique autour dupoint a, alors E [X ] = a. On a donc

µ3 = E [(X −a)3]

=∫ ∞

−∞(x −a)3 f (x)d x

=∫ a

−∞(x −a)3 f (x)d x +

∫ ∞

a(x −a)3 f (x)d x.

En faisant le changement de variable y = x −a, on obtient

µ3 =∫ 0

−∞y3 f (y +a)d y +

∫ ∞

0y3 f (y +a)d y

=∫ ∞

0−y3 f (−y +a)d y +

∫ ∞

0y3 f (y +a)d y

= 0,

puisque f (−y +a) = f (y +a) par symétrie autour du point a. Par conséquent,γ1 =µ3/µ3/2

2 = 0.

Page 306: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

296 Solutions des exercices

1.18 La distribution de la variable aléatoire X est en fait une Exponentielle(1). Parconséquent, E [X ] = Var[X ] = 1 et

µ3 = E [(X −1)3]

=∫ ∞

0(x −1)3e−x d x

=∫ ∞

0(x3 −3x2 +3x −1)e−x d x

= Γ(4)−3Γ(3)+3Γ(2)−Γ(1)

= 3!−3!+3−1

= 2

en reconnaissant des lois gamma. Ainsi, on obtient γ1 =µ3/µ3/22 = 2.

1.19 On trouve que µ2 = 1/3, µ4 = 1/5 et donc γ2 =µ4/µ22 = 9/5. Comme γ2 < 3, la

distribution a des queues moins lourdes que la distribution normale.

1.20 Par définition,

MX (t ) = E [e t X ]

=∫ c

0

2x

c2 e t x d x

= 2

c2t 2 (ctect −ect +1).

1.21 Par le théorème central limite, on sait que X1 ∼ N (µ,σ2/n) et X2 ∼ N (µ,σ2/n).Comme les deux variables aléatoires sont indépendantes, X1−X2 ∼ N (0,2σ2/n).Ainsi,

Pr[|X1 − X2| < σ

5

]= Pr

[ −σ/5

σ/p

n/2< X1 − X2

σ/p

n/2< σ/5

σ/p

n/2

]= Pr

[1

5

√n

2< Z < 1

5

√n

2

],

où Z ∼ N (0,1). On doit donc trouver une valeur de n tel que Pr[Z ≥pn/(5

p2)] ≈

0,005. On trouve dans une table de quantiles de la loi normale quep

n/(5p

2) =2,576, et donc que n ≈ 332.

1.22 a) On a Xi ∼ Gamma(25, 12 ). Or, une somme de n lois gamma indépendantes

de paramètres αi et λ est une loi gamma de paramètres∑n

i=1αi et λ. Parconséquent,

∑ni=1 Xi ∼ Gamma(2500, 1

2 ) et X ∼ Gamma(2500,50).

b) On obtient avec R

Page 307: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 297

> diff(pgamma(c(49, 51), 2500, 50))

[1] 0.6827218

c) Pour obtenir une approximation de la probabilité en b), on peut utiliserle Théorème central limite. On a que E [X ] = 2500/50 = 50 et Var[X ] =2500502 = 1. Par conséquent,

Pr[49 < X < 51] = Pr

[49−50

1< X −50

1< 51−50

1

]≈ Pr[−1 < Z < 1]

=Φ(1)−Φ(−1)

= 2Φ(1)−1

= 0,6826,

où Z ∼ N (0,1).

1.23 Par définition, le biais est

bΘ(θ) = E [Θ]−θ

= 749500−(

2(1000)2

(2)(1)−

(1000

2

)2)=−500.

L’erreur quadratique moyenne est

MSE(Θ) = Var[Θ]+bΘ(θ)2

= 750+ (−500)2

= 250750.

1.24 a) Par linéarité de l’espérance,

E

[n∑

i=1ai Xi

]=

n∑i=1

ai E [Xi ]

=n∑

i=1aiµ

=µn∑

i=1ai

=µ.

Page 308: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

298 Solutions des exercices

b) Étant donné que les variables sont indépendantes, on a

Var

[n∑

i=1ai Xi

]=

n∑i=1

a2i Var[Xi ]

=σ2n∑

i=1a2

i .

Il faut donc minimiser∑n

i=1 a2i sous la contrainte

∑ni=1 ai = 1. Or,

n∑i=1

a2i =

n∑i=1

((ai − 1

n

)+ 1

n

)2

=n∑

i=1

(ai − 1

n

)2

+ 1

n,

étant donné que le produit croisé vaut 0. Ainsi, l’expression∑n

i=1 a2i est

minimisée en choisissant ai = 1/n pour tout i . Par conséquent,

X =n∑

i=1

1

nXi

possède la plus petite variance parmi tous les estimateurs sans biais li-néaires.

1.25 On a

E

[1

n

n∑i=1

(Xi −µ)2

]= 1

n

n∑i=1

E [(Xi −µ)2]

= 1

n

n∑i=1

σ2

=σ2.

1.26 En utilisant la définition de l’espérance, on obtient

E [T (X )] = 0+0+ (2)

2

)1

= θ.

1.27 Soit Var[X ] = θ et

θ = nX

n

(1− X

n

).

Page 309: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 299

On a

E [θ] = E [X ]− E [X 2]

n

= np − np(1−p)+ (np)2

n= np −p(1−p)−np2

= np(1−p)−p(1−p)

= θ−p(1−p).

Par conséquent, θ est un estimateur de θ avec un biais de −p(1−p).

1.28 On sait que

Var[X ] = Var[X ]

n= λ

n.

De plus,

E

[(∂

∂λln f (X ;λ)

)2]= E

[(X −λλ

)2]= 1

λ2 Var[X ]

= 1

λ.

La borne de Rao–Cramér est donc

λ

n= Var

[X

].

Comme la variance de l’estimateur est égale à la borne de Rao–Cramér, sonefficacité vaut 1 et de X est un estimateur sans biais à variance minimale duparamètre λ d’une loi de Poisson.

1.29 D’abord, on cherche un estimateur sans biais :

E [Z ] =αE [X ]+βE [Y ]

=α0,8z +βz

= z,

d’où β= 1−0,8α. Ensuite, on cherche un estimateur avec une variance mini-male :

Var[Z ] =α2Var[X ]+β2Var[Y ]

=α2z2 +β2(1,5)z2

= (α2 +1,5(1−0,8α)2)z2.

Page 310: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

300 Solutions des exercices

Cette dernière expression est minimisée lorsque α2 +1,5(1−0,8α)2 est mini-misé, c’est-à-dire, lorsque α= 0,6122. On trouve ensuite que β= 0,5102.

1.30 a) On a

f (x;θ) = 1

θx1/θ−1(1−x)1−1, 0 < x < 1,θ > 0,

soit une distribution bêta de paramètres α= 1/θ et β= 1.

b) On a ln f (xi ;θ) = (θ−1 −1)ln xi − lnθ et, donc,

`(θ) =(

1

θ−1

) n∑i=1

ln xi −n lnθ.

Par conséquent,

d

dθ`(θ) =−

∑ni=1 ln xi

θ2 − n

θ

et θ =−n−1 ∑ni=1 ln xi .

c) On a

E [θ] =− 1

n

n∑i=1

∫ 1

0

1

θ(ln xi )x1/θ−1

i d xi

=− 1

n

n∑i=1

[x1/θ ln x|10 −

∫ 1

0x1/θ−1

i d xi

]=− 1

n

n∑i=1

(−θ)

= θ.

Chapitre 2

2.1 La franchise permet à l’assureur d’économiser au plus 250 $ par contrat. L’as-sureur économise donc, pour les 12 contrats de son portefeuille,

250,110,250,213,98,250,250,162,131,250,250,250,

pour un total de 2464 $. Le montant total des sinistres sans la franchise est de4982 $. Le rapport d’élimination de perte est donc

LER = 2464

4982= 0,4946.

Page 311: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 301

2.2 La limite permet à l’assureur d’économiser l’excédent de 100000 $ par contrat.L’assureur économise donc, pour les huit contrats de son portefeuille,

0,23000,323000,0,113000,0,0,78000,

pour un total de 537000 $. Le montant total des sinistres sans la limite est de1146000 $. Le rapport d’élimination de perte est donc

LER = 537000

1146000= 0,4686.

2.3 a) Soit X ∼ Exponentielle(0,02) la variable aléatoire du montant d’un sinistreet soit Y , la variable aléatoire du montant économisé par l’assureur. Ondéfinit

Y =

X , X ≤ 10

0, X > 10.

Le rapport d’élimination de perte est

LER = E [Y ]

E [X ]

=∫ 10

0 x fX (x)d x

50

= 0,87616

50= 0,0175.

b) Avec une franchise forfaitaire, on a plutôt

Y =

X , X ≤ 10

10, X > 10.

Le rapport d’élimination de perte est

LER = E [Y ]

E [X ]

=∫ 10

0 x fX (x)d x +∫ ∞10 10 fX (x)d x

E [X ]

= E [X ;10]

E [X ]

= 9,0634

50= 0,1813.

Page 312: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

302 Solutions des exercices

Il est normal que ce ratio soit supérieur à celui en a) puisque l’assureurne rembourse que la partie du montant du sinistre excédent la franchiseforfaitaire, et non le montant au complet.

2.4 Soit X ∼ Gamma(4,0,1), la variable aléatoire du montant d’un sinistre et soit Y ,la variable aléatoire du montant économisé par l’assureur. On définit

Y =

0, X ≤ 100

X −100, X > 100.

Le rapport d’élimination de perte est

LER = E [Y ]

E [X ]

=∫ ∞

100(x −100) fX (x)d x

E [X ]

= 0,138

40= 0,0034.

Il est également possible de réécrire la variable aléatoire comme étant

Y =

X −X , X ≤ 100

X −100, X > 100.

Il est alors aisé de calculer le rapport d’élimination de perte comme suit :

LER = E [Y ]

E [X ]

= E [X ]−E [X ;100]

E [X ]

= E [X ]− (40)Γ(5;10)− (100)(1−Γ(4;10))

40.

Comme la valeur de α est entière, on peut utiliser

Γ(α; y) = 1−α−1∑j=0

y j e−y

j !

pour obtenir

LER = 40−39,862

40= 0,0034.

Page 313: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 303

2.5 Il est dit dans la question que l’assureur «limite ses paiements à 200», la li-mite est donc de 270. En introduisant d’abord la limite, l’assureur économise,respectivement,

0,0,0,0,0,0,0,0,0,0,90,130,

pour un total de 220. En introduisant ensuite la franchise, l’assureur économiseen plus, respectivement,

20,50,70,70,70,70,70,70,70,70,70,70,

pour un total de 770. Le montant total des sinistres sans la limite et la franchiseest de 1745. Le rapport d’élimination de perte est donc

LER = 770+220

1745= 0,567.

2.6 On trouve d’abord

LERd=100 =∫ 100

0 x fX (x)d x +∫ ∞100 100 fX (x)d x

E [X ]

= E [X ;100]

E [X ]

= E [X ;100]

2000= 0,0465

d’où l’on trouve que E [X ;100] = 93. Soit Y , la variable aléatoire du montantépargné par l’assureur. On définit

Y =

X , X ≤ 100

100, 100 < X ≤ 30000

X −30000+100, X > 30000,

ou, de manière équivalente,

Y = X −min(X ,30000)+min(X ,100)

=

X −X +X , X ≤ 100

X −X +100, 100 < X ≤ 30000

X −30000+100, X > 30000.

Ainsi,

LER = E [X ]−E [X ;30000]+E [X ;100]

E [X ]= 0,226.

Page 314: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

304 Solutions des exercices

2.7 a) Il faut voir que la densité donnée peut s’écrire comme une combinaisonlinéaire de deux distributions exponentielles :

fX (x) = e−2x + e−x

2

= 1

2(2e−2x )+ 1

2e−x .

L’espérance limitée est donc, en utilisant les formules pour l’espérancelimitée d’une exponentielle,

E [X ;d ] =(

1

2

)(1

2

)(1−e−2d )+

(1

2

)(1)(1−e−d )

= 1−e−2d

4+ 1−e−d

2.

b) Il faut d’abord évaluer la sévérité moyenne. Soit Y , la variable aléatoire dumontant payé par l’assureur, on a

Y =

0, X ≤ 0,25

X −0,25, X > 0,25,

ou encore

Y = max(X −0,25,0)

= X −min(X ,0,25)

=

X −X , X ≤ 0,25

X −0,25, X > 0,25.

À partir de cette représentation, il est facile de voir que

E [Y ] = E [X ]−E [X ;0,25]

=(

1

4+ 1

2

)− 3−e−0,5 −2e−0,25

4

= 0,541.

L’espérance de la sévérité est de un sinistre tous les dix ans, donc de 0,1.Ainsi, la prime pure est

π= (0,541)(0,1) = 0,0541.

Page 315: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 305

c) Soit Z = 1,05X , la variable aléatoire du montant de sinistre après inflation.On a

FZ (x) = FX (x/1,05)

= 1

2(1−e−(2/1,05)x )+ 1

2(1−e−1/1,05x ).

Le calcul de l’espérance de la sévérité est donc

E [Y ] = E [Z ]−E [Z ;0,25]

= 0,7875−0,2107

= 0,576.

La prime pure est alors

π= (0,576)(0,1) = 0,0576.

2.8 a) Pour le réassureur, il s’agit d’une franchise de 50000. Soit Y , la variablealéatoire du montant payé par le réassureur. On a

Y =

0, X ≤ 50000

X −50000, X > 50000,

ou encore

Y = max(X −50000,0)

= X −min(X ,50000)

=

X −X , X ≤ 50000

X −50000, X > 50000

À partir de cette représentation, il est facile de voir que

E [Y ] = E [X ]−E [X ;50000]

= 1091,09.

b) Soit Y ∗ la variable aléatoire du montant économisé par le réassureur. Ondéfinit

Y ∗ =

X , X ≤ 100000

100000, X > 100000.

Page 316: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

306 Solutions des exercices

On trouve alors que

E [Y ∗] = E [X ;100000]

= 4219,13.

De plus, on a

E [X ] = λ

α−1

= 2500

1,5−1

= 5000.

Le rapport d’élimination de perte est donc

LER = 4219,13

5000= 0,8438.

2.9 On sait que Y P = X −d |X > d et que

fY P (x) = fX (x +d)

1−FX (d), x > 0.

On a donc

E [Y P ] = 1

1−FX (d)

∫ ∞

0x fX (x +d)d x

= 1

1−FX (d)

∫ ∞

d(y −d) fX (y)d y

= 1

1−FX (d)

(∫ ∞

dy fX (y)d y −d(1−F (d))

)= 1

1−FX (d)

(∫ ∞

0y fX (y)d y −

∫ d

0y fX (y)d y −d(1−F (d))

)= E [X ]−E [X ;d ]

1−FX (d)

par définition de l’espérance limitée. Le numérateur représente le montantmoyen des sinistres au-dessus de la franchise d , alors que la présence dudénominateur s’interprète comme la sélection des seuls sinistres dépassant lafranchise.

2.10 Pour chaque cas, la fonction coverage du package actuar retourne une fonc-tion pour calculer ou tracer la densité modifiée. Voir la figure E.3 pour lesgraphique demandés. On a superposé, sur chaque graphique, la densité de ladistribution sans la modification à la densité modifiée. Le code R pour créerces graphiques est le suivant :

Page 317: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 307

0 10 20 30 40 50

0.00

0.10

0.20

(a) Franchise forfaitaire de 10

0 10 20 30 40 500.

000.

040.

08

(b) Franchise atteinte de 10 etlimite de 40

0 10 20 30 40 50

0.00

0.02

0.04

0.06

0.08

0.10

(c) Coassurance de 80 %

FIG. E.3: Graphiques de l’exercice 2.10. Le trait épais représente la variable aléatoiremodifiée et le trait mince la variable aléatoire de base.

a) > f <- coverage(dweibull, pweibull, deductible = 10, per.loss = TRUE)

> curve(dweibull(x, 3, 15), from = 0, to = 50,

+ ylim = c(0, f(0, 3, 15)))

> curve(f(x, 3, 15), from = 0.01, add = TRUE, lwd = 3)

> points(0, f(0, 3, 15), pch = 16, lwd = 3)

b) > f <- coverage(dweibull, pweibull, deductible = 10, limit = 40,

+ franchise = TRUE)

> curve(f(x, 3, 15), from = 10.01, to = 39.99, xlim = c(0, 50),

+ lwd = 3)

> points(40, f(40, 3, 15), pch = 16, lwd = 3)

> curve(dweibull(x, 3, 15), add = TRUE, lty = 2)

c) > f <- coverage(dweibull, pweibull, coins = 0.8)

> curve(f(x, 3, 15), from = 0, to = 50)

> curve(dweibull(x, 3, 15), add = TRUE, lty = 2)

2.11 a) On a X ∼ Pareto(1,5,1500). En 1995, la variable aléatoire est, après infla-tion,

X1995 = (1,05)2(1,06)3X1990

= (1,3131)X1990,

et donc X1995 ∼ Pareto(1,5,1500×1,3131). L’espérance limitée est E [X1995;500] =421,3. L’espérance du montant d’un sinistre en 1995 est donc, avant la fran-chise,

E [X1995] = 1969,65

1,5−1= 3939,3

Page 318: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

308 Solutions des exercices

et après la franchise

E [X ∗1995] = E [X1995]−E [X1995;500]

= 3939,3−421,3

= 3518.

Enfin, le rapport d’élimination de perte est

LER = 3939,3−3518

3939,3= 0,1069.

b) Soit N , la variable aléatoire représentant le nombre de paiements. Oncherche,

Pr(X1995 −500 > 2000|N = 1)

= Pr(X1995 −500 > 2000|X1995 > 500)

= Pr(X1995 −500 > 2000, X1995 > 500)

Pr(X1995 > 500)

= Pr(X1995 −500 > 2000)

Pr(X1995 > 500)

= 0,4107.

c) La nouvelle variable aléatoire est

Y ∗ =

0, X1995 ≤ 500

X1995 −500, 500 < X1995 ≤ 4000

4000−500, X1995 > 4000,

ou encore,

Y ∗ = max(min(X1995,4000)−500,0)

= min(X1995,4000)−min(X1995,500)

=

X1995 −X1995, X1995 ≤ 500

X1995 −500, 500 < X1995 ≤ 4000

4000−500, X1995 > 4000,

d’où

E [Y ∗] = E [X1995;4000]−E [X1995;500]

= 1255,23.

Page 319: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 309

2.12 a) On veut calculer

E [X ;u] = eµ+σ2/2Φ

(ln(u)−µ−σ2

σ

)+u

(1−Φ

(ln(u)−µ

σ

))avec u = 300000, µ= 9,356 et σ= 1,596. On obtient

E [X ;300000] = (41340,92)(0,671413)+ (300000)(1−0,9793)

= 33962.

b) Soit Y , le montant payé par sinistre après inflation. On a

E [Y ] = (1+ r )E

[X ;

d

1+ r

]= (1,1)E [X ;272727,272]

= (1,1)(33356)

= 36692.

Puisque 36692/33962 = 1,0804, cela représente une augmentation descoûts de 8,04 %.

c) Soit Y ∗ la variable aléatoire du montant payé par sinistre suite à l’intro-duction d’une franchise de 1 000 $. On a

E [Y ∗] = E [X ;300000]−E [X ;1000]

= 33962−973,92

= 32988,38.

Puisque 32988,38/33962 = 0,9713, l’introduction de la franchise entraîneune baisse des coûts de 2,87 % par rapport à la situation en a).

2.13 Soit Y P la variable aléatoire du montant payé par paiement par le réassureur.On a Y P = X −δ|X > δ, donc

fY P (x) = fX (x +δ)

1−FX (δ)

= αλα/(x +δ+λ)α+1

λα/(δ+λ)α

= α(λ+δ)α

(x + (λ+δ))α+1 , x > 0,

d’où Y P ∼ Pareto(α,λ+δ).

Page 320: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

310 Solutions des exercices

2.14 Soit X la variable aléatoire du montant d’un sinistre et Y P = X −d |X > d , lavariable aléatoire du montant payé par paiement avec une franchise forfai-taire d . Or, la distribution exponentielle étant sans mémoire, on a, de manièregénérale,

Pr[Y P > x] = Pr[X > x +d ]

Pr[X > d ]

= e−λ(x+d)

e−λd

= e−λx ,

d’où Y P ∼ Exponentielle(λ). Ici, on a donc Pr[Y P > 0,5] = e−3(0,5) = 0,22.

2.15 On a

E A[Y S] = E [X ]−E [X ;5000]

= 11100−E [X ;5000]

= 6500,

d’où E [X ;5000] = 4600. De même,

E A[Y P ] = E [X ]−E [X ;5000]

1−F (5000)

= 6500

1−F (5000)

= 10000,

d’où F (5000) = 0,35. Enfin, on cherche

EB [Y P |X ≤ 5000] = E [X |X ≤ 5000]

=∫ 5000

0 x f (x)d x

F (5000)

= E [X ;5000]− (5000)(1−F (5000))

F (5000)

= 3857.

2.16 L’espérance de la fréquence annuelle des sinistres est r (1−θ)/θ = 15. Pourqu’il y ait un paiement, le montant du sinistre doit être supérieur à la franchise.Or

Pr[X > 200] = e(200/1000)0,3 = 0,5395.

Ainsi, 53,95 % des sinistres occasionneront un paiement, d’où le nombreespéré de paiements par années est (15)(0,5395) = 8,0925.

Page 321: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 311

2.17 a) Le résultat découle directement de la redéfinition de la variable aléatoireY S comme suit :

Y S =αmax(min(X ,u)−d ,0)

=α(min(X ,u)−min(X ,d))

X −X , X < d

X −d , d ≤ X < u

u −d , X ≥ u.

b) Pour calculer le second moment de la variable aléatoire Y S , on écritd’abord

(Y S)2 =

0, X ≤ d

α2(X 2 −2d X +d 2), d < X < u

α2(u2 −2ud +d 2), X ≥ u

=

α2(X 2 −X 2 −2d X +2d X ), X ≤ d

α2(X 2 −d 2 −2d X +2dd), d < X < u

α2(u2 −d 2 −2du +2dd), X ≥ u.

On a alors

E [(Y S)2] =α2(E [X 2;u2]−E [X 2;d 2]−2dE [X ;u]+2dE [X ;d ]).

La variance est donc

Var[Y S] = E [(Y S)2]−E [Y S]2

=α2(E [X 2;u2]−E [X 2;d 2]−2dE [X ;u]+2dE [X ;d ])

−α2(E [X ;u]−E [X ;d ])2.

c) Suite à une inflation de 100r %, la définition de la variable aléatoire Y S

équivalente à celle utilisée en a) est

Y S =α(1+ r )

[min

(X ,

u

1+ r

)−min

(X ,

d

1+ r

)]

=α(1+ r )

X −X , X < d/(1+ r )

X −d/(1+ r ), d/(1+ r ) ≤ X < u/(1+ r )

u/(1+ r )−d/(1+ r ), X ≥ u/(1+ r ).

On obtient donc directement

E [Y S] =α(1+ r )

(E

[X ;

u

1+ r

]−E

[X ;

d

1+ r

]).

Page 322: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

312 Solutions des exercices

2.18 On remarquera que la relation est un cas spécial du résultat de l’exercice 2.17avec α= 1 et r = 0. On a

Y S =

0, X < d

X −d , d ≤ X < u

u −d , X ≥ u.

Par conséquent,

E [Y S] = (0)Pr[X < d ]+∫ u−d

0y fY S (y)d y + (u −d)(1−FX (u))

=∫ u−d

0y fY S (y)d y + (u −d)(1−FX (u)).

En faisant le changement de variable x = y +d dans l’intégrale, on obtient

E [Y S] =∫ u

d(x −d) fX (x)d x + (u −d)(1−FX (u))

=∫ u

0(x −d) fX (x)d x −

∫ d

0(x −d) fX (x)d x

+ (u −d)(1−FX (u))

=∫ u

0x fX (x)d x −d FX (u)−

∫ d

0x fX (x)d x +d FX (d)

+ (u −d)(1−FX (u))

=∫ u

0x fX (x)d x +u(1−FX (u))−

∫ d

0x fX (x)d x −d(1−FX (d))

= E [X ;u]−E [X ;d ].

2.19 Lorsqu’il y a bonus, son montant est

600000

(0,75−S/600000

3

)= 450000−S

3.

Il y aura donc un bonus si L < 450000. On a donc

B = max

(0,

450000−S

3

)= 150000− 1

3min(S,450000),

d’où

E [B ] = 150000− 1

3E [S;450000]

= 150000− 1

3(220321,36)

= 76559,55.

Page 323: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 313

2.20 a) Lorsqu’un sinistre de montant d < x ≤ d∗ survient, l’assureur rembourseun montant d∗(x −d)/(d∗−d). On a donc

Y P =

d∗

d∗−d(X −d), d < X ≤ d∗

X , X > d∗.

b) Pour pouvoir évaluer l’espérance, il est plus facile de réécrire la variablesous la forme

Y P = X +(

d

d∗−d

)min(X ,d∗)−

(d∗

d∗−d

)min(X ,d)

∣∣∣∣ X > d

=

X +

(d

d∗−d

)X −

(d∗

d∗−d

)d , d < X ≤ d∗

X +(

d

d∗−d

)d∗−

(d∗

d∗−d

)d , X > d∗.

Par la définition de l’espérance limitée ou en utilisant le résultat de l’exercice 2.9,on obtient directement

E [Y P ] = E [X ]+dE [X ;d∗]/(d∗−d)−d∗E [X ;d ]/(d∗−d)

1−FX (d).

Chapitre 3

3.1 a) On peut calculer puis tracer la fonction de répartition empirique aisémentavec la fonction ecdf de R ; voir la figure E.4. Quant à la fonction de massede probabilité empirique, la façon la plus simple de la calculer est à partirde la fonction table ; voir la figure E.5.

b) Il faut d’abord déterminer le nombre de données dans chacune des classes.On a n1 = 4, n2 = 10, n3 = 2 et n4 = 4. L’équation de l’ogive est alors

F20(x) =

0, x ≤ 2

(x −2)/25, 2 < x ≤ 7

(x −5)/10, 7 < x ≤ 12

(x +58)/100, 12 < x ≤ 22

(x +42)/80, 22 < x ≤ 38

1, x > 38

Les fonctions grouped.data et ogive de actuar permettent, dans l’ordre,de définir un objet de données groupées et de calculer son ogive ; voir lafigure E.6.

Page 324: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

314 Solutions des exercices

> x <- c(3, 5, 5, 6, 8, 8, 8, 8, 9, 10, 10,

+ 11, 11, 11, 16, 21, 23, 26, 29, 36)

> Fn <- ecdf(x)

> plot(Fn)

0 10 20 30 40

0.0

0.2

0.4

0.6

0.8

1.0

ecdf(x)

x

Fn(

x)

FIG. E.4: Fonction de répartition empirique des données de l’exercice 3.1

Page 325: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 315

> table(x)

x

3 5 6 8 9 10 11 16 21 23 26 29 36

1 2 1 4 1 2 3 1 1 1 1 1 1

> fn <- table(x)/length(x)

> plot(unique(x), fn, type = "h", lwd = 4)

5 10 15 20 25 30 35

unique(x)

fn

FIG. E.5: Fonction de masse de probabilité empirique des données de l’exercice 3.1

Page 326: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

316 Solutions des exercices

> xg <- grouped.data(Group = c(2, 7, 12, 22, 38),

+ Frequency = c(4, 10, 2, 4))

> Gn <- ogive(xg)

> plot(Gn)

5 10 15 20 25 30 35

0.0

0.2

0.4

0.6

0.8

1.0

ogive(xg)

x

F(x

)

FIG. E.6: Ogive des données groupées de l’exercice 3.1

Page 327: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 317

> hist(x)

Histogram of x

x

Fre

quen

cy

0 10 20 30 40

02

46

8

FIG. E.7: Histogramme des données groupées de l’exercice 3.1

c) L’équation de l’histogramme est, en dérivant l’ogive obtenue en b),

f20(x) =

0, x ≤ 2

1/25, 2 < x ≤ 7

1/10, 7 < x ≤ 12

1/100, 12 < x ≤ 22

1/80, 22 < x ≤ 38

0, x > 38.

Le package actuar définit une méthode de la fonction hist pour les don-nées groupées ; voir la figure E.7.

Page 328: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

318 Solutions des exercices

3.2 À partir de l’information du tableau et de la définition de l’ogive, on a

0,21 = 36

n+ 0,40x

n

0,51 = 36

n+ x

n+ 0,60y

nn = 200+x + y.

En résolvant, on obtient x = 120.

3.3 En utilisant les informations du tableau et la définition de l’ogive, on obtient

0,689 = (0,5)F500(1000)+ (0,5)F500(2000)

= (0,5)

(200+110

500+ 310+x

500

),

d’où l’on trouve que x = 69 et

0,839 = (0,5)F500(2000)+ (0,5)F500(5000)

= (0,5)

(310+69

500+ 379+ y

500

),

d’où l’on trouve que y = 81.

3.4 Les données sont entrées dans R avec

> (x <- grouped.data(Group = 1000 * c(0, 1, 3, 5, 10, 25, 50, 100, Inf),

+ Frequency = c(16, 22, 25, 18, 10, 5, 3, 1)))

Group Frequency

1 (0, 1000] 16

2 (1000, 3000] 22

3 (3000, 5000] 25

4 (5000, 10000] 18

5 (10000, 25000] 10

6 (25000, 50000] 5

7 (50000, 100000] 3

8 (100000, Inf] 1

Pour calculer l’ogive de ces données, la borne infinie de la dernière classe doitêtre remplacée par une valeur très grande par rapport aux autres bornes. Ilne faut pas que cette valeur soit trop grande si on veut avoir un graphiqueintéressant. Il ne faut pas supprimer la dernière classe. La figure E.8 présenteles ogives avec 200000 et 2000000 comme dernière borne. On cherche

Pr[2000 ≤ X ≤ 6000] = F100(6000)−F100(2000).

Or,

Page 329: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 319

> x[8, 1] <- c(100000, 200000)

> Gn <- ogive(x)

> plot(Gn)

0 50000 150000

0.0

0.2

0.4

0.6

0.8

1.0

ogive(x)

x

F(x

)

(a) cr = 200000

> x[8, 1] <- c(100000, 2000000)

> Gn <- ogive(x)

> plot(Gn)

0 500000 15000000.

00.

20.

40.

60.

81.

0

ogive(x)

x

F(x

)

(b) cr = 2000000

FIG. E.8: Ogive des données de l’exercice 3.4 avec différentes dernières bornes

> Gn <- ogive(x)

> Gn(c(2000, 6000))

[1] 0.270 0.666

d’où Pr[2000 ≤ X ≤ 6000] = 0,396.

3.5 Comme seulement une donnée est plus petite ou égale à 150, la fonctionde répartition empirique est F5(150) = 1/5 = 0,20. Pour l’estimateur lissé, onregarde la contribution de chacune des données au point 150, t j (150) :

x le noyau autour de 80 va de 30 à 130, la donnée 80 contribue donc à 100 % ;

x le noyau autour de 153 va de 103 à 203, la donnée 153 contribue donc à(150−103) % = 47 % ;

x le noyau autour de 162 va de 112 à 212, la donnée 162 contribue donc à(150−112) % = 38 % ;

x les deux autres données ne contribuent pas.

Page 330: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

320 Solutions des exercices

0 100 200 300 400

0.00

00.

010

0.02

0

N = 1 Bandwidth = 20

Den

sity

(a) Noyaux individuels

100 150 200 250 300 350

0.00

00.

002

0.00

40.

006

N = 4 Bandwidth = 20

Den

sity

(b) Somme pondérée

FIG. E.9: Estimation par noyaux triangulaires et largeur de bande de 50 des donnéesde l’exercice 3.6

L’estimateur lissé est donc

F (150) =5∑

j=1f5(y j )t j (150)

= (0,20)(1)+ (0,20)(0,47)+ (0,20)(0,38)+0+0

= 0,37.

Ainsi, |F5(150)− F (150)| = |0,20−0,37| = 0,17.

3.6 a) Étant donné que la distribution est symétrique, la moyenne sera le pointcentral, c’est-à-dire

150+ 300−150

2= 225.

b) La figure E.9(a) présente les quatre noyaux (quatre densités) sur le mêmegraphique et la figure E.9(b) présente leur somme pondérée, c’est-à-diref (x).

3.7 La figure E.10 présente la distribution empirique des données.

a) On voit que pour une largeur de bande de 0,5, aucune donnée ne va contri-buer à la densité au point 6,2.

Page 331: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 321

3 4 5 6 7 8 9 10

unique(x)

fn

FIG. E.10: Distribution empirique des données de l’exercice 3.7

b) Pour une largeur de bande de 1, il y a une valeur, 7, qui va contribuer à ladensité au point 6,2 :

f (6,2) = 0,1

(2)(1)= 0,05.

c) Pour une largeur de bande de 2, il y a trois valeurs, 5, 7 et 8 qui vont contri-buer à la densité au point 6,2 :

f (6,2) = 0,3

(2)(2)+ 0,1

(2)(2)+ 0,1

(2)(2)= 0,125.

d) Pour une largeur de bande de 3, il y a cinq valeurs, 4, 5, 7, 8 et 9 qui vontcontribuer à la densité au point 6,2 :

f (6,2) = 0,2

(2)(3)+ 0,3

(2)(3)+ 0,1

(2)(3)+ 0,1

(2)(3)+ 0,1

(2)(3)= 0,13333.

Page 332: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

322 Solutions des exercices

e) On voit que pour une largeur de bande de 0,5, aucune donnée ne va contri-buer à la densité au point 6,2.

f) Pour une largeur de bande de 1, il y a une valeur, 7, qui va contribuer à ladensité au point 6,2 :

f (6,2) =(

1

10

)(6,2−7+1

(1)2

)= 0,02.

g) Pour une largeur de bande de 2, il y a trois valeurs, 5, 7 et 8 qui vont contri-buer à la densité au point 6,2 :

f (6,2) =(

1

10

)(6,2−7+2

(2)2

)+

(1

10

)(6,2−8+2

(2)2

)+

(3

10

)(−6,2+5+2

(2)2

)= 0,095.

3.8 On utilise l’équation d’un estimateur avec noyaux triangulaires :

f (5) =(

1/5

a2

)(5− (6−a))+

(−1/5

a2

)(5− (4+a))

= 0,01.

En simplifiant, on trouve 0,05a2 −2a +2 = 0 et, en choisissant la bonne racine,a = 1,0263.

3.9 On entre les données individuelles de l’exercice dans R avec

> x <- c(2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3,

+ 4, 4, 4, 5, 5, 5, 5, 6, 6, 6, 6, 8, 8, 9, 15,

+ 17, 22, 23, 24, 24, 25, 27, 32, 43)

et les données sous forme groupée avec

> xg <- grouped.data(Group = c(1.5, 2.5, 6.5, 29.5, 49.5),

+ Frequency = c(12, 15, 11, 2))

a) La figure E.11 présente la fonction de répartition empirique des données,obtenue à l’aide de la fonction ecdf.

b) La figure figure E.11 présente également l’ogive des données, obtenue avecla fonction ogive du package actuar. On voit que l’ogive et la fonction derépartition empirique correspondent généralement bien. Autour du pointx = 22, l’ajustement pourrait être un peu meilleur, par exemple en ajoutant

Page 333: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 323

> Fn <- ecdf(x)

> Gn <- ogive(xg)

> plot(Fn, pch = 16)

> lines(knots(Gn), Gn(knots(Gn)), type = "o",

+ pch = 21, bg = "white", lty = 2)

0 10 20 30 40

0.0

0.2

0.4

0.6

0.8

1.0

ecdf(x)

x

Fn(

x)

FIG. E.11: Fonction de répartition empirique (lignes et points pleins) et ogive (lignesbrisées et points vides) des données de l’exercice 3.9

Page 334: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

324 Solutions des exercices

> hist(xg)

Histogram of xg

xg

Den

sity

0 10 20 30 40 50

0.00

0.05

0.10

0.15

0.20

0.25

0.30

FIG. E.12: Histogramme des données de l’exercice 3.9

une classe. Pour les deux bornes extrêmes, 0 aurait peut-être été un peuplus intuitif comme choix de borne inférieure que 1,5. La borne supérieureest logique, car supérieure à la valeur maximale de l’échantillon, mais esttotalement arbitraire sinon (on aurait pu choisir, par exemple, 50).

c) La figure E.12 présente l’histogramme des données créé à partir de l’objetde données groupées.

d) On a simplement

> mean(x)

[1] 9.225

> sd(x)

[1] 10.23691

Page 335: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 325

3.10 Tout d’abord, on a F10(4) = 0,40, E [F10(4)] = F (4), et Var[F10(4)] = F (4)(1−F (4))/10. En utilisant le Théorème central limite, on peut poser que

Pr

[−1,96 ≤ F10(4)−E [F10(4)]p

Var[F10(4)]≤ 1,96

]≈ 0,95,

soit

Pr

[−1,96 ≤

p10(F10(4)−F (4))p

F (4)(1−F (4))≤ 1,96

]≈ 0,95.

En estimant le dénominateur parp

F10(4)(1−F10(4)) =p0,24 puis en isolant

F (4), on trouve

F (4) ∈F10(4)±1,96

√F10(4)(1−F10(4))

10

(0,4± (1,96)

√0,24

10

)∈ (0,0964,0,7036).

3.11 En utilisant l’équation de l’estimateur de Nelson–Åalen, on obtient

Hn(1200) = 3

52+ 10

40+ 11

19= 0,8866.

On trouve maintenant la valeur de la fonction de survie évaluée au point1200,

S(1200) = e−0,8866 = 0,4120,

et finalement la valeur de la fonction de répartition évaluée à ce même point :

F (1200) = 1−0,4120 = 0,5880.

Page 336: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

326 Solutions des exercices

yi (10000− yi )/(6000) k ∆Hn

1000 1,5000 0,0 0,05003400 1,1000 0,0 0,05264500 0,9167 0,5 0,05567500 0,4167 0,5 0,0588

15000 −0,8333 0,5 0,062517500 −1,2500 0,0 0,0667

TAB. E.1: Résultats intermédiaires du calcul de l’estimation par noyaux pour lesdonnées de l’exercice 3.12

3.12 a) En utilisant l’équation de l’estimateur de Nelson–Åalen, on trouve

Hn(1000) = 1

20= 0,0500

Hn(3400) = 1

20+ 1

19= 0,1026

Hn(4500) = 1

20+ 1

19+ 1

18= 0,1582

Hn(7500) = 1

20+ 1

19+ 1

18+ 1

17= 0,2170

Hn(15000) = 1

20+ 1

19+ 1

18+ 1

17+ 1

16= 0,2795

Hn(17500) = 1

20+ 1

19+ 1

18+ 1

17+ 1

16+ 1

15= 0,3462.

b) Le tableau E.1 présente les résultats intermédiaires. L’estimation est donc

h(10000) =(

1

6000

)(0,5)(0,0556+0,0588+0,0625)

= 0,00001449.

3.13 On a

γ1 = µ3

σ3 .

Page 337: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 327

En entrant les données dans R, on peut calculer les troisième et deuxièmemoment centraux facilement :

> x <- 1000 * c(rep(2, 2), rep(4, 6), rep(6, 12), rep(8, 10))

> (m <- mean(x))

[1] 6000

> mean((x - m)^3)

[1] -3.2e+09

> mean((x - m)^2)

[1] 3200000

On a donc

γ1 = −3200000000

32000003/2

=−0,559.

La distribution des données est donc asymétrique vers la gauche ou, demanière équivalente, la bosse se trouve à droite.

3.14 Étant donné que la distribution empirique est symétrique, l’estimateur ducoefficient d’asymétrie est 0. En entrant les données dans R, on peut calculerles quatrième et deuxième moment centraux facilement :

> x <- c(100, rep(200, 4), rep(300, 10), rep(400, 4), 500)

> (m <- mean(x))

[1] 300

> mean((x - m)^4)

[1] 2e+08

> mean((x - m)^2)

[1] 8000

On a donc

γ2 = µ4

σ4

= 200000000

80002

= 3,125.

La distribution empirique des données s’approche donc de celle d’une loinormale.

Page 338: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

328 Solutions des exercices

3.15 a) On a (n +1)p = (20+1)(0,60) = 12,6, d’où

π0,60 = 0,4x(12) +0,6x(13)

= (0,4)(38)+ (0,6)(39)

= 38,6.

b) On a (n +1)p = (20+1)(0,75) = 15,75, d’où

π0,75 = 0,25x(15) +0,75x(16)

= (0,25)(41)+ (0,75)(43)

= 42,5.

3.16 Par définition,

E [min(X ,320)] =∫ 320

0x fX (x)d x +320(1−FX (320)).

En supposant que les données sont uniformément distribuées à l’intérieurdes classes, la moyenne de celles-ci est affectée au point milieu. À la classe(200,320], on attribue un nombre de données proportionnel à la longueur deleur classe par rapport à la classe (200,500], soit (120/300)(24) = (0,4)(24) = 9,6données. On a au total n = 100 données. On a donc

E100[min(X ,320)] =(

50+0

2

)(20

100

)+

(100+50

2

)(34

100

)+

(200+100

2

)(22

100

)+

(320+200

2

)(9,6

100

)+320

(24−9,6

100

)= 5+25,5+33+24,96+46,08

= 134,54.

On peut vérifier ce résultat à l’aide de la fonction elev de actuar :

> x <- grouped.data(Classe = c(0, 50, 100, 200, 500),

+ Frequence = c(20, 34, 22, 24))

> elev(x)(320)

[1] 134.54

Page 339: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 329

3.17 Étant donné que l’intervalle est petit, on peut en calculer le niveau de confianceexactement. En utilisant la loi binomiale avec paramètres n = 5 et p = 0,5, onobtient

Pr[X(2) ≤π0,5 < X(4)] =3∑

k=2

(5

k

)(0,5)k (0,5)5−k

= 0,625.

3.18 Étant donné que l’intervalle est grand, on va utiliser l’approximation normaleavec correction pour la continuité pour déterminer le niveau de confiance.On a, avec Y ∼ N (250,125),

Pr[240 ≤π0,50 < 260] ≈ Pr[239,5 ≤ K < 259,5]

=Φ(0,85)−Φ(−0,94)

= 0,6287.

3.19 La valeur 10 est la 10e statistique d’ordre et la valeur 20 est la 14e statistiqued’ordre. Comme l’intervalle est petit, on peut en calculer le degré de confianceexactement. Soit N ∼ Binomiale(20,0,55),

Pr[X(10) ≤π0,55 < X(14)] = Pr[N = 10,11,12,13]

=13∑

k=10

(20

k

)(0,55)k (0,45)20−k

= 0,1593+0,1771+0,1623+0,1221

= 0,6208.

3.20 a) On obtient aisément

fX (x) = 1

xfY (ln(x))

= λα

Γ(α)x(ln(x))α−1e−λ ln(x), x > 1.

On remarque que comme Y est définie sur [0,∞), X = eY est définie sur[1,∞). Cette distribution est la log-gamma de paramètres α et λ.

b) La fonction R de la figure E.13 calcule le biais empirique pour des valeursde λ, n et r données. On remarquera que cette fonction définit une fonc-tion interne qui se charge des étapes 2 et 3 de l’algorithme présenté dansl’exposé de l’exercice. Cette fonction est ensuite passée à replicate pourréaliser efficacement l’étape 4 de l’algorithme.

Page 340: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

330 Solutions des exercices

sim <- function(lambda, n, r)

## Fonction interne pour simuler un échantillon

## et calculer l'estimateur.

f <- function(lambda, n)

## Simulation des données. On pourrait aussi

## utiliser la fonction rlgamma() du package

## actuar.

x <- exp(rgamma(n, shape = 1, rate = lambda))

## Estimateur de lambda

1 / (1 - 1/mean(x))

## Simulation de 'r' échantillons

lc <- replicate(r, f(lambda, n))

## La fonction retourne une liste contenant le

## vecteur d'estimateurs et le biais empirique.

list(estimates = lc,

bias = mean(lc) - lambda)

FIG. E.13: Fonction R permettant la création des échantillons et le calcul du biaisempirique

Page 341: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 331

i) Pour n = 10 et r = 1000 on a

> simul.1 <- sim(5, 10, 1000)

> simul.1$bias

[1] 0.7635874

ii) Pour n = 1000 et r = 100 on a

> simul.2 <- sim(5, 1000, 100)

> simul.2$bias

[1] -0.003825851

iii) Pour n = 1000 et r = 1000 on a

> simul.3 <- sim(5, 1000, 1000)

> simul.3$bias

[1] 0.0001300101

La taille de l’échantillon a un impact sur le biais de l’estimateur. On voitqu’au passage d’un petit échantillon (partie i)) à un plus grand (partie ii))le biais devient moins important et l’estimateur est donc plus proche desa vraie valeur. En revanche, le nombre de simulation n’a un impact quesur la force de la conclusion. De la partie ii) à la partie iii), seul le nombrede simulations change. Or, le biais change assez peu. Nous ne sommesque confortés dans notre conclusion que l’estimateur λ est probablementsans biais pour λ.

c) On a un échantillon de 100 estimations. La figure E.14 présente le gra-phique de la fonction de répartition empirique de l’estimateur λ.

d) La figure E.15 présente l’histogramme et l’ogive de l’estimateur λ. Tel quesuggéré dans l’énoncé de l’exercice, on a utilisé les classes calculées par lafonction hist pour construire l’ogive. On a procédé ainsi :

> gn <- hist(x, plot = FALSE)

> xg <- grouped.data(cj = gn$breaks, nj = gn$counts)

> Gn <- ogive(xg)

e) Comme il y a 100 données dans l’échantillon, on a (101)(0,45) = 45,45 etdonc

π0,45 = (0,55)x(45) + (0,45)x(46).

Pour le 70e centile, la procédure est la même. On a (101)(0,70) = 70,7 etdonc

π0,70 = (0,30)x(70) + (0,70)x(71).

Pour notre échantillon, on obtient

Page 342: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

332 Solutions des exercices

> x <- simul.2$estimates

> Fn <- ecdf(x)

> plot(Fn, do.points = FALSE)

4.8 5.0 5.2 5.4

0.0

0.2

0.4

0.6

0.8

1.0

ecdf(x)

x

Fn(

x)

FIG. E.14: Fonction de répartition empirique de l’estimateur λ de l’exercice 3.20

> xs <- sort(x)

> 0.55 * xs[44] + 0.45 * xs[45]

[1] 4.959905

et

> 0.30 * xs[70] + 0.70 * xs[71]

[1] 5.068952

Plus simplement, on peut utiliser la méthode pour données groupées dela fonction quantile définie dans actuar pour calculer les quantiles lissés(soit l’inverse de l’ogive) :

> quantile(xg, c(0.45, 0.7))

Page 343: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 333

> hist(x, prob = TRUE)

Histogram of x

x

Den

sity

4.6 4.8 5.0 5.2 5.4

0.0

1.0

2.0

3.0

(a) Histogramme

> plot(Gn)

4.6 4.8 5.0 5.2 5.4

0.0

0.2

0.4

0.6

0.8

1.0

ogive(xg)

xF

(x)

(b) Ogive

FIG. E.15: Histogramme et ogive de l’estimateur λ de l’exercice 3.20

45% 70%

4.972414 5.068000

Les résultats diffèrent légèrement parce que la technique de lissage utilisépar quantile n’est pas tout à fait la même que celle utilisée ci-dessus.

Chapitre 4

4.1 En utilisant la technique de la fonction de répartition, on a

FY (y) = Pr[Y ≤ y]

= Pr[c X ≤ y]

= Pr[X ≤ y/c]

= FX (y/c)

= 1−(

λ

λ+ y/c

)α= 1−

(cλ

cλ+ y

)αet donc, Y ∼ Pareto(α,cλ).

Page 344: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

334 Solutions des exercices

4.2 En utilisant la technique de la fonction de répartition, on a

FY (y) = Pr[Y ≤ y]

= Pr[X ≤ ln(y)]

= FX (ln(y)).

Étant donné la présence de la valeur absolue dans la densité de X , il fautséparer le domaine. Pour −∞< x ≤ 0, on a 0 < y < 1, et donc

FX (ln(y)) =∫ ln(y)

−∞1

2θe

xθ d x

= 1

2e ln(y)/θ.

Pour 0 < x <∞, on a 1 < y <∞, et donc

FX (ln(y)) =∫ 0

−∞1

2θex/θ d x +

∫ ln(y)

0

1

2θe−x/θ d x

= 1− 1

2e

− ln(y)θ .

Par conséquent,

F (y) =

12 e ln(y)/θ, 0 < y < 1

1− 12 e ln(y)/θ, y ≥ 1.

4.3 En utilisant le fait que, pour α entier, Γ(α) = (α−1)!, on trouve

Pr[X ≤ x] = 1

(α−1)!βα

∫ x

0tα−1e−t/βd t

= 1

(α−1)!βα

(−tα−1βe−t/β

∣∣∣x

0+

∫ x

0(α−1)tα−2βe−t/βd t

)=− xα−1e−x/β

(α−1)!βα−1 + 1

(α−2)!βα−1

∫ x

0tα−2e−t/βd t

=−Pr[Y =α−1]+ 1

(α−2)!βα−1

∫ x

0tα−2e−t/βd t

avec Y ∼ Poisson(x/β). La relation s’obtient en continuant à intégrer commeci-dessus jusqu’à obtenir

Pr[X ≤ x] = 1−Pr[Y =α−1]−·· ·−Pr[Y = 0]

= Pr[Y ≥α].

Page 345: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 335

4.4 En utilisant la technique de la fonction de répartition, on a

FY (y) = FX

(λy

1− y

)=β

(τ,α;

λy/(1− y)

λy/(1− y)+λ)

=β(τ,α; y),

où β(a,b; x) est la fonction de répartition d’une distribution Bêta(a,b) évaluéeau point x. On a donc que Y ∼ Bêta(τ,α).

4.5 En utilisant la technique de la fonction de répartition, on obtient

FY (y) = Pr[Y ≤ y]

= Pr[5X −1/4 ≤ y]

= Pr

[X >

( y

5

)−4]

= 1−FX

(( y

5

)−4 )=

(1

1+ (5/y)4

)αqui est la fonction de répartition d’une variable aléatoire avec distribution Burrinverse de paramètres τ=α, γ= 4 et θ = 5.

4.6 a) Par définition, la distribution de Y est nommée log-gamma. On remarqueque comme X est définie sur [0,∞), Y = e X est définie sur [1,∞). On a donc

fY (y) = 1

yfX (ln(y))

= λα

Γ(α)y(ln(y))α−1e−λ ln(y), y ≥ 1.

b) En utilisant la fonction génératrice des moments de X , on trouve

E [Y ] = E [e X ]

= MX (1)

=(

λ

λ−1

)α, λ> 1

E [Y 2] = E [e2X ]

= MX (2)

=(

λ

λ−2

)α, λ> 2,

Page 346: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

336 Solutions des exercices

d’où

Var[Y ] = E [Y 2]−E [Y ]2

=(

λ

λ−2

)α−

λ−1

)2α

, λ> 2.

c) De la partie b), on voit que

E [Y k ] = MX (k)

=(

λ

λ−k

)α, λ> k.

Les moments de Y existent donc seulement pour k <λ.

4.7 a) Il suffit de poser c = 1+ i dans le résultat de l’exercice 4.1.

b) En utilisant la technique de la fonction de répartition, on trouve

FY (y) = FX

( y

1+ i

)= 1−

(θγ(1+ i )γ

θγ(1+ i )γ+ yγ

)αet donc, Y ∼ Burr(α,γ, (1+ i )θ).

c) On a

fY (y) = 1

1+ ifX

( x

1+ i

)= 1

1+ i

λα

Γ(α)

(ln(y/(1+ i )))α−1

(y/(1+ i ))λ+1

= λα(1+ i ))λ(ln(y)− ln(1+ i ))α−1

Γ(α)yλ+1.

4.8 En utilisant la technique de la fonction de répartition, on a

FY (y) = FX (yτ)

= 1−(

λ

λ+ yτ

)αet donc, Y ∼ Burr(α,τ,λ1/τ).

Page 347: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 337

4.9 En utilisant la technique de la fonction de répartition, on a

FY (y) = Pr[Y ≤ y]

= Pr[ln(1+X /θ) ≤ y]

= Pr[X ≤ θ(e y −1)]

= FX (θ(e y −1))

= 1−(

θ

θ+θ(e y −1)

)α= 1−e−αy , y ≥ 0.

Ainsi, Y ∼ Exponentielle(α).

4.10 Soit Y , la variable aléatoire du montant des sinistres en 2007. On définit

Y = (1,04)(1,045)(1,16)X

= 1,260688X .

En se reportant à l’exercice 4.7 b), on a que Y ∼ Burr(α= 0,5,γ= 2,θ = 3,7821)et donc que

Pr[Y > 4] = 1−FY (4) = 0,6870.

4.11 a) On observe que la variable aléatoire X obéit à une distribution Paretotranslatée(3,1). En utilisant la technique de la fonction de répartition, ontrouve

FY (y) = FX

(y

1,10

)= 1−

(1,10

y

)3

.

b) On a Pr[Y > 2,2] = 1−FY (2,2) = 0,125.

4.12 On a X |Θ∼ Binomiale(10,Θ) etΘ∼ Uniforme(0,1). Par la loi des probabilitéstotales,

Pr[X = x] =∫ 1

0

(10

x

)θx (1−θ)10−x dθ

=(

10

x

)∫ 1

0θx (1−θ)10−x dθ

Page 348: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

338 Solutions des exercices

qui devient, en reconnaissant sous l’intégrale la forme fonctionnelle d’unedistribution Bêta(x +1,11−x),

Pr[X = x] =(

10

x

)Γ(x +1)Γ(11−x)

Γ(12)

= 10!

(10−x)!x!

x!(10−x)!

11!

= 1

11.

Par conséquent,

Pr[X > 6] =10∑

i=7Pr[X = i ]

= 4

11.

4.13 Par la loi des probabilités totales, on trouve

fX (x) =∫ ∞

0

(θτe−θx xτ−1

Γ(τ)

)(λαe−λθθα−1

Γ(α)

)dθ

= xτ−1λα

Γ(τ)Γ(α)

∫ ∞

0θτ+α−1e−(x+λ)θ dθ

qui devient, en reconnaissant sous l’intégrale la forme fonctionnelle d’unedistribution Gamma(τ+α, x +λ)

fX (x) = xτ−1λαΓ(τ+α)

Γ(α)Γ(τ)(x +λ)τ+α

et donc, X ∼ Pareto Généralisée(α,τ,λ).

4.14 On a

Pr[X = x] =∫ 1

0θ(1−θ)x−1 Γ(α+β)

Γ(α)Γ(β)θα−1(1−θ)β−1 dθ

= Γ(α+β)

Γ(α)Γ(β)

∫ 1

0θα(1−θ)x+β−2 dθ

qui devient, en reconnaissant sous l’intégrale une distribution Bêta(α+1,β+x −1),

Pr[X = x] = Γ(α+β)Γ(α+1)Γ(x +β−1)

Γ(α)Γ(β)Γ(α+β+x).

Page 349: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 339

4.15 Par la loi des probabilités totales, on obtient

fX (x) =∫ ∞

0τθxτ−1e−θxτ λ

αxα−1e−λx

Γ(α)dθ

= τxτ−1λα

Γ(α)

∫ ∞

0θαe−(xτ+λ)θ dθ

= ατxτ−1λα

(λ+xτ)α+1 ,

en reconnaissant une distribution Gamma(α+1, xτ+λ) sous l’intégrale. Ladensité obtenue est celle d’une loi Burr(α,τ,λ1/τ).

4.16 On a X |Λ ∼ Burr(5,1,Λ) et Λ ∼ Gamma(10,2). On cherche E [X ] et Var[X ].Il ne faut pas tenter de trouver la distribution marginale de X , mais plutôtconditionner :

E [X ] = E [E [X |Λ]]

= E

[ΛΓ(4)Γ(2)

Γ(5)

]= 1

4E [Λ]

= 5

4

et

Var[X ] = E [Var[X |Λ]]+Var[E [X |Λ]]

= E

[Λ2Γ(3)Γ(3)

Γ(5)−

(ΛΓ(4)Γ(2)

Γ(5)

)2]+Var

[ΛΓ(4)Γ(2)

Γ(5)

]= 5

48E [Λ2]+ 1

16Var[Λ]

= 145

48.

4.17 Pour commencer, on utilise le lien entre le taux d’échec et la fonction de

Page 350: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

340 Solutions des exercices

survie pour trouver

S(x|θ) = e−∫ x

0 λ(x|θ)d t

= exp

∫ x

0

3

θ+ td t

= exp

3ln

θ+x

)= exp

ln

θ+x

)3=

θ+x

)3

.

La fonction de répartition est donc

F (x|θ) = 1−(

θ

θ+x

)3

,

d’où X |Θ∼ Pareto(3,Θ). Par conséquent,

E [X ] = E [E [X |Θ]]

= E

2

]= 500

et

Var[X ] = E [Var[X |Θ]]+Var[E [X |Θ]]

= E

[3Θ

4

]+Var

2

]= 850000.

4.18 Soit f (·) la fonction de densité de probabilité d’une Log-normale(µ,σ2) et g (·)celle d’une Gamma(α,λ). Pour comparer les queues de ces deux distributions,il faut évaluer

limx→∞

f (x)

g (x).

En éliminant les termes qui ne dépendent pas de x, on obtient

limx→∞

x−1e−(ln(x)−µ)2/2σ2

xα−1e−x/θ= lim

x→∞e−(ln(x)−µ)2/2σ2−α ln(x)+x/θ.

Or, de l’exercice 1.4 on sait que x tend plus rapidement vers l’infini que ln(x).L’exposant tend donc vers ∞, d’où la distribution log-normale a une queueplus épaisse que la distribution gamma.

Page 351: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 341

4.19 Une fonction d’espérance de vie résiduelle linéaire en x indique une distribu-tion de Pareto telle que

e(x) =(

1

α−1

)x + λ

α−1.

À partir de e(x) = 2000+2x, on trouve que α= 1,5 et λ= 1000. En utilisant lesformules de l’annexe A pour l’espérance limitée d’une loi de Pareto, on a quele LER est

LER = E [X ]−E [X ; x]

E [X ]

= 0,30115.

4.20 a) Il s’agit d’une fonction linéaire en x, on a donc que X ∼ Pareto. En utilisantla relation de l’exercice 4.19, on trouve que α= 7/3 et λ= 16/3.

b) En utilisant la formule de l’annexe A, on trouve que E [X ;10] = 3,0215.

4.21 Pour X ∼ Gamma(α,λ), on a E [X ] = α/λ et Var[X ] = α/λ2. On trouve lesparamètres suivants pour les trois sous-intervalles : α1 = 1, λ1 = 1, α2 =25, λ2 = 5, α3 = 144 et λ3 = 12. Pour le premier sous-intervalle, on a A ∼Gamma(1,1) et

Pr[A ≤ 2] = Γ(1;2).

Pour le second sous-intervalle, on a B ∼ Gamma(25,5) et

Pr[2 < B ≤ 8] = Γ(25;40)−Γ(25;10).

Pour le troisième sous-intervalle, on a C ∼ Gamma(144,12) et

Pr[8 <C ≤ 16] = Γ(144,192)−Γ(144;96).

La densité raccordée est donc

fX (x) =

0,5e−x

Γ(1;2), 0 < x ≤ 2

0,2

Γ(25;40)−Γ(25;10)

525x25−1e−5x

Γ(25), 2 < x ≤ 8

0,3

Γ(144;192)−Γ(144;96)

12144x144−1e−12x

Γ(144), 8 < x ≤ 16.

Page 352: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

342 Solutions des exercices

4.22 On a

fX (x) =

p/10, 0 < x < 10

(1−p)(3)(1003)

(100+x)4

1

(100/110)3 , x ≥ 10

=

p/10, 0 < x < 10(3)(1103)

(100+x)4 (1−p), x ≥ 10.

Pour que la distribution soit continue au point x = 10, on doit avoir

fX (10) = p

10,

soit

3

110(1−p) = p

10.

En résolvant pour p, on trouve p = 3/14.

4.23 a) On pose X ∼ Weibull(λ1,τ1) et Y = X −1 ∼ Weibull inverse(λ2,τ2). On saitde l’annexe A que tous les moments positifs de la distribution Weibullexistent, alors que ceux de la distribution Weibull inverse n’existent quepour k < τ2. Par ce critère, on voit que la distribution Weibull Inversepossède une queue plus lourde.

D’autre part, on a

fY (x)

fX (x)= τ2λ

−τ22 x−τ2−1e−(λ2x)−τ2

τ1λτ11 xτ1−1e−(λ1x)τ1

∝ x−τ1−τ2 e−(λ2x)−τ2+(λ1x)τ1,

d’où

ln

(fY (x)

fX (x)

)∝ (λ1x)τ1 − (λ2x)−τ2 − (τ1 +τ2) ln(x).

Lorsque x →∞, le terme central tend vers 0. Comme x tend plus rapide-ment vers ∞ que ln(x), on a que

limx→∞ ln

(fY (x)

fX (x)

)= lim

x→∞(λ1x)τ1 − (λ2x)−τ2 − (τ1 +τ2) ln(x)

=∞,

Page 353: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 343

16 18 20 22 24

0.00

00.

005

0.01

00.

015

0.02

0

x

FIG. E.16: Comparaison des queues des distributions Weibull (trait mince) et Wei-bull inverse (trait épais)

d’où

limx→∞

SY (x)

SX (x)= lim

x→∞fY (x)

fX (x)=∞.

Ainsi, en comparant les fonctions de survie on arrive aussi à la conclusionque la queue de la loi Weibull inverse est plus lourde que celle de la Weibull.

b) On fixe τ1 et λ1 de manière arbitraire et on résoud numériquement pourτ2 et θ2. La figure E.16 présente le graphique des deux distributions pourτ1 = 3, λ1 = 0,1, τ2 = 4,4744 et θ2 = 0,1335.

Page 354: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

344 Solutions des exercices

4.24 On a

MY (t ) =∫ ∞

0e t y SX (y)

E [X ]d y

=(

e t y

t

)(SX (y)

E [X ]

)∣∣∣∣∞0+

∫ ∞

0

(e t y

t

)(fX (y)

E [X ]

)d y

=− 1

tE [X ]+ MX (t )

tE [X ]

= MX (t )−1

tE [X ].

Ce résultat suppose que limy→∞ e t y SX (y) = 0. En appliquant la règle de l’Hô-pital, on voit qu’il s’agit de la même limite que −t−1 limy→∞ e t y fX (y) qui doitêtre 0 sinon l’intégrale définissant MX (t ) ne convergerait pas.

4.25 a) Par définition de la fonction de survie :

S(x) =∫ ∞

x(1+2t 2)e2t d t

= (1+x +x2)e−2x , x ≥ 0.

b) Par définition du taux d’incidence :

h(x) =− d

d xlnS(x)

= d

d x(2x)− d

d xln(1+x +x2)

= 2− 1+2x

1+x +x2 .

c) On a d’abord ∫ ∞

xS(t )d t =

∫ ∞

x(1+ t + t 2)e−2t d t

= (1+x +0,5x2)e−2x

et donc

e(x) =∫ ∞

x S(x)d x

S(x)= 1+x +0,5x2

1+x +x2 .

d) On a

limx→∞h(x) = lim

x→∞

(2− 1+2x

1+x +x2

)= 2.

Page 355: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 345

e) On a

limx→∞e(x) = 1

limx→∞ h(x)

= 1

2.

f) À partir de c), on trouve

d

d xe(x) =− x +0,5x2

(1+x +x2)2 < 0,

pour x > 0, d’où e(x) est une fonction strictement décroissante. Cepen-dant, pour h(x), on a h(0) = 1, h(0,5) = 6/7 et h(∞) = 2. On voit donc quele taux d’incidence n’est pas une fonction strictement croissante.

Chapitre 5

5.1 On a∑5

i=1 xi = 6211 et∑5

i=1 x2i = 26040101. Pour trouver les estimateurs des

moments de α et β, on pose

E [X ] = E [E [X |Λ]] = E [Λ−1] = β

α−1= 6211

5

et

E [X 2] = E [E [X |Λ]] = E [Λ−2] = 2β2

(α−1)(α−2)= 26040101

5.

En résolvant, on trouve α= 3,45 et β= 3048,87.

5.2 Par définition, la fonction de vraisemblance donne la probabilité d’obtenir unéchantillon tel que celui obtenu. On doit donc avoir deux données entre 0 et2000 et quatre données entre 2000 et 5000, le tout sachant que les six donnéessont plus petites que 5000. On a alors

L(λ) = (1−e−2000λ)2(e−2000λ−e−5000λ)4

(1−e−5000λ)6.

5.3 On a∑5

i=1 xi = 5850 et∑5

i=1 x2i = 5867500. Pour trouver les estimateurs des mo-

ments de α et θ il suffit de poser égaux les deux premiers moments empiriqueset théoriques :

αθ = 5850

6

Page 356: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

346 Solutions des exercices

et

αθ2 +α2θ2 = 5867500

6.

On trouve alors α= 34,83 et θ = 27,99.

5.4 La fonction de répartition de la log-logistique étant

F (x) = (x/θ)γ

1+ (x/θ)γ,

on trouve, après avoir égalisé les quantiles théoriques et empiriques, que γ= 2et θ = 200.

5.5 La densité de la variable aléatoire sous-jacente est

fX (x) = F ′X (x) = pxp−1.

L’espérance est donc

E [X ] =∫ 1

0xpxp−1 d x

= p

p +1.

En posant E [X ] = x pour trouver un estimateur des moments de p, on obtient

p = x

1− x.

5.6 On a∑5

i=1 xi = 10000 et∑5

i=1 x2i = 30000000. On égalise les deux premiers

moments théoriques et empiriques :

eµ+σ2

2 = 10000

5

et

e2µ+2σ2 = 30000000

5.

On trouve alors µ= 7,40 et σ= 0,6368. Par conséquent,

Pr[X > 4500] = 1−Φ(

ln(4500)−7,40

0,6368

)= 1−Φ(1,5919)

= 0,056.

Page 357: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 347

5.7 On pose simplementβp

2= x = 4,2,

d’où β= 3,3511.

5.8 a) Posons λ=λτ. On a

Pr[X ≤ 500] = 1−e−λ500τ

= 0,25

et

Pr[X ≤ 1000] = 1−e−λ1000τ

= 0,50

d’où on trouve que ˆλ= 0,000108 et τ= 1,2687. Ainsi, on a λ= 0,000747.

b) On cherche π0,80 tel que

1−e−(λπ0,80)τ = 0,80.

On trouve π0,80 = (− ln0,20)1/τ/λ= 1947.

5.9 La distribution marginale de la variable X est une loi de Pareto(α,β). Ainsi,pour estimer les paramètres α et β par la méthode des quantiles, on pose

SX (450) =(

β

β+450

)α= 0,001

et

SX (50) =(

β

β+50

)α= 0,125.

Il suffit maintenant de manipuler les termes pour obtenir

ln(0,125)

ln(0,001)=

ln(

ββ+50

)ln

β+450

)ln

β+450

)0,3010

= ln

β+50

)β0,3010(β+50) =β(β+450)0,3010.

Page 358: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

348 Solutions des exercices

5.10 D’abord, le rapport d’élimination de perte avec une franchise forfaitaire est

LER = E [X ;d ]

E [X ]

alors qu’avec une franchise atteinte il est

LER = E [X ;d ]−d(1−F (d))

E [X ].

Par conséquent, on a les équations suivantes :

0,56 = E [X ;200]

E [X ]

0,79 = E [X ;500]

E [X ]

0,32 = E [X ;200]−200(1−F (200))

E [X ]

0,52 = E [X ;500]−500(1−F (500))

E [X ]

Puisque E [X ] = 200, on trouve F (200) = 0,76 et F (500) = 0,892, d’où λ≈ 0,01et τ≈ 0,48.

5.11 La fonction de répartition d’une loi U (a,b) étant

F (x) = x −a

b −a,

on a

50−a

b −a= 0,80

55−a

b −a= 0,90,

d’où on obtient a = 10 et b = 60.

5.12 Pour X ∼ Bernoulli(p), on a la fonction de vraisemblance

L(p; x1, . . . , xn) =n∏

i=1pxi (1−p)1−xi

= p∑n

i=1 xi (1−p)n−∑ni=1 xi

Page 359: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 349

et la fonction de log-vraisemblance

l (p; x1, . . . , xn) =n∑

i=1xi ln(p)+

(n −

n∑i=1

xi

)ln(1−p),

d’où

l ′(p; x1, . . . , xn) =∑n

i=1 xi

p− n −∑n

i=1 xi

1−p

= nx

p− n −nx

1−p.

On trouve donc p = X .

5.13 a) On a la fonction de log-vraisemblance

l (µ,σ2) = n ln

(1p

2πσ

)− 1

2

n∑i=1

(xi −µ)2

σ2

et les dérivées partielles

∂µl (µ,σ2) =

n∑i=1

(xi −µ)

σ2

∂σ2 l (µ,σ2) =− n

2σ2 +∑n

i=1(xi −µ)2

2σ4 .

En posant ces dérivées égales à 0 et en résolvant pour µ et σ2, on obtientles estimateurs du maximum de vraisemblance

µ= 1

n

n∑i=1

Xi = X

σ2 = 1

n

n∑i=1

(Xi − X )2 = S2.

b) À partir des calculs précédents, on trouve

∂2

∂µ2 l (µ,σ2) =− n

σ2

∂2

∂σ4 l (µ,σ2) = n

2σ4 −∑n

i=1(xi −µ)2

σ6

∂2

∂µ∂σ2 l (µ,σ2) =−∑n

i=1 xi −µσ4 .

Page 360: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

350 Solutions des exercices

Or,

E[− n

σ2

]=− n

σ2

E

[−

∑ni=1(Xi −µ)

σ4

]= 0

et

E

[n

2σ4 −∑n

i=1(Xi −µ)2

σ6

]=− n

2σ4

car E [Xi −µ] = 0 et E [(Xi −µ)2] =σ2. On obtient ainsi la matrice variance-covariance :

Σ=[σ2/n 0

0 2σ4/n

].

Or, on sait que la distribution asymptotique conjointe des estimateurs dumaximum de vraisemblance est une normale multivariée sans biais et dematrice variance-covariance Σ.

c) On rappelle queΦ(·) et φ(·) sont, dans l’ordre, les fonctions de répartitionet de densité de probabilité d’une loi N (0,1). Par conséquent,

A = ∂

∂µh(µ,σ2) =− 1

σφ

(c −µσ

)et

B = ∂

∂σ2 h(µ,σ2) =−1

2

(c −µσ3

(c −µσ

),

d’où

Var[h(µ, σ2)] = [A B

][σ2/n 0

0 2σ4/n

][AB

]=

(c −µσ

))2(

1

n+ (c −µ)2

2nσ2

).

Enfin, on sait que, asymptotiquement,

h(µ, σ2) ∼ N (h(µ,σ2),Var[h(µ, σ2)]).

Page 361: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 351

5.14 En utilisant la technique habituelle :

L(θ) = 2nθn

(n∏

i=1xi

)e−θ

∑ni=1 x2

i

l (θ) = n ln(2)+n ln(θ)+n∑

i=1ln xi −θ

n∑i=1

x2i

l ′(θ) = n

θ−

n∑i=1

x2i .

On trouve alors θ = n/∑n

i=1 x2i . En calculant la dérivée seconde de la fonction

de log-vraisemblance, on voit qu’il s’agit bien d’un maximum.

5.15 a) On a f (x) = pxp−1, d’où

L(p) = pnn∏

i=1xp−1

i

l (p) = n ln(p)+ (p −1)n∑

i=1ln(xi )

l ′(p) = n

p+

n∑i=1

ln(xi ).

On trouve alors p =−n/∑n

i=1 ln(xi ). En calculant la dérivée seconde, onvoit qu’il s’agit bien d’un maximum.

b) À partir de a), on calcule

l ′′(p; x1, . . . , xn) =− n

p2

d’où

I (p) = nE [p−2] = n

p2

et

Var[p] = 1

I (p)= p2

n.

c) On sait quep ∈ p ±1,96

√Var[p].

De a) et b), on a donc

p ∈ p ±1,96ppn

.

Page 362: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

352 Solutions des exercices

d) On a

E [X ] =∫ 1

0xpxp−1 d x

= p

p +1.

Par la propriété d’invariance, l’estimateur du maximum de vraisemblancede E [X ] est

E [X ] = p

1+ p,

où p est l’estimateur du maximum de vraisemblance de p déterminé ena).

e) On pose E [X ] = h(p) avec

h(p) = p

1+p,

d’où

h′(p) = 1

(1+p)2 .

Par la méthode delta,

Var[E [X ]

]= h′(p)2Var[p]

=(

1

1+p

)4 (p2

n

)et

Var[E [X ]

]= (1

1+ p

)4 (p2

n

)et donc

E [X ] ∈ p

1+ p±1,96

(p

(1+ p)2p

n

).

5.16 On a

L(α) =α5λ5α5∏

i=1(λ+xi )−α−1

l (α) = 5ln(α)+5α lnλ− (α+1)5∑

i=1ln(λ+xi )

l ′(α) = 5

α+5ln(λ)−

5∑i=1

ln(λ+xi ).

Page 363: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 353

On obtient alors α= 5/(∑5

i=1 ln(λ+xi )−5lnλ) = 3,8629. En calculant la dérivéeseconde de la fonction de log-vraisemblance, on vérifie qu’il s’agit bien d’unmaximum.

5.17 La probabilité d’avoir une observation inférieure à 2 est

F (2) =∫ 2

02λxe−λx2

d x = 1−e−4λ.

On a ensuite, pour un échantillon aléatoire de taille 4,

L(λ) = F (2)(1−F (2))3

= (1−e−4λ)e−12λ

l (λ) = ln(1−e−4λ)−12λ

l ′(λ) = 4(1−e−4λ)−1e−4λ−12.

On trouve alors λ= 14 ln 4

3 .

5.18 On aura reconnu la densité d’une N (0,θ). On sait que l’estimateur du maxi-mum de vraisemblance de θ est sans biais. Ainsi, MSE(θ) = Var[θ]. Or, ona

ln f (x) =−1

2ln(2πθ)− x2

2θd 2

dθ2 ln f (x) = 1

2θ2 − x2

θ3

I (θ) = nE

[1

2θ2 − X 2

θ3

]= 2n

θ2

et Var[θ] = I−1(θ). Une approximation de l’erreur quadratique moyenne estdonc

MSE(θ) = Var[θ]

= 2θ2

n= 0,20.

5.19 a) On a une distribution log-gamma de paramètres α= 2 et λ. De l’annexe A,on sait que

E [X ] =(

λ

λ−1

)2

.

Page 364: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

354 Solutions des exercices

En posant E [X ] = X , on trouve que l’estimateur des moments de λ est

λ= ±√

X

±√

X −1.

b) On a

L(λ) = λ2n ∏ni=1 ln(xi )∏n

i=1 xλ+1i

l (λ) = 2n ln(λ)+n∑

i=1ln(ln(xi ))− (λ+1)

n∑i=1

ln(xi )

l ′(λ) = 2n

λ−

n∑i=1

ln(xi ).

On trouve alors que λ= 2n/∑n

i=1 ln(xi ).

5.20 a) On a

L(λ) = (λ5)5(∏5

i=1 x4i )e−λ

∑5i=1 xi

(Γ(5))5

l (λ) = 25ln(λ)+45∑

i=1ln xi −λ

5∑i=1

xi −5lnΓ(5)

l ′(λ) = 25

λ−

5∑i=1

xi ,

d’où λ= 25/∑5

i=1 xi = 1/2.

b) On a

l ′′(λ) =−25

λ2

et donc la matrice d’information de Fisher est

I (λ) = E

[25

λ2

]= 25

(5/8)2

= 64.

Par conséquent, Var[λ] = 164 .

Page 365: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 355

5.21 Par définition de la fonction de vraisemblance :

L(α) = (Pr[X ≤ 2])2Pr[5 ≤ X ≤ 11]Pr[X ≥ 11]

=(1−

(1

3

)α)2 ((1

6

)α−

(1

12

)α)(1

12

)α.

Étant donné qu’il faudra faire appel à des méthodes numériques pour ré-soudre ce problème, on peut tout aussi bien minimiser la fonction de vrai-semblance au lieu de la fonction de log-vraisemblance.

5.22 On a

L(β) = Pr[0 ≤ X ≤ 1]Pr[X ≥ 2]

= (1−e−β)e−2β

l (β) = ln(1−e−β)−2β

l ′(β) = e−β

1−e−β−2.

On obtient β= ln(1,5).

5.23 a) Par la méthode du maximum de vraisemblance habituelle, on trouve

λ= n∑ni=1 x2

i

.

Or, Pk = FX (k) = 1−e−λk2. Par la propriété d’invariance de l’estimateur du

maximum de vraisemblance, on a donc Pk = 1−e−λk2.

b) Par la méthode delta, on a que

Var[Pk ] =(∂Pk

∂λ

)2

Var[λ]

= (k2e−λk2)2Var[λ].

Or, en laissant tomber les termes non fonction de λ,

l (λ) = n ln(λ)−λn∑

i=1x2

i + . . .

l ′(λ) = n

λ−

n∑i=1

x2i

l ′′(λ) =− n

λ2

Page 366: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

356 Solutions des exercices

d’oùE

[− n

λ2

]=− n

λ2

et

Var[λ] = λ2

n.

Par conséquent,

Var[Pk ] = k4λ2e−2λk2

n.

c) On sait que Pk ∼ N (Pk ,Var[Pk ]). Or, si X1 = X2 = 10 et X3 = 15, alors λ=3/425, p10 = 0,5063 et

Var[P10] = λ

3= 0,0405.

Ainsi, approximativement, P10 ∼ N (0,5063,0,0405), d’où Pr[P10 ≤ 0,5] ≈Φ(−0,0313) = 0,4875.

5.24 En premier lieu, on a

l (α,λ; x) = n ln(α)+αn ln(λ)− (α+1)n∑

i=1ln(λ+xi )

et

∂2

∂α2 l (α,λ; x) =− n

α2

∂2

∂λ2 l (α,λ; x) =−αn

λ2 + (α+1)n∑

i=1

(1

λ+xi

)2

∂2

∂α∂λl (α,λ; x) = n

λ−

n∑i=1

(1

λ+xi

).

Pour la suite, on aura besoin des résultats intermédiaires

E

[(1

λ+X

)2]=

∫ ∞

0

1

(λ+x)2

αλα

(λ+x)α+1 d x

= α

λ2(α+2)

E

[1

λ+X

]=

∫ ∞

0

1

λ+x

αλα

(x +λ)α+1 d x

= α

α+1

1

λ.

Page 367: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 357

Ainsi,

E

[∂2

∂α2 l (α,λ; X )

]= E

[− n

α2

]=− n

α2

E

[∂2

∂λ2 l (α,λ; X )

]= E

[−αn

λ2 + (α+1)n∑

i=1

(1

λ+Xi

)2]

=− αn

λ2(α+2)

E

[∂2

∂α∂λl (α,λ; X )

]= E

[n

λ−

n∑i=1

(1

λ+Xi

)]= n

λ(α+1)

et la matrice d’information de Fisher est

I (α,λ) =

n

α2 − n

λ(α+1)

− n

λ(α+1)

αn

λ2(α+2)

.

La matrice de variance-covariance est donc

Σ= I−1(α,λ)

=

α2(α+1)2

n

α(α+1)(α+2)λ

n

α(α+1)(α+2)λ

n

λ2(α+1)2(α+2)

.

De là, on obtient

Var[α] = α2(α+1)2

50= 0,28125

Var[λ] = λ2(α+1)2(α+2)

50α= 656250

Cov(α, λ) = α(α+1)(α+2)λ

50= 393,75.

Page 368: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

358 Solutions des exercices

5.25 On a

h(α,λ) = Pr[X > 10]

=(

λ

λ+10

)α∂h(α,λ)

∂α=

λ+10

)αln

λ+10

)∂h(α,λ)

∂λ=α

λ+10

)α−1 (10

(λ+10)2

).

Or,

h(α, λ) = 0,0816

∂h(α,λ)

∂α

∣∣∣∣(α,λ)

=−0,1023

∂h(α,λ)

∂λ

∣∣∣∣(α,λ)

= 0,0292

et donc

Var[h(α, λ)] = [−0,1023 0,0292][

24 1010 40

][−0,10230,0292

]= 0,2254.

L’intervalle de confiance est donc 0,0816± (1,44)p

0,2254. Étant donné qu’ils’agit d’un intervalle pour une probabilité, la borne inférieure ne peut êtreplus petite que 0 (et la borne supérieure ne peut être plus grande que 1).L’intervalle de confiance est donc (0,0,7653).

5.26 On sait que l’estimateur du maximum de vraisemblance de λ est λ= X −1 et ilest simple d’établir que Var[λ] =λ2/n. Ici, on a λ= 0,0187.

a) On a

h(λ) = E [X ;50]

= 1−e−50λ

λ

dh(λ)

dλ= e−50λ(50λ+1)−1

λ2 ,

d’où

Var[h(λ)] =(

e−50λ(50λ+1)−1

λ2

)2λ2

n

Page 369: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 359

et

Var[h(λ)] = (−686,57)2(0,00004388)

= 20,68.

b) On procède comme en a) avec

h(λ) =π0,95

= ln(0,05)

λdh(λ)

dλ=− ln(0,05)

λ2 .

On obtient Var[h(λ)] = 3196.

5.27 a) On a que X |A =α obéit à une loi de Bernoulli(α) et que A obéit à une loiU (0,1). On cherche

f (α|x1, x2, x3) ∝α∑3

i=1 xi (1−α)3−∑3i=1 xi (1)

=α(1−α)2.

On reconnaît ici la forme fonctionnelle d’une distribution Bêta(2,3). Onsait que, si la fonction de perte choisie est l’erreur quadratique, l’estima-teur bayesien est l’espérance de la distribution a posteriori. On a donc

α= 2

2+3= 2

5= 0,4.

b) On a

Pr[0,2 < A < 0,4|X = x] =∫ 0,4

0,2

Γ(5)

Γ(2)Γ(3)α(1−2α+α2)dα

= 0,3432.

5.28 On a que X |Θ= θ ∼ Poisson(θ) et queΘ∼ Gamma(α,λ). On a donc

f (θ|x1, . . . , xn) ∝(

e−θnθ∑n

i=1 xi∏ni=1 xi !

)(λαe−λθθα−1

Γ(α)

)= e−(λ+n)θθα+

∑ni=1 xi−1.

On reconnaît ici la forme fonctionnelle d’une distribution Gamma de pa-ramètres α∗ = α+∑n

i=1 xi et λ∗ = λ+n. On sait que, si la fonction de perte

Page 370: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

360 Solutions des exercices

choisie est l’erreur quadratique, l’estimateur bayesien est l’espérance de ladistribution a posteriori. Par conséquent

θ = α+∑ni=1 xi

n +λ .

5.29 a) On a que X |A = α obéit à une loi de Pareto(α,1) et que A obéit à unedistribution Exponentielle(3). On a

f (α|x1, . . . , xn) ∝ 3e−3α(

αn∏ni=1(1+xi )α+1

)= αne−3α∏n

i=1(1+xi )α+1

=αn(

e−3∏ni=1(1+xi )

)α=αne−λ

∗α

avec λ∗ = 3+∑ni=1 ln(1+ xi ). On reconnaît alors la forme fonctionnelle

d’une loi Gamma. On a donc, comme densité a posteriori, une loi Gammade paramètres α∗ = n +1 et λ∗.

b) On sait que, si la fonction de perte choisie est l’erreur quadratique, l’es-timateur bayesien est l’espérance de la distribution a posteriori. On adonc

α= n +1

3+∑ni=1 ln(1+xi )

= 7

3+7,27= 0,68.

5.30 a) On a que X |B =β obéit à une loi Exponentielle(β) et que B obéit à une loiGamma(2,3). On a

f (β|x1, . . . , x5) ∝β6e−β(3+∑5i=1 xi ).

Puisque∑5

i=1 xi = 47, on reconnaît ici la forme fonctionnelle d’une loiGamma(7,50). Avec une fonction de perte quadratique, l’estimateur baye-sien est l’espérance de la distribution a posteriori. On a donc

β= 7

50= 0,14.

b) Avec une fonction de perte valeur absolue„ l’estimateur bayesien est lamédiane de la distribution a posteriori. Il faut donc choisir β tel que

Pr[B ≤ β|X = x] = Γ(7;50β) = 1

2.

Page 371: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 361

Avec les informations données dans l’énoncé, on trouve

β= 6,670

50= 0,1334.

5.31 a) Soit X la variable aléatoire du nombre de fois où un étudiant reste bloquédans un devoir. On a X |Θ= θ ∼ Binomiale(3, p) etΘ∼U (0,25,0,75). On a

f (θ|x1 = 2, x2 = 2) = 2((3

2

)θ2(1−θ)2

)2∫ 0,750,25 2

((32

)θ2(1−θ)2

)2 dθ

= θ4(1−θ)2∫ 0,750,25 θ

4(1−θ)2 dθ

= 141,22θ4(1−θ)2.

Avec une fonction de perte quadratique, l’estimateur bayesien est l’espé-rance de la distribution a posteriori. Ainsi,

θ = 141,22∫ 0,75

0,25θ5(1−θ)2 dθ = 0,5668.

b) On a

Pr[0,6 <Θ< 0,7|X1 = 2, X2 = 2] = 1441,22∫ 0,7

0,6θ4(1−θ)2 d p

= 0,3055.

5.32 a) Soit X la variable aléatoire du montant d’un sinistre en millions. On aY = X |X > 1,5. Par conséquent,

Pr[Y > 29,5] = FX (29,5)−FX (1,5)

1−FX (1,5).

Or, par la propriété d’invariance de l’estimateur du maximum de vraisem-blance, on a

Pr(Y > 29,5) = 1−

λ+1,5

)α− (λ

λ+29,5

)α(

λ

λ+1,5

)α=

(λ+1,5

λ+29,5

)α= 0,0365.

Page 372: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

362 Solutions des exercices

b) On a

h(α,λ) =(λ+1,5

λ+29,5

)α,

∂h

∂α=

(λ+1,5

λ+29,5

)αln

(λ+1,5

λ+29,5

),

∂h

∂λ= 28α

(λ+1,5)α−1

(λ+29,5)α+1

et

∂h(α,λ)

∂α

∣∣∣∣(α,λ)

=−0,0238

∂h(α,λ)

∂λ

∣∣∣∣(α,λ)

= 0,0029,

d’où

Var[h(α, λ)] = [−0,0238 0,0029][

23,92 167,07167,07 1199,32

][−0,02380,0029

]= 0,00057.

5.33 Le montant payé par l’assureur est Y = min(X ,3000)−100|X > 100, d’où

fY (y) =

fX (y +100)

1−FX (100), 0 ≤ y < 2900

SX (3000)

1−FX (100), y = 2900

0, y > 2900,

=

λe−λy , 0 ≤ y < 2900

e−2900λ, y = 2900

0, y > 2900.

La fonction de vraisemblance est donc

L(λ) =n∏

i=1fY (yi )

=λ8e−λ(100+···+1500)(e−2900λ)2

=λ8e−10420λ.

Page 373: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 363

Par la méthode usuelle, on trouve λ= 8/10420. On cherche une estimationde E [X ] =λ−1. Par la propriété d’invariance de l’estimateur du maximum devraisemblance, on a

E [X ] = 1

λ= 10420

8= 1302,50.

5.34 Soit X la variable aléatoire du montant d’un sinistre et Y la variable aléatoiredu montant payé par l’assureur. On a Y = min(X ,150), d’où

fY (y) =

fX (y), y < 150

1−FX (150), y = 150

0, y > 150,

=

λe−λy , y < 150

e−150λ, y = 150

0, y > 150.

On a donc la fonction de vraisemblance

L(λ) =n∏

i=1fY (yi )

=λ5e−λ(10+···+110)(e−150λ)3

=λ5e−845λ.

Par la technique usuelle, on trouve λ= 0,0059.

5.35 On a la fonction de répartition empirique

F9(x) =

0, x ≤ 029 , 0 < x ≤ 269 , 2 < x ≤ 5

1, 5 < x ≤ 8.

Il faut maintenant trouver la valeur de λ qui minimise

Q(λ) = ∑x=2,5,8

(F (x)−F9(x))2

=(1−e−λ2 − 2

9

)2

+(1−e−λ5 − 6

9

)2

+(1−e−λ8 −1

)2.

On trouve numériquement que le minimum est atteint en λ= 0,2286.

Page 374: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

364 Solutions des exercices

Chapitre 6

6.1 La fonction de répartition théorique est

FX (x) = 1−(

λ

λ+x

)α= 1−

(1000

1000+x

)2

.

Ainsi, le nombre espéré de sinistres dans chaque classe est

E1 = 10(F (250)−F (0)) = 3,6

E2 = 10(F (500)−F (250)) = 1,9556

E3 = 10(F (1000)−F (500)) = 1,9444

E4 = 10(F (∞)−F (1000)) = 2,5.

On a les nombres de sinistres observés n1 = 3, n2 = 2, n3 = 3 et n4 = 2. La valeurde la statistique du test du khi carré est donc

Q =4∑

j=1

(n j −E j )2

E j

= (3−3,6)2

3,6+ (2−1,9556)2

1,9556+ (3−1,9444)2

1,9444+ (2−2,5)2

2,5

= 0,7740.

Soit χ23,0,10 = 6,2514 le 90e centile d’une distribution khi carré avec trois degrés

de liberté. Puisque 0,7740 < 6,2514, on ne rejette pas le modèle.

6.2 La fonction de répartition du modèle est

FX (x) = 1−(

λ

λ+x

)α= 1−

(50

50+x

)3,5

.

On a les nombres espérés de sinistres par classe suivants :

E1 = 1000(F (3)−F (0)) = 184,49

E2 = 1000(F (7,5)−F (3)) = 202,37

E3 = 1000(F (15)−F (7,5)) = 213,93

E4 = 1000(F (40)−F (15)) = 271,40

E5 = 1000(F (∞)−F (40)) = 127,80.

Page 375: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 365

La valeur de la statistique est donc

Q = (180−184,49)2

184,49+ (180−202,37)2

202,37+ (235−213,93)2

213,93

+ (255−271,40)2

271,40+ (150−127,80)2

127,80

= 9,5046.

Or, Pr[χ22 > 9,5046] = 0,0086 (où χ2

2 est une variable aléatoire avec distributionkhi carré avec deux degrés de liberté). Par conséquent, on ne rejette pas lemodèle avec un seuil de signification de 0,86 %. Des seuils proposés, seul 0,5 %est donc valide.

6.3 La fonction de répartition empirique est

F5(x) =

0, x < 0,1

0,2, 0,1 ≤ x < 0,4

0,4, 0,4 ≤ x < 0,8

0,8, 0,8 ≤ x < 0,9

1, x ≥ 0,9.

La fonction de répartition théorique est

F (x) =∫ x

0

1+2y

2d y = x

2(1+x), 0 ≤ x ≤ 1.

La statistique de Kolmogorov–Smirnov est donc

D = maxi=1,...,5

|F (xi )−F5(xi )|, |F (xi )−F5(xi−1)|

= max|F (0,1)−F5(0,1)|, |F (0,1)−F5(0)|,|F (0,4)−F5(0,4)|, |F (0,4)−F5(0,1)|,|F (0,8)−F5(0,8)|, |F (0,8)−F5(0,4)|,|F (0,9)−F5(0,9)|, |F (0,9)−F5(0,8)|

= 0,32.

La valeur critique du test de Kolmogorov–Smirnov avec un seuil de significationde 5 % est c = 1,36/

p5 = 0,6082. Puisque D < c, on ne rejette pas le modèle.

Page 376: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

366 Solutions des exercices

6.4 a) La fonction de répartition empirique est

F10(x) =

0, x < 12

10 , 1 ≤ x < 26

10 , 2 ≤ x < 38

10 , 3 ≤ x < 49

10 , 4 ≤ x < 8

1, x ≥ 8.

b) La fonction de répartition théorique est

FX (x) = 1−(

2

2+x

)2

. =

On a donc F (1) = 59 , F (2) = 3

4 , F (3) = 2125 , F (4) = 8

9 et F (8) = 2425 La distance de

Cramér–von Mises est

QCvM =10∑

i=1(F (xi )−F10(xi ))2

= 2×(

5

9− 2

10

)2

+4×(

3

4− 6

10

)2

+2×(

21

25− 8

10

)2

+(

8

9− 9

10

)2

+(

24

25−1

)2

= 0,3478.

c) On a cette fois une fonction de répartition empirique telle que F10(2) = 610 ,

F10(4) = 910 et F10(8) = 1. La valeur de la distance est donc

QC v M =(

3

4− 6

10

)2

+(

8

9− 9

10

)2

+(

24

25−1

)2

= 0,0242.

6.5 On trouve d’abord la fonction de répartition théorique :

F (x) =∫ x

0

y

2d y = x2

4, 0 ≤ x ≤ 2.

On a ensuite F4(0,5) = 1/4, F4(1) = 2/4, F4(1,25) = 3/4, et F4(1,5) = 1. Le ta-bleau E.2 présente les différences entre les fonctions de répartition. La statis-tique D4 est donc 7/16 = 0,4375.

Page 377: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 367

i |Fn(xi )−F (xi )| |Fn(xi−1)−F (xi )|1 3/16 1/162 1/4 03 0,359375 0,1093754 7/16 3/16

TAB. E.2: Différences entre les fonctions de répartition théorique et empirique pourles données de l’exercice 6.5

xi |Fn(xi )−F (xi )| |Fn(xi−1)−F (xi )|1 0,1329 0,01004 0,1257 0,01716 0,0686 0,07437 0,0814 0,06148 0,0743 0,06869 0,0471 0,0957

9,5 0,0975 0,0454

TAB. E.3: Différences entre les fonctions de répartition théorique et empirique pourles données de l’exercice 6.6

6.6 On trouve d’abord la fonction de répartition théorique :

F (x) =∫ x

0

y

50d y = x2

100, 0 ≤ x ≤ 10.

On a ensuite F7(1) = 1/7, F7(4) = 2/7, F7(6) = 3/7, F7(7) = 4/7, F7(8) = 5/7,F7(9) = 6/7 et F7(9,5) = 1. Le tableau E.3 présente les différences entre lesfonctions de répartition. La statistique de Kolmogorov–Smirnov vaut doncD = 0,1329. Puisque la valeur critique du test est c = 1,36/

p7 = 0,5140 > D , on

ne rejette pas le modèle.

6.7 On a

FX (x) = 1−(

λ

λ+x

)α= 1− 8

8+x.

Page 378: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

368 Solutions des exercices

On trouve ensuite que

E1 = (20)(F (5)−F (0))

= 7,6923

E2 = (20)(F (20)−F (5))

= 6,5934

E3 = (20)(F (∞)−F (20))

= 5,7143.

Ainsi, la valeur de la statistique est

Q = (10−7,6923)2

7,6923+ (5−6,5934)2

6,5934+ (5−5,7143)2

5,7143

= 1,1667.

6.8 On rappelle que FX (x;α,λ) = Γ(α;λx), où Γ(α; x) est la fonction de répartitionde la distribution Gamma(α,1). Le calcul de la statistique de Kolmogorov–Smirnov requiert donc les valeurs de Γ(α;1,25), Γ(α;5,5) et Γ(α;7) pour α= 3et α= 3,5. Or, avec la relation donnée dans l’énoncé, on obtient

Γ(3;1,25) = 1−e−1,25(1+1,25+ (1,25)2

2

)= 0,1315

Γ(3;5,5) = 1−e5,5(1+5,5+ (5,5)2

2

)= 0,9116

Γ(3;7) = 1−e−7(1+7+ (7)2

2

)= 0,9704.

Le tableau E.4 présente les calculs pour les deux distributions postulées. Pour laGamma(3,0,01), la statistique de Kolmogorov–Smirnov est D = 0,6616 et pourla Gamma(3,5,0,01), la statistique est D = 0,6114. On choisit donc la deuxièmedistribution pour la modélisation les données.

6.9 L’hypothèse de taux d’échec constant correspond à une distribution exponen-tielle de paramètre λ= 0,01. On a donc FX (x) = 1−e−x/100 et

E1 = 50(F (25)−F (0)) = 11,0600

E2 = 50(F (40)−F (25)) = 5,4240

E3 = 50(F (60)−F (40)) = 6,0754

E4 = 50(F (80)−F (60)) = 4,9741

E5 = 50(F (∞)−F (80)) = 22,4664.

Page 379: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 369

|Fn(xi )−F (xi )| |Fn(xi−1)−F (xi )|xi α= 3 α= 3,5 α= 3 α= 3,5

125 0,1185 0,1771 0,1315 0,0729550 0,1616 0,1114 0,6616 0,6114700 0,0296 0,0512 0,2204 0,1988

TAB. E.4: Différences entre les fonctions de répartition théorique et empirique pourles données de l’exercice 6.8

Étant donné que E4 < 5, on regroupe (arbitrairement) E3 et E4 pour obtenirE3,4 = 11,0495. On obtient ensuite

Q = (10−11,06)2

11,06+ (5−5,4240)2

5,4240

+ (15−11,0495)2

11,0495+ (20−22,4664)2

22,4664

= 1,8179.

Puisque Pr[χ23 > 1,8179] = 0,61 > 0.05, on ne rejette pas l’hypothèse.

6.10 a) On les valeurs suivantes de la fonction de répartition empirique : F50(25) =0,20, F50(50) = 0,44, F50(100) = 0,68 et F50(200) = 0,90. Pour la distributionde Pareto, on a F (25) = 0,4557, F (50) = 0,6464, F (100) = 0,8075 et F (200) =0,9106. La distance de Cramér–von Mises est alors

QCvM = (0,4557−0,2)2 + (0,6464−0,44)2

+ (0,8075−0,68)2 + (0,9106−0,9)2

= 0,1244.

Pour la distribution de Weibull, on a F (25) = 0,2212, F (50) = 0,3935, F (100) =0,6321 et F (200) = 0,8647. La distance est alors

QCvM = (0,2212−0,2)2 + (0,3935−0,44)2

+ (0,6321−0,68)2 + (0,8647−0,9)2

= 0,0062.

Comme 0,0062 < 0,1244, la distribution de Weibull est un meilleur modèle.

Page 380: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

370 Solutions des exercices

b) Pour la distribution de Pareto, on a

E1 = 50(F (25)−F (0)) = 22,7834

E2 = 50(F (50)−F (25)) = 9,5389

E3 = 50(F (100)−F (50)) = 8,0552

E4 = 50(F (200)−F (100)) = 5,1504

E5 = 50(F (∞)−F (200)) = 4,4721.

Étant donné que E5 < 5, on regroupe E4 et E5 pour obtenir E4,5 = 9,6225.On obtient alors

Q = (10−22,7834)2

22,7834+ (12−9,5389)2

9,5389

+ (12−8,0552)2

8,0552+ (16−9,6225)2

9,6225

= 13,9662.

Or, χ23,0,05 = 7,815 < Q. On rejette donc le modèle avec distribution de

Pareto.

c) Comme 0,10 < 0,1244, le choix de la distribution log-normale serait meilleur.

6.11 a) On a

H0 : numéros de départ équiprobables

H1 : numéros de départ non équiprobables.

b) Pour un total de 144 courses et une probabilité uniforme de victoire de18 , le nombre de victoires espéré pour chaque numéro est 144/8 = 18.Les résultats cumulés observés et espérés sont présentés dans le tableausuivant :

Numéro 1 2 3 4 5 6 7 8

Gains observés 29 48 66 91 108 118 133 144Gains théoriques 18 36 54 72 90 108 126 144

Écart absolu 11 12 12 19 18 10 7 0

La plus grande différence est observée pour le numéro 4. On a donc D =19/144 = 0,132. La valeur critique du test de Kolmogorov–Smirnov pourune taille d’échantillon n = 144 est 1,36/12 = 0,1133 pour un seuil α= 0,05et 1,63/12 = 0,1358 pour un seuil α= 0,01. On rejette donc l’hypothèse H0

à un niveau de confiance de 95 %, mais pas à un niveau de confiance de99 %.

Page 381: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 371

6.12 On a, dans l’ordre,

−219,1−(

3

2

)ln(100) =−226,01

−219,2−(

3

2

)ln(100) =−226,11

−221,2−(

2

2

)ln(100) =−225,81

−221,4−(

2

2

)ln(100) =−226,01

−224,4−(

1

2

)ln(100) =−226,70.

Le meilleur modèle est donc la distribution de Pareto.

Chapitre 7

7.1 a) On trouve d’abord l’estimateur du maximum de vraisemblance du para-mètre θ. On a pk = Pr[N = k] = (m

k

)θk (1−θ)n−k , k = 0, . . . ,m et donc

L(θ) =m∏

k=0(pk )nk

l (θ) =m∑

k=0nk ln pk

=m∑

k=0nk

(ln

(m

k

)+k ln(θ)+ (m −k) ln(1−θ)

)

l ′(θ) =m∑

k=0nk

(k

θ− m −k

1−θ)

.

En résolvant l’équation l ′(θ) = 0, on trouve

θ = 1

m

∑mk=0 kNk∑mk=0 Nk

= N

m.

Page 382: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

372 Solutions des exercices

Par conséquent,

E [θ] = E

[N

m

]= E [N ]

m

= mθ

m= θ.

b) On a

Var[θ] = Var

[N

m

]= Var[N ]

nm2

= mθ(1−θ)

nm2

= θ(1−θ)

nm.

c) De la partie a), on a

d 2

dθ2 ln pk =− k

θ2 − m −k

(1−θ)2

d’où

I (θ) = E [−nd 2

dθ2 ln pN ]

= n

θ2 E [N ]+ n(m −k)

(1−θ)2 E [m −N ]

= nm

θ+ mn(1−θ)

(1−θ)2

= nm

θ(1−θ)

et donc

Var[θ] = I−1(θ)

= θ(1−θ)

nm.

Page 383: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 373

d) Un intervalle de confiance de niveau 1−α pour θ est

θ± zα/2

√Var[θ]

soit

θ± zα/2

√θ(1−θ)

mn.

Or, comme le paramètre θ est inconnu, on utilise en pratique l’intervalleapproximatif

θ± zα/2

√θ(1− θ)

mn.

7.2 a) On a Pr[N = k] = λk e−λ/k !, k = 0,1, . . . , et donc les fonctions de vraisem-blance

L(λ) =∞∏

k=0

(λk e−λ

k !

)nk

et de log-vraisemblance

l (λ) =∞∑

k=0nk (k lnλ−λ− lnk !).

Par les techniques habituelles, on trouve

λ= N =∑∞

k=0 knk∑∞k=0 nk

= 0,1001

puis E [λ] =λ et Var[λ] = Var[N ] =λ/n. On a donc λ∼ N (λ,λ/n). Par consé-quent, un intervalle de confiance approximatif à 95 % pour le paramètre λest

λ±1,96√

Var[λ],

avec Var[λ] = λ/n. L’intervalle de confiance est donc

0,1001±1,96

√0,1001

10000.

Page 384: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

374 Solutions des exercices

b) Avec la paramétrisation donnée dans l’énoncé, E [N ] =β et Var[N ] =β(β+1).De plus,

L(β) =∞∏

k=0

(βk

(β+1)k+1

)nk

l (β) =∞∑

k=0nk (k lnβ− (k +1)ln(β+1))

et donc

β= N =∑∞

k=0 knk∑∞k=0 nk

= 0,1001.

On trouve ensuite que E [β] = 0,1001 et que Var[β] = β(β+1)/n, d’où Var[β] =0,1001(1,1001)/10000. L’intervalle de confiance est donc

0,1001±1,96

√0,1001(1,1001)

10000.

c) En posant θ = (β+1)−1 dans les formules de l’annexe A, on trouve E [N ] = rβet Var[N ] = rβ(β+1). Les estimateurs des moments de r et β sont donc lessolutions des équations

rβ=∑∞

k=0 knk∑∞k=0 nk

= 0,1001

et

rβ(1+β) =∑∞

k=0 k2nk∑∞k=0 nk

−(∑∞

k=0 knk∑∞k=0 nk

)2

= 0,10028

d’où on trouve r = 55,67 et β= 0,0018.

d) On peut utiliser la fonction fitdistr du package MASS dans sa forme laplus simple pour trouver les estimateurs du maximum de vraisemblance der et µ= rβ :

> x <- c(rep(0, 9048), rep(1, 905), rep(2, 45), rep(3, 2))

> fitdistr(x, "negative binomial")

size mu

5.273162e+01 1.001000e-01

(3.797344e+02) (3.166543e-03)

Page 385: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 375

7.3 a) De l’exercice 7.2, on sait que l’estimateur du maximum de vraisemblancedu paramètre d’une distribution de Poisson est la moyenne échantillonale.Pour la variable aléatoire N1, on a λ1 = x = 0,109. Pour la variable aléatoireN2, on a λ2 = x = 0,057.

b) On sait que la distribution de la somme de n variables aléatoires indépen-dantes distribuées selon des lois de Poisson de paramètre λi , i = 1, . . . ,n estune Poisson de paramètre λ=∑n

i=1λi . On obtient donc N ∼ Poisson(λ1 +λ2 = 0,166).

7.4 a) De l’exercice 7.1, on a

θ = n

7=

∑7k=0 knk

7n= 0,0237.

b) Comme à l’exercice 7.2 c), on a

rβ=∑∞

k=0 knk∑∞k=0 nk

= 0,166

et

rβ(1+β) =∑∞

k=0 k2nk∑∞k=0 nk

−(∑∞

k=0 knk∑∞k=0 nk

)2

= 0,2244

On trouve alors r = 0,4715 et β= 0,3521.

c) On utilise la fonction fitdistr du package MASS pour trouver les estima-teurs du maximum de vraisemblance de r et µ= rβ :

> x <- c(rep(0, 861), rep(1, 121), rep(2, 13), rep(3, 3), 4, 6)

> fitdistr(x, "negative binomial")

size mu

0.65606189 0.16600239

(0.21012471) (0.01442188)

7.5 On a

Pr[N = k] =∫ ∞

0Pr[N = k|Λ=λ] fΛ(λ)dλ

= βr

Γ(r )k !

∫ ∞

0λr+k−1e−λ(β+1) dλ.

Page 386: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

376 Solutions des exercices

Or, en reconnaissant sous l’intégrale la forme fonctionnelle d’une distributionGamma(r +k,β+1), on obtient

Pr[N = k] = Γ(r +k)βr

Γ(r )k !(β+1)r+k

= Γ(r +k)

Γ(r )Γ(k −1)

β+1

)r (1

β+1

)k

= Γ(r +k)

Γ(r )Γ(k −1)θr (1−θ)k ,

avec θ =β(β+1)−1, soit la fonction de masse de probabilité d’une distributionbinomiale négative de paramètres r et θ.

7.6 Sans la franchise, l’espérance de la fréquence serait E [N ] = r (1−θ)/θ = 15. Deplus, on a

SX (20) = e−(0,01)(20) = 0,8187.

Cela signifie qu’environ 82 % des sinistres seront d’un montant supérieurà la franchise, c’est-à-dire qu’environ 82 % des sinistres vont produire uneréclamation. On a donc E [N∗] = (0,8187)(15) = 12,28.

7.7 Tout d’abord, il est clair distributions continues normale et gamma ne sont pasappropriées pour modéliser la fréquence de sinistres.

Pour choisir parmi les autres distributions possibles, on peut comparer lamoyenne et la variance échantillonales. On a µ = 2 et σ2 = 1,496. Commeµ> σ2, la loi binomiale est le meilleur choix.

La figure E.17 montre le graphique de kpk /pk−1 = knk /nk−1 en fonction de kpour k = 1, . . . ,6. La pente est clairement négative. Ceci indique donc que lemembre de la famille (a,b,0) avec a < 0, soit la binomiale, est le meilleur choix.

7.8 On regroupe les trois dernières classes pour obtenir une fréquence significativepour le calcul de la statistique. Si N ∼ Poisson(0,6), on a

E0 = 365Pr[N = 0] = 200,32

E1 = 365Pr[N = 1] = 120,19

E2 = 365Pr[N = 2] = 36,06

E3+ = 365Pr[N ≥ 3]

= 365−E0 −E1 −E2 = 8,43.

Page 387: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Solutions des exercices 377

1 2 3 4 5 6

1.0

1.5

2.0

2.5

k

knk/

n k−1

FIG. E.17: Graphique de knk /nk−1 en fonction de k pour les données del’exercice 7.7

On a les nombres de sinistres observés n0 = 209, n1 = 111, n2 = 33 et n3+ = 12.La valeur de la statistique de Pearson est donc

Q =3∑

j=0

(n j −E j )2

E j

= (209−209.32)2

209,32+ (111−120,19)2

120,19

+ (33−36,06)2

36,06+ (12−8,43)2

8,43

= 2,85.

Page 388: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez
Page 389: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Bibliographie

Akaike, H. 1974, «A new look at the statistical model identification», IEEE Transac-tions on Automatic Control, vol. 19, no 6, p. 716–723.

Béguin, L.-P. 1990, Lexique général des assurances : lexique anglais-français etfrançais-anglais, Cahiers de l’Office de langue française, Publications du Québec,ISBN 2-55114107-9.

Charbonnier, J. 2004, Dictionnaire de la gestion des risques et des assurances, LaMaison Du Dictionnaire, Paris, ISBN 978-2-85608178-5.

Cossette, H., V. Goulet, M. Jacques et M. Pigeon. 2009, Modélisation des distributionsde sinistres : Exercices et solutions, Document libre publié sous contrat CreativeCommons, ISBN 978-2-9811416-1-3.

Dutang, C., V. Goulet et M. Pigeon. 2008, «actuar: An R package for actuarial sci-ence», Journal of Statistical Software, vol. 25, no 7. URL http://www.jstatsoft.

org/v25/i07.

Goulet, V. 2012, Introduction à la programmation en R, 3e éd., Document librepublié sous contrat Creative Commons, ISBN 978-2-9811416-2-0. URL http:

//cran.r-project.org/other-docs.html.

Goulet, V. 2013, ACT 2002 Méthodes numériques en actuariat, Partie III : Analysenumérique, École d’actuariat, Université Laval. URL http://libre.act.ulaval.

ca/cours/act_2002.

Hogg, R. V., A. T. Craig et J. W. McKean. 2005, Introduction to Mathematical Statistics,6e éd., Prentice Hall, Upper Saddle River, NJ, ISBN 0-13008507-3.

Hogg, R. V. et S. A. Klugman. 1984, Loss Distributions, Wiley, New York, ISBN 0-4718792-9-0.

Klugman, S. A., H. H. Panjer et G. Willmot. 2004, Loss Models: From Data to Deci-sions, 2e éd., Wiley, New York, ISBN 0-4712157-7-5.

379

Page 390: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

380 Bibliographie

Klugman, S. A., H. H. Panjer et G. Willmot. 2008, Loss Models: From Data to Deci-sions, 3e éd., Wiley, New York, ISBN 978-0-470-18781-4.

Klugman, S. A., H. H. Panjer et G. Willmot. 2012a, Loss Models: From Data toDecisions, 4e éd., Wiley, New York, ISBN 978-1-118-31532-3.

Klugman, S. A., H. H. Panjer et G. Willmot. 2012b, Solutions Manual to AccompanyLoss Models: From Data to Decisions, 4e éd., Wiley, New York, ISBN 978-1-118-31531-6.

R Development Core Team. 2013, R: A Language and Environment for StatisticalComputing, R Foundation for Statistical Computing, Vienna, Austria. URL http:

//www.r-project.org.

Silverman, B. W. 1986, Density Estimation for Statistics and Data Analysis, Chapman& Hall, London, ISBN 0-41224620-1.

Therneau, T. 2013, survival : A Package for Survival Analysis in S. URL http://cran.

r-project.org/package=survival, R package version 2.37-4.

Venables, W. N. et B. D. Ripley. 2002, Modern Applied Statistics with S, 4e éd., Springer,New York, ISBN 0-38795457-0.

Wheeler, B. 2013, SuppDists : Supplementary Distributions. URL http://cran.

r-project.org/package=SuppDists, R package version 1.1-9.

Page 391: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez
Page 392: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez

Ce document a été produit avec le système de mise en page LATEX. Le texte principal est enAdobe Utopia 11 points, le code informatique en Bera Mono (un clone de Bitstream Vera)et les titres en Adobe Myriad Pro. Les graphiques ont été réalisés avec R.

Page 393: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez
Page 394: Modélisation des distributions de sinistres avec Rlibre.act.ulaval.ca/fileadmin/Portail_libre/ACT-2005/Notes de cours... · Partage à l’identique — Si vous modifiez, transformez