Upload
tranthuy
View
230
Download
0
Embed Size (px)
Citation preview
Mémoire pour l’obtention du titre d’actuaire
Modélisations des rachats
dans les contrats d’épargne
Naoufal RAKAH
PROMOTION 2012
Directeur des études CEA : Olivier LOPEZ
Directeur de mémoire Allianz : Aliou SOW
2
Remerciements
Je tiens à remercier l’équipe du service études actuarielles de la direction Etudes, Pilotage et
Réassurance du groupe Allianz et en particulier Aliou SOW et Dominique ABGRALL pour les
nombreux échanges avisés.
Je remercie également Jean Paul ANGIBAUD et Alain HUA pour m’avoir communiqué des
données utiles pour ce mémoire.
Un grand merci également aux corps professoral du CEA et en particulier à Olivier LOPEZ
pour ses remarques concernant ce mémoire.
Toute ma gratitude s’adresse à ma femme pour m’avoir soutenu dans ce projet ainsi qu’à
mes deux enfants Maelys et Constantin.
3
Sommaire
Introduction ............................................................................................................................................. 5
1) Définition de l’assurance vie ........................................................................................................... 6
1.1) Présentation générale .................................................................................................................. 6
1.2) Fiscalité ......................................................................................................................................... 9
1.3) Clause bénéficiaire ....................................................................................................................... 9
1.4) Les différents mouvements de la vie du contrat.......................................................................... 9
1.5) Rachat structurel / rachat conjoncturel ..................................................................................... 10
2) Calcul des lois de rachats avec la méthodologie Allianz ................................................................ 11
2.1) Présentation générale ................................................................................................................ 11
2.2) Estimation par Kaplan Meier ...................................................................................................... 13
3) Présentation des données de l’étude ............................................................................................ 17
3.1) Introduction des variables sélectionnées................................................................................... 17
3.2) Statistiques élémentaires sur les variables ................................................................................ 20
4) Modélisation logistique de la probabilité de rachat ..................................................................... 31
4.1) Introduction du modèle ............................................................................................................. 31
4.2) Application du modèle ............................................................................................................... 37
4.2.1) Sélection des variables ........................................................................................................ 37
4.2.2) Résultats de la régression.................................................................................................... 42
5) Modélisation des montants rachetés par un GLM ........................................................................ 52
5.1) Introduction du modèle ............................................................................................................. 52
5.2) Analyse de la distribution des montants de retraits .................................................................. 54
5.3) Résultats ..................................................................................................................................... 56
6) Modélisation des taux de rachats par la théorie de la crédibilité ................................................. 68
6.1) Introduction ................................................................................................................................ 68
6.2) Le modèle de Bühlmann ............................................................................................................. 68
6.3) Le modèle de Bühlmann-Straub ................................................................................................. 70
6.4) Application aux rachats .............................................................................................................. 72
7) Corrélations entre indicateurs financiers et taux de rachats ........................................................ 74
7.1) Recommandations de l’Autorité de Contrôle Prudentiel et de Résolution. ............................ 74
7.2) Liste des produits et indicateurs financiers utilisés .................................................................. 77
7.3) Résultats ..................................................................................................................................... 78
Conclusion ............................................................................................................................................. 83
Bibliographie .......................................................................................................................................... 84
4
Mots clés : rachats, estimateur Kaplan Meier, régression logistique, GLM, théorie de la
crédibilité, modèle de Bühlmann et dérivés
5
Introduction
L’option de rachat est une garantie essentielle qui est très utilisée par les assurés dans leurs
contrats d’épargne. Cette faculté a contribué en partie à l’envol de l’assurance vie en offrant
une souplesse et une liquidité aux contrats.
L’assureur porte donc une attention particulière pour ce risque car il peut conduire à la
faillite de la compagnie si les rachats sont massifs. Au-delà de ce risque extrême, il entraine
également des problématiques de gestion actif/ passif.
Cette option est au cœur des nouvelles réglementations ; en effet les référentiels IFRS 4
phase 2 (International Financial Reporting Standards), Solvabilité 2 et MCEV (Market
Consistent Embedded Value) intègrent les rachats dans le calcul du coût des options et
garanties afin d’estimer au plus juste dans le bilan ou le compte de résultat la provision
« Best Estimate ». De plus avec Solvabilité 2, le calcul du SCR de base s’effectue en intégrant
le calcul du SCR par risque, notamment celui du rachat.
Ce mémoire a pour objectif de comprendre les mécanismes incitant les assurés à retirer
partiellement ou totalement les sommes investies sur leurs contrats d’épargne.
Dans un premier temps, les principes de base de l’assurance vie seront abordés en
définissant le vocabulaire utilisé, en présentant les différentes options possibles et en
introduisant la notion de rachats dits structurels et de rachats dits conjoncturels.
Dans un deuxième temps, la méthodologie utilisée au sein d’Allianz sera détaillée pour le
calcul par ancienneté des lois de rachats qui est réalisé annuellement.
Ensuite le modèle de régression logistique sera utilisé d’une part pour estimer une
probabilité de rachat au niveau du contrat sur les paramètres dits structurels. D’autre part ce
modèle servira à définir une classification optimale des modalités de variables. Ces variables
auront été sélectionnées au préalable par différents tests statistiques afin de juger de leurs
implications dans le déclenchement du rachat.
Un modèle GLM sera implémenté pour étudier le montant racheté sur les classifications
crées par la méthode logistique.
Nous allons ensuite appliquer la théorie de la crédibilité habituellement utilisée en assurance
non vie pour estimer les taux de rachats futurs à partir des taux historiques. Ce modèle sera
utilisé sur une classification définie par la régression logistique.
Dans une dernière partie, après avoir défini les recommandations de l’ACPR concernant les
rachats, nous analyserons l’existence possible de corrélations significatives entres les
principaux indices financiers et les taux de rachats, à partir des données observées sur les
produits d’épargne Allianz.
6
1) Définition de l’assurance vie
1.1) Présentation générale
Qu’est-ce que l’assurance vie ? Le code des assurances au travers de l’article L310-1 nous précise qu’il s’agit d’une assurance
dont l’exécution dépend de la durée de vie humaine.
Nous distinguons donc :
• Assurance en cas de vie dont l’objectif pour l’assuré est de se constituer à terme une rente ou un capital servi uniquement en cas de vie. Les assureurs insèrent souvent une contre assurance (en cas de décès le montant de l’épargne acquise est reversé à
un bénéficiaire désigné). Les différents contrats associés sont :
- Les contrats à capital différé : l’assureur s’engage à verser un capital au terme du contrat, moyennant le paiement de primes, si l’assuré est vivant (sauf en cas de contre assurance).
- Les contrats à rente différée : l’assureur s’engage à verser au terme du contrat, moyennant le paiement de primes, si l’assuré est vivant (sauf en cas de contre assurance) une rente qui peut être viagère ou temporaire.
- Les contrats à rente immédiate : les modalités de versement sont les mêmes que précédemment, cependant, dans ce cas, la rente n’est pas différé dans le temps.
Une présentation moderne de ces contrats s’effectue en fonction des supports sur
lesquels est investi le montant de l’épargne : les contrats en euros et en unité de
compte que nous définirons par la suite.
• Assurance en cas de décès dont l’objectif pour un assuré est de protéger ses proches en leur assurant une rente ou un capital en cas de décès. Les primes versées sont dites à « fonds perdu ».
• Assurance mixte qui comporte une couverture des deux « risques » en cas de vie et en cas de décès.
Par la suite lorsque nous évoquerons l’assurance vie, il s’agira de l’assurance en cas de vie
« au sens épargne ».
Définissons les principes de base de l’assurance vie (qui est souvent considérée comme le
placement préféré des français) ainsi que le vocabulaire utilisé. Les différentes options
possibles pour l’assuré seront présentées et nous donnerons la définition des rachats dits
structurels et des rachats dits conjoncturels.
7
L’assurance vie n’est pas un placement comme les autres. Et nombre d’épargnants en
détiennent – ou s’apprêtent à en souscrire – une, sans forcément connaitre toutes ses
subtilités.
Il s’agit d’un placement financier qui est doté d’avantages en matière de transmission du
capital et d’une fiscalité particulièrement attrayante.
Un contrat d’assurance vie met en présence plusieurs intervenants.
L’assureur : c’est lui qui porte tous les engagements pris lors de la souscription (valorisation
du capital et sa restitution, principalement).
Le distributeur : c’est le vendeur du contrat.
Le souscripteur : c’est celui qui ouvre le contrat et effectue des versements.
L’assuré : c’est la personne (le souscripteur en général) sur la tête de laquelle repose le
contrat. Il recevra le capital au terme du contrat, ou son décès déclenchera le paiement aux
bénéficiaires désignés.
Le bénéficiaire : c’est la ou les personnes qui recevront le capital au décès de l’assuré.
La durée d’un contrat d’assurance vie peut être viagère ou pour une durée fixe (8 ans par exemple). L’investissement se fait par des versements, qui peuvent être libres ou réguliers. Dans ce dernier cas, chaque mois, par exemple, une somme déterminée à l’avance est investie dans le contrat. Chaque contrat définit le montant minimal des sommes à verser. Il y a deux principaux contrats : monosupport et multisupports. Un contrat monosupport ne propose d’investir que dans un seul fonds, presque toujours un
fonds en euros garanti. Quant au contrat multisupports, il offre plusieurs types
d’investissements – un ou plusieurs fonds en euros et des unités de compte, c'est-à-dire des
fonds communs de placement (FCP) ou des sicav investis sur les marchés boursiers – et
permet à l’assuré de répartir son épargne sur des placements plus ou moins risqués, puis de
procéder à des arbitrages, en faisant évoluer sa répartition au fil du temps. Un contrat
multisupports offre donc plus de disponibilité d’investissement. La grande majorité des
contrats actuellement commercialisés sont des multisupports.
Une unité de compte est un compartiment du contrat regroupant des parts de fonds d’investissement autres qu’un fonds en euros. L’article R 131-1 du code des assurances définit les supports qui peuvent être retenus (immobiliers ou mobiliers comme les sicav ou FCP). L’assureur s’engage sur le nombre de parts, pas sur leur valeur. La valeur de l’épargne investie dans ces fonds n’est pas garantie : il s’agit donc de compartiments à risque.
8
Le fonds en euros est le compartiment principal de l’assurance vie, car il fait l’objet d’une
garantie permanente de revalorisation, et sa valeur ne peut jamais baisser. En revanche, les
performances des fonds en euros s’étiolent depuis plusieurs années. Ils n’ont apporté, en
moyenne, que 2,8% en 20131. Ils sont investis en obligations d’états ou d’entreprises, à
hauteur de 80% de leurs actifs. Le reste est placé, de façon diversifiée, en actions, immobilier
et placements monétaires. Même si leurs performances sont inférieures à celle du passé, les
fonds en euros restent les plus performants des placements sans risque.
Le fonds euros est souvent assorti d’un taux minimum garanti (TMG) ou un taux minimum
garanti annuel (TMGA), figurant dans les conditions générales du contrat, qui constitue un
engagement de revalorisation donné par l’assureur sur son fonds en euros. Il garantit que le
capital progressera, au minimum, à hauteur de ce taux pendant la durée prévue. La loi
plafonne ces garanties.
Ces TMG ne préfigurent pas du rendement définitif du contrat mais ils sont importants dans
le contexte actuel de taux bas car ils offrent un taux de rendement minimum à l’assuré.
On trouve également la participation aux bénéfices qui est le rendement distribué chaque année au titre du fonds en euros. Le rendement est, en fait, composé de deux ingrédients : le taux minimum garanti et la participation aux bénéfices, qui vient le compléter. Ce taux de participation aux bénéfices ne peut pas être inférieur à 85% des gains engrangés par l’assureur. L’assurance vie comporte des frais, prélevés sur plusieurs postes.
�Sur les versements : les frais vont de 0 à 5%.
�Pour la gestion : chaque année, l’assureur prélève de 0 à plus de 1% sur le capital
constitué. En apparence faibles, ces frais sont, en fait, les plus lourds, car ponctionnés
pendant toute la vie du contrat, sur un capital qui ne cesse d’augmenter.
�Sur les arbitrages : lors de chaque mouvement, l’assureur prélève de 0 à 1% des sommes
transférées. La plupart des contrats en accordent un gratuitement chaque année ; il n’y a pas
de frais d’arbitrage sur Internet.
�Sur les unités de compte : ces frais sont ponctionnés à l’intérieur des supports en unités
de comptes et minorent donc la performance du fonds.
�Sur les rentes : s’il y a transformation du capital en rente viagère, l’assureur prélève
jusqu’à 3% des sommes sur les arrérages.
1 Eric Leroux & Frédérique Schmidiger : « Le Particulier, juillet-août 2014 »
9
�Sur les sorties prématurées : ces pénalités sont devenues très rares. Elles sanctionnent les
sorties d’argent demandé durant les 5 ou 10 premières années du contrat et peuvent
atteindre 5% du capital.
�Sur les adhésions : dans les contrats associatifs, ces frais (de 5 à 30€) servent à payer une
adhésion à l’association. Ils sont prélevés à l’ouverture.
Tous les frais figurent sur la première page de la notice d’information fournie par l’assureur.
1.2) Fiscalité
La fiscalité d’un contrat d’assurance vie est avantageuse après 8 ans ; le retrait chaque année jusqu’à 4 600€ (9 200€ pour un couple marié) de gains est non imposable (mais les prélèvements sociaux de 15,5% sont dus). S’il est dépassé, l’excédent est soumis à un prélèvement forfaitaire de 7,5%. Il s’y ajoute des avantages en cas de décès. Pour les sommes investies avant 70 ans, chaque
bénéficiaire désigné peut recevoir jusqu’à 152 500€ sans être redevable de droits. Si ce
montant est dépassé, l’excédent est taxé à 20% jusqu’à 700 000€ par bénéficiaire, puis à
31,25% au-delà. La règle est un peu moins favorable pour les versements effectués après 70
ans, mais des avantages demeurent : abattement sur les 30 500 premiers euros de primes
versées, et exonération pour l’ensemble des intérêts acquis. La part de prime dépassant
30 500€ est soumise aux droits de succession ordinaires.
1.3) Clause bénéficiaire
La clause bénéficiaire est une clause du contrat dans laquelle il y a désignation de la ou les personnes qui percevront les capitaux de contrat en cas de décès. La simple acceptation par le bénéficiaire n’a aucun effet sur le contrat. En revanche, si le souscripteur valide cette acceptation, il ne lui sera plus possible, sans l’accord du bénéficiaire acceptant : �de changer de bénéficiaire ;
�d’effectuer des arbitrages (sauf vers le fonds en euros) ;
�de donner le contrat en garantie (nantissement).
1.4) Les différents mouvements de la vie du contrat
Les différents mouvements pouvant impacter les contrats sont les suivants:
�Arbitrage : c’est l’action de changer de compartiment financier, par exemple en vendant
un fonds investi en actions françaises pour investir sur un autre fonds investi en actions
internationales. De plus en plus de contrats proposent de les effectuer automatiquement,
lorsqu’un support a connu une augmentation ou une baisse, ou pour revenir régulièrement à
la répartition choisie à l’origine.
10
�Le retrait (ou rachat) total : c’est la récupération de tout le montant investi en une seule
fois, et le contrat est clos.
�Le retrait (ou rachat) partiel : c’est la récupération par l’assuré d’une partie du montant
investi et le solde continue à fructifier normalement.
�L’avance : c’est un prêt que consent l’assureur sur l’épargne constituée par l’assuré. Cette
somme ne supporte pas l’impôt et n’est pas soumise aux frais sur versement lors de son
remboursement. En revanche, elle génère des frais spécifiques.
�Les versements : ce sont des montants qui sont investis durant toute la vie du contrat ; ils
sont en général soumis à des frais. Ces versements peuvent être programmés ou libres.
1.5) Rachat structurel / rachat conjoncturel
Donnons maintenant la définition d’un rachat structurel et d’un rachat conjoncturel.
Les rachats sont dits structurels si l’analyse des rachats passés est utilisée pour modéliser le
comportement moyen des assurés en fonction de leur âge, de l’ancienneté de leur contrat,
le sexe, la catégorie socioprofessionnelle, le réseau de distribution….
Plus difficile à modéliser est le comportement des assurés en termes de rachats lorsque
l’environnement économique change ou que la revalorisation de leur épargne ne répond
plus à leurs exigences. Cette composante des rachats est appelée « rachats conjoncturels »
ou « rachats dynamiques ».
Les bases de l’assurance vie étant posées, nous allons pouvoir nous intéresser aux calculs et
à la modélisation du comportement client en termes de rachats totaux et partiels.
11
2) Calcul des lois de rachats avec la méthodologie Allianz
2.1) Présentation générale
L’objet de cette partie est de détailler les calculs des lois de rachats au sein d’Allianz Ces lois sont calculées à la fois pour les produits multisupports et monosupport en euros. Les variables retenues pour ces lois sont : le produit, l’ancienneté, le réseau et le montant de provision mathématique. Les lois de rachats (totales et partielles) sont utilisées dans les modèles de rentabilité produit et pour les travaux d’inventaire prospectif. Pour la majorité des contrats une méthode dérivée de Kaplan-Meier est utilisée. La provision mathématique d’ouverture est reconstituée à partir des flux constatés sur chaque produit. Il faut extraire les rachats partiels, les rachats totaux, les termes mais aussi les entrées (souscriptions, quittancements, versements libres) et sorties autres que les rachats ou termes (décès, transformation…). La liste des principaux paramètres en entrées, sorties intermédiaires et résultats définitifs communiqués pour une ancienneté donnée est résumée dans le tableau 2.1.
Tableau 2-1
Un exemple est détaillé (Tableau 2.2) basé sur un produit monosupport en euros pour le
réseau Allianz Finance Conseil et le réseau Courtage.
Les taux en % sont communiqués par ancienneté et par réseau pour l’année 2013 (c’est à
dire avec les encours de l’année 2012).
L’ancienneté maximale des lois est 43 ans. A partir de l’ancienneté 30 ans les taux sont
identiques ; en effet lorsque l’encours est faible pour les anciennetés élevées, la moyenne
des 5 dernières années est appliquée comme taux « flat » pour les anciennetés supérieures.
Nous appliquons cette méthode sur la série de taux bruts qui sera ensuite lissée avec la
moyenne des taux des deux dernières années afin de corriger les pics de rachats atypiques.
Données en entrée Sorties intermédiaires Résultats
PM de clôture PM d'ouverture Taux de rachats totaux annuels
Montants rachats partiels mensuels Taux de rachats partiels mensuels Taux de rachats partiels € annuels
Montants rachats totaux mensuels Taux rachats de totaux mensuels Taux de rachats partiels UC annuels
Entrées
Retraits ou termes
Décès
Principaux résultats pour une ancienneté donnée
12
Tableau 2-2
Durée courue
Rachat
total
Rachat
partiel €
Rachat
partiel UC
en année AF CT AF CT AF CT
1 0,20% 0,30% 0,40% 2,40% 0% 0% 2 0,20% 0,30% 2,00% 2,40% 0% 0% 3 0,00% 0,50% 1,80% 5,40% 0% 0% 4 0,00% 0,40% 2,10% 2,90% 0% 0% 5 0,00% 0,30% 3,00% 3,60% 0% 0% 6 0,00% 0,30% 1,70% 2,10% 0% 0% 7 1,40% 0,50% 2,90% 2,00% 0% 0% 8 0,90% 0,80% 1,60% 2,30% 0% 0% 9 0,30% 1,40% 2,50% 1,80% 0% 0%
10 1,50% 0,30% 1,70% 1,90% 0% 0% 11 0,90% 2,60% 1,90% 2,10% 0% 0% 12 0,40% 1,90% 2,20% 4,60% 0% 0% 13 0,70% 1,30% 1,90% 1,60% 0% 0% 14 1,10% 0,50% 2,90% 5,50% 0% 0% 15 0,70% 0,50% 1,60% 1,80% 0% 0% 16 0,80% 1,10% 1,50% 2,00% 0% 0% 17 0,60% 0,30% 1,80% 1,70% 0% 0% 18 0,80% 0,90% 2,20% 2,30% 0% 0% 19 1,00% 0,80% 2,30% 2,40% 0% 0% 20 0,60% 1,10% 2,00% 2,10% 0% 0% 21 0,70% 0,90% 2,00% 2,70% 0% 0% 22 0,70% 0,90% 1,90% 2,20% 0% 0% 23 0,70% 0,80% 1,90% 2,10% 0% 0% 24 0,80% 0,90% 1,60% 1,90% 0% 0% 25 0,90% 0,80% 1,50% 1,40% 0% 0% 26 0,70% 0,80% 1,60% 1,50% 0% 0% 27 0,90% 0,50% 1,60% 1,70% 0% 0% 28 0,50% 0,40% 1,60% 1,80% 0% 0% 29 0,80% 0,60% 1,50% 1,80% 0% 0% 30 0,80% 0,70% 1,60% 1,60% 0% 0% 31 0,80% 0,70% 1,60% 1,60% 0% 0% 32 0,80% 0,70% 1,60% 1,60% 0% 0% 33 0,80% 0,70% 1,60% 1,60% 0% 0% 34 0,80% 0,70% 1,60% 1,60% 0% 0% 35 0,80% 0,70% 1,60% 1,60% 0% 0% 36 0,80% 0,70% 1,60% 1,60% 0% 0% 37 0,80% 0,70% 1,60% 1,60% 0% 0% 38 0,80% 0,70% 1,60% 1,60% 0% 0% 39 0,80% 0,70% 1,60% 1,60% 0% 0% 40 0,80% 0,70% 1,60% 1,60% 0% 0% 41 0,80% 0,70% 1,60% 1,60% 0% 0% 42 0,80% 0,70% 1,60% 1,60% 0% 0%
43 0,80% 0,70% 1,60% 1,60% 0% 0%
13
2.2) Estimation par Kaplan Meier
Une méthode dérivée de l’estimateur de Kaplan Meier est utilisée pour calculer les taux de
rachats.
Rappelons la définition de cet estimateur pour approximer une probabilité de décès2.
Soient les notations suivantes :
�� : Loi discrète de la forme (��, ��)�∈��,…,�� avec �� dates connues entre ��, � + 1� et �� les
valeurs de la variable ��aux points��. �� : Durée de vie résiduelle d’un individu sachant qu’il est en vie à l’âge�.
�� : Probabilité de décéder en �� �� : Nombre de vivants en �� ���� : Nombre de décédés en �� ���� : Nombre de censurés en �����, ��� ���� : Nombre de censurés à gauche
On veut estimer �� la probabilité de décès dans l’intervalle ��, � + 1�; or
�� = 1 − �� = 1 − �(� + 1)�(�)
Donc on estime dans un premier temps �� la fonction de survie sur��, � + 1�. Or
∀���(�) = � (1 − � ) |"#$%
Si on se situe aux événements de sorties ou censures on se ramène à estimer des
probabilités de la forme : �� = &(� > ��|� > ����)
Un estimateur naturel de �� = 1 − �� ,∀( ∈ )1;+� est �� = ,-.- On obtient donc une expression de �/�(�) , ∀� ∈ )0; ���
�/�(�) = � (1 − ����)�|"-$%
2 Frédéric Planchet & Pierre Thérond : « Modèles de Durée, Applications actuarielles ». Economica,
2006.
14
On obtient �1� :
�1� = 1 − �(1 − ����"2�3"4
) avec �� = ���� − ���� − ���� + ����.
L’estimateur de Kaplan Meier est non paramétrique et ne fait pas d’hypothèse sur la
spécification de la loi de mortalité. Il est obligatoire de connaître, pour chaque assuré, les
dates d’entrée et de sortie dans la période d’observation.
Le calcul des lois de rachats s’effectue à une date donnée qui ne correspond pas forcément à une ancienneté entière du contrat. Par exemple prenons un contrat souscrit au 01/06/2012 et dont le calcul des lois se fait au 31/12/2014. Supposons que la valeur de la provision mathématique de ce contrat soit égale à 100 au 31/12/2014. Alors l’ancienneté du contrat au 31/12/2014 est la différence entre la date du 31/12/2014 et la date du 01/06/2012 soit 2,5 ans d’ancienneté. L’affectation de la provision mathématique se fera ainsi :
Le calcul des taux de rachats par génération est une adaptation de la méthode de Kaplan-Meier. Sont pris en compte toutes les prestations (rachats sinistres termes) ainsi que des versements pour recalculer mensuellement une "Provision mathématique ouverture"
Il y a ainsi 12 provisions mensuelles d’ouverture notées iPM .
Les versements du mois i sont notés iV .
Les prestations (rachats sinistres et termes) du mois i sont notées iestaPr .
clôturePM représente le montant de la provision mathématique constatée au 01/01/n+1 c'est
à dire à la clôture de l'exercice n.
∑∑==
+−=12
1
12
1
Prj
jj
jclôturei estaVPMPM
Le taux de rachats obtenu se calcule de la manière suivante :
ancienneté PM
1 ……
2 50
3 50
…… ……
15
∏=
−−=
12
1
11_i i
i
PM
rachatsrachatTaux
Ci-dessous le calcul du taux de rachats totaux sur l’exemple d’un produit monosupport en
euros pour l’ancienneté 9 et le réseau Allianz Finance Conseil et Affaires Directes en 2010.
Ce tableau récapitule la somme des entrées, sorties et rachats de 2010 et donne la provision
mathématique de clôture qui est le point de départ du calcul.
Le détail des calculs est le suivant:
Le taux de rachats totaux pour l’ancienneté 9 est donc 8,20% (= 1-91,80%).
Des retraitements sont parfois réalisés ; ce sont des corrections des rachats atypiques c'est-
à-dire considérés comme exceptionnels par un avis d’expert soit en montant soit en
fréquence.
La fréquence de production de ces lois est annuelle.
Nous présentons (figure 2.1) le graphe des lois de rachats par ancienneté et par année sur la
totalité du portefeuille. Globalement les courbes des lois par année se superposent sauf
pour l’année 2008 où nous constatons des taux de rachats plus élevés (expliqués
probablement par l’effet de la crise).
Mois entréesretraits ou
termes
rachats
partielsdécès PMi rachati / PMi 1 - rachati / PMi
Fonction de
survie
1 582 970 2 218 050 795 509 € 1 941 402 296 851 655 € 0,75% 99,25% 99,25%
2 355 374 2 467 874 1 054 043 € 2 090 467 292 479 662 € 0,84% 99,16% 98,42%
3 432 798 3 352 056 1 328 925 € 2 929 961 287 222 652 € 1,17% 98,83% 97,27%
4 595 721 3 392 786 1 096 667 € 1 517 919 280 044 509 € 1,21% 98,79% 96,09%
5 702 411 2 021 968 687 239 € 1 108 559 274 632 859 € 0,74% 99,26% 95,38%
6 384 481 2 121 588 1 024 471 € 1 399 774 271 517 504 € 0,78% 99,22% 94,64%
7 551 367 1 594 842 736 926 € 1 951 961 267 356 152 € 0,60% 99,40% 94,07%
8 177 893 745 203 533 597 € 419 365 263 623 790 € 0,28% 99,72% 93,81%
9 246 865 1 430 955 792 408 € 893 737 262 103 518 € 0,55% 99,45% 93,29%
10 507 470 1 387 204 798 083 € 1 386 627 259 233 284 € 0,54% 99,46% 92,79%
11 230 912 1 424 379 674 035 € 890 893 256 168 840 € 0,56% 99,44% 92,28%
12 733 402 1 319 615 675 773 € 852 422 253 410 444 € 0,52% 99,48% 91,80%
PM au
31/12/2010
entrées
2010
Rachats
totaux 2010
Rachats partiels
2010 sorties 2010
251 296 037 € 5 501 664 23 476 519 € 10 197 675 € 17 383 087
16
Figure 2.1
Nous pouvons ajouter que cette méthode d’estimation par la formule dérivée de Kaplan
Meier est assez rapide à implémenter (un outil programmé sous Excel permet de faire le
calcul directement) mais il faut bien enregistrer tous les mouvements afin de reconstituer les
provisions mathématiques d’ouverture.
17
3) Présentation des données de l’étude
Dans cette section nous allons présenter les données utilisées ainsi que les produits
sélectionnés pour effectuer les modélisations suivantes.
Nous avons sélectionné pour l’étude les produits phares (les plus commercialisés) d’Allianz
dont les montants de provisions mathématiques sont significativement élevés. Nous avons
renommé ces produits par couleur.
Les montants de rachats et les montants de provisions mathématiques ont été extraits du
système d’informations Allianz pour tous les contrats d’épargne (des produits sélectionnés)
présents sur les années 2012 et 2013. Les contrats pour lesquels il n’y a pas eu de retrait ont
été extraits également pour le modèle logistique. Sur l’année 2012 il y a 816 770 contrats
présents.
3.1) Introduction des variables sélectionnées
Les variables retenues lors de l’extraction sont détaillées ci-dessous.
Pour le modèle de crédibilité et l’étude des corrélations entre les rachats et les indicateurs
financiers les taux de rachats ont été extraits de 2007 à 2013.
La liste des produits retenus pour notre étude est détaillée dans le tableau ci-dessous ainsi
que les encours en euros pour 2013.
Catégorie Nom du produit Encours totaux Rachats totaux Rachats partiels
Rouge 4 737 827 392 144 606 873 171 336 600
Bleu 449 837 007 6 617 651 20 245 488
Vert 5 174 182 894 95 253 192 204 177 958
Orange 6 388 081 111 117 097 405 453 479 712
Jaune 908 503 043 31 074 669 26 587 195
Violet 777 807 591 11 823 225 30 001 750
Rose 2 000 474 289 27 257 495 48 783 488
Noir 4 142 310 913 105 383 363 110 928 980
Marron 3 835 472 056 26 052 692 83 161 452
Multisupports
Monosupport €
18
Les variables sélectionnées pour la suite de l’étude sont :
Liste des variables
Tableau 3.1
Nom des variables sélectionnées Intitulé des variables
anciennete Ancienneté du contrat
age_lors_du_rachat Age de l'assuré au moment du rachat
NB_UC Nombre d’unité de compte détenu par l'assuré
tauxinvestissement_UC_2012_2013 Taux investissement annuel dans les UC associé à l'année du rachat
PM_122012_2013_total Montant de la provision mathématique du contrat associé à l'année du rachat
class_CSP CSP de l'assuré
class_situation_familiale Situation familiale de l'assuré
class_reseau Réseau de distribution Allianz
class_PERICOTIS Périodicité de la cotisation
class_department Département du lieu d'habitation de l'assuré
class_nbrachats Existence ou absence d'un rachat antérieur à la date du retrait
NV_RGPMT Catégorie de produits
Pour la variable PM_122012_2013_total c’est la provision mathématique au 31/12/N-1 qui
est prise en compte pour les contrats avec ou sans rachat dans l‘année ; pour les contrats
souscrits dans l’année, c’est la provision mathématique au 31/12/N qui est prise en compte
(car à l’année N-1 le montant de la provision mathématique vaut zéro).
Les différentes valeurs des variables qualitatives ont été classifiées dans les tableaux de 3.2
à 3.7.
Classification des départements
Tableau 3.2
Dans le tableau 3.2, le regroupement des départements a été réalisé en fonction du revenu
salarial annuel 2010 moyen net de prélèvements (Source : Insee, Déclarations annuelles de
données sociales (DADS)). La première ligne du tableau représente les régions dont les
revenus sont les plus élevés et la dernière ligne les revenus les plus faibles.
Modalités de class_department N° des départements regroupés en fonction du revenu 2010
class_department 1 75,92,78,91,94,95,77,31,69,60
class_department 2 13,38,33,90,67,45,28,06,51,27,44,54,76,59,21,37
class_department 3 35,63,93,01,68,64,83,87,57,73,86,14,74,29,18,34,80, 25,41,55,30,72
class_department 442,89,10,71,02,62,26,79,84,16,50,08,2A,81,49,88,56,19,82,40,22,39,70,03,53,52,
58,04,36,17,32,65,2B,07,61,23,12,24,46,43,47,85,09,15,11,66,48,05
class_department 0 les autres départements y compris les non renseignés
19
Classification de la périodicité de la cotisation
Tableau 3.3
Classification réseau commercial
Tableau 3.4
Classification situation familiale
Tableau 3.5
Classification catégorie socioprofessionnelle
Tableau 3.6
Dans chaque catégorie de CSP il y a également les retraités de la profession ; par exemple la
class_CSP4 contient les cadres et anciens cadres.
Modalités de class_PERICOTIS Périodicité de la cotisation
class_PERICOTIS 1 unique
class_PERICOTIS 2 mensuelle
class_PERICOTIS 3 autre
Modalités de class_PERICOTIS Réseau commercial
class_reseau 1 Allianz finance conseil class_reseau 2 Agent général
class_reseau 0Autres (courtiers, affaires
directes….)
Modalités de class_situation_familiale Situation familiale de l'assuré
class_situation_familiale 1 Marié, union libre, pacsé
class_situation_familiale 2 Célibataire, veuf, divorcé
Modalités de class_CSP CSP de l'assuré
class_CSP 1 Ouvriers
class_CSP 2 Employés, techniciens, agents de maîtrise
class_CSP 3 Professions libérales, artisans, commerçants
class_CSP 4 Cadres
class_CSP 5 Sans emplois
class_CSP 0 Autre
20
Classification existence rachats partiels antérieurs
Tableau 3.7
Si il y a eu un rachat partiel avant la date de rachat actuel alors class_nbrachats=2 ; sinon
cette variable vaut 1.
3.2) Statistiques élémentaires sur les variables
Nous présentons quelques statistiques élémentaires sur les variables de la base de données
des contrats qui sera utilisée pour les modélisations.
� Variables quantitatives
L’assuré moyen est âgé de 61 ans avec un écart type de 18 ans. De plus l’ancienneté moyenne
dépasse le pic fiscal de 8 ans. Nous remarquons que l’assuré moyen n’investit que dans un fond ou
deux puisque le nombre moyen d’unité de compte détenu est de 1,85. La médiane de la variable
tauxinvestissement_UC_2012_2013 est de 0. Cela montre que les assurés investissent
essentiellement dans des fonds sans risque.
� Variables qualitatives
Nous nous intéressons (figures 3.1 à 3.8) à la répartition du nombre de contrats pour les
différentes modalités (ou regroupement de modalités) des variables qualitatives.
Modalités de class_nbrachats Existence ou absence d'un rachat antérieur à la date du retrait
class_nbrachats 2 Existence d'un rachat partiel avant la date de rachat actuel
class_nbrachats 1 Absence d'un rachat partiel avant la date de rachat actuel
Variables quantitatives Moyenne Médiane Écart-type Minimum Maximum
ancienneté 10,25 9,00 7,40 0,00 38,00
age_lors_du_rachat 60,87 63,00 18,11 0,00 114,00
NB_UC 1,85 1,00 1,74 1,00 39,00
tauxinvestissement_UC_2012_2013 14,26 0,00 27,64 0,00 100,00
PM_122012_2013_total 32 683,65 12 183,18 86 075,32 0,50 40 432 774,60
21
Figure 3.1
Figure 3.2
Les détenteurs de contrats d’épargne de notre portefeuille sont surtout des assurés
(quasiment autant d’hommes que de femmes) en couple.
Modalités de
class_situation_familialeSituation familiale de l'assuré %
1 Marié,union libre,pacsé 63%
2 Célibataire,veuf,divorcé 37%
Sexe %
Féminin 52%
Masculin 48%
22
Figure 3.3
Nous remarquons (figure 3.3) qu’il y a environ 30% de valeurs manquantes pour la catégorie
socioprofessionnelle de l’assuré ; en effet c’est une information assez difficile à obtenir et
surtout à actualiser durant la vie du contrat. Pour cette raison nous ne retiendrons pas cette
variable par la suite pour les modèles qui seront présentés.
Toutes les catégories socio-professionnelles sont représentées dans les contrats
sélectionnés.
L’observation étonnante est que la catégorie socioprofessionnelle qui détient le plus de
contrats dans notre échantillon est « Employés, techniciens, agents de maîtrise » devant les
cadres ou professions libérales. Mais une partie des données manquantes est peut être
attribuable à ces deux dernières catégories.
Modalités de class_CSP Catégorie Socio-Professionnelle de l'assuré %
0 Non renseigné 30%
1 Ouvriers 11%
2 Employés, techniciens, agents de maîtrise 20%
3 Professions libérales, artisans, commerçants 16%
4 Cadres 13%
5 Inactifs 10%
23
Figure 3.4
Les départements sont bien renseignés dans les bases de données Allianz puisque moins de
3% (figure 3.4) des contrats seulement ne sont pas renseignés. Ces départements sont
enregistrés dans les bases Allianz au moment de la souscription du contrat ; ils ne sont pas
toujours mis à jour en cas de déménagement de l’assuré pendant la durée de vie du contrat.
Modalités de
class_departementN° des départements regroupés en fonction du revenu 2010 %
0 Autres départements y compris les non renseignés 3%
1 75,92,78,91,94,95,77,31,69,60 14%
2 13,38,33,90,67,45,28,06,51,27,44,54,76,59,21,37 25%
3 35,63,93,01,68,64,83,87,57,73,86,14,74,29,18,34,80, 25,41,55,30,72 25%
442,89,10,71,02,62,26,79,84,16,50,08,2A,81,49,88,56,19,82,40,22,39,
70,03,53,52,58,04,36,17,32,65,2B,07,61,23,12,24,46,43,47,85,09,15,
11,66,48,05
33%
24
Figure 3.5
Figure 3.6
Une majorité d’assurés n’a jamais effectué de rachat avant la date de l’étude ; nous
rappelons que nous n’avons pas retenu les contrats avec rachats partiels programmés. De
plus le versement unique est majoritaire.
Modalités de class_nbrachats Existence ou absence d'un rachat antérieur à la date du retrait %
1 Absence d'un rachat partiel avant la date de rachat actuel 81%
2 Existence d'un rachat partiel avant la date de rachat actuel 19%
Modalités de class_PERICOTIS Périodicité de la cotisation %
1 Unique 83%
2 Mensuelle 16%
3 Autre 1%
25
Figure 3.7
La principale force de vente d’Allianz pour les contrats d’épargne est le réseau « Allianz
finance conseil » (figure 3.7) qui cible essentiellement les assurés avec un patrimoine
important. Le réseau « Agent général » cible plutôt les assurés ayant déjà un contrat
d’assurance Allianz (type habitation, santé,…) pour leurs proposer des contrats d’épargne.
Modalités de class_reseau Réseau commercial %
0 Autre (courtiers,….) 4%
1 Allianz finance conseil 64%
2 Agent général 32%
26
Figure 3.8
Nous avons environ 34 % des contrats qui possèdent un seul support en euros (figure 3.8) et
le reste est constitué par des contrats multisupports qui possèdent tous des fonds en euros
avec un taux garanti. De plus tous ces produits disposent d’une clause de PB.
Produit Catégorie %
Rouge Multisupports 19%
Rose Monosupport € 4%
Bleu Multisupports 1%
Vert Multisupports 16%
Pourpre Multisupports 1%
Noir Monosupport € 18%
Marron Monosupport € 12%
Orange Multisupports 27%
Jaune Multisupports 1%
Violet Multisupports 1%
27
Nous présentons (figure 3.9) les taux de rachats par âge. Nous remarquons que les taux
augmentent pour la tranche d’âge basse jusqu’à un pic situé à environ 38 ans pour diminuer
ensuite progressivement aux âges élevés. Il y a un pic atypique vers 98 ans mais il n’y a pas
beaucoup de données (le montant de la provision est non significatif) à cet âge donc les taux
sont plus volatils.
Une explication possible est que les assurés ont besoin de liquidité (avant 38 ans) pour
l’achat de leur résidence principale et qu’ensuite les taux diminuent car les besoins en
liquidité s’estompent (résidence en partie ou en totalité payé, enfant un peu plus âgé,…).
Figure 3.9 Taux de rachats par âge de l’assuré à la date du retrait
0
5
10
15
20
25
0 4 8
12
16
20
24
28
32
36
40
44
48
52
56
60
64
68
72
76
80
84
88
92
96
10
0
10
4
10
9
11
3
Ta
ux
de
ra
cha
ts e
n %
Age
28
Nous observons (figure 3.10) les taux de rachats par ancienneté calculés sur les contrats
sélectionnés. Le pic fiscal à 8 ans d’ancienneté est clairement visible ensuite nous observons
une nette diminution du taux pour les maturités élevés.
Taux de rachats par ancienneté du contrat
Figure 3.10
Taux de rachats par réseau commercial
Figure 3.11
Nous observons (figure 3.11) des taux de rachats plus élevés sur le réseau des agents que sur
le réseau AFC ou le courtage. De plus le réseau a une influence sur les taux de rachats
puisque nous constatons un écart d’environ 3 % entre le réseau Agent et le réseau
« Autres » qui comprend les courtiers et affaires directes.
0
2
4
6
8
10
12
14
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37
Ta
ux
de
ra
cha
ts e
n %
Ancienneté
0
1
2
3
4
5
6
7
8
9
Autres AFC Agent
Ta
ux
de
ra
cha
ts e
n %
Réseaux
29
Le graphe des taux de rachats par catégorie socioprofessionnelle (figure 3.12) nous indique
que celle-ci influe peu sur les taux de rachats qui sont sensiblement proches avec un pic pour
la catégorie « Professions libérales, artisans, commerçants ».
Taux de rachats par catégorie socioprofessionnelle
Figure 3.12
Modalités de class_CSP Catégorie Socio-Professionnelle de l'assuré %
0 Non renseigné 29%
1 Ouvriers 11%
2 Employés, techniciens, agents de maîtrise 20%
3 Professions libérales, artisans, commerçants 16%
4 Cadres 13%
5 Inactifs 10%
0
2
4
6
8
10
12
0 1 2 3 4 5
Ta
ux
de
ra
cha
ts e
n%
Catégorie socioprofessionnelle
30
Le graphe des taux de rachats par département (figure 3.13) n’indique pas d’écarts
significatifs des taux par département. Le pic du rachat pour la modalité « 0 » s’explique par
un faible effectif dans cette catégorie (environ 3%) cela induit donc une assez forte volatilité.
Nous rappelons dans le tableau ci-dessous les modalités de la variable département afin de
mieux comprendre l’axe des abscisses du graphe (figure 3.13).
Taux de rachats par département
Figure 3.13
Après avoir introduit les variables et les produits nous allons pouvoir effectuer les
différentes modélisations afin d’appréhender le comportement client en terme de rachat.
Modalités de
class_departementN° des départements regroupés en fonction du revenu 2010 %
0 Autres départements y compris les non renseignés 3%
1 75,92,78,91,94,95,77,31,69,60 14%
2 13,38,33,90,67,45,28,06,51,27,44,54,76,59,21,37 25%
3 35,63,93,01,68,64,83,87,57,73,86,14,74,29,18,34,80, 25,41,55,30,72 25%
4
42,89,10,71,02,62,26,79,84,16,50,08,2A,81,49,88,56,19,82,40,22,39,
70,03,53,52,58,04,36,17,32,65,2B,07,61,23,12,24,46,43,47,85,09,15,
11,66,48,05
33%
0
2
4
6
8
10
12
14
0 1 2 3 4
Ta
ux
de
ra
cha
ts e
n %
Classes de départements
31
4) Modélisation logistique de la probabilité de rachat
L’objectif de cette régression est triple : calculer des probabilités de rachat au niveau du
contrat, sélectionner les variables les plus significatives pour le déclenchement du rachat et
définir une classification des modalités des variables sélectionnées.
Nous ne prenons pas en compte les rachats partiels programmés car il n’y a pas d’aléa sur
ces contrats.
La base de données contient les contrats présents en 2012 et 2013. Sur l’année 2012 il y a
816 770 contrats présents. Une variable indicatrice rachat est créée avec deux modalités : 0
si pas de rachat dans l’année et 1 si rachat dans l’année.
Sur 2012 et 2013 la valeur de la variable rachat vaut 1 dans 18% des cas et 0 dans 82% des
cas. Nous avons donc un échantillon intéressant pour effectuer la régression logistique.
4.1) Introduction du modèle
La régression logistique binaire est utile pour prédire les valeurs de la variable aléatoire 5
qui possède deux modalités 0 ou 1.
Soit Ω un échantillon d’individus de taille�.
La valeur prise par 5 pour un individu 7 se note (7) .
Soient 8 variables explicatives de la variable 5 notés 9 = (9�, 9:, …9;). Le vecteur de
valeurs pour un individu 7 s’écrit9(7) = (9�(7), 9:(7),…9;(7)). Le logit d’un individu s’écrit ln >(?)��>(?) = �@ + ��9�(7) + �:9:(7) + ⋯+ �;9;(7) avec �@, ��, … , �; paramètres à estimer en fonction de l’échantillon et avec la probabilité B qui
est définie par : B(7) = &)5(7) = 1/9(7)� . Pour estimer les paramètres de la régression la méthode du maximum de vraisemblance est
utilisée.
Le principe consiste à déterminer en premier lieu les valeurs prises par P(5 /9). Pour un
individu 7, nous modélisons la probabilité à l’aide de la loi de Bernoulli Ber(B(7)).
&)5(7)/9(7)� = B(7)D(?) ∗ (1 − B(7))(��D(?)) Lorsque F(7) = 1; &)5(7) = 1/9(7)� = B(7) et si F(7) = 0; &)5(7) = 0/9(7)� =1 − B(7) ce qui est cohérent avec la définition donnée précédemment.
La vraisemblance d’un échantillon Ω s’écrit :
32
G = �B(7)D(?) ∗ (1 − B(7))(��D(?))?
Pour simplifier les calculs la log-vraisemblance est souvent utilisée.
ln G = HF(7) ln B(7)? + (1 − F(7)) ln(1 − B(7)) La méthode du maximum de vraisemblance cherche le paramètre � = (�@, ��, … , �;) de la
régression logistique qui rend maximum la fonction Gou la fonction ln G (car la fonction
logarithme est une fonction monotone).
Cet estimateur noté �1 est appelé l’estimateur du maximum de vraisemblance il est donc
asymptotiquement sans biais ; de variance minimale et asymptotiquement gaussien3 .
Ces éléments, notamment le dernier, seront très importants pour l'inférence statistique
(intervalle de confiance, test de significativité, ...).
La fonction ln G est une fonction concave il y a donc existence et unicité de �1 .
Pour trouver cet estimateur il n’y a pas de solution analytique il faut passer par des
heuristiques. C’est l’algorithme de Newton-Raphson qui est utilisé par SAS pour résoudre
cette équation. Il démarre avec une initialisation quelconque du vecteur de paramètre � ;
pour passer de (() à (( + 1) , il se rapproche de la solution finale â en utilisant la formule
suivante :
��J� = �� − K LM�GL�L�%N�� ×LM�GL�
Après avoir trouvé la solution nous cherchons à évaluer la fiabilité du modèle qui sera
mesurée par la courbe de ROC.
Avant de présenter cette courbe ; introduisons le test de Mann-Whitney qui est relié à l’aire
sous la courbe de ROC.
Nous définissons au préalable un score qui est une probabilité de rachat estimée pour un
individu 7 nous pouvons le noterBP (7). Ce test non paramétrique permet de mesurer si les distributions des scores sont bien
différenciées.
3 Pour la démonstration se référer à la page 173 de l’ouvrage de Christian Gourieroux ; Alain
Monfort : « Statistique et modèles économétriques ». Economica, 1996.
33
� Etape1 : calcul du rang des individus Q(7) à partir de leurs scores
� Etape2 : on définit
QJ = H Q(7)?RST D(?)3� ; Q� = H Q(7)?RST D(?)3@
UJ = QJ − �� ∗ (�� + 1)2 ;U� = Q� − �@ ∗ (�@ + 1)2 W�U = min(UJ, U�) �� représente le nombre de contrats avec un rachat dans l’année.
�@ représente le nombre de contrats sans rachat dans l’année.
U correspond à la statistique de de Mann-Whitney.
� Etape3 : soit H0 l’hypothèse « les distributions sont confondues », la statistique
Z = [�\]∗\^4_\]∗\^∗(\]`\^`])]4~b(0,1)
La courbe de ROC est un graphique permettant d’évaluer la qualité de la régression. Cette
évaluation est effectuée à l’aide de l’aire sous la courbe de ROC appelée critère AUC («Area
Under Curve»).
La courbe de ROC présente en ordonnée le taux de vrais positifs (la sensibilité) et en
abscisse le taux de faux positifs (1-spécificité).
Dans un premier temps le score est calculé pour chaque contrat à l’aide du modèle de
prédiction.
La base est ensuite triée selon les scores décroissants.
Un seuil � = 50% est défini.
Le taux de vrais positifs et le taux de faux positifs sont alors calculés de la manière suivante :
e& = ��(f)�� ; g& = �@(f)�@ ��(f) représente le nombre de contrats avec un rachat dans l’année dont le score est
supérieur à 50%.
�@(f) représente le nombre de contrats sans rachat dans l’année dont le score est inférieur à
50%.
34
La courbe de ROC relie ainsi les couples (e&; g&) avec comme origine le point (0; 0) et le
dernier point(1; 1). Nous présentons un exemple de tracé de cette courbe (figure 4.1).
Exemple Courbe de ROC
Figure 4.1
L’aire sous la courbe de ROC peut se calculer de différentes manières : soit par des
méthodes d’intégration numérique (méthode des trapèzes) soit par la formule suivante qui
relie le test de Mann-Whitney à l’AUC.
UJ�� ∗ �@ = hUi
L’aire sous cette courbe (tableau 4.1) permet ainsi de juger de la qualité du modèle.
Interprétation des valeurs du critère AUC4
Tableau 4.1
Valeur de l’AUC Commentaire
AUC < 0,7 Pas de discrimination
0,7 ≤ AUC < 0,8 Discrimination acceptable
0,8 ≤ AUC < 0,9 Discrimination excellente
0,9 ≤ AUC Discrimination exceptionnelle
4 Ricco Rakotomalala « Pratique de la régression logistique » : http://eric.univ-
lyon2.fr/~ricco/cours/cours/pratique_regression_logistique.pdf
35
Après avoir défini un indicateur de la qualité du modèle, nous allons détailler les tests de
significativité des paramètres imposés par la régression.
Les deux principaux tests sont le principe du rapport de vraisemblance et le test de WALD.
� principe du rapport de vraisemblance:
Les vraisemblances de deux modèles sont comparées : j (Q variables et donc Q + 1
valeurs à estimer) et jf avec s< Q.
La définition de la statistique est la suivante :
e = −2 ∗ ln l(mn)l(m#) avec G(j�) la vraisemblance du modèle à ( variables.
V~ℵ:(Q − �)��M sous l’hypothèse q@:« les coefficients des variables supplémentaires de j sont nuls ».
Dans les analyses SAS ; G(j ) représente le modèle complet avec toutes les variables
sélectionnées.
Dans le test global de significativité de SAS : G(jf) représente la vraisemblance du modèle
sans variable significative et G(j ) représente le modèle complet avec toutes les variables
sélectionnées ; le nombre de degré de liberté est donc 5-0=5.
Dans le test de significativité de SAS pour chaque variable: G(jf) représente la
vraisemblance du modèle sans la variable sélectionnée (son coefficient est à 0) et G(j ) représente le modèle complet avec toutes les variables sélectionnées ; le nombre de degré
de liberté est donc 5-4=1.
� Test de Wald :
Avant la présentation de ce test définissons la matrice Hessienne.
La matrice Hessienne d’une fonction numérique s est la matrice carrée, notée q(s) de ses
dérivées partielles secondes. Plus précisément, étant donnée une fonction f à valeurs réelles
f: u. → u: s(��, �:, … , �.)et en supposant que toutes les dérivées partielles secondes de f
existent, le coefficient d'indice ((, w) de la matrice Hessienne de f vaut : q�x(s) = y4zy�-y�{ ou
en d'autres termes,
q(s) =|}}}}~ L:sL�:� ⋯ L:sL��L�.⋮ ⋱ ⋮L:sL�.L�� ⋯ L:sL�.: ��
����
36
L’expression de cette matrice est :
q = 9% e9 avec e matrice diagonale composée des valeurs de B(7) ∗ (1 − B(7)) pour
chaque contrat et 9 matrice des valeurs des différentes variables sélectionnées avec comme
première colonne la constante.
Or la matrice de variance covariance des coefficients de la régression correspond à l’inverse
de cette matrice Hessienne ; on la notera i/ = q�� .
Le logiciel SAS teste la significativité globale et par variable du modèle que nous détaillons ci-
dessous :
• Par variable : soit 1 ≤ w ≤ 8la statistique de Wald �x = "1{4�P{4 ~ℵ:(1)��M sous q@ :
�x = 0 avec �1x: la variance du coefficient �1x lue sur la diagonnale de l’inverse de la
matrice Hessienne.
• Au global : la statistique de Wald �(x) =�(�)% ∗� i/(;)�� ∗ �1(;)~ℵ:(8)��M sous q@ : �� = �: = ⋯�; = 0 avec i/(;)�� la sous matrice des variances covariances sans la
constante �@.
Détaillons maintenant une autre notion associée à ce modèle qui est l’odds-ratio. Il sera
utilisé par la suite pour l’analyse des rachats.
Pour expliciter ce calcul un exemple sera donné avec un tableau de contingence.
Soit Y la variable aléatoire binaire qui prend les valeurs suivantes : « rachat dans l’année » ou
« pas de rachat dans l’année » que nous codifions en («1» ; «0»).
Soit X la variable aléatoire binaire : « jeune » ; «âgé » que nous codifions en («1» ; «0»).
L’odds ratio est :
�u = &(5 = 1/9 = 1)&(5 = 0/9 = 1) &(5 = 1/9 = 0)&(5 = 0/9 = 0)�
37
Dans notre exemple, le calcul de l’odds-ratio est : �u ≈ 3,3 cela signifie que le groupe
« jeune » a environ 3 fois plus de chances de racheter son contrat que dans le groupe
« âgé ».
Lorsque �u = 1 il n’y a pas d’incidence de l’âge sur le rachat du contrat.
4.2) Application du modèle
Après avoir revu brièvement les termes mathématiques nous allons appliquer le modèle aux
contrats d’épargne. Au préalable nous ferons une sélection des variables pertinentes par
différents tests statistiques.
4.2.1) Sélection des variables
� Etudes de la corrélation entre les variables explicatives quantitatives
Le coefficient de corrélation linéaire entre 9 et 5 s’écrit de la manière suivante :
−1 ≤ Q = i��(9, 5)�(9)�(5) ≤ 1
Ce nombre réel Q est invariant pour tout changement d’origine et d’échelle.
Si 9et 5 sont indépendants alors Q = 0; la réciproque et fausse.
Le nuage de points (représentant les différentes valeurs des deux variables aléatoires) est
une droite si et seulement si : Q = 1 (droite à pente positive) ou Q = −1 (droite à pente
négative).
Si |Q| ≈ 1il existe une forte corrélation linéaire entre 9et 5 mais cela ne signifie en aucun
cas qu’il existe une relation de cause à effet entre 9 et 5.
Calculons les coefficients de corrélation des différentes variables.
Coefficients de corrélation de Pearson
Ancienneté Age Nombre UC Taux investissement UC PM
Ancienneté 1 0,39 -0,28 -0,3 0,03 Age 0,39 1 -0,09 -0,14 0,14 Nombre UC -0,28 -0,09 1 0,43 0,12 Taux investissement UC -0,3 -0,14 0,43 1 -0,02 PM 0,03 0,14 0,12 -0,02 1
38
Nous remarquons que la corrélation la plus élevée est de 0,43 et concerne le taux
d’investissement dans les unités de compte de l’assuré et le nombre d’unités de compte
détenu par l’assuré. Par la suite nous ne retenons que le paramètre taux d’investissement
dans les unités de compte. L’âge et l’ancienneté sont naturellement corrélés. De plus nous
remarquons que lorsque l’âge ou l’ancienneté augmente le taux d’investissement dans les
unités de compte diminue (aversion au risque avec l’âge).
� V de cramer entre la variable binaire rachat et les autres variables (qualitatives et
quantitatives)
Définissons dans un premier temps cette notion.
Soient 9 et 5 deux variables qualitatives avec Q et � modalités.
9 5 F� F: …………………. Fx Ff
�� ��� ��: ��f ��. �: �:� �:: �:f �:. …………………. �� ��x ��. � � � � : � f � . �.� �.: �.x �.f �
Avec les notations du tableau ci-dessus on a :
��. = H��xx ; �.x = H��x� Le e de cramer se calcule de la manière suivante :
e = � ℵ:� × +(��(� − 1); (Q − 1)�
Avec :
ℵ: = HH (��x − ��.�.x� ):��.�.x�x�
Le e de Cramer est compris entre 0 et 1. Plus e est proche de zéro, plus il y a indépendance
entre les deux variables étudiées. Il vaut 1 en cas de liaison fonctionnelle.
39
Contrairement au ℵ�, il reste stable si l’on augmente l’échantillon dans les mêmes
proportions inter-modalités.
La variable avec le e de cramer le plus élevé est celle qui explique le mieux la variable binaire
rachat.
Le résultat est le suivant :
Résultat du e de Cramer sur les variables sélectionnées
PM_122012_2013_total 0,937
tauxinvestissement_UC_2012_2013 0,470
class_nbrachats 0,267
class_CSP 0,160
Anciennete 0,070
NV_RGPMT 0,065
age_lors_du_rachat 0,063
class_reseau 0,047
class_situation_familiale 0,023
NB_UC 0,020
Pericotis 0,020
class_department 0,020
Nous choisissons de retenir les quatre premières variables qui ont le V de Cramer les plus
élevés. Autrement dit le taux d’investissement dans les unités de compte, le montant de la
provision mathématique du contrat, l’existence antérieure d’un rachat partiel et la catégorie
socioprofessionnelle de l’assuré sont retenues comme ayant un lien fonctionnel avec la
variable binaire rachat.
� Test de Kruskal WALLIS: lien entre les variables quantitatives et rachat
L’objet de ce test est de mesurer le lien entre les variables quantitatives et la variable binaire
rachat. Il va nous permettre d’identifier les variables les plus liées à la variable à expliquer en
repérant celles qui présentent les statistiques de Kruskal-Wallis les plus élevées.
Ce test qui est non paramétrique permet de comparer les moyennes de plusieurs
échantillons. Il permet de déterminer si les échantillons proviennent de la même population
ou d’une population ayant les mêmes caractéristiques.
Soient � échantillons indépendants et non exhaustifs ��; …… ; �� de tailles respectives ��; …… ; ��. Le test compare les �moyennes ; c'est-à-dire teste l’hypothèse
(q@):�� = ⋯ = �� contre (q�):∃au moins un couple ((, w) tel que �� ≠ �x
L’ensemble des valeurs de ces � échantillons sont classées par ordre croissant ; ensuite le
rang de chaque valeur est déterminé.
40
Pour chaque échantillon �� on note Q� la somme des rangs des valeurs de cet échantillon.
Le calcul suivant est ensuite réalisé :
ℎ = 12� ∗ (� + 1)�HQ�:���
�3� � − 3(� + 1)��W�� = H����3�
Si on noteq la variable aléatoire qui prend la valeur ℎ calculée ci-dessus à l’issue de
l’expérience aléatoire.
Si les �� sont assez grand (en général supérieur à 5) alors si (q@) est vraie, q ~ℵ: à (� − 1)��M. Le résultat de ce test nous donne les valeurs suivantes :
Résultat du Test de Kruskal WALLIS entre les variables quantitatives et rachat
Obs Variable Wallis
1 PM_122012_2013_total 21 937
2 tauxinvestissement_UC_2012_2013 6 274
3 age_lors_du_rachat 125
4 NB_UC 122
5 Anciennete 16
Nous choisissons de retenir les quatre premières variables qui ont le ℵ:de Kruskal Wallis les
plus élevés. Autrement dit le taux d’investissement dans les unités de compte, le montant de
la provision mathématique du contrat, l’âge de l’assuré et le nombre d’unités de compte
détenu sont retenues comme les plus liées avec la variable binaire rachat.
� Analyse discriminante : sélection Stepwise
La procédure « STEPDISC » sous SAS vise à identifier la combinaison de variables la plus
performante pour expliquer une typologie. Elle permet notamment d'identifier les variables
qui sont pertinentes pour la suite de l'analyse et celles qui ne le sont pas, basée sur la
significativité du test de Fisher appliqué au lambda de Wilks qui est le rapport de la variance
intra classe sur la variance totale ; il est donc compris entre 0 et 15.
5 Le détail de cette théorie est expliqué dans l’ouvrage de Gilbert Saporta « Probabilités Analyse des
données et Statistique ».
41
Par défaut la probabilité associée au test de F doit être inférieur à 15%6.
Cette procédure regroupe plusieurs méthodes : FORWARD ; BACKWARD ou STEPWISE.
FORWARD suppose que le modèle entre d'abord une variable qui explique le mieux la
typologie, puis elle cherche la variable qui explique le mieux la variance qui reste à expliquer,
... et ainsi de suite. BACKWARD introduit d'abord toutes les variables puis elle élimine des
variables qui n'expliquent rien. STEPWISE est intermédiaire dans le sens où elle commence
comme une FORWARD puis teste à chaque étape si elle ne peut pas éliminer une variable
entrée auparavant.
Résultats de la sélection Stepwise
Step Entré(s) Valeur F Pr > F
Lambda
de Wilks
Pr <
Lambda
1 tauxinvestissement_UC_2012_2013 5 322 <0,0001 0,99351 <0,0001
2 NB_UC 1 599 <0,0001 0,99157 <0,0001
3 Anciennete 660 <0,0001 0,99076 <0,0001
4 PM_122012_2013_total 285 <0,0001 0,99042 <0,0001
5 age_lors_du_rachat 4 0,0482 0,99041 <0,0001
Les quatre premières variables avec les valeurs de F les plus élevées sont retenues.
Autrement dit le taux d’investissement dans les unités de compte, le montant de la provision
mathématique du contrat, l’ancienneté du contrat et le nombre d’unités de compte détenu
sont retenues par l’analyse discriminante pour expliquer le rachat.
� Résumé sélections variables
Les quatre premières variables de chaque test sont retenues ce qui donne la sélection totale
des sept variables suivantes :
class_nb_rachat, PM_122012_2013_total, tauxinvestissement_UC_2012_2013, NB_UC,
anciennete, class_csp, age_lors_du_rachat.
Par conséquent l’âge de l’assuré, le taux d’investissement dans les unités de compte,
l’ancienneté du contrat, le montant de la provision mathématique du contrat et l’existence
antérieure d’un rachat partiel sont des éléments qui sont retenus comme déclencheurs de
l’acte de rachat qu’il soit partiel ou total et seront donc utilisés par la suite dans le modèle
de régression.
La variable NB_UC n’est pas retenue car le nombre d’unités de compte détenu par l’assuré
est fortement corrélé avec le taux d’investissement dans les unités de compte. La variable 6 Seuil choisi par SAS qui s’appuie sur les travaux de Costanza, M.C et Afifi « Comparison of Stopping
Rules in Forward Stepwise Discriminant Analysis »
42
Class_CSP ne sera également pas retenue car la catégorie socioprofessionnelle des assurés
est peu renseignée. De plus nous remarquons que le réseau de distribution n’est pas lié aux
rachats d’après les tests précédents alors que nous l’utilisons au sein d’Allianz pour le calcul
des lois de rachats détaillé dans la partie 2.
4.2.2) Résultats de la régression
Nous allons regarder les différents résultats obtenus par le modèle logistique.
Le modèle est implémenté pour l’année 2012 et testé sur l’année 2013.
� Modèle avec les variables sélectionnées sans classification des modalités.
Nous allons présenter les différents résultats obtenus par la procédure « proc logistic » de
SAS.
Les résultats du tableau suivant indiquent que les tests de validité du modèle de Wald et du
rapport de la vraisemblance sont significatifs ; en effet la « p-value » de la dernière colonne
est inférieure au seuil de 5%. Par conséquent il existe au moins un des coefficients de la
régression logistique qui est non nul.
Test de l'hypothèse nulle globale
Test Khi 2 DDL Pr > Khi 2
Likelihood Ratio 58933.5670 5 <.0001
Wald 57579.8236 5 <.0001
Nous observons d’après le tableau des estimations des paramètres de la régression que
chaque variable du modèle est significative au sens du test de Wald ; en effet la « p-value »
calculée dans la dernière colonne est inférieure au seuil de 5%. Nous avons de plus un
résultat intéressant en comparant le Khi2 de Wald car plus celui-ci est élevé et plus la
variable est significative ; la valeur critique étant 3,84 qui correspond à un seuil de confiance
de 95%. Le taux d’investissement dans les unités de compte et l’antériorité d’un rachat
apparaissent comme étant nettement significatifs ; l’ancienneté l’est également mais dans
une moindre mesure.
Ce tableau contient également les coefficients de chaque variable dans la régression
logistique (ou plus précisément les estimateurs de ces coefficients). Il s’agit de la colonne
« Estimation ». Chaque estimateur est soumis à une part d’incertitude mesurée par son écart
type (appelé «Erreur type »).
43
Estimation des paramètres de la régression logistique
Analyse des estimations du maximum de vraisemblance
Paramètre DDL Estimation
Erreur
type
Khi 2
de Wald Pr > Khi 2
Intercept 1 -0.0296 0.0145 4.1626 0.0413
Anciennete 1 0.0353 0.000557 4003.6964 <.0001
age_lors_du_rachat 1 0.00379 0.000214 313.6032 <.0001
tauxinvestissement_UC 1 0.0135 0.000180 5599.9313 <.0001
PM_122012_2013_total 1 1.139E-6 6.254E-8 331.7411 <.0001
class_nbrachats 1 1.7364 0.00755 52918.1363 <.0001
Aire sous la courbe de ROC
Percent Concordant 71.9
Percent Discordant 27.2
C 0.723
La valeur de l’aire sous la courbe de ROC est indiquée par la lettre C. Cette valeur est de
0,723 ce qui implique un modèle acceptable d’après la classification définie au tableau 4.1.
� Modèle avec les variables sélectionnées avec classification des modalités.
Le processus de sélection des modalités est le suivant :
44
Nous rappelons que la classification a pour but de simplifier l’analyse et l’interprétation des
résultats du modèle.
La classification retenue est la suivante :
� ancienneté du contrat : cette variable a été découpée en 4 classes
Tranche Inégalité Libellé
Ancienneté moyenne
Classe 1 ] 0-4] anciennete ≤ 4 moins de 4 ans 2
Classe 2 [5-7] 5 ≤ anciennete ≤7 de 5 à 7 ans 6
Classe 3 [8-10] 8≤ anciennete ≤10 de 8 à 10 ans 9
Classe 4 [11 - 11≤ anciennete plus de 10 ans 17,5
Les classes ont été définies de manière à isoler les deux pics fiscaux de 4 et 8 ans.
� âge de l’assuré : cette variable a été découpée en 4 classes
Tranche Inégalité Libellé Age moyen
Classe 1 ] 0-50] age_lors_du_rachat ≤50 moins de 50 ans 37
Classe 2 [51-63] 51≤ age_lors_du_rachat ≤ 63 de 51 à 63 ans 58
Classe 3 [64-75] 64≤ age_lors_du_rachat ≤75 de 64 à 75 ans 69
Classe 4 [76 - 75< age_lors_du_rachat plus de 75 ans 82
Le découpage a été réalisé par quartile ; il correspond aux différentes étapes de la vie de
l’assuré.
Classification
des modalités
initiales par
quantile
Test sur la
Régression
Vérification de la
significativité des modalités
avec test de WALD
Si non
significatif
Nouvelle
classification
Si significatif
Terminé
45
� Montant de la provision mathématique du contrat (en euros) :
Tranche Inégalité Libellé
Provision moyenne
Classe 1 ] 0-4000] PM_122012_2013_total ≤ 4000 moins de 4k€ 1 492
Classe 2 ] 4000-12000] 4000 < PM_122012_2013_total ≤ 12000 de 4 à 12k€ 7 634
Classe 3 ] 12000-34000[ 12000 < PM_122012_2013_total < 34000 de 12 à 34k€ 20 974
Classe 4 [34000 - 34000 ≤PM_122012_2013_total plus de 34k€ 95 529
Le découpage a été réalisé par quartile avec réajustement des bornes afin que le test de
Wald par classe soit valide.
� Taux d’investissement dans les unités de compte du contrat :
Tranche Inégalité Libellé Taux moyen
Classe 1 0 tauxinvestissement_UC_2012_2013= 0% 0% 0%
Classe 2 ]0-25] 0% < tauxinvestissement_UC_2012_2013 ≤25% de 0 à 25% 15%
Classe 3 ]25-50[ 25% < tauxinvestissement_UC_2012_2013 ≤50% de 25 à 50% 36%
Classe 4 ]50 50%<tauxinvestissement_UC_2012_2013 plus de 50% 85%
Nous avons isolé les contrats investis totalement dans les fonds en euros.
� Existence d’un rachat partiel antérieur au contrat :
Tranche Inégalité Libellé
Classe 1 0 nbrachats = 0 pas de rachat avant le rachat concerné
Classe 2 1 ou plus nbrachats >=1 un ou plusieurs rachats avant le rachat concerné
Par la suite nous allons étudier les odds-ratios provenant du modèle sur ces classes afin
d’évaluer la tendance des rachats par rapport à une classe de référence. Nous allons ensuite
confronter ces résultats aux odds-ratios empiriques ainsi qu’aux statistiques descriptives.
Les résultats obtenus par la procédure SAS « proc logistic » sont décrits ci-dessous.
Dans un premier temps nous présentons (tableau 4.2) l’analyse des effets de type 3 en
présence de variables qualitatives (c'est-à-dire après l’instruction class). Cette analyse est
effectuée pour chaque variable en comparant le sous modèle excluant la variable au modèle
incluant cette variable et les autres afin de tester l’hypothèse nulle H0 : cette variable est
sans effet dans le modèle pourvu que les autres variables y soient.
Il ressort du tableau 4.2 que les variables sectionnées sont validées au sens de Wald car leurs
p-value sont inférieures à 5%.
46
Tableau 4.2
Analyse des effets de type 3
Effet DDL
Khi 2
de Wald Pr > Khi 2
class_anciennete 3 4891.3763 <.0001
class_age_lors_du_rachat 3 843.4005 <.0001
class_tauxinvestissement_UC 3 3947.1146 <.0001
class_PM_122012_2013_total 3 22909.3985 <.0001
class_nbrachats 1 47188.0112 <.0001
Le tableau 4.3 contient les valeurs des estimateurs des coefficients de la régression. Les
variables sont découpées par les modalités définies ci-dessus. Il ressort que le découpage
des variables est validé au sens de Wald car toutes les modalités sont significatives au test
de Wald.
Estimation des paramètres de la régression logistique
Tableau 4.3
Analyse des estimations du maximum de vraisemblance
Paramètre DDL Estimation
Erreur
type
Khi 2
de Wald Pr > Khi 2
Intercept 1 2.0791 0.0185 12647.3645 <.0001
class_anciennete 1 1 -0.4430 0.0101 1922.9362 <.0001
class_anciennete 2 1 -0.6100 0.0113 2892.8835 <.0001
class_anciennete 3 1 -0.6492 0.0114 3215.3965 <.0001
class_age_lors_du_rachat 1 1 -0.0930 0.0115 65.4081 <.0001
class_age_lors_du_rachat 2 1 -0.2535 0.0110 531.0043 <.0001
class_age_lors_du_rachat 3 1 -0.2547 0.0106 572.2461 <.0001
class_tauxinvestissement_UC 1 1 -0.7932 0.0153 2680.0840 <.0001
class_tauxinvestissement_UC 2 1 -0.3644 0.0178 417.8867 <.0001
class_tauxinvestissement_UC 3 1 -0.2631 0.0210 156.8767 <.0001
class_PM_122012_2013_total 1 1 -0.9737 0.0101 9374.8587 <.0001
class_PM_122012_2013_total 2 1 0.2716 0.0120 514.0083 <.0001
47
Analyse des estimations du maximum de vraisemblance
Paramètre DDL Estimation
Erreur
type
Khi 2
de Wald Pr > Khi 2
class_PM_122012_2013_total 3 1 0.3259 0.0117 781.5125 <.0001
class_nbrachats 1 1 1.7082 0.00786 47188.0112 <.0001
Nous rappelons (tableau 4.4) la classification qui a été définie auparavant sur les variables
sélectionnées et nous introduisons les variables class_*. Cela permettra une analyse des
odds-ratios.
Tableau 4.4
Donnons quelques résultats et remarques sur les odds-ratios.
variables condition class_* modalités de class_*
ancienneté anciennete ≤ 4 class_anciennete 1
ancienneté 5≤ anciennete ≤7 class_anciennete 2
ancienneté 8≤ anciennete ≤10 class_anciennete 3
ancienneté 11≤ anciennete class_anciennete 4
age_lors_du_rachat age_lors_du_rachat ≤50 class_age_lors_du_rachat 1
age_lors_du_rachat 51≤ age_lors_du_rachat ≤ 63 class_age_lors_du_rachat 2
age_lors_du_rachat 64≤ age_lors_du_rachat≤75 class_age_lors_du_rachat 3
age_lors_du_rachat 75< age_lors_du_rachat class_age_lors_du_rachat 4
PM_122012_2013_total PM_122012_2013_total ≤ 4000 class_PM_122012_2013_total 1
PM_122012_2013_total 4000 < PM_122012_2013_total ≤ 12000 class_PM_122012_2013_total 2
PM_122012_2013_total 12000 < PM_122012_2013_total < 34000 class_PM_122012_2013_total 3
PM_122012_2013_total 34000 ≤ PM_122012_2013_total class_PM_122012_2013_total 4
tauxinvestissement_UC_2012_2013 tauxinvestissement_UC_2012_2013 = 0 class_tauxinvestissement_UC 1
tauxinvestissement_UC_2012_2014 0 < tauxinvestissement_UC_2012_2013 ≤ 25 class_tauxinvestissement_UC 2
tauxinvestissement_UC_2012_2015 25< tauxinvestissement_UC_2012_2013 ≤ 50 class_tauxinvestissement_UC 3
tauxinvestissement_UC_2012_2016 50< tauxinvestissement_UC_2012_2013 class_tauxinvestissement_UC 4
48
� Dans le cas de variables discrétisées, une modalité de référence est définie, par exemple la modalité 4 de la variable tauxinvestissement_UC_2012_2013 et les odds-ratios des autres modalités sont supérieurs à 1 pour les modalités influant plus que la modalité de référence sur la probabilité à prédire et inférieurs à 1 sinon. Plus le taux d’investissement dans les unités de compte est faible et plus la probabilité de racheter le contrat diminue (aversion au risque).
Odds-ratio taux d’investissement dans les unités de compte
Modèle Empirique
1 vs 4 0.452 1.84
2 vs 4 0.695 3.51
3 vs 4 0.769 3.53
� Lorsque le montant de la provision mathématique diminue la probabilité de rachat diminue.
Odds-ratio montant de la provision du contrat
Modèle Empirique
1 vs 4 0.378 0.54
2 vs 4 1.312 0.71
3 vs 4 1.385 0.78
� Nous avons une tendance baissière sur les résultats obtenus. C’est en adéquation avec la tendance baissière du graphe 3.9 où nous observons que la probabilité de rachat diminue avec l’âge de l’assuré.
Odds-ratio âge de l’assuré
Modèle Empirique
1 vs 4 0.911 1.19
2 vs 4 0.776 1.17
3 vs 4 0.775 1.13
49
� Les résultats sont difficiles à interpréter car nous avons une tendance baissière sur les résultats du modèle et une tendance haussière sur les résultats empiriques. Le graphe 3.10 nous donne comme indication que la probabilité de rachat diminue avec l’ancienneté après le pic fiscal de 8 ans.
Odds-ratio ancienneté du contrat
Modèle Empirique
1 vs 4 0.642 0.99
2 vs 4 0.543 1.11
3 vs 4 0.522 1.46
� Les assurés n’ayant jamais effectué de rachats partiels sur leurs contrats ont une probabilité nettement plus élevée d’effectuer un retrait par rapport aux assurés qui ont effectué un retrait partiel par le passé.
Odds-ratio existence d’un rachat partiel par le passé
1 vs 2 5.519
Notre comparaison montre que les calculs des odds-ratios empiriques et modélisés
présentent des écarts importants et disent parfois l’inverse. Par exemple le modèle nous dit
que la probabilité de rachat est plus faible pour un assuré âgé de 51 à 63 ans (OR=0,776) par
rapport à un assuré âgé de plus de 75 ans. Les résultats empiriques nous disent l’inverse
(OR=1,17). Mais nous retrouvons souvent la même tendance sur les odds-ratios. Nous
verrons ci-dessous que l’utilisation du modèle pour la prédiction du rachat est bien meilleur
et donnent des résultats encourageants.
Nous allons maintenant observer la fiabilité de la prédiction du modèle en regardant les
paramètres de la courbe de ROC (tracé et aire sous la courbe).
Aire sous la courbe de ROC
Percent Concordant 76.0
Percent Discordant 22.4
C 0.768
Les résultats ci-dessus indiquent que l’aire sous la courbe de ROC s’est améliorée passant de
0,723 pour un modèle à variables sans classe à 0,768 pour un modèle à variables classifiées.
50
Ci-dessous (figure 4.2) le tracé de la courbe de ROC.
Courbe de ROC
Figure 4.2
� Vérification du modèle sur un échantillon de validation
La validation du modèle se fera sur les données de rachats effectués dans l’année 2013.
Nous calculons les probabilités prédites au niveau du contrat et l’aire sous la courbe de ROC
avec les paramètres fixés de la régression 2012.
Nous obtenons les résultats suivants :
Aire sous la courbe de ROC
Percent Concordant 79.6
Percent Discordant 18.7
C 0.805
Sensitivity
0.000.050.100.150.200.250.300.350.400.450.500.550.600.650.700.750.800.850.900.951.00
1 - Specificity
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
51
Courbe de ROC
Figure 4.3
La régression donne une aire sous la courbe de ROC de 0,805 pour l’échantillon de
validation.
Cette modélisation est donc efficace d’après la classification définie au (4.1) pour estimer
des probabilités de rachat au niveau du contrat d’après la sélection des variables les plus
significatives pour le déclenchement du rachat.
Nous allons maintenant étudier le montant des rachats sur les modalités des variables
sélectionnées par la méthode logistique.
Sensitivity
0.000.050.100.150.200.250.300.350.400.450.500.550.600.650.700.750.800.850.900.951.00
1 - Specificity
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
52
5) Modélisation des montants rachetés par un GLM
5.1) Introduction du modèle
Le modèle GLM sera décrit succinctement car c’est le même raisonnement que la régression
logistique mais avec une fonction de lien différente.
Le modèle linéaire s’écrit F% = �@ + ����% + �:�:% +⋯+ �;�;% + �% avec �@, ��, … , �; paramètres à estimer.
On suppose l’échantillon de taille � c'est-à-dire1 ≤ � ≤ �.
Sous la forme matricielle l’équation s’écrit5 = 9� + �.
L’estimateur des moindres carrés ordinaire est donné par :
�1 = (9%9)��(9%5)7 Cet estimateur est sans biais et convergent et est qualifié de BLUE (« Best Linear Unbiaised
Estimator ») car il est démontré qu’il s’agit du meilleur estimateur linéaire sans biais.
Cela est vrai si les hypothèses suivantes sont vérifiées :
� L’espérance mathématique de l’erreur est nulle : �(�%) = 0
� La variance de l’erreur est constante : ehu(�%) = �:�
� Indépendance des erreurs i�e(�%, �%�) = �(�%, �%�) = 0�� Q� ≠ �′ � Indépendance entre l’erreur et les valeurs des variables explicatives i�e(�%, ��%) = 0
� �% est normalement et identiquement distribué
Le résidu noté W%est défini comme l’écart entre la série à expliquer observée F% et la série à
expliquer ajustée F%P : W% = F% − F%P
La qualité de l’ajustement linéaire se mesure par le coefficient de corrélation u:défini par :
u: = ¢£¤¢£¥ avec �i� = ∑F%P : et �i� = ∑F%:.
Nous pouvons écrire sous les différentes formes matricielles le modèle linéaire :
5 = 9� + � Modèle théorique définit ci-dessus
7 Régis Bourbonnais : « Econométrie ».Dunod, 2011.
53
5 = 9�1 + WModèle estimé, l’erreur est maintenant résidu
La matrice des variances covariances des coefficients �1�est donnée par :
e"1 =�:�§ × (9%9)�� Avec �:�§ = ∑ ¨©4\©ª].�x�� appelé variance résiduelle (c’est une estimation
de la variance de l’erreur).
Les variances des coefficients �1�se lisent sur la première diagonale (nous les nommerons �1"1- ) de cette matrice et les covariances à l’extérieur de cette première diagonale.
Or "1-�"-�P«P- suit une loi de Student à � − w − 1 degrés de liberté8.
Sous l’hypothèse q@ : �� = 0 (contre �� ≠ 0) le ratio de Student "1-�@�P«P- suit donc une loi de
Student à � − w − 1 degrés de liberté.
Le test d’hypothèses bilatéral consiste donc à comparer le ratio de Student calculé pour
chaque coefficient �1� à la valeur � de Student à � − w − 1 degrés de liberté et pour un seuil
de probabilité fixé à 5%.
SAS effectue ce calcul avec la p-value.
Le test de significativité global du modèle de régression est associé aux hypothèses
suivantes :
q@ : �� = �: = ⋯ = �x = 0 contre q�: il existe au moins un coefficient non nul.
La statistique :
g = ¬4 x(��¬4) (.�x��)® ~ loi de Fisher à w et � − w − 1 degrés de liberté (comme rapport de
deux lois de chi-deux).
Comme précédemment le test d’hypothèses consiste à comparer ce ratio calculé à la valeur
du quantile associé à une loi de Fisher à w et � − w − 1 degrés de liberté et pour un seuil de
probabilité fixé à 5%.
SAS effectue également ce calcul avec la p-value pour un seuil de 5%.
La valeur du u: est fournie par SAS.
8 Régis Bourbonnais : « Econométrie ».Dunod, 2011.
54
5.2) Analyse de la distribution des montants de retraits
Nous présentons un récapitulatif de la distribution du montant des rachats sur les années
2012 et 2013.
Variable d'analyse : montant rachat
Nb Moyenne Médiane Minimum Maximum
511 805 6316 1000 0.03 3 113 009
La visualisation graphique de la distribution des montants de rachats est la suivante :
Distribution du montant des rachats
Il y a beaucoup de faibles montants rachetés. Environ 50% des rachats sont inférieurs à
1 000 € et le reste est réparti sur la queue de distribution.
La répartition des montants de rachats suit elle une loi log normale ?
Pour y répondre nous allons-nous intéresser à la variable log (montant des rachats)
Le détail des statistiques de la variable log (montant des rachats) est précisé dans le tableau
ci-dessous :
PERCENT
0
10
20
30
40
50
MT_RACH
0 2000
4000
6000
8000
10000
12000
14000
16000
18000
20000
22000
24000
26000
28000
30000
55
Mesures statistiques de base
Position Variabilité
Moyenne 7.084010 Ecart-type 1.77209
Médiane 6.907755 Variance 3.14031
Mode 5.298317 Intervalle 18.45766
Ecart interquartile 2.73328
Le graphique (figure5.1) compare la distribution du log montant des rachats avec la
distribution d’une loi normale.
Figure 5.1
Le test de Kolmogorov-Smirnov ne valide pas l’hypothèse de normalité de la variable log
(montant des rachats).
Courbe: Normal(Mu=7.084 Sigma=1.7721)
Pourcentage
0
5
10
15
20
25
lmontant_rachat_par_mois
-4 -2 0 2 4 6 8 10 12 14 16
56
Paramètres pour distribution
Normal
Paramètre Symbole Estimation
Moyenne Mu 7.08401
Ecart type Sigma 1.772092
Tests d'ajustement pour distribution Normal
Test Statistique p-valeur
Kolmogorov-Smirnov D 0.0714 Pr > D <0.010
Quantiles pour distribution
Normale
Pourcentage
Quantile
Observé Estimé
1.0 3.91860 2.96151
5.0 4.60517 4.16918
10.0 4.94164 4.81298
25.0 5.70378 5.88875
50.0 6.90776 7.08401
75.0 8.43707 8.27927
90.0 9.54647 9.35504
95.0 10.16286 9.99884
99.0 11.38581 11.20651
La normalité du logarithme des montants n’est pas prouvée. La recherche de l’adéquation
de cette distribution à une loi connue (gamma,…) n’est pas aisée.
5.3) Résultats
Le modèle GLM est utilisé pour estimer le log (montant des rachats) en fonction des
variables et des classes définies par le modèle logistique. C’est le log (montant des rachats)
qui est utilisé pour le modèle GLM car cette transformation de variable à expliquer est celle
qui offre un coefficient de R2 le plus élevé.
57
Les résultats sont présentés ci-dessous :
Significativité globale du modèle
Source DDL
Somme des
carrés
Carré
moyen Valeur F Pr > F
Model 13 327135.040 25164.234 10100.8 <.0001
Error 506130 1260931.318 2.491
Corrected Total 506143 1588066.358
Le modèle est globalement significatif car la p value est inférieur à 0,05 : Il existe au moins
un des coefficients de la régression qui soit non nul.
Calcul du R2
R carré
0.205996
On notera que le R2 est assez faible donc nous ne pourrons pas utiliser ce modèle en
prédiction pour estimer les montants rachetés.
58
Estimation des paramètres de la régression
Paramètre Estimation Erreur type Valeur du test t Pr > |t|
Intercept 7.300375604 B 0.01101446 662.80 <.0001
class_anciennete 1 -0.921888470 B 0.00596604 -154.52 <.0001
class_anciennete 2 -0.733394842 B 0.00648605 -113.07 <.0001
class_anciennete 3 0.102393223 B 0.00817438 12.53 <.0001
class_anciennete 4 0.000000000 B . . .
class_age_lors_du_rachat 1 0.828953478 B 0.00729936 113.57 <.0001
class_age_lors_du_rachat 2 0.691343261 B 0.00641867 107.71 <.0001
class_age_lors_du_rachat 3 0.203700375 B 0.00559598 36.40 <.0001
class_age_lors_du_rachat 4 0.000000000 B . . .
class_nbrachats 1 -0.606121417 B 0.00916993 -66.10 <.0001
class_nbrachats 2 0.000000000 B . . .
class_tauxinvestissement.. 1 0.046282310 B 0.00969608 4.77 <.0001
class_tauxinvestissement.. 2 -0.351212684 B 0.01010809 -34.75 <.0001
class_tauxinvestissement.. 3 -0.164479807 B 0.01156469 -14.22 <.0001
class_tauxinvestissement.. 4 0.000000000 B . . .
class_PM_122012_2013.. 1 0.524289355 B 0.00654055 80.16 <.0001
class_PM_122012_2013.. 2 0.354483207 B 0.00824776 42.98 <.0001
class_PM_122012_2013.. 3 -0.384386363 B 0.00600912 -63.97 <.0001
class_PM_122012_2013.. 4 0.000000000 B . . .
Toutes les modalités définies des variables sélectionnées sont significatives au sens du test
de Student.
Des informations intéressantes sont obtenues à partir de l’estimation des paramètres ci-
dessus :
59
• La classe d’âge dont les montants rachetés sont les plus élevés est la tranche 0-50 ans
qui est la catégorie qui a été définie comme la plus jeune ; ces montants diminuent
ensuite progressivement avec l’âge (les assurés plus âgés possèdent d’autres
ressources financières pour ne pas puiser dans l’assurance vie).
Les statistiques descriptives nous donnent les résultats suivants :
Tranche Inégalité Libellé Rachat moyen
Classe 1 ] 0-50] age_lors_du_rachat ≤50 moins de 50 ans 8 479
Classe 2 [51-63] 51≤ age_lors_du_rachat ≤ 63 de 51 à 63 ans 8 209
Classe 3 [64-75] 64≤ age_lors_du_rachat ≤75 de 64 à 75 ans 5 766
Classe 4 [76 - 75< age_lors_du_rachat plus de 75 ans 4 217
Ce tableau conforte bien les résultats du modèle.
• Les contrats essentiellement investis en euros sont ceux dont les montants rachetés sont les plus élevés. Les statistiques descriptives nous donnent les résultats suivants :
Tranche Inégalité Libellé Rachat moyen
Classe 1 0 tauxinvestissement_UC_2012_2013= 0% 0% 7 785
Classe 2 ]0-25] 0% < tauxinvestissement_UC_2012_2013 ≤25% de 0 à 25% 3 830
Classe 3 ]25-50[ 25% < tauxinvestissement_UC_2012_2013 ≤50% de 25 à 50% 4 162
Classe 4 ]50 50%<tauxinvestissement_UC_2012_2013 plus de 50% 6 295
Ce tableau conforte notre analyse provenant du modèle.
• Plus le montant de la provision mathématique augmente et plus le montant des
rachats diminue. Les statistiques descriptives nous donnent les résultats suivants :
Tranche Inégalité Libellé Rachat moyen
Classe 1 ] 0-4000] PM_122012_2013_total ≤ 4000 moins de 4k€ 7 785
Classe 2 ] 4000-12000] 4000 < PM_122012_2013_total ≤ 12000 de 4 à 12k€ 3 830
Classe 3 ] 12000-34000[ 12000 < PM_122012_2013_total < 34000 de 12 à 34k€ 4 162
Classe 4 [34000 - 34000 ≤PM_122012_2013_total plus de 34k€ 6 295
Ce tableau confirme une tendance baissière globale même si elle s’inverse pour une
provision supérieure à 34 000 €.
60
• Le montant racheté augmente avec l’ancienneté. Les statistiques descriptives nous donnent les résultats suivants :
Tranche Inégalité Libellé Rachat moyen
Classe 1 ] 0-4] anciennete ≤ 4 moins de 4 ans 4 887
Classe 2 [5-7] 5 ≤ anciennete ≤7 de 5 à 7 ans 4 688
Classe 3 [8-10] 8≤ anciennete ≤10 de 8 à 10 ans 9 683
Classe 4 [11 - 11≤ anciennete plus de 10 ans 8 366
Nous retrouvons ici une tendance haussière avec l’ancienneté même si le rachat de la
classe 4 est inférieur à celui de la classe 3.
Ci-dessous le test de Tukey9 qui est un test de comparaison de moyennes à postériori
validant que le découpage par classes (définies par la régression logistique) des différentes
variables est significatif au seuil défini de 5%.
Test de Tukey pour la variable class_anciennete
Comparaisons significatives au niveau 0.05 indiquées par : ***.
class_anciennete
Comparaison
Différence
entre
les moyennes
Simultané 95% Limites
de confiance
3 – 4 0.305902 0.285132 0.326672 ***
3 – 2 1.226677 1.205429 1.247926 ***
3 – 1 1.396704 1.376615 1.416792 ***
4 – 3 -0.305902 -0.326672 -0.285132 ***
4 – 2 0.920775 0.904973 0.936577 ***
4 – 1 1.090801 1.076597 1.105005 ***
2 – 3 -1.226677 -1.247926 -1.205429 ***
2 – 4 -0.920775 -0.936577 -0.904973 ***
2 – 1 0.170026 0.155131 0.184921 ***
1 – 3 -1.396704 -1.416792 -1.376615 ***
9 Pour le détail de ce test voir Mohamed Elmethni « Mathématiques appliquées & sciences humaines
et sociales » : http://domus.grenet.fr/grimass/MathSHS/PSY3/ANOVA/Cours/Chap8.htm
61
Comparaisons significatives au niveau 0.05 indiquées par : ***.
class_anciennete
Comparaison
Différence
entre
les moyennes
Simultané 95% Limites
de confiance
1 – 4 -1.090801 -1.105005 -1.076597 ***
1 – 2 -0.170026 -0.184921 -0.155131 ***
Test de Tukey pour la variable class_age_lors_du_rachat
Comparaisons significatives au niveau 0.05 indiquées par : ***.
class_age_lors_du_
rachat
Comparaison
Différence
entre
les moyennes
Simultané 95% Limites
de confiance
1 – 2 0.329135 0.310081 0.348189 ***
1 – 3 0.871753 0.854192 0.889314 ***
1 – 4 1.088360 1.070882 1.105837 ***
2 – 1 -0.329135 -0.348189 -0.310081 ***
2 – 3 0.542618 0.526435 0.558802 ***
2 – 4 0.759225 0.743132 0.775318 ***
3 – 1 -0.871753 -0.889314 -0.854192 ***
3 – 2 -0.542618 -0.558802 -0.526435 ***
3 – 4 0.216607 0.202313 0.230901 ***
4 – 1 -1.088360 -1.105837 -1.070882 ***
4 – 2 -0.759225 -0.775318 -0.743132 ***
4 – 3 -0.216607 -0.230901 -0.202313 ***
62
Test de Tukey pour la variable class_nbrachats
Les moyennes avec la même lettre ne sont pas très
différentes.
Tukey Groupement Moyenne Nb class_nbrachats
A 7.158199 471217 2
B 5.973390 34927 1
Test de Tukey pour la variable class_tauxinvestissement_UC
Comparaisons significatives au niveau 0.05 indiquées par : ***.
class_tauxinvestiss
ement_UC
Comparaison
Différence
entre
les moyennes
Simultané 95% Limites de
confiance
1 – 4 0.339601 0.315446 0.363757 ***
1 – 3 0.712446 0.692503 0.732388 ***
1 – 2 0.969823 0.956406 0.983239 ***
4 – 1 -0.339601 -0.363757 -0.315446 ***
4 – 3 0.372844 0.343357 0.402332 ***
4 – 2 0.630221 0.604691 0.655752 ***
3 – 1 -0.712446 -0.732388 -0.692503 ***
3 – 4 -0.372844 -0.402332 -0.343357 ***
3 – 2 0.257377 0.235790 0.278965 ***
2 – 1 -0.969823 -0.983239 -0.956406 ***
2 – 4 -0.630221 -0.655752 -0.604691 ***
2 – 3 -0.257377 -0.278965 -0.235790 ***
63
Test de Tukey pour la variable class_PM_122012_2013_total
Comparaisons significatives au niveau 0.05 indiquées par : ***.
class_PM_122012_
2013_total
Comparaison
Différence
entre
les moyennes
Simultané 95% Limites de
confiance
1 – 2 0.301000 0.278583 0.323416 ***
1 – 4 1.201134 1.186429 1.215839 ***
1 – 3 1.431635 1.413708 1.449562 ***
2 – 1 -0.301000 -0.323416 -0.278583 ***
2 – 4 0.900134 0.879745 0.920524 ***
2 – 3 1.130635 1.107812 1.153459 ***
4 – 1 -1.201134 -1.215839 -1.186429 ***
4 – 2 -0.900134 -0.920524 -0.879745 ***
4 – 3 0.230501 0.215183 0.245819 ***
3 – 1 -1.431635 -1.449562 -1.413708 ***
3 – 2 -1.130635 -1.153459 -1.107812 ***
3 – 4 -0.230501 -0.245819 -0.215183 ***
64
Nous allons tracer (figure 5.2) le graphe des résidus en fonction de la valeur prédite ; on
observe une forte dispersion qui invalide le modèle pour la prédiction (comme nous l’avons
déjà vu avec un faible R2).
Graphe des résidus en fonction de la valeur prédite.
Figure 5.2
Nous traçons (figure 5.3) la courbe QQplot et un histogramme de répartition des résidus
(figure 5.4) afin d’observer si les résidus suivent une loi normal.
65
Tracé QQplot
Figure 5.3
Distribution des résidus
Figure 5.4
Courbe: Normal(Mu=22E-13 Sigma=1.5784)
Pourcentage
0
5
10
15
20
25
30
Residu
-10 -8 -6 -4 -2 0 2 4 6 8 10
66
Le test de Kolmogorov ainsi que les graphes 5.3 et 5.4 invalident l’hypothèse de normalité
des résidus.
Tests d'ajustement pour distribution Normal
Test Statistique DDL p-valeur
Kolmogorov-Smirnov D 0.0509 Pr > D <0.010
Une régression par Spline cubique (tableau 5.1) a été effectuée afin d’améliorer le pouvoir
prédictif du modèle ; cela améliore légèrement le R2 puisqu’il passe de 0,206 à 0,215 mais
cela reste faible.
Tableau 5.1
RANSREG MORALS Algorithm Iteration History for
Identity(lmontant_rachat_par_mois)
Iteration
Number
Average
Change
Maximum
Change R carré
Criterion
Change Note
1 0.33771 16.9264 0.17449
2 0.02368 2.40457 0.21508 0.04059
3 0.00292 0.22543 0.21546 0.00037
4 0.00033 0.02881 0.21546 0.00000
5 0.00004 0.00326 0.21546 0.00000
6 0.00001 0.00044 0.21546 0.00000 Converged
En résumé l’approximation des montants de rachats par GLM offre un R2 assez faible donc
on ne pourra pas l’utiliser comme modèle prédictif mais il sera utile pour donner des
indications sur l’évolution du montant des rachats en fonction des variables et des classes
sélectionnées par la régression logistique.
Rappelons les principaux éléments retenus de ce modèle :
La classe d’âge dont les montants rachetés sont les plus élevés est la tranche 0-50 ans qui est
la catégorie qui a été définie comme la plus jeune ; ces montants diminuent ensuite
67
progressivement avec l’âge (les assurés plus âgés possèdent d’autres ressources financières
pour ne pas puiser dans l’assurance vie).
Les montants rachetés les plus élevés sont dans les contrats essentiellement investis en
euros.
Lorsque le montant de la provision mathématique augmente ; le montant des rachats
diminue.
Le montant racheté augmente avec l’ancienneté.
68
6) Modélisation des taux de rachats par la théorie de la crédibilité
6.1) Introduction
L’objet de cette partie est de modéliser les taux de rachats par la théorie de la crédibilité.
Deux modèles seront utilisés : le modèle de Bühlmann classique et le modèle de
Bühlmann-Straub plus élaboré prenant en compte une pondération par année.
L’inventeur de cette théorie vers la fin des années 60 est Hans Bühlmann; elle fut
développée à partir des méthodes Bonus-Malus et des travaux de Delaporte.
Cette théorie va permettre de prédire les rachats en calculant une pondération entre les
données à priori et les observations historiques.
Cette théorie a été appliquée aux montants des rachats.
Avant de présenter les deux modèles nous allons définir de manière générale ce qu’est le
modèle de crédibilité.
Nous définissons un paramètre Θ qui permet de distinguer les individus. Θ est une variable
aléatoire. Nous observons les sinistres 9 sur n périodes. Les 9� sont indépendants
conditionnellement à Θ.
La variance de X se décompose ainsi :
Avec w qui est la part d’incertitude qui disparaît lorsqu’on connait les réalisations de X et v
qui est l’incertitude moyenne qui reste malgré l’information sur les réalisations de X
Nous définissons le coefficient d’information par :
Plus k est faible et plus l’information est pertinente.
6.2) Le modèle de Bühlmann
Soit 9�% une variable aléatoire relative au risque ( observée l’année � ; on peut prendre par
exemple la charge annuelle de sinistres, le nombre de sinistres ou le S/P.
Par la suite cette variable représentera le montant racheté pour un groupe de contrats.
On suppose que ( varie de 1àQet � varie de 1à�.
On souhaite estimer E [9�.J�|9�� = ���, 9�: = ��:, ………9�. = ��.� .
( ) ( )[ ] ( )[ ] wvXEVXVEXV +=Θ+Θ=
w
vk =
69
La méthode propose une pondération via le facteur de crédibilité entre les observations sur
le risque ( : (9��9�:……9�.) et d’autre part sur des risques du même type.
L’estimateur de crédibilité est une fonction linéaire des observations du risque (: G�(9��9�:……9�.) = �@ + ��9�� +�:9�:+….. +�.9�.. telle que la fonction
E (E (9�.J� –G�) 2) soit minimum.
Les hypothèses pour utiliser ce modèle sont les suivantes :
• Indépendance des variables 9�% • Pour chaque ( les variables sont équidistribuées
• La fonction de structure est inconnue mais on suppose que les paramètres
structuraux ci-dessous existent :
E(m( °i))=� , VAR (m( °i))=a , E(�2( °i))=±
Avec m (°i)= E (9�%) et �2( °i)= VAR (9�%) Nous souhaitons minimiser la fonction E (E (9�.J� –G�) 2) en cherchant les extremums par
dérivées partielles. Nous trouvons le paramètre suivant10 :
Z = ""J²4\
Facteur de crédibilité qui s’écrit aussi : Z = ..J²4«
Estimation des paramètres structuraux a, ± et � :
Auparavant on détermine
�̅� = 1�H��%.%3�
Et
�̅ = 1QH�̅� �3�
10 Détail de la démonstration dans l’ouvrage de Pierre Petauton : « Théorie de l’assurance
dommages ». Dunod, 2000.
70
� Estimation de � :
�̂ = �̅ = 1Q�HH��%.µ3�
¶3�
� Estimation de ± :
±̂ = 1QH�·̧P �3� = 1Q(� − 1)HH(��% − �̅�):.
%3�
�3�
� Estimation de a :
�1 = 1(Q − 1)H(�·¹ − �̅): �3� − ±�º
Si �P < 0 on prend�P = 0.
Ces estimateurs sont sans biais c'est-à-dire :
E (�̂)=� ; E (±̂)=± ; E (�1)=a
Donc l’estimation de Z est :
Z/ = ..J�» Avec �» = ¼P"P
Selon Bühlmann l’estimation est :
E [9�.J�|9�� = ���, 9�: = ��:, ………9�. = ��.� = Z/�·̧¹ + (1 − Z/)�̂ : c’est une pondération
entre la moyenne des observations passées �·̧¹ et de la moyenne à priori de�̂.
6.3) Le modèle de Bühlmann-Straub
Dans le modèle de Bühlmann, chaque risque se voit attribué le même poids dans le temps.
Le modèle de Bühlmann-Straub pallie à ce problème en attribuant un poids ½�%au cours du
temps en fonction de la taille ou de l’exposition du risque(. Soient ( allant de1àQ, et w allant de 1à�� .
71
On note ½� le poids total attribué au (è¿Àcontrat (ou groupe de contrats) pour les �� périodes d’observations
½� = H½�x.-x3�
Par la suite le poids est le nombre de contrats.
Et ½ est le poids total attribué à tous les contrats.
½ = H½�
�3�
X¶Â représente le montant de rachat moyen d’un contrat (ou groupe de contrats).
Les estimateurs de �, ±, � sont :
�̂ = 9à = 1½Hw¶X¶ �3� = 1½HHw¶ÂX¶Â
.-x3�
�3�
avec :
X¶ = 1½�Hw¶ÂX¶Â.-x3�
±̂ = HH½�x(X¶Â − X¹¶):.-x3�
�3� ∗ (H(�� − 1)
�3� )��
�1 = �∑ ½¶ÅX¶ −XÆ: �3� − ±̂(Q − 1)��½ − 1½∑ ½¶: �3� � = w ∗�∑ ½�(X¹¶ − X): �3� − ±̂(Q − 1)�½: −∑ ½�: �3�
L’estimateur du facteur de crédibilité pour le (è¿À contrat (ou groupe de contrats) est : Z»� = È-È-J�» ��W��» = ¼P"1. L’estimateur du montant moyen des rachats pour le (è¿À contrat (ou groupe de contrats)
est :
9»� =Z»�9� + (1 − Z»�)�̂
72
L’estimateur du montant total des rachats pour le (è¿À contrat (ou groupe de contrats) est : u»� = ½�..-`]9»� Remarque :
- �̂, ν1, �1 sont respectivement des estimateurs sans biais de �, ν, �. - Il est possible que �1 soit négatif, ce qui est indésirable puisque la variance doit être
toujours une valeur positive.
- Il est clair que nous retrouvons le modèle de Bühlmann si nous posons ½�x = 1 pour
tout couple ((, w)
6.4) Application aux rachats
Nous appliquons les deux modèles détaillés aux produits d’épargne. Cela donne des taux de
rachats estimés pour l’année 2014 à partir des données historiques de 2007 à 2013. Nous
comparons ensuite ces taux estimés aux taux de rachats réels calculés par la méthode Allianz
de ces produits pour l’année 2014 afin de juger de la qualité des résultats prédictifs des deux
modèles.
Produits Rouge1 Rouge2 Bleu Rose Rouge3 Vert
2007 4,08% 2,41% 3,87% 3,81% 0,87% 1,03%
2008 6,81% 4,55% 5,23% 4,51% 3,70% 3,58%
2009 5,79% 4,10% 5,26% 3,37% 4,12% 4,02%
2010 5,76% 3,69% 5,28% 3,50% 4,07% 3,90%
2011 6,81% 4,21% 5,32% 4,25% 5,41% 4,73%
2012 7,24% 3,99% 5,67% 3,67% 5,66% 4,96%
2013 6,72% 3,16% 4,01% 2,75% 5,25% 4,22%
Taux estimés 2014 Bühlmann 6,09% 3,84% 5,38% 3,75% 5,68% 4,19%
Taux estimés 2014 Bühlmann-Straub 5,96% 3,70% 4,41% 3,39% 6,40% 4,63%
Taux réels 2014 6,93% 3,79% 5,00% 3,56% 5,44% 4,64%
Produits Orange Jaune Violet Noir Marron
2007 5,98% 0,01% 0,00% 6,68% 3,39%
2008 6,82% 1,87% 4,64% 6,91% 3,56%
2009 6,20% 4,20% 3,66% 5,85% 3,09%
2010 6,42% 3,48% 4,61% 5,18% 2,86%
2011 7,57% 4,92% 4,27% 6,09% 3,00%
2012 7,78% 5,58% 4,58% 4,97% 2,78%
2013 6,46% 3,94% 3,68% 4,48% 2,46%
Taux estimés 2014 Bühlmann 6,70% 4,77% 4,59% 5,80% 3,04%
Taux estimés 2014 Bühlmann-Straub 6,76% 4,81% 4,64% 5,50% 2,94%
Taux réels 2014 7,27% 4,81% 4,18% 5,18% 2,75%
73
Nous remarquons que pour certains produits les deux méthodes donnent des taux de
rachats quasi identiques comme Orange ; en effet le nombre de contrat est assez stable sur
la période observé.
D’autres produits comme Bleu,… ont un taux de rachats estimé par Bühlmann –Straub
inférieur au taux de rachats estimé par Bühlmann ; en effet dans ce cas le nombre de
contrats a tendance à diminuer dans le temps.
Nous avons l’effet inverse sur d’autres produits comme Jaune et Violet.
Nous remarquons également que les deux modèles donnent une approximation des taux de
rachats assez proche des taux réels 2014.
Le modèle est également appliqué à la classification définie par la régression logistique sur la
variable ancienneté.
Ancienneté ≤ 4 ; 5 ≤ ancienneté ≤7 ; 8≤ ancienneté ≤10 ; 11≤ ancienneté
Nous remarquons également que les deux modèles donnent une approximation des taux de
rachats assez proche des taux réels 2014.
Cette théorie de la crédibilité nous a donc permis d’estimer des taux de rachats à partir de
l’historique des taux ; cette approche est intéressante car nous ne faisons pas de distinction
entre les rachats conjoncturels et structurels ; composantes déjà présentes dans l’historique
des taux.
De plus nous pouvons également l’appliquer à toutes les classifications définies par la
régression logistique et faire ainsi des projections non plus par produit mais par d’autres
catégories de découpage comme l’ancienneté par exemple ou encore l’âge…
Class_anciennete 1 2 3 4
2007 4,28% 4,81% 8,45% 4,20%
2008 6,10% 5,79% 8,03% 4,81%
2009 5,53% 4,71% 7,72% 4,01%
2010 6,10% 3,77% 7,42% 3,79%
2011 7,67% 4,25% 8,58% 4,44%
2012 7,86% 4,69% 7,67% 4,30%
2013 6,32% 4,53% 5,73% 3,73%
Taux estimés 2014 Bühlmann 6,23% 4,63% 7,59% 4,16%
Taux estimés 2014 Bühlmann-Straub 6,00% 5,14% 7,30% 4,19%
Taux réels 2014 7,28% 4,49% 7,33% 4,15%
74
7) Corrélations entre indicateurs financiers et taux de rachats
7.1) Recommandations de l’Autorité de Contrôle Prudentiel et de Résolution.
L’option de rachat est au cœur des nouvelles réglementations ; en effet les référentiels IFRS
4 phase 2 (International Financial Reporting Standards), Solvabilité 2 et MCEV (Market
Consistent Embedded Value) intègrent les rachats dans le calcul du cout des options et
garanties afin d’estimer au plus juste une provision « Best Estimate ». De plus sous
solvabilité 2, le calcul du SCR s’effectue en intégrant le calcul du SCR par risque, notamment
celui du rachat, comme le montre ci-dessous le calcul de la formule standard du SCR.
Formule Standard su SCR
SCR=BSCR – Adj + Op
� BSCR : SCR de base. Il se calcule de la manière suivante : BSCR=racine (somme des SCRi * SCRj *∝¶Â) + SCR intangibles.
SCRi étant le capital requis pour le module de risque i et ∝¶Â est le coefficient de
corrélation entre les deux modules de risque afin de tenir compte des effets de diversification.
� Adj : Ce module consiste à évaluer les montants de besoin en capitaux pouvant être absorbés par la participation aux bénéfices attribuée et par les impôts différés.
75
� Op : besoin en capital au regard du risque opérationnel.
Suite aux recommandations de l’ACPR, le comportement de rachat conjoncturel des assurés
peut être modélisé par une fonction en escalier qui dépendrait des conditions du marché.
La décision des assurées s’appuierait sur l’écart entre un taux benchmark et un taux de PB
servi par l’assureur.
Ci-dessous l’allure du graphe illustrant les taux de rachats conjoncturels en fonction de
l’écart entre un taux de référence (par exemple TME,….) et le taux servi.
Illustration de la modélisation des rachats conjoncturels
Les préconisations de l’ACPR sont les suivantes :
En plus des rachats structurels que l’assureur peut observer dans un contexte économique
«normal» sur les contrats d’assurance-vie, l’assureur doit tenir compte de rachats
conjoncturels ; ceux-ci interviennent notamment dans un contexte fortement concurrentiel
lorsque l’assuré arbitre son contrat d’assurance au profit d’autres supports financiers
(produits assuranciels, bancaires ou immobiliers).
� Modélisation des rachats structurels
Pour la modélisation des rachats structurels, les participants doivent utiliser des lois d’expérience si celles-ci sont conformes aux observations passées, ou à défaut des données de marché. Ces hypothèses de rachat peuvent dépendre de nombreux paramètres (âge de l’assuré, ancienneté fiscale, …). Toutefois les assureurs sont aussi amenés à choisir une modélisation appropriée en fonction des contraintes de granularité du portefeuille, de faisabilité des calculs et de validation des hypothèses.
taux référence - taux servi
Rachat conjoncturel
76
� Modélisation des rachats conjoncturels
Les rachats conjoncturels sont couramment modélisés par une fonction dépendant uniquement de l’écart entre le taux servi et un taux dépendant de l’environnement économique, souvent appelé taux de rendement espéré par l’assuré. Compte tenu de leur nature, les rachats conjoncturels ne peuvent pas être estimés à l’aide de lois d’expérience. Lors des préconisations du QIS 5, deux lois de rachat sont proposées ; l’une correspondant à un plafond maximum de rachats et l’autre correspondant à un minimum de rachats. Les assureurs doivent ajuster leur loi de rachat dynamique afin que celle-ci soit à l’intérieur du tunnel ainsi constituée.
Le taux de rachats conjoncturels RC devra être additionné au taux de rachats structurels RS. Si le taux servi est inférieur au taux attendu (TA) par les assurés, ces derniers auront tendance l’année suivante à racheter plus que ne l’indique la courbe de rachats structurels. A l’inverse, si les assurés se voient offrir un taux supérieur à leurs attentes, ils rachèteront l’année suivante moins que par le passé. Par exemple, les organismes peuvent utiliser le TME observé comme estimateur du taux attendu par les assurés. Le taux de rachats conjoncturels est fonction de l’écart entre le taux servi R et le TA :
ui(u) =ËÌÌÍÌÌÎ
ui�"��(u − �h < Ïui�"� ∗ (¬�¥Ð�Ñ)(Ò�Ñ) �(Ï < u − �h < Ó0�(Ó < u − �h < Ôui��. ∗ (¬�¥Ð�Õ)(Ö�Õ) �(Ô < u − �h < ×ui��.�(× < u − �h
Avec les définitions suivantes :
� Ï est le seuil en deçà duquel les rachats conjoncturels sont constants et fixés à ui�"� .Ce n’est plus l’écart de taux qui explique le comportement des assurés. � ÓW�Ô sont respectivement les seuils d’indifférence à la baisse et à la hausse du taux
servi. Entre ces deux seuils, le comportement de l’assuré ne change pas. � × est le seuil au-delà duquel la diminution du taux de rachats structurel est constante
et fixée à ui��..Ce n’est plus l’écart de taux qui explique le comportement des assurés.
Ï Ó Ô × ui��. ui�"�
Plafond max -4% 0% 1% 4% -4% 40%
Plafond min -6% -2% 1% 2% -6% 20%
Le taux de rachats total s’exprime alors ainsi :
u� = (u, �h, °) = min(1,maxÅ0, u�(°) + ui(u, �h)Æ)
77
Nous allons illustrer graphiquement (figure 7.1) ces différents paramètres.
Figure 7.1
7.2) Liste des produits et indicateurs financiers utilisés
Les produits étudiés sont détaillés par taux de rachats annuels.
Taux de rachats annuels par produit
Produits 2007 2008 2009 2010 2011 2012 2013Rouge1 4,08% 6,81% 5,79% 5,76% 6,81% 7,24% 6,72%Rouge2 2,41% 4,55% 4,10% 3,69% 4,21% 3,99% 3,16%
Bleu 3,87% 5,23% 5,26% 5,28% 5,32% 5,67% 4,01%Rose 3,81% 4,51% 3,37% 3,50% 4,25% 3,67% 2,75%
Rouge3 0,87% 3,70% 4,12% 4,07% 5,41% 5,66% 5,25%Vert 1,03% 3,58% 4,02% 3,90% 4,73% 4,96% 4,22%
Orange 5,98% 6,82% 6,20% 6,42% 7,57% 7,78% 6,46%Jaune 0,01% 1,87% 4,20% 3,48% 4,92% 5,58% 3,94%Violet 0,00% 4,64% 3,66% 4,61% 4,27% 4,58% 3,68%Noir 6,68% 6,91% 5,85% 5,18% 6,09% 4,97% 4,48%
Marron 3,39% 3,56% 3,09% 2,86% 3,00% 2,78% 2,46%
T ota l 4,76% 5,63% 4,94% 4,79% 5,58% 5,49% 4,66%
78
Les indicateurs financiers sont les suivants : CAC 40, TME mensuel et annuel et Taux du livret
A.
Le TME correspond au taux moyen de rendement des emprunts d’État et des obligations
assimilables du Trésor (OAT) émises par l'État français, à taux fixe, et d'une durée supérieure
à 7 ans. Il sert de référence aux banques et aux assurances pour déterminer le niveau des
taux d'intérêts fixes. Le TME qui de plus en plus remplace le TMO, est employé, notamment,
pour le calcul du taux fixe d'un prêt à taux variable convertible en taux fixe ou calculer le
taux des avances sur contrats d’assurance vie.
Ces indicateurs seront comparés au taux de rachats annuels.
Les taux de PB nets de chaque produit sont également utilisés ; ils sont listés dans le tableau
ci-dessous :
Taux de participation aux bénéfices
Les taux de PB pour tous les produits ont été calculés en pondérant par les provisions
mathématiques les taux de PB de chaque produit.
7.3) Résultats
Les coefficients de corrélations sont calculés par portefeuille et au global et de manière
mensuels ou annuels en fonction de l’indice financier de référence.
Nous rappelons dans un premier temps la formule suivante :
Le coefficient de corrélation linéaire entre 9 et 5 s’écrit de la manière suivante :
−1 ≤ Q = i��(9, 5)�(9)�(5) ≤ 1
Produits 2007 2008 2009 2010 2011 2012 2013Rouge1 4,15% 4,10% 3,60% 3,20% 2,80% 2,70% 2,29%Rouge2 4,15% 4,10% 3,60% 3,20% 2,80% 2,70% 2,29%
Bleu 4,45% 4,15% 3,90% 3,83% 3,51% 3,47% 3,47%Rose 4,45% 4,15% 3,90% 3,83% 3,51% 3,47% 3,47%
Rouge3 4,15% 4,10% 3,60% 3,20% 2,80% 2,70% 2,29%Vert 4,15% 4,10% 3,60% 3,20% 2,80% 2,70% 2,29%
Orange 4,15% 4,10% 3,60% 3,20% 2,85% 2,70% 2,28%Jaune 4,00% 4,00% 3,60% 3,20% 2,80% 2,70% 2,29%Violet 4,00% 4,00% 3,60% 3,20% 2,80% 2,70% 2,29%Noir 3,70% 3,42% 3,24% 2,98% 2,88% 2,78% 2,74%
Marron 4,48% 4,49% 3,80% 3,90% 3,75% 3,44% 3,42%
T ota l 4,13% 4,01% 3,59% 3,32% 3,02% 2,88% 2,59%
79
� Corrélation variation CAC 40 en mensuels / variation taux rachats mensuels
Nous rappelons que le CAC40 est un indice boursier qui est composé des 40
plus grandes capitalisations de la place de Paris. Nous avons analysé l’indice
en variation relative pour pouvoir le comparer à la variation de taux de
rachats. Il n’apparait pas de corrélation évidente entre l’indice CAC 40 et le
taux de rachats. En effet les valeurs des coefficients sont proches de 0%.
� Corrélation variation TME en mensuels /variation taux rachats mensuels
Il apparait une corrélation un peu plus marquée entre le taux de rachats et le TME.
Corrélations Produits
-15,84% Rouge1
-9,07% Rouge2
-36,20% Bleu
2,58% Rose
-0,03% Rouge3
-3,41% Vert
-8,27% Orange
7,86% Jaune
0,43% Violet
-12,22% Noir
-11,83% Marron
-13,73% Tous produits
Corrélations Produits
25,55% Rouge1
25,77% Rouge2
18,06% Bleu
6,34% Rose
20,08% Rouge3
19,24% Vert
15,86% Orange
7,75% Jaune
10,13% Violet
14,10% Noir
10,22% Marron
20,44% Tous produits
80
� Corrélation variation taux livret A /variation taux rachats annuels
Il apparait une corrélation très nette entre le taux de rachats et le taux du Livret A.
Pour le taux du livret A les taux sont comparés en variation annuelle car le taux du livret A
est mis à jour au plus tous les trimestres.
De plus le graphe (figure 7.2) indique clairement que lorsque le taux du livret A augmente le
taux de rachats (tous produits confondus) annuel augmente également.
Variation taux de rachats annuels / taux Livret A
Figure 7.2
Corrélations Produits
74,70% Rouge1
64,08% Rouge2
53,73% Bleu
83,28% Rose
50,58% Rouge3
49,82% Vert
88,10% Orange
44,00% Jaune
44,14% Violet
77,30% Noir
93,43% Marron
92,71% Tous produits
0,00%
1,00%
2,00%
3,00%
4,00%
5,00%
6,00%
2007 2008 2009 2010 2011 2012 2013
Année
Taux rachats annuels
Taux Livret A
81
Nous allons tracer des graphes (figures 7.3 et 7.4) qui donnent un aperçu visuel des
corrélations observées précédemment.
Les taux de rachats et les taux de participation aux bénéfices concernent tous les produits
confondus.
Le taux du livret A est annuel : si le taux a changé en cours d’année, nous avons pris la
moyenne des taux de l’année. Nous avons le même raisonnement pour le TME annuel.
Le graphe (figure 7.3) nous indique que les taux de rachats augmentent lorsque l’écart entre
le taux du Livret A et le Taux de PB augmente (en faveur du taux du livret A) et inversement
les taux de rachats baissent lorsque cet écart diminue. Sauf un léger décrochage en 2011-
2012 qui peut être expliqué par la partie structurelle du rachat.
Variation taux de rachats annuels / taux (Livret A - Participation aux bénéfices)
Figure 7.3
-3,00%
-2,00%
-1,00%
0,00%
1,00%
2,00%
3,00%
4,00%
5,00%
6,00%
2007 2008 2009 2010 2011 2012 2013
Année
Taux rachats annuels
Taux LA-Taux PB nets
82
Pour le graphe de la figure 7.4 nous observons que les taux de rachats augmentent lorsque
l’écart entre le taux TME annuel et le Taux de PB augmente (en faveur du taux du taux TME)
et inversement les taux de rachats baissent lorsque cet écart se resserre. Mais c’est moins
significatif qu’avec le taux du livret A. Une explication possible est que l’écart entre le taux
TME annuel et le taux de PB n’est pas très élevé car il reste inférieur à 0,5% sur la période
étudiée.
Variation taux de rachats annuels / taux (TME - Participation aux bénéfices)
Figure 7.4
En conclusion, nous observons donc une forte corrélation entre le taux de rachats et le taux
du livret A et dans une moindre mesure le taux TME.
Le paramètre CAC 40 ne donne pas de corrélations significatives par rapport au taux de
rachats sur les produits étudiés.
-1,00%
0,00%
1,00%
2,00%
3,00%
4,00%
5,00%
6,00%
2007 2008 2009 2010 2011 2012 2013Année
Taux de rachats annuels
Taux TME annuel-Taux de PB net
83
Conclusion
L’objectif de ce mémoire était une meilleure compréhension des mécanismes incitant les
assurés à retirer partiellement ou totalement les sommes investies sur leurs contrats
d’épargne.
La régression logistique a permis de prendre en compte les paramètres structurels et
d’optimiser la sélection des variables déterminantes ainsi que leurs modalités. Les 5
variables sélectionnées pour expliquer le choix des assurés de retirer leur épargne sont : la
part d’investissement dans les unités de compte, l’ancienneté du contrat, le montant de la
provision mathématique du contrat, l’âge de l’assuré et l’existence sur le contrat d’un rachat
partiel par le passé.
Le modèle GLM a permis d’affiner l’analyse sur les variables sélectionnées en observant les
montants rachetés. Ainsi, la classe d’âge dont les montants rachetés sont les plus élevés est
la tranche 0-50 ans ; ces montants diminuent ensuite progressivement avec l’âge (les assurés
plus âgés possèdent d’autres ressources financières pour ne pas puiser dans leur épargne).
Les contrats essentiellement investis en euros sont ceux dont les montants rachetés sont les
plus élevés. De plus lorsque le montant de la provision mathématique augmente le montant
des rachats diminue (les assurés aisés ont moins besoin de liquidités).
La théorie de la crédibilité a permis d’estimer le taux de rachats futur à partir de l’historique
des taux ; cette approche est intéressante car nous ne faisons pas de distinction entre les
rachats conjoncturels et structurels ; composantes déjà présentes dans l’historique des taux.
La dernière analyse a montré des corrélations significatives entre le taux de rachats, le taux
du livret A et le taux TME. Les assurés restent donc à l’écoute du marché financier dans leur
choix d’action sur leur contrat d’épargne et surtout restent attentifs aux taux de
participation aux bénéfices distribués sur leurs contrats.
Cette étude a donc mis en avant la diversité des sources d’influence du choix de l’assuré
dans le contrat d’épargne, sources endogènes (âge,…) et exogènes (marchés financiers).
Comme influence endogène, l’approche des modèles linéaires a permis de modéliser le
comportement de rachat à l’aide de variables explicatives. Comme influence exogène, les
corrélations positives sont significatives entre le taux de rachats et quelques indicateurs
financiers.
L’étude sur les rachats pourrait se prolonger par d’autres pistes complémentaires
notamment l’application de modèles ou de processus stochastiques à des fins de prévision.
Le sujet reste assez riche et sera toujours d’actualité car l’assureur qui appréhendera au
mieux ce risque sera plus a même à donner des provisions « Best Estimate » le plus juste
possible et le calcul du SCR sera mieux maitrisé, la solvabilité d’un assureur étant un atout
commercial majeur en ces temps de crise.
84
Bibliographie
� Ouvrages et revues
Eric Leroux & Frédérique Schmidiger : « Le Particulier, juillet-août 2014 »
Frédéric Planchet & Pierre Thérond : « Modèles de Durée, Applications actuarielles ».
Economica, 2006.
Stéphane Tufféry : « Etude de cas en statistique décisionnelle ». Technip, 2009.
Françoise Couty ; Jean Debord ; Daniel Fredon : « Probabilités et statistiques ». Dunod, 2006.
Gilbert Saporta : «Probabilités Analyse des données et Statistique ».Technip, 2011.
Régis Bourbonnais : « Econométrie ».Dunod, 2011.
Pierre Petauton : « Théorie de l’assurance dommages ».Dunod, 2000.
Christian Gourieroux : « Statistique de l’assurance ».Economica, 1999.
� Mémoires d’actuariat
Myriam El Jerdy : « Tarification des groupes en assurance santé ».ISFA, 2008.
David Grimal : « Analyse économétrique de l’option de rachat dans les produits
d’épargne ».CEA, 2007.
Audrey Lamirault & Laure Vitré : « un contexte de taux bas : quelle modélisation pour les
rachats ? » .CEA, 2013.
Aliou Sow : « Provision Best Estimate des engagements liés à l’option de conversion en
rente ».ISFA, 2012.
Adrien Suru : « Apport de la physique à la modélisation du rachat ».Dauphine, 2011.
� Lien internet
http://acpr.banque-france.fr/fileadmin/user_upload/acp/International/Les_grands_enjeux
/Exercice-preparation-solvabilite-II/20130527-ONC-2013.pdf
Ricco Rakotomalala « Pratique de la régression logistique » : http://eric.univ-
lyon2.fr/~ricco/cours/cours/pratique_regression_logistique.pdf
85
� Notes internes
Notes Allianz sur les process des lois de rachat « Lois de rachat des produits d’épargne et de
retraite : procédures suivies » de Gwenola Gueguen et Aliou Sow.