88
Mémoire présenté devant l’ENSAE ParisTech pour l’obtention du diplôme de la filière Actuariat et l’admission à l’Institut des Actuaires le 09/11/2016 Par : HENNOM Damien Titre : Création d’un indicateur de valeur client en assurance non vie Confidentialité : NON X OUI (Durée : 1 an X 2 ans) Les signataires s’engagent à respecter la confidentialté indiquée ci-dessus Membres présents du jury de la filière Entreprise : AVIVA France Nom : MUNOZ Xavier Signature : Membres présents du jury de l’Institut Directeur du mémoire en entreprise : des Actuaires Nom : SCHALCK Meryem Signature : Autorisation de publication et de mise en ligne sur un site de diffusion de documents actuariels (après expiration de l’éventuel délai de confidentialité) Signature du responsable entreprise : Secrétariat : Signature du candidat : Bibliothèque : Ecole Nationale de la Statistique et de l’Administration Economique (ENSAE) 3, Avenue Pierre Larousse - 92245, MALAKOFF CEDEX, FRANCE

HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Mémoire présenté devant l’ENSAE ParisTechpour l’obtention du diplôme de la filière Actuariat

et l’admission à l’Institut des Actuairesle 09/11/2016

Par : HENNOM Damien

Titre : Création d’un indicateur de valeur client en assurance non vie

Confidentialité : � NON X� OUI (Durée : � 1 an X� 2 ans)

Les signataires s’engagent à respecter la confidentialté indiquée ci-dessus

Membres présents du jury de la filière Entreprise : AVIVA FranceNom : MUNOZ XavierSignature :

Membres présents du jury de l’Institut Directeur du mémoire en entreprise :des Actuaires Nom : SCHALCK Meryem

Signature :

Autorisation de publication et demise en ligne sur un site dediffusion de documents actuariels(après expiration de l’éventuel délai deconfidentialité)

Signature du responsable entreprise :Secrétariat :

Signature du candidat :Bibliothèque :

Ecole Nationale de la Statistique et de l’Administration Economique (ENSAE)3, Avenue Pierre Larousse - 92245, MALAKOFF CEDEX, FRANCE

Page 2: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Résumé

Mots clés : Valeur client, Assurance non-vie, Modèle de durée, Modèle de sinistralité, Ventescroisées

Depuis ces dernières décennies, le client a pris une place centrale au sein des entreprises. La connaissance duclient et sa valorisation sont devenues des problématiques croissantes pour les entreprises d’assurance cherchanttoujours à segmenter leur population de façon de plus en plus fine.

L’objectif de ce mémoire est double, l’objectif principal est de créer un nouvel indicateur de valeur client pourEurofil, canal de distribution direct du groupe Aviva Assurance. L’indicateur représentera la valeur potentielled’un client pour la marque sur les trois prochaines années et sera analysé dans notre mémoire sous forme d’unmontant. Ce mémoire propose différentes modélisations possibles pour la création de cet indicateur et donnedes éléments d’aide à la décision pour comparer ces modèles.Le second objectif est de segmenter notre population de clients en croisant notre indicateur de valeur client etla valeur client observée dans le passé. Ce mémoire propose une segmentation possible des clients en comparantla valeur client potentielle et la valeur client observée.

Abstract

Key words : Customer Life Time Value, Non life insurance, Duration models, Claim models,Cross Selling

Over the past few years, customer behaviour has become a central issue. Knowledge of a customer and hissatisfaction are growing problems within insurance companies who are always looking for a better segmentationof their customer base.

The following report has two main objectives. The first one is to create a new customer life time value forEurofil, Aviva’s direct insurer branch. This indicator will represent the potential value of a customer over thenext three years and will be calculated as an amount. We will look at different models for creating this metricand will use several methods of comparing these models.The second objective is to segment our customer base by crossing our customer life time value indicator withthe observed customer value. We will cover one possible segmentation in comparing these metrics.

1

Page 3: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Remerciements

Je remercie Meryem Schalck, ma tutrice professionnelle pour m’avoir encadré tout au long de mon stage.Ses conseils avisés m’ont permis de progresser et de mener à bien les missions qui m’ont été confiées.Je remercie Xavier Munoz, responsable du département de recherche et développement, pour m’avoir accueilliau sein de son équipe.Je remercie également Brice Carles, responsable de l’actuariat Eurofil, et Elodie Delle Case pour leur aide etleurs conseils ainsi que pour le temps qu’ils m’ont accordé.

Mes remerciements s’adressent également à l’ensemble des membres du département R&D et actuariat pourleur accueil et le temps qu’ils m’ont consacré afin de répondre à mes interrogations.

Enfin, je tiens à remercier Romuald Elie, mon tuteur pédagogique pour ses conseils.

2

Page 4: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Table des matières

Résumé 1

Abstract 1

Remerciements 2

Introduction 5

1 Contexte de l’étude 71.1 L’assureur direct Eurofil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81.2 Objectifs de l’étude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111.3 Déroulé de l’étude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121.4 Description des données disponibles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2 Notion de valeur client 162.1 Etude de l’état de l’art . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2.1.1 Définition générale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172.1.2 Spécifités en assurance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2.2 Définition retenue par Eurofil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

3 Valeur client passée 233.1 Méthodologie de calcul . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

3.1.1 Focus sur les primes et les sinistres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243.1.2 Focus sur les frais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

3.1.2.1 Les frais d’acquisition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243.1.2.2 Les frais de gestion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

3.1.3 Focus sur le facteur de capitalisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 273.2 Résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

4 Valeur client potentielle 314.1 Modélisation de la marge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

4.1.1 Choix du modèle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 324.1.2 Modèle économétrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

4.1.2.1 Présentation du modèle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 324.1.2.2 Etude préalable à la modélisation . . . . . . . . . . . . . . . . . . . . . . . . . . 334.1.2.3 Résultats du modèle économétrique de marge . . . . . . . . . . . . . . . . . . . . 354.1.2.4 Critique sur le modèle économétrique de marge . . . . . . . . . . . . . . . . . . . 37

4.1.3 Modèle actuariel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 384.1.3.1 Modélisation des sinistres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

4.1.3.1.1 Méthodologie et étude préalable à la modélisation . . . . . . . . . . . . 394.1.3.1.2 Modélisation des sinistres automobile . . . . . . . . . . . . . . . . . . . 404.1.3.1.3 Modélisation des sinistres MRH . . . . . . . . . . . . . . . . . . . . . . 444.1.3.1.4 Modélisation des sinistres PFA . . . . . . . . . . . . . . . . . . . . . . . 48

4.1.3.2 Modélisation des primes et frais . . . . . . . . . . . . . . . . . . . . . . . . . . . 494.1.3.3 Critique sur le modèle actuariel de marge . . . . . . . . . . . . . . . . . . . . . . 49

4.1.4 Comparaison des modèles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 504.1.5 Création de l’output pour la valeur client . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

4.2 Modélisation de la durée de vie client . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 534.2.1 Modèle à hasard proportionnel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

4.2.1.1 Présentation du modèle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

3

Page 5: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

4.2.1.2 Vérification des hypothèses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 564.2.2 Modèle de vie accéléré . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 574.2.3 Comparaison des modèles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 594.2.4 Création de l’output pour la valeur client . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

4.3 Intégration du cross-selling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 614.3.1 Modélisation de la propension à acheter . . . . . . . . . . . . . . . . . . . . . . . . . . . . 614.3.2 Estimation du risque engendré . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

4.3.2.1 Méthode de crédibilité de Bühlmann . . . . . . . . . . . . . . . . . . . . . . . . . 634.3.2.2 Méthode de crédibilité pour la vente croisée . . . . . . . . . . . . . . . . . . . . . 634.3.2.3 Application à nos données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

4.4 Calcul de la valeur client future . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 654.4.1 Méthode de calcul . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 654.4.2 Présentation des résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 654.4.3 Validation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

5 Analyse croisée : Valeur client passée/Valeur client future 695.1 Présentation de l’analyse croisée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 705.2 Résultat sur nos données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

Conclusion 72

Note de synthèse 73

Executive summary 77

Table des figures 81

Bibliographie 82

Annexes 82

Annexe 1 : Eléments sur la loi Poisson et Gamma 83

Annexe 2 : Eléments sur la loi Tweedie 85

Annexe 3 : Courbe Log-log Kaplan Meier 87

Page 6: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Introduction

Ces dernières années, le client a pris une place centrale au sein des entreprises [DF97]. Déjà, dans les années60, Levitt [Lev60] plaçait la satisfaction client comme première priorité des firmes. L’avènement de la Gestionde la Relation Client (Customer Relationship Management) dans les années 80 a renforcé ce constat le but étantde construire, de gérer et de faire fructifier la relation client. Peu à peu le client est devenu un actif que lescompagnies doivent valoriser et retenir.Ces dernières années, la croissance des outils technologiques et des données offre de nouvelles perspectives auxfirmes leur permettant d’être au plus près des attentes du client et leur proposer des services de plus en pluspersonnalisés [Har15]. Ces outils permettent également aux firmes de se focaliser sur les actions marketing lesplus profitables et les clients les plus fidèles. Récemment l’avènement du Big data a d’autant plus renforcé cesperspectives donnant l’accès à des ressources de données importantes et à des traitements en temps réel. Lamasse d’informations collectée par les compagnies sur leurs clients ne cesse d’augmenter, le problème pour lesfirmes est désormais d’utiliser cette masse de données afin de valoriser aux mieux leurs relations clients.

Comme tous les secteurs économiques, le secteur assurantiel s’est lui aussi interressé aux caractéristiquesde ses clients. Historiquement, les assureurs segmentent leur clientèle au niveau de la tarification. Le but del’assureur étant de segmenter au maximum sa population assurée afin de proposer un tarif au plus proche durisque réel du client. Cette approche a néanmoins ses limites, tout d’abord, la segmentation des tarifs d’assu-rance est faite produit par produit ne prenant pas en compte l’intégralité des connaissances que possède la firmesur le client. De plus, cette approche ne garantit pas la fidélité de la clientèle, ni ne permet l’équipement d’uncontrat supplémentaire. Une autre approche est donc nécessaire afin de compléter les approches classiques detarification. L’intérêt des différents secteurs économiques pour le client a amené ceux-ci à créer différentes mé-triques permettant d’améliorer la relation client. Parmi les métriques généralement utilisées par les compagnies,nous trouvons la valeur client. La valeur client est devenue la métrique la plus utilisée sur le marché, celle-cipermettant d’acquérir, de garder et de maximiser le potentiel d’un client [VK04].

Dans cette optique, Eurofil a souhaité construire un indicateur de valeur client sur son portefeuille. L’objectifd’Eurofil est d’avoir une vision à 360 degrés de ses clients. La valeur client permettant de voir le client dansson ensemble et non pas l’observer comme une somme de contrats indépendants. L’indicateur de valeur clientsera utilisé de façon opérationnelle afin d’améliorer les outils marketing et les différents modèles en intégrant lavaleur client comme nouvel indicateur.

Ce mémoire a pour objectif la construction d’un indicateur de valeur client. Pour ce faire, notre travails’articulera en plusieurs parties :

Dans un premier temps, la notion de valeur client sera présentée, tout d’abord d’un point de vue générale puisde façon plus précise en prenant en compte les spécifités du secteur assurantiel. Enfin, nous présenterons ladéfinition retenue par Eurofil dans le cadre de ce mémoire.

Dans un second temps, la valeur client observée sur le portefeuille sera calculée. Cette valeur représente les gainsou les pertes qu’Eurofil a subis dans le passée pour les clients qu’elle possède actuellement en portefeuille. Pource faire, la première partie de ce chapitre sera consacrée à la définition du périmètre de calcul ainsi que de saméthodologie, puis une seconde partie sera consacrée à l’analyse de ce premier indicateur.

Dans un troisième temps, l’indicateur de valeur client future sera modélisé. Cet indicateur représente la valeurpotentielle pour Eurofil d’un client pour les trois prochaines années. Pour ce faire, la première partie de cechapitre sera consacré à la modélisation de la marge client (ou le gain attendu pour chaque client). Une secondepartie traitera de la modélisation de la rétention du client (ou la probabilité pour un client de rester en porte-feuille). Enfin, la dernière partie sera consacrée aux aspects de cross-selling (ventes croisées).

5

Page 7: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Dans un quatrième temps, une analyse des deux indicateurs, valeur client passée et future, sera effectuée encroisant ces indicateurs entre eux. Cette étude permettra de segmenter la population de clients d’Eurofil encréant un troisième indicateur combinaison des deux précédents.

6

Page 8: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Chapitre 1

Contexte de l’étude

Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opèresur le marché de l’assurance directe. Le marché de l’assurance directe est apparu sur le marché européen ily a une trentaine d’années. La vente d’assurance à distance s’est largement développée en Europe, elle repré-sente par exemple 70% des transactions en Angleterre. En France, ce type de business model reste d’une taillerelativement faible face aux transactions d’assurance classique. En 2012, le marché de l’assurance directe nereprésentait que 3% du marché global de l’assurance [La 12]. Cependant la croissance des groupes d’assurancedirecte est réelle, la plupart affichant une croissance de chiffre d’affaires à deux chiffres. De plus, les perspectivesde ce modèle relationnel sont favorables notamment grâce à la croissance des transactions sur internet, à laréussite de ces business model outre-manche et également avec l’évolution des comportements clientèles plusvolatiles et plus connectés. De plus, la structure de ventes de ces entités permet une réduction significative descoûts. En effet, la chaîne de ventes des assureurs directs est plus courte, le nombre d’intermédiaires à rémunérerest donc plus faible. De ce fait, les assureurs directs peuvent proposer des tarifs plus concurrentiels sur le marché.

Les principaux acteurs sur le marché de l’assurance directe en France sont Direct Assurance représentant(en 2012) 79% du chiffre d’affaires du secteur, Eurofil représentant 20% du chiffre d’affaires du secteur et enfinIDMACIF avec 1% du chiffre d’affaires [La 12]. Un premier constat peut être effectué, chacun de ces acteurs estune marque d’un groupe d’assurance déjà implanté sur le marché de l’assurance traditionnelle. Direct Assurancefiliale du groupe Axa, Eurofil marque du groupe Aviva et IDMACIF du groupe MACIF. Le but de ces marquesest de conquérir une part de clientèle recherchant des contrats d’assurance moins chers, avec une relation clientà distance.Notons, que cette répartition a évolué depuis 2012, plusieurs acteurs sont entrés sur le marché notammentAmaguiz et l’Olivier. Néanmoins, peu de chiffres sont disponibles sur ce marché car ils représentent un enjeustratégique majeur pour les sociétés d’assurance. Un exercice non formel peut être effectué, venir évaluer la visi-bilité de chacun de ses acteurs sur les sites comparateurs d’assurance. Ces sites web viennent classer par gammede prix les différents contrats d’assurance selon le profil de l’assuré. Parmi ces sites web nous pouvons noter parexemple Le Lynx, Les Furets ou encore Assurland. Sur le site du Lynx, plusieurs types d’acteurs peuvent êtrerepérés. Tout d’abord, les "pures players" comme Eurofil qui sont des marques ou entités entièrement dédiéesà la vente direct. Puis, les courtiers en assurance, comme Assu2000. Enfin, les sociétés d’assrurance classiquecomme Allianz. Les acteurs les plus représentés sont les courtiers en assurance puis les pures players et enfinles sociétés d’assurance classique. Parmi les pures players, quatre principaux acteurs peuvent être cités, DirectAssurance, Eurofil, l’Olivier et Amaguiz. Les assureurs directs commercialisent essentiellement leurs contrats enligne ou par téléphone. Ces entités sont donc largement présentes sur les sites comparateurs d’assurances.

Les sites comparateurs se rémunèrent via des commissions données par les assureurs sur chaque contratd’assurance ou chaque devis réalisé sur le site. Dans ce secteur également, les chiffres d’affaires sont en forteaugmentation. En 2015, Xerfi délivre une étude qui note une très forte augmentation du trafic sur les sitescomparateurs avec une hausse moyenne de 18,5% du chiffre d’affaires entre 2012 et 2015 [LAr16].

Dans la suite de ce chapitre, une première partie sera consacrée à la présentation d’Eurofil en donnant lesprincipaux chiffres permettant d’éclairer l’étude que nous allons mener par la suite. Dans un second temps,les objectifs de notre étude ainsi que les différentes étapes permettant d’aboutir à l’indicateur de valeur clientseront présentés .

7

Page 9: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

1.1 L’assureur direct EurofilChiffres clés

Eurofil a été créé en 1990 et est resté une société indépendante jusqu’en 2012, en 2012 la société a fusionnéavec Aviva Assurance. Aviva a néanmoins gardé l’image de la marque afin de distribuer des produits via lescanaux de distributions directes.

Eurofil se concentre sur le marché des particuliers et distribue trois produits, le produit automobile repré-sentant la majeure partie du chiffre d’affaires, le produit multirisque habitation (MRH) et enfin le produitprotection famille accident (PFA). Les produits d’Eurofil sont commercialisés en ligne sur le site web d’Eurofilet via une plateforme téléphonique. Eurofil est présent sur les sites comparateurs seulement pour le produitautomobile, les produits MRH et PFA n’y sont pas répertoriés.Les trois produits de la gamme Eurofil sont construits de manière classique pour des produits d’assurance, nousne développerons pas leurs constructions dans ce mémoire.

Pour le besoin de notre étude, quelques chiffres ont été mentionnés permettant d’éclairer les choix métho-dologiques que nous ferons par la suite. Ci dessous l’évolution du chiffre d’affaires depuis 1995 :

0

100

200

1995 2000 2005 2010 2015Exercice

Chi

ffre

d'af

faire

s (e

n m

illio

ns d

'eur

os)

produit4RMRHPFA

Evolution du chiffre d'affaires Eurofil

Figure 1.1 – Evolution du chiffre d’affaires Eurofil

Eurofil enregistre un chiffre d’affaires en 2015 de 254 millions d’euros. Ce chiffre d’affaires est en forte crois-sance depuis la création de la marque. Nous pouvons noter deux périodes de forte croissance, une avant lesannées 2000 et une entre 2010 et 2014. La croissance moyenne du chiffre d’affaires sur ces cinq dernières annéesa été de 2,5%.Le produit automobile a toujours représenté la majeure partie du chiffre d’affaires d’Eurofil. Sur toute la périodela part de l’automobile représentait 90% du chiffre d’affaires. Le produit PFA a été lancé en 1999, sa part dansle chiffre d’affaires a toujours été faible de l’ordre de 1%.

Ci-dessous la répartition du chiffre d’affaires entre les trois produits d’Eurofil en 2015 :

8

Page 10: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

79.2%

19.4%

1.4%

4R

MRH

PFA

0.0 0.2 0.4 0.6 0.8Pourcentage de chiffre d'affaires

Pro

duit

Répartition du chiffre d'affaires 2015 Eurofil

Figure 1.2 – Répartition du chiffre d’affaires 2015 Eurofil

Le produit automobile représente la majeure partie du chiffre d’affaires (près de 80%). A l’inverse, le produitPFA représente moins de 2% du chiffre d’affaires. Notre étude se concentrera principalement sur les produitsautomobile et MRH qui représentent la masse la plus importante des primes. En effet, l’impact absolu surnotre étude des produits PFA est marginale face aux deux autres produits. Nos modélisations sur les produitsautomobile et MRH seront donc plus fines que celle sur la PFA.

Pour notre étude, il est également nécéssaire d’avoir une vision du nombre de clients au sein du portefeuilleEurofil. Ci-dessous l’évolution du nombre de clients depuis 1995 :

80814

112584

145776

190712

201907

188286183114

177660174239

178618184613184839

178077171172172958

180998

195504

206844

219025

228881

243645

0

50000

100000

150000

200000

250000

1995 2000 2005 2010 2015Exercice

Nom

bre

de c

lient

s

Nombre de clients par exercice

Figure 1.3 – Evolution du nombre de clients Eurofil

L’évolution du nombre de clients d’Eurofil suit l’évolution du chiffre d’affaires, nous voyons apparaître lesdeux périodes de forte croissance que nous avons mentionnées dans le paragraphe ci-dessus.Notre étude se focalisera sur les 243 645 clients présents en portefeuille en 2015. Notre étude ayant pour but lacréation d’un indicateur de valeur client, nous allons grâce à l’historique de la clientèle d’Eurofil pouvoir estimerla valeur des clients actuellement présents en portefeuille.L’étude menée dans ce mémoire a pour principal objectif de ne plus observer, d’un point de vue technique, leclient comme une somme de contrats indépendants mais comme un actif que nous voulons faire fructifier dansle temps. Une première observation peut permettre de justifier cette étude : 32% des clients Eurofil sont ditsmulti-équipés c’est à dire qu’ils possèdent plus de un produit (Automobile, MRH ou PFA) et 42% possèdentplus de un contrat. Une partie des clients Eurofil ne possèdent pas qu’un seul contrat, l’observation au globalde ces clients peut donc être un plus pour Eurofil.

9

Page 11: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Parcours client

Comme nous l’avons souligné en introduction de cette partie, Eurofil opère sur le marché direct. De ce fait,ses clients proviennent de deux canaux, du site web Eurofil et des sites comparateurs. Eurofil travaille avecquatre comparateurs d’assurance, Le Lynx, Les Furets, Assurland et Hyperassur. La majeure partie des affairesnouvelles provenant des sites comparateurs sont contractées sur Le Lynx et Les Furets représentant environ70% du chiffre d’affaires comparateur.D’autre part, Eurofil possède des plateformes téléphoniques. Ces plateformes sont utilisées à la fois pour l’acqui-sition des clients mais également pour la gestion des contrats et des sinistres. En ce qui concerne l’acquisition,les clients sont recontactés à leur demande suite à un devis effectué en ligne.A partir de ces constats, quatres types de parcours client peuvent être différenciés, ils sont repésentés sur leschéma suivant :

Devis sur le site web Eurofil

Parcours d’un nouveau client Eurofil

Devis sur un site comparateur

Le Lynx Les furets Assurland

Contact téléphonique

Signature du contrat en ligne

Contact téléphonique

Signature du contrat en ligne

Client

Signature du contrat

Signature du contrat

Figure 1.4 – Parcours d’un nouveau client Eurofil

Après avoir effectué un devis sur le site web d’Eurofil ou sur un site comparateur, le client peut soit finaliserson contrat en ligne ou soit être recontacté par Eurofil par téléphone. Dans le premier cas, les clients serontappellés des clients "full web" dans le second des clients "non full web".Cette différenciation sera utile lors de la prise en compte des frais d’acquisitions client qui peuvent être signi-ficativement différents selon le parcours que le client a suivi avant de signer son contrat. Nous rappellerons etdétaillerons l’ensemble de ces définitions dans la partie de notre étude consacrée à la prise en compte des fraisde gestion et d’acquisition.

Enfin, sur ces dernières années la part des clients provenant des comparateurs s’est largement accrue. Au-trement dit la part des clients empruntant la branche inférieure de notre graphique ci-dessus a augmenté. Sur legraphique ci-dessous est représenté la part de contrat détenu par Eurofil chaque année selon l’origine de celui-ci.La relation avec les comparateurs d’assurance a débuté en 2005 pour Eurofil, la répartition en 2015 est 25% declients provenant de comparateurs et 75% provenant du site web Eurofil.

0

25

50

75

100

1995 2000 2005 2010 2015Exercice

Pou

rcen

tage

origine Comparateur Non Comparateur

Répartition des origines par exercice

Figure 1.5 – Répartition des origines des contrats par exercice

10

Page 12: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

1.2 Objectifs de l’étudeL’étude de la valeur client s’inscrit dans plusieurs projets de la marque Eurofil et plus largement d’Aviva.

Dans notre étude, un montant sera défini pour chaque client en portefeuille reflétant la valeur qu’a engendré ceclient pour la compagnie dans le passé. Par la suite, la valeur attendue de ce client pour la compagnie pour lestrois ans futurs sera modélisée.

Ces deux indicateurs pourront être utilisés pour plusieurs sujets. Le premier, où l’utilisation semble la plusdirecte est le marketing. En effet, notre indicateur permettra à Eurofil de repérer les clients ayant la rentabilitépassée la plus élevée et les clients ayant la rentabilité future la plus élevée. Eurofil mettra à disposition cetindicateur auprès de ses plateformes de gestion client afin d’apporter une aide à la décision face à des problé-matiques de remise client par exemple. L’indicateur pourra également être utilisé directement par le servicemarketing d’Eurofil afin de cibler un segment de clientèle précis pour ses campagnes.

La valeur client pourra être utilisée par les équipes techniques d’Eurofil afin d’améliorer leurs modélisations.Par exemple, la valeur pourra être utilisée pour évaluer la qualité d’un client sur un produit en se basant surses produits existants. Notons que Eurofil inscrit l’étude que nous menons dans son projet d’optimisation de laprime pure. Ce projet comprend plusieurs études liées entre elles. Tout d’abord, Eurofil mène en parallèle denotre étude une refonte tarifaire en automobile et en multirisque habitation. Eurofil mène également une étudesur la concrétisation des devis essayant de repérer les types de clients les plus susceptibles de transformer leursdevis en contrat. Ces études combinées permettront à Eurofil de proposer un tarif plus adapté à sa clientèle etégalement plus concurrentiel.

Enfin la valeur client est une première étape vers la création d’un modèle de "meilleure action future" (nextbest action). Le principe de la next best action est de proposer le meilleur message au client au moment le plusopportun. Le modèle de next best action permet tout d’abord d’éviter la multiplication des messages émanantde la compagnie. En effet, via ce modèle la compagnie arbitre en interne sur le message à envoyer au client.Le client ne reçoit donc qu’une proposition ou qu’une prise de contact de la part de la compagnie. Il permetégalement une optimisation des coûts et une optimisation des temps d’interaction avec le client.

11

Page 13: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

1.3 Déroulé de l’étudeL’ensemble de notre étude se déroulera en quatre étapes, chaque étape étant traitée dans un chapitre dédié.

Ces étapes peuvent se résumer via le schéma suivant :

Valeur client : Déroulé de l’étude

Présentation de la notion de valeur client Etape 1

Etape 2

Etape 3

Calcul de la valeur client passée

Calcul de la valeur client future

Analyse croisée : Valeur passée/ Valeur future

Calcul de la marge Calcul de la probabilité de

survie Cross sell / Up sell

Modèle Econometrique

Modèle Actuariel

Probabilité d’achat

Modèle Cox Modèle AFT Calcul du risque

Etape 4

1 2 3

Calcul de la valeur client future : Fusion des études 1 à 3 4

Figure 1.6 – Déroulé de l’étude

Etape 1

Dans un premier temps, nous présenterons la notion de valeur client. La valeur client est une métriqueutilisée dans de nombreux secteurs économiques, nous présenterons donc d’abord cette notion d’un point devue générale en abordant les différentes définitions présentes sur le marché. Nous verrons ensuite les spécifitésde son calcul dans le secteur de l’assurance. Pour cela, nous passerons en revue les différentes modélisationseffectuées sur le marché.Nous donnerons finalement la définition retenue par Eurofil pour son calcul de valeur client.

Etape 2

Dans un second temps, nous calculerons et analyserons la valeur client observée sur le portefeuille Eurofil.Cette étape nous permettra de comprendre le comportement de la valeur client à travers l’analyse de cette valeurpar différentes variables telle que l’ancienneté ou la situation familiale. Cette étape nous permettra égalementde valider notre définition de valeur client. En effet, en observant le comportement de la valeur client à traversdifférentes variables, nous pourrons détecter si la valeur client que nous observons est conforme avec les attentes,intuitions et observations des équipes d’Eurofil et des articles de recherche sur le sujet.

Dans cette étape nous détaillerons le mode de calcul de la valeur client observée et donnerons les hypothèsessous-jacentes à son calcul. Notons que la valeur client passée sera calculée de la façon suivante (la formule decalcul sera détaillée dans le chapitre 2) :

CVi =

T∑t=0

((Primei,t − Sinistrei,t − FGi,t)× (1 + r)t

)− FAi × (1 + r)T

Avec :CVi : Valeur client du client i

12

Page 14: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Primei,t : Les primes de l’individu i à la date tSinistrei,t : Le montant des sinistres du client i à la date tFGi,t : Les frais généraux du client i à la date tFAi : Les frais d’acquisition pour le client ir : Le taux de capitalisationt : Le temps

Etape 3

Après avoir étudié le comportement de la valeur client dans le passé en ayant calculé à l’étape 2 la valeurclient observée, nous passerons au calcul de la valeur client attendue (ou valeur client future). Cette étape estle coeur de notre étude, c’est cette valeur qui sera utilisée par la suite par l’équipe d’Eurofil afin d’atteindre lesobjectifs que la marque s’est fixés en terme d’optimisation des outils marketing. La définition de la valeur clientfuture, que nous expliciterons plus en détail dans le chapitre 2, est la suivante :

CLVi =

T∑t=1

E[(Primei,t − Sinistrei,t − FGi,t)](1 + d)t

× pi,t +

J∑j=1

E[(Primei,j,t − Sinistrei,j,t − FGi,j,t)](1 + d)t

× pi,j,t × ci,j,t

Avec :CLVi : Valeur client du client iPrimei,t : Les primes de l’individu i à la date tSinistrei,t : Le montant des sinistres du client i à la date tFGi,t : Les frais généraux du client i à la date td : Le taux d’actualisationpi,t : La probabilité d’un client i de rester en portefeuille à tci,t,j : La probabilité pour un client i de souscrire le contrat j à la date t

Afin de pouvoir calculer la valeur client future, il nous faudra effectuer plusieurs modélisations. Nous scin-derons donc l’étape 3 en trois parties indépendantes permettant d’effectuer :

— La modélisation de la marge : E[Primei,t − Sinistrei,t − FGi,t]— La modélisation de la rétention client : pi,t— La modélisation de la vente croisée :

∑Jj=1

E[(Primei,j,t−Sinistrei,j,t−FGi,j,t)](1+d)t × pi,j,t × ci,j,t

Modélisation de la marge

Tout d’abord, il nous faudra modéliser la marge du client. La marge est repésentée par le numérateur denotre valeur client. A travers nos différentes recherches, nous avons pu constater que la marge peut être modé-lisée en assurance de deux manières. Ces deux possibilités seront testées puis ensuite comparées afin de choisirla modélisation optimale pour notre contexte.

Nous testerons d’abord un modèle économétrique de panel, ce modèle est basé comme son nom l’indiquesur un modèle de panel permettant de tenir compte de l’aspect temporel de notre marge client. Avec ce modèlenous modéliserons directement la marge client (Prime− Sinistre− Frais).Nous testerons ensuite un modèle actuariel. Pour celui-ci nous considérons séparement les trois composantes dela marge c’est à dire d’un côté les primes, les sinistres et les frais. Nous ne modéliserons pas les primes et lesfrais pour des raisons que nous expliciterons dans la partie dédiée à ce modèle. Les sinistres quant à eux serontmodélisés de manière classique via des modèles linéaires généralisés.

Modélisation de la rétention client

Après avoir effectué le modèle de marge, nous modéliserons la rétention d’un client, plus précisement nousdéterminerons la probabilité pour un client de rester en portefeuille à chaque temps. Pour cela, nous nous ap-puierons sur les modèles de durée de vie généralement utilisés en assurance vie.Nous testerons deux modèles, le modèle de Cox et le modèle à vie accéléré. Ces deux modèles permettent detenir compte des caractéristiques du client nous donnant une vision plus précise sur sa probabilité de rester enportefeuille.

Modélisation de la vente croisée

13

Page 15: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Enfin, la dernière partie du chapitre consacrée à la valeur client attendue sera consacrée aux aspects devente croisée (ou cross-selling). Nous définissons une vente croisée comme le fait pour un client de souscrireun contrat supplémentaire. Par exemple, la vente d’un contrat multirisque habitation à un client possédant uncontrat automobile.Afin d’intégrer les ventes croisées au sein de notre modèle de valeur client, nous déterminerons dans un premiertemps la probabilité pour un client de souscrire un nouveau contrat. Cette probabilité peut être différente selonle produit vendu et selon les caractéristiques du client.Nous estimerons dans un second temps, le risque engendré par la souscription de ce nouveau contrat. En effet, lecontrat n’ayant pas été réellement souscrit par le client, il nous est impossible d’en connaître ses caractérisqueset donc son risque sous-jacent. Pour palier à ce problème nous ferons appel aux théories de la crédibilité et àson adaptation pour les problèmes de cross-selling.

Etape 4

Le dernier chapitre de notre étude sera consacré à une analyse croisée entre la valeur client passée et la valeurclient future. Nous tenterons par cette analyse de distinguer les clients à fort potentiel ainsi que les clients quela firme doit surveiller dans le futur. Ces analyses permettront d’atteindre nos objectifs fixés en terme d’avancéemarketing pour Eurofil et d’avoir une vision complète sur la clientèle en portefeuille.

14

Page 16: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

1.4 Description des données disponiblesPour réaliser l’étude qui suit, nous disposons des bases de données historiques d’Eurofil. Ces bases contiennent

l’intégralité des contrats depuis la création de la société en 1990. Les bases de données d’Eurofil peuvent êtrereprésentées selon le schéma conceptuel suivant :

Schéma conceptuel de la base de données

Garantie_MRH

NOCNT; NO9AVT

Image

NOCNT; NO9AVT

Garantie_4r

NOCNT; NO9AVT

Risque_MRH

NOCNT; NO9AVT

Risque_4r

NOCNT; NO9AVT

Sinsitre_4r

NOSIN

Sinistre_MRH

NOSIN

Personne

NOCLI

Vehiculier NOORD

LF

NOCNT=NOCNT &

NO9AVT=NO9AVT

LF

LF

LF

LF

LF

LF

LF

LF

NOCLI=NOCLI

Noord=NOORD

Détail de la prime

Caractéristiques du risque

Caractéristiques des sinistres

Caractéristiques clients

Caractéristiques contrats

Figure 1.7 – Schéma conceptuel des bases de données

Afin de réaliser notre étude, nous disposons des bases de données suivantes :

— La base Image contenant l’intégralité des contrats existants ou ayant existés au sein d’Eurofil. Les va-riables de cette base de données sont principalement des variables caractérisant le contrat comme parexemple le type de produit, le numéro de client, le montant de la prime. Cette base nous sera utile tout aulong de l’étude puisqu’elle caractérise le contrat. Notons que cette base a comme clé primaire le numérode contrat (NOCNT) et le numéro d’avenant (NO9AVT) permettant de suivre l’évolution d’un contratdans le temps.

— Les bases Garantie4R et GarantieMRH donnant le détail des primes de chaque contrat selon les garanties.— Les bases Risque4R et RisqueMRH donnant les caractéristiques de risques de chaque contrat. Par

exemple, la base RisqueMRH contiendra le type de logement, la superficie etc... Ces bases seront utileslors de la création des modèles, les variables de cette base de données seront utilisées comme variablesexplicatives.

— Les bases SinistreMRH et Sinistre4R donnant le montant de chaque sinistre avec leurs dates de surve-nances. Ces sinistres sont reliés à un contrat et un avenant. Cette base contient également les caractéris-tiques du sinistre.

— La base Personne donnant les caractéristiques des clients, la date de naissance, la situation familialeetc... Cette base sera utile lors de la création des modèles, les variables de cette base de données serontutilisées comme variables explicatives.

— La base Vehiculier donnant les caractéristiques des véhicules pour les contrats automobiles. Cette basede données sera utilisée lors de la modélisation du risque automobile.

Les bases de données seront agrégées entre elles selon les besoins de notre étude. Chaque modélisationeffectuée par la suite sera construite sur des bases de données différentes selon la modélisation visée.

15

Page 17: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Chapitre 2

Notion de valeur client

La valeur client est devenue un des modèles les plus utilisés afin d’estimer la profitabilité d’une compa-gnie [Boh11]. Le développement de cette métrique a été favorisé par la démonstration de son efficacité. Guptamentionne en 2006 que l’évaluation d’un client comme un actif a permis aux firmes d’améliorer leurs perfor-mances [Gup+06]. Gupta note également qu’évaluer la valeur client est vital pour évaluer la valeur d’une firme[Gup+06]. Venkatesan et Kumar [VGB04] notent en 2004 que la valeur client est un outil utile afin de maximiserla profitabilité d’une firme.La valeur client s’est donc imposée comme une métrique importante dans tous les secteurs économiques. Celle-cipermettant d’acquérir, de garder et de maximiser le potentiel d’un client [VK04].

L’attention portée à la valeur client a vu émerger de nombreux articles de recherches sur ce sujet et avec euxde nombreuses définitions selon le secteur économique et le but de ces études. Holbrook considère que la plupartdes recherches sur la valeur client ont pour but de maintenir la profitabilité d’une compagnie en sélectionnantles clients [Hol94].Le but pour une firme est de calculer une prédiction précise de la valeur client pour chaque client en portefeuille[MB05]. Ces prédictions permettront à la firme de prendre des décisions marketing envers ses clients [Zei01]. Lasomme des valeurs clients permettra également d’obtenir une évaluation du portefeuille clients total [Gup+06].

Une des raisons supplémentaires pour laquelle cette métrique est favorisée est qu’elle résume de façon simplela compléxité des transactions de chaque client. En une valeur la firme peut obtenir une vue globale sur toutson portefeuille ou une vue sur un client particulier. Elle peut donc prendre grâce à la valeur client des décisionsmacro ou micro en décidant par exemple d’écarter ou non un client de son portefeuille.

Dans ce chapitre, la notion de valeur client sera présentée en donnant tout d’abord les différentes définitionstous secteurs économiques confondus. La valeur client sera donc présentée de manière la plus globale possible.Dans un second temps, nous montrerons les spécificités de son calcul en assurance. Nous donnerons égalementune liste non exhaustive de modélisations possibles.Enfin, en combinant le résultat des deux parties précédentes nous justifirons le choix d’Eurofil quant à ladéfinition de la valeur client.

16

Page 18: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

2.1 Etude de l’état de l’art

2.1.1 Définition généraleLa notion de valeur client est devenue un indicateur important dans de nombreuses industries, comme nous

l’avons dit en introduction l’attention croissante portée à la valeur client a vu émerger différentes définitions.Nous donnons ci-dessous deux définitions formulées par Dwyer et Kumar et al. qui donnent une vue globale dela valeur client.

Définition 1 (Valeur client) : Dwyer [DF97] définit la valeur client comme la valeur présente des bénéficesattendus moins les coûts par client.

Définition 2 (Valeur client) : Kumar, Ramani et Bohling [VGB04] définissent la valeur client comme unesomme cumulée de cash flows actualisée pour un client durant toute sa relation avec la firme.

Notons la différence entre ces définitions, la définition de Dwyer prend en considération les bénéfices apportéspar client ce qui inclu les bénéfices directs comme indirects (exemple : le bouche à oreille).De plus, Dwyer considère les bénéfices attendus, cette définition n’inclut donc pas les bénéfices ou les coûtspassés (exemple : les coûts d’acquisitions). A l’inverse, la définition de Kumar définit la valeur comme unesomme de cash flow intégrant ainsi à la fois le passé et le futur.

Malgré les différences entre ces deux définitions une première formule de la valeur client peut être construitedonnant un cadre général à notre étude :

CLV =

T∑t=0

(Revenuet − Coutst)(1 + i)t

Avec :CLV : Valeur client (Customer lifetime value)Revenuet : Les revenus générés par le client à la date tCoutst : Les coûts à la date ti : Le taux d’actualisation

Afin d’affiner la définition de valeur client, il nous faut définir le contexte dans lequel celle-ci est calculée.Par contexte, nous entendons la forme de la relation entre la firme et le client. Fader,Hardie et Lee [FHL06] ontproposé une classification des transactions.

Possibilités de transactions Non contractuelles ContractuellesContinues Séjour à l’hôtel Carte de crédit

Achat alimentaire Utilisation d’un téléphone mobile

Discrètes Renouvellement d’ordonnance Abonnement magazineParticipation à un évènement Club de sport

Assurance

Figure 2.1 – Catégorisation des transactions proposées par Feder, Hardie et Lee (2006)

Ici, les auteurs scindent les transactions en quatre parties. Ils mettent en opposition les transactions contrac-tuelles, où la firme est engagée contractuellement avec le client, et non contractuelles. Ils mettent également enopposition les transactions discrètes (ou ponctuelles), comme la participation à un évènement, et les transactionscontinues comme l’utilisation d’une carte de crédit.

Cette catégorisation est essentielle car elle caractérise premièrement l’intérêt des firmes. En effet, dans uncontexte contractuel la firme est intéressée principalement par la rétention client. En effet, le risque majeur pourla firme est que le client rompt le contrat. Au contraire, dans un contexte non contractuel, la firme s’intéresseà l’activité future du client.Elle définit également les données disponibles par la firme. Les transactions non contractuelles sont générale-ment des transactions non régulières avec un grand nombre de clients anonymes. A l’inverse, les transactionscontractuelles sont plus régulières, sur un nombre de clients connus et restreints.Enfin, ces catégories permettent de définir les solutions de gestion de la valeur client par les équipes marketing.

17

Page 19: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Siddarth S.SINGH [SSI13] a proposé en 2013 de rafiner cette catégorisation en incoporant une troisièmedimension qui est l’aspect variable ou fixe de la dépense client. Notons que les contrats d’assurance sont destransactions contratuelles, discrètes et fixes (dans une certaine mesure : modulo les majorations et les change-ments de tarifications). Par la suite, nous ne nous intéressons qu’aux modèles permettant de modéliser ce typede situation.

2.1.2 Spécifités en assuranceDans la suite, nous nous focaliserons sur la valeur client en assurance. Comme nous l’avons dit précédem-

ment, les transactions en assurance sont contractuelles et discrètes.

Plusieurs spécificités en assurance peuvent être notées notamment, l’aspect aléatoire des coûts. Contraire-ment aux industries classiques, les compagnies d’assurance ne connaissent pas le coût de leurs produits avantleurs ventes. Le coût est déterminé par la survenance des sinistres des assurés qui arrivent de façon aléatoire dansl’année. Le cycle de production de l’assureur est dit inversé. Du fait de ce phénomène, la marge de l’assureurest donc aléatoire.Dans le cas d’Eurofil, notons également des frais d’acquisition complexes à prendre en compte, puisque Eurofildoit payer ses intermédiaires, les comparateurs qui se rémunèrent différemment selon leur business model.

En 2005, Bas Donkers, Peter C.Verhoef et Martijn G. de Jong [DCG06] ont effectué une revue des modèlesafin de modéliser la valeur client en assurance. Leur définition de valeur client est la suivante :Pour un client i à la date t, la valeur client est :

CLVi,t =

T∑τ=0

(Profiti,t+τ )

(1 + r)τ

Avec :

Profiti,t =

J∑j=1

Servij,t × Usageij,t ×Marginj,t

Avec :CLV : Valeur client (Customer lifetime value)Profiti,t : Le profit généré par le client à la date tServij, t : Une indicatrice à 1 si le client i détient le service j à la date tUsageij,t : Le nombre de services j détenus par le client iMarginj,t : Le profit moyen du service jr : Le taux d’actualisation

Plusieurs remarques peuvent être effectuées sur ce modèle. Tout d’abord, la marge (Margin) ne dépend pasdu client i. Donkers explique que pour leur application l’estimation des risques individuels n’était pas possible.Nous lèverons cette hypothèse dans nos modèles dans la suite de ce mémoire.

Donkers propose plusieurs modèles permettant de modéliser le profit, l’intégralité de ces modèles se base surdeux modèles principaux :

Modèle de régression :

Profiti,t+1 = α0 + α1 × Profiti,tModèle de rétention :

E[Profiti,t+1] = P (ret|xi)× Profiti,tDans ces deux modèles Donkers introduit une dépendance temporelle entre le profit en t et en t+1 de l’in-

dividu. Dans le premier modèle cette dépendance est linéaire, dans le second elle est reliée à une probabilité derétention du client.

18

Page 20: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

En 2012, Greg Firestone et Mohamad Hindawi [HF12] proposent dans un document de la Casualty ActuarialSociety (CAS) une autre modélisation du profit du client. Leur modèle est le suivant :

CLV =

T∑t=1

(Primet − Coutt)(1 + i)t

× p(t)−AC

Les auteurs distinguent dans les côuts, les sinistres et les frais considérés comme fixes. Chaque partie de laformule est modélisée de façon individuelle.

Pour les primes, les auteurs proposent deux solutions. Soit construire un modèle de prime, qui doit êtretotalement décorrélé de l’effet rétention (p), ou prendre comme hypothèse que les primes augmentent d’uncertain coefficient chaque année.Pour les coûts, les auteurs suggèrent de créer un modèle de coût intégrant ou non les frais et le coût du capital.Pour la rétention, les auteurs proposent deux modèles, un modèle logistique ou un modèle de durée de vie.

19

Page 21: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

2.2 Définition retenue par EurofilDans la suite de l’étude, deux types de valeurs clients sont distingués. La valeur client passée et la valeur

client future. Les définitions retenues par Eurofil pour ces deux concepts sont les suivantes :

Définition 3 (Valeur client passée) : Le bénéfice cumulé d’un client en portefeuille jusqu’à aujourd’hui.

CVi =

T∑t=0

((Primei,t − Sinistrei,t − FGi,t)× (1 + r)t

)− FAi × (1 + r)T

Avec :CVi : Valeur client du client iPrimei,t : Les primes de l’individu i à la date tSinistrei,t : Le montant des sinistres du client i à la date tFGi,t : Les frais généraux du client i à la date tFAi : Les frais d’acquisition pour le client ir : Le taux de capitalisationT : Durée de la relation entre le client et la firme jusqu’à aujourd’hui (en année)

La valeur passée est calculée comme la somme des primes, des sinistres et des frais capitalisés sur chaquecontrat du client. Les frais d’acquisition sont également pris en considération.

Définition 4 (Valeur client future hors vente croisée) : La valeur attendue d’un client existant jusqu’à un pointdans le temps.

CLVi =

T∑t=1

E[(Primei,t − Sinistrei,t − FGi,t)](1 + d)t

× pi,t

Avec :CLV : Valeur client du client iPrimei,t : Les primes de l’individu i à la date tSinistrei,t : Le montant des sinistres du client i à la date tFGi,t : Les frais généraux du client i à la date td : Le taux d’actualisationpi,t : La probabilité d’un client i de rester en portefeuille à tT : Horizon de temps (3 ans)

La valeur client est la somme actualisée des primes, de sinistres et des frais de chaque client. Nous multi-plions celle-ci par p représentant la probabilité de rester en portefeuille du client. Dans cette formule, les fraisd’acquisition n’apparaissent pas, contrairement à la formule précédente. En effet, la valeur est calculée pour desclients qui sont actuellement en portefeuille.

Définition 5 (Valeur client future avec vente croisée) : La valeur attendue d’un client existant jusqu’à un pointdans le temps y compris les ventes croisées.

CLVi =

T∑t=1

E[(Primei,t − Sinistrei,t − FGi,t)](1 + d)t

× pi,t +

J∑j=1

E[(Primei,j,t − Sinistrei,j,t − FGi,j,t)](1 + d)t

× pi,j,t × ci,j,t

Avec :Primei,j,t : Les primes de l’individu i à la date t pour le contrat jSinistrei,j,t : Le montant des sinistres du client i à la date t pour le contrat jFGi,j,t : Les frais du client i à la date t pour le contrat jd : Le taux d’actualisationpi,j,t : La probabilité d’un client i de rester en portefeuille à t pour le contrat jci,j,t : La probabilité pour un client i de souscrire le contrat j à la date t

20

Page 22: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

La partie gauche de la formule représente la valeur client attendue sur les contrats d’ores et déjà détenuspar le client. La partie de droite représente la valeur client potentielle des ventes croisées.

Les deux premières définitions s’appuient directement sur les travaux de Greg Firestone et Mohamad Hin-dawi. Eurofil sépare simplement la valeur donnée par ces auteurs en deux composantes, la valeur passée et lavaleur future. Cette séparation a pour but d’effectuer une analyse croisée entre la valeur client passée et futureafin de repérer les clients à fort potentiel.Pour la valeur client future, Eurofil veut se limiter à un horizon de temps égal à trois ans, notre T sera doncde 3 dans la suite de ce mémoire. Les perspectives d’un client au delà de trois ans sont considérées comme tropincertaines. En effet, dans les modélisations effectuées par la suite nous prenons en compte des caractéristiquesclients (tel que le nombre d’enfants ou la situation familiale), extrapoler ces caractéristiques sur un horizon longest un exercice difficile.

Dans la suite de cette étude, nous allons modéliser la valeur d’un client dans le temps. Nous présentons iciun schéma représentant la valeur d’un client :

4 3 2 1 5 6 7

Valeur client

Temps

Valeur client passée Valeur client future

Exemple d’évolution de la valeur client

Aujourd’hui

Figure 2.2 – Exemple 1 d’évolution de la valeur client

Nous représentons ci-dessus la valeur client à chaque pas de temps. Nous considérons ici que le client estentré en portefeuille à t égale 1. La valeur client est généralement négative la première année, cela est dû aucoût d’acquisition du client. La valeur peut ensuite être soit positive soit négative selon le niveau de primes, desinistres et de frais du client.Pour t supérieur à 4, la probabilité pt de sortir du portefeuille à t est introduite. La valeur client est alorsdécroissante (peut être croissante si nous prenons en compte les effets de cross-selling).La valeur client passée est ici la somme des marges du client de son arrivée en portefeuille à aujourd’hui.La valeur client future est la somme des flux futurs attendus de t égale 5 à notre horizon de temps.

Nous pouvons également représenter la valeur client en détaillant chaque élément de la formule :

21

Page 23: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Valeur client

Temps 4 3 2 1

Frais d’acquisition

Frais de gestion

Prime

Sinistre

5 6 7

Valeur client passée Valeur client future

Exemple d’évolution de la valeur client

Aujourd’hui

Figure 2.3 – Exemple 2 d’évolution de la valeur client

Ainsi, nous voyons apparaître en t égale 1 les frais d’acquisition client qui amènent à une marge globalegénéralement négative la première année. Durant la vie du contrat, le client peut avoir des sinistres, sinistresdont nous avons une connaissance parfaite jusqu’à aujourd’hui. Dans notre exemple, le client a eu un sinistreen t égale 3. Le montant de sinistre sera pour la valeur client future l’espérance des sinistres pour ce client.

22

Page 24: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Chapitre 3

Valeur client passée

Dans le chapitre précédent, nous avons défini la valeur client passée et future selon Eurofil. Ce chapitre seraconsacré au calcul de la valeur client observée (ou passée).

La connaissance de la clientèle en portefeuille est une première étape pour notre modélisation de valeurclient. Le calcul et l’analyse de la valeur client passée a plusieurs buts.Tout d’abord, analyser la valeur client passée permettra de valider notre définition de la valeur client donnéeau chapitre précédent. En effet, les différentes études extérieures faites sur le sujet ont permis de dégager destendances sur la valeur client que nous devons retrouver sur notre base de données. De plus, l’équipe techniqued’Eurofil, ayant une certaine expérience, a quelques intuitions sur le comportement de la valeur client observéeen se basant notamment sur différentes études réalisées en amont de ce projet.Ensuite, le calcul de la valeur client passée est une étape indispensable pour l’analyse croisée entre cette valeuret la valeur client que nous modéliserons dans le chapitre 4.

Afin de calculer la valeur client observée, nous scinderons ce chapitre en différentes parties. Dans un premiertemps, nous détaillerons la méthodologie de calcul de cette valeur. Pour ce faire, nous expliciterons chaquecomposante de la formule et donnerons les hypothèses et les périmètres retenus par Eurofil.

Dans un second temps, nous présenterons et analyserons les résultats obtenus pour cette valeur et valideronsnotre définition.

23

Page 25: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

3.1 Méthodologie de calculNous détaillons ici le calcul de la valeur client observée. Cette valeur est calculée pour chaque client encore

en portefeuille à la date d’étude. La formule de calcul est la suivante :

CVi =

T∑t=0

((Primei,t − Sinistrei,t − FGi,t)× (1 + r)t

)− FAi × (1 + r)T

La première partie de la formule nous donne la marge observée sur le client à chaque exercice. La margeest sommée sur toute la durée de la relation entre la firme et le client. Le temps 0 représentant le début de larelation avec la firme et T la date d’aujourd’hui. La marge est capitalisée à un taux r afin de tenir compte del’effet d’opportunité de la firme. En effet, la marge du client a été placée durant ces dernières années, elle a doncrapporté à la firme un montant supplémentaire.La seconde partie de la formule prend en compte les frais d’acquition du client au temps 0, ce montant étantnul après t égal zéro, il n’entre donc pas dans la somme.

La suite de cette section sera consacrée à chacun des points de la formule ci-dessus.

3.1.1 Focus sur les primes et les sinistresLa valeur client passée est calculée de façon brute, aucun retraitement n’est effectué sur les sinistres et les

primes. En effet, une possibilité envisageable était de retraiter les sinistres des clients en les écrêtant à un certainseuil. Cela aurait permis de lisser la valeur client passée et par conséquent de ne pas pénaliser les clients ayanteu des sinistres graves. Cette possibilité a été écartée car elle aurait biaisé notre analyse croisée entre la valeurclient passée (observée) et future (attendue).Pour les primes, nous utilisons les primes hors taxes calculées sur le portefeuille Eurofil.Pour les sinistres nous utilisons les montants évalués à la date de notre étude.

3.1.2 Focus sur les fraisDans notre calcul de valeur client nous avons séparé les frais d’Eurofil en deux parties distinctes. D’une part,

nous avons les frais de gestion comprenant l’intégralité des frais liés à la gestion des clients, des contrats et dessinistres. Ces frais sont en majeure partie les salaires versés aux gestionnaires.

D’autre part, nous avons les frais d’acquisition d’un contrat. Ces frais comprennent notamment les fraismarketing qui ont pour but de démarcher les clients et de faire connaître la marque Eurofil auprès de sa cibleclientèle. Nous tenons compte également des commissions versées aux sites comparateurs, commissions qui sontfonction du nombre de clics sur les contrats Eurofil. Enfin, nous prenons en compte les frais d’acquisition in-ternes qui sont principalement les salaires versés aux plateformes téléphoniques s’occupant de la finalisation descontrats.

NB : Par souci de confidentialité, nous ne diffuserons pas les frais de gestion et d’acquisition d’Eurofil, seule-ment leurs parts relatives.

3.1.2.1 Les frais d’acquisition

Typologie des clients

Eurofil est une compagnie directe, de ce fait, les frais d’acquisition sont différents d’une compagnie d’assu-rance classique. Avant d’entrer dans le calcul de ces frais revenons dans un premier temps sur le parcours clientdonné au chapitre 1 :

Les clients d’Eurofil peuvent venir de différents canaux. Nous pouvons distinguer quatre types de clients :— Le client full web provenant des comparateurs : ce client a été sur un site comparateur et a acheté sa

police d’assurance en ligne.— Le client non full web provenant des comparateurs : ce client a été sur un site comparateur, a effectué

un devis en ligne puis a été mis en relation avec les équipes d’Eurofil pour finaliser son contrat.— Le client full web provenant du site Eurofil : ce client a été sur le site d’Eurofil et a acheté sa police

d’assurance en ligne.

24

Page 26: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

— Le client non full web provenant du site Eurofil : ce client a été sur le site d’Eurofil, a effectué un devisen ligne puis a été mis en relation avec les équipes d’Eurofil pour finaliser son contrat.

Dans notre étude, nous définirons pour chacun de ces parcours clients des frais d’acquisition différents. Eneffet, du fait de son parcours, le client dialogue avec un certain nombre d’interlocuteurs et passe par différentesplateformes. Ces interactions ont un coût qui est différent selon les plateformes et surtout ce coût est nul si leclient n’est pas passé par celles-ci.

Typologie des frais d’acquisition

Après avoir défini les différents parcours d’un client, il nous faut maintenant définir une typologie des fraisd’acquisition. Nous pouvons distinguer deux types de frais d’acquisition :

— Les frais d’acquisition externes— Les frais d’acquisition internes

Les frais d’acquistion externes sont principalement les commissions payées aux comparateurs. Le méca-nisme de rémunération des comparateurs peut être de deux ordres. Les comparateurs peuvent se rénumérer auxnombres de clics effectués sur un contrat Eurofil, Ils peuvent également se rémunérer aux nombres de contratstransformés par Eurofil. Pour notre étude, nous ne ferons pas de distinction selon le mode de fonctionnementde chaque comparateur. Nous n’utiliserons que la somme globale des commissions versées par comparateur.De plus, Eurofil n’étant présent que pour son produit automobile sur les comparateurs, ces commissions neconcernent seulement les clients ayant souscrit un contrat automobile.

Les frais d’acquisition internes regroupent les frais de maintien du site web Eurofil, la masse salariale Eurofildédiée à l’acquisition de la clientèle et les frais marketing.

Typologie complète des frais

En tenant compte de la typologie des frais et du parcours du client nous pouvons remplir pour chaque typede client le tableau suivant :

full web non full webComparateur frais externes frais internes + frais externesNon comparateur frais internes frais internes

Figure 3.1 – Catégorisation des frais

Cette première typologie nous permet d’ores et déjà d’affirmer que les frais d’acquisition d’un client sontdifférents en fonction de son parcours. Nous pouvons néanmoins affiner ce calcul des frais en prenant en compted’autres caractéristiques. Nous différencierons chacun des frais (internes et externes) par :

— Type de contractants (client ou prospect)— Type de comparateurs (Les furets, Le Lynx...)— Produit (Automobile, MRH, PFA)— Formule (Tous risques, Tiers...)

Le calcul des frais se base notamment sur le temps passé par un souscripteur pour finaliser un contrat, tempsqui diffère pour les clients ou les prospects (nouveau client). Dans le cas d’un client le souscripteur n’a pas besoinde demander les informations que nous avons d’ores et déjà sur la personne. Dans notre calcul de frais, prendreen considération cette information est naturelle car la comptabilité analytique nous fournit la masse salarialedédiée à la gestion des clients et la masse salariale dédiée à la gestion des prospects. Cette information estscindée par la suite par produit et formule via une clé de répartition basée sur les taux de transformation dechaque produit et formule.Le calcul des frais se base également sur les commissions versées au comparateur, les négociations des prixétant faites avec chaque comparateur, les prix diffèrent. La comptabilité analytique nous fournit la somme descommissions versées aux comparateurs pour l’année, cette information est ensuite scindée par produit et formulevia une clé de répartition basée sur les affaires nouvelles de l’année.

Nous pouvons résumer la segmentation des frais avec le schéma ci-dessous. Pour chaque client dans notre basede données nous nous posons chacune des questions ci-dessous afin d’obtenir les frais de ce client en particulier.

25

Page 27: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Afin de calculer les frais d’acquisition d’un individu facilement, notre output de frais est une matrice donnantpour chaque possibilité les frais engendrés. Nous venons ensuite joindre cet output avec notre base de donnéesclients.

Segmentation des frais d’acquisition

Quel est le type de

contractant ?

Quel canal d’entrée ?

Contact téléphonique?

Quel produit ? Quel formule ?

Client

Prospect

Site Eurofil

Comparateur

Les furets

Le Lynx

Oui

Non

MRH

Auto

PFA

Tiers

Tous risques

Calcul des frais

Figure 3.2 – Segmentation des frais d’acquisition

Méthodologie de calcul

Afin de calculer les frais d’acquisition nous nous sommes basés sur les fichiers du service de comptabilitéanalytique. Nous avons amélioré leur méthodologie de calcul en prenant en compte le type de formule sous-crit par le client. Par souci de confidentialité, nous ne détaillerons pas ici le calcul des frais d’acquisition d’Eurofil.

Nous pouvons tout de même noter que pour cette étude les frais sont calculés pour l’année 2015 seulement.Nous rapportons ensuite les frais calculés aux primes acquises sur l’année (par segment de frais). Ainsi, nousobtenons pour chaque segment de frais défini précédemment un pourcentage de frais dans la prime.Cette solution a été mise en place pour plusieurs raisons. Tout d’abord, faire fluctuer les frais d’acquisition aucours du temps pénaliserait des clients pour des raisons qui ne sont pas liées au client mais à la performance deséquipes Eurofil (mauvais taux de transformation, masse salariale non adaptée). Ensuite, le montant des primesayant évolué nous ne pouvons pas laisser les frais calculés plus haut en montant, nous les transformons donc enpourcentage de prime.

Ci-dessous nous repésentons l’écart relatif de frais d’acquisition entre quatre profils (base Profil 1) :

— Profil 1 (base 100) : Un prospect qui a intégralement souscrit son contrat en ligne sur le site d’Eurofil,ayant souscrit un contrat Auto tous risques

— Profil 2 : Un prospect qui a saisi son devis en ligne sur le site d’Eurofil et a été rappelé afin de finaliserle contrat, ayant souscrit un contrat Auto tous risques

— Profil 3 : Un prospect qui a saisi son devis en ligne sur un site comparateur, ayant souscrit un contratAuto tous risques

— Profil 4 : Un prospect qui a saisi son devis en ligne sur un site comparateur et a été rappelé par leséquipes d’Eurofil afin de finaliser le contrat, ayant souscrit un contrat Auto tous risques

26

Page 28: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

100%

176%

130%

207%

0.0

0.5

1.0

1.5

2.0

Profil 1 Profil 2 Profil 3 Profil 4Profil

Pou

rcen

tage

de

frai

s d'

acqu

isiti

on

Profil Profil 1 Profil 2 Profil 3 Profil 4

Comparaison du pourcentage de frais d'acquisition

Figure 3.3 – Comparaison des frais d’acquisition

NB : Nous représentons ci-dessus l’écart relatif des frais d’acquisition et non les frais en pourcentage de primes

Nous pouvons formuler plusieurs remarques sur le graphique ci-dessus. Tout d’abord, nous pouvons noterque les frais diffèrent de manière significative selon les profils.Ensuite, nous pouvons noter que les clients coûtent plus cher lorsqu’ils viennent d’un site comparateur. Lescommissions à verser aux comparateurs ont un poids important sur les frais globaux.Enfin, les clients ont des frais d’acquisition plus faibles lorsqu’ils signent leur contrat directement en ligne. Eneffet, les clients ne passant pas par les plateformes téléphoniques d’Eurofil leurs frais d’acquisition baissent.

3.1.2.2 Les frais de gestion

Les frais de gestion sont divisés en deux catégories, les frais de gestion sinistres et les frais de gestion clients(ou contrats). La comptabilité analytique nous fournit la masse salariale d’Eurofil dédiée à la gestion des si-nistres ou à celui des clients. De la même manière que pour les frais d’acquistion nous distinguons les frais desinistre et de gestion par :

— Produit (Automobile, MRH, PFA)— Formule (Tous risques, Tiers...)

Les frais de gestion sinistre sont scindés selon la formule des contrats via une clé de répartition basée sur lenombre de sinistres observés sur chaque formule. Notons que pour le calcul de la valeur client passée les fraisde gestion sinistre seront appliqués seulement sur les personnes ayant eu au moins un sinistre. De cette manièrenous favorisons les personnes n’ayant pas eu de sinistre dans le passé. Pour la valeur client future, nous créonsune autre clé de répartition basée sur la fréquence de sinistralité observée.Les frais de gestion clients sont quant à eux scindés par formule en utilisant une clé de répartition basée sur lenombre de contrats dans le portefeuille d’Eurofil.Pour les mêmes raisons que les frais d’acquisition, nous rapportons les frais de gestion aux primes acquises.

3.1.3 Focus sur le facteur de capitalisationLe facteur de capitalisation r représente le gain financier réalisé par la firme sur les marges des clients dans le

passé. Nous prenons comme facteur de capitalisation les taux OAT 10 ans de l’état français. Nous représentonsci-dessous les taux OAT moyens de 1990 à 2015.

27

Page 29: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

0.000

0.025

0.050

0.075

0.100

1990 2000 2010Annee

Taux

Taux OAT moyen 10 ans de l'état français

Figure 3.4 – Historique des taux OAT 10 ans

Les taux OAT nous donnent le rendement financier d’un placement "sans risque". En ayant cet historiquede taux nous pouvons dans notre formule de valeur client passée faire varier notre r en fonction du temps, ildevient donc rt.Au vu de la réglementation actuelle sur les sociétés d’assurance, les assureurs français sont d’importants inves-tisseurs institutionnels. Pour ce mémoire, nous optons donc pour l’utilisation des taux OAT 10 ans pour notrecapitalisation. Une autre possibilité aurait été d’utiliser le taux de rendement financier d’Eurofil, cependantEurofil étant une marque d’Aviva et non pas une filiale ce taux de rendement n’est actuellement pas calculé ausein d’Eurofil.

28

Page 30: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

3.2 RésultatsNous avons défini dans la section précédente la méthodologie de calcul de la valeur client passée. Dans cette

section, nous analysons les résultats obtenus. Par souci de lisibilité nous ne repésenterons pas l’ensemble desrésultats des analyses, seulement une partie.

Nous pouvons d’ores et déjà donner quelques graphiques permettant une première analyse. Nous représentonsci-dessous la valeur client moyenne observée selon le nombre de contrats, l’ancienneté, la situation familiale, letype de produit.

2522

1652

1257

569

4−4+

3−3

2−2

1−1

0 500

1000

1500

2000

2500

Valeur client

Nom

bre

de c

ontr

ats

Moyenne des valeurs clients passees (montant) par nombre de contrats

1085

814

EN COUPLE

SEUL

0 300

600

900

Valeur client

Situ

atio

n

Moyenne des valeurs clients passees (montant) par situation

3867

1878

897

268

−1

−199

6−]13,Inf[

5−]7,13]

4−]4,7]

3−]2,4]

2−]1,2]

1−]0,1]

0

1000

2000

3000

4000

Valeur client

Anc

ienn

eté

Moyenne des valeurs clients passees (montant) par anciennete

1562

2231

491

618

1222

436

913

456

Auto/MRH/PFA

Auto/MRH

Auto2

MRH/PFA

Auto1

Auto/PFA

PFA

MRH0 500

1000

1500

2000Valeur client

Type

de

cont

rats

Moyenne des valeurs clients passees (montant) par type de contrat

Figure 3.5 – Valeur client passée : Analyse

Au delà du fait que la valeur client augmente avec le nombre de contrats, ce qui est plutôt intuitif nouspouvons noter que l’ancienneté d’un client influence de façon positive sa valeur client. Notons que les clientsayant une ancienneté d’un an ou moins ont en moyenne une valeur client négative, ce phénomène est dû auxcoûts d’acquisition du client en première année.Nous pouvons également souligner qu’un client possédant plusieurs produits a en moyenne une valeur clientplus élevée. Notons que les clients n’ayant que un contrat automobile ont une valeur client plus élevée que lespersonnes n’ayant que un contrat PFA ou un contrat MRH.

Nous donnons ci-dessous une autre représentation possible de valeur client. Nous avons scindé notre valeurclient passée en 20 quantiles, nous donnant un score pour le client allant de 1 à 20 (où 1 représente le premierquantile et 20 le dernier).Nous pouvons noter que 90% des clients ayant une ancienneté inférieure à 1 an ont un score inférieur à 10 (lamédiane). En revanche, seulement 12% des clients ayant une ancienneté supérieure à 13 ans ont une valeur clientinférieure à 10.

29

Page 31: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

6−]13,Inf[

5−]7,13]

4−]4,7]

3−]2,4]

2−]1,2]

1−]0,1]

0.00 0.25 0.50 0.75 1.00Pourcentage

Anc

ienn

eté

score_client1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

Répartition des scores par ancienneté

Figure 3.6 – Valeur passée :Score par ancienneté

4−4+

3−3

2−2

1−1

0.00 0.25 0.50 0.75 1.00Pourcentage

Nom

bre

de c

ontr

ats

score_client1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

Repartition des scores par nombre de contrats

Figure 3.7 – Valeur passée :Score par nombre de contrats

Les résultats que nous obtenons viennent confirmer nos intuitions sur la valeur client. Néanmoins, les résultatsque nous obtenons ne nous donnent pas une vision complète sur le risque du client au niveau indiviuel. Afind’obtenir plus de détails sur la valeur client, il nous faut désormais calculer la valeur client attendue. Enfin,rappelons que la valeur client passée sera utilisée par la suite dans une analyse croisée entre la valeur clientpassée et la valeur client future.

30

Page 32: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Chapitre 4

Valeur client potentielle

L’analyse de la valeur client observée n’est pas suffisante pour notre étude. L’équipe d’Eurofil souhaiteconnaître le potentiel d’un client dans le futur pour un horizon de trois ans. Nous avons pu voir dans le chapitreprécédent que la valeur client observée pouvait être très différente selon les caractérisques du client. Nous avonspu voir notamment que l’ancienneté et le nombre de contrats étaient des indicateurs importants.De plus, la valeur client modélisée est une étape indispensable afin d’effectuer une analyse croisée entre elle etla valeur client observée que nous effectuerons au chapitre 5.

Ce chapitre est consacré au calcul de la valeur client future. Dans un premier temps, nous modéliserons lamarge du client en nous appuyant sur deux modèles. Tout d’abord un modèle économétrique puis un modèleactuariel. Les deux modèles seront comparés et nous choisirons le modèle dont les performances sont les plushautes.Dans un second temps, nous modéliserons la rétention des clients à l’aide des modèles de durée. Nous testeronsdeux modèles, le modèle de Cox et un modèle à vie accéléré. Les deux modèles seront comparés et nous choisironsle modèle dont les performances sont les plus hautes.Enfin, nous introduirons la notion de ventes croisées (cross selling) dans notre modèle de valeur client. Toutd’abord en calculant la probabilité pour un client d’acheter un nouveau contrat. Puis, nous calculerons le risqueengendré par la détention de ce nouveau contrat.

31

Page 33: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

4.1 Modélisation de la marge

Rappel sur l’objectif du modèle :

Le modèle de marge que nous allons développer dans la suite de ce chapitre a pour objectif de calculer lamarge espérée d’un client Eurofil à chaque pas de temps.

Rappelons la définition de la valeur client future :

CLVi =

T∑t=1

E[(Primei,t − Sinistrei,t − Fraisi,t)](1 + d)t

× pi,t

En rouge, la partie de la valeur client que nous allons modéliser.

4.1.1 Choix du modèleTrois modélisations sont possibles pour la modélisation de la marge :— Utiliser le ratio combiné moyen— Un modèle économétrique— Un modèle actuariel

Eurofil s’est focalisé sur les deux derniers modèles.

Le premier modèle est le modèle le plus simple, la marge est calculée en utilisant le ratio combiné moyenobservé sur le portefeuille. Afin d’appliquer ce modèle, nous devons faire plusieurs hypothèses. Tout d’abord, lamarge doit être la même pour tous les contrats quelles que soient les caractéristiques du client. De plus, nousprenons pour hypothèse que le ratio combiné reste constant dans le temps. Ces hypothèses ne sont pas vérifiéessur le portefeuille Eurofil. En effet, nous observons des S/P volatiles dans le temps et qui diffèrent selon lessegments de clients. Ce premier modèle n’a donc pas été testé sur notre base de données.

Dans la suite, nous développerons les deux modèles restants. Le modèle que nous appellerons économétriquecar basé sur un modèle de panel. Dans ce modèle, nous estimons directement la marge du client (Prime −Sinistre− Frais).Nous détaillerons également le modèle que nous appellerons actuariel car basé sur des méthodes classiquesd’estimation des risques en actuariat. Dans ce modèle, nous estimons la marge du client en estimant de façonséparée les Primes les Sinistres et les Frais.

4.1.2 Modèle économétrique4.1.2.1 Présentation du modèle

Le modèle économétrique que nous mettons en place est un modèle de panel. Le modèle de panel est définide la manière suivante [Hur10] :

γi,t = ν × γi,t−1 + β ×Xi,t + λt + αi + εi,t

Avec :γ : La variable à modéliserX : Les variables explicativesλ : L’effet du tempsα : L’effet de l’individui : Le client it : Le tempsε : Le terme d’erreur

Dans notre cas, nous modélisons la marge, nous pouvons donc écrire :

Margei,t = ν ×Margei,t−1 + β ×Xi,t + λt + εi,t

Avec :Marge : La marge du client : Prime− Sinistre− Frais

32

Page 34: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Ce modèle prend pour hypothèse que la marge du client i en t dépend de sa marge en t − 1. Comme nousl’avons dit dans le chapitre 2 ce type de modèle a été suggéré par Bas Donkers, Peter C.Verhoef et Martijn G.de Jong [DCG06] en 2005.Nous n’intégrons pas dans notre modélisation l’effet individuel αi. L’effet individuel est un coefficient propre àchaque individu. Cet effet serait utile si notre portefeuille de client restait inchangé, or ce n’est pas le cas, si ceteffet était utilisé notre modèle ne pourrait pas estimer la marge pour un nouveau client.En revanche, nous introduisons le paramètre λt qui est un effet temporel. En introduisant ce facteur, nous sou-haitons observer si la marge d’un individu dépend du temps durant lequel il est resté en portefeuille. Autrementdit, est ce qu’un client qui est en portefeuille depuis 5 ans a une marge plus élevée qu’un client qui est enportefeuille depuis 1 an ?Enfin, ce modèle prend pour dernière hypothèse que la marge d’un client dépend de ses caractéristiques Xi,t

(son âge, ses produits...).

4.1.2.2 Etude préalable à la modélisation

Nous présentons ci-dessous les différentes étapes de la modélisation de la marge.

Périmètre d’étude

Définissons tout d’abord le périmètre d’étude. La marge est calculée pour chaque client sur un historique de10 ans.La gamme de produits automobile d’Eurofil a été renouvelée en 2014, les formules souscrites depuis 2014 sontdonc différentes de celles souscrites avant 2014. Au vu du faible nombre de données, nous ne pouvons pasrestreindre notre étude aux années 2014 et 2015. Pour palier à ce problème nous utilisons une table de cor-respondances effectuée par l’équipe Eurofil permettant de passer des formules automobiles anciennes (en venteavant 2014) aux nouvelles.Les autres produits MRH et PFA n’ont pas évolués de manière significative depuis 10 ans.

Mise en "as if" des sinistres, des frais et des primes

La mise en "as if" des sinistres consiste à valoriser les sinistres historiques pour que leurs montants reflètentun montant à aujourd’hui. En effet, un sinistre ayant eu lieu il y a 10 ans ne coûterait pas la même somme s’ilavait lieu cette année compte tenu de l’inflation. Cette mise en "as if" est une étape indispensable pour notremodèle étant donnée l’historique de sinistres sur lequel nous travaillons.Selon la nature du sinistre, nous ne les actualisons pas aux mêmes taux ainsi nous avons :

— Prime et Frais : Indice des prix à la consommation de l’INSEE— Sinistre :

— Dommage MRH : Indice de la fédération française du bâtiment— Dommage Auto : Indice du coût de remplacement des pièces de l’association des automobilistes— RC Auto : Indice de responsabilité générale de la FFSA— FPA : Indice des prix à la consommation de l’INSEE

Ces différents taux de capitalisation ont été choisis pour leur proximité avec les montants à capitaliser.Les sinistres dommages ont été capitalisés avec l’indice de la fédération française du bâtiment qui donne à chaquetrimestre un indice du coût de la recontruction des bâtiments. Cet indice est conservateur puisqu’il est calculéà partir du prix de revient d’un immeuble courant à Paris. Il enregistre les variations de coûts des différentséléments qui entrent dans la composition du bâtiment.Les sinistres automobiles dommages sont capitalisés selon l’indice de l’association des automobilistes qui donneun indice du coût de remplacement des pièces. Les sinistres responsabilité civile sont quant à eux capitalisésavec l’indice de responsabilité générale donné par la Fédération Française des Sociétés d’Assurance (FFSA).Enfin, les sinistres du produit Protection Famille Accident (PFA) sont capitalisés selon l’indice des prix à laconsommation donné par l’INSEE.

Etude des corrélations

Afin de construire notre modèle, nous étudions la dépendance entre les variables de notre base de données.En effet, les modèles linéaires sont connus pour sous performer en présence de variables fortement dépendantes.Pour étudier la dépendance entre nos variables, nous construisons le V de Cramer.

Nous définissons le V de Cramer de façon suivante :

33

Page 35: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

V =

√χ2

n

min(k − 1; r − 1)

Avec :

χ2 =∑i,j

(ni,j − ni.n.jn )

ni.n.jn

où nij est le nombre d’observations présentant la ième valeur pour la première variable et la jème valeur pourla seconde variable et avec ni. =

∑j nij , n.j =

∑i nij , n =

∑ij nij . Et avec, k le nombre de lignes du tableau

de contingence et r le nombre de colonnes.Un V de Cramer proche de zéro signifiant que la dépendance entre les variables est faible.

Ci-dessous la heat map du V de Cramer, nous n’avons pas, par souci de lisibilité, donné l’ensemble desvariables testées.

Age

Couverture

Nb contrats

Nb contrats auto

Nb contrats MRH

Nb contrats PFA

Nb enfants

Nb sinistres antérieurs

Population

Situation client

Age

Cou

vert

ure

Nb

cont

rats

Nb

cont

rats

aut

o

Nb

cont

rats

MR

H

Nb

cont

rats

PFA

Nb

enfa

nts

Nb

sini

stre

s an

térie

urs

Pop

ulat

ion

Situ

atio

n cl

ient

0.25

0.50

0.75

1.00value

V de cramer entre les variables

Figure 4.1 – Modèle de marge : Heat map V de Cramer

Les variables explicatives ci-dessus ne présentent aucune structure de dépendance particulière. Toutes cesvariables peuvent de plus constituer un facteur déterminant pour notre modèle de marge. Néanmoins, la va-riable nombre de contrats ne sera pas intégrée dans le modèle car est la somme des variables nombre de contratsautomobile, MRH et PFA.

Ecrêtement des sinistres

Avant d’effectuer notre modélisation, nous écrêtons nos sinistres. En effet, les sinistres incendies et RC au-tomobile présentent généralement une queue de distribution à queue épaisse qui peut nuire à la qualité de nosmodèles.

Dans ce mémoire, nous utiliserons la courbe d’excès résiduels afin de déterminer le seuil optimal d’écrêtement.

La théorie des valeurs extrêmes indique que si nous prenons un échantillon X1,...,Xn alors les observations(Xi− un)+ (avec un un seuil) sont caractérisées par une distribution de Pareto généralisée définie comme suit :

{1− [1 + ξ( xβ )]

−1ξ

+ si ξ 6= 0

y = 1− exβ si ξ = 0

avec :x ≥ 0 si ξ ≥ 00 ≤ x ≥ −βξ si ξ < 0

34

Page 36: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

De plus :

Si X ↪→ GPD(β, ξ) alors X − x|X > x ↪→ GPD(β + ξx, ξ)

et E[X − x|X > x] = β+ξx1−ξ

Cela permet alors de constater que l’espérance conditionnelle des excès résiduels est une fonction affine dusurplus x. Il s’agit de déterminer le seuil à partir duquel la courbe de l’espérance conditionnelle se comporte demanière affine.

Nous obtenons le résultat suivant sur nos données :

0.0e+00 5.0e+06 1.0e+07 1.5e+07 2.0e+07

0.0e

+00

5.0e

+06

1.0e

+07

1.5e

+07

Mean excess function

Threshold

Mea

n E

xces

s

Figure 4.2 – Modèle de marge : Meanexcess function des sinistres

0 500000 1000000 1500000 2000000

0e+

001e

+06

2e+

063e

+06

4e+

065e

+06

Mean excess function

Threshold

Mea

n E

xces

s

Figure 4.3 – Mean excessfunction zoom

Nous obtenons ici un seuil d’écrêtement à 250 000 euros. Seulement 69 observations sont supérieures à ceseuil.

4.1.2.3 Résultats du modèle économétrique de marge

Nous présentons ci-dessous les résultats de notre modèle économétrique de marge obtenu sur nos données :

Tout d’abord, notre modèle nous a montré que l’effet de la marge en t−1 sur la marge en t n’était pas signi-ficatif. La marge en t ne dépend donc pas de la marge en t− 1. Ce résultat n’est pas surprenant, en assurance,la marge d’un client est guidé par les sinistres du client. La marge sera positive si le client n’a pas eu de sinistreet généralement négative s’il a eu un sinistre. Or avoir un sinistre l’année 1 n’induit pas un sinistre l’année 2 etinversement.Dans le cas de Donkers et al. [DCG06] nous rappellons que la marge ne dépendait pas des caractéristiques duclient, les auteurs utlilisaient la marge moyenne observée par produit. Cette hypothèse avait été formulée dansleur étude par défaut car les auteurs n’avaient pas la possibilité d’obtenir la marge par client. Du fait de cettehypothèse, les auteurs n’avaient pas rencontré le problème mentionné ci-dessus.

Notre modèle nous a cependant montré que l’effet temps λt est un effet réel en assurance. Nous montronsci-dessous cet effet :

35

Page 37: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

0

100

200

2.5 5.0 7.5 10.0time

Lam

bda

Modèle de marge : effet du temps

Figure 4.4 – Modèle de marge : Effet temps

En abscisse nous avons l’ancienneté du client et en ordonné l’effet temps. Nous pouvons remarquer que l’effettemps est croissant avec le temps, plus un client reste en portefeuille plus la marge attendue est forte. La margeen première année d’un assuré est négative ce qui est dû aux coûts d’acquisition de celui-ci. Ce constat rejointcelui que nous avions fait dans le chapitre 3 lors du calcul de la valeur client passée.

Nous donnons ci-dessous les coefficients de régression donnés par notre modèle sur certaines variables expli-catives. Par souci de lisibilité nous n’affichons pas toutes les variables de notre modèle.

−16.5

−20.16 −21.07

−30.17 −30.41

0

−30

−20

−10

0

0−]1

8,25

]

1−]2

5,30

]

2−]3

0,40

]

3−]4

0,45

]

4−]4

5,60

]

5−]6

0,In

f[

Mod

Coe

f

Coefficients pour la variable âge

92.54

38.25

00

25

50

75

bass

e

moy

enne

haut

e

Mod

Coe

f

Coefficients pour la variable couverture

−67.47

70.82

0

−40

0

40

0−0

1−1

2−2+

Mod

Coe

f

Coefficients pour la variable nombre de contrats auto

40.07

76.19

00

20

40

60

0−0

1−1

2−2+

Mod

Coe

f

Coefficients pour la variable nombre de contrats MRH

Figure 4.5 – Modèle économétrique : Coefficients des principales variables

Nous pouvons noter que la marge d’un client est :— décroissante avec l’âge, un assuré entre 25 et 30 ans aura une marge de 16 euros plus basse toute chose

égale par ailleurs qu’un assuré de 18 ans. Cela peut être expliqué en partie par une sur tarification desjeunes conducteurs chez Eurofil.

— croissante avec le nombre de contrats automobiles (de même pour le nombre de contrats MRH et PFA).

36

Page 38: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

— croissante avec la hauteur de la couverture. Cette variable a été créée à partir des formules de contratsEurofil. Ainsi un contrat tous risques auto sera considéré comme une couverture haute.

— A l’inverse une couverture basique en MRH sera considérée comme une couverture basse. Si le clientpossède plusieurs contrats, nous considérons le contrat dont la couverture est la plus haute.

Nous donnons ci-dessous un exemple d’adéquation du modèle de marge pour un client :

−90

−48

133

157 156165 166

176

156

187

221 222

−100

0

100

200

2 4 6Temps

Mar

ge variablemodèleobservé

Exemple d'adéquation du modèle de marge

Figure 4.6 – Exemple d’adéquation d’une marge client

Nous observons que notre modèle de marge s’ajuste plutôt bien lorsqu’un client n’a pas eu de sinistre durantla durée de la relation avec la firme. Nous détaillerons dans la partie 4.1.4 (cf. 4.1.4) les performances de cemodèle.

4.1.2.4 Critique sur le modèle économétrique de marge

Nous pouvons apporter un certain nombre de critiques vis à vis de la modélisation de la marge via un modèleéconométrique de panel.

Tout d’abord, de façon intuitive ce modèle est peu adapté au secteur de l’assurance. En effet, comme nousl’avons dit la marge d’un client est surtout influencé par la composante Sinistre or ces sinistres sont aléatoire-ment répartis sur tous les t. Avoir une modélisation faisant intervenir une composante de temps est donc trèsdiscutable. Ce problème a notamment été vu lors de modélisation à travers la volatilité de nos coefficients derégression qui étaient très sensibles à l’ajout de nouvelles variables explicatives dans le modèle.

Ensuite, la marge d’un client étant très dispersé, les métriques classiques de régression comme le R² nepeuvent pas être utilisées. En effet, les écarts au carré sont tellement élevés que le rapport entre les écarts aucarré du modèle et celui-ci du modèle moyen est très faible. Les R² sont donc toujours proches de zéro. Nousverrons dans la suite de notre étude que nous comparerons les deux modèles de marges avec la Root MeanSquared Error (RMSE) et la Mean absolute percentage error (MAPE).

Enfin, la modélisation de la marge via un modèle économétrique ne nous permet pas d’utiliser l’ensembledes informations que nous avons à notre disposition. En effet, nous calculons la marge à une maille client, lesinformations relatives au contrat ne peuvent donc pas être intégrées à la modélisation. En intégrant les variablesrelatives au contrat, nous avons deux problèmes, tout d’abord nous devons arbitrer quelle modalité garder pourles clients possédant plusieurs contrats. Ce problème peut être réglé en prenant, par exemple, les informationsdu contrat dont la prime est la plus élevée. Le second problème est que certains clients ne possèdent qu’uncontrat MRH par exemple. Nous n’avons donc pas pour ces clients les informations concernant l’automobile.En mettant comme modalité "Non renseigné" pour les variables automobile nous créons une forte corrélationentre les variables automobile.

37

Page 39: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

4.1.3 Modèle actuarielLe modèle actuariel est basé sur les travaux de Greg Firestone et Mohamad Hindawi [HF12]. Afin de modéliser

la marge nous modéliserons à part les sinistres, les primes et les frais.

4.1.3.1 Modélisation des sinistres

Dans cette section, nous détaillerons la modélisation des sinistres. Nous nous focalisons sur les sinistresautomobile et MRH, le produit PFA représentant une infime part du portefeuille nous modéliserons la sinistralitépar un forfait. Nous effectuons au total quatre modèles :

Automobile MRH PFA

GLM tweedie pour les sinistres dommages

GLM poisson pour la fréquence des

sinistres RC

Montant moyen des sinistres RC

x

GLM tweedie pour les sinistres dommages

GLM poisson pour la fréquence des

sinistres incendies

Montant moyen des sinistres

Incendies

x

Prime pure moyenne 1 2

3 4

Modèle actuariel de marge

Figure 4.7 – Modèle de marge : Modélisation des sinistres

Les sinistres automobile sont séparés en deux catégories, d’une part les sinistres responsabilité civile corporelset de l’autre les sinistres dommages. Ces deux types de sinistres regroupent des garanties qui mériteraient dansune optique de tarification des modélisations séparées. Dans notre cas, nous nous limitons à cette séparationqui permet d’obtenir des résultats satisfaisants tout en limitant le nombre de modèles à construire.Pour le modèle dommage nous modéliserons directement la prime pure via une loi tweedie. Dans notre optiquede valeur client nous ne cherchons pas à différencier les effets de la fréquence et des coûts, l’approche fréquenceet coût moyen plus précise (en terme d’informations obtenues) mais également plus longue n’a donc pas étéprivilégiée.Le modèle RC sera modélisé quant à lui pour sa partie fréquence par une loi de poisson et pour la partie coûtpar un forfait.

Comme pour l’automobile, nous séparons la sinistralité MRH en deux catégories. D’une part les sinistreshors incendies et de l’autre les sinistres incendies.Les sinistres incendies seront modélisés pour leur fréquence par une loi de poisson et pour leur coût par forfait.Les sinistres dommages MRH seront modélisés via une loi Tweedie, nous modélisons donc directement la primepure. Nous utilisons cette approche pour les mêmes raisons que pour la sinistralité dommage automobile.

La sinistralité PFA sera modélisée par un forfait en observant la sinistralité moyenne du portefeuille.

Sur notre graphique, nous avons représenté en rouge les points à améliorer pour nos modélisations. En effet,afin de mieux segmenter notre portefeuille, il nous faudrait modéliser les coûts RC corporels, les coûts incendieset la sinistralité PFA.Nous avons fait le choix de ne pas les modéliser ici pour plusieurs raisons. Tout d’abord, les modélisationsde coûts automobile corporels sont généralement peu discrimantes. En effet, le coût d’un sinistre automobiledépend peu des caractéristiques de l’individu, ce coût est généralement lié aux circonstances de l’accident etaux personnes touchées.Ensuite, les modélisations corporels automobile et incendies sont généralement peu robustes du fait du nombrelimité de données à disposition. Ceci est d’autant plus vrai sur le portefeuille d’Eurofil, où nous avons au totalenviron 8 000 sinistres MRH par an toutes garanties confondues.Enfin, la sinistralité PFA représente un coût faible par rapport aux coûts des sinistres MRH et automobile.

NB : La modélisation de la sinistralité est nécessaire pour notre étude. En effet, à la date de notre étude les

38

Page 40: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

modèles de sinistralité sont en pleine refonte dans les équipes de tarification d’Eurofil. Il nous est donc impossibled’utiliser leurs modèles de sinistralité pour notre propre étude.

4.1.3.1.1 Méthodologie et étude préalable à la modélisation

Nous présentons ci-dessous les différentes étapes de la modélisation des sinistres. Ces étapes seront appli-quées sur les différents modèles que nous effectuons ici.

Périmètre d’étude

Le périmètre d’étude pour la modélisation des sinistres est le même que celui utilisé pour modéliser la marge.

Mise en "as if" des sinistres

De la même manière que pour le modèle de marge économétrique, nous utilisons un facteur afin de mettre àl’échelle tous les montants de sinistre. Pour ce faire, nous utilisons les mêmes facteurs que nous avions utilisésdans le modèle de marge économétrique.

Ecrêtement des sinistres

Les sinistres incendies et RC automobile présentent généralement une queue de distribution à queue épaissequi peut nuire à la qualité de nos modèles. Nous effectuons donc un écrêtement de nos sinistres.Nous utilisons comme pour le modèle économétrique la théorie des valeurs extrêmes afin de trouver un seuild’écrêtement de nos sinistres.Nous décidons de ne pas écrêter les sinistres dommages automobiles et les sinistres dommages MRH car lesmontants de ces sinistres sont relativement faibles, l’ecrêtement ne représente donc pas un intérêt pour notremodélisation.

Construction du modèle

Afin de construire nos modèles, nous étudierons dans un premier temps les corrélations entre les variables denotre base de données. En effet, les modèles linéaires généralisés sont connus pour sous performer en présencede variables fortement corrélées. Nous étudierons donc ici la matrice de V Cramer et identifierons les variablestrop fortement dépendantes.

Dans un second temps, nous utiliserons l’algorithme stepwise afin de déterminer les variables à inclure dansnotre modèle.

Enfin, pour les modélisations de prime pure nous optimiserons le paramètre de la loi Tweedie en fonction dela déviance de notre modèle linéaire généralisée.

Evaluation de la performance des modèles

Afin d’évaluer la performance de nos modèles de sinistralités nous utiliserons trois métriques. Tout d’abordl’indice de Gini mesurant la dispersion entre nos prédictions. Plus l’indice de Gini est élevé plus nous arrivonsà segmenter notre population. L’indice est défini comme suit :

G =2∑ni=1 iyi

n∑ni=1 yi

− n+ 1

n

où yi sont les prédictions de notre modèle et n le nombre de prédictions.

Ensuite nous utiliserons une métrique comparant les valeurs prédites et les valeurs observées. Nous utiliseronsle RMSLE (Root Mean Squared Logarithmic Error) défini comme suit :

RMSLE =

√√√√ 1

n

n∑i=1

(log(yi + 1)− log(yi + 1))2

Le RMSLE pénalise les sous-estimations plus que les sur-estimations. Cette caractéristique est intéressante pournotre étude car nous préférons sur-estimer les prédictions de primes pures plutôt que les sous-estimer.

39

Page 41: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Enfin, nous utiliserons de manière classique la déviance donnée par le modèle.

Nous essayons de minimiser ces quantités.

4.1.3.1.2 Modélisation des sinistres automobile

Etude des corrélations pour les modèles automobiles

Nous présentons ci-dessous le V de Cramer pour les variables retenues dans les deux modèles automobiles.Nous ne représentons pas l’ensemble des variables testées par souci de lisibilité. Notre seuil de tolérance pournotre modélisation a été de 0,6 pour le V de Cramer.

Age

Ancienneté client

Ancienneté veh

Autre conducteur

Classe SRA

Energie

Formule

Groupe SRA

Kilométrage

Nb contrat auto

Nombre enf

Puissance fisc

Sinistre anterieur

Situation client

Type garage

Usage veh

Veh neuf

Vitesse max

Zone vol

Zonier marque

Age

Anc

ienn

eté

clie

nt

Anc

ienn

eté

veh

Aut

re c

ondu

cteu

r

Cla

sse

SR

A

Ene

rgie

For

mul

e

Gro

upe

SR

A

Kilo

mét

rage

Nb

cont

rat a

uto

Nom

bre

enf

Pui

ssan

ce fi

sc

Sin

istr

e an

terie

ur

Situ

atio

n cl

ient

Type

gar

age

Usa

ge v

eh

Veh

neu

f

Vite

sse

max

Zon

e vo

l

Zon

ier

mar

que

0.25

0.50

0.75

1.00value

V de cramer entre les variables

Figure 4.8 – Modèle auto : Heat map V de Cramer

Les variables explicatives ci-dessus ne présentent aucune structure de dépendance particulière. Toutes ces va-riables peuvent de plus constituer un facteur déterminant du risque. Nous pouvons tout de même faire quelquesremarques sur les dépendances les plus fortes observées sur notre base finale.Tout d’abord, nous pouvons noter une forte dépendance entre la formule et l’ancienneté du véhicule. Cette dé-pendance s’explique par le fait qu’un véhicule ancien sera généralement assuré avec un contrat aux tiers plutôtque tous risques. Notons que la dépendance entre ces deux variables n’est pas assez élevée pour être écartée dumodèle, elle est de 0,4.Une deuxième dépendance est élevée c’est celle entre la situation du client (avec pour modalité Seul ouEn couple) avec la variable autre conducteur qui désigne si oui ou non il y a un autre conducteur rattachéau contrat. Cette dépendance peut être expliquée par le fait qu’une personne en couple aura tendance a ratta-ché son conjoint ou ses enfants à son contrat. Néanmoins, dans la catégorie Seul de la variable situation clientnous avons des veufs et des personnes divorcés.

Modélisation des sinistres dommages

Nous nous intéressons dans un premier temps à nos données à modéliser. Nous représentons ci-dessous ladensité des primes pures observées. Nos observations semblent graphiquement suivre une loi Tweedie, nous avonsune masse en zéro puis des montants positifs. Nous pouvons observer que la densité est écrasée par la masse dezéro (indiquant un µ proche de 0) et que la densité est compressée à gauche, au vu de cette observation nousnous attendons à ce que le paramètre p de la loi Tweedie soit proche de 2 (cf. annexe 5.2).

40

Page 42: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

0e+00

2e+05

4e+05

6e+05

0 10000 20000 30000PP

coun

t

Densité de la prime pure

Figure 4.9 – Modèle auto : Densité de la prime pure

Après avoir écarté les variables les plus dépendantes entre-elles grâce au V de Cramer, nous utilisons toutd’abord l’algorithme stepwise nous permettant de sélectionner les variables les plus déterminantes. L’algorithmesetpwise a pour avantage de nous donner une méthode de sélection de variables automatique basée sur un critèrestatistique, le critère d’Akaike. Nous nous aidons également des deux métriques vues précédemment le RMSLEet de la déviance pour sélectionner nos variables.

Lors de la construction du modèle linéaire généralisé par une loi de tweedie, nous devons spécifier le para-mètre p de la loi de Tweedie. Ce paramètre définit la forme de la loi. Nous avons pour :

— p = 0 une loi Normale— p = 1 une loi Poisson— 1 < p < 2 un mélange d’une loi Poisson et Gamma— p = 2 une loi Gamma— p = 3 une loi inverse Gaussienne

Dans notre cas, nous cherchons un p compris entre 1 et 2. Notre p optimal sera celui qui minimise la déviancedu modèle linéaire généralisé. Nous relançons donc notre modèle pour différentes valeurs de p. Nous pouvonsdéterminer avec le graphique ci-dessous que la valeur optimale est de 1,7.

0e+00

3e+08

6e+08

9e+08

1.0 1.2 1.4 1.6 1.8Tweedie power

Dev

ianc

e

Optimisation du degré Tweedie

Figure 4.10 – Modèle de prime pure dommage auto : Optimisation du degré de la Tweedie

Les résultats de notre modèle sont présentés ci-dessous, nous représentons ici l’exponentielle des coefficientsdu modèle linéaire généralisé pour quatre variables explicatives. Par souci de lisibilité nous ne représenteronspas l’ensemble des variables.

41

Page 43: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

100 %

80 %

64 %

58 %60 %

67 %

0.6

0.7

0.8

0.9

1.0

0−]1

8,25

]

1−]2

5,30

]

2−]3

0,40

]

3−]4

0,45

]

4−]4

5,60

]

5−]6

0,In

f[

Mod

Coe

f

Coefficients GLM pour la variable âge

100 %

68 %

116 %

257 %

285 %

170 %

1.0

1.5

2.0

2.5

3B 3S 3V 5M 5P 5R

Mod

Coe

f

Coefficients GLM pour la variable formule

100 %

106 %

116 %

130 %

1.0

1.1

1.2

1.3

A_B

C_O NR

P_T

Mod

Coe

f

Coefficients GLM pour la variable zone vol

100 %101 %

110 %

112 %

1.000

1.025

1.050

1.075

1.100

0−[0

,5]

1−]5

,8]

2−]8

,10]

3−]1

0,In

f[

Mod

Coe

f

Coefficients GLM pour la variable puissance fiscal

Figure 4.11 – Modèle automobile : Coefficients GLM des variables

Nous pouvons à partir de ces graphiques conclure que la prime pure est :— décroissante avec l’âge puis croissante à partir de 45 ans. Ainsi une personne de 30 ans aura une prime

pure 0.8 fois moins élevée en moyenne qu’une personne de 18 ans.— croissante avec la puissance fiscale— 2.8 plus élevée pour une personne ayant une formule 5P (tous risques) qu’une personne possédant une

formule 3B (tiers)— croissante avec la zone de vol— croissante avec la puissance fiscale

Afin de déterminer la fiabilité de notre modèle nous utilisons quatre indicateurs. D’une part les résidusobservés pour notre modèle et l’indice de Gini mesurant la dispersion entre nos prédictions que nous représentonsici via la courbe de Lorenz. La courbe de Lorenz et l’indice de Gini ont été utilisés à l’origine pour mesurerla dispersion de la richesse dans une population donnée qui peut être plus ou moins inégalitaire. La courbe deLorenz associe à la part x des détenteurs d’une part d’une grandeur, la part y de la grandeur détenue. Dansun contexte de tarification, la grandeur y est la part de prime détenue. Dans un tel contexte, nous souhaitonsqu’une faible part de la population possède la plus grande partie de la prime.

Figure 4.12 – Modélisation : Résidus

0.00

0.25

0.50

0.75

1.00

0.00 0.25 0.50 0.75 1.00Cumulative share of X

Cum

ulat

ive

shar

e of

Y

Courbe de Lorenz

Figure 4.13 – Modélisation : Courbe de Lorenz

Les résidus de notre modélisation sont centrés en 0 et ne présentent pas de tendance particulière. Nous

42

Page 44: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

pouvons donc conclure que notre modélisation Tweedie est adaptée.De plus, nous obtenons un indice de Gini de 0,38 ce qui est viable au vu de l’indice de Gini de la population dedépart (0,6).

Nous montrons dans le tableau suivant la déviance et RMSLE de nos prédictions comparés à la prédictionnaïve c’est à dire la moyenne de la prime pure observée.

Métrique Modèle Modèle naïfDéviance 37 106 39 106

RMSLE 4 4,5

Figure 4.14 – Modèle automobile dommage : Performance

Notre modèle sur-performance le modèle naïf, les résultats sont assez proches étant donnée la nature denotre variable à modéliser qui a une grande variabilité.

Modélisation des sinistres RC

Comme nous l’avons dit précédemment nous modélisons les sinistres automobile responsabilité civile parune loi de fréquence et un forfait pour les coûts. Nous détaillons ici la modélisation de la fréquence des sinistresresponsabilité civile automobile. Cette modélisation sera effectuée via une loi de Poisson.

Nous allons passer pour la modélisation de la fréquence par les mêmes étapes que pour la modélisation dessinistres automobiles dommages.Tout d’abord nous allons écrêter les sinistres. Nous représentons ci-dessous la mean excess function pour lessinistres RC.

0e+00 1e+06 2e+06 3e+06 4e+06 5e+06 6e+06

050

0000

1000

000

1500

000

2000

000

Mean excess function des sinistres RC automobile

Threshold

Mea

n E

xces

s

Figure 4.15 – Sinistres RC automobile :Mean excess function

0 500000 1000000 1500000

050

0000

1000

000

1500

000

2000

000

Mean excess function des sinistres RC automobile

Threshold

Mea

n E

xces

s

Figure 4.16 – Mean excessfunction zoom

Nous pouvons déterminer grâce à ces graphiques un seuil d’écrêtement à 200 000 euros. Avec ce seuil, nousécrêtons 0,5% des sinistres. Ce seuil est cohérent avec le seuil utilisé historiquement par l’équipe d’Eurofil quiest également de 200 000 euros.

Après avoir effectué l’écrêtement des sinistres, nous utilisons l’algorithme stepwise afin de déterminer lesvariables à retenir dans notre modélisation. Nous représentons ci-dessous l’exponentielle des coefficients de notremodèle linéaire de Poisson :

43

Page 45: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

100 %

90 %

77 %

67 % 68 %

63 %

0.7

0.8

0.9

1.0

0−]1

8,25

]

1−]2

5,30

]

2−]3

0,40

]

3−]4

0,45

]

4−]4

5,60

]

5−]6

0,In

f[

Mod

Coe

f

Coefficients GLM pour la variable âge

100 %

107 %

114 %

119 %

125 %

1.0

1.1

1.2

0−[0

,2]

1−]2

,5]

2−]5

,8]

3−]8

,15]

4−]1

5,In

f[

Mod

Coe

f

Coefficients GLM pour la variable ancienneté du véhicule

100 %

114 %

122 %

135 %

1.0

1.1

1.2

1.3

1−[0

,10]

2−]1

0,15

]

3−]1

5,20

]

4−]2

0,In

f[

Mod

Coe

f

Coefficients GLM pour la variable kilométrage

100 %

78 %0.80

0.85

0.90

0.95

1.00

0−0

1−]0

,Inf[

Mod

Coe

f

Coefficients GLM pour la variable sinistre antérieur

Figure 4.17 – Modèle automobile : Coefficients GLM des variables

Nous pouvons à partir de ces graphiques conclure que la fréquence de sinistres est :— décroissante avec l’âge— croissante avec le kilométrage— croissante avec le nombre de sinistres antérieurs à la signature du contrat— croissante avec l’ancienneté du véhicule

Enfin, nous avons pu déterminer sur notre base que le coût moyen d’un sinistre RC automobile est de 10400 euros.

Nous montrons dans le tableau suivant la déviance et RMSLE de nos prédictions comparés à la prédictionnaïve c’est à dire la moyenne de la prime pure observée.

Métrique Modèle Modèle naïfDéviance 51 000 52 000RMSLE 3 3,5

Figure 4.18 – Modèle automobile RC : Performance

Notre modèle sur-performance le modèle naïf, les résultats sont assez proches étant donnée la nature denotre variable à modéliser qui a une grande variabilité. De plus, nous ne modélisons pas le coût des sinistres, lavariabilité de nos prédictions est donc plus faible.

4.1.3.1.3 Modélisation des sinistres MRH

Comme nous l’avons mentionné précédemment nous séparons les sinistres multirisques habitation en deuxgroupes, les sinistres incendies et les sinistres hors incendies.Avant d’effectuer ces deux modèles, nous étudions les dépendances entre les variables explicatives de notre basede données. Nous représentons ci-dessous la dépendance entre les variables explicatives de notre modèle. Commepour les sinistres automobiles, nous ne représentons pas par souci de lisibilité toutes les variables de notre basede données. De plus, nous utilisons le même seuil de dépendance afin d’éliminer nos variables c’est à dire 0,6.

44

Page 46: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Année d'occupation

Date constr

Formule

Habitation

Insert

Nb de contrat auto

Nb personnes

Nb pieces

Nb sinistre antérieur

Niveau de vie

Origine

Protection

Qualite

Usage

Zone vol

Ann

ée d

'occ

upat

ion

Dat

e co

nstr

For

mul

e

Hab

itatio

n

Inse

rt

Nb

de c

ontr

at a

uto

Nb

pers

onne

s

Nb

piec

es

Nb

sini

stre

ant

érie

ur

Niv

eau

de v

ie

Orig

ine

Pro

tect

ion

Qua

lite

Usa

ge

Zon

e vo

l

0.25

0.50

0.75

1.00value

V de cramer entre les variables

Figure 4.19 – Modèle MRH : Heat map V de Cramer

Nous pouvons noter un certain nombre de points sur les dépendances ci-dessus. Tout d’abord nous obser-vons une dépendance forte entre le nombre de pièces et le type d’habitation qui peut s’expliquer simplement enobservant que généralement les maisons sont plus grandes que les appartements.Nous observons le même phénomène entre la qualité de l’assurée et le type d’habitation. En effet, dans notrebase de données nous avons plus de personnes propriétaires de maison que de personnes propriétaires d’appar-tement.Ces deux dépendances ne sont tout de même pas assez élevées pour que nous puissions écarter une des variablesde notre modélisation.

Modélisation des sinistres hors incendies

Nous nous intéressons dans un premier temps à nos données à modéliser. Nous représentons ci-dessous ladensité des primes pures observées. Nos observations semblent graphiquement suivre une loi Tweedie, nous avonsune masse en zéro puis des montants positifs. Nous pouvons observer que la densité est écrasée par la massede zéro (indiquant un µ proche de zéro) et que la densité est écrasée à gauche, au vu de cette observation nousnous attendons à ce que le paramètre p de la loi Tweedie soit proche de 2 (cf. annexe 5.2).

0e+00

1e+05

2e+05

3e+05

0 5000 10000 15000 20000PP

coun

t

Densité de la prime pure

Figure 4.20 – Modèle MRH : Densité de la prime pure

45

Page 47: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

La modélisation des sinistres multirisque habitation hors incendies a été effectuée via une loi de Tweedie. Laprocédure de modélisation est la même que pour les sinistres automobiles dommages.Pour rappel, nous nous aidons de l’algorithme stepwise, des métriques vues précédemment (RMSLE et déviance)ainsi que de la significativité de nos variables dans nos modèles afin de sélectionner nos variables. Puis nousdéterminons le paramètre p optimal de la loi de Tweedie. Le graphique ci-dessous nous montre l’évolution dela déviance du modèle linéaire généralisé en fonction du paramètre de la loi de Tweedie. Nous pouvons estimerque le paramètre optimal est de 1,7.

1e+08

2e+08

3e+08

1.0 1.2 1.4 1.6 1.8Tweedie power

Dev

ianc

e

Optimisation du degré Tweedie

Figure 4.21 – Modélisation MRH : Optimisation du degré de la Tweedie

Nous représentons ci-dessous les résultats obtenus pour notre modèle de prime pure dommage MRH pourles principales variables explicatives :

100 %

90 %

86 %

79 %82 %

0.80

0.85

0.90

0.95

1.00

0−[0

,5]

1−]5

,10]

2−[1

0,15

]

3−]1

5,In

f[

99−

NR

Mod

Coe

f

Coefficients GLM pour la variable année d'occupation

100 %

314 %

145 %

167 %

198 %

241 %

1.0

1.5

2.0

2.5

3.0

1 2 3 4 5 +5

Mod

Coe

f

Coefficients GLM pour la variable nombre de pièces

100 %

120 %

106 %

123 %

1.00

1.05

1.10

1.15

1.20

Faib

le

Moy

en

Ele

ve

NR

Mod

Coe

f

Coefficients GLM pour la variable niveau de vie

100 %90 %

139 %

159 %

215 %

282 %

1.0

1.5

2.0

2.5

1 2 3 4 5 6

Mod

Coe

f

Coefficients GLM pour la variable zone vol

Figure 4.22 – Modèle MRH : Coefficients GLM des variables

Nous pouvons à partir de ces graphiques conclure que la prime pure dommage MRH est :— décroissante avec le nombre d’années d’occupation— croissante avec le niveau de vie— croissante avec le nombre de pièces

46

Page 48: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

— croissante avec la zone de vol

Afin de valider notre modélisation, nous représentons ci-dessous la courbe de Lorenz ainsi que les résidus dedéviance de notre modèle.

Figure 4.23 – Modélisation : Résidus

0.00

0.25

0.50

0.75

1.00

0.00 0.25 0.50 0.75 1.00Cumulative share of X

Cum

ulat

ive

shar

e of

Y

Courbe de Lorenz

Figure 4.24 – Modélisation : Courbe de Lorenz

Les résidus de notre modélisation sont centrés en 0 et ne présentent pas de tendance particulière. Nouspouvons donc conclure que notre modélisation Tweedie est adaptée.De plus, nous obtenons un indice de Gini de 0,32 ce qui est viable au vu de l’indice de Gini de la population dedépart.

Nous montrons dans le tableau suivant la déviance et RMSLE de nos prédictions comparé à la prédictionnaïve c’est à dire la moyenne de la prime pure observée.

Métrique Modèle Modèle naïfDéviance 16 106 17 106

RMSLE 3,6 4

Figure 4.25 – Modèle MRH hors incendie : Performance

Notre modèle surperforme le modèle naïf, les résultats sont assez proches étant donnée la nature de notrevariable à modéliser qui a une grande variabilité.

Modélisation des sinistres incendies

Comme mentionné précédemment, la modélisation des sinistres incendies sera effectuée via une loi de Poissonpour la fréquence et un forfait pour les coûts.Avant d’effectuer notre modélisation nous déterminons tout d’abord un seuil d’écrêtement des sinistres.

0 500000 1000000 1500000

0e+

001e

+05

2e+

053e

+05

4e+

055e

+05

Mean excess function des sinistres incendies MRH

Threshold

Mea

n E

xces

s

Figure 4.26 – Sinistres incendies MRH :Mean excess function

0e+00 2e+04 4e+04 6e+04 8e+04 1e+05

0e+

002e

+04

4e+

046e

+04

8e+

041e

+05

Mean excess function des sinistres incendies MRH

Threshold

Mea

n E

xces

s

Figure 4.27 – Mean excessfunction zoom

La mean excess function ci dessus nous indique que le seuil d’écrêtement optimale est de 10 000 euros. Avec

47

Page 49: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

ce seuil nous écrêtons 2% des sinistres.

De la même manière que pour les modèles automobile, nous utilisons l’algorithme stepwise et les métriquesvues précédemment afin de déterminer les variables à inclure dans notre modélisation. Nous représentons ci-dessous les résultats obtenus pour notre modèle de fréquence incendie :

100 %

94 %

93 %

0.94

0.96

0.98

1.00

]Inf,1

975]

]197

5,20

05]

]200

5,In

f[Mod

Coe

fCoefficients GLM pour la variable année de construction

100 %

130 %

1.0

1.1

1.2

1.3

AP

PAR

TE

ME

NT

MA

ISO

N

Mod

Coe

f

Coefficients GLM pour la variable habitation

100 %

79 %

94 %

133 %

153 %

0.8

1.0

1.2

1.4

0−0

1−1

2−2

3−3

4−4+

Mod

Coe

f

Coefficients GLM pour la variable nombre d'enfants

100 %

288 %

140 %

207 %

233 %

252 %

1.0

1.5

2.0

2.5

1 2 3 4 5 +5

Mod

Coe

f

Coefficients GLM pour la variable nombre de pièces

Figure 4.28 – Modèle MRH : Coefficients GLM des variables

Nous pouvons à partir de ces graphiques conclure que la fréquence des sinistres incendies est :— décroissante avec l’ancienneté du bâtiment— croissante avec le nombre d’enfants— croissante avec le nombre de pièces— 1,3 fois plus élevée pour une maison que pour un appartement

Enfin, nous avons pu déterminer sur notre base que le coût moyen d’un incendie est de 5 000 euros.

Nous montrons dans le tableau suivant la déviance et RMSLE de nos prédictions comparé à la prédictionnaïve c’est à dire la moyenne de la prime pure observée.

Métrique Modèle Modèle naïfDéviance 52 146 54 510RMSLE 3,2 3,5

Figure 4.29 – Modèle MRH incendie : Performance

Notre modèle surperforme le modèle naïf, les résultats sont assez proches étant donnée la nature de notrevariable à modéliser qui a une grande variabilité. De plus, nous ne modélisons pas le coût des sinistres la varia-bilité de nos prédictions est donc plus faible.

4.1.3.1.4 Modélisation des sinistres PFA

Les sinistres Protection Famille Accident (PFA) n’ont pas été modélisés pour notre étude. Nous prenons encompte cette sinistralité en calculant la prime pure comme la fréquence observée sur le portefeuille sur 10 anset le coût moyen observé sur 10 ans.

48

Page 50: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Le calcul du coût moyen est effectué après mise en "as if" des sinistres, nous actualisons les sinistres PFA avecle taux d’inflation donné par l’INSEE, les taux d’inflation étant assez faible sur ces dix dernières années, cetteremise à niveau est négligeable.

4.1.3.2 Modélisation des primes et frais

Nous décidons de ne pas construire de modèle pour les primes et les frais mais de simplement prendrepour hypothèse que les primes et les frais dans le temps sont constants au cours du temps. Ce choix n’estpas la solution optimale proposée par Greg Firestone et Mohamad Hindawi [HF12], ce choix est effectué pourplusieurs raisons. Tout d’abord l’évolution des primes n’est pas aléatoire dans le temps, elle est décidée parl’équipe d’Eurofil lors de la mise en place des majorations. De plus, l’évolution de ces primes sur trois ans estmarginale sur une période de temps aussi courte.Pour les frais, nous considérons que la répartition des frais sur la prime sera la même qu’en 2015.

4.1.3.3 Critique sur le modèle actuariel de marge

Nous pouvons formuler quelques critiques au modèle de marge actuariel. Tout d’abord, les modélisations desinistralité que nous avons effectuées mériteraient d’y consacrer une étude à part entière et de modéliser chaquegarantie de manière séparée. Les choix de modélisation effectués précédemment ont été faits vis à vis du tempsimparti pour réaliser l’étude sur la valeur client.

Une seconde critique que nous pouvons formuler est sur l’hypothèse de non accroissement des primes etdes frais au cours du temps. Cette hypothèse est viable sur notre horizon de temps (3 ans) car les primes etles frais d’un client ne changent pas radicalement sur cette période. Elle mériterait tout de même d’y porterune attention particulière notamment pour les jeunes conducteurs par exemple qui ont un risque fortementdécroissant les premières années.

Enfin, dans notre étude nous n’avons pas pu utiliser les modèles de tarification effectués par l’équipe d’Eurofil,notre modèle de marge actuariel se positionne donc ici en concurrence des modèles de tarification. Cette opposi-tion peut être bénéfique car elle permet de comparer nos résultats avec les futurs résultats de l’équipe d’Eurofilen matière de tarification. Il permet également d’avoir un autre angle d’attaque vis à vis de la tarification.

49

Page 51: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

4.1.4 Comparaison des modèlesAfin de comparer les deux modèles de marge, nous avons écarté, en amont de notre modélisation, dans une

base test un échantillon de clients. Nous calculons alors la marge observée et prédite à chaque pas de tempspour chaque client pour les années 2013, 2014 et 2015. Ce calcul nous permettra de comparer à chaque pas detemps les performances des modèles de marge économétrique et de marge actuarielle.

Afin de comparer les deux modèles, nous utilisons le RMSE (Root Mean Squared Error). Le RMSE est définicomme suit :

RMSE =

√√√√ 1

n

n∑i=1

(yi − yi)2

Exercice Modèle actuariel Modèle économétrique Modèle naïf2013 934 949 9502014 674 699 7052015 1361 1373 1376

Figure 4.30 – Comparaison des modèles de marges via le RMSE

L’écart moyen des erreurs est plus faible pour le modèle actuariel pour chacune des années. Le modèle naïfest construit en prenant la marge moyenne observée sur les trois années (2013, 2014, 2015).

Une seconde métrique peut être utilisée afin de comparer nos deux modèles, le pourcentage moyen d’erreursabsolu (Mean absolute percentage error : MAPE) qui est défini comme suit :

MAPE =1

n

n∑t=1

∣∣∣∣yt − ytyt

∣∣∣∣La MAPE est une métrique plus facilement interprétable que le RMSE, elle nous donne un pourcentage

moyen d’erreurs. Pour nos modèles, ce pourcentage moyen est assez élevé, cela est dû aux fluctuations im-portantes de notre variable à prédire, la marge, qui peut être largement négative. De plus, nos modèles sontconstruits afin d’être en moyenne sur la population totale exacte, nous tentons de nous approcher d’un modèleindividuel en segmentant au maximum notre population d’origine. Malgré cela, nos modèles ne peuvent qu’ap-proximer la marge individuelle en tenant compte d’un sinistre moyen sur la population. Il est donc cohérent detrouver des erreurs moyennes sur nos modèles assez élevées.

Exercice Modèle actuariel Modèle économétrique Modèle naïf2013 0.53 0.62 0.862014 0.51 0.60 0.822015 0.47 0.58 0.73

Figure 4.31 – Comparaison des modèles de marges via le MAPE

Une troisième métrique peut être utilisée afin de comparer nos deux modèles, l’indice de gini.

Performance Modèle actuariel Modèle économétriqueIndice de gini 40% 15%

Figure 4.32 – Comparaison des modèles de marges via l’indice de Gini

Le modèle actuariel a un indice de Gini bien plus élevé que le modèle économétrique, ce qui signifie que lemodèle actuariel segmente la population plus efficacement que le modèle économétrique. Dit autrement, le mo-dèle économétrique est plus centré sur la marge moyenne que le modèle actuariel. Là encore, le modèle actuarielsera préféré au modèle économétrique.

Une méthode afin d’améliorer la performance de ces modèles serait de les mélanger via une méthode deblending. Cette méthode consiste simplement à mélanger les deux modèles entre eux. Pour ce faire, nouspondérons les prédictions de chacun des modèles pour obtenir une nouvelle prédiction :

50

Page 52: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Margeblend = p1 ×Margeactuarielle + p2 ×Margeeconometrique

Avec p1 + p2 = 1

Généralement, pour trouver ces pondérations, il est d’usage d’utiliser un meta model, par exemple un modèlelinéaire généralisé, pour trouver les pondérations optimales. La mise en place de ce meta model est surtout utilelorsque le modélisateur a x modèles à assembler. Dans notre cas, nous n’avons que deux modèles, nous pouvonsdonc via une boucle tester l’ensemble des pondérations possibles (avec un pas de 0,01 par exemple) et regarderquelle pondération nous donne les meilleurs résultats sur notre base test. Pour évaluer la performance nousutilisons les deux métriques vues précédemment le RMSE et le MAPE.

Notons que le blending de modèle est très utile lorsque les modèles sont peu corrélés entre eux et ont desperformances relativement proches. En effet, cela indique que lorsque un des modèles donne une prédictionéloignée de la réalité l’autre en donne une plus proche. En mixant les modèles nous devons donc surperformerles deux modèles.

Sur nos données, la corrélation entre les modèles de marge est de 0.5, néanmoins le modèle de margeéconométrique semble moins performant que l’actuariel. Le RMSE sur les 3 années pour le modèle de margeéconométrique est de 1039, le modèle actuariel 1031 et le modèle naïf 1041. Nous montrons ci-dessous lesperformances du modèle mixé selon p1.

1030.0

1032.5

1035.0

1037.5

1040.0

0.00 0.25 0.50 0.75 1.00p1

RM

SE

Evolution du RMSE en fonction de p1

Figure 4.33 – Blending des modèles de marges

Nous arrivons à un RMSE de 1028 avec une pondération de p1 à 0.87. Cette pondération améliore nos per-formances et est relativement logique car le modèle actuariel est plus performant que le modèle économétrique,nous devons donc lui accorder un poids plus important.

Notons tout de même que cette approche complexifie nettement le calcul de la marge de façon opérationnelle.

51

Page 53: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

4.1.5 Création de l’output pour la valeur clientL’objectif de notre modélisation était de calculer la marge d’un client à chaque pas de temps. Nous avons

pu voir dans la section précédente que le modèle actuariel offrait de meilleurs résultats.

Pour construire notre marge client à partir du modèle actuariel nous procédons comme suit. Tout d’abord,nous utilisons nos modèle de sinistralité afin de calculer le risque attendu pour chaque contrat. Afin d’introduireun effet temps dans notre modélisation des sinistres nous faisons avancer à chaque pas de temps les variablesdu modèle dont nous connaissons la valeur (l’âge, l’ancienneté du véhicule...).Nous agrégeons ensuite les risques calculés au niveau du client. Nous obtenons ainsi la partie Sinistre de notreéquation de Marge.

Pour les parties Primes et Frais, nous utilisons les primes et les frais observés aujourd’hui pour les troisprochaines années. De la même façon nous agrégeons ces informations à la maille client.

Notre output pour le calcul de la valeur client est donc une matrice donnant pour chaque client en portefeuillesa marge à chaque pas de temps.

52

Page 54: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

4.2 Modélisation de la durée de vie clientRappel sur l’objectif du modèle :

L’objectif de cette section est de calculer la probabilité de sortie d’un client à chaque pas de tempssachant ses caractéristiques.

Rappelons la définition de la valeur client future :

CLVi =

T∑t=1

E[(Primei,t − Sinistrei,t − Fraisi,t)](1 + d)t

× pi,t

En rouge, la partie de la valeur client que nous allons modéliser.

Nous modéliserons cette probabilité via des modèles de durée de vie. Nous testerons deux modèles, un modèleà hasard proportionnel puis un modèle à vie accéléré. Les deux modèles cités ont la particularité de prendre encompte les caractéristiques du client afin de calculer leur probabilité de survie. Généralement, la difficulté d’uti-lisation de ces modèles est la quantité de données à la disposition du modélisateur. En effet, pour les modèlesestimant à chaque pas de temps selon les caractéristiques du client une probabilité de survie, une quantité faiblede données peut conduire à un modèle peu robuste. Dans notre cas, nous avons accès à l’historique complet desclients Eurofil, ce qui représente un périmètre maximal d’étude de 20 ans. Néanmoins nous essaierons de limiterle nombre de variables introduites dans notre modèle en ne considérant que les variables qui améliorent de façonsignificative les performances de nos modélisations. De plus, nous n’utiliserons pas l’historique complet maisseulement les 10 dernières années, nous considérons qu’au delà de 10 ans la clientèle d’Eurofil n’avait pas lesmêmes comportements. Rappelons que 10 ans correspond à la date d’entré d’Eurofil sur les sites comparateurs.Afin de choisir l’un ou l’autre des modèles, nous comparerons leurs performances sur une base de données testde client.

Rappel sur les modèles de durée de vie

Nous rappelons que la durée de vie désigne le temps écoulé jusqu’à la survenance d’un évènement, ici lasortie du portefeuille du client. Nous posons :

La fonction de survie :

S(t) = P (T > t) = 1−∫ t

0

f(t) dt

La fonction de hasard :λ(t) =

f(t)

S(t)= −ln(S(t))′

Nous rappelons également brièvement le phénomène de censure. On parle de censure si :

— avant la fin de l’étude, on observe plus l’individu sans qu’il y ait eu de défaillance— à la fin de l’étude, la défaillance n’a toujours pas été observée

Si la défaillance est observée on qualifie les observations comme complètes. En prenant en compte ces aspectsnotre variable Y à modéliser devient :

Yi = min(Ti, Ci)

où Ci désigne la durée observée et Ti la durée passée dans l’état considéré.

Ainsi si le client i est toujours en portefeuille à la date de notre étude, il sera qualifié de censuré car sontemps de sortie du portefeuille est inconnu.Ce phénomène justifie l’utilisation des modèles de durée de vie plutôt qu’un modèle logistique afin de modéliserla probabilité de sortie d’un client du portefeuille.

53

Page 55: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

4.2.1 Modèle à hasard proportionnel4.2.1.1 Présentation du modèle

Le modèle de Cox a été développé par David Cox en 1972. Nous définissons le modèle de Cox à risqueproportionnel de la façon suivante [SAI15] :

λ(t|Zi(t)) = λ0exp(Ziβ)

Avec :λ0 : Le risque de base, une fonction non spécifiéeZi : Le vecteur des covariables pour chaque individuβ : Les mesures d’influence des covariables

Le principe du modèle de Cox est d’estimer le coefficient β en considérant la fonction λ0 comme un paramètrede nuissance. On ne cherche donc pas à estimer λ0.L’estimation du paramètre β est effectuée par une pseudo maximisation de vraisemblance qui est maximiséepar :

L(β) =∏

Yi,δi=1

(exp(βZi)∑

Yj>Yiexp(βZi)

)L’exponentielle du coefficient β représente le ratio de hasard entre deux individus dont leur valeur diffère de

une unité pour une variable en particulier toute chose égale par ailleurs. Autrement dit, un coefficient β positifsignifie qu’un individu i a exp(β) plus de chance de sortir du portefeuille que l’individu de référence toute choseégale par ailleurs.

Choix des variables

Notre étude sur la durée en portefeuille est faite à la maille client. Une autre étude aurait pu être envisagée,celle de la durée d’un contrat. En effectuant ce modèle nous aurions pu utiliser les variables du contrat, commepar exemple le type d’habitation (pour un contrat multirisque habitation) ou le type de véhicule (pour uncontrat automobile). Ces probabilités calculées auraient pu être affectées à chaque contrat puis nous aurionscomme pour le calcul de la marge pu aggréger les résultats à la maille client. Cependant cette étude n’a pas étéprivilégiée, car elle complexifiait notre étude en multipliant les modèles à mettre en place.

Pour ce modèle de Cox, différentes variables ont été testées, nous avons gardé les variables qui d’une partétaient significatives et d’autre part celles qui permettaient une amélioration significative du modèle (cf. 4.2.3).

Nous avons testé entre autre les variables suivantes :— Le nombre d’enfants— Le lieu de vie (urbain/rural)— La situation du client (marié, célibataire)...

Nous avons gardé les variables suivantes :— L’âge : L’âge de l’assuré à la date de début de contrat— Le type de contrat : Auto1 signifie par exemple que le client possède 1 seul contrat automobile, Auto/MRH

signifie que le client possède au moins un contrat automobile et au moins un contrat MRH— L’email : Indique que nous possédons ou ne possédons pas l’email du client— Full web : Indique que le client vient du full web ou non (cf. 3.1.2.1)

Ces variables ont été choisies en fonction du gain en concordance procuré. Nous donnons ici le gain enconcordance observé par l’introduction de chaque variable.

Variables Gain en concordanceContrat 16,00%Age 3,00%Full web 1,00%Email 1,00%

Figure 4.34 – Modèle de Cox : Gain en concordance de chaque variable

54

Page 56: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

La variable contrat est la variable qui permet le plus grand gain dans les performances de notre modèle. Lesvariables non intégrées dans notre modélisation procuraient un gain en concordance plus faible que ceux affichésici.

NB : Nous reviendrons plus en détail sur le calcul de la concordance dans la partie concernant la comparaisondes modèles.

Notre variable d’âge a été scindée en tranches en tenant compte de la représentativité de chaque classe d’âge.De plus, Eurofil ayant une politique stricte à la souscription, la compagnie n’a pas pour cible client les jeunesconducteurs. Il n’a donc pas été possible de scinder la classe des jeunes conducteurs de façon plus fine. Or cetteclasse d’âge est généralement traitée de façon particulière en assurance dommage car celle-ci présente un risquesignificativement plus élevé que les autres tranches d’âges.

Interprétation des coefficients

Nous présentons ci-dessous les résultats de notre modèle :

age contrat email full_web

100 %

85 %

73 %64 %

53 %

42 %

100 %

22 %

34 %39 %

70 %

46 %

100 %

194 %

100 %

42 %0.5

1.0

1.5

2.0

0−]1

8,25

]

1−]2

5,30

]

2−]3

0,35

]

3−]3

5,45

]

4−]4

5,60

]

5−]6

0,In

f]

Aut

o1

Aut

o/M

RH

/PFA

_Aut

o/P

FA

Aut

o/M

RH

_MR

H/P

FA

Aut

o2

MR

H

PFA

emai

l_y

emai

l_n

full_

web

_y

full_

web

_n

Mod

Coe

f

Figure 4.35 – Modèle de Cox : Exponentiel des coefficients β

Nous pouvons interpréter le graphique ci-dessus de la manière suivante :

— Plus la personne est âgée plus son risque instantané baisse toutes choses égales par ailleurs. Ainsi unepersonne de plus de 60 ans aura un risque instantané 0.42 fois moins élevé qu’une personne de moins de25 ans. Ce constat peut s’expliquer du fait de la volatilité décroissante du client en fonction de son âge.

— Plus le nombre de produits détenus par le client augmente plus son risque instantané baisse toute choseégale par ailleurs. Ainsi, une personne possédant les produits automobile, MRH et PFA aura un risqueinstantané 0.22 fois moins élevé qu’une personne ne possédant qu’un seul contrat automobile. Cet effetest attendu car représente la fidélité du client envers la compagnie.

— Une personne dont nous n’avons pas l’email a un risque instantané plus élevé qu’une personne dont nousavons l’email. Cette variable résume de façon concise l’information que nous possédons sur le client.Néanmoins, pour une revue future du modèle, cette variable devra être analysée de façon attentive carle taux de remplissage de cette variable augmente rapidement depuis ces dernières années.

— Une personne provenant du "full web" a un risque instantané plus élevé. Ceci peut être expliqué par lefait que les clients "full web" sont des clients plus sensibles aux prix et donc plus volatiles.

55

Page 57: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Notons également que les clients possédant un contrat automobile ont un risque instantané plus élevé queceux possédant un contrat PFA ou MRH.

4.2.1.2 Vérification des hypothèses

L’hypothèse du modèle à hasard proportionnel est que le risque relatif entre deux individus est constant aucours du temps. On a :

α(t|Zi)α(t|Zj)

=exp(Ziβ)

exp(Zjβ)= exp((Zi − Zj)β)

Nous pouvons vérifier cette hypothèse en traçant les courbes Log-Log Kaplan Meier. En abscisse nous traçonsle logarithme du temps (log(t)) et en ordonnée le logarithme du hasard cumulé (log(Λ)) où on a le hasard cumulédéfini comme suit :

Λ(t) =

∫ t

0

λ(u) du = −ln(S(t))

En traçant ces courbes nous devons obtenir, si l’hypothèse de hasard proportionnel est vérifiée, des courbesparallèles. Nous traçons ici cette courbe pour les groupes de contrats :

−3

−2

−1

0

1

0.0 0.5 1.0 1.5 2.0logtime

logl

ogsu

rv

groupe

Auto/MRH

Auto/MRH/PFA

Auto/PFA

Auto1

Auto2

MRH

MRH/PFA

PFA

Courbe Log−log Kaplan Meier : contrat

Figure 4.36 – Courbe Log log Kaplan Meier pour les contrats

Les courbes Log-log pour la variable contrat sont parallèles, l’hypothèse de hasard proportionnel est doncvérifiée pour cette variable. Nous ne représentons pas les autres courbes Log-log, le lecteur pourra les trouveren annexe de ce mémoire.

56

Page 58: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

4.2.2 Modèle de vie accéléréUne alternative au modèle de Cox peut être étudiée, le modèle de vie accéléré (Accelerated Failure Time

Model). En effet, contrairement au modèle de Cox qui prend pour hypothèse que l’effet des covariables multipliele hasard par une constante, le modèle de vie accéléré considère que l’effet des covariables accélère ou décélèrela durée de vie par une constante [SAI15].

On peut noter :

S(t|Z) = S0(tφ(Z))

On obtient la fonction de risque suivante :

λ(t|Z) = λ0(tφ(Z))φ(Z)

A l’inverse du modèle de Cox qui est un problème semi-paramétrique, le modèle de vie accéléré est complè-tement paramétrique. On peut montrer que le modèle à hasard proportionnel paramétrique et de vie accéléréde Weibull sont équivalents [Dug12].On peut donc passer des coefficients du modèle de vie accéléré aux coefficients de hasard proportionnel [KK96].

Si on pose :β : Les coefficients de régression à hasard proportionnelα Les coefficients de régression de vie accélérép : Le paramètre de la loi de Weibull

On a :βj = αjp

Dans notre cas, nous comparerons le modèle de vie accéléré de Weibull et celui de Cox. Nous avons donc :

S0(t) = exp(−λtα)

Choix des variables

Le choix des variables a été effectué de la même façon que pour le modèle de Cox(cf. 4.2.1.1).

Interprétation des coefficients

Nous représentons ci-dessous les coefficients obtenus après transformation des résultats du modèle de vieaccéléré en suivant la procédure ci-dessus.

57

Page 59: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

age contrat email full_web

100 %

80 %

65 %59 %

50 %

40 %

100 %

19 %

30 %36 %

66 %

39 %

100 %

186 %

100 %

38 %

0.5

1.0

1.5

0−]1

8,25

]

1−]2

5,30

]

2−]3

0,35

]

3−]3

5,45

]

4−]4

5,60

]

5−]6

0,In

f]

Aut

o1

Aut

o/M

RH

/PFA

_Aut

o/P

FA

Aut

o/M

RH

_MR

H/P

FA

Aut

o2

MR

H

PFA

emai

l_y

emai

l_n

full_

web

_y

full_

web

_n

Mod

Coe

f

Figure 4.37 – Modèle de vie accéléré : Exponentiel des coefficients β

Les coefficients de cette seconde modélisation sont très proches de ceux du modèle de Cox. Les probabilitésprédites sont donc elles aussi proches. L’interprétation des coefficients du graphique ci-dessus peut s’effectuerde la même manière que ceux du modèle de Cox, la transformation des coefficients effectuée ci-dessus nous lepermet :

— Un client dont nous n’avons pas l’email a un risque instantané 1.86 fois plus élevé toutes choses égalespar ailleurs.

— Un client ne venant pas du full web a un risque instantané 0.38 fois plus bas toutes choses égales parailleurs.

58

Page 60: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

4.2.3 Comparaison des modèlesAfin de comparer les modèles, nous utilisons la concordance qui se définit de la façon suivante [VS08] :

C(D,G,F ) =1

|ε|∑εij

1f(xi)<f(xj)

Avec :|ε| : Nombre de pairesf(xi) : La prédiction pour le sujet i par le modèle f

La concordance est la probabilité que pour une paire d’échantillons comparables, l’échantillon avec le risqueprédit le plus fort décède avant l’autre échantillon. En d’autre terme, c’est la concordance entre la prédiction etla survie observée.On obtient les résultats suivants :

Modèle ConcordanceVie accéléré 0,72Cox 0,71

Figure 4.38 – Modèle de durée : Concordance

Les résultats des deux modèles sont très proches mais nous obtenons de meilleurs résultats avec le modèlede vie accéléré.

Nous prenons ci-dessous deux exemples de profils et comparons les probabilités de survie :

0.00

0.25

0.50

0.75

1.00

0 5 10 15time

valu

e variableProfil1Profil2

Exemple de courbe de survie

Figure 4.39 – Exemple de courbe de survie pour deux profils

Les deux profils sont les suivants :

— Profil 1 : Client possédant les trois produits (MRH, automobile et PFA), avec un âge compris entre 18et 25 ans, ne venant pas du full web et dont nous avons l’email

— Profil 2 : Client possédant seulement un contrat automobile, avec un âge compris entre 18 et 25 ans, nevenant pas du full web et dont nous avons l’email

Nous pouvons remarquer que les deux probabilités de survie sont largement différentes entre ces deux profilsde clients. Posséder plusieurs produits a un fort impact sur la probabilité de rester en portefeuille.

59

Page 61: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

4.2.4 Création de l’output pour la valeur clientL’objectif de notre modélisation de durée de vie était de calculer pour chaque client en portefeuille une

probabilité de sortie de ce client à chaque pas de temps. Nous avons pu voir dans la section précédente que lemodèle à vie accéléré présentait les meilleurs résultats. C’est donc ce modèle qui sera utilisé pour le calcul de lavaleur client future.

Notre modèle nous donne en output de sortie la probabilité pour un client de rester en portefeuille P (X > x),or cette probabilité ne correspond pas tout à fait à l’output que nous attendons. En effet, le modèle nous donnepar exemple la probabilité de rester 2 ans d’un client P (X > 2) or cette probabilité est différente si le client esten portefeuille depuis 1 an ou 3 ans, nous devons donc calculer une probabilité conditionnelle. Plus exactementnous avons :

P (X > 3|X > 1) ≤ P (X > 5|X > 3)

Nous calculons cette probabilité en utilisant les résultats de notre modèle :

P (X > x+ t|X > x) =P (X > x+ t,X > x)

P (X > x)

=P (X > x+ t)

P (X > x)

Au final, nous obtenons en output une matrice nous donnant sur les lignes x et les colonnes t les probabilitésP (X > x+ t|X > x).

60

Page 62: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

4.3 Intégration du cross-selling

Rappel sur l’objectif du modèle :

Nous avons déterminé dans les deux sections précédentes la marge de notre client sur trois ans ainsi que saprobabilité de rester en portefeuille sur cette même période. Un dernier aspect reste à intégrer dans notremodélisation, le fait qu’un client puisse souscrire à un autre produit/contrat sur cet intervalle de temps.Cet apsect n’apparaît pas dans notre formule de base que nous avons définie au chapitre 2. Nous allonsdonc légérement modifier cette formule.

Dans cette section, nous intégrerons l’aspect cross-selling dans notre modèle de valeur client. Nous définis-sons le cross-selling comme le fait pour un client d’acheter un nouveau contrat.

L’intégration dans notre modèle de valeur client sera faite de la manière suivante :

CLVi =

T∑t=1

E[(Primei,t − Sinistrei,t − FGi,t)](1 + d)t

× pi,t +

J∑j=1

E[(Primei,j,t − Sinistrei,j,t − FGi,j,t)](1 + d)t

× pi,j,t × ci,j,t

La première partie de notre formule est la valeur client que nous avons calculée au chapitre 4. La seconde

partie est l’espérance de la valeur client pour les contrats possiblement souscrits par le client. On note :

ci,j,t : La probabilité pour un client i de souscrire le contrat j à la date t

Nous pouvons voir apparaître deux problématiques dans cette intégration. Tout d’abord, nous devons estimerla probabilité ci,j de souscrire un nouveau contrat. Ensuite, nous devons estimer le risque associé à ce contrat(Sinistrei,j).

4.3.1 Modélisation de la propension à acheterDans un premier temps, nous pouvons prendre comme hypothèse que la propension à acheter ne varie pas

au cours du temps. Nous modélisons donc ci,j , la probabilité pour un client i de souscrire le contrat j.

Nous donnons tout d’abord quelques éléments permettant d’accorder une crédibilité à l’intégration de l’aspectde vente croisée à notre étude.

12 % 12 %

13 % 13 % 14 %

17 %

19 %

22 %

24 %

26 %

28 %

30 %

32 %

35 % 35 %35 %

33 % 33 % 33 % 33 % 32 %

0.0

0.1

0.2

0.3

1995 2000 2005 2010 2015Exercice

Pou

rcen

tage

Pourcentage de clients ayant plus de un produit par exercice

Figure 4.40 – Evolution du pourcentage de clients multi-équipés

61

Page 63: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Sur le graphique ci-dessus nous donnons l’évolution du pourcentage de clients multi-équipés depuis 1995. En2015, 32% des clients possédaient plus de un produit. Les ventes croisées sont donc fréquentes au sein d’Eurofil.

60 %58 % 59 %

58 %56 %

58 %

61 %62 %

61 % 61 % 61 % 62 % 62 % 61 % 61 % 61 % 61 % 60 % 60 %62 %

65 %

0.0

0.2

0.4

0.6

1995 2000 2005 2010 2015Exercice

Pou

rcen

tage

Pourcentage de clients MRH ayant un produit automobile par exercice

Figure 4.41 – Pourcentagede clients MRH possédantun contrat automobile

12 % 12 %

14 % 13 % 14 %

17 %

20 %

23 %

25 %

27 %

29 %

31 %

34 %

37 %38 % 38 %

37 % 36 %36 %

35 %

34 %

0.0

0.1

0.2

0.3

0.4

1995 2000 2005 2010 2015Exercice

Pou

rcen

tage

Pourcentage de clients automobile ayant un produit MRH par exercice

Figure 4.42 – Pourcentagede clients automobile

possédant un contrat MRH

Nous détaillons sur les graphiques ci-dessus la nature de ces ventes croisées. Nous pouvons observer qu’en2015, 65% des clients possédant un contrat MRH étaient équipés d’un contrat automobile. De la même façon,34% des clients possédant un contrat automobile étaient équipés d’un contrat MRH.

Les constats que nous avons effectués ci-dessus ne nous permettent pas de déterminer la probabilité ci,j .Afin de déterminer cette probabilité nous calculons sur les dix dernières années la probabilité moyenne pourun client de souscrire un nouveau contrat ou produit. Nous pouvons résumer ces probabilités avec le schémasuivant :

Probabilités de souscription d’un client

MRH Auto PFA

Auto/MRH Auto/PFA PFA /MRH

Auto/MRH/PFA

1.0%

2.7%

1.3% 4.3% 0.4%

4.1%

8.6%

0.8%

3.5%

Figure 4.43 – Probabilités de souscription client

Sur ce schéma nous avons fait apparaître les probabilités de souscription d’un client. Par exemple, un clientpossédant un contrat automobile a en moyenne 4.1% de chance de souscrire un contrat MRH dans l’année. Nousn’avons pas fait apparaître sur ce schéma l’intégralité des possibilités de probabilités, d’une part par souci delisibilité et d’autre part car les autres possibilités ne concernent que très peu de clients.Ces probabilités sont des probabilités moyennes et ne tiennent pas compte des caractéristiques du client. Lamodélisation via des modèles linéaires généralisés de ces probabilités d’achat pourrait être une bonne solutionafin d’améliorer notre modèle de valeur client.

62

Page 64: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Enfin ce graphique peut nous faire penser à un graphe d’une chaîne de Markov. Cependant, l’intérêt deschaînes de Markov est de pouvoir constater l’état du système pour un horizon de temps long. Or, dans notreoptique de valeur client, nous nous projetons sur un horizon de seulement 3 ans, l’étude des chaînes de Markovn’a donc pas été explorée.

4.3.2 Estimation du risque engendréDe manière classique, pour estimer le risque associé à un contrat, nous utilisons les caractérisques de la

personne et du contrat. Or dans notre cas, nous n’avons pas accès aux informations du contrat car le client n’apas réélement souscrit à celui-ci.Afin d’avoir une estimation du risque engendré par ce contrat nous nous appuyons sur l’article de recherche deThuring [Thu12]. Dans cet article paru en 2012, Thuring propose une méthode basée sur la crédibilité.

4.3.2.1 Méthode de crédibilité de Bühlmann

La théorie de la crédibilité est une méthode de tarification. Celle-ci a pour objectif de combiner les informa-tions de l’ensemble de la population et également celles propres à l’individu. Le modèle de crédibilité permet dedéterminer le poids à accorder au passé individuel vis à vis du passé collectif. Cette méthode est utilisée pourdes portefeuilles hétérogènes où la prime collective peut ne pas refléter le risque individuel.

Nous rappellons ici le principe de la méthode de crédibilité proposé par Bühlmann en 1967 afin d’introduirele modèle de Thuring.

Tout d’abord introduisons quelques notations : Sit sont les sinistres des clients i au temps t,m est la moyennedes sinistres m = S = 1

IT

∑Ii=1

∑Tt=1 Sit.

L’objectif du modèle de Bühlmann est de déterminer le z optimal afin de calculer la prime suivante :

πi = zSi + (1− z)m

La prime d’un client i est une proportion de la prime individuelle et de la prime collective. Plus z est grandplus on accordera d’importance à l’aspect individuel.

Pour calculer z nous procédons de la manière suivante :

Nous avons la variance intra s2 = 1I(T−1)

∑Ii=1

∑Tt=1(Sit−Si)2 et la variance inter a = 1

I−1

∑Ii=1(Si−S)2−

1T s

2.

Nous calculons le rapport de crédibilité K : K = s2

a et enfin la proportion z : z = TT+K .

4.3.2.2 Méthode de crédibilité pour la vente croisée

Nous explicitons ci-dessous l’adaptation de la méthode de crédibilité proposée par Thuring.

Modèle de Englund et al.

Thuring se base sur le modèle de Englund et al. [EGG08] de 2008. Dans ce modèle nous considérons desclients i = 1..I pour la période de temps j = 1...J avec les produits d’assurance k′ et k. Nous utiliserons l’indicel ∈ k′, k et r ∈ k′, k.

Les clients i sont caractérisés par un risque θil qui est une réalisation indépendante et identiquement distri-buée de la variable aléatoire Θil avec E[Θil] = θ0l avec θ0 le risque du profil collectif de base et Cov[Θil,Θir] = τ2

lr.

Nous posons Nijl le nombre de sinistres qui suit une loi de Poisson tel que E[Nijl|Θil] = λijlΘil. Nous avonsle nombre attendu de sinistres λijl = eijlgl(Xijl) pour un client i sur la période j pour l ∈ k′, k qui dépendde l’exposition eijl et d’une régression gl avec Xijl les caractéristiques du client. De manière classique eijl estcompris entre 0 et 1, 0 signifiant que le client n’a pas été actif sur la période.

Nous posons Fijl =Nijlλijl

qui mesure la déviation entre le nombre attendu de sinistres λijl et les sinistresobservés Nijl.

63

Page 65: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Nous avons E[Fijl|Θij ] = Θil et assumons que V ar[Fijl|Θij ] =σ2l (Θil)λijl

et que Cov[Fijk′ , Fijk|Θik′,Θik] = 0

avec σ2l (Θil) est la variance d’un client i pour l ∈ kk′ [BG05].

Nous avons Fi.l =∑Jij=1Nijl∑Jij=1 λijl

et λi.l =∑Jij=1 λijl. Nous avons donc V ar[Fi.l|Θil] =

σ2l (Θil)λi.l

et Cov[Fi.k′ , Fi.k|Θik′,Θik] =

0 avec σ2l (Θil).

Le modèle de Englund et al. nous donne :

θi = θ0 + αi(Fi. − θ0)

Avec θi = [θik′ , θik]′, θ0 = [θ0k′ , θ0k]′, Fi. = [Fi.k′ , Fi.k]′ et αi =

(αik′k′ αik′kαikk′ αikk

).

Nous avons αi = TΛi(TΛi + S)−1, où T =

(τ2k′k′ τ2

k′k

τ2kk′ τ2

kk

), Λ =

(λi.k′ 0

0 λi.k

)et S =

(σ2k′ 00 σ2

k

)[EGG08].

Si nous calculons l’estimateur des deux risques en effectuant l’opération matricielle ci-dessus nous obtenons :

θik′ = θ0k′ + αik′k′(Fi.k′ − θ0k′) + αik′k(Fi.k − θ0k)

θik = θ0k + αikk′(Fi.k′ − θ0k′) + αikk(Fi.k − θ0k)

Le modèle de Englund et al. nous donne simplement une théorie de la crédibilité en présence de deux produitsd’assurance. Ce modèle ne nous donne pas le risque engendré par la vente du produit k au client i possédant leproduit k′. Thuring présente dans ses travaux une adaptation de ce modèle à la vente croisée.

Modèle de crédibilité de Thuring

Nous nous intéressons à la vente du produit k pour un client i possédant le produit k′. L’hypothèse dumodèle de Thuring est que l’estimateur θikk′ du risque θik peut être obtenu en se basant sur Fi.k′ . Le client ine possédant pas le produit k nous n’avons pas de sinistre nijk = 0 et eijk = 0 ce qui nous donne αikk = 0,l’estimateur de Englund devient :

θik = θ0k + αikk′(Fi.k′ − θ0k′)

Notons que pour obtenir une estimation de θik nous devons calculer les estimateurs de αikk′ , θ0k et θ0k′ surune base de clients ayant les produits k et k′.

4.3.2.3 Application à nos données

Pour notre étude Eurofil a voulu se concentrer sur les aspects principaux de valeurs clients. La modélisationde la vente croisée n’était pas une priorité pour notre étude. Cette modélisation a donc été volontairement misede côté et sera effectuée plus tard par les équipes d’Eurofil. Nous donnons tout de même ici quelques remarquessur ce modèle.

L’estimation du risque engendré par la vente croisée requiert de posséder un nombre suffisant de données. Parexemple, afin d’estimer le risque engendré par la vente d’un produit MRH pour les clients possédant le produitautomobile, il nous est indispensable d’avoir une base de clients possédant ces deux produits. Cet aspect nepose pas de problème pour des ventes croisées effectuées de manière classique par exemple entre la MRH etl’automobile. Il est plus problématique lorsque les ventes croisées sont plus rares ou concernent un nombre limitéde clients, nous pensons par exemple à la vente croisée d’un produit MRH pour les clients possédant déjà leproduit PFA.Plusieurs méthodes peuvent être envisagées pour palier à ce problème. Premièrement, tout simplement ne pasconsidérer ces ventes croisées que nous pouvons juger de marginales. Secondement, nous pouvons imputer à cesventes croisées le risque moyen observé sur le produit en question. Méthode que nous pouvons d’ailleurs utiliserpour toutes ventes croisées.

64

Page 66: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

4.4 Calcul de la valeur client future

4.4.1 Méthode de calculA la suite des études effectuées dans le chapitre 4 nous pouvons calculer la valeur client future pour notre

portefeuille d’assurés Eurofil. Pour chaque client en portefeuille nous calculons pour chaque pas de temps :— La marge client en utilisant le modèle de marge— La probabilité de sortie d’un client en utilisant le modèle de durée de vie

Dans les parties précédentes, nous avons pu observer que le modèle de marge actuariel et le modèle de duréeà vie accélérée présentaient les meilleurs résultats. Ce sont donc ces modèles que nous utilisons pour calculernotre valeur client future.

CLVi =Primei,1 − Sinistrei,1 − FGi,1

(1 + d)× pi,1+

Primei,2 − Sinistrei,2 − FGi,2(1 + d)2

× pi,2+

Primei,3 − Sinistrei,3 − FGi,3(1 + d)3

× pi,3

Point sur le facteur d’actualisation d

Nous utilisons comme facteur d’actualisation les taux sans risque donnés par l’EIOPA. Nous représentonsci-dessous la courbe des taux sans risque sur 10 ans.

0.005

0.010

0.015

0.020

2.5 5.0 7.5 10.0Annee

Taux

Taux EIOPA

Figure 4.44 – Courbe des taux sans risque EIOPA

De la même manière que pour le calcul de la valeur client passée, nous pouvons transformer notre d en dten ayant l’évolution des taux sans risque sur 3 ans.

4.4.2 Présentation des résultatsNous présentons ici la densité de la valeur client future. Le graphique à gauche est la densité simple de notre

variable, à droite nous représentons cette densité en la découpant par percentile.

65

Page 67: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

0.0000

0.0005

0.0010

0.0015

0.0020

−1000 0 1000 2000Valeur client future

Den

sité

Densite des valeurs clients futures

Figure 4.45 – Densité de la valeur client future

Nous pouvons noter que 90% des clients en portefeuille ont une valeur client future positive. Nous pouvonségalement observer que la valeur client est une variable centrée en 250 et répartie de façon "normale" autourde cette valeur. Dans le cadre de notre étude, cette répartition nous convient car elle permet de segmenter leportefeuille, en ayant peu de "très bons" clients et peu de "très mauvais" clients.

Nous représentons ci-dessous un exemple de valeur client future observée sur trois années. Comme nousl’avons mentionné au chapitre 2, la valeur client future est décroissante au cours du temps (celle-ci aurait puêtre croissante si nous avions pris en compte les ventes croisées). Cet effet est dû à la présence de la probabilitép de sortir du portefeuille à chaque temps t.

−200

0

200

2016 2017 2018Exercice

Val

eur

Exemple de valeur client future

Figure 4.46 – Exemple de valeur client future

−200

0

200

2016 2017 2018Exercice

Val

eur type

coutprimesinistre

Exemple de valeur client future

Figure 4.47 – Exemple de valeur client future décom-posée

Sur le graphique de gauche, nous représentons la valeur client décomposée en primes, sinistres et frais. Nousretrouvons la même allure décroissante.

De la même manière que pour la valeur client passée (cf. 3.2), nous pouvons séparer notre valeur client en20 quantiles. Nous donnons ici les graphiques obtenus pour la valeur client future sur les mêmes variables quecelles traitées pour la valeur client passée.Il est intéressant de noter que contrairement à la valeur client passée, les nouveaux clients (ancienneté inférieureà 1 an) ne sont pas pénalisés, 50% d’entre eux ont une valeur client supérieure à la médiane des valeurs clientstotales. On rappelle que seulement 10% d’entre eux l’étaient pour la valeur client passée. A l’inverse, les clientsanciens (ancienneté supérieure à 13 ans) sont moins favorisés avec 25% dont la valeur est inférieure à la médiane(contrairement au 12,5% sur la valeur client passée).

66

Page 68: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

6−]13,Inf[

5−]7,13]

4−]4,7]

3−]2,4]

2−]1,2]

1−]0,1]

0.00 0.25 0.50 0.75 1.00Pourcentage

Anc

ienn

eté

score_client1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

Répartition des scores par ancienneté

Figure 4.48 – Valeur future : Scorepar ancienneté

4−4+

3−3

2−2

1−1

0.00 0.25 0.50 0.75 1.00Pourcentage

Nom

bre

de c

ontr

ats

score_client1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

Repartition des scores par nombre de contrats

Figure 4.49 – Valeur future : Score parnombre de contrats

Grâce aux études menées aux chapitres 3 et 4, nous pouvons suivre l’évolution de la valeur d’un client dansle temps. De plus, l’estimation de la marge client, construit au chapitre 4, est basée sur des modèles linéairesgénéralisés, il nous est donc possible de calculer un intervalle de confiance pour notre marge et donc pour notrevaleur client. En effet, notre modèle nous donne un écart-type sur nos prédictions. Ci-dessous, nous donnons unexemple d’évolution de la valeur d’un client en portefeuille (en bleu l’intervalle de confiance à 95% de la valeurclient future).

Passée Future

Sinistre

Sinistre

−1500

−1000

−500

0

500

1000

2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018Exercice

Val

eur

clie

nt

Exemple d'évolution de la valeur client

Figure 4.50 – Exemple d’évolution de la valeur client

Au final, la valeur client future calculée dans ce chapitre pourra alimenter les bases de données d’Eurofil.L’indicateur pourra être entré en base sous la forme d’un montant comme nous l’avons calculé dans notre étude,mais pourra être modifié pour devenir une "note". Cette note pourra prendre, par exemple, ses valeurs entre 1et 20 en découpant notre variable en quantile comme nous l’avons présenté sur la figure 4.46.

4.4.3 ValidationAfin de tester notre valeur client, deux études ont été construites. Tout d’abord, un échantillon de valeur

client a été envoyé aux équipes commerciales d’Eurofil afin de valider notre valeur à dire d’expert. Cette valeura été envoyée sous forme d’une note de 1 à 20 comme décrit dans la partie précédente. Cette étape n’est pasterminée à la date de rédaction de ce mémoire.

Une seconde étude a été réalisée, sur chaque client présent en portefeuille à fin 2014, nous avons estiméleur valeur client future seulement pour 1 an. Nous sommes venus comparer ensuite la valeur client future à

67

Page 69: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

la réelle valeur que le client nous a apportée. Contrairement aux tests effectués sur le modèle de marge, notrebase de données est constituée de clients qui sont sortis du portefeuille en cours d’année 2015. Nous prenonsen considération ces clients car dans notre modèle de valeur client cet aspect est pris en considération via laprobabilité p de rester en portefeuille.Afin de mesurer la pertinence de notre modèle, nous scindons la valeur client calculée et la valeur client réelleen cinq quantiles. Nous croisons ensuite ces deux variables afin de calculer le taux de bon classement. Ainsi,dans le tableau ci-dessous nous représentons le taux de bon classement par note (de 1 à 5). Ce type de mesureest utilisé car dans notre modèle de valeur client, ce n’est pas le montant de la valeur client qui nous intéressemais le classement du client vis à vis des autres clients. Nous scindons les deux variables en cinq simplementpar souci de lisibilité des résultats.

Valeur client réelle1 2 3 4 5

CLV

1 29% 30% 25% 16% 9%2 32% 40% 21% 13% 7%3 13% 20% 26% 21% 11%4 12% 6% 22% 30% 22%5 14% 4% 6% 20% 51%

Figure 4.51 – Classement de la valeur client attendue (modèle actuariel) versus valeur client réelle

A travers ce tableau, nous pouvons remarquer par exemple que pour les clients dont la note réelle est de 2(quantile 40%), nous avons classé 90% de ces clients avec une note de 1,2 ou 3.En revanche, notre modèle ne capte la baisse de valeur due à un sinistre extrême, notre classement pour lepremier quantile est "mauvais". Il faut néanmoins nuancer cet effet car il est difficile de capter cet effet. Deplus, par construction, notre modèle de marge étant basé sur des modèles de prime pure il ne peut capter ceteffet.De plus, pour une note réelle de 3, notre valeur client future nous donne une note de 1 pour 25% des clients. Unepartie de ces 25% sont des segments de clients très particuliers. Notre modèle de valeur client surestime le risquepour ces clients, ce qui fait baisser leur valeur. Une analyse plus approfondie sur ces clients serait nécessaire.

Pour palier ce problème qui est lié à notre modèle de marge, nous revenons à notre mélange de modèleseffectué à la partie 4.1.4 (cf. 4.1.4). Nous calculons notre valeur client future en mélangeant notre modèle demarge actuarielle et notre modèle de marge économétrique. Nous obtenons les résultats ci-dessous.

Valeur client réelle1 2 3 4 5

CLV

1 43% 24% 15% 12% 7%2 19% 33% 23% 16% 10%3 13% 24% 28% 22% 13%4 13% 13% 24% 29% 22%5 13% 6% 10% 21% 49%

Figure 4.52 – Classement de la valeur client attendue (modèle mélange) versus valeur client réelle

Comme c’était le cas pour la marge, le modèle mélangé nous assure de meilleurs résultats.

68

Page 70: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Chapitre 5

Analyse croisée : Valeur clientpassée/Valeur client future

Dans les chapitres précédents, nous avons calculé la valeur client passée et future sur notre portefeuille d’as-surés, environ 240 000 clients.Nous avons pu déterminer que l’observation du passée du client ne suffisait afin de caractériser la valeur d’unclient pour la compagnie. Tout d’abord, la valeur qu’a généré un client dans le passé ne détermine pas néces-sairement la valeur qu’il va générer dans le futur. En effet, que ce soit au niveau des primes ou des sinistres lesmontants associés au client peuvent évoluer au cours du temps. Cet effet est dû d’une part à la "malchance"d’un client qui a eu un sinistre grave dans le passé et d’autre part à la capacité du client à s’équiper de nouveauxproduits et contrats. Néanmoins, même si l’indicateur de valeur client passée n’est pas optimale, il nous procuretout de même une information sur le client que nous ne pouvons pas négliger.

Pour palier aux défauts de la valeur client passée, nous avons calculé dans le chapitre précédent une valeurclient future. Pour ce faire, nous avons mis en place plusieurs modélisations et avons testé pour chacune plusieursmodèles. Nous avons pu déterminer que les modèles les plus performants étaient le modèle actuariel pour lecalcul de la marge et le modèle à vie accéléré pour le calcul de la probabilité de sortie du client du portefeuille.Dans le chapitre précédent, nous avons également mis en évidence les différents points à améliorer dans notreétude. La majeure partie des points à améliorer sont des aspects que nous n’avons pas eu le temps de traiterdans notre étude. Cependant, nous avons tenté de minimiser les conséquences de ceux-ci en effectuant des mo-délisations plus simplistes sur des éléments marginaux.

Dans la suite de ce chapitre, nous présenterons une analyse croisée entre la valeur client passée calculée enchapitre 3 et la valeur client future calculée en chapitre 4.Dans un premier temps, nous présenterons l’analyse proposée par Greg Firestone et Mohamad Hindawi [HF12].

Dans un second temps, nous présenterons les résultats de notre analyse sur nos données et analyserons etles résultats obtenus.

69

Page 71: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

5.1 Présentation de l’analyse croiséeLa première partie de ce chapitre sera consacrée à la présentation de l’analyse croisée proposée par Greg

Firestone et Mohamad Hindawi [HF12]. Les deux auteurs construisent le graphique suivant permettant decatégoriser l’ensemble des clients.

Past CLV

Futu

re C

LV

Rising stars

Low High

Low

H

igh

True Loyalists

Falling Angel Total Misfits

Schéma d’analyse de la valeur client

Figure 5.1 – Analyse croisée valeur client passée et future proposée par Mohamad Hindawi

Sur ce schéma, les auteurs représentent quatre types de clients :

"Total Misfits" : Les clients "inadaptés" ayant une valeur client passée et future faible. Pour ce type declient, les auteurs proposent de maintenir le lien clientèle mais de réduire les coûts de gestion sur ces clientsc’est à dire limiter les actions commerciales envers eux. Pour cette catégorie de clients, l’objectif de la firme doitêtre de maximiser le profit sur chaque transaction.

"Falling Angel" : Les "anges déchus" ayant une forte valeur client passée mais une valeur client future faible.La compagnie doit tenter de transférer ces clients dans le cadre "fidèle" en identifiant les opportunités de ventescroisées. Cependant l’investissement marketing sur ce type de client doit être maîtrisé afin de ne pas baisserleur valeur déjà considérée comme basse.

"Rising Stars" : Les "étoiles montantes" ayant une faible valeur client passée mais une valeur client futureforte. La compagnie doit investir dans la relation avec ces clients et identifier les possibles ventes croisées. Larelation client doit être cultivée pour réduire au maximum le départ de ces clients du portefeuille.

"True Loyalists" : Les "fidèles" ayant une forte valeur client passée et une valeur client future forte. Commepour les "étoiles montantes", la compagnie doit cultiver la relation client, investir afin de garder ces clients enportefeuille et enfin récompenser la fidélité de ceux-ci.

70

Page 72: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

5.2 Résultat sur nos donnéesNous représentons ci-dessous un graphique montrant la répartition de la clientèle en portefeuille d’Eurofil

en fonction de leur valeur client passée et leur valeur client future.Sur le graphique ci-dessous nous n’avons par souci de lisibilité pas représenté l’ensemble des clients Eurofil.Nous représentons des "poches" de clients. Nous avons scindé la valeur client passée et future en quartile,le centre des cercles représente la moyenne de la valeur observée pour chaque possibilité. La taille du cercle(et le pourcentage) représente le pourcentage de clients concernés. Enfin, les lignes horizontales et verticalesreprésentent respectivement le quantile à 50% de la valeur client future et passée.

7%

7%

6%

5%

9%

7%

5%

3%

7%

6%

7%

5%

3%

4%

7%

11%

CV

CLV

Analyse CV/CLV

Figure 5.2 – Analyse croisée valeur client passée et future

Nous pouvons formuler plusieurs remarques sur le graphique ci-dessus :

Tout d’abord, en prenant comme référence le quantile à 50%, nous pouvons noter que Eurofil aurait 31%de ses clients "True Loyalist", 19% de "Rising stars", 30% de "Total Misfits" et enfin 20% de "Falling Angel".Néanmoins, le seuil de 50% peut être considéré comme un seuil de segmentation très élevé afin de créer cegraphique. Un autre seuil pourrait être fixé, nous ne l’avons pas déterminé dans notre étude car le positionnementde ce seuil nécessite une entente entre les services marketing et techniques. De plus, nous avons la possibilité demodifier cet indicateur en scindant notre population en plus de quatre parties. En effet, la valeur client passéeet future étant calculée en montant nous pourrions créer une nouvelle variable alimentant les bases de donnéesd’Eurofil prenant comme modalités les groupes créés à partir de cet indicateur.

71

Page 73: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Conclusion

Cette étude développe une méthodologie de création d’un indicateur de valeur client en assurance non-vie.Notre mémoire s’est appuyé sur trois principaux articles, l’étude de Kumar et al. en 2004 [VGB04] nous donnantune définition précise de la valeur client. L’étude de Feder, Hardie et Lee en 2006 [FHL06] nous permettantde catégoriser les modèles de valeurs clients selon la nature de la relation client/firme. Enfin, l’étude de BasDonkers, Peter C.Verhoef et Martijn G. de Jong [DCG06] donnant les modélisations possibles de la valeur clienten assurance.La combinaison de ces articles nous a permis de déterminer notre méthodologie de calcul de la valeur client.Dans ce mémoire, nous avons décidé de séparer la valeur client passée (ou observée), reflétant l’ensemble de lasomme des gains (ou pertes) effectués par la compagnie dans le passé sur chaque client, et la valeur client future(ou attendue) reflétant la somme des gains (ou pertes) attendus par la firme pour chaque client sur un horizonde trois ans.

Dans un premier temps, notre étude s’est axée sur la création de la valeur client passée. La valeur clientpassée dans ce mémoire est une simple somme d’éléments parfaitement connus à la date d’aujourd’hui. Notreétude nous a permis de montrer que sur nos données cette valeur dépendait des caractéristiques du client et deses contrats.

Dans un second temps, notre étude s’est axée sur la création de la valeur client future. Pour ce faire, nousavons modéliser chaque élément composant la valeur client de façon indépendante en testant pour chacune d’elleplusieurs modèles.Nous avons pu montrer que sur nos données le modèle optimal pour la marge était le modèle actuariel, modélisantla sinistralité. Ce modèle était plus performant que le second modèle testé qui était un modèle économétriquede panel.Les études sur la rétention client nous ont permis de montrer d’une part que les caractéristiques clients influen-çaient leurs probabilités de rester en portefeuille et d’autre part que les modèles à vie accéléré nous donnaientles meilleurs résultats comparés aux modèles de Cox.L’analyse de la valeur client future nous a donné une première vision sur le portefeuille d’Eurofil en segmen-tant notre population de clients. Cette valeur pourra être utilisée comme nouvel indicateur marketing en étanttransformée sous forme de note.

Dans un troisième temps, nous nous sommes focalisés sur l’analyse croisée entre la valeur client passée etla valeur client future. Cette analyse nous a permis de construire une troisième variable de segmentation duportefeuille. Comme la variable précédente, cette variable pourra être un troisième indicateur prenant la formed’une variable catégorielle.

Tout au long de ce mémoire, nous avons effectué des choix de modélisations auxquelles nous pouvons appor-ter un certain nombre d’améliorations. La principale amélioration à apporter est la prise en compte pour Eurofildes ventes croisées prenant en compte la possibilité qu’un client va sur les trois prochaines années contracterun nouveau contrat. Ce mémoire donne une méthodologie possible pour cette implantation qui pourra êtredéveloppée par la compagnie.

Enfin, ce mémoire était une étude préalable à la création d’un modèle de meilleure action future (Next BestAction). Notre étude apporte une première aide à la décision sur les types de clients à contacter, la prochaineétape est de proposer à ces clients l’offre qui correspond le mieux à leurs besoins.

72

Page 74: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Note de synthèse

La connaisance du client a toujours été une des priorités au sein des compagnies. Dans un contexte deconcurrence forte cette volonté est d’autant plus marquée car elle permet par exemple d’optimiser les coûtsmarketing ou d’accroître la satisfaction client.Les compagnies d’assurance ont toujours été dotées de bases de données volumineuses leur permettant de quan-tifier les risques auxquels elles sont exposées. Les informations des assureurs sont généralement des informationssur les contrats ainsi que sur les clients. L’utilisation de ces informations est souvent limitée à leur fonction pre-mière (les informations des contrats automobile étant utilisées pour la quantification du risque automobile...).Le croisement des informations contenues dans les différentes bases de données internes permet d’ores et déjàde créer des indicateurs techniques ou d’aide à la décision.

L’objectif de ce mémoire était de créer un indicateur de valeur client sur un horizon de temps de trois ans. Cetindicateur a été créé pour Eurofil marque directe du groupe Aviva Assurance France. Cet indicateur sera utilisépour différentes optiques. La fonction première de cet indicateur est de répérer les clients les plus rentables pourla firme. Ainsi, les actions marketing, les frais et les contacts clientèles pourront être optimisés. L’indicateur devaleur client sera également utilisé à des fins de modélisation afin d’améliorer les modèles d’Eurofil en intégrantla valeur client comme nouvel indicateur.

L’indicateur de valeur client a été créé par la combinaison de plusieurs études :La première étude que nous avons effectuée a été d’observer les valeurs des clients dans le passé. Eurofil définitla valeur client passée comme suit :

CVi =

T∑t=0

((Primei,t − Sinistrei,t − FGi,t)× (1 + r)t

)− FAi × (1 + r)T

Avec :CVi : Valeur client du client iPrimei,t : Les primes de l’individu i à la date tSinistrei,t : Le montant des sinistres du client i à la date tFGi,t : Les frais généraux du client i à la date tFAi : Les frais d’acquisition pour le client ir : Le taux de capitalisation

Cette première étape nous a permis de dégager des grandes tendances sur la valeur client. Nous avons pudéterminer que la valeur client est significativement différente entre les clients automobile et multirisque habi-tation, qu’elle était également différente selon les caractéristiques du client, son âge, sa situation familiale, sescaractéristiques contrats.

La seconde étude que nous avons réalisée a été de modéliser la valeur client, appellée dans notre mémoirevaleur client future. Eurofil définit la valeur client future comme suit :

CLVi =

T∑t=1

E[(Primei,t − Sinistrei,t − FGi,t)](1 + d)t

× pi,t

Avec :CLVi : Valeur client du client iPrimei,t : Les primes de l’individu i à la date tSinistrei,t : Le montant des sinistres du client i à la date tFGi,t : Les frais généraux du client i à la date td : Le taux d’actualisation

73

Page 75: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

pi,t : La probabilité d’un client i de rester en portefeuille à tPrimei − Sinistrei − FGi : La marge du client i

Pour construire cet indicateur nous sommes passés par trois modélisations. Nous pouvons résumer le chemi-nement de cette étude via le schéma suivant.

Construction de la valeur client future

Valeur client future

Modélisation de la marge

Modélisation des sinistres Calcul des primes

et des frais

Modélisation de la rétention client

Modélisation de la vente croisée

1 2 3

Auto MRH PFA

Marge Probabilité de rester en

portefeuille Vente croisée

Estimation du risque engendré

Probabilité d’achat

Figure 5.3 – Construction de la valeur client future

Tout d’abord, nous avons construit un modèle de marge, où deux approches ont été testées. Une basée sur unmodèle économétrique de panel où nous avons modéliser directement la marge (Prime−Sinistre−FG). L’autreest basée sur un modèle actuariel où nous avons considéré les trois parties de la marge de façon indépendante.A travers l’analyse de différentes métriques tels que le RMSE, le MAPE ou encore l’indice de Gini, notre étudenous a permis de déterminer que le modèle actuariel permettait d’obtenir de meilleurs résultats.

Ensuite, nous avons modélisé la probabilité de sortie du client du portefeuille avec là encore deux modèlestestés, un modèle de Cox et un modèle à vie accélérée. Notre étude nous a permis de constater que le modèleà vie accélérée obtenait les meilleurs résultats. De plus, notre étude nous a permis de mettre en évidenceque les caractéristiques du client influençaient de manière significative la probabilité de sortie du portefeuillede l’individu. Ci-dessous un exemple de deux courbes de survie pour deux clients ayant des caractéristiquesdifférentes :

0.00

0.25

0.50

0.75

1.00

0 5 10 15time

valu

e variableProfil1Profil2

Exemple de courbe de survie

Enfin, la troisième modélisation avait pour but d’intégrer les aspects de ventes croisées (ou cross-selling) dansnotre étude. Cet aspect n’a pas été implanté faute de temps. Ce mémoire donne tout de même une méthode

74

Page 76: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

d’intégration des ventes croisées dans la valeur client en traitant les deux aspects de cette intégration. Toutd’abord la probabilité d’un client de souscrire un nouveau contrat et ensuite l’estimation de la marge attenduesur ce contrat.

Notre étude nous a permis d’obtenir une vision sur le portefeuille clients actuel d’Eurofil, nous présentonsci-dessous la densité de valeur client observé sur le portefeuille Eurofil.

0.0000

0.0005

0.0010

0.0015

0.0020

−1000 0 1000 2000Valeur client future

Den

sité

Densite des valeurs clients futures

Pour ce qui est des utilisations marketing, nous avons proposé à la fin de ce mémoire une utilisation possiblede la valeur client afin d’améliorer le cliblage client. Nous avons croisé la valeur client passée et la valeur clientfuture afin de catégoriser les clients en quatre classes. Nous donnons ci-dessous le graphique obtenu sur leportefeuille Eurofil avec en abscisse la valeur client observée et en ordonnée la valeur client future. Les zonesbleues représentant des "amas" de clients.

7%

7%

6%

5%

9%

7%

5%

3%

7%

6%

7%

5%

3%

4%

7%

11%

CV

CLV

Analyse CV/CLV

Cette étude nous a permis de détecter les clients les plus rentables dans le futur ainsi que les moins rentables.Selon les objectifs de la firme, les actions marketing pourront se focaliser sur l’une ou l’autre des catégories.

75

Page 77: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Au final, cette étude a permis à Eurofil de créer deux nouvelles variables dans sa base de données, la valeurclient observée et modélisée. Ces deux variables pourront être utilisées dans différents secteurs, notamment dansles services marketing ou dans les services d’actuariat, afin d’optimiser les process et les coûts marketing maiségalement les modèles mis en place par les équipes actuarielles.

76

Page 78: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Executive summary

Customer knowledge has always been one of the priorities of business. In a competitive market, this desire iseven more pronounced, partly because this knowledge helps to optimize marketing costs and maximize customersatisfaction.Insurance companies have always possessed large data base, enabling them to quantify their risks. Insurer’s datagenerally includes a wealth of contract and customer information. However, the use of this information is oftenlimited, for example automobile insurance data is normally only used for automobile risk quantification. Simplycrossing this information with other products allows the creation of new technical or decision support indicators.

The purpose of this project was to create a Customer Lifetime Value that represents the potential value ofa customer over the next three years. This indicator was constructed for Eurofil,the direct insurance branchof Aviva. This metric will be used in several studies. The primary use will be to identify the most profitablecustomers in order for Eurofil to be able to optimize its marketing costs. The Customer Lifetime Value will alsobe used by the technical pricing team as a new factor to improve their existing models.

The Customer Lifetime Value has been constructed in several stages :First, we computed the past Customer Value, defined within Eurofil as :

CVi =

T∑t=0

((Premiumi,t − Claimi,t −GCi,t)× (1 + r)t

)−ACi × (1 + r)T

Where :CVi : Customer value iPremiumi,t : Premium of a customer i at tClaimi,t : Claim of a customer i at tGCi,t : General costs of a customer i at tACi : Acquisition costs of a customer i at tr : Capitalization factor

This step allowed us to identify trends in the data. We were able to show that past Customer Value differssignificantly between automobile and household insurance customers. We also saw that past Customer Valuevaries according to customer characteristics (such as age and family status) as well as contract characteristics.

Next, we modeled the Customer Lifetime Value, referred to in this document as the "future Customer Value".Eurofil define the Customer Lifetime Value as :

CLVi =

T∑t=1

E[(Premiumi,t − Claimi,t −GCi,t)](1 + d)t

× pi,t

Where :CLVi : Customer lifetime value iPremiumi,t : Premium of a customer i at tClaimi,t : Claim of a customer i at tGCi,t : General costs of a customer i at td : Discount factorpi,t : Probability for a customer i to remain in the portfolio at tPremiumi − Claimi −GCi : Margin of a customer i

To create the Customer Lifetime Value, we produced three model summarized in the following diagram.

77

Page 79: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Customer life time value construction

Customer Life time Value

Margin Model

Claim Model Premium and Costs

computation

Churn Model Cross-selling Model 1 2 3

Auto MRH PFA

Margin Probability to remain in

portfolio Cross-selling

Risks estimation Probability of

purchase

Figure 5.4 – Customer Lifetime Value study

First of all, we built a margin model, where we tested two approaches. One was an econometric model wherewe modeled the margin directly ; the other was an actuarial model where we considered the premium, generalcosts and claim costs independently. After an analysis based on the RMSE, MAPE and the Gini index, wedetermined that the actuarial model outperformed the econometric one.

Next, we modeled the customer churn, again using two approaches, we tested a Cox model and an acceleratedfailure time model. We saw that in our case the accelerated failure time model performed better than the Coxmodel. In addition, we noted also that the characteristics of customer significantly affect the probability thatcustomer will leave the portfolio. Below an example of survival curve of two different customers :

0.00

0.25

0.50

0.75

1.00

0 5 10 15time

valu

e variableProfil1Profil2

Example : Survival curve

The third and final model was created to take into account the effects of cross-selling. This model was notimplemented due to lack of time ; however, this document details the methodology used. Two main problem needto be resolves in order to integrate this model with the others : the calculation of the probability of subscriptionand the computation of the expected margin for the new contracts.

These steps enabled us to obtain a view of Eurofil’s current customer portfolio. The diagram below showsthe density of the customer lifetime value for this portfolio :

78

Page 80: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

0.0000

0.0005

0.0010

0.0015

0.0020

−1000 0 1000 2000CLV

Den

sity

Customer life time value density

As for marketing uses of our metrics, we have outlined in this document a potential use for improvingtargeting of customers. We crossed the past Customer Value and the Customer Lifetime Value in order tosegment our customer base into four groups. Below is the graph we obtained for Eurofil portfolio showingpast Customer Value on the x-axis and Customer Lifetime Value on the y-axis. The blue zone represents thepercentage of customers in each group.

7%

7%

6%

5%

9%

7%

5%

3%

7%

6%

7%

5%

3%

4%

7%

11%

CV

CLV

Analysis CV/CLV

This project allowed us to detect the most profitable customers for future years as well as the least pro-fitable. Depending on Eurofil’s objectives, the marketing department could focus on one or other of these groups.

To summarise, this project enabled us to create two new factors for Eurofil’s databases, the past customervalue and the Customer Lifetime Value. These two factors will be used in different departments includingMarketing and Actuarial in order to optimize costs and various actuarial models.

79

Page 81: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Table des figures

1.1 Evolution du chiffre d’affaires Eurofil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81.2 Répartition du chiffre d’affaires 2015 Eurofil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91.3 Evolution du nombre de clients Eurofil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91.4 Parcours d’un nouveau client Eurofil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101.5 Répartition des origines des contrats par exercice . . . . . . . . . . . . . . . . . . . . . . . . . . . 101.6 Déroulé de l’étude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121.7 Schéma conceptuel des bases de données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.1 Catégorisation des transactions proposées par Feder, Hardie et Lee (2006) . . . . . . . . . . . . . 172.2 Exemple 1 d’évolution de la valeur client . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212.3 Exemple 2 d’évolution de la valeur client . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

3.1 Catégorisation des frais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253.2 Segmentation des frais d’acquisition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263.3 Comparaison des frais d’acquisition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 273.4 Historique des taux OAT 10 ans . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283.5 Valeur client passée : Analyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293.6 Valeur passée : Score par ancienneté . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303.7 Valeur passée : Score par nombre de contrats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

4.1 Modèle de marge : Heat map V de Cramer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 344.2 Modèle de marge : Mean excess function des sinistres . . . . . . . . . . . . . . . . . . . . . . . . . 354.3 Mean excess function zoom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 354.4 Modèle de marge : Effet temps . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 364.5 Modèle économétrique : Coefficients des principales variables . . . . . . . . . . . . . . . . . . . . 364.6 Exemple d’adéquation d’une marge client . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 374.7 Modèle de marge : Modélisation des sinistres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 384.8 Modèle auto : Heat map V de Cramer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 404.9 Modèle auto : Densité de la prime pure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 414.10 Modèle de prime pure dommage auto : Optimisation du degré de la Tweedie . . . . . . . . . . . . 414.11 Modèle automobile : Coefficients GLM des variables . . . . . . . . . . . . . . . . . . . . . . . . . 424.12 Modélisation : Résidus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 424.13 Modélisation : Courbe de Lorenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 424.14 Modèle automobile dommage : Performance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 434.15 Sinistres RC automobile : Mean excess function . . . . . . . . . . . . . . . . . . . . . . . . . . . . 434.16 Mean excess function zoom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 434.17 Modèle automobile : Coefficients GLM des variables . . . . . . . . . . . . . . . . . . . . . . . . . 444.18 Modèle automobile RC : Performance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 444.19 Modèle MRH : Heat map V de Cramer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 454.20 Modèle MRH : Densité de la prime pure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 454.21 Modélisation MRH : Optimisation du degré de la Tweedie . . . . . . . . . . . . . . . . . . . . . . 464.22 Modèle MRH : Coefficients GLM des variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . 464.23 Modélisation : Résidus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 474.24 Modélisation : Courbe de Lorenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 474.25 Modèle MRH hors incendie : Performance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 474.26 Sinistres incendies MRH : Mean excess function . . . . . . . . . . . . . . . . . . . . . . . . . . . . 474.27 Mean excess function zoom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 474.28 Modèle MRH : Coefficients GLM des variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . 484.29 Modèle MRH incendie : Performance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 484.30 Comparaison des modèles de marges via le RMSE . . . . . . . . . . . . . . . . . . . . . . . . . . 50

80

Page 82: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

4.31 Comparaison des modèles de marges via le MAPE . . . . . . . . . . . . . . . . . . . . . . . . . . 504.32 Comparaison des modèles de marges via l’indice de Gini . . . . . . . . . . . . . . . . . . . . . . . 504.33 Blending des modèles de marges . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 514.34 Modèle de Cox : Gain en concordance de chaque variable . . . . . . . . . . . . . . . . . . . . . . 544.35 Modèle de Cox : Exponentiel des coefficients β . . . . . . . . . . . . . . . . . . . . . . . . . . . . 554.36 Courbe Log log Kaplan Meier pour les contrats . . . . . . . . . . . . . . . . . . . . . . . . . . . . 564.37 Modèle de vie accéléré : Exponentiel des coefficients β . . . . . . . . . . . . . . . . . . . . . . . . 584.38 Modèle de durée : Concordance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 594.39 Exemple de courbe de survie pour deux profils . . . . . . . . . . . . . . . . . . . . . . . . . . . . 594.40 Evolution du pourcentage de clients multi-équipés . . . . . . . . . . . . . . . . . . . . . . . . . . 614.41 Pourcentage de clients MRH possédant un contrat automobile . . . . . . . . . . . . . . . . . . . . 624.42 Pourcentage de clients automobile possédant un contrat MRH . . . . . . . . . . . . . . . . . . . . 624.43 Probabilités de souscription client . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 624.44 Courbe des taux sans risque EIOPA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 654.45 Densité de la valeur client future . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 664.46 Exemple de valeur client future . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 664.47 Exemple de valeur client future décomposée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 664.48 Valeur future : Score par ancienneté . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 674.49 Valeur future : Score par nombre de contrats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 674.50 Exemple d’évolution de la valeur client . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 674.51 Classement de la valeur client attendue (modèle actuariel) versus valeur client réelle . . . . . . . 684.52 Classement de la valeur client attendue (modèle mélange) versus valeur client réelle . . . . . . . . 68

5.1 Analyse croisée valeur client passée et future proposée par Mohamad Hindawi . . . . . . . . . . . 705.2 Analyse croisée valeur client passée et future . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 715.3 Construction de la valeur client future . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 745.4 Customer Lifetime Value study . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 785.5 Exemple de densité de loi Poisson (λ = 2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 835.6 Exemple de densité de loi Gamma (µ = 5, ν = 1) . . . . . . . . . . . . . . . . . . . . . . . . . . . 845.7 Loi tweedie (µ = 1, p = 1.1, φ = 5) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 855.8 Loi tweedie (µ = 1, p = 1.9, φ = 5) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 855.9 Courbe Log log Kaplan Meier pour l’email . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 875.10 Courbe Log log Kaplan Meier pour le full web . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 875.11 Courbe Log log Kaplan Meier pour l’âge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

81

Page 83: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Bibliographie

[Boh11] Abdul Manaf Bohari. Customer Lifetime Value Model in Perspective of Firm and Customer :Practical Issues and Limitation on Prospecting Profitable Customers of Hypermarket Business. 2011.

[BG05] Bühlmann et Gisler. A course in Credibility theory and its applications. 2005.

[DCG06] Bas Donkers, Peter C.Verhoef et Martijn G.de Jong. Modeling CLV : A test of competingmodels in the insurance industry. http://link.springer.com/article/10.1007/s11129-006-9016-y. 2006.

[Dug12] Emmanuel Duguet. Econométrie des Durées. 2012.

[DF97] Dwyer et F.Robert. Customer lifetime valuation to support marketing decision making. 1997.

[EGG08] Englund, Guillen et Nielsen Gustafsson. Multivariate latent risk : A credibility approach. 2008.

[FHL06] Fader, Hardie et Lee. CLV : More than Meets the Eye. 2006.

[Gup+06] Sunil Gupta et al.Modeling Customer Lifetime Value. http://www.anderson.ucla.edu/faculty/dominique.hanssens/content/JSR2006.pdf. 2006.

[Har15] Tuomas Harju. Accuracy of Noncomplex Customer Lifetime Value. 2015.

[HF12] Mohamad Hindawi et Greg Firestone. Customer Lifetime Value. 2012.

[Hol94] Holbrook. The nature of Customer Value. In : Service Quality : New directions in theory andpractice. 1994.

[Hur10] Christophe Hurlin. Dynamic panel data models. http://www.univ-orleans.fr/deg/masters/ESA/CH/Geneve_Chapitre2.pdf. 2010.

[KK96] David G. Kleinbaum et Mitchel Klein. Survival Analysis : A Self-Learning Text. 1996.

[La 12] Laura Fort La Tribune. Tops et flops de l’assurance directe. http : / / www . latribune . fr /entreprises- finance/banques- finance/industrie- financiere/20121109trib000730038/tops-et-flops-de-l-assurance-directe.html. 2012.

[LAr16] Marie Bourdelles L’Argus de l’assurance. Les comparateurs d’assurances peinent à s’imposer(Etude Xerfi). http://www.argusdelassurance.com/intermediaires/comparateurs/les-comparateurs-d-assurances-peinent-a-s-imposer-etude-xerfi.103743. 2016.

[Lev60] Levitt. Marketing Myopia. 1960.

[MB05] Malthouse et Blattberg. Can we predict customer lifetime value ? 2005.

[SAI15] Philippe SAINT PIERRE. Introduction à l’analyse des durées de survie. 2015.

[SSI13] Siddarth S.SINGH. Measuring Customer Lifetime Value : Models and Analysis. http://sites.insead.edu/facultyresearch/research/doc.cfm?did=51835. 2013.

[Thu12] Fredrik Thuring. A credibility method for profitable cross-selling of insurance products. http://www.actuaries.org/ASTIN/Colloquia/Madrid/Papers/Thuring.pdf. 2012.

[VK04] Rajkumar Venkatesan et V. Kumar. A Customer Lifetime Value Framework for Customer Se-lection and Resource Allocation Strategy. 2004.

[VS08] Raykar Vikas C. et Harald Steck Balaji Krishnapuram. On Ranking in Survival Analysis :Bounds on the Concordance Index. 2008.

[VGB04] V.Kumar, Ramani Girish et Timothy Bohling. Customer lifetime valuation to support marketingdecision making. 2004.

[Zei01] Zeithaml. Driving Customer Equity : How Customer Lifetime Value Is Reshaping Corporate Stra-tegy. 2001.

82

Page 84: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Annexe 1 : Eléments sur la loi Poisson etGamma

Loi Poisson

La loi de Poisson est caractérisée par :

P (N = k) = e−λλk

k!,∀k ∈ N

On a E(N) = V ar(N) = λ ∈ R+

Ci-dessous un exemple de densité de loi Poisson :

0

10000

20000

0 3 6 9 12Data

coun

t

Densite d'une loi Poisson

Figure 5.5 – Exemple de densité de loi Poisson (λ = 2)

Loi Gamma

La loi de Gamma est caractérisée par :

f(y|µ, ν) =1

Γ

µ

)νyν−1exp

(−νµy

), y ∈ R+

Ci-dessous un exemple de densité de loi Gamma :

83

Page 85: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

0.00

0.05

0.10

0.15

0.20

0 5 10 15 20 25Data

dens

ity

Densite d'une loi Gamma

Figure 5.6 – Exemple de densité de loi Gamma (µ = 5, ν = 1)

84

Page 86: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Annexe 2 : Eléments sur la loi Tweedie

La loi Tweedie est caractérisée par :

f(y|µ, φ) = A(y, φ)× exp(

1

φ(yθ(µ)− κ(θ(µ)))

)où

θ(µ) =

{µ1−p

1−p , si p 6= 1

log(µ), si p = 1et

κ(θ(µ)) =

{µ2−p

2−p , si p 6= 2

log(µ), si p = 2etA est une fonction qui dépend des paramètres de la loi

La loi de Y est une loi Poisson composée avec des sauts Gamma :

Y ↪→ CPois

(µ2−pφ(2− p), G

(− 2− pφ(1− p)

, φ(2− p)µp−1

))où p ∈ [1, 2]

Ci-dessous un exemple de densité de loi Tweedie :

0

2000

4000

6000

8000

0 5 10 15Data

coun

t

Densite d'une loi Tweedie

Figure 5.7 – Loi tweedie (µ = 1, p = 1.1, φ = 5)

0

2000

4000

6000

0 10 20 30Data

coun

t

Densite d'une loi Tweedie

Figure 5.8 – Loi tweedie (µ = 1, p = 1.9, φ = 5)

Nous considérons un contexte de régression où le nombre de sinistres suit une loi de Poisson et le coût dessinistres suit une loi Gamma.

Ni ↪→ P (λi) avec λi = exp(XTi βλ)

Yi,j ↪→ G(µi, φ) avec µi = exp(XTi βµ)

On a : Si = Y1,i + ...+ YN,i a une distribution Tweedie avec :

85

Page 87: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Le "power" de la fonction de variance est p = φ+2φ+1

La moyenne est λiµi

Le paramètre d’échelle est λ1

φ+1−1

i

µφφ+1i

φφ+1

86

Page 88: HENNOMDamien Créationd ... · Chapitre 1 Contextedel’étude Eurofil est le canal de distribution direct d’Aviva assurances. Cette entité a été créée en 1990 et opère

Annexe 3 : Courbe Log-log Kaplan Meier

−2

−1

0

1

0.0 0.5 1.0 1.5 2.0logtime

logl

ogsu

rv groupe

email_n

email_y

Courbe Log−log Kaplan Meier : email

Figure 5.9 – Courbe Log log KaplanMeier pour l’email

−1

0

1

0.0 0.5 1.0 1.5 2.0logtime

logl

ogsu

rv groupe

full_web_n

full_web_y

Courbe Log−log Kaplan Meier : full web

Figure 5.10 – Courbe Log logKaplan Meier pour le full web

−2

−1

0

1

0.0 0.5 1.0 1.5 2.0logtime

logl

ogsu

rv

groupe

0−]18,25]

1−]25,30]

2−]30,35]

3−]35,40]

4−]40,45]

5−]45,60]

6−]60,Inf]

Courbe Log−log Kaplan Meier : Age

Figure 5.11 – Courbe Log log Kaplan Meier pour l’âge

87