112

REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

REMERCIEMENTS

Je tiens à remercier Monsieur David CADOUX, directeur des risques IARD, dem'avoir permis d'eectuer ce stage au sein du Group Risk Management d'AXA et pourtoute l'attention qu'il a portée à mon mémoire.

Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, quim'a conseillée et fait bénécier de son expérience sur les risques émergents. Je le remercieégalement pour son accueil chaleureux et sympathique ainsi que pour la conance qu'ilm'a accordée tout au long de mon stage.

Je tiens à adresser un remerciement spécial à Yannick APPERT-RAULLIN pour m'avoirguidée dans mes recherches. Il a toujours su m'accorder du temps malgré son emploi dutemps chargé et ses conseils m'ont été d'une grande aide, aussi bien pour mon mémoireque pour ma carrière professionnelle.

Merci également à mes collègues stagiaires pour leurs idées et leur soutien : MathieuPRIGENT, Matthieu MONSCH, Elisabeth GOLOVINA-BENOIS, Honorine CALIXTEet plus particulièrement Alexandre BREL.Je tiens aussi à remercier Jérémie BONNEFOY, Florence THEVENOT et ChristopheDUTANG de m'avoir transmis leur savoir dans leur domaine respectif.

Je remercie Arthur CHARPENTIER pour l'intérêt qu'il a porté à mon étude, et pourles idées dont il m'a fait part lors de notre rencontre.

Pour nir, je remercie Messieurs Arnaud COHEN et Olivier LOPEZ d'avoir été mesréférents à l'ISUP pour ce mémoire.

Page 2: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents
Page 3: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

RÉSUMÉ

Ce mémoire a été rédigé par Mélanie MASSIAS (promotion ISUP 2010) à l'issue du stageeectué entre avril et septembre 2010 au sein du Groupe Risk Management d'AXA. L'ob-jectif de ce mémoire est d'améliorer la recherche et la surveillance des risques émergents,à partir des outils de suivi déjà mis en place à AXA. Les travaux réalisés ont permis unemeilleure compréhension et anticipation de ces risques et ont également amélioré leursuivi au quotidien.

La première partie est une introduction présentant les risques émergents. Après avoirdéni la notion de "risques émergents" et exposé leurs principales caractéristiques, nousprésentons leur processus de contrôle en général et plus particulièrement au sein d'AXA.Le groupe AXA a notamment mis en place des outils de suivis quantitatifs et qualitatifs.Enn nous expliquons les enjeux de ce suivi, en détaillant comment les risques émergentspeuvent à la fois avoir un impact sur le passif et l'actif de l'assureur.

La seconde partie détaille notre étude. Dans un premier temps nous présentons le prin-cipe de fonctionnement de l'outil quantitatif de suivi des risques et les données qui sontà notre disposition.Dans un second temps, à partir de ces données nous élaborons un indicateur deprogression d'un risque émergent. Ce chapitre nous a amené à tester plusieurs indi-cateurs et notamment à construire un algorithme de détection de pics pour faciliter nostravaux.Grâce à ce nouvel indicateur, nous mettons en place dans un dernier chapitre une mé-thode d'anticipation de progression des risques. En se basant sur la modélisationARMA et la théorie des chaines de Markov, nous simulons des scénarios d'évolution fu-ture des risques. A partir de ces simulations nous estimons la probabilité de progressiond'un risque. Cette méthode permet de comparer les risques entre eux et d'identier les-quels sont potentiellement les plus dangereux.Le dernier chapitre porte également sur l'analyse de l'interaction des risques ausein d'une même famille. L'idée est d'évaluer si un choc sur un risque entraine desrépercussions sur les autres risques d'une même famille. Ceci nous a conduit à étudier lamodélisation VAR, l'analyse des chocs, et la causalité de Granger.Les études du dernier chapitre sur l'anticipation de progression et sur les interactionsont été menées sur la famille pandemic u (les grippes pandémiques). La volumétrie desdonnées nous a en eet contraint à restreindre notre étude à une seule famille.

Le nouvel indicateur de progression est désormais utilisé pour les travaux de reporting.L'étude sur l'anticipation de progression et sur les interactions au sein d'une même fa-mille a donné des résultats satisfaisants pour les risques de la famille pandemic u. Ilserait désormais intéressant d'eectuer cette analyse sur une autre famille de risques.

Page 4: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents
Page 5: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

ABSTRACT

This thesis was written by Mélanie MASSIAS (ISUP class 2010) after an internshipaccomplished between April and September 2010 within the Group Risk Management ofAXA.The goal of this thesis is to improve research and tracking of emerging risks, thanks tosupervising tools already used in AXA.

The rst part introduces emerging risks. After dening the main characteristics of emer-ging risks, we explain the control process especially at AXA. AXA has, for example,established quantitative and qualitative watching tools. Then we explain emerging risks'impact on liabilities and assets.

The second part talks about our study. Starting by introducing how quantitative toolswork, we then present available data. Thus, we establish a progress indicator on emer-ging risks. For that, we had to create a peak detection algorithm in order to test severalindicators.In the next part, we develop a method to anticipate progression risk. Based on ARMAprocesses and Markov theory, we simulate future evolutions of risks. We estimate pro-gression risks' probability by using those simulations. This method allowed us to comparerisks and identify which ones are the most dangerous.The last chapter analyzes interactions in a family of risks. The idea is to evaluate if theemergence of a risk causes the progression of other risks. For that we study VAR mode-lisation, impulse analysis, and Granger causality.These last two studies (anticipation of progression risk and interaction analysis) are madewith the pandemic u family. Indeed, the study was so huge that we had to restrain it.

This thesis allows us to better understand emerging risks. The new progression indicatoris now used for reporting. The study about progression anticipation and interaction givesus satisfying results for pandemic u family. It would also be interesting to do thesestudies on another family.

Page 6: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents
Page 7: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

TABLE DES MATIÈRES

I Introduction : dénitions et présentation des risques émergents 17

1 Présentation des risques émergents 191.1 Dénition des risques émergents . . . . . . . . . . . . . . . . . . . . . . . . 191.2 Caractéristiques des risques émergents . . . . . . . . . . . . . . . . . . . . 20

1.2.1 Incertitude et fort potentiel catastrophique . . . . . . . . . . . . . 201.2.2 Importance de l'horizon temporel . . . . . . . . . . . . . . . . . . . 21

2 Maîtrise des risques émergents 232.1 Généralités sur la maîtrise des risques . . . . . . . . . . . . . . . . . . . . 232.2 Processus de contrôle des risques émergents . . . . . . . . . . . . . . . . . 232.3 Les risques émergents au sein du Groupe AXA . . . . . . . . . . . . . . . 24

3 Enjeux du suivi des risques émergents 273.1 Impact des risques émergents sur le passif de l'assureur . . . . . . . . . . . 273.2 Impact des risques émergents sur l'actif de l'assureur . . . . . . . . . . . . 28

II Analyse de la progression des risques émergents et leurs interac-tions 29

1 Description des données et premiers traitements 311.1 Présentation du logiciel de suivi . . . . . . . . . . . . . . . . . . . . . . . . 311.2 Données disponibles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321.3 Traitement préalable des données . . . . . . . . . . . . . . . . . . . . . . 33

2 Élaboration d'un indicateur de progression d'un risque émergent 352.1 Problématique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 352.2 Qu'est ce qu'un bon indicateur ? . . . . . . . . . . . . . . . . . . . . . . . 362.3 Périmètre de l'étude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

Page 8: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

TABLE DES MATIÈRES

2.4 Construction d'un algorithme de détection de pics . . . . . . . . . . . . . 362.5 Comparaison des moteurs de recherche . . . . . . . . . . . . . . . . . . . . 39

2.5.1 Problématique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 392.5.2 Etude du référencement et des dysfonctionnements des moteurs de

recherche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 412.5.3 Lissage des données . . . . . . . . . . . . . . . . . . . . . . . . . . 47

2.6 Élaboration de l'indicateur . . . . . . . . . . . . . . . . . . . . . . . . . . . 482.6.1 Indicateurs testés . . . . . . . . . . . . . . . . . . . . . . . . . . . . 482.6.2 Étalonnage des moteurs de recherche . . . . . . . . . . . . . . . . . 492.6.3 Test des indicateurs . . . . . . . . . . . . . . . . . . . . . . . . . . 52

3 Anticipation de la progression des risques émergents et analyse desinteractions dans une même famille 553.1 Périmètre de l'étude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 553.2 Lissage des données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 573.3 Simulations de scénarios d'évolution des risques . . . . . . . . . . . . . . . 59

3.3.1 Modélisation ARMA . . . . . . . . . . . . . . . . . . . . . . . . . . 593.3.2 Analyse des résidus et simulations de trajectoires . . . . . . . . . . 633.3.3 Simulations de la série initiale . . . . . . . . . . . . . . . . . . . . . 703.3.4 Probabilités de survenance d'un choc et backtesting . . . . . . . . 713.3.5 Conclusions : avantages et limites de la méthode . . . . . . . . . . 73

3.4 Analyse de l'interaction dans une famille de risques . . . . . . . . . . . . . 743.4.1 Modélisation VAR . . . . . . . . . . . . . . . . . . . . . . . . . . . 743.4.2 Détermination du retard maximal p . . . . . . . . . . . . . . . . . 753.4.3 Sélection des paramètres : méthode descendante . . . . . . . . . . 753.4.4 Interprétation des résultats . . . . . . . . . . . . . . . . . . . . . . 763.4.5 Dynamique d'un modèle VAR : analyse des chocs . . . . . . . . . . 773.4.6 Interprétation des résultats . . . . . . . . . . . . . . . . . . . . . . 793.4.7 Stabilité du modèle . . . . . . . . . . . . . . . . . . . . . . . . . . . 793.4.8 Test de causalité de Granger . . . . . . . . . . . . . . . . . . . . . 803.4.9 Interprétation des résultats . . . . . . . . . . . . . . . . . . . . . . 823.4.10 Conclusions : avantages et limites de l'analyse . . . . . . . . . . . . 82

M.MASSIAS ISUP 2010 10

Page 9: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

TABLE DES FIGURES

1.1 Comparaison de l'impact d'une tempête et des risques émergents . . . . . 201.2 Évolution du potentiel d'action en fonction de l'avancée du risque . . . . . 211.3 Horizon temporel des risques connus et des risques émergents . . . . . . . 22

2.1 Étapes du processus de contrôle des risques émergents . . . . . . . . . . . 242.2 Exemple de radar crée pour le reporting . . . . . . . . . . . . . . . . . . . 26

1.1 Recherche sur Google . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 311.2 Combinaisons de recherche possibles . . . . . . . . . . . . . . . . . . . . . 32

2.1 Évolution de RTS pour le risque bisphenol . . . . . . . . . . . . . . . . . . 372.2 Évolution de RTS pour le risque bisphenol . . . . . . . . . . . . . . . . . . 392.3 Comparaison de l'évolution de R+RT du risque cybermarket avec les trois

moteurs de recherche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 402.4 Évolution de R+RT de diérents risques avec le moteur de recherche A . . 422.5 Évolution corrigée de R+RT de diérents risques avec le moteur A . . . . 432.6 Évolution de R+RT de diérents risques avec le moteur B . . . . . . . . . 442.7 Évolution de R+RT de diérents risques avec le moteur C . . . . . . . . . 452.8 Comparaison de la volatilité de l'évolution de R+RT du risque paraben

par moteur de recherche, en nombre de pages . . . . . . . . . . . . . . . . 462.9 Diérents lissages pour l'évolution de R+RT de cybermarket avec le mo-

teur A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 472.10 Construction de l'indicateur R+RTGlobal sans pondération . . . . . . . . 502.11 Construction de l'indicateur R+RTGlobal avec pondération . . . . . . . . 512.12 Résumé des résultats des tests d'indicateurs . . . . . . . . . . . . . . . . . 52

3.1 Comparaison de l'évolution de RS+RTS sans lissage et avec un lissagemoyenne mobile d'ordre 360 pour le risque AH1N1 . . . . . . . . . . . . . 57

Page 10: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

TABLE DES FIGURES

3.2 Comparaison de l'évolution de RS+RTS sans lissage et avec le lissagespécial pour le risque AH1N1 . . . . . . . . . . . . . . . . . . . . . . . . . 58

3.3 Test de Dickey Fuller sur la série initiale . . . . . . . . . . . . . . . . . . . 603.4 Test de Dickey Fuller sur la série diérenciée . . . . . . . . . . . . . . . . . 603.5 Autocorrélogramme de la série diérenciée . . . . . . . . . . . . . . . . . . 613.6 Autocorrélogramme partiel de la série diérenciée . . . . . . . . . . . . . . 613.7 Estimation par les moindres carrés des paramètres du modèle ARMA(2,2) 623.8 Test sur les résidus du modèle ARMA(2,2) . . . . . . . . . . . . . . . . . . 623.9 Comparaison du modèle et de la série initiale et prévisions . . . . . . . . . 633.10 Evolution des résidus estimés du modèle ARMA(2,2) . . . . . . . . . . . . 643.11 Test de Wald . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 663.12 Méthode de simulations . . . . . . . . . . . . . . . . . . . . . . . . . . . . 683.13 Résumé des classes de résidus déterminées pour avianu . . . . . . . . . . 693.14 Observation de l'évolution et de la répartition des résidus, pour le risque

avianu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 703.15 Diérentes simulations de l'évolution de RS+RTS pour le risque AH1N1 . 713.16 Fonctions de répartition . . . . . . . . . . . . . . . . . . . . . . . . . . . . 723.17 Backtesting . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 733.18 Détermination du retard p . . . . . . . . . . . . . . . . . . . . . . . . . . . 753.19 Résultats des tests de causalité de Granger (lire x cause y) . . . . . . . . . 8220 Extrait d'une table de données SAS . . . . . . . . . . . . . . . . . . . . . . 8921 Erreur de données : moteurs de recherche manquants . . . . . . . . . . . . 9022 Erreur de données : termes de sévérité manquants . . . . . . . . . . . . . . 9023 Erreur de données : forte chute d'une valeur . . . . . . . . . . . . . . . . . 9024 Erreur de données : valeurs incohérentes . . . . . . . . . . . . . . . . . . . 9125 Vérication des augmentations de RS avec l'ensemble des moteurs de re-

cherche, pondérés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9326 Vérication des augmentations de R+RT avec l'ensemble des moteurs de

recherche, pondérés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9427 Vérication des augmentations de RTS avec l'ensemble des moteurs de

recherche, pondérés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9528 Vérication des augmentations de RS+RTS avec l'ensemble des moteurs

de recherche, pondérés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9629 Évolution de l'indicateur RS+RTS, après traitement et lissage, pour le

risque AH1N1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9730 Évolution de l'indicateur RS+RTS, après traitement et lissage, pour le

risque avianu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9831 Évolution de l'indicateur RS+RTS, après traitement et lissage, pour le

risque inuenza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9932 Évolution de l'indicateur RS+RTS, après traitement et lissage, pour le

risque novelu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10033 Évolution de l'indicateur RS+RTS, après traitement et lissage, pour le

risque pandemicu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

M.MASSIAS ISUP 2010 12

Page 11: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

TABLE DES FIGURES

34 Évolution de l'indicateur RS+RTS, après traitement et lissage, pour lerisque swineu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

35 Équation du modèle VAR, partie 1 . . . . . . . . . . . . . . . . . . . . . . 10736 Équation du modèle VAR, partie 2 . . . . . . . . . . . . . . . . . . . . . . 10837 Fonction de réponse impulsionnelle simple et orthogonalisée suite à un

choc sur AH1N1 à l'instant t = 0 . . . . . . . . . . . . . . . . . . . . . . . 10938 Fonction de réponse impulsionnelle simple et orthogonalisée suite à'un

choc sur avianu à l'instant t = 0 . . . . . . . . . . . . . . . . . . . . . . . 11039 Fonction de réponse impulsionnelle simple et orthogonalisée suite à un

choc sur inuenza à l'instant t = 0 . . . . . . . . . . . . . . . . . . . . . . 11140 Fonction de réponse impulsionnelle simple et orthogonalisée suite à un

choc sur novelu à l'instant t = 0 . . . . . . . . . . . . . . . . . . . . . . . 11241 Fonction de réponse impulsionnelle simple et orthogonalisée suite à un

choc sur pandemicu à l'instant t = 0 . . . . . . . . . . . . . . . . . . . . 11342 Fonction de réponse impulsionnelle simple et orthogonalisée d'un choc sur

swineu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

M.MASSIAS ISUP 2010 13

Page 12: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents
Page 13: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

INTRODUCTION

Les progrès scientiques et technologiques, tels que les nanotechnologies, ou encore lesproblèmes environnementaux, comme le réchauement climatique, ont causé l'apparitionde nouveaux risques, amenant les assureurs à reconsidérer en permanence leur exposition.

Ces risques, caractérisés par leur constante évolution, sont diciles à quantier, enterme de fréquence et de coût, du fait de la pauvreté de données statistiques.

Ils sont d'autant plus dangereux qu'ils peuvent avoir des conséquences à la fois surle passif et l'actif de l'assureur, entrainant des pertes non négligeables. Le secteur del'assurance a dû, en eet, faire face au cours de ces dernières années aux conséquencesnancières de plusieurs risques émergents, tel l'amiante, dont les charges restantes liéesaux sinistres aux USA sont estimées à 75 milliards de dollars.

Les risk managers sont, par conséquent, appelés à appréhender les risques émergentsau mieux, en les identiant et en les surveillant, an de limiter leur impact.Le groupe AXA a très rapidement accordé de l'importance aux risques émergents et anotamment mis en place des outils de suivi quantitatifs et qualitatifs. La direction desrisques émergents surveille les risques au quotidien grâce à ces outils, qui disposent désor-mais d'un historique de plus d'un an de données. Malgré tout, cet historique n'a encorejamais été exploité pour des études.

L'objectif de ce mémoire est d'évaluer comment les risques agissent et interagissent,en exploitant les données passées. Notamment nous aimerions répondre aux questionssuivantes : l'évolution d'un risque est-elle prévisible ? Pouvons-nous évaluer la probabi-lité d'évolution d'un risque sur une période donnée ? La progression d'un risque a-t-elledes répercussions sur l'évolution des autres risques ?

Cette étude vise à améliorer la connaissance qu'a le groupe AXA des risques émer-gents, dans le but d'anticiper au mieux leur comportement et leurs conséquences.

Dans la première partie, nous présentons les risques émergents, le proces-

sus de contrôle au sein d'AXA et leur impact pour l'assureur.

Page 14: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

TABLE DES FIGURES

Nous donnons une dénition des risques émergents et citons leurs principales carac-téristiques. Nous expliquons le processus de contrôle des risques en général et des risquesémergents, et particulièrement au sein du groupe AXA. Enn, nous détaillons les im-pacts des risques émergents à la fois sur le passif et sur l'actif de l'assureur an de biencomprendre l'enjeu d'un suivi.

Dans une seconde partie nous présentons notre étude, en particulier l'éla-

boration d'un indicateur d'évolution, une méthode d'anticipation des progres-

sions des risques émergents et l'analyse des interactions au sein d'une fa-

mille.

Nous présentons le fonctionnement de l'outil quantitatif de suivi, appelé Heimdall,qui va mesurer le bruit d'une liste de risques préalablement établie, sur internet. Nousprésentons également les diérentes données fournies par ce logiciel.Heimdall sert depuis sa création à surveiller les risques au jour le jour au sein d'AXA.Toutefois il s'est avéré que les données utilisées jusque-là pour ce suivi quotidien n'étaientpas adéquates et qu'il était nécessaire d'établir dans un premier temps un indicateur deprogression des risques. Cette partie nous a tout d'abord amené à eectuer un traitementdes données et à étudier comment considérer les diérents moteurs de recherche utilisés.Pour tester les indicateurs, nous avons dû mettre en place un algorithme de détectionde pics, an de déterminer pour chaque indicateur quels sont les risques en progressiondétectés. Puis nous avons vérié si ces risques avaient réellement évolué par la recherched'articles internet, an de déterminer quel serait le meilleur indicateur.L'indicateur enn créé permet le suivi des risques au quotidien, mais ce que nous souhai-tons avant tout, est de pouvoir anticiper ces progressions. Pour cela, nous avons modéliséles risques un à un, an de prédire à partir du passé l'évolution future des risques. Nousavons eectué des simulations an de générer diérents scénarios d'évolution de chaquerisque. A partir de ces scénarios nous avons pu estimer la probabilité de progression d'unrisque sur une période donnée.Après avoir établi cette méthode d'anticipation, nous avons cherché à déterminer si l'évo-lution d'un risque avait des conséquences sur les autres risques d'une même famille. Pourcela nous n'avons plus modélisé les risques un à un, mais modélisé cette fois-ci la famillede risques.

M.MASSIAS ISUP 2010 16

Page 15: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

Première partie

Introduction : dénitions et

présentation des risques émergents

Page 16: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents
Page 17: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 1

PRÉSENTATION DES RISQUES ÉMERGENTS

1.1 Dénition des risques émergents

L'industrie de l'assurance utilise couramment la dénition suivante des risques émer-gents :

"ce sont des risques nouveaux, ou en cours de développement, ou des risques déjà exis-tants, mais pouvant entraîner des pertes potentielles dicilement quantiables en termesde fréquence et de sévérité."

La notion de risques émergents est donc utilisée pour désigner des risques variés :

Cela peut désigner des risques nouveaux liés aux nouvelles technologies.L'essor des nouvelles technologies peut, en eet, entrainer de nouveaux risques,c'est le cas par exemple des nanotechnologies. Ces nouveaux risques sont souventdiciles à identier, parfois même inconnus ;

Les risques émergents peuvent aussi être des risques nouveaux apparus suiteà des changements de comportements sociaux. Puisque les comportementschangent, l'assureur doit prendre en compte que les risques évoluent avec ces com-portements et que cela peut causer de nouveaux dangers. Nous ne sommes pasencore certains que l'utilisation fréquente des téléphones portables et les ondesqu'ils produisent sont sans danger pour l'organisme humain. La création d'inter-net a quant à elle amener l'apparition de nouveaux risques telle la cybercriminalité ;

Les risques émergents sont parfois aussi des risques déjà existants, mais pouvantdevenir menaçants par suite de changement de perception ou de jurispru-dence, nous citerons l'exemple de l'amiante ou de la perte de biodiversité ;

Page 18: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 1. PRÉSENTATION DES RISQUES ÉMERGENTS

Les risques émergents peuvent aussi désigner des risques existants, qui sontdangereux à long terme. Nous prendrons l'exemple de l'obésité, qui est en nettecroissance depuis plusieurs années. Si cette croissance continue, cela entrainera unehausse des dépenses de santé dans plusieurs années, qui ne sera pas sans consé-quence pour les assureurs.

1.2 Caractéristiques des risques émergents

1.2.1 Incertitude et fort potentiel catastrophique

Les risques émergents sont principalement caractérisés par leur haut degréd'incertitude, et leur potentiel d'accumulation catastrophique. En eet, imagi-nons l'exemple suivant : un produit alimentaire mondialement vendu est soudainementidentié comme cancérigène. En raison de la mondialisation des échanges, le rejet d'unproduit sur l'ensemble du globe porte en soi un potentiel d'accumulation catastrophiquenon négligeable ; il en résulterait un choc qui pourrait être comparé au passage d'une tem-pête. La même branche d'activités pourrait être touchée sur plusieurs entités du mêmegroupe, tout comme une tempête frapperait plusieurs pays et aurait des conséquencessur plusieurs entités.

Figure 1.1 Comparaison de l'impact d'une tempête et des risques émergents

Nous voyons immédiatement apparaître le dilemme de stratégie suivant : dans les faits,nous constatons qu'en phase d'émergence, lorsque l'identication du risque estfaible, la possibilité d'action est forte mais l'incertitude est grande, alors que,plus nous avançons dans la connaissance du risque, plus la possibilité d'actionse réduit (dramatiquement pour l'amiante). Ceci est illustré par le schéma 1.2.

M.MASSIAS ISUP 2010 20

Page 19: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 1. PRÉSENTATION DES RISQUES ÉMERGENTS

Figure 1.2 Évolution du potentiel d'action en fonction de l'avancée du risque

1.2.2 Importance de l'horizon temporel

Les risques connus "classiques" se limitent généralement au court terme, que l'on peutévaluer à 6 mois voire un an. Les risques émergents, ont quant à eux des impactsà durée plus longue. Par exemple les conséquences de l'amiante ou les eets causés parl'accroissement de la durée de la vie peuvent se faire ressentir pendant 30 ans, voire 50 ans.

Il convient donc de distinguer :• Les risques à long terme, (amiante, nanotechnologies. . . ), pouvant s'étaler surdes dizaines d'années ;• Les risques à court terme tels les pandémies ou le terrorisme.

M.MASSIAS ISUP 2010 21

Page 20: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 1. PRÉSENTATION DES RISQUES ÉMERGENTS

Figure 1.3 Horizon temporel des risques connus et des risques émergents

M.MASSIAS ISUP 2010 22

Page 21: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 2

MAÎTRISE DES RISQUES ÉMERGENTS

2.1 Généralités sur la maîtrise des risques

Au sein des entreprises, c'est la Direction des risques qui s'assure que les risquesauxquels l'entreprise doit ou devra faire face sont correctement identiés à la source,anticipés, mesurés puis gérés dynamiquement.

Généralement, cette direction ne gère pas directement les risques elle-même : elle ga-rantit que les échelons opérationnels de l'entreprise, ceux qui sont en contact quotidienavec les risques, en ont bien connaissance et qu'ils possèdent les outils (éventuellementfournis par la Direction des risques) pour les gérer.

La Direction des risques établit en quelque sorte la deuxième ligne de défense en amont desopérations, en rééchissant, non seulement aux développements indésirables des risquesconnus, mais également aux évolutions de nouveaux risques dont les conséquences po-tentielles sont encore peu ou dicilement quantiables.

2.2 Processus de contrôle des risques émergents

Le processus de contrôle des risques émergents est identique à celui des risques classiques mais avec quelques particularités, il s'agit :

D'identier les risques. On parle davantage de détection pour les risques émer-gents ;

De les mesurer. Pour les risques émergents, on va plus travailler par scénarioque par modélisation du fait du manque de données statistiques ables disponibles ;

De les gérer. On va utiliser davantage la mutualisation avec d'autres risques et laprévention, en l'absence de techniques éprouvées de transfert des risques émergents.

Page 22: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 2. MAÎTRISE DES RISQUES ÉMERGENTS

Paradoxalement, comme on ne peut rechercher que ce que l'on a désigné, la détectionet le suivi des évolutions des risques émergents nécessite de les avoir au préalable nom-mément identiés ! Il faut donc comparer les facteurs de risques (secteur industriel ounancier, tendances de marché, environnement socio-économique. . . ) qui peuvent avoirun impact sur l'entreprise avec la poursuite de ses objectifs stratégiques, ce qui permetd'établir une première liste de risques (cette démarche se fait généralement à dire d'ex-pert).

Une fois cette liste de risques établie, il est nécessaire d'aecter un niveau de prioritéà chaque risque ; ce niveau sera fonction de l'appétence au risque de l'entreprise (ou desa tolérance au risque) tel que déni par la direction générale.

Il convient ensuite de tenir à jour cette liste des risques émergents (ainsi que les prioritésaérentes) : cette liste sera donc revue en continu et évoluera dans le temps en fonc-tion des avancées scientiques et technologiques, du degré d'attention que lui portent lesmédias, de l'évolution de la jurisprudence y-compris ce que l'on appelle soft law enterminologie anglo-saxonne, autrement-dit, de l'évolution de la perception du risque parl'ensemble des parties prenantes.

La direction des risques de l'entreprise peut proposer alors à sa directiongénérale, une liste des principaux risques émergents qu'elle a retenus commepertinents. Celle-ci procèdera ensuite aux choix et arbitrages nécessaires pour tenircompte des ressources de l'entreprise ainsi que des diverses compétences nécessaires àl'étude approfondie de ces risques ; il en résulte une liste de risques émergents réduiteaux sujets jugés les plus urgents ou les plus importants que la direction des risques et leséquipes opérationnelles doivent évaluer.

Figure 2.1 Étapes du processus de contrôle des risques émergents

2.3 Les risques émergents au sein du Groupe AXA

Le groupe AXA a très rapidement accordé de l'importance aux risques émergents.Une liste d'environ 150 risques à suivre a été établie à dire d'experts. Ces

M.MASSIAS ISUP 2010 24

Page 23: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 2. MAÎTRISE DES RISQUES ÉMERGENTS

risques ont été regroupés en 30 familles de risques appartenant à 4 secteurs d'origine : Les risques environnementaux : changement climatique, inondation, perte debiodiversité, dangers du mercure, des pesticides, pollution urbain, etc ;

Les risques réglementaires / légaux : fraude comptable, atteinte à la vie privée,risque opérationnel, etc ;

Les risques sociaux : nourriture contaminée, tabac, obésité, dangers des conser-vateurs (paraben. . . ), maladies neurodégénératives,etc ;

Les risques technologiques : champs électromagnétiques, nanotechnologies, mé-téorologies spatiales, cybercriminalité, etc.

Cette liste est mise à jour en fonction des récents développements dans les quatresecteurs identiés ci-dessus ; les réseaux opérationnels participent à la remontée d'infor-mations sur des risques nouveaux, le reste provient de diérentes recherches dans desrevues scientiques ou sur Internet et est utilisé pour capturer une représentation de laperception des risques.

Pour faciliter cette veille, la direction des risques émergents d'AXA a mis au point : Un outil quantitatif, appelé Heimdall, qui mesure le bruit (buzz) du risquesur Internet, suit les tendances et avertit lorsque des seuils d'alerte sont franchis ;

Des outils d'analyse qualitative qui permettent de vérier que les tendances etle franchissement de seuils correspondent bien à l'évolution de risques et non pasà des dysfonctionnements d'Internet.

Un reporting synthétique est ensuite établi pour alerter et diuser les informationsrelatives à ces risques. La création d'un radar, gure 2.2 permet de visualiser les risquesémergents les plus dangereux et leur vitesse de progression.

La mise en place du logiciel de suivi Heimdall constitue une innovation etune avancée considérable pour la surveillance des risques émergents, au seind'AXA.

M.MASSIAS ISUP 2010 25

Page 24: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 2. MAÎTRISE DES RISQUES ÉMERGENTS

Figure 2.2 Exemple de radar crée pour le reporting

M.MASSIAS ISUP 2010 26

Page 25: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 3

ENJEUX DU SUIVI DES RISQUES ÉMERGENTS

Les risques émergents sont doublement dangereux puisqu'ils peuvent avoirdes conséquences à la fois sur l'actif et le passif de l'assureur.

3.1 Impact des risques émergents sur le passif de l'assureur

Les contrats concernés par l'émergence d'un nouveau risque sont principalement descontrats de responsabilité civile. Parmi eux, il y a :

La responsabilité produits : le producteur est responsable en cas de défaut desécurité d'un produit ou d'un service entrainant un dommage à une personne quellequ'elle soit.Prenons l'exemple d'une personne ayant été atteinte de salmonellose après avoiringéré des oeufs. Cette personne peut se retourner contre le fabricant de produitset entrainer un coût pour les assureurs.L'assureur doit donc identier quels risques peut présenter la fabrication du produiten question. Pour cela il peut demander, par exemple, au fabricant de répondre àun questionnaire sur les matériaux utilisés pour créer le produit et le processus defabrication. Cela nécessite qu'il ait une bonne connaissance des risques en général,mais aussi des risques émergents. Après avoir évalué ces risques, l'assureur choisitles risques qu'il souhaite retenir et propose une tarication adaptée à l'exposition.Par exemple, un assureur peut demander un prime d'assurance plus élevée à unfabricant de chaussettes, s'il s'avère que celles-ci contiennent des particules de nanoargent ;

La responsabilité employeur : l'employeur est responsable des dommages cau-sés à ses employés par leur activité professionnelle. Nous pourrons citer commeexemple, les dommages causés par l'amiante. Les employeurs doivent dédommager

Page 26: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 3. ENJEUX DU SUIVI DES RISQUES ÉMERGENTS

les employés ayant présenté des cancers ou étant décédés à cause de leur expositionà l'amiante, lors de leur activité professionnelle.Il convient une nouvelle fois à l'assureur de se renseigner sur les matériaux mani-pulés par les employés et de se tenir constamment informé sur la découverte desmatériaux pouvant être dangereux. Par exemple, nous avons récemment identiéque le bisphenol A utilisé pour la fabrication des biberons pouvaient être dangereux ;

La responsabilité environnementale : une entreprise est responsable de l'im-pact de son activité sur l'environnement. L'assureur doit donc évaluer les dommagesenvironnementaux que pourraient causer l'entreprise et tenir compte des consé-quences nancières que cela pourrait entrainer. Il doit aussi être conscient que cesconséquences pourraient s'aggraver suite à des changements de réglementation.

L'enjeu pour l'assureur n'est dons pas d'exclure systématiquement lesconséquences provoquées par l'apparition potentielle de ces risques émer-gents, mais plutôt de mettre en place un processus et une culture de sélectionde ces risques qui permettront à l'assureur de choisir les risques qu'il souhaiteretenir après les avoir évalués et tarifés en toute connaissance de cause.

3.2 Impact des risques émergents sur l'actif de l'assureur

L'émergence d'un risque n'est pas sans conséquence sur l'actif de l'assureur. Cela peutavoir des conséquences sur :

Le cours des actions du portefeuille : nous pourrons prendre l'exemple del'entreprise Perrier qui, après avoir découvert la présence de benzène dans les bou-teilles vendues en Caroline du Nord, avait été contraint de rappeler 72 millions debouteilles. En plus du coût engendré par le rappel des produits, cet évènement avaitprovoqué une baisse des ventes et une chute du cours de la maison mère de Perrier ;

Les obligations : l'émergence d'un risque peut dégrader les ratings des obligationsaugmentant le risque de spread ;

Les biens immobiliers : par exemple, dans les années 90, la présence d'amiantepouvait inuer sur la valeur nancière intrinsèque d'un actif immobilier.

Une compagnie d'assurance telle AXA a donc tout intérêt à considérersérieusement les conséquences de l'émergence d'un risque. En eet, si unrisque émerge, l'assureur va avoir besoin rapidement de liquidités pour faireface à ses engagements. Pour cela, il va liquider des parts d'actifs. Si le risquea eu un impact sur ces actifs, et qu'ils ont perdu de la valeur, il sera alorscontraint à liquider un plus grand nombre de parts, entrainant des pertespotentiellement considérables.

M.MASSIAS ISUP 2010 28

Page 27: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

Deuxième partie

Analyse de la progression des risques

émergents et leurs interactions

Page 28: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents
Page 29: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 1

DESCRIPTION DES DONNÉES ET PREMIERS TRAITEMENTS

1.1 Présentation du logiciel de suivi

Comme nous l'avons vu précédemment, la direction des risques émergents d'AXA amis en place depuis 2009 un outil quantitatif appelé Heimdall.

Cet outil est un logiciel de veille qui va servir à mesurer le bruit (buzz) d'unrisque sur Internet. Le logiciel va eectuer des requêtes auprès de 3 moteurs de re-cherche, an de mesurer le nombre de résultats référencés sur un risque.Par exemple, comme le montre la gure 1.1, si l'on eectue une recherche sur Google,sur les nanotechnologies, nous obtenons 11 300 000 résultats.

Figure 1.1 Recherche sur Google

En surveillant l'évolution de ce nombre de résultats dans le temps, on peut ainsi me-surer le bruit d'un risque sur internet, et par conséquent son importance. Toutes les deuxheures le logiciel va eectuer ces requêtes pour l'ensemble des risques, sur 3 moteurs derecherche parmi les plus importants du marché. Nous les noterons, moteur A, B et C.

An de mesurer la dangerosité d'un risque, le logiciel va aussi eectuer des requêtespour déterminer le nombre de résultats obtenus en croisant le nom du risque avec unterme de sévérité, parmi les 3 termes suivants : emerging 1, spreading 2 ou catastrophic.

1. émergent

2. se répandant

Page 30: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 1. DESCRIPTION DES DONNÉES ET PREMIERS TRAITEMENTS

De même, an de mesurer le bruit du risque dans le contexte assuranciel, le logicielva aussi croiser le nom du risque avec un terme assuranciel, parmi les 7 termes suivants :class action 3, compensation 4, law suit 5, gross negligence 6, third party liability 7 , liti-gation 8.

Le schéma 1.2 illustre les diérentes combinaisons de recherche possibles.

Figure 1.2 Combinaisons de recherche possibles

Notations : Il est important pour la compréhension de la suite du mémoire que lelecteur intègre bien les notations suivantes :

R représente le nombre de résultats obtenus pour une recherche avec le nomdu risque seul ; RT représente le nombre de résultats obtenus pour une recherche avec le

nom du risque croisé avec les termes assuranciels ; RS représente le nombre de résultats obtenus pour une recherche avec le

nom du risque croisé avec les termes de sévérité ; RTS représente le nombre de résultats obtenus pour une recherche combi-

nant le nom du risque, les termes assuranciels et les termes de sévérité.

1.2 Données disponibles

Le logiciel Heimdall ne nous fournit pas exactement les données présentées ci-dessus.En eet, pour chaque risque nous disposons de l'évolution de :

R+RT : nous ne connaissons pas l'évolution de R, ni de RT mais uniquementde la somme R+RT ;

3. recours collectif

4. dédommagement

5. poursuite judiciaire

6. négligence grave

7. responsabilité civile

8. litige

M.MASSIAS ISUP 2010 32

Page 31: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 1. DESCRIPTION DES DONNÉES ET PREMIERS TRAITEMENTS

RS : le logiciel nous fournit même le détail des résultats obtenus pour chaqueterme de sévérité. Ainsi nous connaissons :• RSe, représentant le nombre de résultats obtenus pour une recherche croi-

sant le nom du risque et emerging ;• RSs, le nombre de résultats obtenus en croisant le nom du risque et sprea-

ding ;• RSc, le nombre de résultats obtenus en croisant le nom du risque et ca-

tastrophic ;RS n'est autre que la somme de RSe, RSs et RSc.

RTS : nous ne connaissons pas le détail de ce nombre de résultats pour les 7termes assuranciels mais nous disposons du détail entre les termes de sévérité :• RTSe, nombre de résultats obtenus en croisant le nom du risque, les termes

assuranciels et emerging ;• RTSs, nombre de résultats obtenus en croisant le nom du risque, les termes

assuranciels et spreading ;• RTSc, nombre de résultats obtenus en croisant le nom du risque, les termes

assuranciels et catastrophic ;RTS est la somme des RTSe, RTSs et RTSc.

L'évolution de ces données est donc connue pour chaque risque, chaque mo-teur et depuis le 1er mars 2009 (pour les risques les plus anciens), à raisond'une observation toutes les 2 heures, soient 12 observations par jour.

Etant donné que le logiciel suit environ 150 risques, notre base de données est de tailleconsidérable. Les données ont été exportées du logiciel Heimdall vers des chiers Excel.Mais, vu l'ampleur de nos données, nous avons décidé d'exporter les chiers Excel entables SAS, pour faciliter la manipulation.

Remarque : Pour une requête, les données fournies par Heimdall représentent lenombre d'articles référencés pour cette recherche, et non pas le nombre de foisque cette recherche a été eectuée sur internet.

1.3 Traitement préalable des données

Après avoir importé les données sous Excel puis SAS, nous disposons pour chaquerisque d'une table regroupant les valeurs R+RT, RSe, RSs, RSc, RTSe, RTSs, RTSc pourchaque moteur et toutes les 2 heures depuis le 1er mars 2009 (pour les risques les plusanciens).Un extrait d'une table est disponible en annexe A, gure 20.

En manipulant les données, nous avons identié plusieurs erreurs dues à un dysfonc-

M.MASSIAS ISUP 2010 33

Page 32: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 1. DESCRIPTION DES DONNÉES ET PREMIERS TRAITEMENTS

tionnement du logiciel Heimdall. Ces erreurs, illustrées en annexe A, sont de plusieurstypes :

Moteur de recherche manquant : pour une date (nous entendrons par date, ladate et l'heure à laquelle la requête a été eectuée), les requêtes n'ont été eectuéesque pour un ou deux moteurs de recherche, mais pas pour les trois, voir gure 21annexe A ;

Sévérité manquante : pour une date, les requêtes n'ont pas été eectuées pourl'ensemble des termes de sévérité, mais que pour emerging par exemple, voir gure22 annexe A ;

Forte chute d'une valeur : entre deux observations, soit en 2 heures, nous ob-servons une chute importante d'une valeur, par exemple une chute de la valeurR+RT de 94% pour le moteur A et de 85% pour le moteur C, voir gure 23 annexeA. Nous supposerons qu'entre deux dates, soit en 2 heures, l'ensemble des valeursR+RT, RSe, RSs, RSc, RTSe, RTSs, RTSc, ne peuvent pas chuter de plus de 5% ;

Valeurs incohérentes : si nous gardons en tête le schéma 1.2 illustrant l'ensembledes combinaisons de requêtes possibles, nous comprenons facilement que les valeursdoivent vériées :• RTSe < RSe < R+RT ;• RTSs < RSs < R+RT ;• RTSc < RSc < R+RT.

ce qui n'est pas toujours le cas, voir gure 24 annexe A.

Si une observation vérie l'une des erreurs citées ci-dessus, elle sera considérée commeerronée et sera supprimée.De plus, nous avons remarqué que si à une date une observation est erronée, les autresobservations de cette date présentent des variations laissant suggérer que ces donnéespeuvent présenter une erreur, même si elles n'ont pas été identiées comme telles.

Il a donc été décidé de supprimer les dates (nous entendons par date, date etheure), n'ayant pas toutes les données disponibles. Ainsi, si une donnée pourune date est manquante, ou si elle a été supprimée car elle ne vériait pas lescontraintes évoquées ci-dessus, alors la date entière est supprimée.

M.MASSIAS ISUP 2010 34

Page 33: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 2

ÉLABORATION D'UN INDICATEUR DE PROGRESSION D'UNRISQUE ÉMERGENT

2.1 Problématique

Nous partons de l'hypothèse que la progression d'un risque émergent et le bruit au-tour de ce risque sur internet sont liés. En eet, si un évènement concernant un risqueen question a lieu, aussi varié soit-il (une étude scientique révélant la dangerosité durisque, une personne exposée au risque ayant présenté des symptômes, des poursuitesjudiciaires, la découverte d'un vaccin. . . ), celui-ci peut créer un eet boule de neige surinternet.Par exemple, un évènement peut d'abord être relaté sur le site d'un journal local. Puis, enfonction de son importance, l'information peut être relayée par des sites à fréquentationplus forte. Un article peut être ainsi diusé via plusieurs sites internet, parfois mêmesur des blogs où des sujets de discussion sont ainsi ouverts. Une information, selon sonampleur peut ainsi rapidement se diuser et créer le bruit ( buzz ), augmentant ainsile nombre de pages référencées concernant le risque.

Dans un premier temps nous cherchons donc à déterminer, à partir des don-nées que nous fournit le logiciel Heimdall concernant le bruit du risque, unindicateur, permettant de mesurer la progression d'un risque émergent.

Remarque : L'augmentation du bruit d'un risque peut être parfois liée à une infor-mation favorable, par exemple la découverte d'un vaccin, ou une étude scientiquerévélant que le risque est en fait bénin. . .

Page 34: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 2. ÉLABORATION D'UN INDICATEUR DE PROGRESSION D'UNRISQUE ÉMERGENT

2.2 Qu'est ce qu'un bon indicateur ?

Un bon indicateur serait un indicateur, qui à partir de la mesure du bruit autour durisque sur internet, reéterait le développement du risque émergent.Ainsi, nous cherchons un indicateur, qui lorsqu'un évènement relatif au risque intervient,présente un pic ou une augmentation signicative, permettant de nous alarmer.Réciproquement, lorsque notre indicateur présente un pic, nous souhaitons que celui-cireète la progression du risque. Ainsi si ce pic révèle réellement un évènement, nousdevons pouvoir déceler ce qui s'est réellement passé en eectuant des recherches sur in-ternet, dans les journaux. . .

Un bon indicateur serait donc un indicateur susamment prudent, permet-tant de déterminer la progression d'un risque émergent lorsqu'un fait seproduit, mais aussi susamment able, an que lorsqu'il présente une forteaugmentation, celle-ci traduise bien la survenance d'un évènement relatif aurisque.

2.3 Périmètre de l'étude

Nous allons tester plusieurs indicateurs sur l'ensemble de nos risques. Nous nousfocaliserons sur l'évolution de nos indicateurs lors des deux derniers mois passés. Au-delà,nous avons remarqué que pour n'importe quel indicateur, il était dicile de justier laprésence de pics. En eet, les pages référencées datant d'au-delà deux mois sont plusrares, et il est donc dicile de déterminer s'il s'est réellement produit un fait, et donc sil'indicateur est pertinent.

2.4 Construction d'un algorithme de détection de pics

Etant donné que nous allons tester plusieurs indicateurs, et cela pour les 150 risquesà chaque fois, il est impossible de visualiser l'ensemble des évolutions pour déterminer lespics. De plus, l'évolution de nos indicateurs ne présente pas toujours des pics comme nousnous l'imaginons communément : évolution stable puis augmentation brute. L'évolutionest en eet parfois la succession de nombreux pics, ou encore à l'image d'un dôme.

Comment caractérisons-nous donc un pic ?

Pour déterminer ce qu'est un pic, nous allons tout d'abord identier les minima etmaxima locaux. Nous considérons qu'un point est un minimum local si la valeur pré-cédant ce point est plus grande ou égale à ce point et la valeur suivante est strictementplus grande.De même nous considérons qu'un point est un maximum local si la valeur précédente estinférieure ou égale à ce point et la valeur suivante est strictement inférieure. Ainsi xt est

M.MASSIAS ISUP 2010 36

Page 35: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 2. ÉLABORATION D'UN INDICATEUR DE PROGRESSION D'UNRISQUE ÉMERGENT

un minimum local sixt−1 ≤ xt et xt > xt+1

Et xt est un maximum local si

xt−1 ≥ xt et xt < xt+1

Nous identions ainsi les minima et maxima locaux. A noter qu'il est impossible d'avoirdeux minima ou maxima locaux à la suite : il y a obligatoirement alternance entre mi-nima et maxima.

Intéressons nous par exemple à l'évolution de RTS pour le risque bisphenol comme lemontre la gure 2.1. Les points bleus et rouges représentent respectivement les pointsminima et maxima locaux selon la dénition ci-dessus.

Figure 2.1 Évolution de RTS pour le risque bisphenol

Les pics , , , , sont des successions de pics et nous voyons qu'il est tout à faitraisonnable de ne considérer qu'il ne s'agit que d'un seul pic, qui aurait crû en plusieurs

M.MASSIAS ISUP 2010 37

Page 36: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 2. ÉLABORATION D'UN INDICATEUR DE PROGRESSION D'UNRISQUE ÉMERGENT

étapes. Pour intégrer la notion qu'un pic peut être en fait la succession de plusieurs pics,nous allons introduire l'hypothèse suivante : un pic (encadré par 2 minima et un maxi-mum) est achevé si le minimum de droite est plus petit ou légèrement plus grand que leminimum précédant le maximum.En clair,

• Si le minimum de droite est inférieur au minium de gauche, nous considéronsque le pic est achevé ;

• Si le minimum de droite est supérieur au minimum de gauche, alors nous consi-dérons que le pic est achevé si le minimum de droite ne dépasse pas un seuil xé à2% 1de la valeur du minimum de gauche.

Les minima n'achevant pas les pics sont supprimés. Par conséquence, entre deux minima,il peut donc y avoir désormais plusieurs maximas locaux. Le maximum de ces maximalocaux sera retenu.Nous obtenons ainsi la liste alternant les minima et maxima naux, qui caractérisent nospics (en rouge et bleu), sur la gure 2.2.

Des pics peuvent ainsi s'étendre longuement. Toutefois, nous nous intéres-serons uniquement à la montée du pic, c'est-à-dire à la valeur entre le maximum etle minimum gauche du pic, et ceci pour deux raisons.En premier lieu, il n'y a que la montée du pic qui nous intéresse, tout simplement parceque ce qui nous préoccupe est une augmentation du bruit et non une diminution. Enoutre, il est facile de justier une augmentation du bruit du risque car de nouveauxarticles apparaissent, souvent après la survenance d'un évènement, tandis que la diminu-tion du bruit est due à la suppression d'articles, souvent trop vieux. Ceci se fait selon lesfréquences de référencement des moteurs de recherche et n'est donc pas forcément lié àl'activité du risque.En second lieu, prenons l'exemple du pic marqué . Celui-ci n'est pas pris en compte caril appartient à la phase de chute du pic retenu. Toutefois, si celui-ci avait eu un maximumplus grand que le maximum précédent marqué en rouge, alors nous aurions considéré lemaximum du pic comme le maximum de notre pic nal, malgré la chute présente entreces deux maxima.Il est donc justié de ne s'intéresser qu'à la montée des pics naux, étant donné que si

1. Le seuil a été xé à 2%, car au delà, le nombre de pics à considérer augmentait de façon signicative

et les pics obtenus n'étaient pas pertinents.

M.MASSIAS ISUP 2010 38

Page 37: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 2. ÉLABORATION D'UN INDICATEUR DE PROGRESSION D'UNRISQUE ÉMERGENT

Figure 2.2 Évolution de RTS pour le risque bisphenol

un pic avait été susamment important dans la chute, il aurait été pris en compte dansla montée.

2.5 Comparaison des moteurs de recherche

2.5.1 Problématique

Comme nous l'avons déjà expliqué, nous disposons des données provenant de 3 mo-teurs de recherche A, B et C. Cependant, lorsque nous comparons ces trois moteurs derecherche pour l'évolution d'une donnée d'un risque, R+RT par exemple, nous remar-quons que les 3 moteurs ont souvent des évolutions totalement diérentes.Regardons par exemple l'évolution de R+RT du 1er mai 2010 au 1er juillet 2010, pourle risque cybermarket, gure 2.3. Nous observons ce même phénomène pour les donnéesRS et RTS et pour l'ensemble des autres risques.

M.MASSIAS ISUP 2010 39

Page 38: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 2. ÉLABORATION D'UN INDICATEUR DE PROGRESSION D'UNRISQUE ÉMERGENT

Figure 2.3 Comparaison de l'évolution de R+RT du risque cybermarket avec les troismoteurs de recherche

Cette constatation soulève un important problème : y a-t-il un moteur derecherche plus able qui est plus dèle à ce qui se passe en réalité ? Doit-onsupprimer un moteur de recherche, voire n'en garder qu'un ? Et dans le cascontraire, comment considérer tous les moteurs ?

Remarque : Il est aussi important de souligner que les moteurs de recherche n'ont pasles mêmes méthodes et fréquences de référencement de pages internet (voir sectionsuivante 2.5.2) et donc, rien que pour cette raison, il est normal que les trois moteursde recherche ne montrent pas la même évolution pour une même donnée.

M.MASSIAS ISUP 2010 40

Page 39: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 2. ÉLABORATION D'UN INDICATEUR DE PROGRESSION D'UNRISQUE ÉMERGENT

2.5.2 Etude du référencement et des dysfonctionnements des moteursde recherche

L'objet de cette partie est d'étudier le référencement des trois moteurs de recherched'une part, et de détecter les périodes de dysfonctionnement de ces moteurs d'autre part.Le but de cette démarche étant d'évaluer si un moteur de recherche est plus performantet quels moteurs nous devons retenir.

Pour chaque donnée disponible (R+RT, RS, et RTS) et pour chacun des moteurs, nousallons analyser l'évolution de l'ensemble des risques. Si nous détectons des périodes oùl'ensemble des risques a la même évolution, alors cela reètera une variation due à undysfonctionnement du moteur de recherche en question et non due à la progression desrisques eux-mêmes. Nous traiterons par la suite comment corriger ces périodes, an dene pas perturber notre étude, pour chacun des moteurs.

Les résultats sont présentés pour la donnée R+RT mais sont similaires pour les don-nées RS et RTS.

Moteur de recherche A

Pour commencer, intéressons nous à l'évolution de R+RT pour le moteur A. Nous avonscomparé l'ensemble des risques entre eux, et avons remarqué plusieurs variations com-munes à tous les risques, reétant des variations dues au moteur de recherche A et nonà la progression des risques eux-mêmes. Le graphique 2.4, où nous n'avons aché que 7risques pour plus de visibilité, illustre ce fait.

Les variations , , sont des variations communes à l'ensemble des risques. Cesvariations peuvent être soient dues à un dysfonctionnement du moteur A, soit à un chan-gement de méthode de référencement, ou d'algorithme de recherche.La période , surprend par sa forte volatilité. En cherchant, sur internet des informationssur les méthodes de référencement du moteur A, nous avons découvert que le moteur Aavait changé sa méthode d'indexation des sites internet vers le 10 juin, ce qui expliquedonc cette variation brutale.

Extrait d'un article paru dans Lemondeinformatique.fr du 10/06/2010 . . . son nouveau système d'indexation, actif depuis cette semaine, délivre désormais desrésultats de recherche prenant en compte les sites mis à jour après quelques secondes. Au-paravant, il n'eectuait la mise à jour de son index que tous les 30 jours, et à l'origine,ne le faisait que tous les quatre mois.

M.MASSIAS ISUP 2010 41

Page 40: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 2. ÉLABORATION D'UN INDICATEUR DE PROGRESSION D'UNRISQUE ÉMERGENT

Figure 2.4 Évolution de R+RT de diérents risques avec le moteur de recherche A

La mise en place de cette nouvelle méthode a très certainement rencontré des di-cultés et il est très probable que la période soit aussi une conséquence de ce change-ment d'indexation. Il est donc nécessaire de supprimer de telles périodes, an de ne pasconfondre les variations propres au risque et les variations dues au moteur de recherche.La gure 2.5 nous montre l'évolution de R+RT après ce traitement eectué.

En supprimant les variations communes à tous les risques, nous remarquons qu'il restecependant des variations communes entre certains risques, comme la montée indiquéepar commune à l'ensemble des risques de la gure sauf à paraben .

M.MASSIAS ISUP 2010 42

Page 41: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 2. ÉLABORATION D'UN INDICATEUR DE PROGRESSION D'UNRISQUE ÉMERGENT

Figure 2.5 Évolution corrigée de R+RT de diérents risques avec le moteur A

Nous pourrions penser que ces risques peuvent être corrélés, or ils sont à chaque foisde nature totalement diérentes et n'ont aucune raison de présenter une augmentationau même instant. Ils s'avèrent toutefois qu'il s'agit de risque de même volumétrie.Il se peut donc qu'il s'agisse, en fait, d'un changement de fonctionnement du moteur A,qui ne concernerait que des risques de même volumétrie. Par exemple, cela pourrait êtreun changement concernant le référencement qui aurait des conséquences uniquement surles risques ayant un grand nombre de résultats mais qui n'aurait aucun impact sur desrisques présentant un nombre de résultats déjà faibles.Nous décidons de ne pas supprimer ces périodes.

Nous identions de même les périodes de variations communes entre risques pour l'évolu-tion de RTS et RS pour le moteur A, mais nous remarquons, que les périodes identiées àsupprimer sont souvent les mêmes pour R+RT, RTS et RS. Ainsi dès que nous identionsun problème sur R+RT, RTS ou RS, nous supprimerons la période à la fois pour R+RT,RTS et RS.

M.MASSIAS ISUP 2010 43

Page 42: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 2. ÉLABORATION D'UN INDICATEUR DE PROGRESSION D'UNRISQUE ÉMERGENT

Moteur de recherche B

Intéressons nous désormais au moteur B et plus particulièrement à l'évolution de R+RTpour les 7 mêmes risques, comme l'illustre la gure 2.6.

Figure 2.6 Évolution de R+RT de diérents risques avec le moteur B

Pour l'ensemble des risques, nous n'avons pas identié de variations communes et depériodes à supprimer. Toutefois, nous avons pu constater que certains risques avaient desévolutions très semblables, comme c'est le cas de food contamination 2 et pesticides, sur legraphique 2.6. Bien qu'il se peut que ces deux risques soient corrélés, nous avons remar-qué que ce phénomène avait aussi lieu pour plusieurs autres risques qui n'ont vraimentaucun lien entre eux. Par exemple, il existe des ressemblances entre tobacco 3, terrorism,

2. contaminations alimentaires

3. tabac

M.MASSIAS ISUP 2010 44

Page 43: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 2. ÉLABORATION D'UN INDICATEUR DE PROGRESSION D'UNRISQUE ÉMERGENT

environmental pollutant 4, nuclearwaste 5, solarwind 6. Toutefois il s'avère que ces risquesprésentaient un point commun : ils avaient des nombres de résultats de même ordre degrandeur. Ainsi, un lissage sera donc nécessaire (voir section 2.5.3), pour éliminer le bruitprovenant du moteur B, an d'éliminer ces similitudes, qui n'ont pas lieu d'être.Nous constatons ce même fait en observant RTS et RS.

Moteur de recherche C

Intéressons nous désormais à l'évolution de R+RT pour le moteur C, gure 2.7.

Figure 2.7 Évolution de R+RT de diérents risques avec le moteur C

Nous n'avons pas distingué de périodes avec des variations communes à tous les

4. polluants environnementaux

5. déchets nucléaires

6. vents solaires

M.MASSIAS ISUP 2010 45

Page 44: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 2. ÉLABORATION D'UN INDICATEUR DE PROGRESSION D'UNRISQUE ÉMERGENT

risques. Toutefois, il apparait des périodes de fortes chutes révélant certainement unproblème de fonctionnement du moteur C. Néanmoins, ces problèmes sont ponctuels :la chute dure rarement plus de 2 heures (une observation). Pour corriger ce problème,nous supprimerons toutes les observations ayant chuté de plus de 5% en l'espace de deuxheures et appliquerons un lissage an de lisser les variations plus petites (inférieures à5%), voir section 2.5.3.Nous observons ce même phénomène pour l'évolution de RS et RTS, nous appliqueronsdonc la même démarche.

Les graphiques de chacun des moteurs nous ont montré que le moteur de rechercheA fournissait des données plus volatiles que le moteur B, lui-même plus volatile que lemoteur C. Pour s'en convaincre, nous avons calculé l'écart-type de l'évolution de R+RTpour le risque paraben, gure 2.8.

Figure 2.8 Comparaison de la volatilité de l'évolution de R+RT du risque parabenpar moteur de recherche, en nombre de pages

Le moteur A présente donc des données beaucoup plus volatiles.

En résumé :• Moteur A : Le moteur A présente un référencement très fréquent qui allaitde la journée à un mois, et qui est désormais de l'ordre de la seconde aujourd'hui.Il présente l'avantage de réagir vite, mais présente par conséquent de nombreuxpics, pas toujours signicatifs. Le moteur A, voulant toujours être performant,change souvent d'algorithme de recherche ou de méthode de référencement,entrainant ainsi de nombreuses périodes de forte volatilité, que nous sommescontraints de supprimer ;• Moteur B : Le moteur B présente un référencement assez fréquent, bien quemoins fréquent que le moteur A. Toutefois, nous avons remarqué des évolutionssemblables entre des risques de même volumétrie n'ayant aucun lien ;• Moteur C : Le moteur C présente une période de référencement trèsfaible, d'où les faibles variations sur les graphiques. Il présente l'inconvénientd'être plus lent à réagir, mais les pics qu'ils présentent sont par conséquent plussignicatifs. Il présente parfois des problèmes entrainant des chutes brutales ;

Il n'y a donc pas de moteur de recherche à privilégier et nous verronscomment les prendre en compte à la section 2.6.2.

M.MASSIAS ISUP 2010 46

Page 45: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 2. ÉLABORATION D'UN INDICATEUR DE PROGRESSION D'UNRISQUE ÉMERGENT

2.5.3 Lissage des données

De petites variations ne sont pas signicatives et sont souvent dues à des problèmesde moteurs. Il est donc nécessaire de les supprimer en appliquant un lissage par moyennemobile.

Quel ordre de lissage doit-on choisir ?Nous devons choisir un ordre de lissage qui éliminera les petites variationsmais qui n'aplatira pas trop les grandes variations qui nous intéressent.

Regardons de plus près l'évolution de R+ RT pour le moteur A pour le risque cyber-market, après le traitement expliqué à la section précédente, gure 2.9.

Figure 2.9 Diérents lissages pour l'évolution de R+RT de cybermarket avec le moteurA

M.MASSIAS ISUP 2010 47

Page 46: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 2. ÉLABORATION D'UN INDICATEUR DE PROGRESSION D'UNRISQUE ÉMERGENT

Comme nous recherchons dans un premier temps à déterminer un indicateur ecace,nous allons identier les dates auxquelles se sont produits les pics, an de chercher si unévènement s'est produit à cette date. Plus l'ordre de lissage sera grand, plus le pic seraétalé et moins les dates seront précises. C'est pourquoi nous décidons pour le moment dechoisir un ordre de lissage d'ordre 12, soit un lissage à la journée. Ce lissage ne permetpas d'éliminer entièrement le bruit dû aux moteurs de recherche, mais ils conservent lespics qui nous intéressent.Les lissages d'ordre 24 (sur 2 jours), et d'ordre 84 (à la semaine) sont moins précis.

Bien qu'il n'enlève pas entièrement le bruit dû aux moteurs de recherche, nouschoisissons d'utiliser un lissage d'ordre 12, soit à la journée, car il conserveles pics, ce qui nous intéresse pour le moment. Nous verrons par la suite, quelorsque nous étudierons l'anticipation et l'interaction entre les risques, nouspréférerons choisir une autre méthode de lissage.

2.6 Élaboration de l'indicateur

Nos données ont été nettoyées au préalable pour éliminer les problèmes de fonctionne-ment d'Heimdall, puis traitées par des suppressions et lissage de données an d'éliminerles dysfonctionnements des moteurs de recherche. Nous cherchons désormais à mettre enplace un indicateur répondant à nos attentes, qui comme nous l'avons dit, sont : l'in-dicateur doit être susamment prudent (il doit présenter une augmentation lorsqu'unévènement concernant un risque se produit), mais il doit être aussi susamment able(les augmentations doivent bel et bien correspondre à un évènement produit).

Nous allons procéder de la manière suivante : nous allons tester un nombre susantd'indicateurs. Pour chaque indicateur, l'algorithme de détection de pics, mis en placeprécédemment va pouvoir identier les risques présentant les augmentations les plus im-portantes, ainsi que les dates auxquelles se sont produites ces augmentations. Grâce àces dates, nous allons pouvoir rechercher sur internet si un évènement s'est réellementproduit et pouvoir ainsi justier cette augmentation ou non.

Puisque nous testons un large nombre d'indicateurs, nous aurons une bonnereprésentation des risques pour lesquels un évènement est survenu. Nouschoisirons un indicateur qui aura détecté ces évènements et qui aura aussi unpourcentage susamment important, de pics justiés par des articles.

2.6.1 Indicateurs testés

Nous rappelons qu'Heimdall fournit les données suivantes : R+RT, RSe, RSs, RSc,RTSe, RTSs, RTSc. Théoriquement, R désigne tous les articles concernant le risque en

M.MASSIAS ISUP 2010 48

Page 47: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 2. ÉLABORATION D'UN INDICATEUR DE PROGRESSION D'UNRISQUE ÉMERGENT

général. Ainsi, pour des sujets assez vastes, tels nanoparticles 7, les résultats référencésne concernent pas forcément la notion de risque en lui-même. En eet, si nous recher-chons, par exemple, nanoparticles dans le moteur A, les résultats obtenus renvoient versdes sites expliquant ce que sont les nanoparticules et ne font pas forcément référence auxnanoparticules en tant que risque.

Ainsi en couplant nanoparticles avec catastrophic par exemple, nous ciblons plus la no-tion de danger. Théoriquement les requêtes faisant intervenir les termes de sévérité Sdevraient renvoyer à une notion de dangerosité. Mais cela reste une fois de plus théo-rique car par exemple si nous cherchons nanoparticles et emerging , nous remarquonsque parmi les résultats obtenus le mot emerging ne concerne pas spécialement le risquenon plus : parmi les résultats il y avait par exemple un article intitulé Emerging use ofnanoparticles . Ou encore, il est courant, lorsque nous recherchons tobacco et emerging,d'obtenir des pages parlant de emerging markets.

Enn les requêtes faisant intervenir les termes assuranciels T, devraient théoriquementrenvoyer à des articles renseignant sur l'impact du risque sur les assurances. Cette notionest très importante pour savoir dans quelle mesure le risque peut être un danger pourles assurances. Toutefois, nous avons remarqué que si l'on faisait une recherche avec 2mots (le nom du risque et un terme assuranciel par exemple), nous pouvions remettre enquestion la pertinence des résultats obtenus. En eet parfois ces deux mots sont eecti-vement bien dans la même page Web, mais très éloignés l'un de l'autre et n'ayant doncparfois aucun rapport.

Nous allons tout d'abord tester les indicateurs R+RT, RS (où RS = RSe +RSs + RSc) et RTS (où RTS = RTSe + RTSs + RTSc) et RS+RTS. Ces indi-cateurs correspondent théoriquement à ce que nous cherchons mesurer, maiscomme nous venons de le montrer, il existe une diérence importante entrela théorie et la pratique. Il est donc nécessaire de tester ces indicateurs poursavoir quel est le plus able.

2.6.2 Étalonnage des moteurs de recherche

Précédemment, nous avons choisi de n'exclure aucun moteur de recherche et nousdevons désormais déterminer comment tous les considérer.La première possibilité est de faire simplement la somme des indicateurs de chaque mo-teur.Par exemple pour R+RT,

(R+RT )Global = (R+RT )MoteurA + (R+RT )MoteurB + (R+RT )MoteurC

Toutefois, nous avons remarqué que pour la plupart des risques, la volumétrie des ré-

7. nanoparticules

M.MASSIAS ISUP 2010 49

Page 48: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 2. ÉLABORATION D'UN INDICATEUR DE PROGRESSION D'UNRISQUE ÉMERGENT

sultats du moteur B était souvent plus importante que celle de A et C. Faire la sommedes 3 indicateurs revient donc à donner plus d'importance au moteur B et à obtenir unindicateur nal proche du moteur B. Comme l'illustre la gure 2.10, pour le risque cyber-market 8, le moteur B a une volumétrie beaucoup plus importante que celle du moteur Aet C, ce qui donne un estimateur global dont l'évolution est proche de celle de l'indicateurdu moteur B. Le graphique de gauche n'est autre que la superposition des graphiques dela gure 2.3 étudiée précédemment.

Figure 2.10 Construction de l'indicateur R+RTGlobal sans pondération

Une pondération est donc nécessaire.

Pour cela nous calculons le poids de chaque moteur à l'instant t :

Poidst,moteurA =(R+RT )t,moteurA

(R+RT )t,moteurA + (R+RT )t,moteurB + (R+RT )t,moteurC

Poidst,moteurB =(R+RT )t,moteurB

(R+RT )t,moteurA + (R+RT )t,moteurB + (R+RT )t,moteurC

Poidst,moteurC =(R+RT )t,moteurC

(R+RT )t,moteurA + (R+RT )t,moteurB + (R+RT )t,moteurC

Puis nous calculons les poids moyens correspondants en faisant la moyenne sur l'ensembledes observations. Enn, par un simple produit en croix, nous déterminons les coecientsde pondération à appliquer pour que les 3 moteurs de recherche aient tous un poidsmoyen de 1

3 .

CoeffmoteurA =1

3× PoidsmoyenmoteurA

8. cyber marché

M.MASSIAS ISUP 2010 50

Page 49: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 2. ÉLABORATION D'UN INDICATEUR DE PROGRESSION D'UNRISQUE ÉMERGENT

CoeffmoteurB =1

3× PoidsmoyenmoteurB

CoeffmoteurC =1

3× PoidsmoyenmoteurC

Et,

(R+RT )Global = CoeffmoteurA × (R+RT )moteurA + CoeffmoteurB × (R+RT )moteurB

+ CoeffmoteurC × (R+RT )moteurC(2.1)

L'indicateur global pondéré reète bien les évolutions des 3 moteurs de recherche avecautant de poids. Comme nous pouvons le voir sur la gure 2.11, cet indicateur reproduitles évolutions du moteur A, ce qui n'était pas le cas avec l'indicateur sans pondération,puisque le moteur de recherche A avait un poids trop faible. Le graphique de gauche estdonc le même que le graphique de gauche de la gure précédente, mais avec une pondé-ration diérente.

Figure 2.11 Construction de l'indicateur R+RTGlobal avec pondération

Étant donné que nous avons le même problème de poids des moteursde recherche pour les autres indicateurs RS et RTS, nous déciderons parla suite d'appliquer la pondération. L'ensemble des indicateurs testés seradonc calculé à partir d'une pondération des indicateurs de chaque moteur derecherche.

M.MASSIAS ISUP 2010 51

Page 50: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 2. ÉLABORATION D'UN INDICATEUR DE PROGRESSION D'UNRISQUE ÉMERGENT

2.6.3 Test des indicateurs

Après avoir calculé les valeurs de R+RTGlobal, RSGlobal, RTSGlobal, par la méthodede pondération expliquée ci-dessus, nous testons ces indicateurs en recensant les risquesayant eu une forte augmentation pour cet indicateur, grâce à l'algorithme de détectionde pics. Ces listes sont illustrées en annexe B. Pour chacun des risques, nous connaissonsla date à laquelle a eu lieu cette augmentation et nous pouvons donc vérier si un évène-ment s'est réellement produit grâce à Internet ou aux outils qualitatifs disponibles chezAXA.

La vérication sera considérée comme : Certaine, si l'article qui justie l'augmentation est pertinent et qu'il coïncide avecles dates de l'augmentation de l'indicateur ;

Incertaine, si un article a été trouvé sur le risque mais que sa date ne coïncide pasavec la date de l'augmentation ou si les articles trouvés ne sont pas pertinents.C'est le cas en particulier des risques présentant déjà une grande littérature ;

Nulle, si aucun article n'a été trouvé pour justier cette augmentation.

Les résultats détaillés en annexe sont résumés par le tableau ci-dessous :

Figure 2.12 Résumé des résultats des tests d'indicateurs

Les résultats nous indiquent que les indicateurs R+RT et RS+RTS semblent de bonsindicateurs. En eet R+RT a un nombre de pics vériés de façon certaine important (23pics), ce qui représente un pourcentage important de l'ensemble des pics identiés 66%.L'indicateur RS+RTS a quant-à-lui détectait moins de pics justiés de façon certaine (17pics), mais cela représente un pourcentage plus important (77 %).De plus, les risques identiés de façon certaine par R+RT et RS+RTS ne sont en partiepas les mêmes. En eet, parmi les 17 risques de RS+RTS et les 23 de R+RT, seuls 3risques sont en communs 9.Toutefois les évènements relatifs aux risques identiés par RS+RTS nous ont semblé pluspertinents car ils avaient tous une notion de dangerosité comparés à ceux de R+RT.

9. BPA, diacetyl, phtalates

M.MASSIAS ISUP 2010 52

Page 51: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 2. ÉLABORATION D'UN INDICATEUR DE PROGRESSION D'UNRISQUE ÉMERGENT

L'indicateur RS+RTS sera retenu. Il vérie les critères d'un bon indicateuret présente l'avantage d'indiquer une notion de dangerosité.De plus, nous avons conrmé la pertinence de cet indicateur en vériant qu'ildétectait bien les diérents évènements identiés depuis la mise en place dulogiciel Heimdall, par le suivi quotidien de la Direction des Risques Emer-gents.

M.MASSIAS ISUP 2010 53

Page 52: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents
Page 53: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 3

ANTICIPATION DE LA PROGRESSION DES RISQUESÉMERGENTS ET ANALYSE DES INTERACTIONS DANS UNE

MÊME FAMILLE

Nous disposons désormais d'un indicateur reétant relativement bien la progressiond'un risque émergent. Nous pouvons désormais suivre le développement des risques aujour le jour et être alarmés lorsqu'une augmentation se produit.Toutefois ce qui nous intéresserait idéalement serait d'anticiper ces augmentations etd'évaluer comment les risques interagissent entre eux suite à une progression d'un risquedonné.

Les pics sont-ils prévisibles ? Pouvons-nous évaluer la probabilité d'évolu-tion d'un risque sur une période donnée ? Si un risque progresse de manièresignicative, est-ce que cela va avoir des répercussions sur d'autres risques, etparticulièrement des risques d'une même famille ? Ces répercussions auront-elles lieu à la hausse ou à la baisse ?L'objectif de ce chapitre est de se focaliser sur l'évolution passée des risquessuivis, particulièrement entre des risques d'une même famille, an d'anticiperla progression rapide d'un risque et ses conséquences.

3.1 Périmètre de l'étude

Comme nous l'avons expliqué, le but de ce chapitre n'est pas le suivi du risque aujour le jour, mais de se focaliser sur l'évolution passée des risques an de mieux com-prendre comment les risques agissent seuls et au sein de leur famille. Les risques neseront donc plus suivis sur 2 mois comme ce fût le cas pour l'élaboration del'indicateur mais sur un an, an de disposer d'un historique susant.L'étude sera limitée à une famille de risques, nous choisirons de la restreindre

Page 54: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 3. ANTICIPATION DE LA PROGRESSION DES RISQUESÉMERGENTS ET ANALYSE DES INTERACTIONS DANS UNE MÊME FAMILLE

à la famille pandemic u . C'est en eet la famille la mieux connue, du fait que nousavons pu suivre sa progression dans l'actualité de l'an dernier. Notre étude sera doncfocalisée du 1er mars 2009 au 1er mars 2010.

Cette famille comprend 6 risques : AH1N1 : nouveau type de grippe issu d'une combinaison de gênes de virus grip-paux de cochon, d'oiseau et d'humain dans une combinaison jamais observée aupa-ravant. Ce type de virus est caractérisé par sa propagation rapide parmi les humainset à travers le monde. AH1N1 signie qu'il s'agit d'un virus de souche A et de typeH1N1 ;

avian u 1 : formes de virus qui infectent les oiseaux sauvages et oiseaux domes-tiques ;

inuenza 2 : maladie infectieuse fréquente et contagieuse touchant les oiseaux etcertains mammifères dont le porc et l'être humain ;

novel u : littéralement grippe nouvelle, faisant surtout référence à l'épidémie quia touché le monde l'an dernier ;

pandemic u : épidémie grippale touchant une part inhabituellement importantede la population et présente sur une large zone géographique ;

swine u 3 : grippe provoquée par un virus grippal infectant les cochons. Les virusgrippaux porcins les plus fréquents sont de type H1N1.

Remarque : L'épidémie de grippe ayant touché le monde entier a connu plusieursnoms. En eet, nous lui avons d'abord attribué le nom de grippe porcine ( swineu), puis après avoir découvert qu'elle ne contenait pas uniquement des gênes devirus de cochon mais aussi d'oiseau et d'humain, ce nom a été abandonné. Elle aaussi été appelé grippe mexicaine, du fait que les premiers cas ont été détectés auMexique. Finalement l'OMS a décrété que le nom attribué serait A-H1N1.En France, nous avons souvent parlé de grippe A. D'ailleurs beaucoup de genspensent à tort que le A désigne Aviaire, et ont donc fait l'amalgame avec la grippeaviaire.Il est donc important de noter que ce que nous cherchons à mettre enavant dans ce chapitre est l'interaction entre les évolutions des dié-rents types de grippe et non de résoudre un problème de sémantique.Toutefois, celui-ci va représenter très probablement un biais dans notreétude, du fait que beaucoup d'individus font l'amalgame entre toutesles diérentes grippes dénies ci-dessus.

1. grippe aviaire

2. grippe

3. grippe porcine

M.MASSIAS ISUP 2010 56

Page 55: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 3. ANTICIPATION DE LA PROGRESSION DES RISQUESÉMERGENTS ET ANALYSE DES INTERACTIONS DANS UNE MÊME FAMILLE

3.2 Lissage des données

Dans le chapitre précédent, nous avions choisi d'appliquer un lissage moyenne mo-bile d'ordre 12. En eet, ce qui nous intéressait était de détecter les pics, et l'ordre 12permettait de conserver les pics, mais éliminait peu le bruit dû aux moteurs de recherche.

Ici puisque nous allons étudier comment le passé d'un risque peut agir sur lerisque lui-même et sur les autres risques, il est important de supprimer toutle bruit dû aux moteurs de recherche an de ne pas introduire de biais. Unlissage de type moyenne mobile ne convient plus. En eet, en dessous d'unlissage d'ordre 360, c'est à dire d'un lissage au mois, les bruits des moteursde recherche persistent. Et un lissage d'ordre 360 est un lissage d'ordre tropélevé car il élimine la plupart des pics, voir gure 3.1Un autre type de lissage s'impose.

Figure 3.1 Comparaison de l'évolution de RS+RTS sans lissage et avec un lissagemoyenne mobile d'ordre 360 pour le risque AH1N1

Par la même dénition expliquée précédemment, (cf. section 2.4 algorithme de détec-tion de pics), nous allons identier l'ensemble des points étant des minima et maximalocaux. A partir de ces points, nous calculons les variations entre les minima et maximaconsécutifs.Nous partons du principe que les variations trop faibles représentent le bruit provoquépar les moteurs de recherche. Ainsi, nous faisons l'hypothèse suivante : nous ne consi-dérons que les minimas et les maximas locaux dont la variation absolue entre les deuxest supérieure à 10%, et an d'éliminer le bruit, nous appliquons un lissage de moyennemobile entre les minima et maxima locaux restants.Cela revient à garder les variations principales et à lisser les variations trop faibles assi-

M.MASSIAS ISUP 2010 57

Page 56: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 3. ANTICIPATION DE LA PROGRESSION DES RISQUESÉMERGENTS ET ANALYSE DES INTERACTIONS DANS UNE MÊME FAMILLE

milées au bruit des moteurs de recherche.L'ordre de lissage choisi entre les minimas et maximas locaux restants est 84, c'est àdire un lissage à la semaine, car il s'agit de l'ordre minimal qui permet de supprimer lesvariations dont nous ne souhaitons pas.

Figure 3.2 Comparaison de l'évolution de RS+RTS sans lissage et avec le lissagespécial pour le risque AH1N1

Ce type de lissage permet donc de garder les points culminants et de lis-ser les variations non importantes comprises entre ces points. Le lissage étantimportant, nous décidons de ne garder plus qu'une observation par jour. Letemps écoulé entre deux observations n'est donc plus 2 heures, mais désor-mais une journée.

Remarque : Il est à noter que le lissage appliqué est un lissage à la semaine maisétant donné que les périodes sur lesquelles nous appliquons le lissage sont parfoisinférieures à la semaine, il peut s'agir d'un lissage d'ordre inférieur.

M.MASSIAS ISUP 2010 58

Page 57: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 3. ANTICIPATION DE LA PROGRESSION DES RISQUESÉMERGENTS ET ANALYSE DES INTERACTIONS DANS UNE MÊME FAMILLE

3.3 Simulations de scénarios d'évolution des risques

Idées et démarche suivie : Nous allons tout d'abord considérer les risques un àun et les modéliser séparément. Pour cela nous utiliserons les processus ARMAqui se basent sur le principe que la valeur d'une variable à l'instant t dépend deses valeurs dans le passé et d'une erreur qui est aléatoire. Ceci est eectué à lasection 3.3.1.Or cette modélisation ne va pas permettre de modéliser la survenance d'un pic.En eet, lorsqu'un pic se produit, il s'agit d'un changement brut indépendammentdes valeurs passées. Ces augmentations brutes vont donc se répercuter dans leserreurs de modèle. Nous nous intéresserons donc par la suite à l'évolution deserreurs du modèle, et calculerons des probabilités an de simuler des trajectoiresd'erreurs, voir section 3.3.2.Enn nous injecterons ces erreurs aux prédictions du modèle ARMA an d'obtenirplusieurs trajectoires d'évolution de l'indicateur, section 3.3.3.A partir de l'ensemble des trajectoires simulées, nous en déduirons les probabilitésd'augmentation du risque, section 3.3.4.

3.3.1 Modélisation ARMA

Des rappels sur les dénitions de séries temporelles, de stationnarité, des modèlesARMA et de la méthode de Box et Jenkins sont disponibles en annexe D.

L'évolution de l'indicateur RS+RTS lissé, pour un risque donné, constitue une sérietemporelle pouvant être noté (Xt, t ∈ T ), où T = [[1, 365]] représente les 365 jours com-pris entre le 1 mars 2009 et le 1 mars 2010.En considérant les six risques que nous étudions, nous disposons donc de six séries tem-porelles, illustrées en annexe C.

Nous allons modéliser chacune de ces séries temporelles par un modèle ARMA. Nousprocéderons de la même manière pour les six risques, en suivant la méthode de Box etJenkins, c'est pourquoi, nous ne détaillerons notre démarche que pour le risque AH1N1.

Notons donc (Xt, t ∈ T ) l'évolution de l'indicateur RS+RTS lissé, pour le risque AH1N1,du 1 mars 2009 au 1 mars 2010. Procédons tout d'abord au test de Dickey Fuller pourdéterminer si la série est stationnaire. En eet, si la série possède une tendance ou unesaisonnalité, alors, les observations ne fourniraient pas les mêmes indications sur la loide X en fonction que la série soit observée à une période ou une autre. Il n'y aurait doncaucun sens de construire un modèle à partir de cette suite d'observations.

Les résultats présentés gure 3.3, indique que la série n'est pas stationnaire. En eet

M.MASSIAS ISUP 2010 59

Page 58: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 3. ANTICIPATION DE LA PROGRESSION DES RISQUESÉMERGENTS ET ANALYSE DES INTERACTIONS DANS UNE MÊME FAMILLE

la p-value de la statistique Tau étant supérieure à 5%, nous rejetons l'hypothèse H0 destationnarité.

Figure 3.3 Test de Dickey Fuller sur la série initiale

Pour rendre la série stationnaire, nous allons diérencier la série, c'est à dire que nousne considérons plus la série (Xt, t ∈ T ) mais (Yt, t ∈ T *) où Yt = ∇Xt = Xt − Xt−1 etT * = [[2, 365]].Cela ne pose en eet aucun problème étant donné que nous pouvons revenir à tout mo-ment à la série initiale par Xt =

∑ti=2 Yi +X1

Le test de Dickey Fuller, appliqué cette fois-ci à la série diérenciée indique ,gure 3.4,que la série est stationnaire. En eet les p-values des statistiques Tau sont inférieures à5%.

Figure 3.4 Test de Dickey Fuller sur la série diérenciée

Examinons désormais, l'autocorrélogramme et l'autocorrélogramme partiel de la sériediérenciée, gure 3.5 et 3.6. En eet ces autocorrélogrammes vont permettre de déter-miner les retards p et q du modèle ARMA(p, q) qui modélisera la série.

Les autocorrélogramme et autocorrélogramme partiel ρ(h) et r(h) ne sont plus si-gnicativement diérents de 0 à partir du rang 2. Ceci nous suggère donc de tester lesmodèles ARMA(p, q) pour p ≤ 2 et q ≤ 2.

M.MASSIAS ISUP 2010 60

Page 59: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 3. ANTICIPATION DE LA PROGRESSION DES RISQUESÉMERGENTS ET ANALYSE DES INTERACTIONS DANS UNE MÊME FAMILLE

Figure 3.5 Autocorrélogramme de la série diérenciée

Figure 3.6 Autocorrélogramme partiel de la série diérenciée

Parmi les modèles testés, nous retenons les modèles ayant tous les coecients signi-catifs, c'est à dire les coecients dont la p-value de la statistique de Student est inférieureà 5%. Parmi ces modèles, il y a par exemple le modèle ARMA(2, 2) (gure 3.7).

M.MASSIAS ISUP 2010 61

Page 60: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 3. ANTICIPATION DE LA PROGRESSION DES RISQUESÉMERGENTS ET ANALYSE DES INTERACTIONS DANS UNE MÊME FAMILLE

Figure 3.7 Estimation par les moindres carrés des paramètres du modèle ARMA(2,2)

Il faut aussi vérier que les résidus estimés du modèle forment bien un bruit blanc.Pour cela nous eectuons le test de Ljung et Box, qui teste si les résidus sont des bruitsblancs. La gure 3.8 illustre les résultats du test pour les résidus du modèle ARMA(2,2).La p-value de la statistique du Chi-2 étant supérieure à 5% nous ne rejetons pas l'hypo-thèse que les résidus du modèle sont des bruits blancs.

Figure 3.8 Test sur les résidus du modèle ARMA(2,2)

Nous retenons donc les modèles dont les coecients sont tous signicatifs, et dontles résidus sont des bruits blancs. Puis, parmi les modèles retenus, nous choisissons celuiayant le plus petit critère AIC.

Le modèle nalement retenu est le modèle ARMA(2,2) dont l'équation est :

∆Xt = 1, 76134×∆Xt−1 − 0, 76134×∆Xt−2 + εt + 1, 08318εt−1 − 0, 34907εt−2

où εt est un bruit blanc centré.

Les coecients du modèle étant estimés, nous pouvons calculer les valeurs de ce mo-dèle pour la période T = [[1, 365]] et calculer la prévision du modèle en n = 365 sur unhorizon n+ 30, comme l'illustre la gure 3.9.

Le modèle ARMA permet uniquement de modéliser des phénomènes sta-tionnaires. Par conséquent, lorsque qu'un changement brut se produit (uneforte chute ou augmentation de la série), le modèle ARMA ne permet pas dedétecter ces phénomènes, entrainant ainsi de fortes erreurs de modèle.

M.MASSIAS ISUP 2010 62

Page 61: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 3. ANTICIPATION DE LA PROGRESSION DES RISQUESÉMERGENTS ET ANALYSE DES INTERACTIONS DANS UNE MÊME FAMILLE

Figure 3.9 Comparaison du modèle et de la série initiale et prévisions

3.3.2 Analyse des résidus et simulations de trajectoires

Puisque lorsqu'une forte augmentation ou une forte chute de la série initiale se pro-duit, cela entraine de fortes valeurs de résidus, il est judicieux d'observer l'évolution deces résidus sur la période T = [[1, 365]].

Nous remarquons bien en comparant les gures 3.9 et 3.10 que les périodes où lesrésidus évoluent fortement coïncident avec les périodes de changement brut de la sérieinitiale.

Les résidus sont donc en majorité des résidus faibles, puis des résidus aux valeurs plusou moins extrêmes qui correspondent à des périodes de changement brutaux de la sérieinitiale. Finalement nous pouvons classer les résidus en fonction de leur valeur.

Nous choisirons 7 classes de valeurs (Ei, 1 ≤ i ≤ 7). E4 sera la classe centrale où lesrésidus sont faibles et donc où la majorité des résidus se situent. E1, E2, et E3, seront les

M.MASSIAS ISUP 2010 63

Page 62: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 3. ANTICIPATION DE LA PROGRESSION DES RISQUESÉMERGENTS ET ANALYSE DES INTERACTIONS DANS UNE MÊME FAMILLE

Figure 3.10 Evolution des résidus estimés du modèle ARMA(2,2)

classes à fortes valeurs négatives, E1 étant la classe la plus extrême. De même E5, E6, etE7, seront les classes à fortes valeurs positives, E7 étant la classe la plus extrême.

Nous regroupons donc les résidus en classes de valeurs (Ei, 1 ≤ i ≤ 7) quipeuvent être assimilées à des états : un état où le modèle correspond relati-vement bien à la série initiale et des états où le modèle dière fortement dela série initiale, notamment lors de la survenance des pics.

Il s'agit désormais de déterminer, à partir des résidus observés sur la période T = [[1, 365]],la probabilité qu'un résidu se situe dans une classe Ei, ∀1 ≤ i ≤ 7. Nous supposerons quecette probabilité est indépendante du temps, c'est à dire que

P (εt ∈ Ei) = P (εs ∈ Ei) ∀(t, s) et ∀1 ≤ i ≤ 7

M.MASSIAS ISUP 2010 64

Page 63: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 3. ANTICIPATION DE LA PROGRESSION DES RISQUESÉMERGENTS ET ANALYSE DES INTERACTIONS DANS UNE MÊME FAMILLE

Il y a donc 7 probabilités à estimer. Pour cela nous pourrions estimer cette probabilitéempiriquement :

P (εt ∈ Ei) =

365∑t=1

1εt∈Ei

Cela revient à supposer que la probabilité qu'un résidu se situe dans la classe Ei, estégale à la fréquence moyenne observée, à laquelle les résidus se situaient dans la classeEi, durant la période T = [[1, 365]].Or cette hypothèse supposerait le fait que la probabilité que la valeur du résidu se situedans la classe Ei ne dépend pas de la valeur des classes précédentes dans lequel le résiduse situait. Cela supposerait donc le fait que les εt soient indépendants.

Nous savons que les résidus ne sont pas corrélés mais cela ne nous renseignentpas sur l'indépendance des résidus. Il faut donc pour cela eectuer un testd'indépendance, comme le test de Wald.

Le test de Wald est un test non paramétrique qui permet de tester si les valeursd'une série ont été générées de façon aléatoire. Le test de Wald teste donc l'hypothèse :

H0 : les valeurs de la série sont indépendantes

H1 : les valeurs de la série sont dépendantes

Le test va se baser sur le principe suivant.Nous appelons un run, une séquence de valeurs située soit en dessous soit au dessus dela moyenne de la série. Puisqu'il s'agit de tester dans notre cas l'indépendance des rési-dus, la moyenne est nulle, dans notre cas. Cela revient donc à regarder les séquences derésidus positifs et négatifs. Par exemple la séquence '++++- - - ++++ - - - - - ++- - -'est constituée de 6 runs, 3 runs postitifs et 3 runs négatifs.Notons Z le nombre de runs, m le nombre de '+' et n le nombre de '-'. Si les valeurs de lasérie sont distribuées de façon indépendantes, Z sera très grand, à l'opposé si les valeursde la série sont indépendantes, Z sera faible, car les valeurs positives seront regroupésensemble et les valeurs négatives aussi.

Si H0 est vraie Z suit une loi normale de moyenne

µ =2mn

(m+ n)+ 1

et de variance

σ2 =2mn(2mn− (m+ n))

(m+ n)2(m+ n− 1)

Z constitue la statistique du test. Si la p-value du test est inférieure à 5% nous rejetonsH0. Comme le montre la gure 3.11, les résidus ne sont pas indépendants.

M.MASSIAS ISUP 2010 65

Page 64: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 3. ANTICIPATION DE LA PROGRESSION DES RISQUESÉMERGENTS ET ANALYSE DES INTERACTIONS DANS UNE MÊME FAMILLE

Figure 3.11 Test de Wald

Les résidus n'étant pas indépendants, la probabilité que la valeur du résiduse situe dans une classe en t dépend donc des classes précédentes.

Toutefois nous supposerons que la prédiction de la valeur de la classe à l'instant t, sinous connaissons la valeur de la classe en t− 1, n'est pas améliorée par la connaissancedes valeurs des classes en t− h pour h > 1. Nous parlons d'absence de mémoire.

P [εt ∈ Ei|ε0, . . . , εt−1] = P [εt ∈ Ei|εt−1]

∀1 ≤ i ≤ 7 et ∀t ≥ 1

Cela revient à supposer que les résidus suivent une chaine de Markov.

En eet, une chaine de Markov à temps discret est une suite aléatoire (Xn, n ≥ 0) àtemps discret, à valeurs dans un espace d'états S ni ou dénombrable et vériant lapropriété de Markov :

P [Xn = i|X0, . . . , Xn − 1] = P [Xn = i|Xn−1]

pour tout i ∈ S et quelque soit n ≥ 1

Nous faisons l'hypothèse que les résidus suivent une chaine de Markov pour deuxraisons.Tout d'abord, il n'est pas nécessaire de tenir compte d'un passé trop lointain. Par exemple,s'il y a eu de faibles ou grosses valeurs une semaine auparavant, il est peu probable quecela est une conséquence sur la valeur d'aujourd'hui.D'autre part, nous choisissons cette hypothèse pour simplier nos calculs qui pourraientêtre vite volumineux si nous considérions les classes avant t − 1. En eet le nombrede probabilités à calculer augmente en fonction du nombre de classes précédentes àconsidérer :

aucune classe précédente considérée : 7 probabilités à calculer

P (εt ∈ Ei), ∀i ∈ [[1, 7]]

une classe précédente considérée : 7*7 probabilités à calculer

P (εt ∈ Ei|εt−1 ∈ Ej),∀(i, j) ∈ [[1, 7]]2

M.MASSIAS ISUP 2010 66

Page 65: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 3. ANTICIPATION DE LA PROGRESSION DES RISQUESÉMERGENTS ET ANALYSE DES INTERACTIONS DANS UNE MÊME FAMILLE

deux classes précédentes considérées : 7*7*7 probabilités à calculer

P (εt ∈ Ei|εt−1 ∈ Ej , εt−2 ∈ Ek),∀(i, j, k) ∈ [[1, 7]]3

etc

De plus, nous ne disposons pas d'un historique susant pour calculer un nombre deprobabilités trop important.

Nous supposerons de plus, que la chaine de Markov est homogène, c'est à dire quesa probabilité de transition d'un espace à un autre ne change pas au cours du temps :

∀n ≥ 0, ∀(i, j) ∈ [[1, 7]]2, P [εn+1 ∈ Ej |εn ∈ Ei] = P [ε1 ∈ Ej |ε0 ∈ Ei]

Le nombre pi,j = P [ε1 ∈ Ej |ε0 ∈ Ei] est appelé probabilité de transition de l'état ià l'état j.

Nous estimerons ces probabilités de manière empirique à partir de notreéchantillon d'observations de période T = [[1, 365]].

pi,j =

∑365t=2 1Xt=j,Xt−1=i∑365

t=2 1Xt−1=i

, ∀(i, j) ∈ [[1, 7]]2

A partir de ces probabilités nous pouvons simuler plusieurs évolutions des résidus, àpartir de l'algorithme suivant :

Étape 1 : Nous identions dans quelle classe j se situe le résidu à l'instant t ; Étape 2 : A partir des probabilités pi,j où j est désormais xé, nous ferons une pre-mière simulation pour déterminer dans quelle classe se situera le résidu à l'instantt+ 1 ;

Étape 3 : Nous ferons une deuxième simulation pour déterminer la valeur queprendra le résidu en t+ 1 au sein de la classe déterminée à l'étape précédente ;

Étape 4 : Nous eectuerons les étapes 1, 2 et 3, 30 fois de façon à obtenir unetrajectoire des résidus simulée sous un horizon de 30 jours.

Nous simulerons ainsi 1000 trajectoires.

Comment simuler dans quelle classe sera le résidu en t+ 1 à partir des pro-babilités pi,j (étape 2) ?

Après avoir déterminé à l'étape 1, dans quelle classe j se situe le résidu à l'instant t,nous disposons des 7 probabilités pi,j (∀1 ≤ i ≤ 7 et où j est xé), que le résidu suivantse situe dans la classe i. Nous devons simuler dans quelle classe sera le résidu à partir deces probabilités.Pour cela nous allons générer un nombre aléatoire entre [0, 1], par une loi uniforme, puisnous allons diviser un intervalle [0, 1] comme illustré gure 3.12.

M.MASSIAS ISUP 2010 67

Page 66: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 3. ANTICIPATION DE LA PROGRESSION DES RISQUESÉMERGENTS ET ANALYSE DES INTERACTIONS DANS UNE MÊME FAMILLE

Figure 3.12 Méthode de simulations

En fonction de l'intervalle dans lequel se situe le nombre simulé, nous obtenons laclasse dans lequel sera le résidu. S'il se situe dans l'intervalle [0, I1] il sera dans la classeE1, dans l'intervalle [I1, I2], il se situera dans la classe E2 et ainsi de suite.

En eet les sous intervalles de [0, 1] constitués, sont de longueur les probabilités pi,j ,∀1 ≤i ≤ 7. Ainsi plus la probabilité est grande, plus l'intervalle correspondant est grand etplus le nombre simulé a de chance d'être compris dans cet intervalle.

Remarque : il se peut qu'une probabilité soit nulle et donc il se peut qu'il existedes entiers k et l tel que Ik = Il et que l'intervalle soit ainsi l'ensemble vide.

Une fois la classe du résidu en t+ 1 déterminée, comment simuler la valeurdu résidu (étape 3) ?

Une fois la classe du résidu en t + 1 déterminée, nous simulerons la valeur du résiduau sein de cette classe par une loi uniforme.

M.MASSIAS ISUP 2010 68

Page 67: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 3. ANTICIPATION DE LA PROGRESSION DES RISQUESÉMERGENTS ET ANALYSE DES INTERACTIONS DANS UNE MÊME FAMILLE

En eet si la classe du résidu en t + 1 est dénie par l'intervalle [a, b], nous simule-rons une loi uniforme U(a, b) an de déterminer la valeur du résidu.

Comment bien choisir les classes ?

Les résultats de nos simulations dépendent essentiellement de la manière dont les classesont été choisies au préalable.

Premièrement, étant donné qu'une fois que nous connaissons la classe dans laquelle serale résidu, nous simulons le résidu de façon uniforme, alors il est essentiel que la répartitionà l'intérieur d'une même classe de notre échantillon de données soit uniforme.

Deuxièmement les classes doivent être choisies de façon à ce que la majorité des pointssoit contenue dans la classe centrale, c'est à dire la classe E4, puis les classes E3 et E5

contiendraient un nombre de points plus faibles, enn les classes E6 et E2 auraient unnombre de points très faibles. Enn les classes E6 et E1 ne contiendraient qu'un inmenombre de points.

L'observation de l'évolution des résidus permet d'avoir une première idée des classesà déterminer. Toutefois il est judicieux d'ordonner les valeurs des résidus par ordre crois-sant, an de mieux calibrer ces classes et de s'assurer que la répartition des résidus ausein des classes est bien uniforme, gure 3.14. Les classes nalement déterminées sontprésentées, gure 3.13.

Figure 3.13 Résumé des classes de résidus déterminées pour avianu

M.MASSIAS ISUP 2010 69

Page 68: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 3. ANTICIPATION DE LA PROGRESSION DES RISQUESÉMERGENTS ET ANALYSE DES INTERACTIONS DANS UNE MÊME FAMILLE

Figure 3.14 Observation de l'évolution et de la répartition des résidus, pour le risqueavianu

3.3.3 Simulations de la série initiale

L'idée générale est d'intégrer les trajectoires de résidus simulées précédemment auxprévisions du modèle ARMA an d'obtenir des trajectoires de prévision du modèle. Nousallons procéder comme suit :

Connaissant l'évolution de notre série initiale Xt,∀t ≤ 365, nous calculons grâceau modèle ARMA la prédiction au sens des moindres carrés X366 de X366 ;

M.MASSIAS ISUP 2010 70

Page 69: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 3. ANTICIPATION DE LA PROGRESSION DES RISQUESÉMERGENTS ET ANALYSE DES INTERACTIONS DANS UNE MÊME FAMILLE

Notons (εit, 366 ≤ t ≤ 395), la trajectoire de la ième simulation des résidus. Nousajoutons un résidu à notre prédiction, ainsi X366 devient X366 + εi366 ;

Nous calculons la prédiction au sens des moindres carrés X367 de X367 et ajoutonsà cette prédiction une erreur : X367 devient X367 + εi367 ;

Nous procédons ainsi de suite an d'obtenir une trajectoire de prévision (Xt, 366 ≤t ≤ 395) obtenue à partir de a ième simulation de résidus.

Nous eectuons ces étapes pour tout 1 ≤ i ≤ 1000, c'est à dire pour les 1000 trajec-toires de résidus simulées précédemment, an d'obtenir 1000 scénarios de l'évolution dela série initiale.

La gure 3.15 représente quelques trajectoires simulées que nous avons obtenus pourle risque AH1N1.

Figure 3.15 Diérentes simulations de l'évolution de RS+RTS pour le risque AH1N1

3.3.4 Probabilités de survenance d'un choc et backtesting

L'ensemble des trajectoires simulées est une bonne représentation des diérents scé-narios de l'évolution future de l'indicateur. Ce qui nous intéresse particulièrement, est de

M.MASSIAS ISUP 2010 71

Page 70: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 3. ANTICIPATION DE LA PROGRESSION DES RISQUESÉMERGENTS ET ANALYSE DES INTERACTIONS DANS UNE MÊME FAMILLE

déterminer, à partir de l'ensemble des scénarios, la probabilité d'avoir une augmentationbrute de cette évolution.

Pour cela, pour chaque trajectoire simulée obtenue, nous appliquons l'algorithme dedétection de pics construit à la section 2.4, an de déterminer l'augmentation maximalede la simulation. Nous noterons Zi l'augmentation maximale de la ième simulation.A partir de ces informations, nous pouvons estimer la probabilité que l'évolution futurede l'indicateur présente une augmentation maximale inférieure à x% :

F (x) =1

1000

1000∑i=1

1Zi≤x

Nous calculons ainsi pour chacun des six risques de la famille pandemic u, la fonctionde répartition F (x). La gure 3.16 illustre ces six fonctions de répartition.

Ces résultats nous permettent non seulement d'avoir une idée de la probabilité d'avoirun choc pour un risque donné, mais surtout de pouvoir comparer les risques entre eux etde déterminer quels sont les risques les plus dangereux. En eet, si nous comparons lesfonctions de répartition de la famille pandemicu, nous remarquons par exemple que lafonction du risque swineu tend plus rapidement vers 1 que celle du risque AH1N1. Parconséquent il est plus probable que l'évolution du risque AH1N1 présente une augmen-tation brute comparé au risque swineu.

Figure 3.16 Fonctions de répartition

M.MASSIAS ISUP 2010 72

Page 71: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 3. ANTICIPATION DE LA PROGRESSION DES RISQUESÉMERGENTS ET ANALYSE DES INTERACTIONS DANS UNE MÊME FAMILLE

Ces fonctions de répartition ont été estimées à partir d'un an de données (du 1ermars 2009 au 1er mars 2010) et ont été établies à partir de simulations eectuées sur unhorizon d'un mois (jusqu'au 1er avril 2010). Nous connaissons donc l'évolution réelle quis'est produite jusqu'au 1er avril 2010 et nous pouvons la comparer avec nos prévisions,gure 3.17.

Figure 3.17 Backtesting

Les pics réellement constatés sont en adéquation avec les résultats obtenus.Par exemple, le graphique 3.16 montre que nous avions estimé une probabilité nulle que lesrisques swineu et pandemicu aient une augmentation supérieure à 5%. Le tableau3.17indique qu'il a été réellement constaté une augmentation faible pour pandemicu (0,62%)et aucune augmentation pour swineu.A contrario, la probabilité d'observer une augmentation forte pour le risque AH1N1 étaitnon nulle : nous avions estimé une probabilité d'environ 50% d'observer une augmentationde plus de 20% et une probabilité de 30% d'observer une augmentation de plus de 30%.Le pic réellement constaté est en eet considérable : 36,73%.

3.3.5 Conclusions : avantages et limites de la méthode

Cette méthode présente l'intérêt principal de fournir diérents scénarios possiblesd'évolution future des risques. Elle permet d'estimer la probabilité qu'un risque progresseet de pouvoir :

Comparer les risques entre eux. La méthode permet d'estimer quels sont les risquesles plus sujets à évoluer, donc les plus dangereux ;

Comparer chaque risque au cours du temps. En eet si l'on réitère cette méthodeaprès un certain temps écoulé, nous pouvons comparer comment les probabilitésde progression d'un risque ont évolué et évaluer ainsi si un risque devient de plusen plus dangereux.

Le backtesting de la méthode présente des résultats satisfaisants pour la famille pan-demic u. Toutefois cette méthode présente des limites :

La méthode nécessite un historique de données important ; La qualité de la méthode dépend beaucoup des valeurs des classes de résidus choi-sies. Il est donc important de ne pas négliger cette étape ;

M.MASSIAS ISUP 2010 73

Page 72: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 3. ANTICIPATION DE LA PROGRESSION DES RISQUESÉMERGENTS ET ANALYSE DES INTERACTIONS DANS UNE MÊME FAMILLE

La méthode est longue à implémenter et ne peut pas être utilisée de façon régulièrecomme dans le cadre d'un reporting ou pour une famille de risques trop grande.

3.4 Analyse de l'interaction dans une famille de risques

La section précédente nous a permis de calculer pour chaque risque la probabilité desurvenance d'un pic, la question à laquelle nous pouvons maintenant nous intéresser estla suivante : si une augmentation brute se produit pour un risque donné, estce que cette augmentation va engendrer des répercussions sur l'ensemble desautres risques de la même famille ?

Nous devons donc évaluer comment les risques interagissent entre eux, ce qui nous em-mène non plus à considérer une modélisation par risque, mais une modélisation par famillede risques cette fois-ci. Nous n'allons donc plus prendre en compte une modélisation àdimension 1 mais nous allons introduire la notion de modélisation multidimensionnelleavec la modélisation VAR.

3.4.1 Modélisation VAR

La dénition générale d'un processus VAR(p) est la suivante :Un processus vectoriel Xt, t ∈ Z, de dimension (n, 1), admet une représentation VARd'ordre p, notée V AR(p) si :

Xt = A0 −A1Xt−1 −A2Xt−2 − . . .−ApXt−p + εt

avec Xt =

X1t

X2t...Xnt

Ai =

a11i a21i . . . an1ia12i a22i . . . an2i...

......

a1ni a2ni . . . anni

et εt =

ε1tε2t...εnt

Il s'agit donc du même principe que la modélisation AR(p), mise à part le fait que Xt

ne désigne plus une série mais un vecteur de série. La matrice Σ = E(εtε′t) de dimension

(n, n) est la matrice de variance covariance des erreurs. Cette matrice est inconnue.

En appliquant cette modélisation sur nos 6 séries temporelles, cela nous permettraitde savoir comment les risques interagissent entre eux. Or, les paramètres du processusVAR ne peuvent être estimés que sur des séries stationnaires. Ainsi, étant donné qu'au-cune des 6 séries en question n'est stationnaire, il faut les diérencier, tout comme nousavions procédé lors de la modélisation ARMA.

M.MASSIAS ISUP 2010 74

Page 73: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 3. ANTICIPATION DE LA PROGRESSION DES RISQUESÉMERGENTS ET ANALYSE DES INTERACTIONS DANS UNE MÊME FAMILLE

C'est à dire que nous allons appliquer la modélisation à :

Xt =

∆(AH1N1)t∆(avianflu)t∆(influenza)t∆(novelflu)t

∆(pandemicflu)t∆(swineflu)t

En déterminant le retard p, et les paramètres A0, A1, . . . , Ap nous saurons comment lesrisques agissent entre eux et à quels retards.

3.4.2 Détermination du retard maximal p

Tout comme nous déterminons en dimension 1 le rang p d'un AR(p), grâce à lafonction d'autocorrélation partielle, nous déterminons en multidimensionnel le rang pd'un V AR(p), par la matrice d'autocorrélation partielle.

Figure 3.18 Détermination du retard p

La gure 3.18 nous amène à opter pour un retard p = 10 puisque la matrice d'auto-corrélation partielle n'est pas signicativement diérente de 0 pour un retard supérieurà 10.

3.4.3 Sélection des paramètres : méthode descendante

Tout comme nous avions procédé à l'estimation des paramètres pour les modèlesARMA, nous allons procéder à l'estimation des paramètres du modèle VAR et ne retenirque les modèles dont tous les coecients seront signicatifs.

Ayant identié à l'étape précédente que le retard maximal est 10, il faut donc estimer : 6*6*10 paramètres correspondant aux paramètres de A1, A2, . . . , Ap ; 6 paramètres correspondant aux paramètres de A0 .

Ce qui fait 366 paramètres à considérer.

Il s'agit donc d'un modèle de taille considérable par rapport à un modèle ARMA etil est par conséquent nécessaire d'établir une démarche pour sélectionner les paramètres

M.MASSIAS ISUP 2010 75

Page 74: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 3. ANTICIPATION DE LA PROGRESSION DES RISQUESÉMERGENTS ET ANALYSE DES INTERACTIONS DANS UNE MÊME FAMILLE

à garder.En eet, lorsque nous supprimons un coecient car il n'est pas signicatif, l'estimationdes paramètres changent et par conséquent leur signication aussi. C'est pourquoi, enfonction de l'ordre de suppression des paramètres, nous pouvons parvenir à plusieursmodèles valables diérents.

Ici, étant donné le nombre de paramètres important, il est trop coûteux d'ex-périmenter plusieurs modèles. Il est donc nécessaire de mettre en place uneméthode de sélection des paramètres, qui permettra d'aboutir à un modèlesatisfaisant.

Nous procéderons à la sélection des paramètres par une méthode descendante :

Étape 1 : Nous estimons une première fois le modèle, avec l'ensemble de sesparamètres ;

Étape 2 : Nous éliminons le paramètre le moins signicatif parmi l'ensemble desparamètres c'est à dire celui ayant la p-value la plus grande ;

Étape 3 : Nous estimons une nouvelle fois le modèle. Si l'ensemble des paramètressont signicatifs, c'est à dire si tous les paramètres ont leur p-value inférieure à 5%alors nous sommes parvenus au modèle souhaité, sinon nous réitérons l'étape 2.

3.4.4 Interprétation des résultats

Le modèle nal obtenu est disponible en annexe E et se lit de la façon suivante :

∆AH1N1t = −0, 27675 × ∆AH1N1t−1 − 0, 25788 × ∆avianflut−2 + 0, 24557 ×∆avianflut−1

∆avianflut = 0, 94453×∆avianflut−1 − 0, 42452×∆avianflut−8 + . . .

+0, 00101×∆swineflut−9

Ce modèle exprime la variation de l'indicateur à l'instant t d'un risque en fonctiondes variations précédentes des autres risques. Il permet une première interprétation desinteractions entre les risques.

Les résultats ont été triés par ordre décroissant en fonction de la valeur absolue del'estimation des paramètres. Ainsi cela permet d'évaluer pour un risque donné, à quel re-tard et pour quel risque, la variation de l'indicateur est la plus importante. Par exemple,une variation en t−1 du risque avianu aura plus d'impact sur le risque avianu, qu'unevariation du risque swineu en t− 9.

Les résultats montrent de plus que les variations des indicateurs des risques peuvent

M.MASSIAS ISUP 2010 76

Page 75: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 3. ANTICIPATION DE LA PROGRESSION DES RISQUESÉMERGENTS ET ANALYSE DES INTERACTIONS DANS UNE MÊME FAMILLE

être exprimés en fonction des variations proches, c'est à dire inférieures à 4 jours. Tou-tefois ceci n'est pas vérié pour le risque swineu qui dépend uniquement des variationsdes autres risques produites plus de 5 jours auparavant.

Ceci révèle que la forte variation d'un risque pourrait avoir des conséquencesrapides (sous 4 jours), sur les variations des autres risques, excepté le risqueswineu qui a tendance à être plus long à réagir.

Enn nous pouvons observer aussi de combien de risques dépend la variation d'un risquedonné à l'instant t. Le modèle VAR indique que :

AH1N1 s'exprime en fonction d'un seul autre risque : avianu ; Avianu s'exprime en fonction de 4 autres risques : AH1N1, inuenza, pandemicu,swineu ;

Inuenza s'exprime en fonction de 4 autres risques : avianu, novelu, pandemicu,swineu ;

Novelu s'exprime en fonction de 3 autres risques : inuenza, pandemicu, swine-u ;

Pandemicu s'exprime en fonction de 4 autres risques : avianu, inuenza, novelu,swineu ;

Swineu s'exprime en fonction de 2 autres risques : inuenza, pandemicu.

Les risques ayant une notion large tels inuenza, novelu, pandemicu,qui désignent littéralement une grippe, une grippe nouvelle et une grippepandémique, s'expriment en fonction de nombreux autres risques de la mêmefamille. A contrario, des grippes particulières telles la grippe porcine (swine-u) ou la grippe AH1N1 s'expriment en fonction de peu d'autres risques.

Pour nir, prenons l'exemple suivant : le modèle VAR indique que le risque AH1N1s'exprime en fonction du risque avianu. Or le risque avianu s'exprime lui-même enfonction de inuenza. Par conséquent le risque AH1N1 s'exprime lui aussi par le risqueinuenza, mais indirectement.

Pour évaluer les conséquences qu'aurait une forte variation du risque inuenza sur lerisque AH1N1, il faut étudier l'analyse des chocs d'un modèle VAR.

3.4.5 Dynamique d'un modèle VAR : analyse des chocs

Les modèles VAR sont souvent analysés au travers de leur dynamique et ce via lasimulation de chocs aléatoires.

M.MASSIAS ISUP 2010 77

Page 76: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 3. ANTICIPATION DE LA PROGRESSION DES RISQUESÉMERGENTS ET ANALYSE DES INTERACTIONS DANS UNE MÊME FAMILLE

Reprenons la représentation générale d'un modèle VAR(p).

Xt = A0 −A1Xt−1 −A2Xt−2 − . . .−ApXt−p + εt

Nous supposons que les innovations εt sont i.i.d, de moyenne le vecteur nul de dimension(1, n), et de matrice variance covariance Σ de dimension (n, n). Nous supposons que lesparamètres Σ et Ai sont inconnus, mais l'analyse peut être menée lorsque l'on ne disposeque d'estimateurs convergents de ces paramètres.

Sous l'hypothèse de stabilité du processus, nous pouvons démontrer que le modèle VARpeut s'exprimer de la façon suivante :

Xt = µ+∞∑i=0

Θiεt−i

Cette forme d'écriture s'appelle la représentation VMA(∞), ou décomposition de Wald.

Quelle est l'idée générale de l'analyse des chocs ?

L'idée générale de l'analyse des chocs (ou fonction de réponse aux innovations) est d'étu-dier l'eet d'un choc d'une composante εit sur le système de variable Xt. Pour cela, onsuppose que Xt = µ pour t < T et qu'en t = T la ième variable de Xt augmente de 1(soit εjt = 0 pour j 6= i et εit = 1). L'idée est alors d'étudier comment réagit le systèmeaux dates t > T si aucun autre choc ne survient.

Supposons pour simplier que Xt est un processus bi-varié, Xt =

(X1t

X2t

). Nous sup-

posons un choc sur la variable X2t . Cela revient à supposer :

ε2,T = 1 ε1,T = 0, ∀t > T

La suite des réalisations de X1T+h est la fonction de réponse de la variable X1 à une

impulsion de la variable X2. C'est une première possibilité de fonctions de réponse.

Or en raison de la corrélation des deux chocs, l'impulsion initiale de ε2T n'est pas sansinuence sur l'innovation de ε1T . Conditionnellement à la réalisation de ε2T , du fait de lacorrélation des deux chocs, la probabilité d'engendrer une innovation ε1T non nulle estelle même non nulle.Il peut donc être intéressant d'envisager d'isoler l'innovation "propre" au processus X2

T ,non "polluée" par la réaction de l'innovation ε1T . C'est pourquoi, il convient, lorsque lamatrice de variance covariance n'est pas égale à la matrice unité d'orthogonaliser lesinnovations.En eet, étant donné qu'une matrice de variance covariance est toujours dénie positive,nous pouvons la décomposer suivant la décomposition de Choleski :

Σ = ADA′

M.MASSIAS ISUP 2010 78

Page 77: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 3. ANTICIPATION DE LA PROGRESSION DES RISQUESÉMERGENTS ET ANALYSE DES INTERACTIONS DANS UNE MÊME FAMILLE

où A est une matrice triangulaire inférieure de dimension (n,n) et où D est une matricediagonale. On pose :

vt = A−1εt

On remarque alors que les innovations vt sont des combinaisons linéaires des innovationsdu modèle initial εt, qui possèdent une propriété d'indépendance puisque :

E(vtv′t) = A−1E(εtε

′t)(A

−1)′ = A−1Σ(A−1)′ = A−1ADA′(A−1)′ = D

Donc la matrice de variance covariance des innovations vt est diagonale, ce qui prouve queces innovations ne sont pas corrélées. Dès lors, de la même façon on construit la séquencedes X1

T+h obtenus conditionnellement à un choc unitaire sur la composante orthogonalev2T . Cela revient à supposer :

v2T = 1 v2t = 0, ∀t > T

3.4.6 Interprétation des résultats

Les résultats sont présentés en annexe F. Le modèle nous indique les résultats sui-vants :

Un choc sur AH1N1 n'a d'impact que sur le risque avianu et de sens opposé.Toutefois celui s'estompe vite : après 4 jours ;

Un choc sur le risque avianu n'a de conséquence que sur lui-même ; Un choc sur les risques inuenza, novelu ou pandemicu a un impact sur l'en-semble des risques. Cet impact est nettement plus important pour les risques no-velu et pandemicu ;

Un choc sur le risque swineu entraine des répercussions sur l'évolution des autresrisques mais avec un retard de l'ordre de 4 jours.

Le modèle amène donc à la conclusion qu'un choc sur les risques géné-ralistes ( inuenza, pandemicu, novelu) a de fortes conséquences sur l'en-semble des risques de la même famille, tandis qu'un choc sur les risques par-ticuliers AH1N1, avianlu, et swineu a des conséquences faibles voir nullessur les autres risques.

3.4.7 Stabilité du modèle

L'idée générale est de tester la stabilité des coecients du modèle. Nous avons en eetobtenu un certain modèle à partir d'un an de données. Ce modèle serait-il sensiblementle même avec plus ou en moins d'historique ? Pour répondre à cette question, nous allonsappliquer le test de Chow.

Le test de Chow consiste à eectuer un test de comparaison des variances des résidusdes sous-périodes de l'échantillon de données. Considérons le modèle suivant :

Xt = A0 −A1Xt−1 −A2Xt−2 − . . .−ApXt−p + εt

M.MASSIAS ISUP 2010 79

Page 78: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 3. ANTICIPATION DE LA PROGRESSION DES RISQUESÉMERGENTS ET ANALYSE DES INTERACTIONS DANS UNE MÊME FAMILLE

Nous divisons désormais l'échantillon en deux groupes ([1, T ] = [1, T1] ∪ [T1, T ]), surlesquels nous ajustons deux modèles :

Xt = B0 −B1Xt−1 −B2Xt−2 − . . .−BpXt−p + ζt pour t ∈ [1, T1]

et Xt = C0 − C1Xt−1 − C2Xt−2 − . . .− CpXt−p + βt pour t ∈ [T1, T ]

L'hypothèse nulle du test de Chow est :B0

B1

B2

. . .Bp

=

C0

C1

C2

. . .Cp

Soient S la somme des carrés des résidus estimés du modèle initial, S1 la somme

des carrés des résidus estimés du premier groupe, et S2 la somme des carrés des résidusestimés du groupe 2. N1 et N2 représentent le nombre d'observations dans chaque groupeet k est le nombre total de paramètres à estimer. Alors la statistique du test de Chowest égale à :

F =(SC − (S1 + S2))/k

(S1 + S2)/(N1 +N2− 2k)

La statistique du test suit une loi de Fisher avec k et N1 +N2−2k degrés de liberté.

Dans notre cas nous eectuons la cassure de notre année de données tels que [1, T1]représente les 9 premiers mois et[T1, T ] représente les 3 derniers mois. Nous obtenons :

F = 0, 06285

Puis nous nous reportons à une table de statistiques pour déterminer le quantile de Fi-sher. Il vaut 1,64 au seuil de 5%. Puisque F = 0, 06285 < 1, 64, nous ne rejettons pasl'hypothèse nulle du test de Chow.

Le test de Chow nous indique donc que le modèle est stable.

3.4.8 Test de causalité de Granger

Une des questions que l'on peut se poser à partir d'un modèle VAR est de savoir s'ilexiste une relation de causalité entre les diérentes variables du système.Il existe plusieurs dénitions de causalité : la causalité au sens de Granger et la causalitéau sens de Sims. Nous ne traiterons que la causalité au sens de Granger qui est la plusfréquemment utilisée. Nous étudierons la causalité en considérant les variables deux à

deux. Nous nous restreignons donc à un modèle VAR(p) de dimension 2, Zt =

(ytxt

)

M.MASSIAS ISUP 2010 80

Page 79: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 3. ANTICIPATION DE LA PROGRESSION DES RISQUESÉMERGENTS ET ANALYSE DES INTERACTIONS DANS UNE MÊME FAMILLE

On dit que la variable x cause au sens de Granger la variable y si et seulement sila connaissance du passé de x améliore la prévision de y à tout horizon.On dit que la variable x ne cause pas la variable y au sens de Granger si etseulement si :

E(yt+h|yt, yt−1, . . . , y1) = E(yt+h|yt, yt−1, . . . , y1, xt, xt−1, . . . , x1)

Dans le cas d'un modèle V AR(p) :

Zt =

(ytxt

)=

(c1c2

)+

(φ111 φ112φ121 φ122

)(yt−1xt−1

)+

(φ211 φ212φ221 φ222

)(yt−2xt−2

)+ . . .

+

(φp11 φp12φp21 φp22

)(yt−pxt−p

)+

(εy,tεx,t

)la variable xt ne cause pas yt si et seulement si :

φ112 = φ212 = φ312 = . . . = φp12 = 0

Autrement dit, la variable xt ne cause la variable yt si et seulement si les matrices Φi

sont toutes triangulaires inférieures pour ∀i ∈ [1, p] En eet, réécrivons le processus souscette condition, on a :

Zt =

(ytxt

)=

(c1c2

)+

(φ111 0φ121 φ122

)(yt−1xt−1

)+

(φ211 0φ221 φ222

)(yt−2xt−2

)+ . . .

+

(φp11 0φp21 φp22

)(yt−pxt−p

)+

(εy,tεx,t

)Dès lors,

E(yt+h|yt, yt−1, . . . , y1) = c1 + φ111yt + φ211yt−1 + . . .+ φp11yt−p+1

E(yt+h|yt, yt−1, . . . , y1, xt, xt−1, . . . , x1) = c1 + φ111yt + φ211yt−1 + . . .+ φp11yt−p+1

On a bien alors :

E(yt+h|yt, yt−1, . . . , y1) = E(yt+h|yt, yt−1, . . . , y1, xt, xt−1, . . . , x1)

Le test de causalité de Granger revient donc à tester l'hypothèse :

H0 : x ne cause pas y, ou encore, φ112 = φ212 = φ312 = . . . = φp12 = 0

M.MASSIAS ISUP 2010 81

Page 80: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 3. ANTICIPATION DE LA PROGRESSION DES RISQUESÉMERGENTS ET ANALYSE DES INTERACTIONS DANS UNE MÊME FAMILLE

3.4.9 Interprétation des résultats

Figure 3.19 Résultats des tests de causalité de Granger (lire x cause y)

Le tableau se lit de la façon suivante : x cause y. Par exemple le risque avianu causele risque inuenza mais inuenza ne cause pas avianu.

Les tests de causalité de Granger nous indiquent que : Aucun risque ne cause AH1N1 et AH1N1 ne cause aucun risque ; Les risques avianu et swineu se causent mutuellement ; Les risques inuenza, novelu, pandemicu, sont causés par plus de 2 autres risques.

Les tests de causalité de Granger nous indiquent que les risques généra-listes inuenza, novelu, et pandemicu causent et sont causés par plus dedeux autres risques. Tandis que des risques plus spéciques tels AH1N1 etavianu causent et sont causés par moins de deux risques.

3.4.10 Conclusions : avantages et limites de l'analyse

L'analyse de l'interaction a été eectuée sur la famille pandemic u, la famille desrisques émergents la plus connue. En étudiant plusieurs notions telles la modélisation Var,l'analyse des chocs et la causalité de Granger, elle a permis de conrmer nos intuitions,à savoir que :

les risques désignant des termes larges, tels la grippe (inuenza), la grippe pandé-mique (pandemic u) et la grippe nouvelle (novelu), dépendent et peuvent avoirdes conséquences sur l'ensemble des risques de la famille ;

les risques plus spéciques, tels la grippe AH1N1, la grippe aviaire (avianu), etla grippe porcine (swineu), vont avoir des conséquences plus faibles sur les autresrisques ;

si un choc sur un risque se produit, les autres risques de la famille vont avoir ten-dance à réagir rapidement.

Cette étude n'a donc pas permis de révéler des résultats autres que nos intuitions.Il serait donc intéressant d'eectuer cette analyse sur des familles plus méconnues, pourlesquelles nous n'avons pas d'idées reçues. Cette analyse présente toutefois des limites :

M.MASSIAS ISUP 2010 82

Page 81: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 3. ANTICIPATION DE LA PROGRESSION DES RISQUESÉMERGENTS ET ANALYSE DES INTERACTIONS DANS UNE MÊME FAMILLE

Les résultats doivent être interprétés avec précaution. En eet, nous avons inter-prété les résultats fournis par un modèle. Toutefois, il faut être conscient qu'il enexiste plusieurs et que le modèle étudié ne reète pas exactement la réalité ;

L'analyse nécessite un long historique. De plus, même si le test de Chow a mon-tré que le modèle était stable avec plus ou moins trois mois de données, il seraitjudicieux de réévaluer ce modèle régulièrement ;

La méthode est longue d'implémentation et ne peut être appliquée à l'ensemble desfamilles.

M.MASSIAS ISUP 2010 83

Page 82: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents
Page 83: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CONCLUSION

Comme nous l'avons vu, les risques émergents peuvent avoir des conséquences consi-dérables sur le passif et l'actif de l'assureur. L'enjeu du suivi de ces risques est donc detaille.Le but de ce mémoire était d'améliorer la connaissance de ces risques, à partir des outilsdéjà mis en place à AXA, an de les appréhender au mieux.

Pour cela, nous avons : élaboré un indicateur de progression des risques. Nous avons dû eectuer au préa-lable un important traitement de données, déterminer comment considérer les mo-teurs de recherche utilisés par Heimdall, et construire un algorithme de détectionde pics. Nous avons testé plusieurs indicateurs et vérié leur pertinence par larecherche d'articles internet. Enn nous avons backtesté l'indicateur nalementretenu ;

modélisé l'évolution de chaque risque de la famille pandemic u par une modé-lisation ARMA. A partir des résidus du modèle et de la théorie des chaines deMarkov, nous avons simulé des trajectoires de résidus an d'obtenir diérents scé-narios d'évolution future des risques de cette famille. Ces simulations ont permisensuite d'estimer des probabilités de progression d'un risque sur une période don-née. Ces résultats ont été backtestés et donnent des résultats satisfaisants ;

modélisé l'évolution de la famille pandemic u, an de déterminer les interactionsau sein de cette famille. Nous avons aussi étudié les notions d'analyse des chocs etde causalité de Granger.

Cette étude a été utile pour AXA sur plusieurs aspects. Elle a apporté :

un meilleur suivi des risques au quotidien. Le fait d'avoir exploité l'historiquedes données a permis de se rendre compte de plusieurs problèmes. Tout d'abord,que les données utilisées jusqu'à présent pour le suivi au jour le jour des risquesn'étaient pas adéquates, il a donc fallu élaborer un nouvel indicateur de progression.

Page 84: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

CHAPITRE 3. ANTICIPATION DE LA PROGRESSION DES RISQUESÉMERGENTS ET ANALYSE DES INTERACTIONS DANS UNE MÊME FAMILLE

Puis que les données présentaient de nombreuses erreurs qu'il a fallu identier ettraiter. Enn, jusqu'à présent il n'avait pas non plus été étudié comment considérerles diérents moteurs de recherche ;Ces améliorations, en particulier les traitements des données, le nouvel indicateurde progression et l'algorithme de détection de pics mis en place, sont désormaisutilisées pour le suivi au quotidien et pour le reporting eectué tous les deux mois ;

une meilleure anticipation de la progression des risques. L'étude a permisde mettre au point une méthode d'estimation de progression d'un risque. Cetteanalyse permet notamment de déterminer quels sont les risques les plus sujets àévoluer rapidement et donc quels sont les risques les plus dangereux. Cette méthodea présenté des résultats satisfaisants pour la famille pandemic u, et pourrait êtreétendue à d'autres familles. Toutefois cette méthode est longue à implémenter etne peut pas être utilisée de façon régulière comme dans le cadre d'un reporting parexemple. L'analyse des interactions au sein de la famille pandemic u a quant à ellepermis de conrmer des intuitions et il serait intéressant de l'appliquer à d'autresfamilles peu connues.

Que ce soit en considérant les comportements des risques séparément ou en famille,nous avons établi des méthodes an de mieux anticiper l'évolution des risques, dans lebut de mieux protéger le groupe AXA.An d'améliorer cette protection, il serait judicieux d'étudier l'impact de l'émergenced'un risque sur l'actif et le passif d'AXA an d'établir des stratégies de couverture.Toutefois, cette étude ne serait pas facilement réalisable. Il faudrait déterminer dans unpremier temps les conséquences de l'émergence d'un risque sur les actions détenus par legroupe AXA. C'est à dire eectuer la liste des secteurs industriels et des actions poten-tiellement menacés, prendre en compte l'augmentation de volatilité, ainsi que la haussedes corrélations entre les actions, qui pourraient en résulter.Puis il faudrait eectuer un travail similaire sur les obligations, en déterminant commentl'émergence d'un risque peut avoir un impact sur leur rating.Enn il faudrait modéliser le passif d'AXA an de déterminer le besoin en liquidités dansle cas de l'émergence d'un risque et évaluer les liquidités disponibles rapidement à l'actif.Pour nir il faudrait évaluer quel serait l'impact d'un tel choc sur le bilan du groupe eteectuer des tests de sensibilité.

M.MASSIAS ISUP 2010 86

Page 85: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

BIBLIOGRAPHIE

Risques émergents

• JEAN-NOEL GUYE, DORA ELAMRI (2009)Emerging Risks WatchDocument interne à AXA

• DORA ELAMRI (2009)Etude dynamique de la sévérité des risques émergents : application au cas de lagrippe aviaireMémoire de Master Recherche Modélisation et Méthodes Mathématiques en Econo-mie et en Finances, Paris I, Centre Economique de la Sorbonne

• JEAN-NOEL GUYE, DORA ELAMRI (2009)Heimdall, Risques EmergentsDocument interne à AXA

• CATHERINE-ANTOINETTE RAIMBAULT, ANNE BARR (2010)Risques Emergents, Un pilotage stratégiqueEconomica

Série temporelle et modélisation ARMA

• MARIE KRATZ (2009)Cours de séries temporelles ISUP

• REGIS BOURBONNAIS (2009)Manuel et exercices corrigésDunod

Page 86: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

BIBLIOGRAPHIE

• CHISTIAN GOURIEROUX, ALAIN MONFORT (1999)Séries temporelles et modèles dynamiquesEconomica

• JJ. DROESEKE, B. FICHET, P.TASSI (1992)Séries chronologiques : théorie et pratique des modèles ARIMAEconomica

Modélisation VAR et causalité de Granger

• ARTHUR CHARPENTIER (2002)Cours de séries temporelles Théorie et applications - Volume 2http ://perso.univ-rennes1.fr/arthur.charpentier/TS2.pdf

• CHRISTOPHE HURLIN (2004)Econométrie Appliquée Séries Temporelles - Chapitre 5- Représentation VARhttp ://www.univ-orleans.fr/deg/masters/ESA/CH/churlin_E.htm

• REGIS BOURBONNAIS (2009)Manuel et exercices corrigésDunod

Chaines de Markov

• CHRISTIAN HESS (2008)Cours de Mathématiques de l'assuranceISUP

Test de Wald

• D. ISRAEL (2008)Data Analysis in Business Research : A Step-By-Step Nonparametric ApproachSage Publications

Test de Chow

• PHILIPPE CASIN (2008)EconométrieEditions Technip

M.MASSIAS ISUP 2010 88

Page 87: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

Annexe A

Figure 20 Extrait d'une table de données SAS

Page 88: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

ANNEXE A

Figure 21 Erreur de données : moteurs de recherche manquants

Figure 22 Erreur de données : termes de sévérité manquants

Figure 23 Erreur de données : forte chute d'une valeur

M.MASSIAS ISUP 2010 90

Page 89: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

ANNEXE A

Figure 24 Erreur de données : valeurs incohérentes

M.MASSIAS ISUP 2010 91

Page 90: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents
Page 91: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

Annexe B

Figure 25 Vérication des augmentations de RS avec l'ensemble des moteurs de re-cherche, pondérés

Page 92: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

ANNEXE B

Figure 26 Vérication des augmentations de R+RT avec l'ensemble des moteurs derecherche, pondérés

M.MASSIAS ISUP 2010 94

Page 93: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

ANNEXE B

Figure 27 Vérication des augmentations de RTS avec l'ensemble des moteurs derecherche, pondérés

M.MASSIAS ISUP 2010 95

Page 94: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

ANNEXE B

Figure 28 Vérication des augmentations de RS+RTS avec l'ensemble des moteursde recherche, pondérés

M.MASSIAS ISUP 2010 96

Page 95: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

Annexe C

Figure 29 Évolution de l'indicateur RS+RTS, après traitement et lissage, pour lerisque AH1N1

Page 96: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

ANNEXE C

Figure 30 Évolution de l'indicateur RS+RTS, après traitement et lissage, pour lerisque avianu

M.MASSIAS ISUP 2010 98

Page 97: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

ANNEXE C

Figure 31 Évolution de l'indicateur RS+RTS, après traitement et lissage, pour lerisque inuenza

M.MASSIAS ISUP 2010 99

Page 98: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

ANNEXE C

Figure 32 Évolution de l'indicateur RS+RTS, après traitement et lissage, pour lerisque novelu

M.MASSIAS ISUP 2010 100

Page 99: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

ANNEXE C

Figure 33 Évolution de l'indicateur RS+RTS, après traitement et lissage, pour lerisque pandemicu

M.MASSIAS ISUP 2010 101

Page 100: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

ANNEXE C

Figure 34 Évolution de l'indicateur RS+RTS, après traitement et lissage, pour lerisque swineu

M.MASSIAS ISUP 2010 102

Page 101: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

Annexe D

Rappel sur les séries temporelles et les modèles ARMA

Dénition 1. Soit xt, t ∈ T une famille d'observations d'un phénomène qui peut êtrephysique, économique, biologique...Chaque observation xt a été enregistré, à un temps spécique t et on appelle série tem-

porelle cet ensemble d'observations.Si T est dénombrable, il s'agit d'une série temporelle à temps discret, si T est un intervallede R, il s'agit d'une série temporelle à temps continu.

Propriété 1. Chaque observation xt est considérée comme la réalisation d'une variablealéatoire Xt(ω) ; la série temporelle est elle-même considérée comme la réalisation parti-culière d'un processus aléatoire (Xt; t ∈ T ).

Avant le traitement d'une série d'observations, il convient d'en étudier les caractéris-tiques stochastiques. Si ces caractéristiques, c'est à dire son espérance et sa variance, setrouvent modiées dans le temps, la série est considérée comme non stationnaire ; dansle cas d'un processus stochastique invariant, la série temporelle est alors stationnaire.

Dénition 2. Un processus (Xt) est stationnaire au second ordre si

1. Pour tout t, E(Xt2) < +∞ ;

2. Pour tout t, E(Xt) = µ, constante indépendante de t ;

3. Pour tout t et pour tout h, cov(Xt;Xt+h) = E([Xt−µ][Xt+h−µ]) = γ(h), fonctionindépendante de t.

Il est donc nécessaire que la série observée soit stationnaire pour que toute portionde la trajectoire observée fournisse des observations sur la loi de X et que des portionsdiérentes, mais de même longueur, fournissent les mêmes indications.Ainsi si la série observée a une tendance ou une saisonnalité, la série ne sera pas station-naire.

Il existe plusieurs façons de déterminer si une série est stationnaire. Parmi elles, il ya l'analyse de la fonction d'autocorrélation empirique.

Dénition 3. La fonction d'autocovariance empirique notée (γn(k))k est dénie

Page 102: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

ANNEXE D

par :

γn(k) =1

n

n−|k|∑i=1

(Xi+|k| − mn)(Xi − mn) pour− n < k < n (et 0 sinon)

La fonction d'autocorrélation empirique (ρn(k))k est dénie par :

ρn(k) =γn(k)

γn(0)pour− n < k < n (et 0 sinon)

Pour des données ayant une tendance, |ρn(k)| va décroître lentement en fonction dek, pour des données ayant une saisonnalité, |ρn(k)| aura également un comportement demême période. Ainsi la fonction |ρn(k)| peut servir d'indicateur de non-stationnarité.Pour tester la stationnarité on peut aussi appliquer le test de Dickey-Fuller.

Dénition 4. Les tests de Dickey-Fuller permettent de mettre en évidence le carac-tère stationnaire ou non d'une chronique par la détermination d'une tendance détermi-niste ou stochastique.Les modèles servant de base à la construction de ces tests sont au nombre de trois. Leprincipe de ces tests est simple : si l'hypothèse H0 : φ1 = 1 est retenue dans l'un de cestrois modèles, le processus est alors non stationnaire.[1]xt = φ1xt−1 + εt (modèle autorégressif d'ordre 1)[2]xt = φ1xt−1 + β + εt (modèle autorégressif avec constante)[3]xt = φ1xt−1 + bt+ c+ εt (modèle autorégressif avec tendance)Si l'hypothèse H0 est vériée, la chronique xt n'est pas stationnaire quel que soit le mo-dèle retenu.On estime par les moindres carrés ordinaires le paramètre φ1 noté φ1 pour les modèles[1],[2], et [3]. L'estimation des coecients et des écarts-type du modèle pour les moindrescarrés ordinaires fournit t

φ1qui est le rapport de l'estimation du paramètre et de son

erreur estimée. Si tφ1< ttabule, on rejette H0.

Si le test de Dickey-Fuller rejette l'hypothèse de stationnarité, il est nécessaire destationnariser la série. Pour rendre une série stationnaire, il faut donc éliminer cettetendance ou cette saisonnalité. Parmi les moyens qui existent pour ce faire, il y a ladiérenciation.

Dénition 5. On introduit l'opérateur ∇ = 1− B et de façon générale ∇j = ∇j-1, j ≥,avec ∇0 = I.B s'appelle l'opérateur retard B(Xt) = Xt−1. D'où ∇(Xt) = Xt −Xt−1. Nous appelonscette opération la diérenciation.Si on applique ∇k à une fonction tendance polynômiale d'ordre k, on la réduit à uneconstante.

Par exemple si Xt = a + bt + Yt où Yt est un processus centré stationnaire, alors∇(Xt) = a+ (Yt − Yt−1). Nous avons donc ainsi éliminé la tendance, cela revient donc à

M.MASSIAS ISUP 2010 104

Page 103: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

ANNEXE D

stationnariser la série.

Maintenant que nous avons transformé la série pour la rendre stationnaire, il estpossible de la modéliser, entre autres par un processus ARMA (AutoRegressive MovingAverage processes). La plupart des processus stationnaires peuvent être réprésentés parcette famille.

Dans tout ce qui suit, on supposera le processus X centré. Il sura dans le cas où Xest non centré de moyenne µ (E(Xt) = µ, ∀t), de poser Yt = Xt − µ et d'appliquer nosrésultats à Y = (Yt, t ∈ Z)

Dénition 6. Le processus X = (Xt, t ∈ Z) est un processus ARMA(p,q) si X eststationnaire et si ∀t ∈ Z, Φ(B)Xt = Θ(B)εt, où (εt)t est un bruit blanc de variance σ2,avec Φ et Θ polynômes de degré p et q respectivement dénis parΦ(z) = 1 + φ1z + . . .+ φpzp(φp 6= 0) etΘ(z) = 1 + θ1z + . . .+ θqzq(θq 6= 0),et tels que Φ et Θ n'ont pas de racines communes.X est appelé processus autorégressif d'ordre p noté AR(p) si Θ(z) = 1X est appelé processus moyenne mobile d'ordre q noté MA(q) si Φ(z) = 1

Propriété 2. La fonction d'autocovariance d'un processus stationnaire est nulle à partird'un certain rang q+1 si et seulement si ce processus est un MA(q).Tandis que l'autocorrélation partielle rk d'un processusAR(p) s'annule à partir de l'ordrep+1.

Ainsi en observant les fonctions d'autocorrélation et d'autocorrélation partielle empi-rique d'un processus, il est possible de déterminer les rangs p et q du modèle ARMA(p, q).

Le modèle ARMA(p, q) peut servir notamment à faire de la prévision. On observe nvaleurs du processus X. Le problème est de prédire les valeurs du futur (Xt, T ≥ n+ 1)de X à partir des valeurs observées X1, . . . , Xn.

Dénition 7. Etant donné un sous-espace fermé M de L2(Ω), la meilleure prédictiondans M de Xn+h(∈ L2) est dénie comme l'élément de M ayant la plus petite distanceau sens des moindres carrés de Xn+h. On la note Xn+h et on l'appelle prédiction au

sens des moindres carrés de Xn+h dans M . Ainsi

||Xn+h − Xn+h||2 = infZ∈M

||Xn+h − Z||2 = infZ∈M

E[(Xn+h − Z)2]

et Xn+h = PM (Xn+h) : projection de Xn+h sur M

Dans le cas où l'on observe les valeurs X1, . . . , Xn, M désigne le sous-espace de L2

engendré par X1, . . . , Xn.

M.MASSIAS ISUP 2010 105

Page 104: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

ANNEXE D

La méthode Box et Jenkins (1976) consiste en une méthodologie d'étude sys-tématique des séries temporelles à partir de leurs caractéristiques an de déterminer,dans la famille des modèle ARMA, le plus adapté à représenter le phénomène étudié.Cette méthode est simple et économique, c'est pourquoi elle est utilisée par les logicielsinformatiques, en particulier SAS. Elle comporte cinq phases :

1. Identication a priori : après avoir testé la stationnarité grâce au test de Dickey-Fuller, et avoir transformé les données si cela est nécessaire jusqu'à obtenir unmodèle stationnaire, on cherche les valeurs plausibles des degrés (p,q), notammenten examinant les fonctions d'autocorrélation et d'autocorrélation partielle. En gé-néral, on aboutit à la sélection de plusieurs modèles ;

2. Estimation : dans cette phase, les coecients des polynômes autorégressifs et moyennemobile sont estimés par la méthode des moindres carrés pour chacun de modèlesidentiés à l'étape 1 ;

3. Vérication : Les paramètres du modèle étant estimés, nous examinons les résultatsd'estimation. Les coecients du modèle doivent être signicativement diérents de 0, nouspouvons le vérier grâce au test de Student fourni. Si un coecient n'est passignicativement diérent de 0, il convient d'envisager de retourner à l'étape 2en considérant un nouveau modèle éliminant l'ordre du modèle AR ou MA nonvalide ;

L'analyse des résidus s'eectue à partir de deux critères à respecter. Tout d'abordla moyenne des résidus doit être nulle, dans le cas contraire, il convient d'ajouterune constante au modèle. Les résidus doivent former un bruit blanc, le test deLjung Box fourni, permet de tester cette hypothèse. Si le résidu n'est pas unbruit blanc, cela signie que la spécication du modèle est incomplète et qu'ilmanque au moins un ordre à un processus. Nous établissons ainsi une sorte debarrage qui réduit le nombre de modèles retenus.

4. Choix du modèle : Parmi les modèles retenus on choisit le modèle qui semble leplus approprié. Parmi les critères de sélection, il y a le critère AIC. Il s'agit d'unemesure se basant sur l'écart entre la vraie loi (inconnue) et celle du modèle proposé.On choisit le modèle ayant le plus petit critère AIC ;

5. Prévision : Lorsque le modèle est validé, la prévision peut alors être calculée à unhorizon de quelques périodes, limitées, car la variance de l'erreur de prévision croîttrès vite avec l'horizon.

M.MASSIAS ISUP 2010 106

Page 105: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

Annexe E

Figure 35 Équation du modèle VAR, partie 1

Page 106: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

ANNEXE E

Figure 36 Équation du modèle VAR, partie 2

M.MASSIAS ISUP 2010 108

Page 107: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

Annexe F

Figure 37 Fonction de réponse impulsionnelle simple et orthogonalisée suite à un chocsur AH1N1 à l'instant t = 0

Page 108: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

ANNEXE F

Figure 38 Fonction de réponse impulsionnelle simple et orthogonalisée suite à'un chocsur avianu à l'instant t = 0

M.MASSIAS ISUP 2010 110

Page 109: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

ANNEXE F

Figure 39 Fonction de réponse impulsionnelle simple et orthogonalisée suite à un chocsur inuenza à l'instant t = 0

M.MASSIAS ISUP 2010 111

Page 110: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

ANNEXE F

Figure 40 Fonction de réponse impulsionnelle simple et orthogonalisée suite à un chocsur novelu à l'instant t = 0

M.MASSIAS ISUP 2010 112

Page 111: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

ANNEXE F

Figure 41 Fonction de réponse impulsionnelle simple et orthogonalisée suite à un chocsur pandemicu à l'instant t = 0

M.MASSIAS ISUP 2010 113

Page 112: REMERCIEMENTS · Je remercie tout particulièrement Monsieur Jean-Noël GUYE mon maître de stage, qui m'a conseillée et fait béné cier de son expérience sur les risques émergents

ANNEXE F

Figure 42 Fonction de réponse impulsionnelle simple et orthogonalisée d'un choc surswineu

M.MASSIAS ISUP 2010 114