Click here to load reader

Slides 2040-4

  • View
    1.399

  • Download
    0

Embed Size (px)

DESCRIPTION

 

Text of Slides 2040-4

  • 1. Arthur CHARPENTIER - ACT2040 - Actuariat IARD - Automne 2013 Actuariat IARD - ACT2040 Partie 4 - modles linaires gnraliss i.e. GLM (Y {0, 1}, N, R+, R etc.) Arthur Charpentier [email protected] http ://freakonometrics.hypotheses.org/ Automne 2013 1
  • 2. Arthur CHARPENTIER - ACT2040 - Actuariat IARD - Automne 2013 La famille exponentielle Rfrences : Frees (2010), chapitre 13, de Jong & Heller (2008), chapitre 5, et Denuit & Charpentier (2005), chapitre 11. Considrons des lois de paramtres (et ) dont la fonction de densit (par rapport la mesure dominante adquate (mesure de comptage sur N ou mesure de Lebesgue sur R) scrit f(y|, ) = exp y b() a() + c(y, ) , o a(), b() et c() sont des fonctions, et o est appel paramtre naturel. Le paramtre est le paramtre dintrt tandi que est considr comme un paramtres de nuisance (et suppos connu, dans un premier temps). 2
  • 3. Arthur CHARPENTIER - ACT2040 - Actuariat IARD - Automne 2013 La famille exponentielle Exemple La loi Gaussienne de moyenne et de variance 2 , N(, 2 ) appartient cette famille, avec = , = 2 , a() = , b() = 2 /2 et c(y, ) = 1 2 y2 2 + log(22 ) , y R, Exemple La loi de Bernoulli de moyenne , B() correspond au cas = log{p/(1 p)}, a() = 1, b() = log(1 + exp()), = 1 et c(y, ) = 0. Exemple La loi binomiale de moyenne n, B(n, ) correspond au cas = log{p/(1 p)}, a() = 1, b() = n log(1 + exp()), = 1 et c(y, ) = log n y . Exemple La loi de Poisson de moyenne , P() appartient cette famille, f(y|) = exp() y y! = exp y log log y! , y N, avec = log , = 1, a() = 1, b() = exp = et c(y, ) = log y!. 3
  • 4. Arthur CHARPENTIER - ACT2040 - Actuariat IARD - Automne 2013 La famille exponentielle Exemple La loi Binomiale Ngative, de paramtres r et p, f(k|r, p) = y + r 1 y (1 p)r py , y N. que lon peut crire f(k|r, p) = exp y log p + r log(1 p) + log y + r 1 y soit = log p, b() = r log p et a() = 1 On reviendra sur cette loi dans la prochaine section du cours. 4
  • 5. Arthur CHARPENTIER - ACT2040 - Actuariat IARD - Automne 2013 La famille exponentielle Exemple La loi Gamma (incluant la loi exponentielle) de moyenne et de variance 1 , f(y|, ) = 1 () y1 exp y , y R+, est galement dans la famille exponentielle. Il faut choisir = 1 , a() = , b() = log(), = 1 et c(y, ) = 1 1 log(y) log 1 On reviendra sur cette loi dans la section du cours sur la modlisation des cots de sinistres. 5
  • 6. Arthur CHARPENTIER - ACT2040 - Actuariat IARD - Automne 2013 Esprance et variance Pour une variable alatoire Y dont la densit est de la forme exponentielle, alors E(Y ) = b () et Var(Y ) = b (), i.e. la variance de Y apparat comme le produit de deux fonctions : la premire, b () , qui dpend uniquement du paramtre est appele fonction variance, la seconde est indpendante de et dpend uniquement de . En notant = E(Y ), on voit que le paramtre est li la moyenne . La fonction variance peut donc tre dnie en fonction de , nous la noterons dornavant V() = b ([b ]1 ()). Exemple Dans le cas de la loi normale, V() = 1, dans le cas de la loi de Poisson, V () = alors que dans le cas de la loi Gamma, V () = 2 . 6
  • 7. Arthur CHARPENTIER - ACT2040 - Actuariat IARD - Automne 2013 Esprance et variance Notons que la fonction variance caractrise compltement la loi de la famille exponentielle. Chacune des lois de la famille exponentielle possde une fonction de lien spcique, dite fonction de lien canonique, permettant de relier lesprance au paramtre naturel (ou canonique) . Le lien canonique est tel que g () = . Or, = b () donc g () = b ()1 . Exemple Pour la loi normale, = (link=identity), Exemple Pour la loi de Poisson, = log() (link=log) Exemple Pour la loi de Bernoulli, = logit() = log 1 , (link=logit) Exemple Pour la loi Gamma, = 1/ (link=inverse) 7
  • 8. Arthur CHARPENTIER - ACT2040 - Actuariat IARD - Automne 2013 Esprance et variance Loi de probabilit V () Normale 1 Poisson Gamma 2 Inverse gaussienne 3 Binomiale (1 ) 8
  • 9. Arthur CHARPENTIER - ACT2040 - Actuariat IARD - Automne 2013 Esprance et variance, la famille Tweedie Tweedie (1984) a suggr la famille suivante f(y|, ) = A(y, ) exp 1 y() () , o () = 1 1 = 1 log = 1 et () = 2 2 = 2 log = 2 La loi de Y est alors une loi Poisson compose, avec des sauts Gamma, Y CPoi 2 (2 ), G 2 (1 ) , (2 )1 , o [1, 2]. Remarque On a une mesure de Dirac en 0 avec distribution (continue) dnie sur R+ . 9
  • 10. Arthur CHARPENTIER - ACT2040 - Actuariat IARD - Automne 2013 Esprance et variance, la famille Tweedie On obtient alors une fonction variance de la forme V() = . On retrouve le modle de Poisson quand 1 (ou ) et une loi Gamma quand 2 (ou 0). Il est en fait possible dobtenir une classe beaucoup plus large, y compris dans le cas o > 2 en considrant des lois stables. 10
  • 11. Arthur CHARPENTIER - ACT2040 - Actuariat IARD - Automne 2013 Paramtre naturel, et lien canonique Le lien canonique est tel que g(i) = i. Or, i = b (i) do g1 = b . Loi de probabilit Fonction de lien canonique Normale = Poisson = ln Gamma = 1/ Inverse gaussienne = 1/2 Binomiale = ln ln(1 ) = logit() 11
  • 12. Arthur CHARPENTIER - ACT2040 - Actuariat IARD - Automne 2013 Syntaxe et programmation La syntaxe des modles linaires gnralises ressemble > glm(Y~X1+X2+X3+offset(log(Z)), family = quasipoisson(link=log), + data = base, weights=w) qui correspond un modle E(Yi|Xi) = i = g1 Xi + i et Var(Yi|Xi) = V (i) i o Y est le vecteur des Yi que lon cherche modliser (le nombre de sinistres de la police i par exemple), X1, X2 et X3 sont les variables explicatives qui peuvent tre qualitatives (on parlera de facteurs) ou quantitatives, link=log indique que g est la fonction log, family=poisson revient choisir une fonction variance V identit, alors que family=quasipoisson revient choisir une fonction variance V identit avec un paramtre de dispersion estimer, offset correspond la variable i, et weights le vecteur = (i). 12
  • 13. Arthur CHARPENTIER - ACT2040 - Actuariat IARD - Automne 2013 Contrainte du logiciel Il est possible de choisir, en thorie, nimporte quelle fonction de lien (bijective) g telle que g() = . En colonne, la forme de la fonction lien, o dsigne le lien canonique Loi de probabilit 1 log 2 logit 1 () Normale Poisson Gamma Inverse gaussienne Binomiale 13
  • 14. Arthur CHARPENTIER - ACT2040 - Actuariat IARD - Automne 2013 Les quasi-lois La loi de Poisson correspondait au cas f(y|) = exp() y y! = exp y log log y! , y N, avec = log , = 1. On a alors Var(Y ) = E(Y ). On souhaitera introduire un paramtre = 1, autorisant de la surdispersion ( > 1). On parle alors de loi quasi-Poisson (mais ce nest pas une vraie loi). Avec un tel modle, on aurait Var(Y ) = E(Y ). Remarque On reviendra plus longuement sur la modlisation dans le cas surdispers dans la prochaine section du cours. 14
  • 15. Arthur CHARPENTIER - ACT2040 - Actuariat IARD - Automne 2013 Des lois exponentielles aux GLM Considrons des variables alatoires indpendantes Y1, Y2, . . . , Yn. La densit de chacune de celles-ci est f(yi|i, ) = exp yii b(i) a() + c(yi, ) par rapport la mesure dominante approprie (mesure de comptage sur N ou mesure de Lebesgue sur R). Ds lors, la vraisemblance est L(, |y) = n i=1 f(yi|i, ) = exp n i=1 yii n i=1 b(i) a() + n i=1 c(yi, ) . On suppose que les i sont fonction dun ensemble de p paramtres 1, 2, . . . , p, disons. 15
  • 16. Arthur CHARPENTIER - ACT2040 - Actuariat IARD - Automne 2013 Des lois exponentielles aux GLM Plus prcisment, notant i la moyenne de Yi, on suppose que g(i) = xi = i o 1. la fonction monotone et drivable g est appele fonction de lien ; 2. le vecteur xi de dimension p 1 contient des variables explicatives relativ