17
Introduction aux séries temporelles, tendance et composante saisonnière MAP-STA2 : Séries chronologiques Yannig Goude [email protected] 2015-2016 Exemples de séries temporelles Nous étudions dans ce cours des séries temporelles à temps discret, ie une suite réelle (x t ) 1tn t représente le temps. Ce temps est mesuré à une fréquence donnée, appelée fréquence d’échantillonnage. Par exemple, les données du nombre de requétes google “rubgy world cup” par semaine (source https://www.google.fr/trends/), 2004 2006 2008 2010 2012 2014 2016 0 20 40 60 80 100 Nb Queries la production horaire d’un panneau photovoltaïque, l’indice des prix à la consommation des ménages Français (source INSEE: http://www.insee.fr/fr/bases-de-donnees/) au pas mensuel, la consommation électrique résidentielle moyenne en Irlande au pas demi-horaire, les montants de transactions immobilières en France en milliards d’euros depuis 1970 (sources: https://www.data.gouv.fr/fr). 1

Introduction aux séries temporelles, tendance et ...goude/Materials/time... · Introduction aux séries temporelles, tendance et composante saisonnière MAP-STA2 : Séries chronologiques

  • Upload
    others

  • View
    9

  • Download
    0

Embed Size (px)

Citation preview

  • Introduction aux séries temporelles, tendance etcomposante saisonnièreMAP-STA2 : Séries chronologiques

    Yannig Goude [email protected]

    Exemples de séries temporelles

    Nous étudions dans ce cours des séries temporelles à temps discret, ie une suite réelle (xt)1≤t≤n où t représentele temps. Ce temps est mesuré à une fréquence donnée, appelée fréquence d’échantillonnage. Par exemple, lesdonnées du nombre de requétes google “rubgy world cup” par semaine (source https://www.google.fr/trends/),

    2004 2006 2008 2010 2012 2014 2016

    020

    4060

    8010

    0

    Nb

    Que

    ries

    la production horaire d’un panneau photovoltaïque, l’indice des prix à la consommation des ménages Français(source INSEE: http://www.insee.fr/fr/bases-de-donnees/) au pas mensuel, la consommation électriquerésidentielle moyenne en Irlande au pas demi-horaire, les montants de transactions immobilières en France enmilliards d’euros depuis 1970 (sources: https://www.data.gouv.fr/fr).

    1

    mailto:[email protected]://www.google.fr/trends/http://www.insee.fr/fr/bases-de-donnees/https://www.data.gouv.fr/fr

  • oct. 03 oct. 05 oct. 07

    0.0

    0.4

    0.8

    Sol

    ar P

    rodu

    ctio

    n

    2000 2005 2010 2015

    100

    115

    Ind.

    Prix

    (IN

    SE

    E)

    sept. 03 sept. 13 sept. 23

    0.2

    0.6

    Con

    sum

    ptio

    n (k

    w)

    1970 1980 1990 2000 2010

    015

    0

    Tran

    sac.

    Imm

    o

    Décomposition d’une série temporelle

    L’objectif principal de l’analyse d’une série temporelle est la prévision de ses futures réalisations. Afin deréaliser cet objectif, une premiére étape de modélisation de la série est nécessaire. Cette étape consiste àsélectionner, parmi une famille de modèles correspondant à des approximations de la réalité, celui qui décritle mieux la série en question.

    Quelques exemples de modéles de série temporelle:

    • les lissages exponentiels• les modéles de régression (régression linéaire, modéles non-paramétriques. . . )• les modéles du type ARIMA• les modéles de données fonctionnelles

    Une série temporelle Yt est communément décomposée en:

    • une tendance Tt correspondant à une évolution à long terme de la série, par exemple:

    – tendance linéaire: Tt = a+ bt– tendance quadratique: Tt = a+ bt+ ct2– tendance logarithmique: Tt = log(t)

    • une saisonnalité St correspondant à un phénoméne périodique de période identifiée

    • une erreur εt qui est la partie aléatoire de la série (idéalement stationnaire)

    2

  • On ajoute parfois une autre composante, le cycle Ct qui correspond à un phénoméne répétitif régulier (doncprévisible) de période inconnue ou changeante.

    Cette décomposition peut-étre additive Yt = Tt + St + εt ou multiplicative Yt = Tt ∗ St ∗ εt. Il est égalementpossible de combiner ces deux décompositions: Yt = (Tt + St) ∗ εt ou Yt = (Tt ∗ St) + εt. . .

    Nous nous intéressons ici à la modélisation de la composante déterministe de la série: Tt et St.

    Rq: un passage au log permet de se ramener à un modéle additif si le modéle étudié est totalement multiplicatif.

    Exemple:

    janv. 1900 janv. 1950 janv. 2000

    02

    46

    8

    janv. 1900 janv. 1950 janv. 2000

    −5

    05

    10

    Modélisation de la partie déterministe

    La tendance

    Il existe différents procédés permettant d’anlyser puis/ou de corriger la tendance d’une série temporelle.

    Moyenne mobile La moyenne mobile est une méthode simple permettant d’extraire les composantesbasses fréquences d’une série temporelle autrement dit sa tendance. Elle est également connue comme uneméthode de lissage car elle agit comme un filtre passe bas et donc élimine le bruit.

    Le calcul de la moyenne mobile dépend d’un paramètre l appelé la largeur de fenêtre. Ce paramétre correspondau nombre d’observations inclues dans le calcul de la moyenne glissante éffectuée. Plus l est grand plus lelissage est important (jusqu’à atteindre la fonction constante égale à la moyenne).

    La moyenne mobile se calcule ainsi:

    3

  • ŷt =1

    2l + 1

    t+l∑i=t−l

    yt

    Et en r, une des nombreuses alternatives est la fonction filter:

    MA

  • alors le processus ∆yt admet une tendance polyomiale d’ordre k − 1.

    Preuve à faire

    Il en découle que pour éliminer une tendance polynomiale d’ordre k on peut effectuer une différenciationd’ordre k.

    La fonction permettant de différencier une série temporelle est la fonction diff dont voici un exempled’utilisation sur l’indice des prix à la consommation des ménages:

    par(mfrow = c(1, 2))prix.ts

  • Time

    prix

    .ts

    5 10 15

    100

    105

    110

    115

    120

    125

    Time

    diff.

    prix

    .ts

    5 10 15−

    1.0

    −0.

    50.

    00.

    51.

    0

    Estimation paramétrique de la tendance Après avoir représenté la série, il est souvent possible d’inférerune représentation paramétrique de sa tendance. Dans ce cas, on procède par régression (linéaire le plussouvent mais potentiellent non-linéaire) pour estimer cette tendance.

    Par exemple, dans le cas d’un processus y admettant une tendance polynomiale d’ordre k: yt =∑kj=0 ajt

    j+εt,un estimateur de la tendance pourra être obtenu ainsi:

    T̂ = Xâ

    ou X est la matrice dont les colonnes sont les vecteurs (1, ..., tj) et:

    â = (X ′X)−1X ′Y

    avec Y = (y1, ..., yt)

    En pratique, la fonction lm ou nlm dans le cas non linéaire permet d’estimer ce type de tendance.

    time

  • 2000 2005 2010 2015

    100

    105

    110

    115

    120

    125

    Ind.

    Prix

    . Con

    so. M

    énag

    es (

    INS

    EE

    )

    2000 2005 2010 2015−

    10

    12

    Ind.

    Prix

    . − d

    etre

    nd

    Estimation non-paramétique de la tendance Dans certains cas, une représentation paramétrique dela tendance n’est pas évidente. Le modèle sous-jacent à ce type de données est:

    yt = f(t) + εt

    où f est une fonction régulière sur laquelle on ne fait pas d’hypothèse paramétrique, t = 1, 2, .., n. On nefait pour l’instant pas d’hypothèses précises sur εt, considérés comme stationnaires. On pourra dans ce casconsidérer une estimation non-paramétrique de cette tendance. Plusieurs approches sont possibles.

    Estimateur à noyaux

    définition on appelle noyau une fonction K : Rd → R telle que∫K2 0 (paramètre de fenêtre), soit un noyau K. On appelle estimateur à noyau de fassocié à la fenêtre h et au noyau K la fonction f̂h définie par:

    f̂h(x) =∑nt=1 ytK(x−th )∑nt=1 K(x−th )

    c’est une estimation non-paramétrique de la tendance de la série. La régularité de cet estimateur dépend deh la taille de fenêtre du noyau.

    exemple de noyaux:

    • gaussien: K(x) = exp(−x2/)/2pi• uniforme: K(x) = 1|x|≤1/2

    7

  • • triangle: K(x) = (1− |x|)1|x|≤1• epanechnikov K(x) = 34 (1− x2)1|x|≤1• tricube K(x) = 7081 (1− |x|3)31|x|≤1• logistique K(x) = 1/(exp(x) + 2 + exp(−x))• quartic: K(x) = 1516 (1− x2)1|x|≤1• triweight!: K(x) = 3532 (1− x2)31|x|≤1

    −3 −2 −1 0 1 2 3

    0.0

    0.2

    0.4

    gaussien

    x

    −3 −2 −1 0 1 2 3

    0.0

    0.6

    uniforme

    x

    −3 −2 −1 0 1 2 3

    0.0

    0.6

    triangle

    x

    −3 −2 −1 0 1 2 3

    0.0

    0.4

    epanechnikov

    x

    8

  • −3 −2 −1 0 1 2 3

    0.0

    0.4

    0.8

    tricube

    x

    −3 −2 −1 0 1 2 3

    0.05

    0.20

    logistique

    x

    −3 −2 −1 0 1 2 3

    0.0

    0.6

    quartic

    x

    −3 −2 −1 0 1 2 3

    0.0

    0.6

    triweight

    x

    Une fonction permettant d’effectuer une régression à noyau en r est ksmooth du package stats disponibledans la distribution r de base.

    Un exemple d’utilisation sur les données de l’indice des prix à la consommation des ménages:

    noyau

  • 2000 2005 2010 2015

    100

    105

    110

    115

    120

    125

    Ind.

    Prix

    . Con

    so. M

    énag

    es (

    INS

    EE

    )

    2000 2005 2010 2015−

    1.0

    −0.

    50.

    00.

    51.

    0

    Ind.

    Prix

    . − d

    etre

    nd

    Polynômes locaux

    définition soit un réel h > 0 (paramètre de fenêtre), soit un noyau K. On note Wt(x) = K(x−t

    h )∑nt=1

    K( x−th )(on ne

    fait pas apparaitre ici la dépendance à h pour simplifier).

    On appelle estimateur polynomial local de degré q de f associé à la fenêtre h et au noyau K la fonction f̂hdéfinie par:

    f̂h(x) = argminPn∑t=1

    Wt(x)||yt − P (xt − x)||2

    avec P (x) =∑qj=0 ajx

    j un polynôme de degrés q.

    Le principe est donc, pour chaque valeur de x (ici le temps car on estime une tendance ou une composantepériodique de la série), on estime une fonction polynômiale approximant le mieux les données localement, lanotion de voisinage dépendant encore de h la taille de fenêtre. Autrement formulé, il s’agit d’estimer sur lesdonnées un développement limité de la fonction f .

    On remarque que pour q = 0 on retrouve l’estimateur à noyau précédant qui consiste à résoudre∑nt=1 Wt(x)||yt − a||2.

    La fonction r implémentant les polynômes locaux est la fonction loess dont voilà un exemple d’utilisation:

    lo

  • 2000 2005 2010 2015

    100

    105

    110

    115

    120

    125

    Ind.

    Prix

    . Con

    so. M

    énag

    es (

    INS

    EE

    )

    Notons que le noyau utilisé dans cette fonction est le noyau tricube.

    Estimation semi-paramétrique de la tendance Une autre alternative pour estimer la fonction f estde procéder par projection sur des bases de fonctions adaptés, par exemple des fonctions splines polynomialespar morceau.

    définition soit 1 ≤ n1 ≤ ... ≤ nk ≤ n un vecteur de coefficients appelés noeuds définissant une partition dutemps, q un entier >0, alors: (1, x, x2, ..., xq, (x− n1)q+, ..., (x− nk)

    q+) est appelée base de truncated power

    functions de degré q et est de classe Cq−1.

    Par exemple, pour q = 1 on obtient une base de fonction spline linéaire dont l’aspect est le suivant:

    n

  • 0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    truncated power functions q = 1

    x

    ce qui permet de modéliser des tendances linéaires par morceau du type:

    set.seed(150)coef

  • 0.0 0.2 0.4 0.6 0.8 1.0

    −0.

    95−

    0.90

    −0.

    85−

    0.80

    x

    f

    En pratique les coefficients de projection sur la base sont estimés par régression linéaire sur la matrice dedesign: X = (1, x, x2, ..., xq, (x− n1)q+, ..., (x− nk)

    q+).

    Le choix des “cassures” donc des noeuds est déterminant. q = 3 est un choix courant car il permet decontourner ce problème du choix des noeuds en le substituant à un problème de régularisation en résolvant leproblème de régression pénalisée suivant:

    minf∈S3

    (yt − f(t))2 + λ∫f ′′(x)2dx

    où S3 est l’espace engendré par X = (1, x, x2, ..., x3, (x − n1)q+, ..., (x − nk)3+) en prenant k suffisammentgrand, λ > 0 est un paramètre à calibrer, par exemple par validation croisée.

    en pratique on pourra utiliser la fonction gam du package mgcv.

    library(mgcv)

    ## Loading required package: nlme#### Attaching package: 'nlme'#### The following object is masked from 'package:forecast':#### getResponse#### This is mgcv 1.8-9. For overview type 'help("mgcv-package")'.

    13

  • g

  • sept. 03 sept. 08 sept. 13 sept. 18 sept. 23 sept. 28

    0.2

    0.4

    0.6

    0.8

    cons

    umpt

    ion

    (kw

    )

    Il subsiste ici une composante périodique de période 1 semaine qu’on peut ensuite éliminer via un deuxièmefiltrage par moyenne mobile.

    MA2

  • sept. 03 sept. 08 sept. 13 sept. 18 sept. 23 sept. 28

    0.2

    0.4

    0.6

    0.8

    cons

    umpt

    ion

    (kw

    )

    Différenciation De même que pour nettoyer un processus de sa tendance, il est possible de le désaisonnalisépar différentiation.

    Proposition soit un processus yt admettant une saisonnalité additive de période τ , alors le processus∆τyt = yt − yt−τ est un processus désaisonnalisé.

    Preuve yt = St + εt, alors ∆τyt = εt − εt−τ car par définition St = St−τ .

    remarque 1 le processus εt − εt−τ est stationnaire, mais il peut être auto-corrélé. Par exemple si εt est unbruit blanc, εt − εt−τ a une autocorrélation d’ordre τ de −1/2. Voir exemple ci-dessous.

    n

  • 0 1 2 3 4

    −0.

    40.

    00.

    40.

    8

    Lag

    AC

    FSeries X

    0 1 2 3−

    0.5

    0.0

    0.5

    1.0

    Lag

    AC

    F

    Series diff(X, lag = 5, differences = 1)

    remarque 2 la différenciation peut s’appliquer pour un lag donnée et à un ordre donné ce qui donne l’opérateur∆kτ , les paramètres associés dans la fonction diff sont lag et differences.

    Estimation paramétrique de la saisonnalité Un modèle paramétrique naturel pour modéliser unprocessus saisonnier est la décomposition en série de Fourier. Soit un processus yt admettant une saisonnalitéde période τ alors le modèle suivant est généralement proposé:

    yt =∑qj=1 ajcos(ωjt) + bjsin(ωjt) + εt

    où ωj = 2jπ/τ , q est à déterminer par une méthode de sélection de modèle sur les données.

    Les coefficients aj et bj sont obtenus par moindre carrés sur les données.

    Estimation non-paramétrique de la saisonnalité De même que pour la moyenne mobile, il est possibleen choisissant la bonne valeur de fenêtre d’estimer la composante saisonnière d’un processus par méthode ànoyau et polynômes locaux.

    Estimation semi-paramétrique de la saisonnalité Il est possible de définir des bases de splines aveccontraintes au bord du support, on parle alors de splines cycliques.

    17

    Exemples de séries temporellesDécomposition d'une série temporelleModélisation de la partie déterministeLa tendanceLa Saisonnalité