30
Séries temporelles – Cours 1 Introduction au cours de séries temporelles Angelina Roche Executive Master Statistique et Big Data 2018–2019

Introduction au cours de séries temporelles

  • Upload
    others

  • View
    6

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Introduction au cours de séries temporelles

Séries temporelles – Cours 1

Introduction au cours de séries temporelles

Angelina Roche

Executive Master Statistique et Big Data

2018–2019

Page 2: Introduction au cours de séries temporelles

Séries temporelles – Cours 1

Plan du cours d’aujourd’hui

Qu’est-ce qu’une série temporelle ? Exemples

Représentations graphiques

Tendance, saisonnalité, résidus

Remarques complémentaires et déroulement du cours

Page 3: Introduction au cours de séries temporelles

Séries temporelles – Cours 1

Qu’est-ce qu’une série temporelle ? Exemples

Plan

Qu’est-ce qu’une série temporelle ? Exemples

Représentations graphiques

Tendance, saisonnalité, résidus

Remarques complémentaires et déroulement du cours

Page 4: Introduction au cours de séries temporelles

Séries temporelles – Cours 1

Qu’est-ce qu’une série temporelle ? Exemples

Définition d’une série temporelle

DéfinitionsI Une série temporelle est un ensemble d’observations

Xt1 ,Xt2 , ... mesurées sur des temps t1, t2, ... distincts.

I Un processus stochastique {Xt , t ∈ T} est une famille devariables aléatoires définies sur le même espace de probabilité.

On modélisera généralement un série temporelle comme unprocessus stochastique.

Page 5: Introduction au cours de séries temporelles

Séries temporelles – Cours 1

Qu’est-ce qu’une série temporelle ? Exemples

Exemples

Année

Co

nso

mm

atio

n f

ina

le e

ffe

ctiv

e t

ota

le

1950 1960 1970 1980 1990 2000 2010

05

10

15

20

25

30

35

Figure – Évolution de la consommation effective totale annuelle (enmilliards d’euros) en France de 1949 à 2017 (cf TP 2 d’analyse dedonnées).

Page 6: Introduction au cours de séries temporelles

Séries temporelles – Cours 1

Qu’est-ce qu’une série temporelle ? Exemples

Exemples

Année

No

mb

re d

e p

assa

ge

rs a

éri

en

s

1950 1952 1954 1956 1958 1960

10

02

00

30

04

00

50

06

00

Figure – Nombre mensuel de passagers aériens sur des volsinternationaux en milliers de 1949 à 1960.

Page 7: Introduction au cours de séries temporelles

Séries temporelles – Cours 1

Qu’est-ce qu’une série temporelle ? Exemples

ExemplesStatistique

Temps

Evo

lutio

n d

e l'

inte

rêt

2005 2010 2015

20

40

60

80

BigData

Temps

Evo

lutio

n d

e l'

inte

rêt

2005 2010 2015

02

06

01

00

Figure – Évolution de l’intérêt pour les mot-clefs ’Statistique’ et ’BigData’ (source : Google trends).

Page 8: Introduction au cours de séries temporelles

Séries temporelles – Cours 1

Représentations graphiques

Plan

Qu’est-ce qu’une série temporelle ? Exemples

Représentations graphiques

Tendance, saisonnalité, résidus

Remarques complémentaires et déroulement du cours

Page 9: Introduction au cours de séries temporelles

Séries temporelles – Cours 1

Représentations graphiques

Représentations graphiques usuelles

I Le chronogramme : tracé du graphique {(t,Xt), t ∈ T} où Test l’intervalle d’observation.

I Le lag-plot ou diagramme retardé : tracé des points{(Xt−k ,Xt), t, t − k ∈ T}.Objectif : détecter des corrélations pour comprendre ladépendance de la série envers son passé.

I Le month-plot : représentation simultanée des chronogrammesassociés à chaque saison ou mois.

Page 10: Introduction au cours de séries temporelles

Séries temporelles – Cours 1

Représentations graphiques

Example : lag-plot de la consommation effective annuelle

Total.ts <- ts(t(Total),start=1949)lag.plot(Total.ts,set.lags=c(1,2,5,10),layout=c(2,2))

lag 1

xy$

y

123456789101112131415161718192021222324252627282930313233

343536373839404142

43444546474849505152

5354555657585960616263

64656667

68

0 5 10 20 30

01

02

03

04

0

lag 2xy$

y

123456789101112131415161718192021222324252627282930313233343536373839404142

43444546474849505152

5354555657585960616263

64656667

lag 5

xy$

y

123456789101112131415161718192021222324252627282930313233343536373839404142

43444546474849505152

5354555657585960616263

64

lag 10

xy$

y

123456789101112131415161718192021222324252627282930313233

343536373839404142

43444546474849505152

53545556575859

01

02

03

04

0

0 5 10 20 30

Page 11: Introduction au cours de séries temporelles

Séries temporelles – Cours 1

Représentations graphiques

Example : lag-plot du bruit blanc (pas de corrélation)

lag.plot(ts(rnorm(1000,0,1)),set.lags=c(1,5,10,100),layout=c(2,2),do.lines=FALSE)

temps

0 200 400 600 800 1000

-3-1

13

lag 1

ts(r

no

rm(1

00

0, 0

, 1))

-3-2

-10

12

3

-3 -2 -1 0 1 2 3

lag 5

ts(r

no

rm(1

00

0, 0

, 1))

lag 10

ts(r

no

rm(1

00

0, 0

, 1))

lag 100

ts(r

no

rm(1

00

0, 0

, 1))

-3-2

-10

12

3

-3 -2 -1 0 1 2 3

Page 12: Introduction au cours de séries temporelles

Séries temporelles – Cours 1

Représentations graphiques

Example : lag-plot du nombre de passagers aériens

lag.plot(AirPassengers,lags=12,layout=c(3,4),do.lines=FALSE)

lag 1

Air

Pa

sse

ng

ers

10

02

00

30

04

00

50

06

00

100 200 300 400 500 600

lag 2

Air

Pa

sse

ng

ers

lag 3

Air

Pa

sse

ng

ers

100 200 300 400 500 600

lag 4

Air

Pa

sse

ng

ers

lag 5

Air

Pa

sse

ng

ers

lag 6

Air

Pa

sse

ng

ers

lag 7

Air

Pa

sse

ng

ers

lag 8

Air

Pa

sse

ng

ers

10

02

00

30

04

00

50

06

00

lag 9

Air

Pa

sse

ng

ers

10

02

00

30

04

00

50

06

00

lag 10

Air

Pa

sse

ng

ers

100 200 300 400 500 600lag 11

Air

Pa

sse

ng

ers

lag 12

Air

Pa

sse

ng

ers

100 200 300 400 500 600

Page 13: Introduction au cours de séries temporelles

Séries temporelles – Cours 1

Représentations graphiques

Example : month-plot du nombre de passagers aériens

monthplot(AirPassengers)AirPassengers

J F M A M J J A S O N D

100

200

300

400

500

600

Page 14: Introduction au cours de séries temporelles

Séries temporelles – Cours 1

Tendance, saisonnalité, résidus

Plan

Qu’est-ce qu’une série temporelle ? Exemples

Représentations graphiques

Tendance, saisonnalité, résidus

Remarques complémentaires et déroulement du cours

Page 15: Introduction au cours de séries temporelles

Séries temporelles – Cours 1

Tendance, saisonnalité, résidus

Tendance, saisonnalité, résidusOn décompose souvent une série temporelle {Xt , t ∈ T} de manièreadditive

Xt = mt + st + Zt ,

ou multiplicativeXt = mtst(1+ Zt).

avec

I t 7→ mt : la tendance ou trend fonction qui varie peu (captel’orientation à long terme),

I t 7→ st : la composante saisonnière fonction périodique(comportement qui se répète),

I {Zt , t ∈ T} : la composante d’erreur ou résidu, de moyenne nulle etidéalement de faible variabilité par rapport aux deux autres.

Des combinaisons des modèles additif et multiplicatif sont aussienvisageables. Par exemple : Xt = (mt + st)Zt .

Page 16: Introduction au cours de séries temporelles

Séries temporelles – Cours 1

Tendance, saisonnalité, résidus

Estimation de la tendance par moindres carrés

I Objectif : on suppose que Xt = mt + Zt avec mt = β∗0 + β∗1 t + ...+ β∗d td

et l’on souhaite estimer β∗ = (β∗0 , ..., β∗d )

t .

I Idée : estimer β par moindres carrés à partir des observations Xt1 , ...,Xtn .

β ∈ arg minβ∈Rd+11n

∑i=1n

(Xti −mti )2 ⇒ β = (T tT )−1T tX ,

avec

T =

1 t1 t21 . . . td1...

......

...1 tn t2n . . . tdn

et X = (Xt1 , ...,Xtn )t .

I On peut choisir d ensuite par des méthodes de choix de modèles (AIC,BIC,...) ou visuellement.

Page 17: Introduction au cours de séries temporelles

Séries temporelles – Cours 1

Tendance, saisonnalité, résidus

Exemple : consommation effective annuelle, d=1

Année

Con

som

mat

ion

final

e ef

fect

ive

tota

le (

en M

)

1950 1960 1970 1980 1990 2000 2010

05

1020

30

1950 1960 1970 1980 1990 2000 2010

−4

−2

02

4

Année

Rés

idu

du m

odèl

e

Page 18: Introduction au cours de séries temporelles

Séries temporelles – Cours 1

Tendance, saisonnalité, résidus

Exemple : consommation effective annuelle, d=2

Année

Con

som

mat

ion

final

e ef

fect

ive

tota

le (

en M

)

1950 1960 1970 1980 1990 2000 2010

05

1020

30

1950 1960 1970 1980 1990 2000 2010

−2

−1

01

23

4

Année

Rés

idu

du m

odèl

e

Page 19: Introduction au cours de séries temporelles

Séries temporelles – Cours 1

Tendance, saisonnalité, résidus

Exemple : consommation effective annuelle, d=4

Année

Con

som

mat

ion

final

e ef

fect

ive

tota

le (

en M

)

1950 1960 1970 1980 1990 2000 2010

05

1020

30

1950 1960 1970 1980 1990 2000 2010

−1

01

23

Année

Rés

idu

du m

odèl

e

Page 20: Introduction au cours de séries temporelles

Séries temporelles – Cours 1

Tendance, saisonnalité, résidus

Autres méthodes

I Moyenne mobile :

mt =1

2q + 1

q∑k=−q

xt+k .

I Autres méthodes de statistique non-paramétrique : noyau,polynômes locaux,...

Page 21: Introduction au cours de séries temporelles

Séries temporelles – Cours 1

Tendance, saisonnalité, résidus

Exemple : consommation effective annuelleEstimation de la tendance par moyenne mobile (q = 2)

MA <- filter(Total.ts,filter=rep(1/3,3))par(mfrow=c(2,1))plot(Total.ts,xlab=’Année’,ylab=’Consommation finale effective totale (en M)’)points(MA,col=’red’,type=’l’)plot(Total.ts-MA,xlab=’Année’,ylab=’Résidu du modèle’,pch=3,type=’p’)

Année

Co

nso

mm

atio

n fin

ale

effe

ctiv

e to

tale

(e

n M

)

1950 1960 1970 1980 1990 2000 2010

05

10

20

30

Année

sid

u d

u m

od

èle

1950 1960 1970 1980 1990 2000 2010

-0.5

0.0

0.5

Page 22: Introduction au cours de séries temporelles

Séries temporelles – Cours 1

Tendance, saisonnalité, résidus

Estimation de la partie déterministe (tendance etsaisonnalité)

I Il existe un grand nombre de méthodes.I Fonctions implémentées dans R :

I fonction decompose() : estime mt par moyenne mobile(mt =

12q+1

∑qk=−q xt+k) puis estime st à partir de xt − mt

(pour le modèle additif) par moyenne mobile également :

st =1

k + 1

k∑j=0

(xt+jT − mt+jT ),

où T est la période (estimée par la fonction) et k choisi leplus grand possible.

I fonction stl() (plus élaboré) : estimation par maximum devraisemblance dans un modèle additif.

Page 23: Introduction au cours de séries temporelles

Séries temporelles – Cours 1

Tendance, saisonnalité, résidus

Exemple : nombre de passagers aériensEstimation par la fonction decompose() (modèle additif par défaut)

fit.decompose <- decompose(AirPassengers)plot(fit.decompose)

100

200

300

400

500

600

obse

rved

150

250

350

450

tren

d

−40

020

4060

seas

onal

−40

−20

020

4060

1950 1952 1954 1956 1958 1960

rand

om

Time

Decomposition of additive time series

Page 24: Introduction au cours de séries temporelles

Séries temporelles – Cours 1

Tendance, saisonnalité, résidus

Exemple : nombre de passagers aériensEstimation par la fonction stl()

fit.stl <- stl(AirPassengers,s.window=12)plot(fit.stl)

100

200

300

400

500

600

data

−50

050

100

seas

onal

200

300

400

500

tren

d

−20

020

40

1950 1952 1954 1956 1958 1960

rem

aind

er

time

Page 25: Introduction au cours de séries temporelles

Séries temporelles – Cours 1

Tendance, saisonnalité, résidus

Exemple : nombre de passagers aériensEstimation par la fonction decompose() (modèle multiplicatif)

fit.decompose2 <- decompose(AirPassengers,type=’multiplicative’)plot(fit.decompose2)

100

200

300

400

500

600

obse

rved

150

250

350

450

tren

d

0.8

0.9

1.0

1.1

1.2

seas

onal

0.90

0.95

1.00

1.05

1.10

1950 1952 1954 1956 1958 1960

rand

om

Time

Decomposition of multiplicative time series

Page 26: Introduction au cours de séries temporelles

Séries temporelles – Cours 1

Remarques complémentaires et déroulement du cours

Plan

Qu’est-ce qu’une série temporelle ? Exemples

Représentations graphiques

Tendance, saisonnalité, résidus

Remarques complémentaires et déroulement du cours

Page 27: Introduction au cours de séries temporelles

Séries temporelles – Cours 1

Remarques complémentaires et déroulement du cours

Étapes et objectifs de l’analyse d’une série temporelle1. Décrire, préparer :

I Corriger la série des effets systématiques (prise en compte desjours ouvrables, grèves, pannes,...), imputation des donnéesmanquantes (fonction na.approx() du package zoo parexemple),...

I Représentations graphiques : chronogramme, lag-plot,month-plot,... Permet de détecter les valeurs atypiques,anomalies,... que l’on peut traiter éventuellement comme desdonnées manquantes.

2. Modéliser : expliquer la valeur en un instant par des modèlesayant peu de paramètres.

3. Prévoir : à partir d’un modèle ou construites à partir desdonnées (lissage exponentiel par exemple).

Page 28: Introduction au cours de séries temporelles

Séries temporelles – Cours 1

Remarques complémentaires et déroulement du cours

Remarques

I Le choix d’un modèle, l’incorporation d’une composantepeuvent s’apprécier d’après le graphique et tirer leur validationde l’analyse.

I Une même série peut-être analysée de différentes façons. Rienn’interdit de superposer plusieurs approches car

I On étudie une seule réalisation d’un même processus sur unintervalle de temps fini (caractéristiques à long termeéventuellement non visible).

I Une série n’est pas nécessairement modélisée par un modèle denotre catalogue.

Box (1978) "All models are wrong but some are useful."

Page 29: Introduction au cours de séries temporelles

Séries temporelles – Cours 1

Remarques complémentaires et déroulement du cours

Déroulement du cours

I Cours 1 (20 septembre) : introduction, représentationsgraphiques, tendance, saisonnalité.

I Cours 2 (18 octobre) : processus stationnaires, modèlesARMA.

I Cours 3 (15 novembre) : lissage exponentiel.

I Cours 4 (13 décembre) : modèles non stationnaires (modèlesARIMA et SARIMA, tests de non-stationnarité).

Page 30: Introduction au cours de séries temporelles

Séries temporelles – Cours 1

Remarques complémentaires et déroulement du cours

Quelques références

I Aragon, Y. Séries temporelles avec R.

I Site web de Arthur Charpentier :freakonometrics.hypotheses.org.

I Brockwell, P. et Davis, R. Time Series : Theory and Methods.

I Brockwell, P. et Davis, R. Introduction to time series andforecasting.

I Box, G. et Jenkins, G. Time Series analysis – forecasting andcontrol.