Upload
others
View
6
Download
0
Embed Size (px)
Citation preview
Séries temporelles – Cours 1
Introduction au cours de séries temporelles
Angelina Roche
Executive Master Statistique et Big Data
2018–2019
Séries temporelles – Cours 1
Plan du cours d’aujourd’hui
Qu’est-ce qu’une série temporelle ? Exemples
Représentations graphiques
Tendance, saisonnalité, résidus
Remarques complémentaires et déroulement du cours
Séries temporelles – Cours 1
Qu’est-ce qu’une série temporelle ? Exemples
Plan
Qu’est-ce qu’une série temporelle ? Exemples
Représentations graphiques
Tendance, saisonnalité, résidus
Remarques complémentaires et déroulement du cours
Séries temporelles – Cours 1
Qu’est-ce qu’une série temporelle ? Exemples
Définition d’une série temporelle
DéfinitionsI Une série temporelle est un ensemble d’observations
Xt1 ,Xt2 , ... mesurées sur des temps t1, t2, ... distincts.
I Un processus stochastique {Xt , t ∈ T} est une famille devariables aléatoires définies sur le même espace de probabilité.
On modélisera généralement un série temporelle comme unprocessus stochastique.
Séries temporelles – Cours 1
Qu’est-ce qu’une série temporelle ? Exemples
Exemples
Année
Co
nso
mm
atio
n f
ina
le e
ffe
ctiv
e t
ota
le
1950 1960 1970 1980 1990 2000 2010
05
10
15
20
25
30
35
Figure – Évolution de la consommation effective totale annuelle (enmilliards d’euros) en France de 1949 à 2017 (cf TP 2 d’analyse dedonnées).
Séries temporelles – Cours 1
Qu’est-ce qu’une série temporelle ? Exemples
Exemples
Année
No
mb
re d
e p
assa
ge
rs a
éri
en
s
1950 1952 1954 1956 1958 1960
10
02
00
30
04
00
50
06
00
Figure – Nombre mensuel de passagers aériens sur des volsinternationaux en milliers de 1949 à 1960.
Séries temporelles – Cours 1
Qu’est-ce qu’une série temporelle ? Exemples
ExemplesStatistique
Temps
Evo
lutio
n d
e l'
inte
rêt
2005 2010 2015
20
40
60
80
BigData
Temps
Evo
lutio
n d
e l'
inte
rêt
2005 2010 2015
02
06
01
00
Figure – Évolution de l’intérêt pour les mot-clefs ’Statistique’ et ’BigData’ (source : Google trends).
Séries temporelles – Cours 1
Représentations graphiques
Plan
Qu’est-ce qu’une série temporelle ? Exemples
Représentations graphiques
Tendance, saisonnalité, résidus
Remarques complémentaires et déroulement du cours
Séries temporelles – Cours 1
Représentations graphiques
Représentations graphiques usuelles
I Le chronogramme : tracé du graphique {(t,Xt), t ∈ T} où Test l’intervalle d’observation.
I Le lag-plot ou diagramme retardé : tracé des points{(Xt−k ,Xt), t, t − k ∈ T}.Objectif : détecter des corrélations pour comprendre ladépendance de la série envers son passé.
I Le month-plot : représentation simultanée des chronogrammesassociés à chaque saison ou mois.
Séries temporelles – Cours 1
Représentations graphiques
Example : lag-plot de la consommation effective annuelle
Total.ts <- ts(t(Total),start=1949)lag.plot(Total.ts,set.lags=c(1,2,5,10),layout=c(2,2))
lag 1
xy$
y
123456789101112131415161718192021222324252627282930313233
343536373839404142
43444546474849505152
5354555657585960616263
64656667
68
0 5 10 20 30
01
02
03
04
0
lag 2xy$
y
123456789101112131415161718192021222324252627282930313233343536373839404142
43444546474849505152
5354555657585960616263
64656667
lag 5
xy$
y
123456789101112131415161718192021222324252627282930313233343536373839404142
43444546474849505152
5354555657585960616263
64
lag 10
xy$
y
123456789101112131415161718192021222324252627282930313233
343536373839404142
43444546474849505152
53545556575859
01
02
03
04
0
0 5 10 20 30
Séries temporelles – Cours 1
Représentations graphiques
Example : lag-plot du bruit blanc (pas de corrélation)
lag.plot(ts(rnorm(1000,0,1)),set.lags=c(1,5,10,100),layout=c(2,2),do.lines=FALSE)
temps
0 200 400 600 800 1000
-3-1
13
lag 1
ts(r
no
rm(1
00
0, 0
, 1))
-3-2
-10
12
3
-3 -2 -1 0 1 2 3
lag 5
ts(r
no
rm(1
00
0, 0
, 1))
lag 10
ts(r
no
rm(1
00
0, 0
, 1))
lag 100
ts(r
no
rm(1
00
0, 0
, 1))
-3-2
-10
12
3
-3 -2 -1 0 1 2 3
Séries temporelles – Cours 1
Représentations graphiques
Example : lag-plot du nombre de passagers aériens
lag.plot(AirPassengers,lags=12,layout=c(3,4),do.lines=FALSE)
lag 1
Air
Pa
sse
ng
ers
10
02
00
30
04
00
50
06
00
100 200 300 400 500 600
lag 2
Air
Pa
sse
ng
ers
lag 3
Air
Pa
sse
ng
ers
100 200 300 400 500 600
lag 4
Air
Pa
sse
ng
ers
lag 5
Air
Pa
sse
ng
ers
lag 6
Air
Pa
sse
ng
ers
lag 7
Air
Pa
sse
ng
ers
lag 8
Air
Pa
sse
ng
ers
10
02
00
30
04
00
50
06
00
lag 9
Air
Pa
sse
ng
ers
10
02
00
30
04
00
50
06
00
lag 10
Air
Pa
sse
ng
ers
100 200 300 400 500 600lag 11
Air
Pa
sse
ng
ers
lag 12
Air
Pa
sse
ng
ers
100 200 300 400 500 600
Séries temporelles – Cours 1
Représentations graphiques
Example : month-plot du nombre de passagers aériens
monthplot(AirPassengers)AirPassengers
J F M A M J J A S O N D
100
200
300
400
500
600
Séries temporelles – Cours 1
Tendance, saisonnalité, résidus
Plan
Qu’est-ce qu’une série temporelle ? Exemples
Représentations graphiques
Tendance, saisonnalité, résidus
Remarques complémentaires et déroulement du cours
Séries temporelles – Cours 1
Tendance, saisonnalité, résidus
Tendance, saisonnalité, résidusOn décompose souvent une série temporelle {Xt , t ∈ T} de manièreadditive
Xt = mt + st + Zt ,
ou multiplicativeXt = mtst(1+ Zt).
avec
I t 7→ mt : la tendance ou trend fonction qui varie peu (captel’orientation à long terme),
I t 7→ st : la composante saisonnière fonction périodique(comportement qui se répète),
I {Zt , t ∈ T} : la composante d’erreur ou résidu, de moyenne nulle etidéalement de faible variabilité par rapport aux deux autres.
Des combinaisons des modèles additif et multiplicatif sont aussienvisageables. Par exemple : Xt = (mt + st)Zt .
Séries temporelles – Cours 1
Tendance, saisonnalité, résidus
Estimation de la tendance par moindres carrés
I Objectif : on suppose que Xt = mt + Zt avec mt = β∗0 + β∗1 t + ...+ β∗d td
et l’on souhaite estimer β∗ = (β∗0 , ..., β∗d )
t .
I Idée : estimer β par moindres carrés à partir des observations Xt1 , ...,Xtn .
β ∈ arg minβ∈Rd+11n
∑i=1n
(Xti −mti )2 ⇒ β = (T tT )−1T tX ,
avec
T =
1 t1 t21 . . . td1...
......
...1 tn t2n . . . tdn
et X = (Xt1 , ...,Xtn )t .
I On peut choisir d ensuite par des méthodes de choix de modèles (AIC,BIC,...) ou visuellement.
Séries temporelles – Cours 1
Tendance, saisonnalité, résidus
Exemple : consommation effective annuelle, d=1
Année
Con
som
mat
ion
final
e ef
fect
ive
tota
le (
en M
)
1950 1960 1970 1980 1990 2000 2010
05
1020
30
1950 1960 1970 1980 1990 2000 2010
−4
−2
02
4
Année
Rés
idu
du m
odèl
e
Séries temporelles – Cours 1
Tendance, saisonnalité, résidus
Exemple : consommation effective annuelle, d=2
Année
Con
som
mat
ion
final
e ef
fect
ive
tota
le (
en M
)
1950 1960 1970 1980 1990 2000 2010
05
1020
30
1950 1960 1970 1980 1990 2000 2010
−2
−1
01
23
4
Année
Rés
idu
du m
odèl
e
Séries temporelles – Cours 1
Tendance, saisonnalité, résidus
Exemple : consommation effective annuelle, d=4
Année
Con
som
mat
ion
final
e ef
fect
ive
tota
le (
en M
)
1950 1960 1970 1980 1990 2000 2010
05
1020
30
1950 1960 1970 1980 1990 2000 2010
−1
01
23
Année
Rés
idu
du m
odèl
e
Séries temporelles – Cours 1
Tendance, saisonnalité, résidus
Autres méthodes
I Moyenne mobile :
mt =1
2q + 1
q∑k=−q
xt+k .
I Autres méthodes de statistique non-paramétrique : noyau,polynômes locaux,...
Séries temporelles – Cours 1
Tendance, saisonnalité, résidus
Exemple : consommation effective annuelleEstimation de la tendance par moyenne mobile (q = 2)
MA <- filter(Total.ts,filter=rep(1/3,3))par(mfrow=c(2,1))plot(Total.ts,xlab=’Année’,ylab=’Consommation finale effective totale (en M)’)points(MA,col=’red’,type=’l’)plot(Total.ts-MA,xlab=’Année’,ylab=’Résidu du modèle’,pch=3,type=’p’)
Année
Co
nso
mm
atio
n fin
ale
effe
ctiv
e to
tale
(e
n M
)
1950 1960 1970 1980 1990 2000 2010
05
10
20
30
Année
Ré
sid
u d
u m
od
èle
1950 1960 1970 1980 1990 2000 2010
-0.5
0.0
0.5
Séries temporelles – Cours 1
Tendance, saisonnalité, résidus
Estimation de la partie déterministe (tendance etsaisonnalité)
I Il existe un grand nombre de méthodes.I Fonctions implémentées dans R :
I fonction decompose() : estime mt par moyenne mobile(mt =
12q+1
∑qk=−q xt+k) puis estime st à partir de xt − mt
(pour le modèle additif) par moyenne mobile également :
st =1
k + 1
k∑j=0
(xt+jT − mt+jT ),
où T est la période (estimée par la fonction) et k choisi leplus grand possible.
I fonction stl() (plus élaboré) : estimation par maximum devraisemblance dans un modèle additif.
Séries temporelles – Cours 1
Tendance, saisonnalité, résidus
Exemple : nombre de passagers aériensEstimation par la fonction decompose() (modèle additif par défaut)
fit.decompose <- decompose(AirPassengers)plot(fit.decompose)
100
200
300
400
500
600
obse
rved
150
250
350
450
tren
d
−40
020
4060
seas
onal
−40
−20
020
4060
1950 1952 1954 1956 1958 1960
rand
om
Time
Decomposition of additive time series
Séries temporelles – Cours 1
Tendance, saisonnalité, résidus
Exemple : nombre de passagers aériensEstimation par la fonction stl()
fit.stl <- stl(AirPassengers,s.window=12)plot(fit.stl)
100
200
300
400
500
600
data
−50
050
100
seas
onal
200
300
400
500
tren
d
−20
020
40
1950 1952 1954 1956 1958 1960
rem
aind
er
time
Séries temporelles – Cours 1
Tendance, saisonnalité, résidus
Exemple : nombre de passagers aériensEstimation par la fonction decompose() (modèle multiplicatif)
fit.decompose2 <- decompose(AirPassengers,type=’multiplicative’)plot(fit.decompose2)
100
200
300
400
500
600
obse
rved
150
250
350
450
tren
d
0.8
0.9
1.0
1.1
1.2
seas
onal
0.90
0.95
1.00
1.05
1.10
1950 1952 1954 1956 1958 1960
rand
om
Time
Decomposition of multiplicative time series
Séries temporelles – Cours 1
Remarques complémentaires et déroulement du cours
Plan
Qu’est-ce qu’une série temporelle ? Exemples
Représentations graphiques
Tendance, saisonnalité, résidus
Remarques complémentaires et déroulement du cours
Séries temporelles – Cours 1
Remarques complémentaires et déroulement du cours
Étapes et objectifs de l’analyse d’une série temporelle1. Décrire, préparer :
I Corriger la série des effets systématiques (prise en compte desjours ouvrables, grèves, pannes,...), imputation des donnéesmanquantes (fonction na.approx() du package zoo parexemple),...
I Représentations graphiques : chronogramme, lag-plot,month-plot,... Permet de détecter les valeurs atypiques,anomalies,... que l’on peut traiter éventuellement comme desdonnées manquantes.
2. Modéliser : expliquer la valeur en un instant par des modèlesayant peu de paramètres.
3. Prévoir : à partir d’un modèle ou construites à partir desdonnées (lissage exponentiel par exemple).
Séries temporelles – Cours 1
Remarques complémentaires et déroulement du cours
Remarques
I Le choix d’un modèle, l’incorporation d’une composantepeuvent s’apprécier d’après le graphique et tirer leur validationde l’analyse.
I Une même série peut-être analysée de différentes façons. Rienn’interdit de superposer plusieurs approches car
I On étudie une seule réalisation d’un même processus sur unintervalle de temps fini (caractéristiques à long termeéventuellement non visible).
I Une série n’est pas nécessairement modélisée par un modèle denotre catalogue.
Box (1978) "All models are wrong but some are useful."
Séries temporelles – Cours 1
Remarques complémentaires et déroulement du cours
Déroulement du cours
I Cours 1 (20 septembre) : introduction, représentationsgraphiques, tendance, saisonnalité.
I Cours 2 (18 octobre) : processus stationnaires, modèlesARMA.
I Cours 3 (15 novembre) : lissage exponentiel.
I Cours 4 (13 décembre) : modèles non stationnaires (modèlesARIMA et SARIMA, tests de non-stationnarité).
Séries temporelles – Cours 1
Remarques complémentaires et déroulement du cours
Quelques références
I Aragon, Y. Séries temporelles avec R.
I Site web de Arthur Charpentier :freakonometrics.hypotheses.org.
I Brockwell, P. et Davis, R. Time Series : Theory and Methods.
I Brockwell, P. et Davis, R. Introduction to time series andforecasting.
I Box, G. et Jenkins, G. Time Series analysis – forecasting andcontrol.