Upload
marina-mouni
View
68
Download
1
Embed Size (px)
La Méthodologie de Box-Jenkins
Michel Tenenhaus
2
1. Les données
• Une série chronologique assez longue
(n 50).
• Exemple : Ventes d’anti-inflammatoires en France de janvier 1978 à juillet 1982.
• Objectif : Prévoir les ventes d’août à décembre 1982.
1( ,..., ,..., )t nz z z
3
date ventes date ventes date ventes
JAN 1978 3 741 JAN 1980 4 687 JAN 1982 4 764 FEB 1978 3 608 FEB 1980 4 704 FEB 1982 4 726 MAR 1978 3 735 MAR 1980 4 579 MAR 1982 5 080 APR 1978 3 695 APR 1980 4 800 APR 1982 4 952 MAY 1978 3 810 MAY 1980 4 485 MAY 1982 4 633 JUN 1978 3 819 JUN 1980 4 617 JUN 1982 4 830 JUL 1978 3 291 JUL 1980 4 491 JUL 1982 4 460 AUG 1978 3 053 AUG 1980 3 832 SEP 1978 3 908 SEP 1980 4 669 OCT 1978 4 035 OCT 1980 5 193 NOV 1978 3 933 NOV 1980 4 544 DEC 1978 4 004 DEC 1980 4 676 JAN 1979 3 961 JAN 1981 4 709 FEB 1979 4 025 FEB 1981 4 705 MAR 1979 4 336 MAR 1981 4 677 APR 1979 4 335 APR 1981 4 627 MAY 1979 4 412 MAY 1981 4 555 JUN 1979 4 268 JUN 1981 4 570 JUL 1979 3 968 JUL 1981 4 457 AUG 1979 3 505 AUG 1981 3 589 SEP 1979 4 434 SEP 1981 4 636 OCT 1979 4 854 OCT 1981 5 077 NOV 1979 4 592 NOV 1981 4 623 DEC 1979 4 264 DEC 1981 4 591
Marché totaldes anti-inflammatoires
4
Marché total des anti-inflammatoires
5
2. Stabiliser la série
Il faut TRANSFORMER la série observée de manière à
- enlever la tendance,
- enlever la saisonnalité,
- stabiliser la variance.
6
Pour enlever la tendance
Faire des différences régulières d’ordre d :
1 (1 )t t tz z B z 1où t tBz z
d = 22
1(1 ) (1 ) (1 )t t tB z B z B z
d = 1
Différence régulière d’ordre d :
(1 )dt tw B z Dans la pratique
d = 0,1, rarement 2
7
Marché total des anti-inflammatoires : Différence régulière d’ordre d = 1
8
Dans la pratique D = 0,1,très très rarement 2
Pour enlever la saisonnalité
Faire des différences saisonnières d’ordre D :
(1 )st t s tz z B z
D = 22(1 ) (1 ) (1 )s s s
t t s tB z B z B z
D = 1
Différence saisonnière d’ordre D :
(1 )s Dt tw B z
Ordre de la saisonnalité : s = 12 (mois) ou 4 (trimestre)
9
Marché total des anti-inflammatoires : Différence saisonnière (s = 12) d’ordre D = 1
10
Pour enlever tendance et saisonnalité
Formule générale :
(1 ) (1 )d s Dt tw B B z
On peut choisir d et D minimisant l’écart-type de wt.
Application Marché total : s = 12, d = 1, D = 1
1212 1 13(1 )(1 ) ( ) ( )t t t t t tw B B z z z z z
11
Marché total des anti-inflammatoires : Différence régulière/saisonnière (s = 12, d = 1, D = 1)
12
Calcul des séries différenciéesDonnées (20 premiers mois)
JAN 1978 3741 . . .
FEB 1978 3608 -133 . .
MAR 1978 3735 127 . .
APR 1978 3695 -40 . .
MAY 1978 3810 115 . .
JUN 1978 3819 9 . .
JUL 1978 3291 -528 . .
AUG 1978 3053 -238 . .
SEP 1978 3908 855 . .
OCT 1978 4035 127 . .
NOV 1978 3933 -102 . .
DEC 1978 4004 71 . .
JAN 1979 3961 -43 220 .
FEB 1979 4025 64 417 197
MAR 1979 4336 311 601 184
APR 1979 4335 -1 640 39
MAY 1979 4412 77 602 -38
JUN 1979 4268 -144 449 -153
JUL 1979 3968 -300 677 228
AUG 1979 3505 -463 452 -225
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
DATE ventes DIFF(ventes,1) SDIFF(ventes,1,12) DIFF(ventes_2,1)
13
Calcul des écarts-typesDescriptive Statistics
55 3053 4347.71 478.613
54 -868 13.31 382.030
43 -243 263.47 279.368
42 -436 -5.17 242.719
ventes
DIFF(ventes,1)
SDIFF(ventes,1,12)
DIFF(SDIFF(ventes,1,12),1)
N Minimum Mean Std. Deviation
s = 12, d = 1, D = 1
14
Développement de zt
12 1 13( ) ( )t t t t tw z z z z De
On déduit
12 1 13 ( ) t t t t tz z z z w
valeur1 an avant
évaluationde la tendance
1 an avant
termealéatoire
On va modéliser la série « stationnaire » wt.
15
Pour stabiliser la variance
On utilise souvent les transformations ( ) ou t tLog z z
16
3. Le modèle statistique
On suppose que la série stabilisée (w1,…,wN)provient d’un processus stationnaire (wt) :
2
( )
( )
( , )
t
t w
k t t k
E w
Var w
Cor w w
Indépendantde la période t
Dans des conditions assez générales tout processusstationnaire peut être approché par des modèles AR(p), MA(q) ou ARMA(p,q).
17
AR(p) : Auto-régressif d’ordre p
2
( ) 0
( )
( , ) 0 pour tout 1,2,...
t
t
t t k
E a
Var a
Cor a a k
1 1 ...t t p t p tw w w a
où at est un bruit blanc :
Remarque : 1(1 ... )p
18
MA(q) : Moyenne Mobile d’ordre q
1 1 ...t t t q t qw a a a
Remarque :
19
ARMA(p,q)
1 1 1 1... ...t t p t p t t q t qw w w a a a
Remarque : 1(1 ... )p
20
Question
Comment choisir le modèlecorrespondant le mieux aux donnéesétudiées ?
Réponse
On utilise les autocorrélations k et les autocorrélations partielles kk.
21
4. Autocorrélation
1
2
1
( , )
( )( ) = estimation de
( )
k t t k
N
t t kt k
k kN
tt
Cor w w
w w w wr
w w
22
Exemple : Marché TotalDifférence régulière/saisonnière : d = 1, D = 1
Autocorrélationscalculées
Autocorrelations
Series: ventes
-.515 .154 11.937 1 .001
.016 .191 11.948 2 .003
.189 .191 13.635 3 .003
-.200 .195 15.581 4 .004
.062 .200 15.770 5 .008
.174 .201 17.326 6 .008
-.243 .204 20.449 7 .005
.076 .211 20.759 8 .008
.081 .212 21.127 9 .012
-.210 .212 23.686 10 .008
.344 .217 30.755 11 .001
-.312 .230 36.747 12 .000
.114 .240 37.574 13 .000
-.139 .241 38.842 14 .000
.140 .243 40.184 15 .000
-.072 .245 40.549 16 .001
Lag1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Autocorrelation Std. Error
aValue df Sig.
bBox-Ljung Statistic
The underlying process assumed is MA with the order equal tothe lag number minus one. The Bartlett approximation is used.
a.
Based on the asymptotic chi-square approximation.b.
23
Exemple : Marché TotalDifférence régulière/saisonnière : d = 1, D = 1
Corrélogrammeobservé
Formulede Bartlett
24
Variance des autocorrélations rk
Formule de Bartlett
(Hypothèse : h = 0 pour h k)
2 2 21 1
1( ) (1 2 ... 2 ) estimation de ( )k k ks r r r Var r
N
Formule de Box-Jenkins pour un bruit blanc
(Hypothèse : h = 0 pour h 1)
2 1( ) estimation de ( )
2k k
N ks r Var r
N N
25
Test : H0 : k = 0
On rejette H0 : k = 0 au risque = 0.05 si
2 ( )k kr s r
Application Marché total :
1 = 0, k = 0 pour k > 1
Corrélogrammethéorique
0
k
1 k
26
5. Autocorrélation partielle
Régression de wt sur wt-1,…,wt-k :
0 1 1 ...t k k t kk t k tw w w
Autocorrélation partielle d’ordre k : kk
C’est une corrélation partielle :
1 1( , | ,..., )kk t t k t t kCor w w w w
27
Calcul pratique de estimation de kk
1 2 1
1 3 2
1 2 1
1 2 1
1 3 2
1 2 1
1
1
1
1
1
k
k
k k kkk
k k
k k
k k
Soit :
111 11
1
21 2 2 1
22 21 1
1
1
1 1
1
Etc…
On obtient les estimations des kk en remplaçant les k par rk. ˆkk
ˆkk
28
Partial Autocorrelations
Series: ventes
-.515 .154
-.339 .154
.039 .154
-.073 .154
-.073 .154
.186 .154
-.012 .154
-.097 .154
.001 .154
-.139 .154
.238 .154
-.116 .154
.029 .154
-.343 .154
.022 .154
-.053 .154
Lag1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
PartialAutocorrelation Std. Error
Exemple : Marché TotalDifférence régulière/saisonnière : d = 1, D = 1
Autocorrélations partielles calculées
Rejet deH0 : kk = 0si:
ˆ 2 /kk N
29
Corrélogramme partiel observé
Corrélogrammepartiel théorique
0
kk
1 k
142
30
6. Autocorrélations et autocorrélations partielles des modèles AR(p) et MA(q)
Corrélogramme Corrélogramme partiel
(a)
(a)
(b)
(b)
10.5t t tw w a (a) :
10.5t t tw w a (b) :
AR(1)
31
Corrélogramme Corrélogramme partiel (a)
(a)
(b)
(b)
AR(2)
1 2.8 .15t t t tw w w a (a) :
(b) :
1 2.5t t t tw w w a
Le dernier pic significatif du corrélogramme partiel donnel’ordre p du modèle AR(p).
32
Corrélogramme Corrélogramme partiel (a)
(a)
(b)
(b)
MA(1)
1.7t t tw a a (a) :
(b) :
1.7t t tw a a
33
MA(q)
1 2.5 .3t t t tw a a a (a) : q = 2
(b) : q = 5
5.7t t tw a a
Corrélogramme de différents processus MA(q)
(a)
(b)
(c)
(c) : q = 6
1 6.3 .6t t t tw a a a
Le dernier pic significatif du corrélogramme donne l’ordre q du modèle MA(q).
34
7. Étude de la série Marché Total
• Les autocorrélations suggèrent un modèle MA(1).
• Les autocorrélations partielles suggèrent un modèle AR(14).
35
7.1 Étude de la voie moyenne mobile
On suppose que wt suit un modèle MA(1) :
1
2( )
t t t
t
w a a
Var a
et on a = E(wt) = .
On choisit les paramètres , et 2 à l’aidede la méthode du maximum de vraisemblance.
36
Maximum de vraisemblance
• On suppose que le vecteur aléatoire w = (w1,…,wN) suit une loi multinormale. • Densité de probabilité de w :
21
2 1 '
/ 2 2
( ,..., | , , )
1 1 exp ( ) ( , ) ( )
2(2 ) ( , )
N
N
p w w
w - μ Σ w - μ
Σ
• On recherche maximisant la vraisemblance
2ˆˆ ˆ, et
21
ˆˆ ˆ( ,..., | , , )Np w w
37
Qualité de l’ajustement dans ARIMA
2 ( ) 2
2 ( ) ( )
AIC Log r
SBC Log rLog N
On recherche le modèle minimisant SBC.
où r est le nombre de paramètres (hors 2).
38
Modèle MA(1) avec constante
1t t tw a a
Residual Diagnostics
42
1
40
1585179
1591466
39100.764
197.739
-280.918
565.835
569.311
Number of Residuals
Number of Parameters
Residual df
Adjusted Residual Sum ofSquares
Residual Sum of Squares
Residual Variance
Model Std. Error
Log-Likelihood
Akaike's InformationCriterion (AIC)
Schwarz's BayesianCriterion (BIC)
Parameter Estimates
.657 -7.772
.123 10.990
5.326 -.707
.000 .484
Estimates
Std Error
t
Approx Sig
MA1
Non-Seasonal
Lags
Constant
Melard's algorithm was used for estimation.
39
Modèle MA(1) sans constante
1t t tw a a
Residual Diagnostics
42
1
41
1603132
1620350
38625.634
196.534
-281.143
564.285
566.023
Number of Residuals
Number of Parameters
Residual df
Adjusted Residual Sum ofSquares
Residual Sum of Squares
Residual Variance
Model Std. Error
Log-Likelihood
Akaike's InformationCriterion (AIC)
Schwarz's BayesianCriterion (BIC)
Parameter Estimates
.634
.125
5.066
.000
Estimates
Std Error
t
Approx Sig
MA1
Non-Seasonal Lags
Melard's algorithm was used for estimation.
40
Modélisation de zt
12 1 13 1( ) ( )t t t t t t tw z z z z a a De
On déduit
12 1 13 1 ( ) t t t t t tz z z z a a
marché1 an avant
évaluationde la tendance
1 an avant
chocaléatoire
en t
chocaléatoire
en t-1
41
Calcul des prévisions et des erreurs
Modèle : 12 1 13 1t t t t t tz z z z a a
Prévision de zt réalisée en t-1 :
12 1 13 1ˆt t t t tz z z z a
Erreur de prévision à l’horizon 1 :
ˆt t ta z z
Calcul pratique des prévisions et des erreurs sur l’historique:
12 1 13 1ˆ ˆˆ ˆ ˆˆ ˆ et t t t t t t t tz z z z a a z z
42
Résultats
43
Résultats (suite)
44
Résultats (fin)
Vérifier les calculs pour 55 55ˆ ˆˆ et z a
45
Graphique des ventes observées et prédites
46
Graphique des résidus
ˆLimite à 2
47
Qualité de l’ajustement dans Time Series Modeler
2ˆ ( )Normalized BIC 2 ( )ta Log N
Log rN r N
2 2
2 2
ˆ ˆˆ ˆStationary R-Squared 1 1
t t t tt t
t tt t
w w z z
w w w w
48
Validation du modèle Étude des ˆ( )k tr a
Autocorrelations
Series: Error for ventes from ARIMA, MOD_2, NOCON
-.087 .149 .342 1 .558
.072 .147 .581 2 .748
.188 .145 2.253 3 .522
-.079 .143 2.556 4 .635
.128 .141 3.379 5 .642
.164 .140 4.768 6 .574
-.168 .138 6.265 7 .509
.031 .136 6.316 8 .612
.063 .134 6.535 9 .685
-.115 .132 7.304 10 .696
.208 .130 9.894 11 .540
-.281 .127 14.747 12 .256
-.076 .125 15.119 13 .300
-.157 .123 16.750 14 .270
.062 .121 17.017 15 .318
-.054 .119 17.222 16 .371
Lag1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Autocorrelation Std. Error
aValue df Sig.
bBox-Ljung Statistic
The underlying process assumed is independence (whitenoise).
a.
Based on the asymptotic chi-square approximation.b.
49
Validation du modèleCorrélogramme des ˆ( )k tr a
Formule deBox-Jenkins
Corrélogrammethéorique des erreurs bt
0
k(bt)
12 k
50
Validation du modèle : Utilisation de la statistique de Ljung-Box
La statistique de Ljung-Box
22
1
ˆ( )( 2)
mk t
mk
r aN N
N k
suit une loi du khi-deux à m-r ddl lorsque les résidusforment un bruit blanc.On accepte le modèle étudié si les niveaux de signification
2 2Prob( ( ) )mm r
sont > .05 pour différentes valeurs de m.
51
Utilisation du modèle estimé en prévision
Modèle : 12 1 13 1t t t t t tz z z z a a
Prévision de z55+h réalisée en t = 55 :
56 44 55 43 55ˆ ˆz z z z a h = 1
57 45 56 44ˆ ˆz z z z h = 2
Et ainsi de suite…
52
Application
AUG 1982 3716.13 3319.22 4113.04 196.53
SEP 1982 4763.13 4340.43 5185.82 209.30
OCT 1982 5204.13 4757.13 5651.12 221.34
NOV 1982 4750.13 4280.09 5220.17 232.75
DEC 1982 4718.13 4226.12 5210.14 243.62
1
2
3
4
5
DATE. Fit for ventes 95% LCL 95% UCL SE of Fit
53
Intervalle de prévision à 95% de z55+h
Chaque modèle a sa propre formule de constructionde l’intervalle de prévision.
255 .975
ˆˆˆ ( ) 1 ( 1)(1 )hz t N r h
Modèle MA(1) :
54
55
Amélioration du modèle MA(1)
• On suppose maintenant le modèle
• est significatif.12 ˆ( ) .281tr a
1
12 , où bruit blanct t t
t t t t
w b b
b a a a
• De 12(1 ) et (1 )t t t tw B b b B a
on déduit :12(1 )(1 )t tw B B a
56
Demande SPSS
57
Résultats
Parameter Estimates
.715 .765 -11.468
.107 .399 5.219
6.693 1.918 -2.197
.000 .062 .034
Estimates
Std Error
t
Approx Sig
MA1
Non-SeasonalLags
Seasonal MA1
SeasonalLags
Constant
Melard's algorithm was used for estimation.
Residual Diagnostics
42
2
39
1268226.611
1336414.106
25544.245
159.826
-276.531
559.062
564.275
Number of Residuals
Number of Parameters
Residual df
Adjusted Residual Sum of Squares
Residual Sum of Squares
Residual Variance
Model Std. Error
Log-Likelihood
Akaike's InformationCriterion (AIC)
Schwarz's BayesianCriterion (BIC)
12(1 )(1 )t tw B B a
58
7.2 Étude de la voie autorégressive
On suppose que wt suit un modèle AR(14) :
1 1 14 14
2
...
( )
t t t t
t
w w w a
Var a
et on a = (1 - 1 -…- 14).
On choisit les paramètres , 1,…,14 et 2 à l’aidede la méthode du maximum de vraisemblance.
est appeléConstant dansSPSS
59
Résultats
1 1 14 14...t t t tw w w a
Residual Diagnostics
42
14
27
949178.0
1041062
28699.741
169.410
-270.689
571.379
597.444
Number of Residuals
Number of Parameters
Residual df
Adjusted Residual Sum ofSquares
Residual Sum of Squares
Residual Variance
Model Std. Error
Log-Likelihood
Akaike's InformationCriterion (AIC)
Schwarz's BayesianCriterion (BIC)
Parameter Estimates
-.680 .156 -4.367 .000
-.441 .169 -2.614 .014
.059 .188 .311 .758
.034 .184 .185 .855
.107 .191 .560 .580
.138 .214 .644 .525
-.051 .254 -.200 .843
-.016 .240 -.067 .947
-.006 .232 -.026 .980
-.054 .237 -.228 .821
.185 .234 .791 .436
-.307 .227 -1.355 .187
-.428 .208 -2.059 .049
-.572 .156 -3.668 .001
-10.788 9.983 -1.081 .289
AR1
AR2
AR3
AR4
AR5
AR6
AR7
AR8
AR9
AR10
AR11
AR12
AR13
AR14
Non-SeasonalLags
Constant
Estimates Std Error t Approx Sig
Melard's algorithm was used for estimation.
60
Modèle AR : p = (1,2,12,13,14) avec cste
1 1 2 2 12 12 13 13 14 14t t t t t t tw w w w w w a
Demande SPSS
61
Résultats
1 1 2 2 12 12 13 13 14 14t t t t t t tw w w w w w a
Parameter Estimates
-.775 .127 -6.083 .000
-.490 .122 -4.006 .000
-.512 .138 -3.711 .001
-.594 .159 -3.733 .001
-.526 .145 -3.619 .001
-12.797 7.487 -1.709 .096
AR1
AR2
AR12
AR13
AR14
Non-SeasonalLags
Constant
Estimates Std Error t Approx Sig
Melard's algorithm was used for estimation.
Residual Diagnostics
42
5
36
1093774.600
1192109.813
25711.840
160.349
-273.114
558.228
568.654
Number of Residuals
Number ofParameters
Residual df
Adjusted Residual Sum of Squares
Residual Sum ofSquares
Residual Variance
Model Std. Error
Log-Likelihood
Akaike's InformationCriterion (AIC)
Schwarz's BayesianCriterion (BIC)
62
Modèle AR : p = (1,2,12,13,14) sans cste
1 1 2 2 12 12 13 13 14 14t t t t t t tw w w w w w a
Demande SPSS
63
Résultats
1 1 2 2 12 12 13 13 14 14t t t t t t tw w w w w w a
Residual Diagnostics
42
5
37
1172013
1233379
27877.941
166.967
-274.563
559.127
567.815
Number ofResiduals
Number ofParameters
Residual df
Adjusted ResidualSum of Squares
Residual Sum ofSquares
Residual Variance
Model Std. Error
Log-Likelihood
Akaike's InformationCriterion (AIC)
Schwarz's BayesianCriterion (BIC)
Parameter Estimates
-.747 .134 -5.591 .000
-.460 .129 -3.568 .001
-.454 .148 -3.066 .004
-.508 .171 -2.975 .005
-.467 .154 -3.041 .004
AR1
AR2
AR12
AR13
AR14
Non-SeasonalLags
Estimates Std Error t Approx Sig
Melard's algorithm was used for estimation.
64
Modèle AR : p = 2, P = 1 avec cste
2 121 2(1 )(1 ) t tB B B w a
Demande SPSS
65
Résultats
2 121 2(1 )(1 ) t tB B B w a
Residual Diagnostics
42
3
38
1196121
1286077
27725.190
166.509
-274.998
557.997
564.948
Number ofResiduals
Number ofParameters
Residual df
Adjusted ResidualSum of Squares
Residual Sum ofSquares
Residual Variance
Model Std. Error
Log-Likelihood
Akaike's InformationCriterion (AIC)
Schwarz's BayesianCriterion (BIC)
Parameter Estimates
-.759 .139 -5.445 .000
-.523 .132 -3.970 .000
-.557 .146 -3.812 .000
-12.289 8.308 -1.479 .147
AR1
AR2
Non-SeasonalLags
Seasonal AR1Seasonal Lags
Constant
Estimates Std Error t Approx Sig
Melard's algorithm was used for estimation.
66
Modèle AR : p = 2, P = 1 sans cste
2 121 2(1 )(1 ) t tB B B w a
Demande SPSS
67
Résultats
2 121 2(1 )(1 ) t tB B B w a
Residual Diagnostics
42
3
39
1256636
1315334
29246.908
171.017
-276.033
558.066
563.279
Number ofResiduals
Number ofParameters
Residual df
Adjusted ResidualSum of Squares
Residual Sum ofSquares
Residual Variance
Model Std. Error
Log-Likelihood
Akaike's InformationCriterion (AIC)
Schwarz's BayesianCriterion (BIC)
Parameter Estimates
-.731 .143 -5.101 .000
-.481 .135 -3.562 .001
-.489 .154 -3.186 .003
AR1
AR2
Non-SeasonalLags
Seasonal AR1Seasonal Lags
Estimates Std Error t Approx Sig
Melard's algorithm was used for estimation.
68
Résultats
2 121 2(1 )(1 ) t tB B B w a
69
Résultats avec Time Series Modeler
2 121 2(1 )(1 ) t tB B B w a
Forecast
3818 4792 5192 4688 4742
4163 5150 5567 5123 5197
3472 4434 4817 4253 4288
Forecast
UCL
LCL
Modelventes-Model_1
Aug 1982 Sep 1982 Oct 1982 Nov 1982 Dec 1982
For each model, forecasts start after the last non-missing in the range of the requestedestimation period, and end at the last period for which non-missing values of all the predictorsare available or at the end date of the requested forecast period, whichever is earlier.
70
Résultats avec Time Series Modeler2 12
1 2(1 )(1 ) t tB B B w a
71
7.3 Étude de la voie AR/MA
2 121 2(1 ) (1 )t tB B w B a Modèle avec
constante
72
Résultats
2 121 2(1 ) (1 )t tB B w B a
Residual Diagnostics
42
3
38
1112464
1256550
19325.966
139.018
-274.630
557.261
564.211
Number of Residuals
Number of Parameters
Residual df
Adjusted Residual Sum ofSquares
Residual Sum of Squares
Residual Variance
Model Std. Error
Log-Likelihood
Akaike's InformationCriterion (AIC)
Schwarz's BayesianCriterion (BIC)
Parameter Estimates
-.765 .123 -6.228 .000
-.558 .114 -4.911 .000
.965 2.964 .326 .747
-11.009 6.504 -1.693 .099
AR1
AR2
Non-SeasonalLags
Seasonal MA1Seasonal Lags
Constant
Estimates Std Error t Approx Sig
Melard's algorithm was used for estimation.
Warnings
Our tests have determined that the estimated model lies close to the boundary of theinvertibility region. Although the moving average parameters are probably correctlyestimated, their standard errors and covariances should be considered suspect.
73
7.3 Étude de la voie AR/MA
2 121 2(1 ) (1 )t tB B w B a Modèle sans
constante
74
Résultats
2 121 2(1 ) (1 )t tB B w B a
Residual Diagnostics
42
3
39
1190270
1287295
24282.930
155.830
-275.152
556.304
561.517
Number of Residuals
Number of Parameters
Residual df
Adjusted Residual Sum ofSquares
Residual Sum of Squares
Residual Variance
Model Std. Error
Log-Likelihood
Akaike's InformationCriterion (AIC)
Schwarz's BayesianCriterion (BIC)
Parameter Estimates
-.736 .134 -5.488 .000
-.506 .124 -4.074 .000
.745 .360 2.071 .045
AR1
AR2
Non-SeasonalLags
Seasonal MA1Seasonal Lags
Estimates Std Error t Approx Sig
Melard's algorithm was used for estimation.
75
Résultats2 12
1 2(1 ) (1 )t tB B w B a
76
Résultats (avec Time Series Modeler)2 12
1 2(1 ) (1 )t tB B w B a
Forecast
3861 4854 5206 4810 4798
4184 5187 5553 5215 5220
3539 4521 4858 4405 4375
Forecast
UCL
LCL
Modelventes-Model_1
Aug 1982 Sep 1982 Oct 1982 Nov 1982 Dec 1982
For each model, forecasts start after the last non-missing in the range of the requestedestimation period, and end at the last period for which non-missing values of all the predictorsare available or at the end date of the requested forecast period, whichever is earlier.
77
Résultats (avec Time Series Modeler)2 12
1 2(1 ) (1 )t tB B w B a
78
8. Le modèle multiplicatif usuelARIMA(p,d,q)*(P,D,Q)s
( ) (1 ) (1 ) ( )s d s D st w tB B B B z B B a
1
1
1
1
( ) 1 ...
( ) 1 ...
( ) 1 ...
( ) 1 ...
pp
s s sPP
s s sQQ
B B B
B B B
B B B
B B B
où :
Tous ces polynômes doivent être inversibles.
wtbruitblanc
79
9. Prévision
(1 ) (1 )d s Dt tB B B z B a
Le modèle général
peut s’écrire :
1 1 1 1... ...t t p t p t t q t qz z z a a a
80
Prévision à l’horizon h
Modèle
1 1 1 1... ...t h t h p t h p t h t h q t h qz z z a a a
Prévision
1 1 1 1ˆ ˆ ˆˆ ˆ ˆ ˆˆ ˆ ˆ( ) ... ...t t h p t h p t h q t h qz h z z a a
avec : si 0
ˆˆ ( ) si 0
t h jt h j
t
z h jz
z h j h j
81
10. Calcul de l’intervalle de prévision
( )(1 ) (1 ) ( )s d s D st tB B B B z B B a
De
on déduit (formellement) :
1 1
1 1 2 2
' ( )(1 ) (1 ) ( )
' ...
s d s D st t
t t t
z B B B B B B a
a a a
82
Prévision de zt+h à l’instant t
• On a
1 1 2 2 1 1
1 1
' ...
...
t h t h t h t h h t
h t h t
z a a a a
a a
Futur
Passé
1 1ˆ ( ) ' ...t h t h tz h a a
• D’où la prévision de zt+h à l’instant t
83
Erreur de prévision à l’horizon h
1 1 2 2 1 1
ˆ( ) ( )
...
t t h t
t h t h t h h t
e h z z h
a a a a
D’où :
2 2 21 1[ ( )] 1 ...t hVar e h
[ ( )] 0tE e h
84
Intervalle de prévision à 95%de zt+h réalisé à l’instant t
2 2.975 1 1ˆˆ ( ) ( ) 1 ...t hz h t N r
85
Exemple « Marché Total »
12(1 )(1 ) (1 )t tB B z B a Modèle :
On déduit :
1 12 1
2 12 24
2 11
1 2 11
(1 ) (1 ) (1 )
(1 ...)(1 ...)(1 )
(1 (1 ) (1 ) ... (1 ) ...)
t t
t
t
z B B B a
B B B B B a
B B B a
Remarque : (1 ) pour 11h h
86
Marché Total : Intervalle de prévision à l’horizon h 12
2 2.975 1 1
2.975
ˆ ˆˆˆ ( ) ( ) 1 ...
ˆˆˆ ( ) ( ) 1 ( 1)(1 )
t h
t
z h t N r
z h t N r h
87
11. Le modèle général de TS ModelerLe modèle à fonction de transfert
1
série dépendante
,..., séries prédicteurs
( )
, ou
t
t kt
t t
i
Y
X X
Z f Y
f f Log
, (1 ) (1 )
( ) ( )
( ) ( )
d s Di
si i i
si i i
B B
Num B B
Den B B
1
( ) ( ) ( ) ( ) ( )k
s sit i i it t
i i
NumB B Z f X B B a
Den
Nt = « Noise »
88
Application à la série IPI
Année Trimestre 1 Trimestre 2 Trimestre 3 Trimestre 46364656667686970...
82
68777681848995100
137
74797984857799104
136
6465677172788287
111
787983879099103110
140
Indice de la Production Industrielle de la France (1963 - 1982)
89
Visualisation de la série IPI
Date
IPI
160
140
120
100
80
60
40
Cette sérieprésente unetendance etune saisonnalité
90
Visualisation de la saisonnalité
Année
198519801975197019651960
IPI
160
140
120
100
80
60
Trimestre
4
3
2
1
91
Date
160
140
120
100
80
60
40
IPI
MA(IPI,4,4)
Visualisation de la tendance
Moyenne mobile centréed’ordre 4 :
4
X5.0XXXX5.0
Z
2t1tt1t2t
t
Tendance Zt
92
7773696561575349454137332925211713951
Trimestre
150
125
100
75
ipi
(a) Indice de la production industrielle (23.85)
(c) Différence régulière/saisonnière de IPI ( ˆ 4.76 )
93
Modèle avec intervention
468.2( ) ( ) (1 )(1 )( ) ( ) ( )s s
t tB B B B z I B B a Effetmai 68
Nt = « Noise » = Série corrigée stationnarisée
Étapes
1. Construction de la série « Noise »2. Modélisation de la série « Noise »3. Estimation du modèle complet
94
Etape 1 : Construction de la série « Noise »
468.2(1 )(1 )( )t tNoise B B z I a
Parameter Estimates
-15.250 1.626 -9.380 .000
-.160 .375 -.426 .671
i22Regression Coefficients
Constant
Estimates Std Error t Approx Sig
Melard's algorithm was used for estimation.
95
Étape 2 : Modélisation de la série « Noise »
468.2(1 )(1 )( )tNoise B B z I
Noise suit un AR(8)
96
Modélisation de la série « Noise »
468.2(1 )(1 )( )tNoise B B z I
Residual Diagnostics
75
8
66
493.364
494.199
7.294
2.701
-177.255
372.509
393.367
Number of Residuals
Number of Parameters
Residual df
Adjusted Residual Sum ofSquares
Residual Sum of Squares
Residual Variance
Model Std. Error
Log-Likelihood
Akaike's InformationCriterion (AIC)
Schwarz's BayesianCriterion (BIC)
Parameter Estimates
.095 .118 .803 .425
.016 .121 .135 .893
-.215 .119 -1.800 .076
-.520 .125 -4.175 .000
-.081 .121 -.668 .506
-.085 .119 -.714 .478
-.116 .124 -.934 .354
-.259 .127 -2.042 .045
.066 .150 .437 .663
AR1
AR2
AR3
AR4
AR5
AR6
AR7
AR8
Non-SeasonalLags
Constant
Estimates Std Error t Approx Sig
Melard's algorithm was used for estimation.
Noise ~ ARIMA(8,1,0)*(0,1,0)4
97
Modélisation de la série « Noise »
468.2(1 )(1 )( )tNoise B B z I
Residual Diagnostics
75
2
73
549.094
550.078
7.344
2.710
-181.075
366.150
370.785
Number of Residuals
Number of Parameters
Residual df
Adjusted Residual Sum ofSquares
Residual Sum of Squares
Residual Variance
Model Std. Error
Log-Likelihood
Akaike's InformationCriterion (AIC)
Schwarz's BayesianCriterion (BIC)
Parameter Estimates
-.628 -.292
.115 .118
-5.476 -2.474
.000 .016
Estimates
Std Error
t
Approx Sig
Seasonal AR1 Seasonal AR2
Seasonal Lags
Melard's algorithm was used for estimation.
Noise ~ ARIMA(0,1,0)*(2,1,0)4
sans constante
98
Étape 3 : estimation du modèle complet
4 8 41 2 68.2(1 ) (1 )(1 )( )t tB B B B z I a
Residual Diagnostics
75
2
71
547.971
551.748
7.533
2.745
-181.015
370.031
379.301
Number of Residuals
Number of Parameters
Residual df
Adjusted Residual Sum ofSquares
Residual Sum of Squares
Residual Variance
Model Std. Error
Log-Likelihood
Akaike's InformationCriterion (AIC)
Schwarz's BayesianCriterion (BIC)
Parameter Estimates
-.632 -.295 -15.089 -.097
.116 .118 1.679 .170
-5.440 -2.509 -8.987 -.569
.000 .014 .000 .571
Estimates
Std Error
t
Approx Sig
Seasonal AR1 Seasonal AR2
Seasonal Lags
i22
RegressionCoefficients
Constant
Melard's algorithm was used for estimation.
99
Étape 3 : estimation du modèle completsans constante
4 8 41 2 68.2(1 ) (1 )(1 )( )t tB B B B z I a
Residual Diagnostics
75
2
72
550.462
554.558
7.464
2.732
-181.173
368.347
375.299
Number of Residuals
Number of Parameters
Residual df
Adjusted Residual Sum ofSquares
Residual Sum of Squares
Residual Variance
Model Std. Error
Log-Likelihood
Akaike's InformationCriterion (AIC)
Schwarz's BayesianCriterion (BIC)
Parameter Estimates
-.631 -.292 -15.095
.116 .117 1.671
-5.459 -2.498 -9.033
.000 .015 .000
Estimates
Std Error
t
Approx Sig
Seasonal AR1 Seasonal AR2
Seasonal Lags
i22
RegressionCoefficients
Melard's algorithm was used for estimation.
100
Utilisation de Time Series Modeler
4 8 41 2 68.2(1 ) (1 )(1 )( )t tB B B B z I a
Fenêtre 1
101
Utilisation de Time Series Modeler
4 8 41 2 68.2(1 ) (1 )(1 )( )t tB B B B z I a
Fenêtre 2
102
Utilisation de Time Series Modeler
4 8 41 2 68.2(1 ) (1 )(1 )( )t tB B B B z I a
Fenêtre 3
103
Utilisation de Time Series Modeler pour la prévision
4 8 41 2 68.2(1 ) (1 )(1 )( )t tB B B B z I a
Forecast LCL UCL
Q1 1983 136.1 130.7 141.6 Q2 1983 133.4 125.7 141.1 Q3 1983 110.3 100.9 119.8 Q4 1983 138.1 127.2 149.0
Model Statistics
1 .678 18.846 16 .277 0ModelIPI-Model_1
Number ofPredictors
StationaryR-squared
Model Fitstatistics
Statistics DF Sig.
Ljung-Box Q(18)
Number ofOutliers
104
Utilisation de Time Series Modeler pour la prévisionLa syntaxe SPSS
PREDICT THRU END.
* Time Series Modeler.
TSMODEL
/MODELSUMMARY PRINT=[ MODELFIT]
/MODELSTATISTICS DISPLAY=YES MODELFIT=[ SRSQUARE]
/MODELDETAILS PRINT=[ PARAMETERS FORECASTS]
/SERIESPLOT OBSERVED FORECAST FIT FORECASTCI
/OUTPUTFILTER DISPLAY=ALLMODELS
/SAVE NRESIDUAL(NResidual)
/AUXILIARY CILEVEL=95 MAXACFLAGS=24
/MISSING USERMISSING=EXCLUDE
/MODEL DEPENDENT=ipi INDEPENDENT=i22
PREFIX='Model'
/ARIMA AR=[0] DIFF=1 MA=[0] ARSEASONAL=[1,2]
DIFFSEASONAL=1
MASEASONAL=[0]
TRANSFORM=NONE CONSTANT=NO
/TRANSFERFUNCTION VARIABLES=i22
DIFF=1
DIFFSEASONAL=1
/AUTOOUTLIER DETECT=OFF.
105
Utilisation de Expert Modeler
106
Utilisation de Expert Modeler
Model Description
ARIMA(0,1,0)(0,1,1)Model_1IPIModel IDModel Type
Model Statistics
1 .660 27.437 17 .052 0ModelIPI-Model_1
Number ofPredictors
StationaryR-squared
Model Fitstatistics
Statistics DF Sig.
Ljung-Box Q(18)
Number ofOutliers
ARIMA Model Parameters
1
1
.507 .109 4.657 .000
-15.315 1.728 -8.863 .000
1
1
Difference
Seasonal Difference
Lag 1MA, Seasonal
No TransformationIPI
Lag 0Numerator
Difference
Seasonal Difference
No Transformationi22
IPI-Model_1Estimate SE t Sig.
4 468.2 1(1 )(1 )( ) (1 )t tB B z I B a
Réponse :
107
Utilisation de Expert Modeler
108
Utilisation de Expert Modeler
Forecast
136 134 111 139
141 142 121 150
130 126 101 128
Forecast
UCL
LCL
ModelIPI-Model_1
Q1 1983 Q2 1983 Q3 1983 Q4 1983
For each model, forecasts start after the last non-missing in the range of therequested estimation period, and end at the last period for whichnon-missing values of all the predictors are available or at the end date of therequested forecast period, whichever is earlier.
109
Utilisation de Expert Modelerpour « All models »
Réponse :
Model Description
ARIMA(0,1,0)(0,1,1)Model_1IPIModel IDModel Type