109
La Méthodologie de Box-Jenkins Michel Tenenhaus

La Méthodologie de Box-Jenkins - Studies2

Embed Size (px)

Citation preview

Page 1: La Méthodologie de Box-Jenkins - Studies2

La Méthodologie de Box-Jenkins

Michel Tenenhaus

Page 2: La Méthodologie de Box-Jenkins - Studies2

2

1. Les données

• Une série chronologique assez longue

(n 50).

• Exemple : Ventes d’anti-inflammatoires en France de janvier 1978 à juillet 1982.

• Objectif : Prévoir les ventes d’août à décembre 1982.

1( ,..., ,..., )t nz z z

Page 3: La Méthodologie de Box-Jenkins - Studies2

3

date ventes date ventes date ventes JAN 1978 3 741 JAN 1980 4 687 JAN 1982 4 764 FEB 1978 3 608 FEB 1980 4 704 FEB 1982 4 726 MAR 1978 3 735 MAR 1980 4 579 MAR 1982 5 080 APR 1978 3 695 APR 1980 4 800 APR 1982 4 952 MAY 1978 3 810 MAY 1980 4 485 MAY 1982 4 633 JUN 1978 3 819 JUN 1980 4 617 JUN 1982 4 830 JUL 1978 3 291 JUL 1980 4 491 JUL 1982 4 460 AUG 1978 3 053 AUG 1980 3 832 SEP 1978 3 908 SEP 1980 4 669 OCT 1978 4 035 OCT 1980 5 193 NOV 1978 3 933 NOV 1980 4 544 DEC 1978 4 004 DEC 1980 4 676 JAN 1979 3 961 JAN 1981 4 709 FEB 1979 4 025 FEB 1981 4 705 MAR 1979 4 336 MAR 1981 4 677 APR 1979 4 335 APR 1981 4 627 MAY 1979 4 412 MAY 1981 4 555 JUN 1979 4 268 JUN 1981 4 570 JUL 1979 3 968 JUL 1981 4 457 AUG 1979 3 505 AUG 1981 3 589 SEP 1979 4 434 SEP 1981 4 636 OCT 1979 4 854 OCT 1981 5 077 NOV 1979 4 592 NOV 1981 4 623 DEC 1979 4 264 DEC 1981 4 591

Marché totaldes anti-inflammatoires

Page 4: La Méthodologie de Box-Jenkins - Studies2

4

Marché total des anti-inflammatoires

Page 5: La Méthodologie de Box-Jenkins - Studies2

5

2. Stabiliser la série

Il faut TRANSFORMER la série observée de manière à- enlever la tendance,- enlever la saisonnalité,- stabiliser la variance.

Page 6: La Méthodologie de Box-Jenkins - Studies2

6

Pour enlever la tendance

Faire des différences régulières d’ordre d :

1 (1 )t t tz z B z 1où t tBz z

d = 2 21(1 ) (1 ) (1 )t t tB z B z B z

d = 1

Différence régulière d’ordre d :

(1 )dt tw B z Dans la pratique

d = 0,1, rarement 2

Page 7: La Méthodologie de Box-Jenkins - Studies2

7

Marché total des anti-inflammatoires : Différence régulière d’ordre d = 1

Page 8: La Méthodologie de Box-Jenkins - Studies2

8

Dans la pratique D = 0,1,très très rarement 2

Pour enlever la saisonnalité

Faire des différences saisonnières d’ordre D :

(1 )st t s tz z B z

D = 2 2(1 ) (1 ) (1 )s s st t s tB z B z B z

D = 1

Différence saisonnière d’ordre D :

(1 )s Dt tw B z

Ordre de la saisonnalité : s = 12 (mois) ou 4 (trimestre)

Page 9: La Méthodologie de Box-Jenkins - Studies2

9

Marché total des anti-inflammatoires : Différence saisonnière (s = 12) d’ordre D = 1

Page 10: La Méthodologie de Box-Jenkins - Studies2

10

Pour enlever tendance et saisonnalité

Formule générale :

(1 ) (1 )d s Dt tw B B z

On peut choisir d et D minimisant l’écart-type de wt.

Application Marché total : s = 12, d = 1, D = 1

1212 1 13(1 )(1 ) ( ) ( )t t t t t tw B B z z z z z

Page 11: La Méthodologie de Box-Jenkins - Studies2

11

Marché total des anti-inflammatoires : Différence régulière/saisonnière (s = 12, d = 1, D = 1)

Page 12: La Méthodologie de Box-Jenkins - Studies2

12

Calcul des séries différenciéesDonnées (20 premiers mois)

JAN 1978 3741 . . .FEB 1978 3608 -133 . .MAR 1978 3735 127 . .APR 1978 3695 -40 . .MAY 1978 3810 115 . .JUN 1978 3819 9 . .JUL 1978 3291 -528 . .AUG 1978 3053 -238 . .SEP 1978 3908 855 . .OCT 1978 4035 127 . .NOV 1978 3933 -102 . .DEC 1978 4004 71 . .JAN 1979 3961 -43 220 .FEB 1979 4025 64 417 197MAR 1979 4336 311 601 184APR 1979 4335 -1 640 39MAY 1979 4412 77 602 -38JUN 1979 4268 -144 449 -153JUL 1979 3968 -300 677 228AUG 1979 3505 -463 452 -225

1234567891011121314151617181920

DATE ventes DIFF(ventes,1) SDIFF(ventes,1,12) DIFF(ventes_2,1)

Page 13: La Méthodologie de Box-Jenkins - Studies2

13

Calcul des écarts-typesDescriptive Statistics

55 3053 4347.71 478.61354 -868 13.31 382.03043 -243 263.47 279.36842 -436 -5.17 242.719

ventesDIFF(ventes,1)SDIFF(ventes,1,12)DIFF(SDIFF(ventes,1,12),1)

N Minimum Mean Std. Deviation

s = 12, d = 1, D = 1

Page 14: La Méthodologie de Box-Jenkins - Studies2

14

Développement de zt

12 1 13( ) ( )t t t t tw z z z z De

On déduit

12 1 13 ( ) t t t t tz z z z w

valeur1 an avant

évaluationde la tendance

1 an avant

termealéatoire

On va modéliser la série « stationnaire » wt.

Page 15: La Méthodologie de Box-Jenkins - Studies2

15

Pour stabiliser la variance

On utilise souvent les transformations ( ) ou t tLog z z

Page 16: La Méthodologie de Box-Jenkins - Studies2

16

3. Le modèle statistique

On suppose que la série stabilisée (w1,…,wN)provient d’un processus stationnaire (wt) :

2

( )

( )( , )

t

t w

k t t k

E w

Var wCor w w

Indépendantde la période t

Dans des conditions assez générales tout processusstationnaire peut être approché par des modèles AR(p), MA(q) ou ARMA(p,q).

Page 17: La Méthodologie de Box-Jenkins - Studies2

17

AR(p) : Auto-régressif d’ordre p

2

( ) 0

( )( , ) 0 pour tout 1,2,...

t

t

t t k

E a

Var aCor a a k

1 1 ...t t p t p tw w w a

où at est un bruit blanc :

Remarque : 1(1 ... )p

Page 18: La Méthodologie de Box-Jenkins - Studies2

18

MA(q) : Moyenne Mobile d’ordre q

1 1 ...t t t q t qw a a a

Remarque :

Page 19: La Méthodologie de Box-Jenkins - Studies2

19

ARMA(p,q)

1 1 1 1... ...t t p t p t t q t qw w w a a a

Remarque : 1(1 ... )p

Page 20: La Méthodologie de Box-Jenkins - Studies2

20

QuestionComment choisir le modèlecorrespondant le mieux aux donnéesétudiées ?

RéponseOn utilise les autocorrélations k et les autocorrélations partielles kk.

Page 21: La Méthodologie de Box-Jenkins - Studies2

21

4. Autocorrélation

1

2

1

( , )

( )( ) = estimation de

( )

k t t k

N

t t kt k

k kN

tt

Cor w w

w w w wr

w w

Page 22: La Méthodologie de Box-Jenkins - Studies2

22

Exemple : Marché TotalDifférence régulière/saisonnière : d = 1, D = 1

Autocorrélationscalculées

Autocorrelations

Series: ventes

-.515 .154 11.937 1 .001.016 .191 11.948 2 .003.189 .191 13.635 3 .003

-.200 .195 15.581 4 .004.062 .200 15.770 5 .008.174 .201 17.326 6 .008

-.243 .204 20.449 7 .005.076 .211 20.759 8 .008.081 .212 21.127 9 .012

-.210 .212 23.686 10 .008.344 .217 30.755 11 .001

-.312 .230 36.747 12 .000.114 .240 37.574 13 .000

-.139 .241 38.842 14 .000.140 .243 40.184 15 .000

-.072 .245 40.549 16 .001

Lag12345678910111213141516

Autocorrelation Std. Errora Value df Sig.b

Box-Ljung Statistic

The underlying process assumed is MA with the order equal tothe lag number minus one. The Bartlett approximation is used.

a.

Based on the asymptotic chi-square approximation.b.

Page 23: La Méthodologie de Box-Jenkins - Studies2

23

Exemple : Marché TotalDifférence régulière/saisonnière : d = 1, D = 1

Corrélogrammeobservé

Formulede Bartlett

Page 24: La Méthodologie de Box-Jenkins - Studies2

24

Variance des autocorrélations rk

Formule de Bartlett(Hypothèse : h = 0 pour h k)

2 2 21 1

1( ) (1 2 ... 2 ) estimation de ( )k k ks r r r Var rN

Formule de Box-Jenkins pour un bruit blanc(Hypothèse : h = 0 pour h 1)

2 1( ) estimation de ( )2k k

N ks r Var rN N

Page 25: La Méthodologie de Box-Jenkins - Studies2

25

Test : H0 : k = 0

On rejette H0 : k = 0 au risque = 0.05 si

2 ( )k kr s r

Application Marché total :

1 = 0, k = 0 pour k > 1

Corrélogrammethéorique

0

k

1 k

Page 26: La Méthodologie de Box-Jenkins - Studies2

26

5. Autocorrélation partielle

Régression de wt sur wt-1,…,wt-k :

0 1 1 ...t k k t kk t k tw w w

Autocorrélation partielle d’ordre k : kk

C’est une corrélation partielle :

1 1( , | ,..., )kk t t k t t kCor w w w w

Page 27: La Méthodologie de Box-Jenkins - Studies2

27

Calcul pratique de estimation de kk

1 2 1

1 3 2

1 2 1

1 2 1

1 3 2

1 2 1

11

11

1

k

k

k k kkk

k k

k k

k k

Soit :

111 11

12

1 2 2 122 2

1 1

1

1

1 11

Etc…

On obtient les estimations des kk en remplaçant les k par rk. ˆkk

ˆkk

Page 28: La Méthodologie de Box-Jenkins - Studies2

28

Partial Autocorrelations

Series: ventes

-.515 .154-.339 .154.039 .154

-.073 .154-.073 .154.186 .154

-.012 .154-.097 .154.001 .154

-.139 .154.238 .154-.116 .154.029 .154

-.343 .154.022 .154

-.053 .154

Lag12345678910111213141516

PartialAutocorrelation Std. Error

Exemple : Marché TotalDifférence régulière/saisonnière : d = 1, D = 1

Autocorrélations partielles calculées

Rejet deH0 : kk = 0si:

ˆ 2 /kk N

Page 29: La Méthodologie de Box-Jenkins - Studies2

29

Corrélogramme partiel observé

Corrélogrammepartiel théorique

0

kk

1 k

142

Page 30: La Méthodologie de Box-Jenkins - Studies2

30

6. Autocorrélations et autocorrélations partielles des modèles AR(p) et MA(q)

Corrélogramme Corrélogramme partiel

(a)

(a)

(b)

(b)

10.5t t tw w a (a) :

10.5t t tw w a (b) :

AR(1)

Page 31: La Méthodologie de Box-Jenkins - Studies2

31

Corrélogramme Corrélogramme partiel (a)

(a)

(b)

(b)

AR(2)

1 2.8 .15t t t tw w w a (a) :

(b) :

1 2.5t t t tw w w a

Le dernier pic significatif du corrélogramme partiel donnel’ordre p du modèle AR(p).

Page 32: La Méthodologie de Box-Jenkins - Studies2

32

Corrélogramme Corrélogramme partiel (a)

(a)

(b)

(b)

MA(1)

1.7t t tw a a (a) :

(b) :

1.7t t tw a a

Page 33: La Méthodologie de Box-Jenkins - Studies2

33

MA(q)

1 2.5 .3t t t tw a a a (a) : q = 2

(b) : q = 5

5.7t t tw a a

Corrélogramme de différents processus MA(q)

(a)

(b)

(c)

(c) : q = 6

1 6.3 .6t t t tw a a a

Le dernier pic significatif du corrélogramme donne l’ordre q du modèle MA(q).

Page 34: La Méthodologie de Box-Jenkins - Studies2

34

7. Étude de la série Marché Total

• Les autocorrélations suggèrent un modèle MA(1).

• Les autocorrélations partielles suggèrent un modèle AR(14).

Page 35: La Méthodologie de Box-Jenkins - Studies2

35

7.1 Étude de la voie moyenne mobile

On suppose que wt suit un modèle MA(1) :

1

2( )t t t

t

w a a

Var a

et on a = E(wt) = .

On choisit les paramètres , et 2 à l’aidede la méthode du maximum de vraisemblance.

Page 36: La Méthodologie de Box-Jenkins - Studies2

36

Maximum de vraisemblance

• On suppose que le vecteur aléatoire w = (w1,…,wN) suit une loi multinormale. • Densité de probabilité de w :

21

2 1 '/ 2 2

( ,..., | , , )

1 1 exp ( ) ( , ) ( )2(2 ) ( , )

N

N

p w w

w - μ Σ w - μ

Σ

• On recherche maximisant la vraisemblance

2ˆˆ ˆ, et

21

ˆˆ ˆ( ,..., | , , )Np w w

Page 37: La Méthodologie de Box-Jenkins - Studies2

37

Qualité de l’ajustement dans ARIMA

2 ( ) 2

2 ( ) ( )

AIC Log r

SBC Log rLog N

On recherche le modèle minimisant SBC.

où r est le nombre de paramètres (hors 2).

Page 38: La Méthodologie de Box-Jenkins - Studies2

38

Modèle MA(1) avec constante

1t t tw a a

Residual Diagnostics

421

40

1585179

159146639100.764

197.739-280.918

565.835

569.311

Number of ResidualsNumber of ParametersResidual dfAdjusted Residual Sum ofSquaresResidual Sum of SquaresResidual VarianceModel Std. ErrorLog-LikelihoodAkaike's InformationCriterion (AIC)Schwarz's BayesianCriterion (BIC)

Parameter Estimates

.657 -7.772

.123 10.9905.326 -.707.000 .484

EstimatesStd ErrortApprox Sig

MA1

Non-Seasonal

LagsConstant

Melard's algorithm was used for estimation.

Page 39: La Méthodologie de Box-Jenkins - Studies2

39

Modèle MA(1) sans constante

1t t tw a a

Residual Diagnostics

421

41

1603132

162035038625.634

196.534-281.143

564.285

566.023

Number of ResidualsNumber of ParametersResidual dfAdjusted Residual Sum ofSquaresResidual Sum of SquaresResidual VarianceModel Std. ErrorLog-LikelihoodAkaike's InformationCriterion (AIC)Schwarz's BayesianCriterion (BIC)

Parameter Estimates

.634

.1255.066.000

EstimatesStd ErrortApprox Sig

MA1Non-Seasonal Lags

Melard's algorithm was used for estimation.

Page 40: La Méthodologie de Box-Jenkins - Studies2

40

Modélisation de zt

12 1 13 1( ) ( )t t t t t t tw z z z z a a De

On déduit

12 1 13 1 ( ) t t t t t tz z z z a a

marché1 an avant

évaluationde la tendance

1 an avant

chocaléatoire

en t

chocaléatoire

en t-1

Page 41: La Méthodologie de Box-Jenkins - Studies2

41

Calcul des prévisions et des erreurs

Modèle : 12 1 13 1t t t t t tz z z z a a

Prévision de zt réalisée en t-1 :

12 1 13 1ˆt t t t tz z z z a

Erreur de prévision à l’horizon 1 :

ˆt t ta z z

Calcul pratique des prévisions et des erreurs sur l’historique:

12 1 13 1ˆ ˆˆ ˆ ˆˆ ˆ et t t t t t t t tz z z z a a z z

Page 42: La Méthodologie de Box-Jenkins - Studies2

42

Résultats

Page 43: La Méthodologie de Box-Jenkins - Studies2

43

Résultats (suite)

Page 44: La Méthodologie de Box-Jenkins - Studies2

44

Résultats (fin)

Vérifier les calculs pour 55 55ˆ ˆˆ et z a

Page 45: La Méthodologie de Box-Jenkins - Studies2

45

Graphique des ventes observées et prédites

Page 46: La Méthodologie de Box-Jenkins - Studies2

46

Graphique des résidus

ˆLimite à 2

Page 47: La Méthodologie de Box-Jenkins - Studies2

47

Qualité de l’ajustement dans Time Series Modeler

2ˆ ( )Normalized BIC 2 ( )ta Log NLog rN r N

2 2

2 2

ˆ ˆˆ ˆStationary R-Squared 1 1

t t t tt t

t tt t

w w z z

w w w w

Page 48: La Méthodologie de Box-Jenkins - Studies2

48

Validation du modèle Étude des ˆ( )k tr a

Autocorrelations

Series: Error for ventes from ARIMA, MOD_2, NOCON

-.087 .149 .342 1 .558.072 .147 .581 2 .748.188 .145 2.253 3 .522

-.079 .143 2.556 4 .635.128 .141 3.379 5 .642.164 .140 4.768 6 .574

-.168 .138 6.265 7 .509.031 .136 6.316 8 .612.063 .134 6.535 9 .685-.115 .132 7.304 10 .696.208 .130 9.894 11 .540

-.281 .127 14.747 12 .256-.076 .125 15.119 13 .300-.157 .123 16.750 14 .270.062 .121 17.017 15 .318

-.054 .119 17.222 16 .371

Lag12345678910111213141516

Autocorrelation Std. Errora Value df Sig.b

Box-Ljung Statistic

The underlying process assumed is independence (whitenoise).

a.

Based on the asymptotic chi-square approximation.b.

Page 49: La Méthodologie de Box-Jenkins - Studies2

49

Validation du modèleCorrélogramme des ˆ( )k tr a

Formule deBox-Jenkins

Corrélogrammethéorique des erreurs bt

0

k(bt)

12 k

Page 50: La Méthodologie de Box-Jenkins - Studies2

50

Validation du modèle : Utilisation de la statistique de Ljung-Box

La statistique de Ljung-Box2

2

1

ˆ( )( 2)m

k tm

k

r aN NN k

suit une loi du khi-deux à m-r ddl lorsque les résidusforment un bruit blanc.On accepte le modèle étudié si les niveaux de signification

2 2Prob( ( ) )mm r

sont > .05 pour différentes valeurs de m.

Page 51: La Méthodologie de Box-Jenkins - Studies2

51

Utilisation du modèle estimé en prévision

Modèle : 12 1 13 1t t t t t tz z z z a a

Prévision de z55+h réalisée en t = 55 :

56 44 55 43 55ˆ ˆz z z z a h = 1

57 45 56 44ˆ ˆz z z z h = 2

Et ainsi de suite…

Page 52: La Méthodologie de Box-Jenkins - Studies2

52

Application

AUG 1982 3716.13 3319.22 4113.04 196.53SEP 1982 4763.13 4340.43 5185.82 209.30OCT 1982 5204.13 4757.13 5651.12 221.34NOV 1982 4750.13 4280.09 5220.17 232.75DEC 1982 4718.13 4226.12 5210.14 243.62

12345

DATE. Fit for ventes 95% LCL 95% UCL SE of Fit

Page 53: La Méthodologie de Box-Jenkins - Studies2

53

Intervalle de prévision à 95% de z55+h

Chaque modèle a sa propre formule de constructionde l’intervalle de prévision.

255 .975

ˆˆˆ ( ) 1 ( 1)(1 )hz t N r h

Modèle MA(1) :

Page 54: La Méthodologie de Box-Jenkins - Studies2

54

Page 55: La Méthodologie de Box-Jenkins - Studies2

55

Amélioration du modèle MA(1)

• On suppose maintenant le modèle

• est significatif.12 ˆ( ) .281tr a

1

12 , où bruit blanct t t

t t t t

w b bb a a a

• De 12(1 ) et (1 )t t t tw B b b B a

on déduit :12(1 )(1 )t tw B B a

Page 56: La Méthodologie de Box-Jenkins - Studies2

56

Demande SPSS

Page 57: La Méthodologie de Box-Jenkins - Studies2

57

Résultats

Parameter Estimates

.715 .765 -11.468

.107 .399 5.2196.693 1.918 -2.197.000 .062 .034

EstimatesStd ErrortApprox Sig

MA1

Non-SeasonalLags

Seasonal MA1

SeasonalLags

Constant

Melard's algorithm was used for estimation.

Residual Diagnostics

422

39

1268226.611

1336414.10625544.245

159.826-276.531

559.062

564.275

Number of ResidualsNumber of ParametersResidual dfAdjusted Residual Sum of SquaresResidual Sum of SquaresResidual VarianceModel Std. ErrorLog-LikelihoodAkaike's InformationCriterion (AIC)Schwarz's BayesianCriterion (BIC)

12(1 )(1 )t tw B B a

Page 58: La Méthodologie de Box-Jenkins - Studies2

58

7.2 Étude de la voie autorégressive

On suppose que wt suit un modèle AR(14) :

1 1 14 14

2

...

( )t t t t

t

w w w a

Var a

et on a = (1 - 1 -…- 14).

On choisit les paramètres , 1,…,14 et 2 à l’aidede la méthode du maximum de vraisemblance.

est appeléConstant dansSPSS

Page 59: La Méthodologie de Box-Jenkins - Studies2

59

Résultats

1 1 14 14...t t t tw w w a

Residual Diagnostics

421427

949178.0

104106228699.741

169.410-270.689

571.379

597.444

Number of ResidualsNumber of ParametersResidual dfAdjusted Residual Sum ofSquaresResidual Sum of SquaresResidual VarianceModel Std. ErrorLog-LikelihoodAkaike's InformationCriterion (AIC)Schwarz's BayesianCriterion (BIC)

Parameter Estimates

-.680 .156 -4.367 .000-.441 .169 -2.614 .014.059 .188 .311 .758.034 .184 .185 .855.107 .191 .560 .580.138 .214 .644 .525

-.051 .254 -.200 .843-.016 .240 -.067 .947-.006 .232 -.026 .980-.054 .237 -.228 .821.185 .234 .791 .436

-.307 .227 -1.355 .187-.428 .208 -2.059 .049-.572 .156 -3.668 .001

-10.788 9.983 -1.081 .289

AR1AR2AR3AR4AR5AR6AR7AR8AR9AR10AR11AR12AR13AR14

Non-SeasonalLags

Constant

Estimates Std Error t Approx Sig

Melard's algorithm was used for estimation.

Page 60: La Méthodologie de Box-Jenkins - Studies2

60

Modèle AR : p = (1,2,12,13,14) avec cste

1 1 2 2 12 12 13 13 14 14t t t t t t tw w w w w w a

Demande SPSS

Page 61: La Méthodologie de Box-Jenkins - Studies2

61

Résultats

1 1 2 2 12 12 13 13 14 14t t t t t t tw w w w w w a

Parameter Estimates

-.775 .127 -6.083 .000-.490 .122 -4.006 .000-.512 .138 -3.711 .001-.594 .159 -3.733 .001-.526 .145 -3.619 .001

-12.797 7.487 -1.709 .096

AR1AR2AR12AR13AR14

Non-SeasonalLags

Constant

Estimates Std Error t Approx Sig

Melard's algorithm was used for estimation.

Residual Diagnostics

42

5

36

1093774.600

1192109.813

25711.840160.349-273.114

558.228

568.654

Number of ResidualsNumber ofParametersResidual dfAdjusted Residual Sum of SquaresResidual Sum ofSquaresResidual VarianceModel Std. ErrorLog-LikelihoodAkaike's InformationCriterion (AIC)Schwarz's BayesianCriterion (BIC)

Page 62: La Méthodologie de Box-Jenkins - Studies2

62

Modèle AR : p = (1,2,12,13,14) sans cste

1 1 2 2 12 12 13 13 14 14t t t t t t tw w w w w w a

Demande SPSS

Page 63: La Méthodologie de Box-Jenkins - Studies2

63

Résultats

1 1 2 2 12 12 13 13 14 14t t t t t t tw w w w w w a

Residual Diagnostics

42

5

37

1172013

1233379

27877.941166.967

-274.563

559.127

567.815

Number ofResidualsNumber ofParametersResidual dfAdjusted ResidualSum of SquaresResidual Sum ofSquaresResidual VarianceModel Std. ErrorLog-LikelihoodAkaike's InformationCriterion (AIC)Schwarz's BayesianCriterion (BIC)

Parameter Estimates

-.747 .134 -5.591 .000-.460 .129 -3.568 .001-.454 .148 -3.066 .004-.508 .171 -2.975 .005-.467 .154 -3.041 .004

AR1AR2AR12AR13AR14

Non-SeasonalLags

Estimates Std Error t Approx Sig

Melard's algorithm was used for estimation.

Page 64: La Méthodologie de Box-Jenkins - Studies2

64

Modèle AR : p = 2, P = 1 avec cste2 12

1 2(1 )(1 ) t tB B B w a

Demande SPSS

Page 65: La Méthodologie de Box-Jenkins - Studies2

65

Résultats2 12

1 2(1 )(1 ) t tB B B w a

Residual Diagnostics

42

3

38

1196121

1286077

27725.190166.509

-274.998

557.997

564.948

Number ofResidualsNumber ofParametersResidual dfAdjusted ResidualSum of SquaresResidual Sum ofSquaresResidual VarianceModel Std. ErrorLog-LikelihoodAkaike's InformationCriterion (AIC)Schwarz's BayesianCriterion (BIC)

Parameter Estimates

-.759 .139 -5.445 .000-.523 .132 -3.970 .000-.557 .146 -3.812 .000

-12.289 8.308 -1.479 .147

AR1AR2

Non-SeasonalLags

Seasonal AR1Seasonal LagsConstant

Estimates Std Error t Approx Sig

Melard's algorithm was used for estimation.

Page 66: La Méthodologie de Box-Jenkins - Studies2

66

Modèle AR : p = 2, P = 1 sans cste2 12

1 2(1 )(1 ) t tB B B w a

Demande SPSS

Page 67: La Méthodologie de Box-Jenkins - Studies2

67

Résultats2 12

1 2(1 )(1 ) t tB B B w a

Residual Diagnostics

42

3

39

1256636

1315334

29246.908171.017

-276.033

558.066

563.279

Number ofResidualsNumber ofParametersResidual dfAdjusted ResidualSum of SquaresResidual Sum ofSquaresResidual VarianceModel Std. ErrorLog-LikelihoodAkaike's InformationCriterion (AIC)Schwarz's BayesianCriterion (BIC)

Parameter Estimates

-.731 .143 -5.101 .000-.481 .135 -3.562 .001-.489 .154 -3.186 .003

AR1AR2

Non-SeasonalLags

Seasonal AR1Seasonal Lags

Estimates Std Error t Approx Sig

Melard's algorithm was used for estimation.

Page 68: La Méthodologie de Box-Jenkins - Studies2

68

Résultats2 12

1 2(1 )(1 ) t tB B B w a

Page 69: La Méthodologie de Box-Jenkins - Studies2

69

Résultats avec Time Series Modeler

2 121 2(1 )(1 ) t tB B B w a

Forecast

3818 4792 5192 4688 47424163 5150 5567 5123 51973472 4434 4817 4253 4288

ForecastUCLLCL

Modelventes-Model_1

Aug 1982 Sep 1982 Oct 1982 Nov 1982 Dec 1982

For each model, forecasts start after the last non-missing in the range of the requestedestimation period, and end at the last period for which non-missing values of all the predictorsare available or at the end date of the requested forecast period, whichever is earlier.

Page 70: La Méthodologie de Box-Jenkins - Studies2

70

Résultats avec Time Series Modeler2 12

1 2(1 )(1 ) t tB B B w a

Page 71: La Méthodologie de Box-Jenkins - Studies2

71

7.3 Étude de la voie AR/MA

2 121 2(1 ) (1 )t tB B w B a Modèle avec

constante

Page 72: La Méthodologie de Box-Jenkins - Studies2

72

Résultats

2 121 2(1 ) (1 )t tB B w B a

Residual Diagnostics

423

38

1112464

125655019325.966

139.018-274.630

557.261

564.211

Number of ResidualsNumber of ParametersResidual dfAdjusted Residual Sum ofSquaresResidual Sum of SquaresResidual VarianceModel Std. ErrorLog-LikelihoodAkaike's InformationCriterion (AIC)Schwarz's BayesianCriterion (BIC)

Parameter Estimates

-.765 .123 -6.228 .000-.558 .114 -4.911 .000.965 2.964 .326 .747

-11.009 6.504 -1.693 .099

AR1AR2

Non-SeasonalLags

Seasonal MA1Seasonal LagsConstant

Estimates Std Error t Approx Sig

Melard's algorithm was used for estimation.

Warnings

Our tests have determined that the estimated model lies close to the boundary of theinvertibility region. Although the moving average parameters are probably correctlyestimated, their standard errors and covariances should be considered suspect.

Page 73: La Méthodologie de Box-Jenkins - Studies2

73

7.3 Étude de la voie AR/MA

2 121 2(1 ) (1 )t tB B w B a Modèle sans

constante

Page 74: La Méthodologie de Box-Jenkins - Studies2

74

Résultats

2 121 2(1 ) (1 )t tB B w B a

Residual Diagnostics

423

39

1190270

128729524282.930

155.830-275.152

556.304

561.517

Number of ResidualsNumber of ParametersResidual dfAdjusted Residual Sum ofSquaresResidual Sum of SquaresResidual VarianceModel Std. ErrorLog-LikelihoodAkaike's InformationCriterion (AIC)Schwarz's BayesianCriterion (BIC)

Parameter Estimates

-.736 .134 -5.488 .000-.506 .124 -4.074 .000.745 .360 2.071 .045

AR1AR2

Non-SeasonalLags

Seasonal MA1Seasonal Lags

Estimates Std Error t Approx Sig

Melard's algorithm was used for estimation.

Page 75: La Méthodologie de Box-Jenkins - Studies2

75

Résultats2 12

1 2(1 ) (1 )t tB B w B a

Page 76: La Méthodologie de Box-Jenkins - Studies2

76

Résultats (avec Time Series Modeler)2 12

1 2(1 ) (1 )t tB B w B a

Forecast

3861 4854 5206 4810 47984184 5187 5553 5215 52203539 4521 4858 4405 4375

ForecastUCLLCL

Modelventes-Model_1

Aug 1982 Sep 1982 Oct 1982 Nov 1982 Dec 1982

For each model, forecasts start after the last non-missing in the range of the requestedestimation period, and end at the last period for which non-missing values of all the predictorsare available or at the end date of the requested forecast period, whichever is earlier.

Page 77: La Méthodologie de Box-Jenkins - Studies2

77

Résultats (avec Time Series Modeler)2 12

1 2(1 ) (1 )t tB B w B a

Page 78: La Méthodologie de Box-Jenkins - Studies2

78

8. Le modèle multiplicatif usuelARIMA(p,d,q)*(P,D,Q)s

( ) (1 ) (1 ) ( )s d s D st w tB B B B z B B a

1

1

1

1

( ) 1 ...

( ) 1 ...

( ) 1 ...

( ) 1 ...

pp

s s sPP

qq

s s sQQ

B B B

B B B

B B B

B B B

où :

Tous ces polynômes doivent être inversibles.

wtbruitblanc

Page 79: La Méthodologie de Box-Jenkins - Studies2

79

9. Prévision

(1 ) (1 )d s Dt tB B B z B a

Le modèle général

peut s’écrire :

1 1 1 1... ...t t p t p t t q t qz z z a a a

Page 80: La Méthodologie de Box-Jenkins - Studies2

80

Prévision à l’horizon hModèle

1 1 1 1... ...t h t h p t h p t h t h q t h qz z z a a a

Prévision

1 1 1 1ˆ ˆ ˆˆ ˆ ˆ ˆˆ ˆ ˆ( ) ... ...t t h p t h p t h q t h qz h z z a a

avec : si 0 ˆ

ˆ ( ) si 0 t h j

t h jt

z h jz

z h j h j

Page 81: La Méthodologie de Box-Jenkins - Studies2

81

10. Calcul de l’intervalle de prévision

( )(1 ) (1 ) ( )s d s D st tB B B B z B B a

De

on déduit (formellement) :

1 1

1 1 2 2

' ( )(1 ) (1 ) ( )

' ...

s d s D st t

t t t

z B B B B B B a

a a a

Page 82: La Méthodologie de Box-Jenkins - Studies2

82

Prévision de zt+h à l’instant t

• On a

1 1 2 2 1 1

1 1

' ...

...

t h t h t h t h h t

h t h t

z a a a a

a a

Futur

Passé

1 1ˆ ( ) ' ...t h t h tz h a a

• D’où la prévision de zt+h à l’instant t

Page 83: La Méthodologie de Box-Jenkins - Studies2

83

Erreur de prévision à l’horizon h

1 1 2 2 1 1

ˆ( ) ( )

...

t t h t

t h t h t h h t

e h z z h

a a a a

D’où :

2 2 21 1[ ( )] 1 ...t hVar e h

[ ( )] 0tE e h

Page 84: La Méthodologie de Box-Jenkins - Studies2

84

Intervalle de prévision à 95%de zt+h réalisé à l’instant t

2 2.975 1 1ˆˆ ( ) ( ) 1 ...t hz h t N r

Page 85: La Méthodologie de Box-Jenkins - Studies2

85

Exemple « Marché Total »

12(1 )(1 ) (1 )t tB B z B a Modèle :

On déduit :

1 12 1

2 12 24

2 11

1 2 11

(1 ) (1 ) (1 )

(1 ...)(1 ...)(1 )

(1 (1 ) (1 ) ... (1 ) ...)

t t

t

t

z B B B a

B B B B B a

B B B a

Remarque : (1 ) pour 11h h

Page 86: La Méthodologie de Box-Jenkins - Studies2

86

Marché Total : Intervalle de prévision à l’horizon h 12

2 2.975 1 1

2.975

ˆ ˆˆˆ ( ) ( ) 1 ...

ˆˆˆ ( ) ( ) 1 ( 1)(1 )

t h

t

z h t N r

z h t N r h

Page 87: La Méthodologie de Box-Jenkins - Studies2

87

11. Le modèle général de TS ModelerLe modèle à fonction de transfert

1

série dépendante,..., séries prédicteurs

( )

, ou

t

t kt

t t

i

YX XZ f Y

f f Log

, (1 ) (1 )

( ) ( )

( ) ( )

d s Di

si i i

si i i

B B

Num B B

Den B B

1

( ) ( ) ( ) ( ) ( )k

s sit i i it t

i i

NumB B Z f X B B aDen

Nt = « Noise »

Page 88: La Méthodologie de Box-Jenkins - Studies2

88

Application à la série IPI

Année Trimestre 1 Trimestre 2 Trimestre 3 Trimestre 46364656667686970...

82

68777681848995100

137

74797984857799

104

136

6465677172788287

111

787983879099

103110

140

Indice de la Production Industrielle de la France (1963 - 1982)

Page 89: La Méthodologie de Box-Jenkins - Studies2

89

Visualisation de la série IPI

Date

IPI

160

140

120

100

80

60

40

Cette sérieprésente unetendance etune saisonnalité

Page 90: La Méthodologie de Box-Jenkins - Studies2

90

Visualisation de la saisonnalité

Année

198519801975197019651960

IPI

160

140

120

100

80

60

Trimestre

4

3

2

1

Page 91: La Méthodologie de Box-Jenkins - Studies2

91

Date

160

140

120

100

80

60

40

IPI

MA(IPI,4,4)

Visualisation de la tendance

Moyenne mobile centréed’ordre 4 :

4X5.0XXXX5.0

Z

2t1tt1t2t

t

Tendance Zt

Page 92: La Méthodologie de Box-Jenkins - Studies2

92

7773696561575349454137332925211713951

Trimestre

150

125

100

75

ipi

(a) Indice de la production industrielle (23.85)

(c) Différence régulière/saisonnière de IPI ( ˆ 4.76 )

Page 93: La Méthodologie de Box-Jenkins - Studies2

93

Modèle avec intervention

468.2( ) ( ) (1 )(1 )( ) ( ) ( )s s

t tB B B B z I B B a Effetmai 68

Nt = « Noise » = Série corrigée stationnarisée

Étapes

1. Construction de la série « Noise »2. Modélisation de la série « Noise »3. Estimation du modèle complet

Page 94: La Méthodologie de Box-Jenkins - Studies2

94

Etape 1 : Construction de la série « Noise »

468.2(1 )(1 )( )t tNoise B B z I a

Parameter Estimates

-15.250 1.626 -9.380 .000-.160 .375 -.426 .671

i22Regression CoefficientsConstant

Estimates Std Error t Approx Sig

Melard's algorithm was used for estimation.

Page 95: La Méthodologie de Box-Jenkins - Studies2

95

Étape 2 : Modélisation de la série « Noise »

468.2(1 )(1 )( )tNoise B B z I

Noise suit un AR(8)

Page 96: La Méthodologie de Box-Jenkins - Studies2

96

Modélisation de la série « Noise »

468.2(1 )(1 )( )tNoise B B z I

Residual Diagnostics

758

66

493.364

494.1997.2942.701

-177.255

372.509

393.367

Number of ResidualsNumber of ParametersResidual dfAdjusted Residual Sum ofSquaresResidual Sum of SquaresResidual VarianceModel Std. ErrorLog-LikelihoodAkaike's InformationCriterion (AIC)Schwarz's BayesianCriterion (BIC)

Parameter Estimates

.095 .118 .803 .425

.016 .121 .135 .893-.215 .119 -1.800 .076-.520 .125 -4.175 .000-.081 .121 -.668 .506-.085 .119 -.714 .478-.116 .124 -.934 .354-.259 .127 -2.042 .045.066 .150 .437 .663

AR1AR2AR3AR4AR5AR6AR7AR8

Non-SeasonalLags

Constant

Estimates Std Error t Approx Sig

Melard's algorithm was used for estimation.

Noise ~ ARIMA(8,1,0)*(0,1,0)4

Page 97: La Méthodologie de Box-Jenkins - Studies2

97

Modélisation de la série « Noise »

468.2(1 )(1 )( )tNoise B B z I

Residual Diagnostics

752

73

549.094

550.0787.3442.710

-181.075

366.150

370.785

Number of ResidualsNumber of ParametersResidual dfAdjusted Residual Sum ofSquaresResidual Sum of SquaresResidual VarianceModel Std. ErrorLog-LikelihoodAkaike's InformationCriterion (AIC)Schwarz's BayesianCriterion (BIC)

Parameter Estimates

-.628 -.292.115 .118

-5.476 -2.474.000 .016

EstimatesStd ErrortApprox Sig

Seasonal AR1 Seasonal AR2Seasonal Lags

Melard's algorithm was used for estimation.

Noise ~ ARIMA(0,1,0)*(2,1,0)4

sans constante

Page 98: La Méthodologie de Box-Jenkins - Studies2

98

Étape 3 : estimation du modèle complet

4 8 41 2 68.2(1 ) (1 )(1 )( )t tB B B B z I a

Residual Diagnostics

752

71

547.971

551.7487.5332.745

-181.015

370.031

379.301

Number of ResidualsNumber of ParametersResidual dfAdjusted Residual Sum ofSquaresResidual Sum of SquaresResidual VarianceModel Std. ErrorLog-LikelihoodAkaike's InformationCriterion (AIC)Schwarz's BayesianCriterion (BIC)

Parameter Estimates

-.632 -.295 -15.089 -.097.116 .118 1.679 .170

-5.440 -2.509 -8.987 -.569.000 .014 .000 .571

EstimatesStd ErrortApprox Sig

Seasonal AR1 Seasonal AR2Seasonal Lags

i22

RegressionCoefficients

Constant

Melard's algorithm was used for estimation.

Page 99: La Méthodologie de Box-Jenkins - Studies2

99

Étape 3 : estimation du modèle completsans constante

4 8 41 2 68.2(1 ) (1 )(1 )( )t tB B B B z I a

Residual Diagnostics

752

72

550.462

554.5587.4642.732

-181.173

368.347

375.299

Number of ResidualsNumber of ParametersResidual dfAdjusted Residual Sum ofSquaresResidual Sum of SquaresResidual VarianceModel Std. ErrorLog-LikelihoodAkaike's InformationCriterion (AIC)Schwarz's BayesianCriterion (BIC)

Parameter Estimates

-.631 -.292 -15.095.116 .117 1.671

-5.459 -2.498 -9.033.000 .015 .000

EstimatesStd ErrortApprox Sig

Seasonal AR1 Seasonal AR2Seasonal Lags

i22

RegressionCoefficients

Melard's algorithm was used for estimation.

Page 100: La Méthodologie de Box-Jenkins - Studies2

100

Utilisation de Time Series Modeler

4 8 41 2 68.2(1 ) (1 )(1 )( )t tB B B B z I a

Fenêtre 1

Page 101: La Méthodologie de Box-Jenkins - Studies2

101

Utilisation de Time Series Modeler

4 8 41 2 68.2(1 ) (1 )(1 )( )t tB B B B z I a

Fenêtre 2

Page 102: La Méthodologie de Box-Jenkins - Studies2

102

Utilisation de Time Series Modeler

4 8 41 2 68.2(1 ) (1 )(1 )( )t tB B B B z I a

Fenêtre 3

Page 103: La Méthodologie de Box-Jenkins - Studies2

103

Utilisation de Time Series Modeler pour la prévision

4 8 41 2 68.2(1 ) (1 )(1 )( )t tB B B B z I a

Forecast LCL UCL Q1 1983 136.1 130.7 141.6 Q2 1983 133.4 125.7 141.1 Q3 1983 110.3 100.9 119.8 Q4 1983 138.1 127.2 149.0

Model Statistics

1 .678 18.846 16 .277 0ModelIPI-Model_1

Number ofPredictors

StationaryR-squared

Model Fitstatistics

Statistics DF Sig.

Ljung-Box Q(18)Number of

Outliers

Page 104: La Méthodologie de Box-Jenkins - Studies2

104

Utilisation de Time Series Modeler pour la prévisionLa syntaxe SPSS

PREDICT THRU END.

* Time Series Modeler.

TSMODEL

/MODELSUMMARY PRINT=[ MODELFIT]

/MODELSTATISTICS DISPLAY=YES MODELFIT=[ SRSQUARE]

/MODELDETAILS PRINT=[ PARAMETERS FORECASTS]

/SERIESPLOT OBSERVED FORECAST FIT FORECASTCI

/OUTPUTFILTER DISPLAY=ALLMODELS

/SAVE NRESIDUAL(NResidual)

/AUXILIARY CILEVEL=95 MAXACFLAGS=24

/MISSING USERMISSING=EXCLUDE

/MODEL DEPENDENT=ipi INDEPENDENT=i22

PREFIX='Model'

/ARIMA AR=[0] DIFF=1 MA=[0] ARSEASONAL=[1,2]

DIFFSEASONAL=1

MASEASONAL=[0]

TRANSFORM=NONE CONSTANT=NO

/TRANSFERFUNCTION VARIABLES=i22

DIFF=1

DIFFSEASONAL=1

/AUTOOUTLIER DETECT=OFF.

Page 105: La Méthodologie de Box-Jenkins - Studies2

105

Utilisation de Expert Modeler

Page 106: La Méthodologie de Box-Jenkins - Studies2

106

Utilisation de Expert ModelerModel Description

ARIMA(0,1,0)(0,1,1)Model_1IPIModel IDModel Type

Model Statistics

1 .660 27.437 17 .052 0ModelIPI-Model_1

Number ofPredictors

StationaryR-squared

Model Fitstatistics

Statistics DF Sig.

Ljung-Box Q(18)Number of

Outliers

ARIMA Model Parameters

11

.507 .109 4.657 .000-15.315 1.728 -8.863 .000

11

DifferenceSeasonal Difference

Lag 1MA, Seasonal

No TransformationIPI

Lag 0NumeratorDifferenceSeasonal Difference

No Transformationi22

IPI-Model_1Estimate SE t Sig.

4 468.2 1(1 )(1 )( ) (1 )t tB B z I B a

Réponse :

Page 107: La Méthodologie de Box-Jenkins - Studies2

107

Utilisation de Expert Modeler

Page 108: La Méthodologie de Box-Jenkins - Studies2

108

Utilisation de Expert Modeler

Forecast

136 134 111 139141 142 121 150130 126 101 128

ForecastUCLLCL

ModelIPI-Model_1

Q1 1983 Q2 1983 Q3 1983 Q4 1983

For each model, forecasts start after the last non-missing in the range of therequested estimation period, and end at the last period for whichnon-missing values of all the predictors are available or at the end date of therequested forecast period, whichever is earlier.

Page 109: La Méthodologie de Box-Jenkins - Studies2

109

Utilisation de Expert Modelerpour « All models »

Réponse :

Model Description

ARIMA(0,1,0)(0,1,1)Model_1IPIModel IDModel Type