10
Comparaison de mCthodes d'estimation des debits journaliers SAAD BENNIS ~cole de technologie supirieure, 4750, rue Henri-Julien, Montreal (Quebec), Canada H2T 2C8 ET PIERRE BRUNEAU Division hydrologie, service hydraulique, Direction amenagement de centrales, Hydro-Quebec, place Dupuis, 1 7e Ptage, 855, rue Sainte-Catherine est, Montreal (Quebec), Canada H2L 4P5 Recu le 3 janvier 1992 RCvision acceptke le 24 juillet 1992 L'objectif de la premihe partie de 1'Ctude prCsentCe ici est la comparaison des possibilitCs de differentes techniques et modkles d'estimation des debits journaliers. Nous avons, pour ce faire, dCveloppC un logiciel de calcul, trks gCnCral d'application, baptisC DebEst. Le bassin de la rivihe Saint-Fran~ois a CtC retenu comme argument physique, vue la disponibilitk de plusieurs stations hydromCtriques dans cette rCgion. Toutes les techniques et modkles utilisks donnent de bons rbultats. Cependant, l'analyse en composantes principales et la regression multiple appliquees a des modkles dkterministes donnent de meilleurs rCsultats que les modkles ARIMA. L'algorithme rCcursif des moindres carrCs offre plus de flexibilitk que les autres techniques, mais prCsente parfois des problkmes de divergence dus a la mauvaise pondiration des bruits de mesure et de modtlisation. L'utilisation de modkles saisonniers et la prise en compte de la variation des paramktres en fonction du dCbit a permis dJamCliorer d'une f a ~ o n significative tous les rbultats. Toutes les techniques prCsentCes produisent des rCsidus autocorreles au moins pour les trois premiers retards. Les modkles saisonniers rkussissent attenuer I'amplitude de la fonction d'autocorrClation des rCsidus, laquelle reste encore signifi- cative. Dans la deuxikme partie de cette Ctude nous utiliserons la technique du filtre de Kalman en parallkle avec les methodes prCsentCes ici pour extraire l'information rCsiduelle et produire des rCsidus rkellement indbpendants. Mots clis : dCbit journalier manquant, composantes principales, moindres carrb, estimation rkcursive, autocorrClation des residus. The aim of the first part of our research, described in this paper, was to compare daily streamflow estimation techniques and models. A general application software named DebEst was developed for the purpose. The Saint-Fran~ois River basin was used as a physical test area because of the availability of several hydrometric stations in this region. All techniques and models used gave good results. However, principal component analysis and multiple regression applied to deterministic models gave better results than ARIMA models. The least square recursive algorithm was more flexible than the other techniques, although discrepancies sometimes appeared because of incorrect weighting of measuring and modelling noise. Results improved significantly when seasonal models were used and when the variation of parameters was taken into account as a function of flow. All techniques described yielded autocorrelated residuals, at least for the first three time lags. The amplitude of the residual autocorrelation function was reduced by seasonal models although it still remained high. In the second part of our research, the Kalman filter technique will be used in conjunction with the methods described above to extract residual information and generate truly independent residuals. Key words: missing streamflow record, principal components, least squares, recursive parameter estimation, residual autocorrelation. [Journal translation] Can. J. Civ. Eng. 20. 480-489 (1993) 1. Introduction Les series des debits journaliers sont necessaires pour proceder a des etudes hydrologiques reliees la gestion du risque, de la crue maximale probable, de la securitk des bar- rages, de la capacite des evacuations, des niveaux maximal et minimal critiques et du probleme d'etiage. Or, en pra- tique, dans certains cas, on ne dispose que de series de donnies partielles, manifestement insuffisantes pour une etude hydrologique complkte. Dans le cas oh de longues series hydromitriques sont disponibles, il est trks frequent de constater que des donnees manquent. La litterature abonde de modkles de reconstitution des series d'apports mensuels ou annuels (Dragan et al. 1989) alors que la reconstitution des debits journaliers est beau- coup moins documentee (Beauchamp et Downing 1989). Le modkle le plus utilise est prisente sous forme de regression NOTA : Les commentaires sur le contenu de cet article doivent &tre envoyts au directeur scientifique de la revue avant le 31 octobre 1993 (voir l'adresse au verso du plat supkrieur). Prinlcd in Canada / Imprime au Canada multiple oh la station a reconstituer est exprimke en fonction des stations reconstituantes (Haan 1977). Les parametres du modkle regressif sont estimes a l'aide de la mkthode classique des moindres carres (Young 1974). D'une facon generale, cette dernikre technique donne de bons risultats. Cependant, elle posskde trois inconvenients : (i) elle ne tient pas compte de la variation des paramktres de regression en fonction du temps; (ii) les variables dkpendantes sont souvent correlies entre elles, ce qui viole une des conditions de son application; (iii) les erreurs de mesure obkissent rarement a l'hypothese de bruit gaussien utilisee dans la solution par la methode standard des moindres carrks. Ce dernier point est source de biais dans I'estimation des paramktres du modkle de regression utilise (O'Connel 1980). D'autres algorithmes plus sophistiquis, comme les varia- bles instrumentales et le maximum de vraisemblance, appli- ques a des series chronologiques entachees artificiellement d'un bruit alkatoire de moyenne nulle et de variance cons- tante, produisent des solutions non biaisies meilleures que celles obtenues par la methode standard des moindres carrks Can. J. Civ. Eng. Downloaded from www.nrcresearchpress.com by CONCORDIA UNIV on 12/10/14 For personal use only.

Comparaison de méthodes d'estimation des débits journaliers

  • Upload
    pierre

  • View
    214

  • Download
    2

Embed Size (px)

Citation preview

Page 1: Comparaison de méthodes d'estimation des débits journaliers

Comparaison de mCthodes d'estimation des debits journaliers

SAAD BENNIS ~ c o l e de technologie supirieure, 4750, rue Henri-Julien, Montreal (Quebec), Canada H2T 2C8

ET

PIERRE BRUNEAU Division hydrologie, service hydraulique, Direction amenagement de centrales, Hydro-Quebec, place Dupuis,

1 7e Ptage, 855, rue Sainte-Catherine est, Montreal (Quebec), Canada H2L 4P5

Recu le 3 janvier 1992

RCvision acceptke le 24 juillet 1992

L'objectif de la premihe partie de 1'Ctude prCsentCe ici est la comparaison des possibilitCs de differentes techniques et modkles d'estimation des debits journaliers. Nous avons, pour ce faire, dCveloppC un logiciel de calcul, trks gCnCral d'application, baptisC DebEst. Le bassin de la rivihe Saint-Fran~ois a CtC retenu comme argument physique, vue la disponibilitk de plusieurs stations hydromCtriques dans cette rCgion. Toutes les techniques et modkles utilisks donnent de bons rbultats. Cependant, l'analyse en composantes principales et la regression multiple appliquees a des modkles dkterministes donnent de meilleurs rCsultats que les modkles ARIMA. L'algorithme rCcursif des moindres carrCs offre plus de flexibilitk que les autres techniques, mais prCsente parfois des problkmes de divergence dus a la mauvaise pondiration des bruits de mesure et de modtlisation. L'utilisation de modkles saisonniers et la prise en compte de la variation des paramktres en fonction du dCbit a permis dJamCliorer d'une f a ~ o n significative tous les rbultats. Toutes les techniques prCsentCes produisent des rCsidus autocorreles au moins pour les trois premiers retards. Les modkles saisonniers rkussissent attenuer I'amplitude de la fonction d'autocorrClation des rCsidus, laquelle reste encore signifi- cative. Dans la deuxikme partie de cette Ctude nous utiliserons la technique du filtre de Kalman en parallkle avec les methodes prCsentCes ici pour extraire l'information rCsiduelle et produire des rCsidus rkellement indbpendants.

Mots clis : dCbit journalier manquant, composantes principales, moindres carrb, estimation rkcursive, autocorrClation des residus.

The aim of the first part of our research, described in this paper, was to compare daily streamflow estimation techniques and models. A general application software named DebEst was developed for the purpose. The Saint-Fran~ois River basin was used as a physical test area because of the availability of several hydrometric stations in this region. All techniques and models used gave good results. However, principal component analysis and multiple regression applied to deterministic models gave better results than ARIMA models. The least square recursive algorithm was more flexible than the other techniques, although discrepancies sometimes appeared because of incorrect weighting of measuring and modelling noise. Results improved significantly when seasonal models were used and when the variation of parameters was taken into account as a function of flow. All techniques described yielded autocorrelated residuals, at least for the first three time lags. The amplitude of the residual autocorrelation function was reduced by seasonal models although it still remained high. In the second part of our research, the Kalman filter technique will be used in conjunction with the methods described above to extract residual information and generate truly independent residuals.

Key words: missing streamflow record, principal components, least squares, recursive parameter estimation, residual autocorrelation.

[Journal translation]

Can. J. Civ. Eng. 20. 480-489 (1993)

1. Introduction Les series des debits journaliers sont necessaires pour

proceder a des etudes hydrologiques reliees la gestion du risque, de la crue maximale probable, de la securitk des bar- rages, de la capacite des evacuations, des niveaux maximal et minimal critiques et du probleme d'etiage. Or, en pra- tique, dans certains cas, on ne dispose que de series de donnies partielles, manifestement insuffisantes pour une etude hydrologique complkte. Dans le cas oh de longues series hydromitriques sont disponibles, il est trks frequent de constater que des donnees manquent.

La litterature abonde de modkles de reconstitution des series d'apports mensuels ou annuels (Dragan et al. 1989) alors que la reconstitution des debits journaliers est beau- coup moins documentee (Beauchamp et Downing 1989). Le modkle le plus utilise est prisente sous forme de regression

NOTA : Les commentaires sur le contenu de cet article doivent &tre envoyts au directeur scientifique de la revue avant le 31 octobre 1993 (voir l'adresse au verso du plat supkrieur). Prinlcd in Canada / Imprime au Canada

multiple oh la station a reconstituer est exprimke en fonction des stations reconstituantes (Haan 1977). Les parametres du modkle regressif sont estimes a l'aide de la mkthode classique des moindres carres (Young 1974). D'une facon generale, cette dernikre technique donne de bons risultats. Cependant, elle posskde trois inconvenients : (i) elle ne tient pas compte de la variation des paramktres de regression en fonction du temps; (ii) les variables dkpendantes sont souvent correlies entre elles, ce qui viole une des conditions de son application; (iii) les erreurs de mesure obkissent rarement a l'hypothese de bruit gaussien utilisee dans la solution par la methode standard des moindres carrks. Ce dernier point est source de biais dans I'estimation des paramktres du modkle de regression utilise (O'Connel 1980).

D'autres algorithmes plus sophistiquis, comme les varia- bles instrumentales et le maximum de vraisemblance, appli- ques a des series chronologiques entachees artificiellement d'un bruit alkatoire de moyenne nulle et de variance cons- tante, produisent des solutions non biaisies meilleures que celles obtenues par la methode standard des moindres carrks

Can

. J. C

iv. E

ng. D

ownl

oade

d fr

om w

ww

.nrc

rese

arch

pres

s.co

m b

y C

ON

CO

RD

IA U

NIV

on

12/1

0/14

For

pers

onal

use

onl

y.

Page 2: Comparaison de méthodes d'estimation des débits journaliers

BENNIS ET BRUNEAU

(Young 1970). Malheureusement, ces algorithmes n'appor- tent plus d'ameliorations significatives lorsqu'il s'agit d'un signal experimental entachk d'un bruit reel de caractkris- tiques statistiques inconnues qui ne repondent plus aux hypo- theses idkales imposies (Davies 1983).

L'analyse en composantes principales vient remedier ti la dkpendance mutuelle des variables indkpendantes (McCuen et Snyder 1986). Par une rotation des axes, on trouve de nouvelles variables orthogonales riellement indkpendantes, appelees composantes principales. Celles-ci s'expriment sous forme de combinaisons 1inCaires des variables initiales. Les coefficients de ponderation sont les elements des vecteurs propres de la matrice de correlation des debits.

La regression pseudo-orthogonale (Kachroo et Liang 1992) peut aussi Stre utiliske pour remedier au problkme de multicolinCaritC des entrees du systkme. Malheureusement, cette technique fait appel a un facteur arbitraire de poids qu'il faut determiner par essai-erreur, alors que notre objec- tif est de developper une mkthodologie automatisee et gene- rale d'application. De plus, le facteur de poids utilise dans la regression pseudo-orthogonale introduit un biais dans la solution, laquelle n'est plus optimale au sens des moindres carrb. Ce biais, qui evolue dans le meme sens que le facteur de poids, peut Stre modere dans certaines situations (Bruen et Dooge 1984)' mais peut devenir trks important pour d'autres applications (Kachroo et a[. 1992).

Pour remedier au problkme de stationnarite du modkle, nous utilisons l'algorithme recursif des moindres cards, (Schilling et Martens 1986). Cette technique offre les avan- tages d'un calcul itCratif rapide, avec un espace memoire tres restreint dans l'ordinateur, et elle s'applique a des sys- temes non stationnaires a entrees-sorties multiples.

Toutes les mCthodes presentees jusqu'ici sont mediates ou a liaison spatiale, dans le sens ou elles tiennent compte de 17information recueillie a I'extCrieur de la station ou il y a des donnees manquantes. Dans le cas oh cette information n'est pas disponible, nous proposons des methodes imme- diates qui n'utilisent que les informations a la station a reconstituer. I1 s'agit, dans ce cas, de modkles univaries. Les modkles ARIMA (Box et Jenkins 1976) sont appropries pour representer l7Cvolution des debits et reconstituer les donnkes manquantes. Ce type de modkles peut donner de bons rCsul- tats tant que le nombre de debits a estimer reste raisonnable.

MalgrC leur ecart de performance relatif, toutes les tech- niques presentees jusqu'a maintenant donnent de bons resultats mais produisent des rCsidus dont la fonction d'auto- correlation est significative au moins pour les trois premiers retards. L'utilisation d'une technique de filtrage autoadap- tative pour extraire cette autocorrClation des risidus fait l'objet de la deuxikme partie de ce travail.

2.1. Rkgression multiple et pseudo-orthogonale Dans ce type d'approche, le debit de la station a recons-

tituer, Qo, ,, est exprime comme combinaison lineaire des debits de stations avoisinantes, Qi,! :

ci est le retard ou l'avance, exprime en jours, de la pointe de la crue a la station reconstituante i (par rapport a celle de la station dYintCrEt a reconstituer; Vl est un paramktre d'erreur incluant les bruits de mesure et de modelisation. Les coefficients de regression a; sont determines par la reso- lution des equations normales qui minimisent la somme des carrCs des bruits Vt, soit :

avec

Nes t le nombre total des observations communes a toutes les stations utiliskes. Le vecteur A est calibre sur la periode commune oh toutes les donnies sont disponibles. L'Cqua- tion 1 est ensuite utilisee pour estimer les valeurs manquantes de la station d'interet.

La regression multiple saisonnikre consiste a appliquer le modkle 1 separiment a chaque mois de 1'annCe.

La regression pseudo-orthogonale consiste a remplacer la matrice P par la matrice P' :

ou p est un facteur de poids arbitraire qu'il faut determiner par essai-erreur afin d'obtenir un lissage adequat et I est la matrice identit6 d'ordre n.

Cette methode n'a pas etC utilisee ici pour les raisons citees dans l'introduction. Soulignons, cependant, que la methode standard des moindres carrCs constitue un cas particulier de la regression orthogonale (0 = 0).

2.2. Analyse en composantes principales Une des principales conditions d'utilisation de la mithode

des moindres carrCs dans la regression multiple est 1'indC- pendance des variables Q;,,. Or, il est evident que les debits journaliers des stations avoisinantes sont corrClCs entre eux. C'est pour cette raison qu'une rotation orthogonale des axes est opCrCe pour trouver de nouvelles variables rkellement independantes appelkes composantes principales.

On cherche alors de nouvelles variables S- sous forme de combinaisons linkaires des debits Qi,! :

Can

. J. C

iv. E

ng. D

ownl

oade

d fr

om w

ww

.nrc

rese

arch

pres

s.co

m b

y C

ON

CO

RD

IA U

NIV

on

12/1

0/14

For

pers

onal

use

onl

y.

Page 3: Comparaison de méthodes d'estimation des débits journaliers

482 CAN. J. CIV. ENG. VOL. 20, 1993

est le ke vecteur propre de la matrice de correlation des debits :

dans laquelle

rv exprime donc la correlation entre les stations i et j; Qi et Qj representent les moyennes respectives des debits dans les stations i et j.

On exprime maintenant les debits de la station a recons- tituer en fonction des nouvelles variables indipendantes Ck sous la forme :

On peut dkmontrer (McCuen et Snyder 1986) que les coef- ficients de regression a; s'obtiennent directement par la relation

ou Xi est la valeur propre associke au vecteur propre Li. Plusieurs mkthodes permettent de determiner le nombre de composantes principales a conserver. I1 a CtC decide arbi- trairement ici que toute composante principale, dont la variance expliquee, exprimee par

est infkrieure au seuil d'acceptation de 1% sera Ccartee (D. Duban. 1978. Hydrologie statistique approfondie. Ins- titut national polytechnique de Grenoble, Grenoble. Notes de cours.)

Comme dans la technique preckdente, les coefficients ai sont calibres sur la periode commune oh toutes les donnies

sont disponibles. On utilise ensuite les equations 3, 4 et 5 pour estimer les donntes manquantes.

Afin d'eliminer toute forme d'irregularite ou de difference d'echelle entre les variables, il vaut mieux travailler avec des variables centrees rtduites que sur les variables initiales. I1 est possible de travailler sur la matrice de covariance ou sur la matrice de correlation. La matrice de covariance des variables centrkes rCduites est egale a la matrice de correla- tion des variables non centrees et non rkduites.

2.3. Algorithme rkcursif des moindres carres Dans l'algorithme recursif des moindres carrb, les coef-

ficients du modkle de regression sont reajustes d'une faqon iterative. Ayant calcule la solution du problkme A,- pour les t - 1 premikres journtes de simulation, la solution A, qui tient compte des valeurs des debits au jour t se calcule (Davies 1983) par

Les notations pour les debits sont les mCmes qu'a la section 2.1. P: est la matrice de covariance de l'erreur d'estimation de A,, elle est relike a P dCfini en [2] par

P est calcule, dans ce cas, a partir des debits enregistres jusqu'au jour t; of est la variance du bruit gaussien V,.

Les ClCments diagonaux de la matrice P,', P ;~ , Pi2, ..., P:,, representent respectivement les variances des coeffi- cients a l , a2, ... , an, alors que les elements non diagonaux representent les covariances entre les coefficients.

P; est riajust6 a chaque iteration par la relation recursive suivante :

La variance du bruit de mesure Ctant elle aussi inconnue, elle peut Ctre reajustee (Fitch et McBean 1991) par la relation

Les differentes possibilitCs d'klaboration de l'algorithme recursif des moindres carrCs sont discuties en detail par Bennis et Rassam (1991). La version retenue ici est celle ou les conditions initiales sont

Les equations 6 a 9 sont alors utiliskes pour identifier recur- sivement les paramktres du modkle A, a partir de l'histo- rique disponible. Lorsqu'une ptriode de donnees man- quantes est rencontree, 1'Cquation 1 est utilisee pour les estimer. Aprks cette pkriode, les coefficients continuent de se riajuster comme auparavant.

Can

. J. C

iv. E

ng. D

ownl

oade

d fr

om w

ww

.nrc

rese

arch

pres

s.co

m b

y C

ON

CO

RD

IA U

NIV

on

12/1

0/14

For

pers

onal

use

onl

y.

Page 4: Comparaison de méthodes d'estimation des débits journaliers

BENNIS ET BRUNEAU 483

Entre autres avantages, l'algorithme recursif des moindres pendamment de la valeur du debit, on utilisera le coefficient carrks n'impose aucune condition ?I la matrice P;, alors que de determination R2 : la matrice P doit Ctre non singulikre dans la methode standard des moindres carrCs (equation 2). De plus, l'algo- 2 6 rithme recursif permet d'arreter les calculs si la variation [I8] = - - des paramktres du modkle est lente, ce qui indique leur a$

niveau de precision par l'intermkdiaire de la matrice de oh u$ est dCfini par covariance de I'erreur P:.

2.4. Rkgression multiple aux dqfkrencespremi2res (mod2le autorkgressif)

Le modkle autoregressif [AR(2)] se prksente sous la forme

I101 Q I + I = biQt + b2Qt-I + Vt

Les coefficients bl et b2 sont determines (Thirriot et al. 1988) par

avec

La signification statistique de pj est traitke au prochain paragraphe. D'une facon plus gCnQale, le modkle auto- regressif d'ordre p s'ecrit

Afin de determiner les coefficients bl, b2, ..., b,, on forme les matrices

1141 M =

Q N - I Q N - 2 ... Q N - p

et

La mkthode standard des moindres carres donne alors direc- tement la solution b = [bl, b2, . .., b,] par

3. Crithres de comparaison 3.1. Coefficient de dktermination

Le premier critkre de comparaison est la somme des ecarts quadratiques entre les debits estimks, Q,,,, et observes, Qobs :

En fait, dans le but de pouvoir comparer les mkthodes inde-

Afin de comparer l'efficacitk relative de deux techniques, il suffit de comparer leur coefficient de determination res- pectif. Pour mieux apprecier 1'Ccart de performance entre deux techniques, on introduit ici un nouveau parametre de performance

oh Ria,, est le coefficient de determination le plus faible correspondant a la technique la moins efficace, qualifiee ici de (( technique de base D; et R 2 est le coefficient de deter- mination de la technique consideree. p exprime donc, en pourcentage de la variance totale non expliquee par la tech- nique de base, I'amClioration apportee par la technique considCree.

I1 est trks important de faire la distinction entre l'erreur de calibration du modkle et l'erreur d'estimation des donnkes manquantes ou l'erreur d'extrapolation. La premiere est toujours decroissante avec le nombre de paramktres et de variables utilises, autrement dit avec la sophistication du modele. La deuxikme est decroissante jusqu'a une valeur optimale du nombre de paramktres puis devient croissante (Akaike 1974). Abraham et Ledolter (1983) ont soulignt l'importance de choisir le modkle contenant le minimum possible de paramktres : (i) le modkle le plus simple est plus facile A comprendre et (ii) l'estimation de chaque paramktre superflu augmente la variance de l'erreur de prevision.

Par consequent, le modele ayant le plus haut coefficient de determination n'est pas forcement le meilleur pour l'extrapolation. Dans cet ordre d'idke, nous respecterons le principe de parcimonie qui consiste a utiliser le minimum possible de parametres dans le modkle. D'un autre c6tC, toutes les techniques seront comparkes sur la mCme base du nombre de parametres utilisks. Dans tous les exemples traites ici, nous utilisons deux stations reconstituantes, bien que le logiciel DebEst permette d'utiliser jusqu'a quatre stations reconstituantes.

3.2. Coefficient de persistance Le deuxikme critkre utilist est le coefficient de persistance,

Cp (Kitadinis et Bras 1980); il est dCfini par

oh E ; est defini par l'equation 17, et par

Can

. J. C

iv. E

ng. D

ownl

oade

d fr

om w

ww

.nrc

rese

arch

pres

s.co

m b

y C

ON

CO

RD

IA U

NIV

on

12/1

0/14

For

pers

onal

use

onl

y.

Page 5: Comparaison de méthodes d'estimation des débits journaliers

484 CAN. J. CIV. ENG. VOL. 20, 1993

Cp est un indicateur de la performance du modele par rapport au modkle statique qui remplace la donnee man- quante par le debit de la journke pricedente. Une valeur positive de Cp signifie que le modkle utilise donne de meil- leurs rksultats que le modkle statique, alors qu'une valeur negative indique le contraire.

Compte tenu du fait que I'estimation des debits journaliers ne se limite pas a une seule journee, on generalise ici la notion de coefficient de persistance a plusieurs journees con- secutive~. On introduit alors la notion de coefficient de per- sistance generalis6 defini par

En particulier Cp(l) = Cp utilisk par Kitadinis et Bras (1980). Cp(2) represente la performance du modkle par rapport au modkle statique qui remplace la donnee man- quante par le debit enregistre deux jours auparavant, le debit de la journke prkcedente Ctant lui aussi manquant, et ainsi de suite.

3.3. Coefficient d'extrapolation Le troisikme critkre de performance utilise est le coefficient

d'extrapolation (Kitadinis et Bras 1980)' CE, dkfini par

et QE(j) est le debit calculC par extrapolation IinCaire a partir des deux dernikres valeurs du debit. Comme pour Cp, une valeur positive de CE signifie que le modkle utilise est plus performant que le modkle d'extrapolation lineaire. Une valeur negative de CE indique le contraire.

I1 est possible aussi de substituer a l'extrapolation lineaire l'extrapolation parabolique exprimke (Thirriot et al. 1988) Par

ou d est le dClai d'extrapolation.

3.4. Fonction d'autocorrelation des rksidus Le quatrikme critkre de comparaison porte sur la fonction

d'autocorrClation des residus. Les methodes et solutions proposkes sont basCes sur I'hypothkse que les residus prennent des valeurs aleatoires de moyenne nulle et de variance constante. I1 faut par consequent verifier que leur fonction d'autocorrelation s'approche de zero.

D'une faqon gtnkrale, la fonction d'autocorrelation pK mesure la correlation entre une variable stochastique X(t) et les valeurs prises a t + K, X(t + K ) . La fonction pK est definie (Priestley 1987) par

COV{X(t), X(t + K)) 1271 PK =

[ v ~ R { x ( t ) ) VAR{X(~ + K) )I 'I2

COV{X(t), X(t + K)) est la covariance entre X(t) et X(t + K); VAR{X(t)} est la variance de X(t).

Comme les covariances et les variances sont inconnues, la fonction d'autocorrelation d'une serie finie peut Etre estimke par

N-K

Cette dernikre equation peut &re utilisee pour estimer la corrtlation entre les residus a diffkrents retards. L'Cqua- tion 28 s'kcrit, dans ce cas,

N-K z [Res(t) - R E ] [Res(t + k) - &I

et Res = moyenne des residus.

Afin d'apprecier rationnellement I'ampleur des valeurs prises par la fonction r~ dans [29], il est necessaire d'estimer I'erreur commise sur le calcul de r ~ .

Bartlett (1946) a developpe une formule approchee pour calculer I'erreur d'estimation de rK :

En designant par pK la valeur reelle de la fonction d'autocorrClation des residus, I'hypothkse Ho est : pK = 0 K = 1, 2, 3, ...

Le coefficient t se calcule par la formule

En pratique, si la valeur absolue de t est infkrieure a 1'25 pour les retards 1, 2 et 3 et infkrieure a 1'6 pour les retards supkrieurs, alors on peut conclure que les rksidus sont indk- pendants. (Pankratz 1983)

4. Application Le logiciel DebEst est d'application trks generale. I1 ne

contient aucun paramktre ou hypothkse prealable qui limi- terait son utilisation a un bassin ou une region donnee. Dans le cadre de la presente etude, le bassin de la rivikre Saint- Franqois a ete retenu comme bassin tCmoin (fig. 1). I1 s'etend sur une superficie de 10 230 km2, dont 85% se trouve au Quebec et 15% aux ~ t a t s - ~ n i s . Ce bassin est trks bien docu- ment& Les sous-bassins, au nombre de 13, posskdent au

Can

. J. C

iv. E

ng. D

ownl

oade

d fr

om w

ww

.nrc

rese

arch

pres

s.co

m b

y C

ON

CO

RD

IA U

NIV

on

12/1

0/14

For

pers

onal

use

onl

y.

Page 6: Comparaison de méthodes d'estimation des débits journaliers

BENNIS ET BRUNEAU

FIG. 1. Bassin de la rivitre Saint-Franqois, retenu comme bassin temoin au cours de cette etude. Dessin non B 1'Cchelle.

moins deux stations, une limnimktrique et l'autre mCtCoro- logique. Afin de tester la capacitk du logiciel a estimer des donnkes manquantes, trois stations pilotes ont Cte choisies. Elles sont situCes sur les sous-bassins principaux des rivikres au Saumon, Eaton et Massawippi. Pour estimer les dCbits journaliers a chacune des stations, il est possible d'utiliser jusqu'a quatre stations reconstituantes. Cependant, nous nous sommes limitis, dans le cadre de la prksente applica- tion, a un maximum de deux stations reconstituantes, par souci de parcimonie.

Les stations a reconstituer sont : (1) la station 030219 (839 km2), situee sur la rivikre au

Saumon, a 11,9 km en amont de l'embouchure sur la rivikre Saint-Francois; les stations reconstituantes dans ce cas, 030238 (86 km2) et 030257 (123 km2), sont situees sur la rivikre Eaton, directement avoisinante;

(2) la station 030242 (197 km2), situCe sur la rivikre Eaton, au niveau de Sawyerville; les stations reconstituantes, dans ce cas, sont les m2mes que prCcCdemment.

(3) la station 0303215 (521 km2), situee sur la rivikre Massawippi; les stations reconstituantes sont 030217 (210 km2), situee sur la riviere Ascot, et 030219 (839 km2), situCe sur la rivikre au Saumon.

5. RCsultats et comparaison des mdthodes Avant de choisir la methode ou les stations reconstituantes

a utiliser dans le modkle d'estimation des debits, l'utilisateur du programme DebEst est guide par une Ctape d'exploration visuelle se basant sur trois graphiques :

(1) Le premier permet de comparer, sur un m2me gra- phique, l'Cvolution, en fonction du temps, du dCbit de la station a reconstituer avec les dCbits des stations reconsti- tuantes successives.

(2) Le deuxikme est identique au premier mais utilise des variables centrCes riduites pour Climiner le facteur d'kchelle.

(3) Le troisikme permet d'Ctablir une correspondance de

Station reconstituee, debit (m3/s)

2,667 2,667 Station reconstituee, In debit 7,792

FIG. 2. Nuage de correspondance entre le debit a la station reconstituante (030205) et celui B la station reconstituke (030203). (a) Sans transformation logarithmique. (b) Aprts transformation logarithmique.

Can

. J. C

iv. E

ng. D

ownl

oade

d fr

om w

ww

.nrc

rese

arch

pres

s.co

m b

y C

ON

CO

RD

IA U

NIV

on

12/1

0/14

For

pers

onal

use

onl

y.

Page 7: Comparaison de méthodes d'estimation des débits journaliers

CAN. I. CIV. ENG. VOL. 20, 1993

TABLEAU 1. Comparaison des critkres de performance des methodes utiliskes

Regression multiple Analyse en Algorithme recursif Modkle des moindres carres composantes principales des moindres carres ARIMA

c C,(i> C E ( ~ ) cp( i ) CE(i) cp( i ) C E ( ~ ) CJi) C,(i)

Station reconstituee : 030219 Stations reconstituantes : 030257 et 030238

-0,04 0,346 -0,85 -0,16 -0,48 0,07 0,547 0,826 0,20 0,69 0,35 0,75 0,68 0,916 0,43 0,85 0,54 0,88 0,74 0,945 0,54 0,90 0,63 0,92 0,78 0,962 0,61 0,93 0,70 0,94 0,81 0,974 0,67 0,95 0,73 0,96

Station reconstitube : 030242 Stations reconstituantes : 030257 et 030238

0,952 0,974 0,712 0,87 0,891 0,951 0,968 0,992 0,839 0,962 0,939 0,985 0,97 0,996 0,853 0,98 0,944 0,992 0,97 0,997 0,849 0,986 0,943 0,995

0,973 0,998 0,868 0,991 0,950 0,996 0,977 0,999 0,885 0,993 0,956 0,997

Station reconstituee : 030215 Stations reconstituantes : 030217 et 030219

0,54 0,77 0,513 0,75 0,302 0,653 0,77 0,935 0,757 0,93 0,65 0,899 0,82 0,965 0,80 0,96 0,725 0,95 0,84 0,978 0,83 0,97 0,758 0,97 0,86 0,986 0,85 0,98 0,776 0,98 0,87 0,99 0,86 0,99 0,784 0,99

NOTA : C, retard, exprime en jours, de la pointe de la crue a la station reconstituante par rapport a la station reconstitute.

TABLEAU 2. Comparaison des coefficients de determination mensuels

Station

Janvier ND ND 0,583 Fevrier ND ND 0,738 Mars Avril Mai Juin Juillet Aoiit Septembre Octobre Novembre DCcembre

correlation visuelle en portant le debit de la station recons- tituante ou son logarithme sur l'axe X et le debit de la station A reconstituer ou son logarithme sur l'axe Y. La transfor- mation logarithmique permet dans certains cas d'obtenir une relation liniaire caractkrisee par un nuage symetrique et con- centre sur la droite de regression. A titre d'exemple, la figure 2a montre la correspondance entre deux stations (030203 et 030205) sans transformation lonarithmique. La figure 2b montre' le m&me nuage aprtts-transformation logarithmique.

Le tableau 1 presente les valeurs des coefficients de deter- mination, de performance, d'extrapolation et de persistance obtenues pour les trois stations selon les quatre techniques, lors de la calibration des modttles. Les coefficients de per- sistance et d'extrapolation sont representis pour les six pre- miers retards. Les figures 3a A 3b comparent les debits mesu- rCs et les debits estimes par differentes techniques pour la

Annuel 0,845 0,980 0,834 station 030242 situee sur-la rivikre Eaton; les p&iodes com- parees sont celles oG la fonte printanittre contribue de f a ~ o n

NOTA : ND, donnees non disponibles. importante aux debits. Ces derniers presentent alors de

Can

. J. C

iv. E

ng. D

ownl

oade

d fr

om w

ww

.nrc

rese

arch

pres

s.co

m b

y C

ON

CO

RD

IA U

NIV

on

12/1

0/14

For

pers

onal

use

onl

y.

Page 8: Comparaison de méthodes d'estimation des débits journaliers

BENNIS ET BRUNEAU

I I I I I I I I I

197313110 22 jours 19731411

[-I Estime [ + I Mesure [ - I Estirne [ + I Mesure

FIG. 3. Comparaison des debits mesurks (+) et des debits estirnes par differentes techniques, pour la station 030242, au cours d'une pkriode de 22 jours, s'ktalant du 10 mars au 1" avril 1973. Estimation des valeurs journalikres par (a) regression multiple, (b) regression multiple par pkriode rnensuelle, (c) analyse en cornposantes principales, (d) analyse en composantes principales periodique, (e) algo- rithrne recursif des rnoindres carrks et ( f ) ARIMA[AR(~)].

grandes variations, difficiles a estimer par des techniques (i) En depit de faiblesses thkoriques, la regression simples. multiple, calculCe par la mkthode standard des moindres

Les conclusions Cnoncees aprts proviennent de l'examen carrCs, est robuste et fiable; elle rCsiste assez bien aux erreurs de ces figures. de mesure et donne toujours une solution raisonnable.

Can

. J. C

iv. E

ng. D

ownl

oade

d fr

om w

ww

.nrc

rese

arch

pres

s.co

m b

y C

ON

CO

RD

IA U

NIV

on

12/1

0/14

For

pers

onal

use

onl

y.

Page 9: Comparaison de méthodes d'estimation des débits journaliers

Can

. J. C

iv. E

ng. D

ownl

oade

d fr

om w

ww

.nrc

rese

arch

pres

s.co

m b

y C

ON

CO

RD

IA U

NIV

on

12/1

0/14

For

pers

onal

use

onl

y.

Page 10: Comparaison de méthodes d'estimation des débits journaliers

BENNIS ET BRUNEAU 489

d'autocorrelation des residus. Cette dernikre est calculee systematiquement pour les 15 premiers retards. La formule de Bartlett (1946) est utiliske pour determiner la statistique t (equation 31). Malheureusement toutes les methodes donnent des coefficients d'autocorrClation non nuls a 95%' et ceci au moins pour les sept premiers retards (t > 2) (tableau 4). Cependant, les modkles saisonniers produisent gCnCralement de meilleurs rksultats, leurs coefficients d'auto- correlation etant plus modCres (tableau 4). Mais la fonction d'autocorrClation reste significative au moins pour les deux premiers retards. L'existence de cette autocorrClation entre les rCsidus viole, d'une part, une des conditions d'applica- tion des mkthodes utilisees. D'autre part, cela signifie que les methodes utilisees ne tiennent pas compte d'une f a ~ o n explicite de I'autocorrClation qui existe entre les debits journaliers. Les rtsidus contiennent donc de l'information rtsiduelle non exploitke par le modkle. La deuxikme partie de cette etude montre comment il est possible de conjuguer le filtre de Kalman a chacune des techniques presentees ici pour amiliorer les resultats et obtenir des rksidus dont la fonction d'autocorrelation s'approche de zero.

6. Conclusion Cet article decrit la premikre Ctape d'une recherche sur

la comparaison et I'amClioration des techniques d'estimation des debits journaliers. L'Ctude s'est concretisee dans le dCve- loppement d'une premikre version d'un programme infor- matise baptise DebEst, d'application tres gCnCrale.

Toutes les techniques et modkles utilisis donnent de bons resultats. Cependant, l'analyse en composantes principales et la regression multiple appliquees a des modkles determi- nistes donnent de meilleurs resultats que les modkles ARIMA. L'algorithme recursif des moindres carres offre plus de flexi- bilite que les autres techniques, mais prtsente parfois des problkmes de divergence relib a une grande sensibilitk de l'algorithme de calcul aux erreurs de modelisation et de mesure.

L'utilisation de modtles saisonniers et la prise en compte de la variation des paramktres en fonction du debit a per- mis d'ameliorer d'une f a ~ o n significative tous les modkles utilisks. Toutes les techniques presentees produisent des rCsi- dus autocorrelks au moins pour les trois premiers retards. Les modkles saisonniers reussissent a attenuer 1Cgkrement les valeurs de la fonction d'autocorrelation des rksidus. La suite logique de ce travail consiste a conjuguer des techniques de filtrage robustes (filtre de Kalman) aux techniques prC- sentees ici pour ameliorer les rksultats et obtenir des rCsidus reellement independants; ceci fait l'objet de la deuxikme par- tie de cette etude.

Remerciements Les auteurs tiennent a remercier Hydro-Quebec, le Conseil

de recherches en sciences naturelles et en genie du Canada ainsi que 1 '~cole de technologie supkrieure pour l'appui financier fourni a ce projet. 11s remercient tgalement les reviseurs qui ont contribue avec leurs commentaires a ameliorer le contenu de l'article.

Abraham, B., et Ledolter, J . 1983. Statistical methods for fore- casting. John Wiley & Son, New York.

Akaike, H. 1974. A new look at the statistical model identification. IEEE Transactions on Automatic Control, AC-19 : 716-723.

Bartlett, M.S. 1946. On the theoretical specification of sampling properties of autocorrelated time series. Journal of the Royal Statistical Society, B8: 27.

Beauchamp, J.J., et Downing, D.J. 1989. Comparison of regres- sion and time-series methods for synthesizing missing streamflow record. Water Resources Bulletin, 25 : 961-975.

Bennis, S., et Bruneau, J. 1993. Amelioration de mkthodes d'esti- mation des debits journaliers. Revue canadienne de genie civil, 20 : 000-000.

Bennis, S., et Rassam, J.C. 1991. Utilisation d'un modkle ARMAX pour la prevision du debit a Carillon. Revue canadienne de genie civil, 18 : 864-870.

Box, G.E.P., et Jenkins, G.M. 1976. Time series analysis: fore- casting and control. 2e Cd. Holden Day, San Francisco.

Bruen, M., et Dooge, J.C.I. 1984. An effective and robust method for estimating unit hydrograph ordinates. Journal of Hydrology, 70 : 1-24.

Davies, P. 1983. A recursive approach to prony parameter esti- mation. Journal of Sound and Vibration, 89 : 571-583.

Dragan, A., Savie, D., Burn, H., et Zrinji, Z. 1989. A comparison of streamflow generation models for reservoir capacity - yield analysis. Water Resources Bulletin, 25 : 977-983.

Fitch, M.A., et McBean, E.A. 1991. Multi-day flow forecasting using the Kalman filter. Revue canadienne de genie civil, 18 : 320-327.

Haan, C.T. 1977. Statistical methods in hydrology. The Iowa State University Press, Ames. Iowa, pp. 1-20.

Kachroo, R.K., et Liang, L.G.C. 1992. River flow forecasting. Part 11. Algebraic development of linear modelling technics. Journal of Hydrology, 133 : 17-40.

Kachroo, R.K., Sea, C.H., Warsi, M.S., Jemenez, H., et Saxena, R.P. 1992. River flow forecasting. Partie 3. Application of linear techniques in modelling rainfall-runoff transformations. Journal of Hydrology, 133 : 41-97.

Kitadinis, P.K., et Bras, R.L. 1980. Real-time forecasting with a conceptual hydrologic model. 2. Applications and results. Water Resources Research, 16b : 1034-1044.

McCuen, R.H., et Snyder, W.M. 1986. Hydrologic modelling: statistical methods and applications. Prentice-Hall, Englewood Cliffs.

O'Connel, P.E. (~diteur.) 1980. Real-time hydrological forecasting and control-Proc. 1st International Workshop, Institute of Hydrology, Walling-Ford.

Pankratz, A. 1983. Forecasting with univariate box-Jenkins models. Concepts and Cases. John Willey & Sons, New York.

Priestley, M.B. 1987. Spectral analysis and time series. Academic Press Ltd., New York.

Schilling, W., et Martens, J. 1986. Recursive state and parameter estimation with applications in water resources. Applied Mathe- matical Modelling, 10 : 433-437.

Thirriot, C., Bernede, J.P., et Habaieb, H. 1988. Comparaison pratique de methodes de prevision de crues. Exemple de I'Aveyron. La Houille Blanche, 5 : 385-393.

Young, P.C. 1970. An instrumental variable method for real-time identification of a noisy process. Automatika, 6 : 271-287.

Young, P.C. 1974. Applying parameter estimation to dynamic systems. Control Engineering, 10 : 119-124.

Can

. J. C

iv. E

ng. D

ownl

oade

d fr

om w

ww

.nrc

rese

arch

pres

s.co

m b

y C

ON

CO

RD

IA U

NIV

on

12/1

0/14

For

pers

onal

use

onl

y.