Transcript

551.501.45:551.577.38

(Institut t~oyal Mdtdorologique de Belgique, Ucele-Bruxelles)

Un type de distribution diserbte tronqu6e

Par

R. Sneyers

R~sum~. L'analyse statistique de Ia distribution des p6riodes sgches .~ I-Ieiligenblut sugg6re l'emploi de distributions thdoriques tronqudes pour la reprdsenter. De bons ajustements sont effeetivement obtenus au moyen d'une distribution logarithmique et d'une distribution binomiale ndgative dont les deux premiers termes ont 6td supprimds.

Zusammenfassung, Die statistische Analyse der I-I/iufigkeitsverteilung der Trockenperioden in tteiligenblut gibt die Grundlage zu einer Betraehtung abgesehnittener Verteilungen. Eine logarithmische und eine negative bino. mime Verteilung, vonder die zwei ersten Glieder weggelassen wurden, geben eine befriedigende l--bereinstimmung.

Summary. The statistical analysis of the distribution of droughts in Heiligenblut suggests the use of truncated theoretical distributions for its representation. A logarithmic and a negative binomial distribution of which the two first terms have been suppressed give effectively good fits.

1. Introduction

Dans une note r6cente [I], I~. STEINI~IXUSSER a attir6 l'attention sur le fait qu'aucune distribution th6orique elassique ne permet d~ rendre compte d'une fa~on sa~isfaisante de la r@artition de fr~quences des p~riodes sgches (jours eons~cutifs sans pluie) k I-s

Cet dehee est assez surprenant puisqu'il r~v~le, ~ premigre rue, des comportements st~tistiques diff6rents des p6riodes sgehes dans l'ouest de l 'Europe (Paris St-Maur et Ueele) et sur le versant sud des Alpes orientales, alors que pour les p~riodes pluvieuses, un mgme type de distribution (en l'oeeurenee la distribution binomiale n6gative) donne dans les deux cas une bonne representation des r@artitions de fr~quenees observ6es.

1%. S N ~ u Un type de distribution disergte tronqu6e 405

L ' e x a m e n des chiffres publids par H. STEINHXVSSE~ mont re toutefois (voir [l], p. 53) que les diffieultds proviennent de la disproport ion entre valeurs thdoriques et valeurs observdes pour les cinq premieres frdquences et il est curieux de consta ter ~ ce propos que si, en raison de la relat ion :

/0 < 2 h (~)

entre les deux premieres frdquences observdes, l ' a jus tement au moyen d 'une dis t r ibut ion logar i thmique se t rouva i t exclu, la distr ibution bino- miale ndgat ive ajustde fourni t quand m~me une valeur de [o supdrieure au double de [1.

L ' ana lyse s ta t is t ique des donndes complgtes, qui nous ont 6t6 obligeam- men t eommuniqudes, pe rme t t en t d'ailleurs de faire d ' au t res constatat ions.

En effet, si l 'on ddsigne les frdquences des pdriodes de (i ~- 1) jours consdcutifs sans prdeipitat ions par // et si ] 'on pose (el. [2]) :

Ni F~ = 2 /~ . , N~ = 2 ]/~-et l ~ - ( i - - ~ ) , (2)

]>_i i>_i Fi avec i, 7' = 0, 1, 2, . . .

on obtient , pour la distr ibution considdrde les valeurs de [i, Fi , Ni et l~ indiqudes au Tableau 1.

I1 appara l t ainsi, non seulement que les h subissent une croissance r6guli~re, mais encore (par reprdsentat ion graphique), que les valeurs de log (i + 1) ], et plus encore eelles de log (Fi + Ni) d6croissent lind- a i rement b~ par t i r du 5 e tenne, et ee conformdment 5~ une rdpart i t ion qui serait ddfinie par la re la t ion:

~i+1

o~ K est une constante et 0 < ~ < 1, qui n 'es t autre que la relat ion de ddfinition de la dis t r ibut ion logari thmique. I1 s 'ensuit qu 'au lieu de s 'engager dans la vole de la ddeomposit ion de la sdrie eonsiddrde en deux ou plusieurs dist ibutions distinctes, il convient tou t d ' abord de ten ter un a jus tement au moyen d 'une dis tr ibut ion asympto~iquement logari thmique.

N o t o n s immddia tement , ~ ee propos, que les distr ibutions logarith- miques t ronqudes remplissent cette derni~re condition ; de plus, comme une telle dis t r ibut ion peu t se ddfinir au moyen de la re la t ion:

(Zi+ 1 +~o / ~ K i @ l + i 0 avee i 0 ~ l , (3)

de laquelle se ddduit la re la t ion:

/1 1 + i0 /0 - ~'2 + i0'

on vol t sans peine qu 'une telle dis t r ibut ion n 'es t plus incompat ib le avee l ' indgalit6 (1), pourvu que i0 soit suff isamment grand.

406 R . S N E Y E R S :

Par ailleurs, l ' emploi d 'une d i s t r ibu t ion t ronqude pour repr@senter ]a s@rie 6tudi6e t rouve sa just i f icat ion d~ns la na tu r e m6me des donndes,

Tableau 1. Pdriodes de (i + 1) ]ours eonsdcuti]s sans prdcipitations mesurables Heiligenblut. tZrdquences observdes et ]rgquences a]ustdes

i /i Fi N i I i [,~(~) X-2 ]~(z) X 2

0 1 2 3 4 5 6 7 8 9

10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 3O 31 33 35 38 41 45

629 2254 7661 4,40 402 1625 7661 4,71 298 1223 7259 4,93 212 925 6663 5,20 174 713 6027 5,45 105 539 5331 5,89

91 434 4806 6,07 56 343 4260 6,42 50 287 3868 6,48 36 237 3468 6,63 31 201 3144 6,64 35 170 2834 6,67 16 135 2449 7,14 20 119 2257 6,97 11 99 1997 7,17 20 88 1843 6,94

9 68 1543 7,69 9 59 1399 7,71 3 50 1246 7,92 8 47 1192 7,36 3 39 1040 7,67 5 36 980 7,22 3 31 875 7,23 6 28 809 6,89 3 22 671 7,50 2 19 599 7,53 1 17 549 7,29 1 16 523 6,69 3 15 496 6,07 2 12 412 6,33 1 10 354 6,40 1 9 324 6,00 3 8 293 4,62 2 5 194 4,80 1 3 124 4,33 1 2 86 3,00 1 1 45 1,00

624,87 0,03 407,73 0,08 283,78 0,71 205,74 0,19 153,42 2,76 116,79 1,19 90,32 0,01 70,72 3,06 55,93 0,63 44,60 1,66 35,82 0,65 28,94 1,27 23,50 2,39 19,17 0,04 15,70 1,41 12,90 3,91 10,63 0,25

647,02 0,50 401,99 0,00 275,05 1,91 198,58 0,91 148,37 4,43 113,52 0,64 88,39 0,08 69,75 2,71 55,62 0,57 44,74 1,71 36,24 0,76 29,53 1,01 24,19 2,77 19,90 0,00 16,43 1,79 13,61 3,00 11,31 0,47

8,79 ( 7,28 ] 1,03 6,05 5,03 / 0,00 4,19 } 3,50 1,08 2,93 2,45 / 2,06 1,73 1,45 ] 1,22 1,03 0,43

5,73 3,18

9,42( 7,87j 1,62 6,59t 5,53/ 0,10 4,65 3,911 0,39 3,30 2,79 2,36 2,00 1,69 i 1,43 1,211 0,02

7,01 1,28

puisque dans eet te s@rie on a n@glig6 g la lois les p@riodes sgehes d ' une longueur inf@rieure s vingt . -quatre heures et eelles qui, d ' une dur6e de plus de v ing t -qua t re heures, ont 6ehappg s la classification en ra ison du fair qu'elles n ' eng loba ien t pas un jour m6t6orologique entier.

U n t y p e d e d i s t r i b u t i o n d i s c r e t e t r o n q u d e 4 0 7

2. A jus t emen t d 'une dis tr ibut ion logar i thmique tronqude

E n l ' absence de t ou t e ind ica t ion ~ pr ior i sur la va leur qu ' i l convient d ' a t t r i b u e r ~ i0, il f audra proedder pa r essais suecessifs en d o n n a n t /t i0 des va leurs de plus en plus grandes, l ' a eeep ta t ion ou le re je t des distr i- bu t ions eonsiddrdes d t an t 6v idemment lids ~ la quali td de l ' a j u s t e me n t obtenu. On no te ra eependan t que pour faire a ppa ra i t r e l ' ineompat ib i l i t6 d ' une d i s t r ibu t ion thdor ique avee les donn6es observdes, il n ' e s t pas indispensable de ddvelopper eet te d i s t r ibu t ion dans son enti~retd.

On sait , en effet, que pour ehaque frdquenee observde, on peu t 6tabl i r un in terva l le de eonfianee eomprenant , pour un n iveau donn6, la pro- babi l i td exaete eor respondante ; on pour ra donc re je ter une d i s t r ibu t ion thdor ique d~s qu'el le conduit , pour une elasse part ieuli~re, ~ une pro- babi l i td extdr ieure ~ l ' in te rva l le de eonfianee qui lui est a t taehde.

On se souviendra ~ ee propos (eft [3], p. 699) que si / est le nombre de eas observds dans la elasse envisagde, N 6rant le hombre to t a l de eas, il y aura une probabi l i td P que la probabi l i t6 exaete 0 eor respondant

/ soit comprise dans l ' in te rva l le (0, 0) don t les l imites sont ddfinies pa r

l 'dgalit61 :

2 aresin ~0_0 } = 2 aresin V ] ~ �89 + uP1 (4) 2 aresin N - - 1 I N '

( 1 - - P ) off P1 = 1 2 et oh up~ est la va leur de la var iable normale

rddui te cor respondant 5, P1. E n par t ieul ier , dans le eas des pdriodes s~ches de 1 jour (classe 0)

on a ici /0 = 629 et N = 2254, ee qui donne, en u t i l i san t les Tables 3 et 12 de HALI) [4] :

0 - : 0,298 et 0 = 0,261 ou 0 : 0,304 et 0 = 0,255

selon que l 'on choisit P = 0,95 ou P = 0,99. I1 s 'ensui t que l ' in te rva l le de eonfianee qui doi t comprendre la vMeur thdor ique de ]0 sera (588,672) ou (575,685) selon que l 'on adop te la premiere ou la seeonde va leur de P .

Cela ~tant , si on fair i0 z 1 dans (3), on dddui t imm~dia t emen t de re la t ions eonnues 2 (ef. [2], p. 122):

1 En rdalitd, nous n 'avons reproduit ici que la plus simple des deux relations donndes par tIALD, N 6tan~ dans notre cas suffisamment grand pour que les deux relations eonduisent prat iquement au m@me rdsultat.

2 Quelques erreurs out subsist6 h l a p . 122 de notre note [2]. I1 faut er~ effet lire :

1 2 e ligne : X0=e a, ~ = 1- ec~

15 e l i g n e : ~ = ~z'~ '~'~ - ~z'~ ~ '1 - (~ '1) 2 ~'o ~'~ - ( ,a ' l ) 2

dernigre ligne : ~ = i - K~ ~z'o + ~x'~

Arch. l~Iet. Oeoph. Biokl. B. Bd. 10, g . 3 28

4 0 8 R , SNEYERS;

Y0 = - - K [~ + log (i - - z)] (5) e t :

No q- F0 = E (i ~- 1 ) / i = K [~ (1 - - ~)-1 @ log (1 - - ~)], (6)

ce qui donne l ' 6qua t ion :

F0 + No ~ (1 __~)-1 _}_ log (1 - - ~ ) - - I0 - , ( 7 )

Fo ~ + log (1 - - oc)

de laquelle on peu t t i re r ct. Connaissant ~, on ealeulera K au lnoyen de (5), ee qui d6 terminera ent i6rement la d i s t r ibu t ion eherehge.

Pour les pdriodes sgehes s Hei l igenblut , l0 ~ 4,39885 ; ee qui con- dui t s ~ = 0,8876 et K = 1736,38.

I1 en r6sulte que ~0 = K 2 ~ = 684. Comme eet te va leur est pra-

t i quemen t 6gale s la l imi te supgrieure de l ' in te rva l le de eonfianee ~ 99%, il eonvient de eonsid6rer le d6saeeord eomme t rop grand et de re je te r eet te premi6re d is t r ibut ion .

Pour i0 = 2, on t rouve de la m4me manigre que ei-dessus:

F0 = - - K e ~- ~ @ log (1 - - : r (8)

e t :

N 0 @ 2 F o = E ( i@2)/ i=K ~ . ( 1 - - ~ ) - 1 - - ~ @ l o g ( i - - e ) , (9) i > 0

d'ofi l 'on t i re l ' 6qua t ion :

No § Fo l o - -

Fo

@ ~ ( 1 - - ~ ) - 1 @ 2 l o g ( 1 - - ~ ) ~2

+ ~ -[- log (1 - - ~ )

( 1 0 )

On obt ien t ainsi, avec (10) et (8) : c ~ - 0,8700 et K = 2846,79 ee qui 0~ 3

donne : /o = K ~ = 624,87, valeur qui s ' accorde t r ' s bien eet te fois

avec la va leur observ6e. Les ant res valeurs de h ont 6t6 d6duites ~ pa r t i r de f0 au moyen de

la r6currence : i @ 3

, h + l = b ~ + l / i , off b t + l = ~ i @ 4 ,

et f igurent 6galement au Tableau 1 dans la eolonne [dl). I1 a p p a r a l t de cet te fagon que l ' accord reste sa t i s fa isant dans l ' ensemble pnisque la compara i son des valeurs ajust6es aux valeurs observ6es condui t ~ une va leur de Z z = 25,96, avee 9 = 20 degr6s de ]ibert6, pour laquelle le n iveau de signification est un pen inf6rieur s 0,20. P a r ailleurs, l ' examen des composantes de X 2 indiqu6es au Tab leau 1 laisse penser qu ' i l n ' y a pas lieu d ' e scompte r des a jus tements meil leurs en ehoisissant des valeurs de i0 > 2.

Un type de distribution discrete tronqu6e 409

3. Ajustement d'une distribution binomiale n6gative tronqu6e

La d i s t r ibu t ion b inomiale ndgat ive se t r o u v a n t ddfinie au moyen de deux param~tres (en plus de K qui est un fac teur de propor t ional i td) au lieu d ' u n dans le cas de la d i s t r ibu t ion logar i thmique , on est en dro i t d 'esp6rer avec une tel le d i s t r ibu t ion un a ju s t emen t un peu mei l leur qu 'avec la pr6c6dente.

Dans t 'hypoth~se oh cet te d i s t r ibu t ion serai t t ronqude de ses i0 pre- miers termes, la re la t ion de ddfinit ion devien t :

/ ~ = K ~ i + i 0 F ( i + i o @ ~ ) ( 1 - - ~ ) ~ ; i = 0 , 1 , 2 . . . . (11) (i + i0) ! r (~)

de laquelle on dddui t , avec i0 = 1 :

F o = K [ 1 - - ( 1 - - o @ ] ; N o = 2 i/~=E(i+ 1 ) / ~ - - E / ~ =

= K ~ Fo

et :

~t'2~- E i2]i= Z( i@ 1 ) 2 / i - - 2 E g / i - - E / i =

e ~ ~2 ~ (~ @ 1) = K 1 ~ @ K ( 1 - - e ) 2 2 N 0 - - F 0

i ' (12)

I J

I1 en rdsulte qu 'on a les dqua t ions :

No + Fo ~ lo--

Fo ( l - - g ) [ 1 - - ( 1 - - ~)5]

et ~x'2 @ 2 No @ Fo 1 + c~ No @ Fo 1 - -

(13)

qui dev iennent pour la sdrie dtudide :

~ = 4,39885 et ( 1 - - ~ ) [ 1 - - ( 1 - - ~,)~]

1 @ c~ ~ _ 9,70640. (14)

Pour rdsoudre les dquat ions (14) nous avons fair ~ = 0,87, va leur fournie p a r le dernier a jus tement , et nous l ' avons in t rodu i t e dans ehacune des 6quat ions (14). La moyenne des va leurs de ~ ainsi t rouv6es a servi ensui te s d6terminer deux nouvelles valeurs de ~. F i n a l e m e n t on t rouve :

= 0,869 et ~ = 0,310,

ee qui, avee la premiere des re la t ions (12) donne :

K = 4821,39 et, de ee fair, /0 = 691,63.

Comme cet te va leur est signifieative m6me pour un n iveau de eonfianee de 0,99, eet te premi6re d i s t r ibu t ion doi t ~tre rejet6e.

Si l 'on suppose alors i0 = 2, on t rouve les re la t ions :

28*

410 R. SNEYE~S:

[ ~ ~(1--~)~]--2 ~'o I N o = K 1 - - ~ ~ (15)

[ ~ ~213(~+ 1) ~ ( l _ _ ~ ) ~ ] _ _ 4 N o _ _ 4 F o , l et ~ ' ~ = K -1- -~- + ( 1 - - ~ ) 2

desquelles on dgduit :

et

No + 2 F0 _ 10 -t- 1 = g ~ [ 1 - - ( 1 - - ~ ) ~ + l ] F0 (1 - - ~) [1 - - (1 - - g)~ - - ~ ~ (1 --:~)3]

Ez'2 + 3No + 2Fo ~. (~ + 1) N o + 2 F o (1 --0~) [1 - - (1--~)~+1]"

(l~)

Saehant qu'iei on a :

lo@ 1 = 5 , 3 9 8 8 5 et ~z%_ + 3 N o + 2 F o

No+ 2Fo =8 ,72331 ,

on t rouve, en uti l isant la m@me m@thode que plus haut , les solutions: = 0,873 et ~ = 0,135, ee qui conduit s K = 14.641,12 et /0 =- 647,02,

valeur qui, eet te lois, est 6galement acceptable. La distr ibution ainsi d6finie se t rouve indiqu6e au Tableau 1 dans

la eolonne/~(2) et le ealeul de Z ~ r6vgle s nouveau un accord sat isfaisant dans l 'ensemble puisque la valeur trouvde, 6gale g 26,67, avee v = 19 degr@s de libert6, a un niveau de signification eompris entre 0,20 et 0,10. De plus, iei aussi les eomposantes du Z 2 pe rme t t en t de pr@voir qu 'aueune am@lioration impor tan te n 'es t possible en ut i l isant des valeurs de i0 > 2.

4. Conclusions

E n r6sum6, il semble done bien que l 'emploi d 'une dis tr ibut ion t ron- qu6e pour repr6senter les p6riodes s6ehes ~ t !ei l igenblut air appor t6 la r6ponse la plus ad6quate au probl6me pos6.

E n outre, l ' a jus t emen t un peu meilleur obtenu au moyen de la distri- but ion logar i thmique est int6ressant s noter puisque la m6me eons ta ta t ion a pu 4bre faite ?~ propos des p6riodes s6ehes K Paris St-Maur. On peut done eroire que la distr ibution logar i thmique est la plus appropri6e pour d6erire la distr ibution stat is t ique des p6riodes s6ehes, en g6n6ral, du moins, sous nos lalitudes.

Pa r eontre, on peut s '6tonner de ee qu'~ Paris S t - ~ a u r un bon r6- sul ta t a pu 6tre obtenu sans faire appel ~ une distr ibution tronqu6e, mais l 'objeet ion n 'es t qu 'apparente , puisque la dis t r ibut ion logar i thmique n 'es t au t re qu 'une dis tr ibut ion binomiale n6gative pour laquelle ~ = 0 et dont le premie r terme, devenu infini, a 6t6 supprim6.

Aecessoirement, il reste encore ~ signaler que l 'analyse s ta t is t ique qui vient d '4tre faite met en 6videnee la persistanee plus aeeus6e des si tuations atmosph6riques earaet6ris6es par du temps see d~ns 1s r6gion

Un type de distribution discrgte tronquge 411

de t t e i l igenb lu t (versant Sud des Alpes 0r ien ta les ) que duns l 'oues t de l 'Europe , lu l imi te ~ vers luquelle t end lu p robabi l i t4 d ' a vo i r un jour see de plus pa r t emps de s@eheresse a t t e ignan t , en effet, (en moyenne) 0,870 duns le p remier eas eontre 0,824 (g Par i s St-Maur) s 0,833 (g Ueele) duns le second.

Bibliographie

1. STEINtIJ*USSER, ~I. : Trocken- und Niedersehlagsperioden und ihre theo- retisehe Behandlung. Arch. Met. Geoph. Biokl. B 10, 38 (1959).

2. SXEYERS, R. : Sur l 'analyse des r@art i t ions stat ist iques diser~tes. Areh. Met. Geoph. Biokl. B 7, 117 (1955).

3. HALo, A. : Stat ist ical Theory with Engineering Applications. New York: Wiley. 1955.

~. HAs~D, A.: Statist ical Tables and Formulas. New York: Wiley. 1952.


Recommended