Un type de distribution discrète tronquée

  • View
    213

  • Download
    1

Embed Size (px)

Transcript

  • 551.501.45:551.577.38

    (Institut t~oyal Mdtdorologique de Belgique, Ucele-Bruxelles)

    Un type de distribution diserbte tronqu6e

    Par

    R. Sneyers

    R~sum~. L'analyse statistique de Ia distribution des p6riodes sgches .~ I-Ieiligenblut sugg6re l'emploi de distributions thdoriques tronqudes pour la reprdsenter. De bons ajustements sont effeetivement obtenus au moyen d'une distribution logarithmique et d'une distribution binomiale ndgative dont les deux premiers termes ont 6td supprimds.

    Zusammenfassung, Die statistische Analyse der I-I/iufigkeitsverteilung der Trockenperioden in tteiligenblut gibt die Grundlage zu einer Betraehtung abgesehnittener Verteilungen. Eine logarithmische und eine negative bino. mime Verteilung, vonder die zwei ersten Glieder weggelassen wurden, geben eine befriedigende l--bereinstimmung.

    Summary. The statistical analysis of the distribution of droughts in Heiligenblut suggests the use of truncated theoretical distributions for its representation. A logarithmic and a negative binomial distribution of which the two first terms have been suppressed give effectively good fits.

    1. Introduction

    Dans une note r6cente [I], I~. STE IN I~IXUSSER a attir6 l 'attention sur le fait qu'aucune distribution th6orique elassique ne permet d~ rendre compte d'une fa~on sa~isfaisante de la r@artition de fr~quences des p~riodes sgches (jours eons~cutifs sans pluie) k I-s

    Cet dehee est assez surprenant puisqu'il r~v~le, ~ premigre rue, des comportements st~tistiques diff6rents des p6riodes sgehes dans l'ouest de l'Europe (Paris St-Maur et Ueele) et sur le versant sud des Alpes orientales, alors que pour les p~riodes pluvieuses, un mgme type de distribution (en l'oeeurenee la distribution binomiale n6gative) donne dans les deux cas une bonne representation des r@artitions de fr~quenees observ6es.

  • 1%. SN~u Un type de distribution disergte tronqu6e 405

    L 'examen des chiffres publids par H. STEINHXVSSE~ montre toutefois (voir [l], p. 53) que les diffieultds proviennent de la disproportion entre valeurs thdoriques et valeurs observdes pour les cinq premieres frdquences et il est curieux de constater ~ ce propos que si, en raison de la relation :

    /0 < 2 h (~) entre les deux premieres frdquences observdes, l 'a justement au moyen d'une distribution logarithmique se trouvait exclu, la distribution bino- miale ndgative ajustde fournit quand m~me une valeur de [o supdrieure au double de [1.

    L 'analyse statistique des donndes complgtes, qui nous ont 6t6 obligeam- ment eommuniqudes, permettent d'ailleurs de faire d'autres constatations.

    En effet, si l 'on ddsigne les frdquences des pdriodes de (i ~- 1) jours consdcutifs sans prdeipitations par // et si ]'on pose (el. [2]) :

    Ni F~ = 2/~., N~ = 2 ]/~-et l~ - ( i - -~) , (2)

    ]>_i i>_i Fi avec i, 7' = 0, 1, 2, . . .

    on obtient, pour la distribution considdrde les valeurs de [i, Fi, Ni et l~ indiqudes au Tableau 1.

    I1 apparalt ainsi, non seulement que les h subissent une croissance r6guli~re, mais encore (par reprdsentation graphique), que les valeurs de log (i + 1) ], et plus encore eelles de log (Fi + Ni) d6croissent lind- airement b~ part ir du 5 e tenne, et ee conformdment 5~ une rdpartition qui serait ddfinie par la relation:

    ~i+1

    o~ K est une constante et 0 < ~ < 1, qui n'est autre que la relation de ddfinition de la distribution logarithmique. I1 s'ensuit qu'au lieu de s'engager dans la vole de la ddeomposition de la sdrie eonsiddrde en deux ou plusieurs distibutions distinctes, il convient tout d'abord de tenter un ajustement au moyen d'une distribution asympto~iquement logarithmique.

    Notons immddiatement, ~ ee propos, que les distributions logarith- miques tronqudes remplissent cette derni~re condition ; de plus, comme une telle distribution peut se ddfinir au moyen de la relation:

    (Zi+ 1 +~o /~K i@l+i0 avee i0~l , (3)

    de laquelle se ddduit la relation:

    /1 1 + i0 /0 - ~'2 + i0'

    on volt sans peine qu'une telle distribution n'est plus incompatible avee l'indgalit6 (1), pourvu que i0 soit suff isamment grand.

  • 406 R. SNEYERS :

    Par ailleurs, l 'emploi d 'une distr ibut ion tronqude pour repr@senter ]a s@rie 6tudi6e trouve sa justif ication d~ns la nature m6me des donndes,

    Tableau 1. Pdriodes de (i + 1) ]ours eonsdcuti]s sans prdcipitations mesurables Heiligenblut. tZrdquences observdes et ]rgquences a]ustdes

    i /i Fi N i I i [,~(~) X-2 ]~(z) X 2

    0 1 2 3 4 5 6 7 8 9

    10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 3O 31 33 35 38 41 45

    629 2254 7661 4,40 402 1625 7661 4,71 298 1223 7259 4,93 212 925 6663 5,20 174 713 6027 5,45 105 539 5331 5,89 91 434 4806 6,07 56 343 4260 6,42 50 287 3868 6,48 36 237 3468 6,63 31 201 3144 6,64 35 170 2834 6,67 16 135 2449 7,14 20 119 2257 6,97 11 99 1997 7,17 20 88 1843 6,94 9 68 1543 7,69 9 59 1399 7,71 3 50 1246 7,92 8 47 1192 7,36 3 39 1040 7,67 5 36 980 7,22 3 31 875 7,23 6 28 809 6,89 3 22 671 7,50 2 19 599 7,53 1 17 549 7,29 1 16 523 6,69 3 15 496 6,07 2 12 412 6,33 1 10 354 6,40 1 9 324 6,00 3 8 293 4,62 2 5 194 4,80 1 3 124 4,33 1 2 86 3,00 1 1 45 1,00

    624,87 0,03 407,73 0,08 283,78 0,71 205,74 0,19 153,42 2,76 116,79 1,19 90,32 0,01 70,72 3,06 55,93 0,63 44,60 1,66 35,82 0,65 28,94 1,27 23,50 2,39 19,17 0,04 15,70 1,41 12,90 3,91 10,63 0,25

    647,02 0,50 401,99 0,00 275,05 1,91 198,58 0,91 148,37 4,43 113,52 0,64 88,39 0,08 69,75 2,71 55,62 0,57 44,74 1,71 36,24 0,76 29,53 1,01 24,19 2,77 19,90 0,00 16,43 1,79 13,61 3,00 11,31 0,47

    8,79 ( 7,28 ] 1,03 6,05 5,03 / 0,00 4,19 } 3,50 1,08 2,93 2,45 / 2,06 1,73 1,45 ] 1,22 1,03 0,43

    5,73 3,18

    9,42( 7,87j 1,62 6,59t 5,53/ 0,10 4,65 3,911 0,39 3,30 2,79 2,36 2,00 1,69 i 1,43 1,211 0,02

    7,01 1,28

    puisque dans eette s@rie on a n@glig6 g la lois les p@riodes sgehes d'une longueur inf@rieure s vingt.-quatre heures et eelles qui, d 'une dur6e de plus de vingt-quatre heures, ont 6ehappg s la classification en raison du fair qu'elles n'englobaient pas un jour m6t6orologique entier.

  • Un type de d i s t r ibut ion d i sc re te t ronqude 407

    2. Ajustement d'une distribution logarithmique tronqude

    En l 'absence de toute indicat ion ~ priori sur la valeur qu'i l convient d 'a t t r ibuer ~ i0, il faudra proedder par essais suecessifs en donnant /t i0 des valeurs de plus en plus grandes, l 'aeeeptat ion ou le rejet des distri- butions eonsiddrdes dtant 6videmment lids ~ la qualitd de l 'a justement obtenu. On notera eependant que pour faire apparai t re l ' ineompatibi l i t6 d 'une distr ibut ion thdorique avee les donn6es observdes, il n 'est pas indispensable de ddvelopper eette distr ibut ion dans son enti~retd.

    On sait, en effet, que pour ehaque frdquenee observde, on peut 6tablir un interval le de eonfianee eomprenant, pour un niveau donn6, la pro- babil itd exaete eorrespondante ; on pourra donc rejeter une distr ibut ion thdorique d~s qu'elle conduit, pour une elasse partieuli~re, ~ une pro- babil itd extdrieure ~ l ' interval le de eonfianee qui lui est attaehde.

    On se souviendra ~ ee propos (eft [3], p. 699) que si / est le nombre de eas observds dans la elasse envisagde, N 6rant le hombre total de eas, il y aura une probabi l i td P que la probabil i t6 exaete 0 eorrespondant / soit comprise dans l ' interval le (0, 0) dont les l imites sont ddfinies par l'dgalit61 :

    2 aresin ~0_0 } = 2 aresin V]~ 89 + uP1 (4) 2 aresin N - - 1 IN '

    (1 - - P ) off P1 = 1 2 et oh up~ est la valeur de la variable normale

    rdduite correspondant 5, P1. En partieulier, dans le eas des pdriodes s~ches de 1 jour (classe 0)

    on a ici /0 = 629 et N = 2254, ee qui donne, en ut i l isant les Tables 3 et 12 de HALI) [4] :

    0 - : 0,298 et 0 = 0,261 ou 0 : 0,304 et 0 = 0,255

    selon que l 'on choisit P = 0,95 ou P = 0,99. I1 s'ensuit que l ' interval le de eonfianee qui doit comprendre la vMeur thdorique de ]0 sera (588,672) ou (575,685) selon que l 'on adopte la premiere ou la seeonde valeur de P.

    Cela ~tant, si on fair i0 z 1 dans (3), on ddduit imm~diatement de relations eonnues 2 (ef. [2], p. 122):

    1 En rdalitd, nous n'avons reproduit ici que la plus simple des deux relations donndes par tIALD, N 6tan~ dans notre cas suffisamment grand pour que les deux relations eonduisent pratiquement au m@me rdsultat.

    2 Quelques erreurs out subsist6 h lap . 122 de notre note [2]. I1 faut er~ effet lire :

    1 2 e ligne : X0=e a, ~= 1- ec~

    15 e l igne : ~ = ~z'~ '~'~ - ~z'~ ~'1 - (~'1) 2 ~'o ~'~ - ( ,a ' l ) 2

    dernigre ligne : ~ = i - K~ ~z'o + ~x'~

    Arch. l~Iet. Oeoph. Biokl. B. Bd. 10, g . 3 28

  • 408 R , SNEYERS;

    Y0 = - -K [~ + log (i - - z)] (5) et :

    No q- F0 = E (i ~- 1)/ i = K [~ (1 - - ~)-1 @ log (1 - - ~)], (6)

    ce qui donne l '6quat ion:

    F0 + No ~ (1 __~)-1 _}_ log (1 - -~) - - I0 - , (7 )

    Fo ~ + log (1 - - oc)

    de laquelle on peut t irer ct. Connaissant ~, on ealeulera K au lnoyen de (5), ee qui d6terminera enti6rement la distr ibut ion eherehge.

    Pour les pdriodes sgehes s Heil igenblut, l0 ~ 4,39885 ; ee qui con- duit s ~ = 0,8876 et K = 1736,38.

    I1 en r6sulte que ~0 = K 2 ~ = 684. Comme eette valeur est pra-

    t iquement 6gale s la l imite supgrieure de l ' interval le de eonfianee ~ 99%, il eonvient de eonsid6rer le d6saeeord eomme trop grand et de rejeter eette premi6re distr ibution.

    Pour i0 = 2, on trouve de la m4me manigre que ei-dessus:

    F0 = - -K e ~- ~ @ log (1 - - : r (8)

    et :

    N0@2Fo= E ( i@2)/i=K ~.(1 - -~) -1 - -~ @log( i - -e ) , (9) i>0

    d'ofi l 'on tire l '6quat ion:

    No Fo l o - -

    Fo