16

Click here to load reader

Variogramme Suppléments

Embed Size (px)

DESCRIPTION

Ce document détaille les stratégie de modélisation d'un variogramme.

Citation preview

  • Vario, supp. 1

    Stratgie de modlisation

    Il existe plusieurs stratgies diffrentes et chacun dveloppe probablement ses propres habitudes. Pour ma part, je recommande la stratgie suivante:

    - Calculer et modliser le variogramme omnidirectionnel en respectant, pour le choix des classes, les rgles nonces ci-haut.

    - Si le nombre de donnes le permet (i.e. au moins 50, prfrablement 100) calculer les variogrammes directionnels selon diffrentes directions (ex. 0, 45, 90, et 135 degrs) en respectant les rgles ci-haut (i.e. nb. paires >30, demi-longueur du champ comme distance maximale) et surimposer le modle omnidirectionnel sur les variogrammes exprimentaux directionnels.

    La gologie peut apporter une information prcieuse dans le choix des directions et la dcision d'adopter ou non un modle anisotrope.

    - Dterminer s'il y a anisotropie: diffrences de palier, mais surtout de portes qui ne peuvent raisonnablement tre imputes des fluctuations alatoires du variogramme. Cette valuation concerne surtout le dbut du variogramme. Des divergences distance plus grandes sont normales et sans importance. Si ncessaire, procder l'ajustement d'un modle anisotrope.

    Ajustement visuel vs mthodes automatiques

    Il y a deux coles de penses concernant l'ajustement des modles de variogramme. Certains prtendent que l'ajustement visuel demeure la meilleure mthode, alors que d'autres prfrent les mthodes automatiques.

    Personnellement j'utilise les deux mthodes dpendant des contextes et parfois j'utilise les deux mthodes conjointement. L'ajustement automatique est utile lorsqu'on a une bonne ide du type de modle utiliser (ex. sphrique isotrope) et qu'on dsire avoir un choix plus objectif des paramtres du modle (C0, C et a). Il est aussi particulirement utile dans des tudes de simulations ou on gnre des donnes selon un type de modle connu. La mthode automatique est galement utile lorsqu'on dispose de trs peu de donnes qui ne permettent pas de calculer efficacement le variogramme exprimental. On peut alors procder par ajustement automatique utilisant une technique de validation croise. Dans cette technique, il s'agit d'estimer les points connus en faisant comme s'ils ne l'taient pas. En effectuant l'estimation avec diffrents modles, on retient celui qui permet de prdire les points connus avec le plus de prcision.

    Les mthodes entirement automatiques sont probablement viter. Un monitoring des caractristiques essentielles du modle est souhaitable (type de modle, anisotropie, direction d'anisotropie). Les connaissances de l'utilisateur concernant le phnomne doivent tre mises contribution. La gostatistique n'est pas une bote noire!

  • Vario, supp. 2

    Note:

    Il existe trois catgories de mthodes d'ajustement automatique: . Mthodes d'ajustement des moindres carrs partir des valeurs du variogramme

    exprimental. Dans ce cas, les guides noncs ci-haut pour le calcul du variogramme exprimental s'appliquent intgralement. Notons que ces moindres carrs doivent tre pondrs en fonction de "h" et de "N(h)" tout comme on le fait visuellement. Une part de subjectivit se glisse ncessairement dans le choix des critres de pondration.

    . La seconde mthode s'applique surtout de petits ensemble de donnes. Il s'agit des techniques de validation croise (automatise) o les performances pour la restimation des points connus par diffrents modles de variogrammes sont compares. Ici, il n'est plus ncessaire de calculer le variogramme exprimental pour obtenir le modle, bien que ceci soit recommand pour contrler l'ajustement obtenu.

    . Les mthodes bases sur le maximum de vraisemblance et ncessitant des distributions multinormales.

    MODLISATION DU VARIOGRAMME

    Il faut reconnatre deux problmes distincts: - Dtermination du type de modle (ex. sphrique ou linaire), du nombre de structures (ex. un effet de ppite plus un sphrique plus un exponentiel) et de la prsence d'anisotropies ventuelles. - Estimation proprement dite des paramtres des modles retenus.

    La premire partie est trs peu automatise, mme de nos jours. Elle repose souvent en partie sur des connaissances externes aux donnes elles-mmes (ex. nature de la variable, prsence de stratifications, prcision analytique connue, rsultats obtenus avec des donnes similaires d'ailleurs, etc...).

    La seconde partie est de plus en plus automatise, surtout avec la venue de nouveaux logiciels et avec le dveloppement de la gostatistique dans d'autres domaines d'application que les mines. La modlisation visuelle graphique demeure quand mme largement utilise, surtout en gologie.

    Mthodes automatiques d'ajustement.

    1. Moindres carrs:

    On ajuste les paramtres du modle de faon minimiser la somme des carrs des diffrences entre valeurs exprimentales et valeurs thoriques du modle. On utilise habituellement une fonction de pondration proportionnelle au nombre de paires de chaque point du variogramme et de faon donner plus de poids aux faibles valeurs de h.

  • Vario, supp. 3

    Avantages: - trs rapide - reproduit assez bien l'ajustement visuel, tout en liminant une certaine part de subjectivit. - on peut, sous hypothse de normalit et d'indpendance des points du variogramme

    construire des intervalles de confiance pour les paramtres. Toutefois la validit de ces intervalles de confiance est trs discutable car les valeurs du variogramme exprimental ne sont ni normales, ni indpendantes les unes des autres. On peut possiblement les considrer comme une indication relative de la prcision du modle estim.

    Inconvnients: - le critre des moindres carrs est li assez troitement la distribution normale et est assez

    sensible la prsence de points aberrants sur le variograme exprimental. On pourrait songer utiliser un estimateur un peu plus robuste cherchant minimiser la moyenne des carts en valeur absolue par exemple, mais les proprits de cet estimateur sont moins bien connues.

    - une part certaine de subjectivit demeure dans la dfinition de la fonction de pondration.

    - les rsultats dpendent du choix des classes effectu pour le calcul du variogramme exprimental. On pourrait considrer chaque paire individuellement, mais le temps de calcul serait plus long et les rsultats possiblement moins robustes.

    - les paramtres estims ne respectent pas ncessairement les conditions pour un modle positif dfini. Ceci peut tre corrig en incluant des pnalits dans la fonction objective.

    - la solution optimale obtenue n'est pas ncessairement un optimum global, i.e. le rsultat peut dpendre du point de dpart de l'algorithme.

    ex. Cressie propose de minimiser:

    Autres mthodes de moindres carrs.

    On peut rcrire l'quation prcdente sous la forme:

    o la matrice W diagonale ayant sur sa diagonale une quantit approximativement proportionnelle aux variances des valeurs exprimentales du variogramme, i.e. var(e(h)). On peut gnraliser cette ide en utilisant la matrice de variance-covariance V au lieu de W dans l'quation prcdente. Des tudes comparatives ont indiqu toutefois que la complexit supplmentaire ne semblait pas justifie.

    f = N( h ) (h ) - ( h )( h )i=1K

    i

    2

    e i t i

    t i

    [ (h)- (h)] W [ (h) - (h)]e t -1 e t

  • Vario, supp. 4

    2. Mthodes de maximum de vraisemblances

    Ces mthodes reposent toutes sur l'hypothse trs forte de multinormalit, soit des valeurs observes (vraisemblance maximale), soit des contrastes entre les valeurs (vraisemblance maximale rduite). Ces estimateurs produisent des estimateurs biaiss des paramtres qu'ils cherchent estimer, potentiellement de faon importante lorsqu'on s'carte beaucoup de l'hypothse de multinormalit. Les tudes comparatives menes dans un contexte normal ont montr que le moindre carr performait aussi bien que le maximum de vraisemblance. Cressie ne recommande pas leur utilisation.

    Rappel: la fonction de vraisemblance de l'chantillon est simplement la valeur de la fonction de densit conjointe, value aux valeurs prises par l'chantillon, obtenue pour un ensemble de paramtres donns, vecteur moyenne et matrice de variance-covariance dans le cas de la loi multinormale. L'objectif est de choisir ce vecteur moyenne et cette matrice de variance-covariance de faon maximiser la fonction de densit conjointe. Dans le modle de gostatistique stationnaire, la moyenne est constante, et les variances-covariances sont dtermines partir du variogramme thorique, donc de quelques paramtres seulement.

    3. Estimation par validation croise

    Le principe de la mthode est d'enlever tour tour chaque point chantillon et de l'estimer (par krigeage) l'aide de ses voisins. On obtient ainsi chaque point une erreur d'estimation et on cherche les paramtres du variogramme qui, lorsqu'utiliss dans le systme de krigeage, fourniront les estims les plus prcis. La prcision des estims peut tre mesure de diverses faons; ex. somme des carrs des erreurs, somme des carrs des erreurs normaliss par la variance de krigeage.

    Le principal problme est son temps de calcul extrmement long, puisque l'on doit effectuer "n" krigeages pour chaque ensemble de paramtres tests. On l'utilise donc surtout comme mthode de vrification, une fois les paramtres estims par une autre mthode.

    La technique de validation croise peut galement tre utilise pour dterminer le voisinage optimal devant tre utilis pour le krigeage, pour choisir entre deux modles fournissant des ajustements quivalents, pour comparer des mthodes d'estimation entre elles (ex. krigeage vs cokrigeage, vs inverse de la distance, vs spline), etc...

    L(m, ) = n2

    (2 ) + 12

    | ( )| + 12

    (Z - m) ( ) (Z - m)-1 pi log log

  • Vario, supp. 5

    CONDITIONS D'ADMISSIBILIT DES MODLES DE COVARIOGRAMME ET DE VARIOGRAMME

    Soit

    La variance d'estimation de Z0* est donne par:

    Puisqu'il s'agit d'une variance, cette quantit doit tre positive ou nulle, peu importe l'ensemble des n points choisis. C(h) doit donc tre une fonction positive dfinie.

    De mme,

    fournit une condition quivalente exprime en termes du variogramme.

    Thorme de Bochner:

    Une fonction continue est positive dfinie ssi sa transforme de Fourier est une fonction positive et intgrable. Note dans C(h), h est un vecteur dans 1, 2 ou 3 dimensions, de sorte que la transforme de Fourier est une transforme de Fourier en 1, 2 ou 3 dimensions. (Note: ce thorme ne sapplique pas leffet de ppite qui est une fonction discontinue).

    Le problme de ce critre est qu'il est difficile de vrification car les fonctions candidates n'ont pas ncessairement des formes analytiques simples. Christakos (1984, 1992) a donc dvelopp une srie de conditions ncessaires et suffisantes plus simples vrifier. (Voir plus loin)

    0*

    i=1

    n

    iZ = Z

    Var( Z ) = Cov( Z ,Z ) = C( h )0*i=1

    n

    j=1

    n

    i j i ji=1

    n

    j=1

    n

    i j ij

    [ ]i=1

    n

    j=1

    n

    i j ij i j2

    ijC( h ) = - (h )

  • Vario, supp. 6

    Rpertoire de modles

    Le tableau suivant donne une liste, certainement non-exhaustive de modles rencontrs dans la littrature. Plusieurs de ces modles sont en fait des familles de modle pouvant prendre des formes varies selon les valeurs prcises de leurs paramtres.

    Nom quation Source / remarques Ppite 0>h C0 Exponentiel (-h/a)]-[1 C exp Porte effective: 3a; Modle markovien

    en 1-D Sphrique ])0.5(h/a - [1.5h/a C 3 Drive de l'intersection de deux sphres Circulaire

    ah C

    a

  • Vario, supp. 7

    Effet de trou (sin) (aussi sin cardinal)

    C 1 - (2 h / a)2 h / a

    sin pipi

    Admissible en 3D. La fonction samortie en fonction de h. Lamplitude maximale est atteinte en 0.7151*a. La valaeur maximale du variogramme vaut alors 1.217*C.

    Effet de trou 2D )b/h(J)a/hexp((C pi 21 0 Armstrong, 1998, p. 38. Exponentiel gnralis )haexp()haexp(C yx

    byy

    bxx

    22

    Abt et al., Math. Geol, 1999,#1. ax et ay>0 bx et by [0,2) Flexible, le modle gaussien est un cas particulier)

    Stein C [1 - (-h / a) (a + h)

    a]exp Stein, Avignon, 1989. Comportement quadratique l'origine.

    Whittle C [1 - h / a K (h / a) ]1 K1 est la fonction modifie de Bessel de la 2e sorte; Matern, 1960; Markovien en R2.

    Matern, p.30, 2e C 1-(1 + h / a ) 2 2 -

    n+12

    n=0 donne le modle gravimtrique de Chils, n=2 donne le modle magntique. n est entier; Matern, 1960.

    Matern, p.30, 3e

    (h/a)Jh/a2k! - 1 C k

    k

    Jk est la fonction de Bessel de la 1 re sorte. Matern, 1960.

    Bessel [ ](h/a)Jbh - 1 C 022 )/exp( Mantoglou et Wilson, 1982; b et a des paramtres ajuster Admissible en R2 seulement

    Quadratique ah] (h/a))(h/a [ C 2 2 Alfaro, 1984 Stable ( )[ ]ah - 1 C /exp Lantujoul, 1994 Hyperbolique

    + h/a)(-C 111

    Lantujoul, 1994

    Christakos, 1984, p.264, 74

    [ ] ah(h/a)(h/a).-(h/a.C + 52)52 53 Spline sous tension 1D

    exp(-|h|/a)+|h|/a-1 1-D, ref [1], p.81 Spline sous tension 2D

    K0(a|h|)+log(a|h|) 2-D, ref. [1], p.81 Spline sous tension 3D

    1/(a|h|)(exp(-a|h|-1)+1 3D, ref [1], p.85 Puissance (1-|h|2) h1 2D, covariance, ref.[2] Matern, p.30, 4e

    ] (h/a)K a

    h cte- [1 C s

    s

    Cas particuliers: s=1, Whittle;s=1/2, exponentiel. Matern, 1960. La constante est ajuste de sorte que le terme entre crochets vaut 0 lorsque h->0

  • Vario, supp. 8

    Matern, gnral )h(Kh)v(

    2v

    vv1

    Kv : fonction de Bessel d'ordre v>0 (ref [2]) ; Covariance

    Cauchy

    0b

    1

    112

    >

    +

    b

    a

    hC

    Wackernagel, 1995, p. 219 aussi ref [2]

    Rfrences pour les modles du tableau :

    Alfaro M., 1984,Statistical inference of..., in Geostatistics for natural resources characterization, G. Verly et al (eds), Reidel, 45-54.

    Chils J.P. et Guillen, 1984, Sciences de la Terre #20. Christakos G., 1984, Permissible covariance and variogram models, Water Resources Research, 20, 2, 251-265. Galli A. , Gerdil-Neuillet F. et Dadou C., 1984, Factorial kriging analysis :..., in Geostatistics for natural resources

    characterization, G. Verly et al (eds), Reidel, 543-558. Journel A. et Huijbregts, 1978, Mining Geostatistics, Academic press, 600p. Lantujoul C., 1994, Non conditional simulations of...., in Geostatistical simulations, M. Armstrong (ed), Kluwer,

    147-177. Mantoglou A., et Wilson J., 1982, The turning band methods...., Water Resources Research, 18, 5, 1379-1394. Matern B., 1960, Spatial variation, Springer-Verlag, 2e ed., 1980, 151p. Srivastava R.M., et Parker H.M., 1989, Robust measures of spatial continuity, in Geostatistics, M. Armstrong (ed),

    Kluwer, 295-308. Stein M., 1989, The loss of efficeincy ..., in Geostatistics, M. Armstrong (ed), Kluwer, 273-282.

    [1]: Wessel, P. et Bercovici D., 1998, Interpolation with splines in tension: a green's function approach, Math. Geol., v. 30 #1, 77-94. [2]: Gneiting, T. 1998, Closed form solutions of the two-dimensional turning bands equation. Math. Geol., 1998, v. 30, # 4, 379-390.

  • Vario, supp. 9

    Critres dadmissibilit des modles

    Critres d'admissibilit des modles de covariances, de variogramme et de covariances gnralises.

    A. Considrations gnrales

    Soit n la dimension de l'espace (1D,2D,3D...) Soit k, l'ordre de la drive (0, 1,...) Un modle admissible en Rp l'est aussi en Rp-1. L'inverse n'est pas toujours vrai. Un modle admissible l'ordre k l'est aussi l'ordre k+1. L'inverse n'est pas toujours vrai.

    B. Covariance

    Dans tous les cas, si on considre une combinaison linaire de v.a. Zi, il faut que la variance de cette combinaison linaire soit positive: Soit:

    Note: Une combinaison linaire positive de modles admissibles est un modle admissible.

    i.e. C(h) = b C (h) est admissible bi=1

    p

    i2

    i i

    Un produit de modles admissible est un modle admissible.

    B.1 Condition ncessaire et suffisante pour une covariance

    C(h) est une fonction continue de covariance admissible ssi: . la transforme de Fourier de C(h) existe et est note c(w) . c(w) 0 w

    .

    -

    c(w) dw <

    (thorme de Bochner)

    *

    i=1

    n

    i iZ = Z

    Var( Z ) = Cov( Z , Z ) 0*i=1

    n

    j=1

    n

    i j i j

  • Vario, supp. 10

    B.2 Condition suffisante pour une covariance

    i. Une fonction C(h) est admissible en Rn si:

    et

    et

    h2 2

    33

    2

    u

    (u - h )

    d C(h)dh

    dh 0 en R

    2

    2

    3

    33d C(h)

    dh - h d C(h)

    dh 0 en R

    ii. Une fonction C(h) est admissible en R3 si: h C(h) est non-croissant.

    B.3 Conditions ncessaires pour une covariance

    Pour qu'une fonction soit admissible, il faut que: i.

    o n est la dimension de l'espace (1D, 2D, 3D)

    ii. en R1 C(h) = -.403 C(0) en R3 C(h) >= -.218 C(0)

    lim (h 0 ) dC(h)dh < 0+

    lim (h infinity) C(h)h

    = 0(1-n)/ 2

    2

    21d C(h)

    dh 0 en R

    lim C(h)h

    = 0 h(1-n)/ 2

  • Vario, supp. 11

    B.4 Cas multivariable

    Ncessaire et suffisant, cas gnral:

    Les matrices pxp K(w) dont chaque lment Kij(w) est le spectre de puissance crois obtenu par TF de la fonction de covariance Cij(h) o i et j dsignent les variables, doivent tre positives dfinies. De plus, les intgrales des TF existent.

    Ncessaire: Condition de Cauchy-Schwartz. La condition s'exprime en termes des variogrammes (avec paliers). On peut convertir cette relation en termes de covariances par la relation (h)=2 - C(h).

    Ncessaire et suffisant, cas de deux variables

    Si Cii(h), Cjj(h) et Cij(h) sont, individuellement, des fonctions admissibles, alors la condition de Cauchy-Schwartz est aussi suffisante.

    C. Variogramme

    Une combinaison linaire positive de modles admissibles est un modle admissible.

    i.e. (h) = b (h) est admissible bi=1

    p

    i2

    i i

    C.1 Condition ncessaire et suffisante pour un variogramme

    Si le variogramme possde un palier, il suffit de vrifier si la covariance correspondante est admissible. Les rsultats ci-haut s'appliquent intgralement.

    Si le variogramme ne possde pas de palier, alors seuls les incrments sont stationnaires. De la mme faon, la drive (si elle existe) est galement stationnaire. La covariance des drives doit donc tre une fonction positive dfinie. Cette covariance est donne en fonction du Laplacien du variogramme par:

    La transforme de Fourier doit tre positive, i.e.

    (note: la TF de (h) existe au sens des fonctions gnralises)

    | (h)| (h) (h) i, jij ii jj

    d h2C (h) = (h)

    d d2

    c (w) = TF [C (h)] = (iw ) TF [ (h)] 0

  • Vario, supp. 12

    Il faut de plus que:

    C.2 Conditions suffisantes pour un variogramme

    Voir B.2, en remplaant C(h) par C(0)-(h).

    C.3 Conditions ncessaires pour un variogramme

    i.

    ii.

    iii.

    iv. Dans le cas d'une fonction stationnaire (i.e. avec palier), en R1, (h)

  • Vario, supp. 13

    Ncessaire et suffisant, cas de deux variables

    Si ii(h), jj(h) et ij(h) sont individuellement des fonctions admissibles, alors la condition de Cauchy-Schwartz est aussi suffisante.

    D. Covariances gnralises

    D.1 Condition ncessaire et suffisante

    Soit K(h), une covariance gnralise d'ordre k. En drivant k+1 fois le processus Z on obtient un processus stationnaire. En drivant 2(k+1) fois la covariance gnralise, on obtient une covariance stationnaire dont la TF doit tre positive.

    Il faut, pour que K(h) soit admissible que:

    et

    Note: Ces conditions sont analogues celles dduites pour le variogramme, en posant k=0 et K(h)=-(h)

    D.2 Condition suffisante pour une covariance gnralise

    D.3 Condition ncessaire pour une covariance gnralise

    D.4 Cas multivariable

    | (h)| (h) (h) i, jij ii jj

    TF d K(h)dh

    = (iw ) TF [K(h)] 02k+2

    2k+22k+2

    lim K(h)h

    = 0 h2k+2

    lim K(h)h

    = 0 h Infinity2k+2

  • Vario, supp. 14

    Ncessaire et suffisant

    Analogue au cas des variogrammes, les matrices des spectres de puissance doivent tre positives semi-dfinies. Chaque fonction de covariance gnralise, individuellement, est admissible.

    E. Autres rsultats

    Christakos (1984), propose deux mthodes pour construire de nouvelles fonctions de covariance ou de variogramme. La premire mthode utilise la fonction de densit spectrale. On gnre une fonction positive dont l'intgrale existe. Sa TF est une fonction de covariance admissible par construction. Christakos tablit de plus le lien entre fonctions de densit spectrale dans Rn et Rn-k. La seconde mthode tablit le lien entre variogrammes en Rn et variogrammes en Rn-2. Connaissant un modle admissible en Rn, on peut construire un nouveau modle admissible en Rn-2 par la relation suivante:

    F. EXEMPLES

    1. Effet de ppite: (Christakos, 1992, p. 65)

    C(h) = a (h) o (h) est la fonction de Dirac et a>0.

    La transforme de Fourier est: 1(2 ) anpi o n est la dimension de l'espace. Cette valeur est positive pour tout w. Christakos conclut quelle est admissible (bien que le thorme de Bochner ne sapplique pas dans ce cas)

    On peut intuitivement accepter quelle est admissible en tenant le raisonnement suivant: on peut toujours remplacer leffet de ppite par un modle admissible transitif de trs faible porte.

    2. Modle gaussien en R1 (Christakos, 1992, p.65)

    C(h)= C(exp(-(h/a)2) La transforme de Fourier en Rn est:

    n-2 n(h) = (h) + h

    (n - 2) d (h)

    dh

    c(w) = 2

    -

    w

    4 0

    2piexp

  • Vario, supp. 15

    c(w) est positif et l'intgrale existe. Par B.1, C(h) est donc admissible en R1 (et on peut dmontrer que c'est le cas en R2, R3....

    Un argument simple permet de faire la dmonstration pour Rn. C(h) peut en effet tre factorise en une srie de covariances gaussiennes en R1. Un produit de covariances admissible est galement un modle admissible (A).

    3. Soit le modle en R1

    Sa transforme de Fourier est:

    Qui est positif et dont l'intgrale existe. Par consquent, ce modle est admissible en R1 (B.1)

    4. Soit le modle exponentiel en R3

    C(h)= exp(-h/a) a>0 Examinons les conditions suffisantes B.2 La pente l'origine est -1/a < 0 la 1re condition est remplie La 2e condition est: h exp(-h/a) = 0 quand h tend vers l'infini. La 3e condition donne: (h+a)/a3 exp(-h/a) >0

    Le modle est donc admissible en R3

    5. Soit, (h) = h1.5, en R1 Examinons C.1, on a: Cd(h) = .75 h-0.5 cd(w) = cte w-0.5 > 0 Donc, le modle est admissible

    6. h2.1 n'est pas admissible car il croit plus rapidement que h2 (C.1)

    C(h) = C

    ha

    cosh

    c(w) = aC2 aw

    2cosh pi

  • Vario, supp. 16

    7. Le variogramme suivant: (h) = .25 h 0