154
Pierre Dagnelie ANALYSE DE LA VARIANCE EXTRAIT DE

Pierre Dagnelie

  • Upload
    others

  • View
    3

  • Download
    1

Embed Size (px)

Citation preview

Pierre Dagnelie

ANALYSE DE

LA VARIANCE

EXTRAIT DE

- 2 -

PRÉAMBULE

Statistique théorique et appliquée, de Pierre Dagnelie, est un ouvrage en deux volumes publié par les Éditions De Boeck, à Louvain-la-Neuve, Belgi-que (3e édit., 2011-2013, 517+736 p. – <www.dagnelie.be/stpres.html>).

Le présent document réunit les trois chapitres du tome 2 qui sont relatifs à l'analyse de la variance.

La mise en ligne de ce texte partiel est réalisée avec l'aimable autorisation des Éditions De Boeck.

Le site wseb des Éditions De Boeck est : <www.deboecksuperieur.com>. Les publications des Éditions De Boeck sont diffusées par : Dilisco, Rue du Limousin, BP 25, F-23220 Cheniers (France). Tél. : +33 (0)555 51 80 22 ou +33 (0)555 51 80 06 Fax : +33 (0)555 62 17 39 E-mail : <[email protected]> Site web : <www.dilisco-diffusion-distribution.fr>

PLAN Chapitre 9 – L’analyse de la variance à un critère de classification Page 237

Chapitre 10 – L’analyse de la variance à deux critères de classification Page 283

Chapitre 11 – L’analyse de la variance à trois et plus de trois critères de classification Page 347

Chapitre 9

L’analyse de la variancea un critere de classification

Sommaire

9.1⊕ Introduction9.2⊕ Les aspects descriptifs9.3⊕ Les aspects inferentiels9.4⊕ La puissance et la determination des nombres d’observationsExercices

238 ANALYSE DE LA VARIANCE A UN CRITERE 9.1

9.1⊕ Introduction

1◦ D’une maniere tout a fait generale, l’analyse de la variance 1 a commeobjectif de comparer des ensembles de plus de deux moyennes, en identifiant lessources de variation qui peuvent expliquer les differences existant entre elles. A cetitre, l’analyse de la variance est un des principaux outils de l’inference statistique.

Dans le cas le plus simple, l’analyse de la variance a un critere de classifica-tion ou a un facteur ou a une voie 2 concerne des ensembles de moyennes qui nepresentent aucune structure particuliere, liee par exemple a l’existence de deux ouplusieurs facteurs sous-jacents 3 (§ 1.2.2.2◦).

2◦ Bien que l’analyse de la variance ait ete concue essentiellement dans l’op-tique de la realisation d’estimations et de tests d’hypotheses, elle peut egalementetre consideree dans une certaine mesure comme une methode descriptive. Envue de clarifier au maximum l’expose, nous distinguerons les deux approches, enpresentant dans un premier temps les aspects descriptifs (§ 9.2), puis les aspectsinferentiels (§ 9.3). Nous envisagerons en outre les questions de determination dela puissance de l’analyse et des nombres d’observations a effectuer (§ 9.4).

Les exemples 9.2.1 et 9.3.3 sont des illustrations des problemes envisages ici.

3◦ En ce qui concerne l’approche inferentielle, l’analyse de la variance s’appli-que dans les memes conditions que le test t de Student, a savoir des populationsnormales et de meme variance, et des echantillons aleatoires, simples et indepen-dants (§ 8.1.2◦).

Les memes remarques qu’au paragraphe 8.1.2◦ peuvent etre formulees a cesujet. Comme le test t de Student, l’analyse de la variance est en effet peusensible a la non-normalite des populations-parents et, pour des echantillons dememe effectif, a l’inegalite des variances [Donaldson, 1968 ; Kanji et Liu, 1983 ;Krutchkoff, 1988 ; Tiku, 1971].

Une reserve doit cependant etre formulee en ce qui concerne ce dernier point.En effet, si l’analyse de la variance est peu sensible a une eventuelle inegalite desvariances dans le cas des echantillons de meme effectif, il n’en est pas de meme pourles methodes de comparaisons particulieres et multiples de moyennes, qui sont tresfrequemment utilisees en complement a l’analyse de la variance (chapitre 12). Il y adonc lieu, le plus souvent, d’etre malgre tout attentif a cette condition, notammentpar la realisation de transformations de variables (chapitre 4).

On notera aussi qu’en particulier, l’analyse de la variance peut etre appliqueesans inconvenients majeurs a des donnees discontinues, telles que des notations

1 En anglais : analysis of variance, ANOVA.2 En anglais : one-way analysis of variance.3 L’analyse de la variance a un critere de classification est parfois appelee aussi analyse de

la variance a deux composantes, en raison du fait que la variation totale y est divisee en deuxparties (variation factorielle et variation residuelle).

9.2.2 ASPECTS DESCRIPTIFS 239

effectuees selon des echelles comportant au moins cinq degres (appreciations sen-sorielles pouvant aller de 1 a 5 ou de 1 a 7, par exemple) [Rayner et al., 1986 ;Tricker, 1992].

L’exemple 9.3.2 sera exclusivement consacre, a titre d’illustration, a la questiondu controle des conditions d’application de l’analyse de la variance.

4◦ La bibliographie relative a l’analyse de la variance est extremement abon-dante. De nombreux livres y sont notamment consacres, souvent en relation avecles questions de regression ou d’experimentation. On peut citer, entre autres, leslivres de Christensen [1998], Lindman [1992], Mickey et al. [2004], Miller[1997], et Sahai et Ageel [2000].

Certains de ces ouvrages presentent l’analyse de la variance comme un cas par-ticulier du modele lineaire ou modele lineaire general, qui englobe egalement laregression lineaire. Nous introduirons ce type de presentation au paragraphe 16.4,en utilisant alors des notations matricielles.

9.2 Les aspects descriptifs

9.2.1⊕ Principes generaux

Nous considererons successivement les notions de modele observe et de tableaud’analyse de la variance (§ 9.2.2), et la realisation pratique de l’analyse en l’absencede tout recours au calcul automatique (§ 9.2.3), meme si l’emploi de l’ordinateurest en fait la solution adoptee le plus souvent. Il nous paraıt en effet important, tantpour la comprehension que pour l’utilisation de l’analyse de la variance, de conser-ver une certaine aptitude au calcul ✭✭ manuel ✮✮, en particulier en ce qui concerne ladetermination des sommes des carres des ecarts.

9.2.2⊕ La decomposition de la variation totale

1◦ Nous supposerons qu’on dispose au depart de p echantillons ou series d’ob-servations, d’effectifs ni (i = 1 , . . . , p), et nous designerons l’effectif total par n. :

n. =pX

i=1

ni .

On remarquera que, d’une maniere generale, au cours de ce chapitre et deschapitres suivants, les points qui figurent en indices remplacent des indices selonlesquels une sommation a ete realisee.

2◦ Nous designerons aussi les differentes observations par le symbole xik

(i = 1 , . . . , p et k = 1 , . . . ,ni), la valeur xik etant donc la keme observationdu ieme echantillon.

240 ANALYSE DE LA VARIANCE A UN CRITERE 9.2.2

On peut en deduire p moyennes xi , relatives aux p echantillons, et une moyennegenerale x :

xi =1ni

niX

k=1

xik et x =1n.

pX

i=1

niX

k=1

xik =1n.

pX

i=1

(ni xi) .

3◦ En fonction de ces differents elements, il est possible de subdiviser les ecartsentre les observations individuelles et la moyenne generale en deux composantesadditives :

xik − x = (xi − x) + (xik − xi) .

Cette decomposition constitue le modele observe de l’analyse de la variance.Elle implique simplement, sans faire aucune hypothese, que les ecarts entre lesobservations et la moyenne generale peuvent etre consideres comme constitues defacon additive, d’une part, des ecarts entre les moyennes des differents echantillonset la moyenne generale, et d’autre part, des ecarts entre les observations elles-memes et les moyennes respectives des echantillons auxquels les observations ap-partiennent.

La composante globale est appelee variation totale et les deux composantespartielles sont appelees, d’une part, variation factorielle ou liee au facteur controle,ou encore entre echantillons, et d’autre part, variation residuelle ou dans les echan-tillons.

4◦ En elevant au carre les deux membres de la relation precedente, et en som-mant pour toute les valeurs observees, on obtient l’equation d’analyse de la va-riance :

pX

i=1

niX

k=1

(xik − x)2 =pX

i=1

niX

k=1

(xi − x)2 +pX

i=1

niX

k=1

(xik − xi)2

oupX

i=1

niX

k=1

(xik − x)2 =pX

i=1

£ni(xi − x)2

§+

pX

i=1

niX

k=1

(xik − xi)2 .

On constate ainsi que la somme des carres des ecarts par rapport a la moyennegenerale, egalement appelee somme des carres des ecarts totale 4, peut elle aussietre divisee en deux composantes additives : une somme des carres des ecarts fac-torielle ou entre echantillons 5, et une somme des carres des ecarts residuelle oudans les echantillons 6. En designant la somme totale par SCEt et ses deux com-posantes respectivement par SCEa et SCEr , on peut resumer l’equation d’analyse

4 En anglais : total sum of squares.5 En anglais : factorial sum of squares, between-group sum of squares.6 En anglais : residual sum of squares, within-group sum of squares, error sum of squares.

9.2.2 ASPECTS DESCRIPTIFS 241

de la variance sous la forme condensee :

SCEt = SCEa + SCEr .

Les trois sommes des carres des ecarts sont des mesures globales des varia-tions existant, d’une part, entre l’ensemble des observations independamment desechantillons auxquels elles appartiennent, d’autre part, entre les differents echan-tillons, et enfin, entre les observations a l’interieur des differents echantillons.

d On notera qu’aucun double produit, pouvant resulter de l’elevation au carre,n’apparaıt dans l’equation d’analyse de la variance, la somme des doubles produitsetant nulle, en vertu de la propriete de nullite de la somme des ecarts par rapporta la moyenne [STAT1, § 3.5.1.2◦] :

2pX

i=1

niX

k=1

£(xi − x) (xik − xi)

§= 2

pX

i=1

∑(xi − x)

niX

k=1

(xik − xi)∏

= 0 .b

5◦ En relation avec les variables χ2 dont il sera question ulterieurement(§ 9.3.2.5◦), des nombres de degres de liberte peuvent etre associes aux differentessommes des carres des ecarts. Ces nombres de degres de liberte sont aussi additifset se presentent de la maniere suivante :

n. − 1 = (p− 1) + (n. − p) .

6◦ Enfin, en divisant les sommes des carres des ecarts par leurs nombres dedegres de liberte respectifs, on definit des quantites appelees carres moyens 7, asavoir un carre moyen total 8, un carre moyen factoriel ou entre echantillons 9, etun carre moyen residuel ou dans les echantillons 10 :

CMt = SCEt/(n. − 1) , CMa = SCEa/(p− 1) et CMr = SCEr/(n. − p) .

Ces carres moyens sont aussi appeles variances et ils possedent d’ailleurs certainesdes proprietes des variances, notamment en ce qui concerne leurs distributionsd’echantillonnage. Comme les sommes des carres des ecarts, les carres moyensconstituent des mesures globales des variations existant aux trois niveaux consi-deres.

7◦ L’ensemble des resultats peut etre presente sous la forme d’un tableau d’ana-lyse de la variance (tableau 9.2.1).

En pratique, de tels tableaux sont obtenus le plus souvent a l’aide de logicielsqui font intervenir soit des commandes ou des procedures specifiques a l’analyse

7 En anglais : mean square.8 En anglais : total mean square.9 En anglais : factorial mean square, between-group mean square.

10 En anglais : residual mean square, within-group mean square, error mean square.

242 ANALYSE DE LA VARIANCE A UN CRITERE 9.2.2

Tableau 9.2.1. Tableau d’analyse de la variance a un critere de classification.

Degres Sommes des carres CarresSources de variation

de liberte des ecarts moyens

Differences entre echantillons p− 1 SCEa CMa

Differences entre observations(dans les echantillons) n. − p SCEr CMr

Totaux n. − 1 SCEt

de la variance et souvent denommees ✭✭ anova ✮✮, soit des commandes plus generalesrelatives au modele lineaire et frequemment appelees ✭✭ glm ✮✮.

d 8◦ Le quotient des sommes des carres des ecarts factorielle et totale permet dedefinir facilement le rapport de correlation, aussi appele coefficient de correlationnon lineaire 11 :

η =p

SCEa/SCEt .

D’une maniere generale, ce parametre joue, dans le cas d’une relation liant unecaracteristique nominale et une variable quantitative, un role semblable a celuidu coefficient de correlation dans le cas de deux variables quantitatives [STAT1,§ 4.6.3.5◦]. La caracteristique nominale correspond ici aux differents echantillonset la variable quantitative correspond aux differentes observations.

Le rapport de correlation est toujours compris entre 0 et 1 . Il est egal a 0quand toutes les moyennes xi sont egales entre elles, et il est egal a 1 quand lesvariances des differents echantillons sont toutes nulles.

Certains logiciels associent systematiquement le carre du rapport de correlationa toutes les analyses de la variance, en utilisant la notation r2 ou R2, et non pas η2

ou tout autre symbole particulier. S’il s’agit bien la d’un parametre jouant un rolecomparable a celui du coefficient de determination [STAT1, § 4.6.1.5◦], il y a lieutoutefois d’etre attentif au fait qu’il ne s’agit nullement, d’une facon generale, ducarre d’un coefficient de correlation classique.b

Exemple 9.2.1. Comparaison des hauteurs moyennes des arbres de trois typesde hetraies : analyse de la variance.

Nous avons examine anterieurement, a diverses reprises, un ensemble de don-nees relatives a des hauteurs d’arbres observees dans trois types de hetraies (exem-ple 2.3.1). Nous en venons maintenant a l’objectif reel de l’etude, a savoir verifiers’il existe ou non, en moyenne, des differences significatives de hauteurs entre lestrois types de forets, et chiffrer eventuellement ces differences.

11 En anglais : correlation ratio, non-linear correlation coefficient.

9.2.2 ASPECTS DESCRIPTIFS 243

Les valeurs relatives aux 37 endroits ou les mesures ont ete realisees sont don-nees dans le tableau 2.3.1. Les moyennes correspondantes sont :

x1 = 25,97, x2 = 25,39 , x3 = 23,14 et x = 24,98 m .

Applique a la premiere observation du premier echantillon (x11 = 23,4), lemodele observe d’analyse de la variance s’ecrit :

(23,4− 24,98) = (25,97− 24,98) + (23,4− 25,97) ou − 1,58 = 0,99− 2,57.

L’ecart negatif de 1,58 m entre cette observation particuliere et la moyenne generaleprovient, a la fois, du fait que l’endroit considere appartient a un type de foretsdont la moyenne est superieure de 0,99 m, par rapport a la moyenne generale,et que cet endroit presente une hauteur inferieure de 2,57 m, par rapport a lamoyenne de toutes les observations relatives a ce type de forets.

Un calcul similaire pourrait etre realise pour chacune des 36 autres valeurs dutableau 2.3.1, et en sommant les carres des ecarts ainsi obtenus, on aboutirait auxtrois sommes des carres des ecarts definies precedemment :

SCEt = (− 1,58)2 + . . . , SCEa = (0,99)2 + . . . et SCEr = (− 2,57)2 + . . .

Cette facon de proceder n’est pas celle qui est habituellement suivie, mais elle peutetre utile au point de vue didactique, pour bien saisir le mecanisme de l’analysede la variance. Nous verrons au paragraphe 9.2.3 comment les calculs peuventeventuellement etre realises en pratique.

Le tableau 9.2.2 presente les sommes des carres des ecarts qui sont ainsi obte-nues, les nombres de degres de liberte et les carres moyens. Le carre moyen total,egal a 4,598 , n’est toutefois pas repris dans ce tableau, afin d’eviter de suggerer,a tort, qu’il pourrait etre egal a la somme des deux autres carres moyens.

Tableau 9.2.2. Comparaison des hauteurs moyennes des arbres de trois typesde hetraies : tableau d’analyse de la variance.

Degres Sommes des carres CarresSources de variation

de liberte des ecarts moyens

Differences entre types de hetraies 2 48,88 24,44Differences entre observations

(dans les types de hetraies) 34 116,65 3,431

Totaux 36 165,53

Ce carre moyen total (ou cette variance totale), auquel correspond un ecart-type egal a 2,14 m, mesure globalement l’heterogeneite des hauteurs, sans tenircompte de la subdivision en trois types de forets. Le carre moyen residuel (oula variance residuelle), auquel est associe un ecart-type egal a 1,85 m, mesure,

244 ANALYSE DE LA VARIANCE A UN CRITERE 9.2.3

toujours globalement, l’heterogeneite des hauteurs a l’interieur des trois types deforets.

Enfin, le carre moyen factoriel, qui est de loin superieur aux deux autres, meten evidence l’existence de differences importantes de hauteur d’un type de hetraiesa l’autre. Nous verifierons ulterieurement la signification statistique de ces diffe-rences (exemple 9.3.1).

d En outre, on peut completer l’analyse par le calcul du rapport de correlationou de son carre :

η2 = 48,88/165,53 = 0,30 .

Ce parametre mesure le degre de dependance de la variable quantitative ✭✭ hauteurdes arbres ✮✮ en fonction de la caracteristique nominale ✭✭ type de hetraies ✮✮. Commeun coefficient de determination, il indique que 30 % de la variation totale peut etreexpliquee par les differences entre types de forets.b

9.2.3 La realisation de l’analyse de la variance

1◦ Comme nous l’avons signale au paragraphe 9.2.1, nous donnons ici, a titreindicatif, quelques informations relatives a la realisation de l’analyse de la varianceen l’absence de tout recours a l’un ou l’autre moyen de calcul automatique. Cetterealisation consiste essentiellement en une suite de determinations de sommes decarres d’ecarts, semblables a celle qui peut etre effectuee pour toute serie d’obser-vations [STAT1, § 3.8.1].

2◦ En ce qui concerne la somme des carres des ecarts residuelle, on peut calcu-ler separement les sommes des carres des ecarts relatives aux differents echantillonsou series d’observations, et sommer ensuite les resultats ainsi obtenus. Si on designepar Xi. et SCEi , respectivement, les sommes et les sommes des carres des ecartsrelatives aux differentes series d’observations, on a :

Xi. =niX

k=1

xik et SCEi =niX

k=1

x2ik −X2

i./ni (pour tout i) ,

ainsi que :

SCEr =pX

i=1

SCEi .

En realite, la determination des sommes des carres des ecarts individuellesSCEi n’est pas indispensable, en vue de calculer la somme des carres des ecartsresiduelle, mais cette determination permet d’obtenir facilement les variances desdifferentes series d’observations et donc de comparer ces variances, prealablementa toute inference statistique.

9.3.1 ASPECTS INFERENTIELS 245

3◦ Quant a la somme des carres des ecarts totale, on a, toujours par analogieavec le cas d’une seule serie d’observations :

SCEt =pX

i=1

niX

k=1

x2ik −X2

../n. ,

le symbole X.. designant la somme de l’ensemble des n. observations :

X.. =pX

i=1

niX

k=1

xik =pX

i=1

Xi. .

On remarquera que le premier terme qui intervient dans la relation relative a lasomme des carres des ecarts totale SCEt n’est autre que la somme des premierstermes qui se presentent dans l’expression relative aux sommes des carres des ecartsindividuelles SCEi .

4◦ Enfin, la somme des carres des ecarts factorielle peut etre obtenue soit pardifference :

SCEa = SCEt − SCEr ,soit par la relation :

SCEa =pX

i=1

(X2i./ni)−X2

../n. .

Diverses simplifications peuvent etre apportees a certaines de ces formulesquand les effectifs ni sont egaux.

Exemple 9.2.2. Comparaison des hauteurs moyennes des arbres de trois typesde hetraies : realisation de l’analyse de la variance.

En ce qui concerne l’exemple 9.2.1, les differentes sommes des carres des ecartsde l’analyse de la variance (tableau 9.2.2) peuvent etre obtenues de la manieresuivante, a partir des donnees du tableau 3.2.1 :

SCE1 = 8.789,36− 337,62/13 = 22,15 , SCE2 = 9.062,96− 355,42/14 = 40,88 ,

SCE3 = 5.408,22− 231,42/10 = 53,62 , SCEr = 22,15 + 40,88 + 53,62 = 116,65 ,

SCEt = 23.260,54− 924,42/37 = 165,53 et SCEa = 165,53− 116,65 = 48,88 .

Les autres elements du tableau 9.2.2 decoulent alors immediatement de cesdifferentes sommes des carres des ecarts et des effectifs des echantillons.

9.3 Les aspects inferentiels

9.3.1⊕ Principes generaux

1◦ En ce qui concerne les aspects inferentiels, l’analyse de la variance a uncritere de classification se presente sous la forme de deux modeles distincts.

246 ANALYSE DE LA VARIANCE A UN CRITERE 9.3.2

Le modele fixe ou modele I 12, qui est le plus classique, a pour objet la com-paraison d’un nombre limite p de populations, pour chacune desquelles peut etrepreleve un echantillon. Le modele aleatoire ou modele II 13 a trait, au contraire,a la comparaison d’une infinite ou d’un tres grand nombre (une quasi-infinite) depopulations, pour toutes lesquelles il n’est pas possible, en pratique, de preleverchaque fois un echantillon.

Dans ce deuxieme cas, l’echantillonnage est un echantillonnage a deux degres[STAT1, § 2.2.4.4◦]. Dans un premier temps, on choisit de facon completement alea-toire un nombre reduit p de populations, et dans un deuxieme temps, on choisitun echantillon a l’interieur de chacune de ces seules p populations.

Comme nous l’avons deja signale (§ 9.1.3◦), et cela pour les deux modeles, lesechantillons choisis au sein des p populations doivent etre aleatoires, simples etindependants les uns des autres.

Dans l’interpretation des resultats fournis par le modele aleatoire, on doit etreparticulierement attentif au fait qu’on ne s’interesse pas specifiquement aux p po-pulations pour lesquelles on dispose d’observations. Ces quelques populations nesont en fait prises en consideration que comme une image de l’ensemble plus vastedes populations, en nombre infini ou quasi infini, au sujet duquel on s’interroge.L’exemple 9.3.3 est une illustration de cette situation.

d D’autres modeles, intermediaires ou plus generaux, ont egalement ete proposes,mais sont tres peu utilises [Plackett, 1960].b

2◦ Nous consacrerons les paragraphes 9.3.2 et 9.3.3 a ces deux modeles et nouspresenterons ensuite quelques complements relatifs a l’application de ces modelesa deux problemes d’echantillonnage (§ 9.3.4), quelques autres complements plusmathematiques (§ 9.3.5), et quelques informations relatives aux methodes non pa-rametriques et robustes, dont le test des rangs ou de Kruskal et Wallis (§ 9.3.6).

Une distinction sera faite egalement, a certains moments, entre le cas des echan-tillons de meme effectif, dit aussi equilibre 14, et le cas des echantillons d’effectifsinegaux, dit non equilibre 15.

9.3.2⊕ Le modele fixe

1◦ Pour le modele fixe de l’analyse de la variance a un critere de classification,nous designerons par Xik les variables aleatoires qui correspondent aux valeursobservees xik , par mi les moyennes des p populations, et par m une moyennegenerale, ponderee par les effectifs des echantillons :

m =1n.

pX

i=1

(ni mi) .

12 En anglais : fixed model, fixed effects model, model I.13 En anglais : random model, random effects model, model II.14 En anglais : balanced model.15 En anglais : unbalanced model.

9.3.2 ASPECTS INFERENTIELS 247

2◦ Par analogie avec le modele observe (§ 9.2.2.3◦), on peut definir un modeletheorique, qui se presente comme suit :

Xik −m = (mi −m) + (Xik −mi) ou Xik −m = ai + Dik ,

les quantites ai etant les ecarts factoriels, non aleatoires, lies au facteur controle,et les quantites Dik les ecarts residuels, aleatoires, independants les uns des autres,de moyenne nulle et de meme variance σ2. Une autre ecriture encore :

Xik = m + ai + Dik ,

met en evidence le fait que toute observation, aleatoire, peut etre consideree commeresultant de l’addition d’une moyenne generale, d’un effet non aleatoire du aufacteur pris en consideration, aussi appele effet principal 16, et d’un ecart ou d’unresidu 17 aleatoire relatif specifiquement a l’individu envisage.

On notera qu’en raison de leurs relations avec les moyennes, les effets princi-paux ai sont de somme ponderee nulle :

pX

i=1

(ni ai) = 0 ,

et aussi, que c’est bien aux ecarts residuels Dik que s’appliquent les hypothesesde normalite, d’egalite des variances et d’independance emises anterieurement(§ 9.1.3◦).

3◦ Dans ces conditions, l’hypothese nulle a laquelle on s’interesse est a la foisl’hypothese d’egalite des moyennes et l’hypothese de nullite des effets principaux :

H0 : m1 = m2 = . . . = mp ou a1 = a2 = . . . = ap = 0 .

4◦ En fonction du modele theorique defini ci-dessus, on peut rechercher lesesperances mathematiques des sommes des carres des ecarts et des carres moyens.On obtient :

E(CMt) = σ2 +1

n. − 1

pX

i=1

(ni a2i ) , E(CMa) = σ2 +

1p− 1

pX

i=1

(ni a2i )

et E(CMr) = σ2 .

La demonstration de ces differentes relations, qui ne fait intervenir que desproprietes simples de l’esperance mathematique, est donnee au paragraphe 9.3.5.

16 En anglais : main effect.17 En anglais : residual.

248 ANALYSE DE LA VARIANCE A UN CRITERE 9.3.2

Les esperances mathematiques ainsi obtenues montrent que le carre moyenresiduel est toujours egal, en moyenne, a la variance theorique σ2, tandis que lesdeux autres carres moyens ne sont egaux, en moyenne, a cette variance que sil’hypothese d’egalite des moyennes est vraie. Dans tous les autres cas, ces carresmoyens sont en moyenne superieurs a σ2.

5◦ On peut aussi demontrer que, quand l’hypothese nulle est vraie, les distri-butions d’echantillonnage des differentes sommes des carres des ecarts sont, a laconstante σ2 pres, des distributions χ2. Les variables :

χ2t = SCEt/σ2 , χ2

a = SCEa/σ2 et χ2r = SCEr/σ2 ,

sont en effet des variables χ2 dont les nombres de degres de liberte sont ceux quiont ete presentes au paragraphe 9.2.2.5◦, a savoir n. − 1 , p− 1 et n. − p .

En outre, les deux dernieres variables sont independantes l’une de l’autre, aumeme titre que la moyenne, ou la difference de deux moyennes, et la variance sontindependantes l’une de l’autre dans le cas d’un ou de deux echantillons [STAT1,§ 8.3.2.4◦].

La demonstration de ces differentes proprietes est egalement donnee au para-graphe 9.3.5.

6◦ Sur base de ce qui vient d’etre dit, le rapport des variables χ2a et χ2

r , diviseespar leurs nombres de degres de liberte :

£χ2

a/(p− 1)§±£

χ2r/(n. − p)

§= CMa/CMr ,

est une variable F de Fisher-Snedecor, dont les nombres de degres de libertesont p− 1 et n. − p [STAT1, § 6.9.2.1◦]. L’examen des esperances mathematiquesmontre en outre que, quand l’hypothese d’egalite des moyennes n’est pas verifiee,le rapport CMa/CMr fournit en moyenne des valeurs plus elevees que celles desdistributions de Fisher-Snedecor.

On peut alors proceder facilement au test et aux estimations, en fonction desesperances mathematiques et des distributions d’echantillonnage.

7◦ Le test de l’hypothese nulle emise ci-dessus necessite le calcul de la quantite :

Fobs = CMa/CMr .

Le rejet de l’hypothese, au niveau de probabilite α , intervient quand cette quantiteest trop elevee, c’est-a-dire quand :

P(F ≥ Fobs) ≤ α ou Fobs ≥ F1−α ,

avec p− 1 et n. − p degres de liberte. Le caractere unilateral du test resulte de ceque, dans tous les cas ou l’hypothese nulle est fausse, les valeurs Fobs depassent

9.3.2 ASPECTS INFERENTIELS 249

en moyenne les valeurs que donnent normalement les distributions F de Fisher-Snedecor.

Le rejet de l’hypothese nulle, relative a un ensemble de p moyennes, souleve laquestion de savoir quelles sont les moyennes qui different significativement les unesdes autres. Nous envisagerons cette question subsidiaire au cours du chapitre 12.

8◦ En matiere d’estimations, on a, pour les moyennes des differentes popula-tions et pour la variance commune aux differentes populations :

bmi = xi et bσ2 = CMr ,

ces estimateurs etant non biaises.

En outre, on peut calculer comme suit des limites de confiance, pour les moyen-nes mi et pour les differences de moyennes mi −mi0 :

xi ± t1−α/2

pCMr/ni et xi − xi0 ± t1−α/2

pCMr (1/ni + 1/ni0) ,

la variable t de Student etant une variable a n.−p degres de liberte. Ces formulessont semblables a celles qui concernent une ou deux populations, la seule differenceetant que les estimations anterieures de la variance σ2 sont remplacees ici par CMr

(§ 8.2.2.1◦ et 8.4.2.6◦).

Des limites de confiance relatives a la variance σ2 et a l’ecart-type σ peuventegalement etre obtenues selon les procedures habituelles, a partir de la somme descarres des ecarts ou du carre moyen residuel, et grace a la distribution χ2 a n.− pdegres de liberte (§ 7.2.2.1◦).

d 9◦ Dans le test presente ci-dessus, nous avons suppose implicitement que l’hy-pothese alternative H englobe toutes les situations ou au moins une des egalitesdefinies par l’hypothese nulle n’est pas verifiee, et cela quel que soit le sens de laou des differences existant entre les moyennes.

On envisage parfois aussi des alternatives ordonnees 18, pour lesquelles le sensdes differences eventuelles, ou de certaines d’entre elles, est specifie a priori[McDermott et Mudholkar, 1993 ; Miwa et al., 2000 ; Mudholkar etMcDermott, 1989]. Il peut s’agir par exemple de l’alternative suivante :

H : m1 ≤ m2 ≤ . . . ≤ mp ,

pour autant qu’elle comporte au moins une inegalite stricte. De telles hypothesesalternatives correspondent a des ensembles non decroissants de moyennes.

D’autre part, comme dans le cas de deux populations (§ 8.4.2.8◦), le test d’ega-lite des moyennes peut ceder la place a un test d’equivalence des moyennes, danslequel l’hypothese nulle n’implique pas que les moyennes sont toutes strictement

18 En anglais : ordered alternative.

250 ANALYSE DE LA VARIANCE A UN CRITERE 9.3.2

egales, mais bien que leur variance est inferieure ou egale a une certaine limitesuffisamment petite [Chen et al., 2000 ; Wellek, 2003] :

H0 :1p

pX

i=1

(mi −m)2 ≤ ∆2 .b

Exemple 9.3.1. Comparaison des hauteurs moyennes des arbres de trois typesde hetraies : suite de l’analyse de la variance.

Nous pouvons maintenant cloturer l’analyse de la variance que nous avonsentamee a l’exemple 9.2.1.

A partir du tableau 9.2.2, on obtient :

Fobs = 24,44/3,431 = 7,12 et P(F ≥ 7,12) = 0,0026 ,

avec 2 et 34 degres de liberte. L’hypothese d’egalite des hauteurs moyennes desarbres dans les trois types de hetraies doit donc etre rejetee, meme au niveau deprobabilite 0,01 : les differences observees sont hautement significatives.

Les limites de confiance des differences sont (table II), pour un degre de con-fiance egal a 0,95 , et pour les deux premiers types de forets :

25,97− 25,39 ± 2,032p

3,431 (1/13 + 1/14) = 0,58 ± 1,45 = − 0,87 et 2,03 m ,

pour le premier et le troisieme type de forets :

25,97− 23,14 ± 2,032p

3,431 (1/13 + 1/10) = 2,83 ± 1,58 = 1,25 et 4,41 m ,

et pour les deux derniers types de forets :

25,39− 23,14 ± 2,032p

3,431 (1/14 + 1/10) = 2,25 ± 1,56 = 0,69 et 3,81 m .

Le fait que le premier intervalle de confiance englobe la valeur zero indiquequ’il n’y a pas de difference significative entre les deux premiers types de hetraies,ce qui etait deja la conclusion de l’exemple 8.4.1. On peut en consequence calculereventuellement une moyenne globale pour l’ensemble de ces deux types :

x12 = (337,6 + 355,4)/27 ou£13 (25,97) + 14 (25,39)

§±27 = 25,67 m ,

et determiner des limites de confiance relatives a la difference entre cette nouvellemoyenne et la moyenne du troisieme type de forets :

25,67− 23,14 ± 2,032p

3,431 (1/27 + 1/10) = 2,53 ± 1,39 = 1,14 et 3,92 m .

La conclusion finale serait ainsi qu’il n’y a pas de difference significative de hau-teur des arbres entre les deux premiers types de hetraies, qu’il existe au contraire

9.3.2 ASPECTS INFERENTIELS 251

une difference hautement significative de hauteur entre ces deux types et le troi-sieme, et que cette difference peut etre estimee a 2,5 m , avec des limites deconfiance egales a 1,1 et 3,9 m , au degre de confiance habituel (1− α = 0,95).

d En vue de tenir compte du fait qu’on procede en realite a trois comparaisons,dans la determination des trois intervalles de confiance initiaux, on aurait puremplacer la valeur t classique (t0,975 = 2,032), par une valeur t definie au sens deBonferroni [STAT1, § 10.3.5.2◦] :

t1−0,05/6 = t0,99167 = 2,518 .

Cette facon de faire aurait conduit a etendre assez sensiblement les differentsintervalles de confiance, sans modifier, dans le cas present, les conclusions finales.b

Exemple 9.3.2. Comparaison des hauteurs moyennes des arbres de trois typesde hetraies : controle des conditions d’application de l’analyse de la variance.

Nous avons deja examine anterieurement les donnees de l’exemple precedentsous l’angle du respect des conditions de normalite et d’egalite des variances. Ilnous paraıt cependant opportun de revoir globalement la question, en vue d’enfaire la synthese et d’emettre certains suggestions qui peuvent etre etendues al’ensemble du domaine d’application de l’analyse de la variance.

Dans un but purement didactique, nous avons en fait procede a l’examen initialdes donnees, y compris l’etude des ecarts reduits (exemple 2.3.1), verifie la nor-malite des distributions par la realisation de diagrammes de probabilite (exemple3.3.1), par le test de Shapiro et Wilk (exemple 3.3.3) et par le test de conformitedes coefficients de Pearson et de Fisher (exemple 3.4.1), recherche d’eventuel-les observations aberrantes par la methode de Grubbs (exemple 3.5.2), et verifiel’egalite des variances par les tests de Bartlett, de Hartley et de Levene(exemple 7.5.1). Comme nous l’avons deja signale, l’emploi d’un tel ✭✭ arsenal ✮✮ demethodes ne se justifie bien sur absolument pas en pratique.

Une procedure generale, applicable aux divers cas d’analyse de la variance, peutconsister par exemple en un examen initial des donnees tout a fait classique (§ 2.3.2et 2.3.3), un controle rapide de la normalite des distributions par la methode desdiagrammes de probabilite (§ 3.3.2), une identification des eventuelles observationsaberrantes par la methode de Grubbs (§ 3.5.3), et un controle de l’egalite desvariances par la methode de Levene (§ 7.5.2.6◦ et 7.5.3).

Dans cette optique, la methode des diagrammes de probabilite peut etre ap-pliquee globalement aux residus xik − xi ou aux residus reduits correspondants,l’identification des eventuelles observations aberrantes peut se faire a partir desresidus reduits, et la methode de Levene peut aussi etre appliquee indifferemmentaux residus ou aux residus reduits.

Pour l’exemple considere ici, les residus et les residus reduits de l’analyse de lavariance sont donnes dans le tableau 3.5.1, sous les appellations d’ecarts et ecartsreduits par rapport aux moyennes. Le diagramme de probabilite correspondant est

252 ANALYSE DE LA VARIANCE A UN CRITERE 9.3.3

tout a fait comparable a celui de la figure 3.3.3. L’identification d’eventuelles obser-vations aberrantes a ete realisee dans le cadre de l’exemple 3.5.2. Et la methode deLevene, dont nous avons deja donne les resultats anterieurement (exemple 7.5.1),consiste a effectuer une analyse de la variance portant sur les valeurs absolues desresidus ou des residus reduits. Le tableau 9.3.1 presente les resultats obtenus apartir des residus, la probabilite correspondant a la valeur 2,23 etant egale a 0,12 .

Tableau 9.3.1. Comparaison des hauteurs moyennes des arbres de trois types dehetraies : tableau d’analyse de la variance relatif aux valeurs absolues des residus.

Degres Sommes des carres CarresSources de variation F

de liberte des ecarts moyens

Differences entre types de hetraies 2 3,8003 1,9002 2,23Differences entre observations

(dans les types de hetraies) 34 29,0206 0,8535

Totaux 36 32,8209

Aucune anomalie importante, de non-normalite ou d’inegalite des variances,ne met donc en cause le recours a l’analyse de la variance en vue de comparer leshauteurs moyennes des arbres des trois types de hetraies.

d La probabilite 0,12 est toutefois l’indice d’une certaine inegalite des variances.Une solution qui tient compte de cet element est envisagee au paragraphe 9.3.5,dans le cadre de l’exemple 9.3.7.b

9.3.3 Le modele aleatoire

1◦ Au cours du paragraphe 9.3.2, nous avons volontairement expose en detaille raisonnement relatif au modele fixe d’analyse de la variance a un critere declassification. Cela devrait nous permettre d’aller sensiblement plus vite pour lemodele aleatoire et aussi, ulterieurement, pour l’analyse de la variance a deux etplus de deux criteres de classification. Nous nous contenterons en effet, a l’avenir,de mettre en evidence les differences par rapport au modele le plus simple et leplus classique, en exposant seulement les principaux resultats.

2◦ Comme nous l’avons signale au paragraphe 9.3.1.1◦, dans le cas du modelealeatoire, les populations pour lesquelles des observations sont realisees sont choi-sies au hasard au sein d’un ensemble tres vaste, infini ou quasi infini. Les moyennesde ces populations doivent donc etre considerees comme des variables aleatoires etnous les designerons par des lettres majuscules :

M1 , M2 , . . . , Mp .

En plus des hypotheses formulees anterieurement (§ 9.1.3◦), nous supposeronsque ces moyennes possedent elles aussi une distribution normale, de moyenne m etde variance σ2

M , et que les ecarts residuels Dik sont independants de ces moyennes.

9.3.3 ASPECTS INFERENTIELS 253

La moyenne generale m est relative a l’ensemble infini ou quasi infini des popu-lations considerees, et non pas a l’ensemble beaucoup plus limite des p populationspour lesquelles on dispose d’observations.

3◦ Le modele theorique s’ecrit alors :

Xik −m = Ai + Dik ou Xik = m + Ai + Dik .

Dans ce modele, les ecarts factoriels :

Ai = Mi −m ,

sont egalement aleatoires, de distribution normale, de moyenne nulle et de varian-ce σ2

A , egale a σ2M :

mA = 0 et σ2A = σ2

M .

Ces ecarts factoriels sont aussi independants des ecarts residuels Dik .

4◦ En fonction de ce modele, les esperances mathematiques des carres moyensdefinis au paragraphe 9.2.2.6◦ sont :

E(CMt) = σ2 + n0 (p− 1)σ2A/(n. − 1) , E(CMa) = σ2 + n0 σ2

A

et E(CMr) = σ2 ,

σ2A et σ2 etant les deux variances, respectivement entre les populations et dans

les populations, et la quantite n0 etant definie de la maniere suivante, a partir deseffectifs des echantillons et de l’effectif total :

n0 =≥n2

. −pX

i=1

n2i

¥.£n. (p− 1)

§.

Quand les echantillons sont de meme effectif, la quantite n0 est egale a l’effectifcommun n .

Nous donnerons la demonstration de ces differentes proprietes au paragra-phe 9.3.5.

5◦ Les distributions d’echantillonnage et la realisation du test d’hypothese sepresentent exactement comme dans le cas du modele fixe.

Toutefois, l’hypothese a tester est sensiblement differente. Elle s’ecrit ici :

H0 : σ2M = 0 ou σ2

A = 0 .

La nullite de la variance des moyennes Mi , ou de la variance des effets princi-paux Ai , implique l’egalite des moyennes de toutes les populations considerees,

254 ANALYSE DE LA VARIANCE A UN CRITERE 9.3.3

et non pas seulement des moyennes des p populations pour lesquelles on disposed’observations. L’hypothese nulle concerne donc bien l’infinite ou la quasi-infinitedes populations prises en consideration.

6◦ Dans le cas du modele aleatoire, les problemes d’estimation concernentessentiellement les variances σ2

A et σ2, aussi appelees composantes de la varian-ce 19, et les ecarts-types correspondants. Les esperances mathematiques des carresmoyens montrent que des estimations non biaisees peuvent etre obtenues a l’aidedes relations suivantes :

bσ2A = (CMa − CMr)/n0 et bσ2 = CMr ,

en se limitant aux situations ou le carre moyen factoriel CMa est superieur aucarre moyen residuel CMr .

d On notera qu’il s’agit en fait d’estimations basees sur le principe de la methodedes moments [STAT1, § 9.3.3.2◦].b

7◦ Comme pour le modele fixe, des limites de confiance peuvent etre determi-nees facilement pour σ2, par les formules habituelles (§ 9.3.2.8◦).

Le probleme est plus delicat pour σ2A . Une solution approchee et relativement

simple est fournie par les expressions suivantes, dans le cas des effectifs egaux :

(p− 1)CMr (Fobs − F1−α/2)/(nχ21−α/2) et (p− 1)CMr (Fobs − Fα/2)/(nχ2

α/2) ,

la variable F possedant p − 1 et n. − p degres de liberte et la variable χ2 ayantp− 1 degres de liberte [Boardman, 1974].

Cette approximation peut etre etendue au cas des effectifs inegaux en rem-placant n par la moyenne harmonique n00 des effectifs ni :

n00 = p± pX

i=1

1ni

,

et Fobs par une valeur modifiee F 0obs definie de la maniere suivante :

F 0obs = n00 SCExi

±£(p− 1)CMr

§,

SCExi etant la somme des carres des ecarts non ponderee des moyennes xi [Tho-mas et Hultquist, 1978].

On remarquera que ces expressions peuvent donner des resultats negatifs. Onpeut eviter cet inconvenient en remplacant les valeurs negatives par zero, maiscette solution conduit a certains biais, relativement importants quand les carresmoyens CMa et CMr sont peu differents l’un de l’autre.

19 En anglais : variance component.

9.3.3 ASPECTS INFERENTIELS 255

d 8◦ Un probleme connexe est celui de la recherche de limites de confiance pourle rapport σ2

A/σ2. De telles limites peuvent etre deduites de la double inegalite :

Fα/2 <CMa/(σ2 + n0 σ2

A)CMr/σ2

< F1−α/2 ,

puisque la partie centrale de cette inegalite est toujours une valeur observee d’unevariable de Fisher-Snedecor, meme si l’hypothese nulle est fausse.

On obtient ainsi, comme limites de confiance de σ2A/σ2 :

(Fobs/F1−α/2 − 1)/n0 et (Fobs/Fα/2 − 1)/n0 ,

les nombres de degres de liberte de la variable F etant encore p− 1 et n. − p .b

d 9◦ Le modele aleatoire d’analyse de la variance a un critere de classificationintervient en particulier en genetique quantitative 20. La variation totale est alorssouvent qualifiee de variation phenotypique 21, la variation factorielle de variationgenotypique ou genetique 22, et la variation residuelle est parfois appelee variationenvironnementale 23.

Dans cette optique, l’heritabilite 24 est le rapport de la variation genetique ala variation phenotypique. Elle correspond au quotient CMa/CMt . Ce conceptpeut etre mis en relation aussi avec la notion de correlation intraclasse [STAT1,§ 4.6.3.7◦].

Des informations complementaires sont fournies notamment par Donner[1986] et Jacquard [1983].b

d 10◦ En realite, les problemes d’estimation des composantes de la variance et dedetermination de leurs limites de confiance depassent tres largement ce que nousvenons d’en exposer, en particulier pour les echantillons d’effectifs inegaux. Nousreviendrons ulterieurement sur ce sujet, en donnant un certain nombre d’infor-mations et de references bibliographiques generales (§ 16.4.5). Mais des solutionsparticulieres ont aussi ete envisagees dans le cas du modele aleatoire a un criterede classification [Hartung et Knapp, 2005 ; Lee et Khuri, 2002 ; Li et Li, 2007 ;Rao, 2001].

D’autre part, le test de nullite de la composante de la variance σ2A peut even-

tuellement etre generalise, en devenant un test de conformite a une valeur positivequelconque σ2

0 [Chistensen et al., 2007 ; Hartung et Argac, 2002]. L’hypothesenulle est alors :

H0 : σ2A = σ2

0 .b20 En anglais : quantitative genetics.21 En anglais : phenotypic variation.22 En anglais : genotypic variation, genetic variation.23 En anglais : environmental variation.24 En anglais : heritability.

256 ANALYSE DE LA VARIANCE A UN CRITERE 9.3.3

Exemple 9.3.3. Etude de l’homogeneite des rendements fourragers d’un ensemblede prairies : analyse de la variance.

On s’interesse a l’ensemble des prairies d’une region donnee et on souhaiteidentifier l’importance, absolue ou relative, de la variabilite de la production four-ragere, d’une part d’une prairie a l’autre, et d’autre part d’un endroit a l’autre al’interieur des differentes prairies. Dans ce but, on a tout d’abord choisi au hasardtrois prairies dans l’ensemble du territoire considere, puis au sein de chacune deces trois prairies, cinq petites parcelles de 2 m2 [Calembert, 1962]. Dans l’op-tique d’un echantillonnage a deux degres [STAT1, § 2.2.4.4◦], les trois prairiesconstituent trois unites du premier degre et les 15 petites parcelles 15 unites dudeuxieme degre.

Dans chacune des 15 parcelles, on a mesure les rendements en matiere seche aune date donnee. Les valeurs observees, exprimees en tonnes par hectare, figurentdans le tableau 9.3.2 et les resultats de l’analyse de la variance dans le tableau 9.3.3.

Tableau 9.3.2. Etude de l’homogeneite des rendements fourragers d’un ensemblede prairies : rendements observes, en tonnes de matiere seche par hectare.

Parcelles Prairie 1 Prairie 2 Prairie 3

1 2,06 1,59 1,922 2,99 2,63 1,853 1,98 1,98 2,144 2,95 2,25 1,335 2,70 2,09 1,83

Tableau 9.3.3. Etude de l’homogeneite des rendements fourragers d’un ensemblede prairies : tableau d’analyse de la variance.

Degres Sommes des carres CarresSources de variation F

de liberte des ecarts moyens

Differences entre prairies 2 1,3182 0,6591 4,23 *Differences entre parcelles

(dans les prairies) 12 1,8711 0,1559

Totaux 14 3,1893

La probabilite de depasser la valeur 4,23 etant egale a 0,041 , pour une va-riable F de Fisher-Snedecor a 2 et 12 degres de liberte, les differences entreprairies doivent etre considerees comme juste significatives. C’est ce qu’indiqued’ailleurs l’asterisque qui est associee, conventionnellement, a la valeur Fobs .

On peut alors proceder comme suit aux estimations des composantes de lavariance :

bσ2A = (0,6591− 0,1559)/5 = 0,1006 et bσ2 = 0,1559 .

9.3.4 ASPECTS INFERENTIELS 257

En termes d’ecarts-types, on observe donc une variabilite de 0,32 t/ha d’une prai-rie a l’autre, et de 0,39 t/ha d’une parcelle a l’autre a l’interieur des differentesprairies.

Les differences entre prairies n’etant que juste significatives, on doit s’attendrea ce que la premiere estimation soit tres peu precise. Pour un degre de confianceegal a 0,95 , on obtient en effet, comme limites de confiance (tables III et IV) :

2 (0,1559) (4,23− 5,10)±£

5 (7,38)§

= − 0,0074 ,

et 2 (0,1559) (4,23− 0,0254)±£

5 (0,0506)§

= 5,18 ,

soit, en remplacant la valeur negative par zero et en termes d’ecart-type :

0 et 2,28 t/ha .

La deuxieme estimation est par contre nettement meilleure, les limites de confianceetant, dans les memes conditions (table III) :

1,8711/23,3 = 0,080 et 1,8711/4,40 = 0,425 ,

soit aussi, en termes d’ecart-type :

0,28 et 0,65 t/ha .

Comme nous l’avons indique ci-dessus, on pourrait egalement rechercher leslimites de confiance du rapport σ2

A/σ2, et donc du rapport des ecarts-types σA/σ .On constaterait que les intervalles de confiance ainsi definis sont, eux aussi, extre-mement etendus.

En ce qui concerne les conditions d’application, les residus de l’analyse de lavariance permettent de realiser des verifications semblables a celles dont il a etequestion a l’exemple 9.3.2. Toutes sont largement satisfaisantes.

9.3.4 Application a differents problemes d’echantillonnage

1◦ Au cours des paragraphes precedents, nous avons envisage l’analyse de lavariance a un critere de classification dans l’optique habituelle de la comparaisondes moyennes des differentes populations considerees. Nous voudrions en examineraussi les utilisations possibles dans le cas de deux methodes d’echantillonnageparmi les plus courantes, a savoir l’echantillonnage stratifie et l’echantillonnage adeux degres, et subsidiairement dans le cas de l’estimation d’une meme moyenne,commune a deux ou plusieurs populatons.

2◦ L’echantillonnage stratifie a pour principe de subdiviser la population alaquelle on s’interesse en plusieurs parties, appelees strates, au sein desquelleson preleve des echantillons independants [STAT1, § 2.2.4.3◦]. Ce type d’echantil-lonnage peut etre assimile au cas du modele fixe d’analyse de la variance, si on

258 ANALYSE DE LA VARIANCE A UN CRITERE 9.3.4

considere que les differentes strates de l’echantillonnage correspondent aux dif-ferentes populations de l’analyse de la variance, et que la population globale alaquelle on s’interesse est constituee de l’ensemble des populations de l’analyse dela variance. Le but poursuivi n’est plus de comparer les moyennes mi des differentespopulations ou strates, mais bien d’estimer la moyenne generale m .

3◦ Dans le cas d’un echantillonnage aleatoire et simple a l’interieur des strateset pour autant que les effectifs des differents echantillons soient proportionnels auxeffectifs ou aux etendues des differentes strates, cette moyenne peut etre estimeesans biais par la moyenne generale observee x :

bm = x =1n.

pX

i=1

niX

k=1

xik .

Dans les conditions definies au paragraphe 9.1.3◦, les limites de confiance sui-vantes peuvent etre associees a cette estimation :

x ± t1−α/2

pCMr/n. ,

la variable t etant une variable de Student a n.− p degres de liberte, c’est-a-direle nombre de degres de liberte de CMr .

d L’application du modele theorique de l’analyse de la variance permet en effetde montrer que la variance de la moyenne generale est egale a σ2/n. , et CMr estbien une estimation non biaisee de σ2 (§ 9.3.2.2◦ et 9.3.2.8◦).b

4◦ C’est donc du carre moyen residuel CMr , et non pas du carre moyen totalCMt , que depend la precision de l’estimation de m . S’il existe des differences entrestrates, le carre moyen residuel est en moyenne inferieur au carre moyen total,et l’echantillonnage stratifie est en consequence plus precis que l’echantillonnagecompletement aleatoire. L’efficacite relative de l’un par rapport a l’autre est donneepar le quotient CMt/CMr .

Le gain de precision de l’echantillonnage stratifie par rapport a l’echantillon-nage completement aleatoire est d’autant plus grand que ce quotient est eleve,c’est-a-dire aussi d’autant plus grand que le carre moyen factoriel et donc les dif-ferences entre les moyennes des strates sont importants.

5◦ Comme nous l’avons rappele en presentant le probleme considere dansl’exemple 9.3.3, l’echantillonnage a deux degres a, au contraire, pour principed’effectuer deux echantillonnages successifs, a deux niveaux differents [STAT1,§ 2.2.4.4◦]. Ce type d’echantillonnage peut etre assimile au modele aleatoire d’ana-lyse de la variance, si on considere que les unites du premier degre correspondentaux differentes populations de l’analyse de la variance, que les unites du deuxiemedegre correspondent aux observations de l’analyse de la variance, et que la popula-tion globale a laquelle on s’interesse correspond a l’ensemble infini ou quasi infini

9.3.4 ASPECTS INFERENTIELS 259

des populations de l’analyse de la variance. Le but poursuivi est ici egalementd’estimer la moyenne generale m .

6◦ Nous n’envisageons ce probleme que dans le cas d’effectifs ni egaux (nombreconstant n d’unites du deuxieme degre, pour les differentes unites du premierdegre). On a alors, dans les memes conditions que ci-dessus :

bm = x et x ± t1−α/2

pCMa/(np) ,

la variable t possedant p− 1 degres de liberte, c’est-a-dire le nombre de degres deliberte de CMa .

d L’application du modele theorique de l’analyse de la variance permet en effetde montrer que la variance de la moyenne generale est egale a (nσ2

A + σ2)/(np),et la quantite nσ2

A +σ2 est precisement l’esperance mathematique du carre moyenfactoriel (§ 9.3.3.2◦ et 9.3.3.4◦).b

7◦ Cette fois, la precision de l’estimation de la moyenne generale est fonction ducarre moyen factoriel, dont on sait qu’il est en moyenne superieur ou egal au carremoyen total (§ 9.3.3.4◦). D’une facon generale, la precision de l’echantillonnage adeux degres est donc inferieure a la precision de l’echantillonnage completementaleatoire, et la perte de precision est d’autant plus importante que les unites dupremier degre sont plus differentes les unes des autres. Cette perte de precisionest le prix a payer pour pouvoir utiliser une methode d’echantillonnage qui estgeneralement moins couteuse ou qui demande moins de temps.

d 8◦ Un probleme comparable aux deux precedents est celui de l’estimation d’unememe moyenne, commune 25 a deux ou plusieurs populations. Ce probleme sepresente en particulier quand des analyses relatives a une meme caracteristiquesont realisees par differentes methodes ou a l’aide de differents appareils de mesure,ou encore dans differents laboratoires, et qu’il s’impose de combiner l’ensembledes resultats en vue d’obtenir une seule estimation de moyenne. Diverses solutionssont envisagees notamment par Krishnamoorthy et Lu [2003], Mitra et Sinha[2007], et Pal et et al. [2007].b

Exemple 9.3.4. Estimation de la hauteur moyenne des arbres d’un ensemble deforets : echantillonnage stratifie.

Nous reprenons a nouveau les donnees de l’exemple 2.3.1, non plus dans l’op-tique de la comparaison des trois types de forets, mais bien dans l’optique del’estimation de la moyenne generale de la hauteur des arbres, pour l’ensemble destrois types.

La hauteur etant une bonne caracteristique de la productivite des forets, ilpeut en effet se justifier pleinement de vouloir en estimer la valeur moyenne, pour

25 En anglais : common mean.

260 ANALYSE DE LA VARIANCE A UN CRITERE 9.3.4

l’ensemble du territoire considere. En outre, si on a connaissance de l’existen-ce de differents types de forets, auxquels peuvent correspondre differentes hau-teurs moyennes, il se justifie egalement de tenir compte de cette information dansl’organisation de l’echantillonnage. Il est donc naturel, dans une telle situation,de prevoir un echantillonnage stratifie, les differentes strates correspondant auxdifferents types qui peuvent etre identifies.

Pour autant que les nombres d’observations par type de forets soient propor-tionnels aux etendues des differents types, l’echantillonnage stratifie donne, commeestimation de la moyenne generale :

bm = x = 24,98 ou 25,0 m ,

comme erreur standard de cette moyenne (tableau 9.2.2) :p

3,431/37 = 0,30 ou 0,3 m ,

et comme limites de confiance de cette moyenne, pour un degre de confiance egala 0,95 et avec 34 degres de liberte (table II) :

24,98 ± 2,032p

3,431/37 = 24,98 ± 0,62 ou 24,4 et 25,6 m .

L’efficacite relative de cet echantillonnage, par rapport a l’echantillonnage com-pletement aleatoire, est (exemple 9.2.1) :

4,598/3,431 = 134 % .

Cette valeur signifie que l’echantillonnage stratifie apporte dans ce cas un sup-plement d’information d’environ 34 %, par comparaison avec l’echantillonnagecompletement aleatoire.

En d’autres termes, le recours a l’echantillonnage stratifie donne une informa-tion complementaire equivalente a celle que fourniraient des observations realiseesen 12 ou 13 endroits supplementaires sur le terrain, ce qui revient aussi a dire queles 37 points d’observation de l’echantillonnage stratifie sont equivalents a 49 ou50 points d’observation d’un echantillonnage completement aleatoire.

Exemple 9.3.5. Estimation de la production fourragere moyenne d’un ensemblede prairies : echantillonnage a deux degres.

De meme, nous reprenons les donnees de l’exemple 9.3.3, pour illustrer la ques-tion de l’estimation d’une moyenne generale par echantillonnage a deux degres.

Il peut en effet se justifier, ici egalement, de vouloir estimer la moyenne generalede la production fourragere d’un vaste ensemble de prairies et, a cette fin, pourdes raisons de facilite, on peut etre tente de concentrer la collecte des observationsdans un petit nombre de prairies, par echantillonnage a deux degres.

Cet echantillonnage a deux degres donne, comme estimation de la moyennegenerale :

bm = x = 2,153 ou 2,15 t/ha ,

9.3.5 ASPECTS INFERENTIELS 261

comme erreur standard de cette moyenne (tableau 9.3.3) :p

0,6591/15 = 0,210 ou 0,21 t/ha ,

et comme limites de confiance de cette moyenne, toujours pour un degre de con-fiance egal a 0,95 et avec deux degres de liberte (table II) :

2,153 ± 4,303p

0,6591/15 = 2,153 ± 0,902 ou 1,25 et 3,05 t/ha .

La perte de precision, par comparaison avec un echantillonnage completementaleatoire, est considerable. En effet, si on avait effectue 15 observations entierementindependantes les unes des autres, dans l’ensemble de toutes les prairies envisagees,et si on avait observe les memes rendements, on aurait eu comme erreur standardde la moyenne generale :

p0,2278/15 = 0,123 ou 0,12 t/ha ,

et comme limites de confiance de cette moyenne :

2,153 ± 2,145p

0,2278/15 = 2,153 ± 0,264 ou 1,89 et 2,42 t/ha ,

soit donc un intervalle de confiance plus de trois fort plus court.

La perte de precision liee a l’echantillonnage a deux degres resulte non seule-ment de la substitution du carre moyen factoriel au carre moyen total (0,6591 aulieu de 0,2278), mais aussi de la reduction importante du nombre de degres deliberte de la variable t (2 au lieu de 14), et en consequence, de l’augmentationsensible de la valeur t0,975 (4,303 au lieu de 2,145). Nous verrons ulterieurementcomment il aurait ete possible de limiter fortement cette perte de precision, touten effectuant malgre tout un meme type d’echantillonnage (exemple 9.4.4).

9.3.5 Quelques notions complementaires

1◦ Nous introduisons ici quelques notions complementaires, a savoir la relationqui existe entre l’analyse de la variance a un critere de classification et le test t deStudent, une extension de l’analyse de la variance comparable au test de Welch,et un ensemble de demonstrations relatives aux esperances mathematiques et auxdistributions d’echantillonnage des carres moyens.

2◦ La relation entre l’analyse de la variance et le test de Student revient a direque, pour deux populations, l’analyse de la variance a un critere de classificationest toujours strictement equivalente au test t bilateral (§ 8.4.2.1◦). Les deux me-thodes conduisent en effet a des conclusions identiques, car les valeurs Fobs et F1−α

de l’analyse de la variance sont egales, respectivement, aux carres des valeurs tobs

et t1−α/2 du test t , les probabilites associees aux valeurs tobs et Fobs etant ellesaussi egales.

262 ANALYSE DE LA VARIANCE A UN CRITERE 9.3.5

d On peut justifier cette propriete en considerant l’analyse de la variance dans lecas particulier de deux populations. La moyenne generale x et la somme des carresdes ecarts factorielles SCEa sont alors :

x = (n1 x1 + n2 x2)/(n1 + n2) et SCEa = n1 (x1 − x)2 + n2 (x2 − x)2 .

En remplacant x par sa valeur dans cette derniere relation, on obtient :

SCEa = n1 n2 (x1 − x2)2/(n1 + n2) ,et aussi :

Fobs =n1 n2 (x1 − x2)2/(n1 + n2)

SCEr/(n1 + n2 − 2)=

(x1 − x2)2

SCE1 + SCE2

n1 + n2 − 2

≥ 1n1

+1n2

¥ = t2obs .

Comme on peut etablir egalement que [STAT1, § 6.9.2.2◦] :

F1−α = t21−α/2 ,

les deux methodes sont bien strictement equivalentes.b

d 3◦ D’autre part, differentes solutions, autres que le recours a des transforma-tions de variables (chapitre 4), ont ete proposees pour pouvoir proceder a l’analysede la variance quand les populations-parents sont de variances inegales [Argac,2004 ; Krishnamoorthy et al., 2007 ; Lee et Ahn, 2003].

Ces solutions impliquent en general un ajustement du nombre de degres deliberte relatif au carre moyen residuel, dans une optique comparable a celle de lamethode de Welch pour deux populations (§ 8.4.2.3◦), et en se basant egalementsur la formule de Satterthwaite (§ 11.2.3.10◦). Mais certaines de ces solutionsimposent en outre une modification du mode de calcul de la valeurs Fobs de lavariable de Fisher-Snedecor.

Une solution simple et relativement equilibree consiste a ne modifier que lenombre de degres de liberte du carre moyen residuel, en appliquant la versiongeneralisee suivante de la formule de Welch :

h SCE1

n1 (n1 − 1)+ . . . +

SCEp

np (np − 1)

i2

1n1 − 1

h SCE1

n1 (n1 − 1)

i2+ . . . +

1np − 1

h SCEp

np (np − 1)

i2 .

L’utilisation de transformations de variables nous paraıt neanmoins preferablechaque fois qu’elle est possible.b

d 4◦ En ce qui concerne la recherche des esperances mathematiques des carresmoyens (§ 9.3.2.4◦ et 9.3.3.4◦), nous traitons pour commencer le cas de la compo-sante residuelle.

9.3.5 ASPECTS INFERENTIELS 263

On a, pour chacun des p echantillons [STAT1, § 8.3.2.2◦] :

E(SCEi) = (ni − 1)σ2 .

Il en resulte que, pour la somme des carres des ecarts residuelle, qui n’est autreque la somme des p quantites SCEi , et pour le carre moyen residuel, on a :

E(SCEr) =pX

i=1

£(ni − 1)σ2

§= (n. − p)σ2 et E(CMr) = σ2.

Cette demonstration s’applique indifferemment au modele fixe et au modelealeatoire d’analyse de la variance.b

d 5◦ Quant a la composante factorielle, on peut ecrire :

SCEa =pX

i=1

£ni (xi − x)2

§=

pX

i=1

(ni x2i ) +

pX

i=1

(ni x2)− 2pX

i=1

(ni xi x) ,

c’est-a-dire aussi, apres simplification :

SCEa =pX

i=1

(ni x2i )− n. x

2 .

Dans le cas du modele fixe, on a en outre, en designant par Xi et X les variablesaleatoires qui correspondent respectivement aux moyennes xi et x :

Xi = m + ai +1ni

niX

k=1

Dik et X2i =

≥m + ai +

1ni

niX

k=1

Dik

¥2.

En developpant X2i , qui est le carre d’une somme de 2+ni termes, en une somme

de carres et de doubles produits, en appliquant les proprietes relatives a l’esperancemathematique des sommes et des produits de variables aleatoires [STAT1, § 5.7.2],et en se souvenant du fait que la somme des produits ni ai est nulle tandis quel’esperance mathematique de Dik et l’esperance mathematique de D2

ik sont res-pectivement nulle et egale a σ2, on obtient :

E(X2i ) = m2+a2

i +σ2/ni+2mai et Eh pX

i=1

(ni X2i )

i= n. m

2+pX

i=1

(ni a2i )+pσ2 .

Un raisonnement analogue relatif a X conduit aux resultats suivants :

X = m +1n.

pX

i=1

(ni ai) +1n.

pX

i=1

niX

k=1

Dik, X2 =≥m +

1n.

pX

i=1

niX

k=1

Dik

¥2

et E(X2) = m2 + σ2/n. .

264 ANALYSE DE LA VARIANCE A UN CRITERE 9.3.5

Il en decoule que :

E(SCEa) = n. m2 +

pX

i=1

(ni a2i ) + pσ2 − n. m

2 − σ2 = (p− 1)σ2 +pX

i=1

(ni a2i ) ,

et on en deduit facilement les relations donnees au paragraphe 9.3.2.4◦, pour lecarre moyen factoriel et pour le carre moyen total.b

d 6◦ La situation n’est pas la meme pour le modele aleatoire, en raison du faitque les constantes ai cedent la place a des variables aleatoires Ai , de moyennesnulles et de variance σ2

A , independantes entre elles et independantes des Dik .

Selon des principes tout a fait semblables, on obtient successivement dans cecas :

E(X2i ) = m2 + σ2

A + σ2/ni , Eh pX

i=1

(ni X2i )

i= n. m

2 + n. σ2A + pσ2 ,

X2 =≥m +

1n.

pX

i=1

(ni Ai) +1n.

pX

i=1

niX

k=1

Dik

¥2, E(X2) = m2 +

σ2A

n2.

pX

i=1

n2i + σ2/n.

et E(SCEa) = n. m2 + n. σ2A + pσ2 − n. m2 − σ2

A

n.

pX

i=1

n2i − σ2

= (p− 1)σ2 +≥n. −

1n.

pX

i=1

n2i

¥σ2

A .

Les relations du paragraphe 9.3.3.4◦ en decoulent immediatement.b

d 7◦ Quant aux distributions d’echantillonnage des carres moyens, on peut notertout d’abord que, dans les conditions du paragraphe 9.1.3◦, et si les moyennes mi

sont egales entre elles, et donc egales a m , les n. variables Xik sont toutes desvariables normales independantes de meme moyenne m et de meme variance σ2.Leur somme des carres d’ecarts par rapport a la moyenne generale, qui n’est autreque la somme des carres des ecarts totale, divisee par σ2, est alors une variable χ2

a n. − 1 degres de liberte [STAT1, § 8.3.2.5◦].

De meme, pour les differents echantillons consideres individuellement, et cettefois independamment du fait que les moyennes mi sont egales ou non, les sommesdes carres des ecarts SCEi permettent de definir p variables χ2 a ni − 1 degres deliberte :

χ2i = SCEi/σ2 .

Ces variables etant independantes les unes des autres, puisque les echantillonssont eux-memes independants les uns des autres, leur somme, c’est-a-dire aussi lasomme des carres des ecarts residuelle divisee par σ2, est une variable χ2 a n. − pdegres de liberte [STAT1, § 6.8.1.3◦].

9.3.6 ASPECTS INFERENTIELS 265

Enfin, par une procedure analogue a celle qui intervient dans la recherchede la distribution d’echantillonnage de la variance [STAT1, § 8.3.2.5◦], on peutdemontrer que la difference entre χ2

t et χ2r , c’est-a-dire la somme des carres des

ecarts factorielle divisee par σ2, est elle aussi une variable χ2, a p − 1 degres deliberte, a condition a nouveau que toutes les moyennes mi soient egales.b

Exemple 9.3.6. Comparaison des hauteurs moyennes des arbres de deux typesde hetraies : analyse de la variance.

Pour illustrer la relation qui existe entre l’analyse de la variance a un criterede classification et le test t , il suffit de traiter les donnees de l’exemple 8.4.1 parl’analyse de la variance. On obtient ainsi :

Fobs = 0,91 ,

avec 1 et 25 degres de liberte, et cette valeur est bien le carre de :

tobs = 0,95 .

On peut verifier egalement que la valeur F0,95 (soit 4,24) est egale au carre det0,975 (soit 2,06), ou encore que, dans les deux cas, la probabilite correspondantaux valeurs observees est egale a 0,35 .

dExemple 9.3.7. Comparaison des hauteurs moyennes des arbres de trois types dehetraies : analyse de la variance avec variances quelconques.

Pour les donnees des exemples 9.2.1 et 9.3.1, sans hypothese d’egalite des va-riances et dans l’optique d’un ajustement du nombre de degres de liberte selon leprincipe du test de Welch, on obtient, pour la somme des carres des ecarts et lecarre moyen residuels, la valeur :

(22,15/156 + 40,88/182 + 53,62/90)2

(22,15/156)2/12 + (40,88/182)2/13 + (53,62/90)2/9= 21 ,

au lieu de 34 .

La probabilite associee a la valeur Fobs serait alors egale a 0,0044 , au lieu de0,0026 , et la conclusion de l’analyse de la variance ne serait donc pas modifiee.

La reduction relativement importante du nombre de degres de liberte est lieeau fait que la variance observee la plus elevee est relative a l’echantillon d’effectifle plus reduit.b

9.3.6 Les methodes non parametriques et robustes

1◦ Comme dans le cas de deux populations (§ 8.4.3.1◦), le test non parametri-que utilise le plus couramment pour comparer p populations est un test base sur

266 ANALYSE DE LA VARIANCE A UN CRITERE 9.3.6

les rangs. Ce test est connu sous le nom de test de Kruskal et Wallis 26 , et ilconstitue une generalisation du test de Mann et Whitney ou de Wilcoxon.

2◦ Ce test necessite le classement de l’ensemble des n. observations par ordrecroissant, la determination des rangs des differentes observations, le calcul dessommes des rangs Xi. , relatives aux p echantillons, et la determination de laquantite :

χ2obs =

12n. (n. + 1)

pX

i=1

(X2i./ni)− 3 (n. + 1) .

Quand l’hypothese d’egalite des moyennes, ou des medianes, est vraie, cettequantite est approximativement une valeur observee d’une variable χ2 de Pearsona p − 1 degres de liberte, et l’hypothese d’identite des distributions des p popu-lations-parents doit en consequence etre rejetee, au niveau de probabilite α , si :

P(χ2 ≥ χ2obs) ≤ α ou χ2

obs ≥ χ21−α ,

le test etant unilateral.L’approximation est satisfaisante des qu’on dispose d’un total de 15 a 20 obser-

vations au moins et des tables particulieres sont disponibles pour des effectifs pluslimites. De telles tables, de meme que des procedures de calcul, qui sont integreesdans divers logiciels, peuvent etre trouvees dans les principaux ouvrages relatifsaux methodes non parametriques et dans les publications de Di Bucchianico etvan de Wiel [2005], Iman et al. [1975], et Owen [1962].

d 3◦ On notera que la quantite χ2obs est a un facteur pres le carre moyen factoriel

qu’on obtiendrait en soumettant les rangs a l’analyse de la variance. La sommedes carres des ecarts factorielle serait en effet, pour les rangs (§ 9.2.3.4◦) :

SCEa =pX

i=1

(X2i./ni)−

£n. (n. + 1)/2

§2±n. =

pX

i=1

(X2i./ni)− n. (n. + 1)2/4 .

D’autre part, dans le cas de deux populations, la valeur χ2obs du test de Krus-

kal et Wallis est aussi le carre de la quantite uobs relative au test de Mann etWhitney ou de Wilcoxon, ce qui rend les deux tests strictement equivalents.b

4◦ Des commentaires semblables a ceux des paragraphes 8.4.3.4◦, 8.4.3.5◦ et8.4.3.6◦ peuvent egalement etre formules ici.

C’est ainsi qu’une correction doit etre apportee en presence d’ex aequo, pourautant que ceux-ci soient particulierement nombreux. Cette correction se realisealors en divisant la valeur χ2

obs par :

1−nX£

k (k2 − 1)§o±£

n. (n2. − 1)

§,

26 En anglais : Kruskal-Wallis’s test.

9.4.1 PUISSANCE ET NOMBRES D’OBSERVATIONS 267

la sommation etant relative aux differentes series d’ex aequo communs a deux ouplusieurs echantillons, et k designant le nombre de termes de ces differentes series.

C’est ainsi egalement que, dans les conditions d’application de l’analyse de lavariance, l’efficacite asymptotique du test de Kruskal et Wallis, par rapport al’analyse de la variance, est egale a 3/π ou 95,5 %.

d 5◦ Comme pour deux populations aussi, d’autres tests non parametriques ontete proposes. On peut citer notamment un test general base sur les medianes,une variante du test de Kolmogorov et Smirnov (§ 3.2.1.3◦), et differents testsrelatifs au cas des hypotheses alternatives ordonnees (§ 9.3.2.9◦), dont le test deJonckheere ou de Terpstra et Jonckheere 27 [Buning, 1999 ; Neuhauseret al., 1998 ; Zhang et Wu, 2007].

De meme, diverses methodes robustes ont ete proposees [Babu et al., 1999 ;Buning, 1997 ; Routledge, 1997]. Et des methodes robustes existent aussi enmatiere d’estimation des composantes de la variance [Muller et Uhlig, 2001 ;Stahel et Welsh, 1997 ; Zhou et Zhu, 2003].b

Exemple 9.3.8. Comparaison des hauteurs des arbres de trois types de hetraies :test de Kruskal et Wallis.

Le tableau 9.3.4 reprend les donnees de hauteurs d’arbres qui nous ont servia illustrer l’analyse de la variance a un critere de classification (exemples 9.2.1 et9.3.1), ainsi que les rangs qui peuvent etre associes a ces donnees.

A partir des sommes des rangs, on obtient :

χ2obs =

12(37) (38)

(316,52/13 + 280,52/14 + 1062/10)− 3 (38) = 9,32 ,

et avec deux degres de liberte :

P(χ2 ≥ 9,32) = 0,0095 .

Comme l’analyse de la variance, le test de Kruskal et Wallis met donc enevidence des differences hautement significatives de hauteur entre les trois typesde forets. La prise en compte des ex aequo ne modifierait guere les resultats etaucunement la conclusion du test.

9.4 La puissance et la determination des nombresd’observations

9.4.1⊕ Principes generaux

1◦ Les problemes de calcul de la fonction de puissance et de determination desnombres d’observations presentent, en analyse de la variance, de multiples aspects.

27 En anglais : Jonckheere’s test, Terpstra-Jonckheere’s test.

268 ANALYSE DE LA VARIANCE A UN CRITERE 9.4.2

Tableau 9.3.4. Comparaison des hauteurs des arbres de trois types de hetraies :hauteurs observees, en metres, et rangs.

Hauteurs RangsType 1 Type 2 Type 3 Type 1 Type 2 Type 3

23,4 22,5 18,9 8 5,5 124,4 22,9 21,1 12,5 7 224,6 23,7 21,2 16,5 10 324,9 24,0 22,1 18 11 425,0 24,4 22,5 19 12,5 5,5

26,2 24,5 23,6 23 14,5 926,3 25,3 24,5 25 20 14,526,8 26,0 24,6 29,5 21 16,526,8 26,2 26,2 29,5 23 2326,9 26,4 26,7 31,5 26 27,5

27,0 26,7 – 33 27,5 –27,6 26,9 – 35 31,5 –27,7 27,4 – 36 34 –– 28,5 – – 37 –

Totaux 316,5 280,5 106

Nous envisagerons tout d’abord la question du calcul de la fonction de puis-sance dans le cas du modele fixe (§ 9.4.2), en negligeant le cas du modele aleatoire,ce dernier ayant plus pour objet de realiser des estimations que des tests d’hypo-theses. Nous considererons ensuite les questions de determination des nombresd’observations pour chacun des deux modeles (§ 9.4.3 et 9.4.4). Enfin, nous consa-crerons un paragraphe a la question de la comparaison de la sensibilite de deuxou plusieurs experiences, relatives par exemple a differentes methodes de mesureou d’analyse (§ 9.4.5).

d 2◦ Des informations complementaires relatives aux determinations de puis-sances et de nombres d’observations, y compris pour les methodes non parametri-ques, sont donnees par Argac [2004], Buning et Kossler [1999], Lee [2003a],et Mahoney et Magel [1996].b

9.4.2 La fonction de puissance dans le cas du modele fixe

1◦ Dans le cas des tests d’egalite de deux moyennes, le calcul de la fonction depuissance est relativement aise, car les hypotheses alternatives sont toujours dutype :

H : m1 −m2 = δ (6= 0) .

La puissance est alors directement fonction de δ , qui est une mesure tres simpledu degre de faussete de l’hypothese nulle [STAT1, § 10.4.2].

9.4.2 PUISSANCE ET NOMBRES D’OBSERVATIONS 269

Il n’en est pas de meme pour l’analyse de la variance, les hypotheses alternativesetant beaucoup plus diversifiees, en raison de la multiplicite des signes d’egalite quiinterviennent dans l’hypothese nulle. Une meme difference de moyennes n’impliqued’ailleurs pas toujours, dans ce cas, un meme degre de faussete de l’hypothese nulle.

Ainsi, pour quatre populations par exemple, les hypotheses :

H1 : m1 6= m2 = m3 = m4 et H2 : m1 = m2 6= m3 = m4 ,

constituent deux hypotheses alternatives distinctes, et une meme difference entreles deux groupes de moyennes ne revet pas, dans les deux cas, la meme importance.

2◦ En ce qui concerne le modele fixe de l’analyse de la variance a un criterede classification, une mesure globale du degre de faussete de l’hypothese nulle estdonnee par l’expression :

pX

i=1

(ni a2i ) ,

qui intervient notamment dans l’esperance mathematique du carre moyen factoriel(§ 9.3.2.4◦). Pour des effectifs ni egaux, ce parametre est, a une constante pres, lavariance des effets principaux ai , et aussi des moyennes mi :

s2a =

1p

pX

i=1

a2i =

1p

pX

i=1

(mi −m)2 ,

puisque la moyenne generale m est alors la moyenne arithmetique simple desmoyennes individuelles mi .

3◦ Des tables, des abaques et des procedures de calcul, qui se basent sur de telsparametres, permettent de determiner la puissance du test. On peut se referer a cepropos a certains recueils de tables, tel que celui de Pearson et Hartley [1966-1972], et a diverses autres publications [Guenther, 1979 ; Hager et Moller,1986 ; Tiku, 1967, 1972].

Comme dans le cas de deux populations [STAT1, § 10.4.3.1◦], la puissance estnon seulement une fonction croissante du degre de faussete de l’hypothese nulle,mais aussi une fonction croissante des effectifs des echantillons et du risque depremiere espece, et une fonction decroissante de la variance residuelle σ2.

d 4◦ D’une maniere generale, la determination de la puissance du test F est baseesur les distributions F non centrales [STAT1, § 6.10.3.2◦].

Pour le modele fixe de l’analyse de la variance a un critere de classification, leparametre de decentrage ou de non-centralite ∏ relatif a ces distributions est :

∏ =1σ2

pX

i=1

(ni a2i ) ,

270 ANALYSE DE LA VARIANCE A UN CRITERE 9.4.3

et est donc etroitement lie a la mesure du degre de faussete de l’hypothese nulleque nous avons presentee ci-dessus.b

Exemple 9.4.1. Comparaison des hauteurs moyennes des arbres de trois typesde hetraies : puissance du test.

Nous repartons ici des conclusions de l’exemple 9.3.1 pour determiner, dans cecas, la puissance du test d’egalite des moyennes. Nous simplifions toutefois quelquepeu le probleme, en considerant que les echantillons sont tous trois d’effectif 12 ,et non pas respectivement d’effectifs 13 , 14 et 10 .

L’alternative a laquelle conduit l’exemple 9.3.1 est du type :

H : m1 = m2 6= m3 ,

avec une difference de moyennes qui pourrait etre, en fonction des resultats ob-serves :

δ = m1 −m3 = m2 −m3 = 2,5 .

On a dans ces conditions :

a1 = a2 = 0,8333 , a3 = − 1,6667 et s2a = 1,3889 .

En considerant en outre la valeur observee du carre moyen residuel commevaleur de la variance residuelle (CMr = 3,431), on obtient la puissance suivante,par calcul ou a l’aide des tables de Tiku [1967] par exemple :

1− β(2,5) = P(RH0|δ = 2,5) = 0,91 .

De meme, on obtiendrait une puissance egale a 0,75 pour une difference de deuxmetres et une puissance egale a 0,24 pour une difference d’un metre.

Ces valeurs montrent qu’en fonction des observations dont on dispose et pourles effectifs consideres, on ne peut raisonnablement esperer mettre en evidence desdifferences significatives que si ces differences sont de l’ordre de 2 ou 3 metres aumoins.

d Pour une difference de moyennes de 2,5 metres, la distribution non centrale quiest a la base de la determination de la puissance est la distribution F a 2 et 33degres de liberte, dont le parametre de decentrage est :

∏ = (12) (3) (1,3889)/3,431 = 14,57.b

9.4.3 La determination des nombres d’observationsdans le cas du modele fixe

1◦ Une solution simple, tres souvent largement satisfaisante, du probleme dela determination du nombre d’observations dans le cas du modele fixe d’ana-lyse de la variance a un critere de classification consiste a utiliser les formules et

9.4.3 PUISSANCE ET NOMBRES D’OBSERVATIONS 271

eventuellement l’abaque relatifs au test t d’egalite de deux moyennes (§ 8.4.4.1◦).Le coefficient de variation cv est alors le coefficient de variation qui correspond aucarre moyen residuel, et la difference δr est l’amplitude des moyennes, exprimeeen valeur relative.

Cette facon de proceder ne tient toutefois aucun compte du nombre de moyen-nes qui sont comparees, ni de la repartition de ces moyennes, certaines d’entre ellespouvant etre egales tandis que d’autres ne le sont pas.

d 2◦ En vue de faire intervenir ces deux elements de facon precise, il faut etablirla relation qui les lie au parametre de decentrage defini au paragraphe 9.4.2.4◦.A cette fin, nous considerons quatre repartitions particulieres, en les illustrantchacune par un exemple relatif a cinq moyennes. Ces repartitions sont :I . les p moyennes sont divisees en deux groupes d’effectifs egaux si p est pair, oupresque egaux si p est impair, tels que :

m1 = m2 > m3 = m4 = m5 et m1 −m3 = δ ;

II . toutes les moyennes sauf une sont supposees egales, comme :

m1 > m2 = m3 = m4 = m5 et m1 −m2 = δ ;

III . les p moyennes sont reparties uniformement entre les deux valeurs extremes,soit par exemple :

m1 > m2 > m3 > m4 > m5 et m1−m2 = m2−m3 = m3−m4 = m4−m5 = δ/4 ;

IV. toutes les moyennes sauf deux sont egales, les deux moyennes isolees etantsupposees equidistantes du groupe principal, comme :

m1 > m2 = m3 = m4 > m5 et m1 −m2 = m2 −m5 = δ/2 .

Le tableau 9.4.1 donne, pour des nombres de populations allant de 2 a 8 , etpour chacune des repartitions qui viennent d’etre definies, les valeurs des rapports kentre l’ecart-type des moyennes et leur amplitude :

k = sa/δ .

On peut constater que la premiere repartition est celle dont les rapports sa/δ sontles plus eleves, et la derniere celle dont les rapports sa/δ sont les plus petits.b

d 3◦ La figure 9.4.1, deduite notamment des abaques de Pearson et Hartley[1966-1972], donne une representation graphique de la relation qui lie l’effectif nau nombre p de populations et a la repartition des moyennes, pour un risque depremiere espece α egal a 0,05 et un risque de deuxieme espece β egal a 0,5 et 0,1 .Cette figure fait egalement intervenir, a titre intermediaire le rapport sa/σ :

∏0 = sa/σ = k δ/σ = k δr/cv .

272 ANALYSE DE LA VARIANCE A UN CRITERE 9.4.3

Tableau 9.4.1. Rapport de l’ecart-type a l’amplitude, pour differents nombres pde populations et differentes repartitions des moyennes (I a IV).

Repartitionsp

I II III IV

2 0,500 0,500 0,500 –3 0,471 0,471 0,408 0,4084 0,500 0,433 0,373 0,3545 0,490 0,400 0,354 0,316

6 0,500 0,373 0,342 0,2897 0,495 0,350 0,333 0,2678 0,500 0,331 0,327 0,250

Cette quantite est aussi une mesure du degre de faussete de l’hypothese nulle etest etroitement liee au parametre ∏ des distributions F non centrales (§ 9.4.2.4◦).L’exemple 9.4.2 illustre les principales possibilites d’utilisation de cette figure.

Des indications relatives a d’autres valeurs de α et β sont fournies notammentpar Kastenbaum et al. [1970a].b

d 4◦ La figure 9.4.1, de meme que les abaques a partir desquels elle a ete etablie,permet de constater que la solution simple presentee au debut de ce paragraphe esten general relativement satisfaisante pour les structures intermediaires II et III ,mais qu’elle ne convient pas pour les structures extremes I et IV, et cela d’autantplus que le nombre de moyennes envisagees est eleve.

Par comparaison avec le cas de deux moyennes, on peut considerer, en premiereapproximation, que le nombre d’observations necessaires diminue proportionnelle-ment a la racine carree du nombre de moyennes pour la structure I et augmenteproportionnellement a cette meme racine carree pour la structure IV.b

5◦ D’une facon plus particuliere, dans le cas de l’echantillonnage stratifie, leprobleme de la determination du nombre d’observations en vue de l’estimationd’une moyenne peut etre resolu a l’aide des diverses relations qui ont trait al’echantillonnage completement aleatoire (§ 8.2.3). Il faut noter toutefois que lavariance et le coefficient de variation qui apparaissent dans ces relations sont ceuxqui concernent la composante residuelle de l’analyse de la variance (variance etcoefficient de variation a l’interieur des strates), tandis que l’effectif n qui inter-vient dans ces relations est l’effectif total (n. ou eventuellement pn , si les effectifsrelatifs aux p strates sont egaux).

En ce qui concerne le nombre et la constitution des strates, rappelons egalementque l’objectif a atteindre est d’assurer une variabilite aussi reduite que possible al’interieur des strates, c’est-a-dire egalement des differences aussi importantes quepossible entre les strates (§ 9.3.4.4◦).

9.4.3 PUISSANCE ET NOMBRES D’OBSERVATIONS 273

Figure 9.4.1. Relation, d’une part, entre l’effectif n de chacun des echantillonset le degre de faussete ∏0 de l’hypothese nulle, et d’autre part, entre ce degre

de faussete et le quotient δr/cv (ou δ/σ), pour differents nombres depopulations (2 a 8) et differentes repartitions des moyennes (I a IV),la signification des symboles I a IV etant rappelee schematiquement

dans la partie superieure droite de la figure.

274 ANALYSE DE LA VARIANCE A UN CRITERE 9.4.3

En outre, on peut demontrer que, si les variances a l’interieur des differentesstrates sont egales, la repartition des observations entre les strates doit etre realiseede facon telle que la fraction sondee, c’est-a-dire le rapport entre l’effectif del’echantillon preleve et l’effectif ou la taille de la strate, soit constante. Si parcontre, les variances a l’interieur des differentes strates sont inegales, la solution laplus favorable consiste a adopter des fractions sondees qui sont proportionnellesaux produits des effectifs ou des tailles des strates par leurs ecarts-types [Ardilly,2006 ; Dussaix et Grosbras, 1993 ; Tille, 2001].

Exemple 9.4.2. Comparaison des poids moyens de quatre populations de poulets :determination du nombre d’observations.

Nous poursuivons la discussion des exemples 8.2.2 et 8.4.4, relatifs a l’estima-tion et a la comparaison de poids de poulets, en supposant que, dans les memesconditions, on souhaite comparer quatre ensembles de poulets, qui pourraient etrelies par exemple a quatre alimentations differentes.

Pour un coefficient de variation semblable a celui qui a ete observe, soit 13 %, etsi on souhaite mettre en evidence d’eventuelles differences de poids egales a 10 %,avec des risques d’erreur de premiere et de deuxieme espece α et β egaux res-pectivement a 0,05 et 0,1 , la solution la plus simple est celle qui est donnee parl’exemple 8.4.4. Elle conduit a prelever quatre echantillons d’environ 35 poulets.

d Pour disposer d’informations plus precises, il y a lieu de tenir compte du nombrede populations comparees et de la repartition supposee des moyennes.

Le tableau 9.4.1 donne, pour les quatre repartitions theoriques envisagees(I a IV), les valeurs suivantes du parametre ∏0 :

∏0 = 0,500 (10)/13 = 0,38 , ∏0 = 0,433 (10)/13 = 0,33 ,

∏0 = 0,373 (10)/13 = 0,29 et ∏0 = 0,354 (10)/13 = 0,27.

Ces valeurs peuvent egalement etre trouvees, de maniere approchee, sur l’axe ∏0

de la figure 9.4.1, en joignant par des segments de droite le point :

δr/cv = 10/13 = 0,77,

et les points I.4 , II.4 , III.4 et IV.4 .

La figure 9.4.1 permet ensuite de determiner les effectifs necessaires en vued’atteindre l’objectif poursuivi, en lisant sur l’axe des ordonnees les valeurs n quicorrespondent, pour la courbe β = 0,1 et p = 4 , aux differentes valeurs de ∏0 .On obtient ainsi, approximativement, un effectif egal a 25 dans le cas le plus fa-vorable (I), a 50 dans le cas le plus defavorable (IV), et a 35 et 45 dans les casintermediaires (II et III).

L’observation de quatre lots constitues chacun d’une quarantaine de pouletsserait donc une solution vraisemblablement satisfaisante. On remarquera aussi

9.4.4 PUISSANCE ET NOMBRES D’OBSERVATIONS 275

que ces resultats confirment le fait que la solution simple deduite du cas de deuxmoyennes (n = 35) est bien une solution approximative intermediaire.

Utilisee en sens inverse, la figure 9.4.1 permet egalement de determiner desvaleurs de δr (ou δ), en fonction des effectifs n . Pour des lots de 20 poulets parexemple, et toujours avec un risque de deuxieme espece egal a 0,1 , la valeur duparametre ∏0 serait egale a 0,43 et le rapport δr/cv se situerait approximativemententre 0,86 et 1,22 . A ces deux valeurs extremes, correspondraient des differen-ces δr egales respectivement a 11 et 16 %. On pourrait donc esperer mettre ainsien evidence, au niveau de signification 0,05 et avec une probabilite egale a 0,9 ,d’eventuelles differences de poids de l’ordre de 12 a 15 % seulement.

En utilisant les lignes pointillees de la figure 9.4.1 (β = 0,5), on pourrait aussimontrer que d’eventuelles differences de poids de l’ordre de 8 a 9 % seraient alorsmises en evidence dans un cas sur deux.b

Exemple 9.4.3. Estimation de la hauteur moyenne des arbres d’un ensemble deforets : determination des nombres d’observations.

Pour illustrer ce qui a trait a l’echantillonnage stratifie, nous reprenons egale-ment les donnees de l’exemple 9.3.4.

Si, pour l’ensemble de forets considere dans cet exemple, on souhaite estimerla hauteur moyenne des arbres avec une marge d’erreur egale a 2 % (soit parexemple une erreur de 0,5 m pour une hauteur moyenne de 25 m), avec un degrede confiance egal a 0,95 , et si le coefficient de variation a l’interieur des stratespeut etre considere comme etant de l’ordre de 7 a 8 %, le nombre d’observationsa realiser serait approximativement :

n ' 4 (7,5/2)2 = 56 .

Dans l’hypothese d’une egalite des variances a l’interieur des differentes strates,ces 56 observations devraient en outre etre reparties au prorata de l’etendue desstrates, soit par exemple, pour trois strates representant respectivement 35 , 40 et25 % de l’etendue totale, respectivement 20 , 22 et 14 observations.

9.4.4 La determination des nombres d’observationsdans le cas du modele aleatoire

1◦ Nous ne considererons les questions de determination des nombres d’obser-vations, dans le cas du modele aleatoire d’analyse de la variance a un critere declassification, que dans l’optique de l’echantillonnage a deux degres et pour deseffectifs n egaux. La determination des effectifs doit alors se faire a chacun desdeux degres.

2◦ Comme nous l’avons signale anterieurement (§ 9.3.4.6◦), la variance dela moyenne generale estimee par echantillonnage a deux degres est egale a la

276 ANALYSE DE LA VARIANCE A UN CRITERE 9.4.4

quantite (nσ2A + σ2)/(np) , c’est-a-dire aussi :

σ2X = σ2

A/p + σ2/(np) .

Pour un meme nombre total np d’observations et pour autant que σ2A soit different

de zero, cette variance est d’autant plus petite que p est grand, et donc que n estpetit.

On doit en consequence choisir, au deuxieme degre de l’echantillonnage, uneffectif n aussi reduit que possible. Un effectif de deux unites du deuxieme degre(n = 2) pour chacune des unites du premier degre est toujours, theoriquement, lasolution la plus favorable. Un tel effectif permet en effet, a la fois, de controler lavalidite des resultats obtenus, en facilitant la recherche d’eventuelles observationsaberrantes, d’estimer l’importance des deux sources de variation, et d’obtenir l’es-timation la plus precise possible de la moyenne generale.

On pourrait etre tente de reduire l’effectif n a la valeur 1 , mais cela consisteraiten fait en un retour a l’echantillonnage completement aleatoire.

3◦ Quand le nombre n d’observations a effectuer pour chacune des unites dupremier degre est ainsi fixe au minimum indispensable, on peut determiner lenombre p d’unites a observer au premier degre. Cette determination peut etrerealisee comme dans le cas de l’echantillonnage completement aleatoire (§ 8.2.3),mais en remplacant toutefois la variance σ2 par σ2

A + σ2/n .

Cette derniere quantite est en effet la variance des moyennes observees pourchacune des unites du premier degre.

d 4◦ Le raisonnement suivi ci-dessus ne tient pas compte du fait que l’observationdes unites du premier degre peut representer une depense ou un travail important,et est parfois beaucoup plus couteuse, en argent ou en temps, que l’observation desunites du deuxieme degre. S’il en est ainsi, il peut etre interessant de determiner leseffectifs n et p en recherchant, non plus le nombre minimum d’observations np ,mais bien le cout minimum de l’ensemble des operations ou le temps de travailminimum.

Si on designe par c1 le cout relatif a chaque unite du premier degre et par c2

le cout relatif a chaque unite du deuxieme degre, le cout total des p unites dupremier degre et des np unites du deuxieme degre est :

c = c1 p + c2 np = (c1 + c2 n) p .

Pour une precision donnee, mesuree par exemple en termes de variance de lamoyenne generale :

σ2X = (σ2

A + σ2/n)/p ,

on peut ecrire :c = (c1 + c2 n) (σ2

A + σ2/n)/σ2X .

9.4.4 PUISSANCE ET NOMBRES D’OBSERVATIONS 277

On demontre sans difficultes que le minimum de cette fonction de cout corres-pond a :

n =q

(c1/c2) (σ2/σ2A) .

Cette relation permet de calculer l’effectif optimal n relatif au deuxieme degrede l’echantillonnage. Quand cet effectif est fixe, il est possible de determiner commeci-dessus l’effectif p relatif au premier degre.b

Exemple 9.4.4. Estimation de la production fourragere moyenne d’un ensemblede prairies : determination des nombres d’observations.

En ce qui concerne l’estimation de la production moyenne d’un ensemble deprairies, l’exemple 9.3.5 a montre que la substitution de l’echantillonnage a deuxdegres a l’echantillonnage completement aleatoire provoque une perte de precisionconsiderable, la marge d’erreur etant de 0,90 t/ha dans le premier cas et de0,26 t/ha dans le deuxieme cas, pour un meme nombre total d’observations. Cettegrande difference de precision est liee au fait que, dans l’exemple considere, lenombre p d’unites du premier degre est reduit a 3 , le nombre d’unites du deuxiemedegre etant au contraire relativement eleve (n = 5).

On peut facilement observer que la perte de precision aurait ete sensiblementmoins importante, toujours pour un meme nombre total d’observations, si les ef-fectifs avaient ete choisis differemment. En conservant les memes valeurs pour lesdeux composantes de la variance (exemple 9.3.3) :

bσ2A = 0,1006 et bσ2 = 0,1559 ,

on a en effet, pour cinq prairies et trois observations par prairie (p = 5 et n = 3),une marge d’erreur egale a :

2,776p

0,1006/5 + 0,1559/15 = 0,48 t/ha ,

et aussi, pour sept prairies et deux observations par prairie (p = 7 et n = 2),c’est-a-dire un total de 14 observations au lieu de 15 :

2,447p

0,1006/7 + 0,1559/14 = 0,39 t/ha ,

c’est-a-dire des marges reduites de moitie environ, par rapport a la marge d’erreurinitiale (0,90 t/ha).

En supposant que rien ne s’oppose au principe de ne faire que deux observationspar prairie (n = 2), on peut alors s’efforcer de determiner le nombre de prairies aprendre en consideration, en vue d’aboutir a une marge d’erreur egale par exemplea 10 % de la moyenne generale. La variance des moyennes par prairie peut etreestimee a :

0,1006 + 0,1559/2 = 0,1786 ,

278 ANALYSE DE LA VARIANCE A UN CRITERE 9.4.5

ce qui correspond a un coefficient de variation egal a :

100p

0,1786/2,153 = 19,6 ou 20 % .

On en deduit le nombre de prairies que voici :

p ' 4 (20/10)2 = 16 ,

soit un total de 32 observations.Ce resultat n’est toutefois qu’indicatif, car les valeurs des composantes de la

variance n’ont ete estimees qu’avec de tres petits nombres de degres de liberte, etdonc avec une tres faible precision.

d Le fait d’effectuer plus de deux observations par prairie peut etre justifie par uncout eleve de prise en consideration de prairies supplementaires (frais de transportet pertes de temps), par comparaison avec le cout des observations individuelles(frais de prelevement, de sechage et de pesee des echantillons de fourrages).

Si par exemple, le rapport des couts c1/c2 des deux types d’operations etait del’ordre de 5 , le nombre optimal d’observations par prairie serait :

n =p

5 (0,1559/0,1006) = 2,78 ou 3 .

De meme, le rapport des couts devrait etre de l’ordre de 15 a 20 , pour justifier lefait de porter a 5 le nombre d’observations par prairie.b

9.4.5 La comparaison de la sensibilite de deux ou plusieursexperiences

1◦ Un probleme etroitement lie a la notion de puissance de l’analyse de la va-riance est celui de la comparaison de la sensibilite de deux ou plusieurs experiences,faisant intervenir par exemple differentes methodes de mesure ou d’analyse. Le butpoursuivi dans ce cas est de voir si une methode de mesure ou d’analyse s’averesignificativement plus efficace qu’une autre, pour mettre en evidence d’eventuellesdifferences de moyennes.

Nous envisageons cette question en presentant la methode ou le test de Brad-ley et Schumann 28, qui est relatif au cas de deux experiences independantes,realisees dans des conditions identiques.

2◦ Par l’analyse de la variance, chacune des experiences donne naissance a unevaleur Fobs , qui est une mesure de la sensibilite de l’experience en question. Lacomparaison des deux valeurs ainsi obtenues permet de tester l’hypothese d’egalesensibilite, c’est-a-dire l’hypothese d’egalite des deux quantites :

1σ2

pX

i=1

a2i ,

tous les effectifs etant supposes egaux.28 En anglais : Bradley-Schumann’s test of sensitivity.

9.4.5 PUISSANCE ET NOMBRES D’OBSERVATIONS 279

Un test bilateral peut etre realise en calculant le rapport :

wobs = Fmax/Fmin ,

dans lequel Fmin et Fmax designent respectivement la plus petite et la plus grandedes deux valeurs Fobs . Au niveau de signification α , ce rapport doit etre comparea une valeur theorique w1−α/2 et l’hypothese d’egale sensibilite doit etre rejeteequand :

wobs ≥ w1−α/2 .

Les valeurs theoriques w1−α/2 sont donnees notamment par Schumann et Brad-ley [1959], en fonction du niveau de signification choisi, de deux parametres a et b ,qui dependent eux-memes des valeurs Fmin et Fmax , et des nombres de degres deliberte k1 et k2 :

a = k1 (Fmin + Fmax)2±£

8 (Fmin + Fmax − 1)§

et b = k2/2 .

d 3◦ Ce test a ete l’objet de diverses extensions, relatives au cas de plus de deuxexperiences, au cas d’experiences non independantes et au cas du modele aleatoired’analyse de la variance a un critere de classification [Dar, 1962, 1964 ; Schoemanet Schumann, 1969 ; Schumann et Bradley, 1959]. Dans ce dernier cas, il s’agitplus particulierement de tester l’egalite des rapports des composantes de varianceσ2

A/σ2.b

Exemple 9.4.5. Etude morphometrique de grains de sable : comparaison de lasensibilite de deux indices.

Au cours d’une etude relative a la forme de grains de sable, on a comparela sensibilite de differents indices morphometriques, caracterisant la forme plusou moins anguleuse ou arrondie des grains, et par la-meme leur degre d’erosion[Tonnard, 1960]. Nous nous limitons ici a l’examen des resultats relatifs a deuxde ces indices, a savoir ceux de Cailleux et de Kuenen.

Deux echantillons de 25 grains de sable ont ete constitues au hasard et inde-pendamment, pour chacun des 10 types de sable qu’on desirait caracteriser parl’intermediaire de ces indices. Dans chaque cas, un echantillon a ete etudie a l’aided’un indice et l’autre echantillon a l’aide de l’autre indice. Les resultats obtenuspar l’analyse de la variance, apres une transformation logarithmique realisee envue de stabiliser les variances, sont presentes de facon condensee dans le tableau9.4.2.

A premiere vue, l’indice de Cailleux (Fobs = 24,2) semble preferable a celuide Kuenen (Fobs = 18,9), pour mettre en evidence les differences qui existententre les dix types de sable consideres. Le test de Bradley et Schumann permetde controler la validite de cette appreciation.

280 ANALYSE DE LA VARIANCE A UN CRITERE

Tableau 9.4.2. Etude morphometrique de grains de sable : resume des tableauxd’analyse de la variance relatifs aux indices de Cailleux et de Kuenen.

Degres de Indice Cailleux Indice KuenenSources de variation

liberte CM F CM F

Differences entre types de sable 9 1,03832 24,2 *** 0,68918 18,9 ***Differences entre grains de sable 240 0,04296 0,03646

Total 249

On obtient ici :wobs = 24,2/18,9 = 1,28 ,

a = 9 (24,2 + 18,9)2±£

8 (24,2 + 18,9− 1)§

= 49,6 et b = 240/2 = 120 .

Les tables de Schumann et Bradley [1959] donnent approximativement, pourde telles valeurs de a et b :

w0,975 = 1,51 .

La difference entre les deux valeurs Fobs et donc aussi la difference de sensibiliteentre les deux indices envisages ne doivent, en consequence, pas etre considereescomme significatives, au niveau de probabilite 0,05 .

Exercices

⊕ 9.1. Comparez, quant aux differences de moyennes, les observations relatives aux diffe-rentes durees de traitement de l’exercice 4.2.

⊕ 9.2. Quinze veaux ont ete repartis au hasard en trois lots, recevant chacun une alimenta-tion particuliere. Les gains de poids, observes au cours d’une meme periode et exprimesen kg, sont presentes ci-dessous, une donnee etant manquante. Doit-on considerer queles differences de moyennes entre alimentations sont significatives ? Dans l’affirmative,estimez ces differences de moyennes et determinez-en les limites de confiance.

Alimentation 1 : 42,1 , 37,7 , 45,1 , 43,2 ;

alimentation 2 : 45,2 , 54,2 , 38,1 , 48,3 , 55,1 ;

alimentation 3 : 48,3 , 44,1 , 56,9 , 42,2 , 54,0 .

9.3. Quatre echantillons de chocolat, preleves au hasard dans une production importante,ont ete analyses en ce qui concerne leur teneur en lactose, chaque echantillon etant l’objetde trois mesures. En fonction des observations suivantes, exprimees en pourcentages,estimez la variabilite propre aux echantillons (ecart-type entre echantillons) et la variabi-lite analytique (ecart-type entre mesures, pour un meme echantillon), et determinez leslimites de confiance correspondantes.

Echantillon 1 : 8,02 , 8,36 , 8,24 ; echantillon 2 : 7,27 , 7,04 , 7,35 ;

echantillon 3 : 7,38 , 7,52 , 7,69 ; echantillon 4 : 7,99 , 7,79 , 7,98 .

EXERCICES 281

9.4. Dans les conditions de l’exercice 9.2, quel est l’ordre de grandeur du nombre deveaux dont il faudrait disposer pour pouvoir esperer mettre en evidence des differenceseventuelles de croissance en poids de 5 kg ?

9.5. Dix echantillons de fourrage ont ete preleves au hasard dans un silo et chacun d’euxa ete l’objet de quatre determinations de la teneur en calcium. Les 40 observations, expri-mees en pourcentages de la matiere seche, ont ete soumises a l’analyse de la variance a uncritere de classification, et ont conduit notamment a l’obtention d’un carre moyen factorielegal a 0,2961 et un carre moyen residuel egal a 0,00664 . Quelle est, dans ces conditions,l’erreur standard estimee de la moyenne generale des 40 observations ? A quelle valeur del’erreur standard devrait-on s’attendre, dans les memes conditions, si on avait effectue10 prelevements et seulement deux analyses par prelevement, et si on avait effectue 10prelevements et une seule analyse par prelevement ? Combien d’observations devrait-on effectuer, toujours dans les memes conditions, si on souhaitait aboutir a une erreurstandard egale a 0,1 %?

Chapitre 10

L’analyse de la variance adeux criteres de classification

Sommaire

10.1 Introduction10.2 Les modeles croises a effectifs egaux : aspects descriptifs10.3 Les modeles croises a effectifs egaux : aspects inferentiels10.4 Les modeles croises a effectifs inegaux10.5 Les modeles hierarchises10.6 La puissance et la determination des nombres d’observationsExercices

284 ANALYSE DE LA VARIANCE A DEUX CRITERES 10.1

10.1 Introduction

1◦ L’analyse de la variance a deux criteres de classification 1 peut etre conside-ree comme une generalisation de l’analyse a un critere, qui permet de tenir comptesimultanement de deux facteurs sous-jacents, et non plus d’un seul facteur.

Les deux facteurs envisages peuvent etre soit places sur pied d’egalite, soit aucontraire subordonnes l’un a l’autre. Dans le premier cas, les modeles d’analysede la variance sont dits croises 2, alors que dans le deuxieme cas, ils sont ditshierarchises 3. Le cas hierarchique est parfois qualifie aussi de multi-niveaux 4.

Dans les differents cas, on doit egalement faire la distinction entre les modelesfixes, les modeles aleatoires et les modeles mixtes 5. Enfin, une distinction im-portante intervient entre le cas des effectifs egaux, parfois qualifie d’equilibre ouorthogonal, et le cas des effectifs inegaux, parfois qualifie de non equilibre ou nonorthogonal.

Les exemples 10.2.1, 10.3.4 et 10.5.1 sont des illustrations de quelques-unes deces situations.

2◦ Comme pour l’analyse de la variance a un critere de classification, nousconsidererons tout d’abord les aspects descriptifs (§ 10.2), puis les aspects inferen-tiels (§ 10.3) de l’analyse a deux criteres, en nous limitant dans un premier tempsaux modeles croises a effectifs egaux. Nous envisagerons ensuite les modeles croisesa effectifs inegaux (§ 10.4) et les modeles hierarchises (§ 10.5). Nous termineronspar quelques informations relatives a la notion de puissance et a la determinationdes nombres d’observations (§ 10.6).

Nous travaillerons toujours par analogie avec l’analyse de la variance a un cri-tere, ce qui devrait nous permettre de ne pas etre trop long. C’est ainsi que nouseviterons au maximum de donner des demonstrations, en matiere d’esperancesmathematiques et de distributions d’echantillonnage notamment.

3◦ Globalement, les conditions d’application sont, en analyse de la variancea deux criteres de classification, de la meme nature qu’a un critere : populationsnormales et de meme variance, et echantillons aleatoires, simples et independants.Les memes remarques que precedemment peuvent etre formulees ici egalement ace sujet (§ 8.1.2◦ et 9.1.3◦).

A ces conditions de base, s’ajoute parfois une condition d’additivite, que nousdefinirons ulterieurement (§ 10.2.4.2◦).

Comme en analyse de la variance a un critere de classification (exemple 9.3.2),nous illustrerons par un exemple le controle des conditions d’application (exemple10.3.2).

1 En anglais : two-way analysis of variance.2 En anglais : cross-classification.3 En anglais : hierarchical classification.4 En anglais : multilevel analysis.5 En anglais : mixed model, mixed effects model.

10.2.2 MODELES CROISES A EFFECTIFS EGAUX : ASPECTS DESCRIPTIFS 285

d 4◦ Les references bibliographiques mentionnees au paragraphe 9.1.4◦ peuventetre utiles aussi pour completer l’information relative a l’analyse de la variance adeux criteres de classification. Eventuellement, on pourra consulter en outre lespublications relatives au modele lineaire qui sont citees au paragraphe 16.1.5◦.b

10.2 Les modeles croises a effectifs egaux :aspects descriptifs

10.2.1 Principes generaux

Au cours du paragraphe 10.2.2, nous presenterons le modele observe et lesdifferents elements du tableau d’analyse de la variance, en suivant le meme chemi-nement qu’au paragraphe 9.2.2. Nous donnerons ensuite, tres rapidement, quelquesindications relatives a la realisation des calculs (§ 10.2.3) et nous developperonsles notions d’interaction et d’additivite (§ 10.2.4). Nous terminerons par la pre-sentation du cas particulier des echantillons d’une seule observation, dit aussi casd’une observation par cellule 6 (§ 10.2.5).

10.2.2 La decomposition de la variation totale

1◦ Considerons p q echantillons ou series d’observations de meme effectif n ,et designons les observations individuelles par xijk , les indices i , j et k etantrelatifs respectivement aux differentes modalites du premier critere de classification(i = 1 , . . . , p), aux differentes modalites du deuxieme critere de classification(j = 1 , . . . , q), et aux differentes observations d’un meme echantillon ou d’unememe serie (k = 1 , . . . ,n).

A partir de telles donnees, on peut calculer differentes moyennes, a savoirune moyenne pour chacun des echantillons ou series d’observations (i = 1 , . . . , pet j = 1 , . . . , q) :

xij. =1n

nX

k=1

xijk ,

une moyenne pour chacune des modalites de chacun des deux criteres de classifi-cation (i = 1 , . . . , p d’une part, et j = 1 , . . . , q d’autre part) :

xi.. =1

q n

qX

j=1

nX

k=1

xijk =1q

qX

j=1

xij. et x.j. =1

pn

pX

i=1

nX

k=1

xijk =1p

pX

i=1

xij. ,

6 En anglais : one observation per cell.

286 ANALYSE DE LA VARIANCE A DEUX CRITERES 10.2.2

et une moyenne generale :

x... =1

p q n

pX

i=1

qX

j=1

nX

k=1

xijk =1p q

pX

i=1

qX

j=1

xij. =1p

pX

i=1

xi.. =1q

qX

j=1

x.j. .

2◦ On peut alors subdiviser les ecarts par rapport a la moyenne generale endeux, puis en quatre composantes :

xijk − x... = (xij. − x...) + (xijk − xij.)

= (xi.. − x...) + (x.j. − x...) + (xij. − xi.. − x.j. + x...) + (xijk − xij.) .

La premiere decomposition est identique a celle qui a ete realisee en analysede la variance a un critere de classification (§ 9.2.2.3◦). La seconde decomposition,qui constitue le modele observe de l’analyse de la variance a deux criteres de clas-sification, fait apparaıtre deux termes de variation factorielle, relatifs a l’un etl’autre des deux facteurs, un terme dit d’interaction, et un terme de variation re-siduelle. Nous examinerons le terme d’interaction de facon plus precise au coursdu paragraphe 10.2.4.

3◦ Par elevation au carre et sommation pour les np q observations, on obtientensuite l’equation d’analyse de la variance :

pX

i=1

qX

j=1

nX

k=1

(xijk − x...)2 = q npX

i=1

(xi.. − x...)2 + pnqX

j=1

(x.j. − x...)2

+npX

i=1

qX

j=1

(xij. − xi.. − x.j. + x...)2 +pX

i=1

qX

j=1

nX

k=1

(xijk − xij.)2 .

Les deux premieres composantes sont des sommes de carres d’ecarts factorielles,la troisieme est une somme de carres d’ecarts liee a l’interaction, et la quatriemeest une somme de carres d’ecarts residuelle.

En affectant les lettres a et b , respectivement, a chacun des deux criteres declassification, et en designant les differents termes par SCEt , SCEa , SCEb , SCEab

et SCEr , on peut ecrire aussi, de facon simplifiee :

SCEt = SCEa + SCEb + SCEab + SCEr .

4◦ Aux differentes sommes des carres des ecarts, peuvent etre associes desnombres de degres de liberte, qui sont lies par la relation :

p q n− 1 = (p− 1) + (q − 1) + (p− 1) (q − 1) + p q (n− 1) .

10.2.2 MODELES CROISES A EFFECTIFS EGAUX : ASPECTS DESCRIPTIFS 287

Il s’agit de p q n−1 degres de liberte pour la somme totale, puisqu’elle fait intervenirglobalement les p q n observations individuelles, p−1 et q−1 degres de liberte pourles deux sommes factorielles, puisqu’elles sont calculees respectivement a partir dep et de q moyennes, p q (n−1) degres de liberte pour la somme residuelle, puisqu’ellefait intervenir p q echantillons de n observations, et par difference, (p− 1) (q − 1)degres de liberte pour la somme des carres des ecarts de l’interaction.

5◦ Enfin, en divisant les differentes sommes des carres des ecarts par leursnombres de degres de liberte, on obtient les carres moyens CMt , CMa , CMb ,CMab et CMr .

L’ensemble des resultats peut alors etre presente sous la forme d’un tableaud’analyse de la variance (tableau 10.2.1).

Tableau 10.2.1. Tableau d’analyse de la variance a deux criteresde classification, dans le cas des modeles croises a effectifs egaux.

Sources Degres Sommes des carres Carresde variation de liberte des ecarts moyens

Facteur a p− 1 SCEa CMa

Facteur b q − 1 SCEb CMb

Interaction (p− 1) (q − 1) SCEab CMab

Variation residuelle p q (n− 1) SCEr CMr

Totaux p q n− 1 SCEt

Exemple 10.2.1. Comparaison de trois types de sondes dans deux types de sols :analyse de la variance.

Au cours d’une etude relative aux problemes d’echantillonnage du sol, on acompare, dans plusieurs types de sols, differents types de sondes destinees a prele-ver des echantillons de terre, en effectuant chaque fois diverses analyses chimiques[Hanotiaux, 1966]. On s’interesse principalement aux differences qui pourraientexister d’un type de sondes a l’autre et aux interferences eventuelles des types desondes avec les types de sols.

Le tableau 10.2.2 est relatif a deux types de sols, a trois types de sondes,et aux teneurs en P2O5 , exprimees en milligrammes par 100 grammes de terreseche, chacune des combinaisons sol-sonde ayant ete l’objet de quatre preleve-ments independants les uns des autres. Ce tableau presente a la fois les donneesinitiales xijk , et les moyennes par type de sols et type de sondes xij. , par typede sols xi.. , par type de sondes x.j. , et generale x... , toutes les moyennes etantvolontairement calculees avec une precision quelque peu abusive.

Le tableau 10.2.3 donne les resultats de l’analyse de la variance, sous l’angledescriptif. Ce tableau peut etre obtenu a l’aide de l’un ou l’autre logiciel statistiqueou selon la procedure qui sera l’objet du paragraphe 10.2.3.

288 ANALYSE DE LA VARIANCE A DEUX CRITERES 10.2.2

Tableau 10.2.2. Teneurs en P2O5 , en mg par 100 g de terre seche, et moyennesobservees, pour deux types de sols et trois types de sondes.

Sonde 1 Sonde 2 Sonde 3(j = 1) (j = 2) (j = 3)

43 41 42Sol 1 45 42 44

(i = 1) 46 43 4653 44 48

40 35 37Sol 2 40 37 39

(i = 2) 40 40 4043 40 40

xij. xi..

Sol 1 46,75 42,50 45,00 44,75Sol 2 40,75 38,00 39,00 39,25

x.j. 43,75 40,25 42,00 42,00(x...)

Tableau 10.2.3. Comparaison de trois types de sondes dans deux types de sols :tableau partiel d’analyse de la variance (aspects descriptifs).

Sources Degres Sommes des carres Carresde variation de liberte des ecarts moyens

Types de sols 1 181,5 181,5Types de sondes 2 49,0 24,5Interaction 2 3,0 1,5Variation residuelle 18 112,5 6,25

Totaux 23 346,0

Ce tableau met immediatement en evidence une composante particulierementimportante liee aux types de sols et basee sur les ecarts :

x1.. − x... = 2,75 et x2.. − x... = − 2,75 .

De meme, la composante, moins importante, relative aux types de sondes faitintervenir les ecarts :

x.1. − x... = 1,75 , x.2. − x... = − 1,75 et x.3. − x... = 0,00 .

Nous completerons ulterieurement cette interpretation (exemple 10.3.1).

10.2.3 MODELES CROISES A EFFECTIFS EGAUX : ASPECTS DESCRIPTIFS 289

10.2.3 La realisation de l’analyse de la variance

1◦ Comme pour un critere de classification (§ 9.2.2.7◦), l’analyse de la variancea deux criteres de classification est realisee le plus souvent a l’aide de logicielsqui font appel a des commandes de type ✭✭ anova ✮✮ ou ✭✭ glm ✮✮. Mais les differentessommes des carres des ecarts peuvent eventuellement etre determinees aussi demaniere ✭✭ manuelle ✮✮, par le calcul de sommes de carres dont on doit soustraire destermes correctifs.

Dans cette optique, nous designerons par Xij. et SCEij , respectivement, lessommes et les sommes des carres des ecarts relatives aux differentes series d’obser-vations, et aussi par Xi.. , X.j. et X... les sommes relatives aux differentes modalitesdes deux criteres de classification et la somme generale de toutes les observations.

2◦ Les differentes sommes des carres des ecarts peuvent alors etre obtenues al’aide des relations suivantes, qui generalisent celles que nous avons presentees auparagraphe 9.2.3 :

SCEt =pX

i=1

qX

j=1

nX

k=1

x2ijk −X2

.../(p q n) , SCEa =1

q n

pX

i=1

X2i.. −X2

.../(p q n) ,

SCEb =1

pn

qX

j=1

X2.j. −X2

.../(p q n) et SCEr =pX

i=1

qX

j=1

SCEij ,

la somme des carres des ecarts relative a l’interaction pouvant etre calculee pardifference.

Exemple 10.2.2. Comparaison de trois types de sondes dans deux types de sols :realisation de l’analyse de la variance.

Pour les donnees du tableau 10.2.2, les differentes sommes sont :

X11. = 187, X12. = 170 , X13. = 180 , X21. = 163 , X22. = 152 , X23. = 156 ,

X1.. = 537, X2.. = 471 , X.1. = 350 , X.2. = 322 , X.3. = 336 , X... = 1.008 .

Calculees selon les principes habituels, les sommes des carres des ecarts relativesaux six series d’observations sont aussi :

SCE11 = 56,8 , SCE12 = 5,0 , SCE13 = 20,0 ,

SCE21 = 6,8 , SCE22 = 18,0 , SCE23 = 6,0 .

La somme des carres des 24 observations individuelles est egale a 42.682 , et onobtient alors tres facilement le contenu du tableau 10.2.3 a l’aide des differentesrelations donnees ci-dessus.

290 ANALYSE DE LA VARIANCE A DEUX CRITERES 10.2.4

10.2.4 Les notions d’interaction et d’additivite

1◦ Les termes d’interaction 7, a savoir xij.− xi..− x.j. + x... , apparaissent toutnaturellement dans le modele observe d’analyse de la variance a deux criteres declassification, lorsqu’on veut equilibrer ce modele apres y avoir fait figurer les ecartsfactoriels et residuel xi.. − x... , x.j. − x... et xijk − xij. (§ 10.2.2.2◦).

Ces termes d’interaction sont nuls quand les differences liees a l’action d’un desdeux facteurs ne dependent pas de l’autre facteur, c’est-a-dire quand, par exemple,les ecarts xij.− x.j. , relatifs au premier facteur, sont independants des modalites jdu deuxieme facteur. En effet, quand ces ecarts ne dependent pas de j , ils sont tousegaux entre eux, pour chaque valeur de i , et donc egaux aussi a leur moyenne :

xi1. − x.1. = . . . = xij. − x.j. = . . . = xiq. − x.q. = xi.. − x... .

On a alors, pour tout i et tout j :

xij. − xi.. − x.j. + x... = 0 .

De meme, les termes d’interaction sont nuls quand les ecarts xij.− xi.. , relatifsau deuxieme facteur, sont independants de i , c’est-a-dire du premier facteur. Enoutre, ces deux conditions de nullite des termes d’interaction sont strictementequivalentes, la premiere entraınant toujours la seconde et reciproquement.

Quand tous les termes d’interaction xij.− xi..− x.j. + x... sont nuls, on dit quel’interaction est nulle ou qu’il n’y a pas d’interaction.

2◦ Dans ce cas, on peut aussi ecrire que, pour tout i et tout j :

xij. − x... = (xi.. − x...) + (x.j. − x...) ,

c’est-a-dire que l’effet conjoint des deux facteurs est egal a la somme de leurs deuxeffets individuels. Le modele d’analyse de la variance est alors dit additif 8.

La notion de non-interaction, ou d’absence d’interaction, se confond donc aveccelle d’additivite 9, de meme que la notion d’interaction, ou de presence d’uneinteraction, se confond avec celle de non-additivite 10.

3◦ Quand certains des termes d’interaction ne sont pas nuls, et surtout dansle cas particulier 2× 2 (p = q = 2), on parle parfois de synergie ou d’antagonisme,selon que l’interaction est positive ou negative.

Si par exemple, l’apport simultane d’une fumure azotee et d’une fumure potas-sique provoque, par comparaison avec un temoin sans engrais, un accroissementde rendement superieur a la somme des accroissements de rendement qui seraient

7 En anglais : interaction.8 En anglais : additive model.9 En anglais : additivity.

10 En anglais : non-additivity.

10.2.4 MODELES CROISES A EFFECTIFS EGAUX : ASPECTS DESCRIPTIFS 291

lies, separement, aux deux fumures, on peut dire qu’il y a synergie entre les deuxfumures.

Si au contraire, l’accroissement de rendement lie a la double fumure est infe-rieur a la somme des accroissements de rendement lies aux deux fumures simples,on peut dire qu’il y a un certain antagonisme entre les fumures.

d 4◦ La notion d’interaction et son interpretation sont l’objet d’une bibliographieimportante, dont on peut citer notamment Berrington de Gonzalez et Cox[2007], Corsten et Denis [1990], et Goodman et Haberman [1990].b

Exemple 10.2.3. Comparaison de trois types de sondes dans deux types de sols :absence d’interaction entre les deux facteurs.

A partir des moyennes qui figurent dans la partie inferieure du tableau 10.2.2,on peut facilement calculer les six termes d’interaction, qui sont egaux a :

0,25 , – 0,50 , 0,25 ,

– 0,25 , 0,50 , – 0,25 ,

les deux lignes etant toujours relatives aux deux types de sols et les trois colonnesaux trois types de sondes. On notera que les sommes de ces termes sont toutesnulles, tant horizontalement que verticalement, et bien sur globalement.

Ces valeurs, toutes tres faibles, temoignent de la quasi-absence d’interaction.A peu de chose pres, les differences entre types de sondes sont donc identiquesd’un type de sols a l’autre, et les differences entre types de sols ne dependent pasnon plus des sondes utilisees pour effectuer les prelevements de terre.

Exemple 10.2.4. Etude de l’influence de la duree d’eclairement et de la gibbe-relline sur la croissance en hauteur de Bryophyllum : interaction entre les deuxfacteurs.

En vue de presenter une situation tout a fait differente, nous considerons aussiles resultats de mesures de hauteur effectuees sur 72 individus d’une mousse dugenre Bryophyllum. Ces 72 individus avaient ete affectes au hasard et en nombresegaux (n = 12) a six traitements, correspondant a deux durees d’eclairement(8 h et 16 h d’eclairement par jour) et trois niveaux d’application d’une subs-tance de croissance, la gibberelline, dont on souhaite etudier l’influence (absencede gibberelline, dose 1 et dose 2) [Marcelle, 1969].

Les differentes moyennes, exprimees en millimetres, sont presentees sous formenumerique dans le tableau 10.2.4 et sous forme graphique dans la figure 10.2.1, lesobservations individuelles allant de 52 a 118 mm. Les resultats de l’analyse de lavariance seront discutes ulterieurement (exemple 10.3.3).

Les differences entre les lignes ✭✭ 8 h ✮✮ et ✭✭ 16 h ✮✮ du tableau 10.2.4, de memeque la representation graphique et les termes d’interaction qui pourraient etrecalcules comme dans l’exemple precedent, tout concourt a mettre en evidence uneinteraction tres marquee entre les deux facteurs. La difference de croissance en

292 ANALYSE DE LA VARIANCE A DEUX CRITERES 10.2.4

Tableau 10.2.4. Etude de l’influence de la duree d’eclairement etde la gibberelline sur la croissance en hauteur de Bryophyllum :

hauteurs moyennes observees, en millimetres.

Durees Gibberellinexi..d’eclair. Absence Dose 1 Dose 2

8 h 63,8 102,5 106,7 91,016 h 75,3 93,1 100,3 89,6

x.j. 69,6 97,8 103,5 90,3

Dose 2Dose 1Absence

110

100

90

80

70

60

Gibbérelline

Hau

teur

(mm

)

8 heures

16 heures

Figure 10.2.1. Etude de l’influence de la duree d’eclairement etde la gibberelline sur la croissance en hauteur de Bryophyllum :

representation graphique des hauteurs moyennes observees,en fonction des deux facteurs consideres.

hauteur, due a la difference de duree d’eclairement, est en effet positive et del’ordre de 12 mm, en l’absence de gibberelline, alors qu’elle est negative et del’ordre de 8 mm en moyenne, en presence de gibberelline, pour les deux dosesenvisagees.

On remarquera aussi que ces differences positive et negative se compensenttres largement, puisque la difference marginale liee au facteur durees d’eclairementest quasi nulle (1,4 mm). Il s’agit d’un exemple typique d’antagonisme entre lesdeux facteurs consideres (augmentation de la duree d’eclairement et applicationde gibberelline).

Graphiquement, l’absence d’interaction serait caracterisee par le fait que lesdeux lignes brisees de la figure 10.2.1 seraient confondues, en l’absence d’effet dela duree d’eclairement, ou simplement decalees l’une par rapport a l’autre, maisen conservant le parallelisme de leurs differents segments, en presence d’un effet dela duree d’eclairement. Au contraire, l’intersection des lignes brisees est un indiceflagrant de l’existence d’une interaction.

10.3.1 MODELES CROISES A EFFECTIFS EGAUX : ASPECTS INFERENTIELS 293

10.2.5 Le cas des echantillons d’une seule observation

1◦ Tres souvent, on ne dispose que d’une seule observation (n = 1), pour cha-cune des combinaisons des differentes modalites des deux criteres de classification.

Aucun terme residuel n’apparaıt alors dans le modele observe, puisque lesmoyennes xij. se confondent avec les observations individuelles xij1 . En vue d’al-leger les notations, on peut d’ailleurs supprimer le troisieme indice, devenu super-flu, et supprimer aussi le point qui remplace cet indice dans les symboles relatifsaux moyennes. Par analogie avec le cas general (§ 10.2.2.2◦), on peut ecrire enconsequence :

xij − x.. = (xi. − x..) + (x.j − x..) + (xij − xi. − x.j + x..) .

2◦ De meme, l’equation d’analyse de la variance devient :

SCEt = SCEa + SCEb + SCEab .

Aucune autre modification n’intervient en ce qui concerne les aspects descriptifs del’analyse, si ce n’est le fait que la ligne ✭✭ variation residuelle ✮✮ disparaıt du tableaud’analyse de la variance (tableau 10.2.1), et que le nombre de degres de liberte dela variation totale est egal a p q − 1 , au lieu de p q n− 1 .

d 3◦ Quant a la realisation des calculs, les formules du paragraphe 10.2.3 peuventtoujours etre utilisees, en remplacant eventuellement les symboles Xi.. , X.j. et X... ,par Xi. , X.j et X.. , et en ne faisant pas intervenir de somme de carres d’ecartsresiduelle.b

10.3 Les modeles croises a effectifs egaux :aspects inferentiels

10.3.1 Principes generaux

1◦ Nous consacrerons tout d’abord trois paragraphes distincts aux trois mo-deles croises d’analyse de la variance a deux criteres de classification : le modelefixe, qui correspond au cas ou les deux criteres de classification sont des criteresfixes (§ 10.3.2), le modele aleatoire, qui correspond au cas ou les deux criteres declassification sont des criteres aleatoires, constitues chacun d’une infinite ou unequasi-infinite de modalites (§ 10.3.3), et le modele mixte, qui correspond au cas oules deux criteres de classification sont l’un fixe et l’autre aleatoire (§ 10.3.4). Noussuivrons chaque fois le meme raisonnement que pour l’analyse de la variance a uncritere de classification (§ 9.3.2 et 9.3.3).

A ce stade, nous ne considererons toutefois que le cas general, relatif a desechantillons de plus d’une observation (n > 1). Nous presenterons aussi, a ce

294 ANALYSE DE LA VARIANCE A DEUX CRITERES 10.3.2

propos, un tableau recapitulatif accompagne d’un certain nombre de commentaires(§ 10.3.5).

Nous envisagerons ensuite le cas des echantillons d’une seule observation(§ 10.3.6), le probleme particulier des observations successives, realisees sur lesmemes individus a differentes dates ou a differents moments (§ 10.3.7), et lesmethodes non parametriques et robustes (§ 10.3.8).

d 2◦ D’autres modeles que ceux auxquels nous venons de faire allusion ontegalement ete proposes, en vue de tenir compte notamment d’effets multiplica-tifs et non plus additifs, et de nombres de modalites finis et non plus infinis ouquasi infinis, pour certains criteres de classification aleatoires [Dias et Krza-nowski, 2003 ; Gauch et al., 2008 ; Sabaghnia et al., 2008 ; Searle et Fawcett,1970]. Il s’agit en particulier des modeles a effets principaux additifs et interac-tion multiplicative 11, utilises notamment dans l’etude des interactions genotype-environnement 12.b

10.3.2 Le modele fixe : echantillons de plusieurs observations

1◦ Si on suppose que les p q series d’observations dont il a ete question auparagraphe 10.2.2.1◦ proviennent de p q populations, on peut designer les moyennesde ces populations par mij . On peut en deduire aussi les moyennes suivantes,relatives aux differentes modalites des deux criteres de classification :

mi. =1q

qX

j=1

mij et m.j =1p

pX

i=1

mij ,

ainsi que la moyenne generale :

m.. =1p q

pX

i=1

qX

j=1

mij =1p

pX

i=1

mi. =1q

qX

j=1

m.j .

2◦ Le modele theorique, correspondant au modele observe du paragraphe10.2.2.2◦, s’ecrit alors :

Xijk −m.. = ai + bj + cij + Dijk .

Dans ce modele, les effets principaux ai et bj sont des constantes, de sommesnulles, definies a partir des differentes moyennes :

ai = mi. −m.. et bj = m.j −m.. .

11 En anglais : additive main effects and multiplicative interaction model, AMMI model.12 En anglais : genotype-environment interaction.

10.3.2 MODELES CROISES A EFFECTIFS EGAUX : ASPECTS INFERENTIELS 295

Les termes cij , parfois designes aussi par (ab)ij , sont egalement des constantes,et representent l’interaction des deux criteres de classification. Ces valeurs sontdefinies de la maniere suivante, par analogie avec le modele observe (§ 10.2.2.2◦) :

cij = (ab)ij = mij −mi. −m.j + m.. .

Elles doivent etre interpretees comme precedemment (§ 10.2.4), et en particulier,elles sont egalement de sommes nulles, tant pour les sommations portant sur unindice a la fois, que pour la sommation globale sur les deux indices.

Enfin, les quantites Dijk sont des variables aleatoires qui, dans les conditionsdu paragraphe 10.1.3◦, sont normales, independantes, de moyennes nulles et dememe variance σ2.

3◦ Les hypotheses nulles auxquelles on s’interesse sont ici au nombre de trois.Les deux premieres ont trait a l’absence d’effet des deux facteurs, consideres sepa-rement :

H0 : a1 = a2 = . . . = ap = 0 ou m1. = m2. = . . . = mp.

et H00 : b1 = b2 = . . . = bq = 0 ou m.1 = m.2 = . . . = m.q ,

tandis que la troisieme concerne l’absence d’interaction :

H000 : c11 = c12 = . . . = cpq = 0 .

4◦ Toujours dans les memes conditions que ci-desssus, et par une proceduresemblable a celle que nous avons adoptee dans le cas de l’analyse de la variance aun critere de classification (§ 9.3.5), on peut demontrer que les esperances mathe-matiques des carres moyens sont :

E(CMa) = σ2 +q n

p− 1

pX

i=1

a2i , E(CMb) = σ2 +

pn

q − 1

qX

j=1

b2j ,

E(CMab) = σ2 +n

(p− 1) (q − 1)

pX

i=1

qX

j=1

c2ij et E(CMr) = σ2 .

5◦ Quand les differentes hypotheses nulles sont vraies, les distributions d’echan-tillonnage des sommes des carres des ecarts, divisees par σ2, sont toutes des dis-tributions χ2, independantes les unes des autres et dont les nombres de degres deliberte sont ceux que nous avons donnes au paragraphe 10.2.2.4◦. On peut doncproceder facilement aux differents tests d’hypotheses.

6◦ Pour eviter tout risque d’interpretation erronee au sujet des facteurs prin-cipaux, il est preferable de realiser pour commencer le test relatif a l’interaction.

296 ANALYSE DE LA VARIANCE A DEUX CRITERES 10.3.2

A cette fin, on calcule la quantite :

Fab = CMab/CMr ,

et on rejette l’hypothese H000 , au niveau de probabilite α , quand cette quantite est

trop elevee, c’est-a-dire quand :

P(F ≥ Fab) ≤ α ou Fab ≥ F1−α ,

avec (p− 1) (q − 1) et p q (n− 1) degres de liberte.En l’absence d’interaction, les tests relatifs aux deux criteres de classification

peuvent ensuite etre realises en calculant les valeurs :

Fa = CMa/CMr et Fb = CMb/CMr ,

et en rejetant eventuellement les hypotheses H0 et H00 , dans des conditions sem-

blables, mais avec des nombres de degres de liberte egaux respectivement a p− 1et p q (n− 1) d’une part, q − 1 et p q (n− 1) d’autre part.

En presence d’une interaction significative, il faut au contraire eviter d’effectuerces tests et proceder a une ou plusieurs decompositions alternatives de la sommedes carres des ecarts totale, ainsi que le montre notamment l’exemple 10.3.3. Detelles decompositions peuvent etre considerees comme des cas particuliers d’utili-sations de contrastes (§ 12.2.1) [Schabenberger et al., 2000].

7◦ Comme en analyse de la variance a un critere de classification (§ 9.3.2.8◦),les moyennes observees sont des estimations non biaisees des moyennes theoriquescorrespondantes, de meme que le carre moyen residuel est toujours une estimationnon biaisee de σ2. On peut en deduire, selon les memes principes, des limites deconfiance pour les moyennes, pour les differences de moyennes et pour la variance.

On a par exemple, pour la moyenne relative a une modalite donnee du premierfacteur et pour une difference de deux moyennes relatives a ce facteur :

xi.. ± t1−α/2

pCMr/(q n) et xi.. − xi0.. ± t1−α/2

p2CMr/(q n) ,

la variable t de Student etant une variable a p q (n−1) degres de liberte. Le divi-seur q n qui apparaıt dans les deux cas correspond en fait au nombre d’observationsqui interviennent dans le calcul de chacune des moyennes considerees.

Exemple 10.3.1. Comparaison de trois types de sondes dans deux types de sols :suite de l’analyse de la variance.

Nous poursuivons ici l’analyse de la variance qui a ete l’objet de l’exemple10.2.1, en effectuant les tests d’hypotheses et en calculant les estimations et leslimites de confiance qui s’imposent. En ce qui concerne les tests, le tableau 10.3.1complete le tableau 10.2.1, en en donnant les resultats.

10.3.2 MODELES CROISES A EFFECTIFS EGAUX : ASPECTS INFERENTIELS 297

Tableau 10.3.1. Comparaison de trois types de sondes dans deux types de sols :tableau complet d’analyse de la variance.

Sources Degres Sommes des carres CarresF P

de variation de liberte des ecarts moyens

Types de sols 1 181,5 181,5 29,0 *** 0,0000Types de sondes 2 49,0 24,5 3,92 * 0,039Interaction 2 3,0 1,5 0,24 0,79Variation residuelle 18 112,5 6,25

Totaux 23 346,0

On constate tout d’abord que l’interaction est non significative. Le test confirmedonc la conclusion intuitive de l’exemple 10.2.3, a savoir que les differences entretypes de sondes ne dependent pas des types de sols et vice versa 13.

Par contre, les differences observees sont tres hautement significatives en cequi concerne les types de sols, et juste significatives en ce qui concerne les typesde sondes.

L’estimation et les limites de confiance de la difference existant entre les deuxtypes de sols seraient, pour un degre de confiance egal a 0,95 (table II) :

x1.. − x2.. = 44,75− 39,25 = 5,50 ou 5,5 mg/100 g

et 5,50 ± 2,101p

2 (6,25)/12 = 5,50 ± 2,14 = 3,4 et 7,6 mg/100 g .

Cette information n’est cependant pas essentielle, en regard des objectifs de l’etude(exemple 10.2.1).

La comparaison, plus interessante, des trois types de sondes est un probleme quipeut etre traite notamment par la methode de Newman et Keuls (§ 12.4.3). Cettemethode permet de montrer que les resultats obtenus a l’aide du premier type desondes sont significativement superieurs aux resultats fournis par le deuxieme typede sondes, le troisieme type conduisant a des resultats intermediaires, qui ne sontpas significativement differents des deux autres. La difference entre les moyennesextremes, qui concernent le premier et le deuxieme type de sondes, et les limitesde confiance correspondantes sont (table II) :

x.1. − x.2. = 43,75− 40,25 = 3,50 ou 3,5 mg/100 g

et 3,50 ± 2,101p

2 (6,25)/8 = 3,50 ± 2,63 = 0,9 et 6,1 mg/100 g .

13 Ainsi que nous l’avons deja signale dans le ✭✭ mode d’emploi ✮✮ qui suit la table des matieres, lapresence simultanee d’asterisques et de valeurs de probabilites dans certains tableaux d’analysede la variance ne s’impose absolument pas. Nous faisons cependant figurer ces deux types dementions en parallele, afin de permettre au lecteur de comparer les deux approches et d’enadopter l’une ou l’autre en pleine connaissance de cause.

298 ANALYSE DE LA VARIANCE A DEUX CRITERES 10.3.2

Exemple 10.3.2. Comparaison de trois types de sondes dans deux types de sols :controle des conditions d’application de l’analyse de la variance.

A titre d’exemple, nous procedons une nouvelle fois de facon assez detaillee aucontrole des conditions d’application de l’analyse de la variance, dans le cas quenous venons d’envisager (exemple 10.3.1). Nous considerons ce controle dans l’op-tique que nous avons presentee anterieurement (exemple 9.3.2), a savoir un rapideexamen des donnees initiales, un controle de la normalite, une identification deseventuelles observations aberrantes, et un controle de l’egalite des variances.

L’examen des donnees initiales ne met en evidence aucune anomalie flagrante(tableau 10.2.2).

Le controle de la condition de normalite peut etre realise par le calcul desresidus ou des residus reduits de l’analyse de la variance, et la preparation d’undiagramme de probabilite relatif a ces residus (figure 10.3.1). Ce diagramme estglobalement lineaire, a l’exception dans une certaine mesure d’une valeur extremeparticulierement elevee.

3210-1-2

2

1

0

-1

-2

Résidus réduits

Qua

ntile

s no

rmau

x

Figure 10.3.1. Comparaison de trois types de sondes dans deux types de sols :diagramme de probabilite relatif aux residus reduits de l’analyse de la variance

a deux criteres de classification.

Le residu suspect est egal a 6,25 et correspond a la valeur observee de 53 mgde P2O5 par 100 g de terre seche (x114). La valeur reduite de ce residu est egalea 2,89 , et au sens de la methode de Grubbs, depasse le maximum admissible auniveau de probabilite 0,05 (table VI) :

(d0max)0,975 = 2,754 ou 2,75 .

Cette valeur ne depasse toutefois pas la valeur limite 3,049 ou 3,05 , relative auniveau de probabilite 0,01 .

Enfin, le controle de l’egalite des variances peut etre realise par la methodede Levene (§ 7.5.3), c’est-a-dire par l’analyse de la variance relative aux valeursabsolues des residus ou des residus reduits. Cette analyse se presente exactement

10.3.2 MODELES CROISES A EFFECTIFS EGAUX : ASPECTS INFERENTIELS 299

comme celle de l’exemple 10.3.1 (tableau 10.3.1) et donne les valeurs suivantes desvariables F de Fisher-Snedecor :

Fa = 1,69 , Fb = 0,66 et Fab = 2,96 .

Pour les memes nombres de degres liberte que precedemment, les probabilitescorrespondantes sont respectivement egales a 0,21 , 0,53 et 0,077. Aucune anomaliesignificative n’apparaıt donc a ce sujet.

La seule question qui se pose est celle de savoir s’il y a lieu d’ecarter ou nonla valeur 53 de l’analyse finale. En l’absence d’elements objectifs, resultant d’unretour a l’origine de cette valeur (controle de la localisation du prelevement del’echantillon de terre concerne, recherche d’eventuelles anomalies observees lors dela preparation de l’echantillon ou de la realisation de l’analyse chimique, recherched’eventuelles erreurs de transcription, etc.), nous aurions tendance a conservercette valeur.

On pourrait nous retorquer que, dans un autre cas, nous avons preconise aucontraire l’elimination de valeurs aberrantes, sans aucune base objective exterieureaux donnees observees elles-memes (exemple 3.6.2). Il faut noter que les anomaliesconstatees etaient beaucoup plus importantes dans ce cas, les ecarts reduits maxi-mums observes depassant non seulement la limite relative au niveau de probabilite0,05 , mais aussi, tres largement, la limite relative au niveau de probabilite 0,01 .

Nous reviendrons ulterieurement sur ce probleme, en montrant quelle peutetre l’influence de la valeur suspecte sur les resultats de l’analyse de la variance(exemple 10.4.1).

d Nous avons signale anterieurement que le recours aux valeurs limites de latable VI ne constitue qu’une solution approchee, surtout pour des effectifs aussireduits que ceux qui sont consideres ici (§ 3.5.3.4◦). Pour mesurer la qualite decette approximation, on peut noter que les valeurs limites exactes, donnees parLund [1975] ou calculees a l’aide de la relation du paragraphe 3.5.3.4◦, sont 2,80et 3,09 , au lieu de 2,75 et 3,05 .

De meme, l’utilisation de la methode de Levene, avec des nombres de degresde liberte non corriges, est aussi une approximation, qui ne prete toutefois pas aconsequence (§ 7.5.3.3◦).b

Exemple 10.3.3. Etude de l’influence de la duree d’eclairement et de la gibbe-relline sur la croissance en hauteur de Bryophyllum : analyse de la variance.

Le tableau 10.3.2 presente les resultats de l’analyse de la variance relativeau probleme que nous avons evoque, en matiere d’interaction, dans le cadre del’exemple 10.2.4. Comme l’examen des moyennes nous l’avait fait supposer, cetableau met en evidence une interaction tres significative entre les facteurs dureesd’eclairement et gibberelline.

Une telle conclusion relative a l’interaction enleve toute valeur aux tests quipourraient etre realises globalement pour chacun des deux facteurs principaux. La

300 ANALYSE DE LA VARIANCE A DEUX CRITERES 10.3.2

Tableau 10.3.2. Etude de l’influence de la duree d’eclairement etde la gibberelline sur la croissance en hauteur de Bryophyllum :

premier tableau d’analyse de la variance.

Degres S. des carres CarresSources de variation F P

de liberte des ecarts moyens

Durees d’eclairement 1 36 36 0,48 0,49Gibberelline 2 15.829 7.915 105 *** 0,0000Interaction 2 1.530 765 10,1 *** 0,0001Variation residuelle 66 4.988 75,6

Totaux 71 22.383

presence d’une interaction significative implique en effet que l’action de chacun desfacteurs depend des modalites prises en consideration pour l’autre facteur. L’in-fluence de chacun des facteurs doit alors etre envisagee de maniere separee pourchacune des modalites de l’autre facteur.

Dans cette optique, on peut construire le tableau 10.3.3, qui presente deuxsubdivisions alternatives de la somme des carres des ecarts totale.

Tableau 10.3.3. Etude de l’influence de la duree d’eclairement etde la gibberelline sur la croissance en hauteur de Bryophyllum :

deuxieme tableau d’analyse de la variance.

Degres S. des carres CarresSources de variation F P

de liberte des ecarts moyens

Durees d’eclairement 1 36 36Gibberelline / 8 heures 2 13.389 6.694 88,6 *** 0,0000Gibberelline / 16 heures 2 3.970 1.985 26,3 *** 0,0000Variation residuelle 66 4.988 75,6

Gibberelline 2 15.829 7.915Eclairement / absence 1 793 793 10,5 ** 0,0019Eclairement / dose 1 1 532 532 7,04 ** 0,010Eclairement / dose 2 1 241 241 3,18 0,079Variation residuelle 66 4.988 75,6

Totaux 71 22.383

Dans la premiere partie de ce tableau, on retrouve tout d’abord les deux lignesdu tableau 10.3.2 qui sont relatives au facteur durees d’eclairement et a la variationresiduelle.

Les lignes qui concernent le facteur gibberelline et l’interaction ont par contreete regroupees, puis subdivisees d’une autre maniere. La ligne ✭✭ gibberelline /8 heures ✮✮ est relative a l’influence de la gibberelline pour la duree d’eclairement

10.3.2 MODELES CROISES A EFFECTIFS EGAUX : ASPECTS INFERENTIELS 301

de 8 heures. Elle correspond a ce que serait la ligne ✭✭ gibberelline ✮✮ dans le cas d’uneanalyse de la variance a un critere de classification limitee aux seules informationsrelatives a la duree d’eclairement de 8 heures.

La ligne ✭✭ gibberelline / 16 heures ✮✮ caracterise de la meme maniere l’influencede la gibberelline pour la duree d’eclairement de 16 heures.

Inversement, le regroupement des lignes ✭✭ durees d’eclairement ✮✮ et ✭✭ interac-tion ✮✮ du tableau 10.3.2 et la subdivision des totaux ainsi obtenus en trois com-posantes permettent d’obtenir les trois lignes centrales de la deuxieme partie dutableau 10.3.3. Ces trois lignes mettent en evidence l’importance du facteur dureesd’eclairement, separement, pour les trois niveaux d’application de gibberelline (ab-sence de gibberelline, dose 1 et dose 2).

Il apparaıt ainsi clairement que la gibberelline a une influence tres hautement si-gnificative pour les deux durees d’eclairement, et que la duree d’eclairement n’inter-vient de facon significative qu’en l’absence de gibberelline et pour la dose inferieurede cette substance de croissance. Nous affinerons encore cette interpretation aucours de l’exemple 12.2.1, en utilisant alors la notion de contraste.

d Le tableau 10.3.4 donne en outre les totaux relatifs aux differents traitementset groupes de traitements, a raison de 12 observations pour chacune des cellules dela partie centrale du tableau, et respectivement 36 et 24 observations pour chacunedes lignes et chacune des colonnes du tableau. Ces totaux, qui correspondent auxmoyennes presentees dans le tableau 10.2.4, permettent de bien comprendre, si onle souhaite, l’origine des differents elements qui figurent dans le tableau 10.3.3.

Tableau 10.3.4. Etude de l’influence de la duree d’eclairement etde la gibberelline sur la croissance en hauteur de Bryophyllum :

totaux relatifs aux differents traitements, en millimetres.

Durees GibberellineXi..d’eclair. Absence Dose 1 Dose 2

8 h 766 1.230 1.280 3.27616 h 904 1.117 1.204 3.225

X.j. 1.670 2.347 2.484 6.501

En ce qui concerne le facteur gibberelline, on a successivement, selon la proce-dure indiquee au paragraphe § 9.2.3.4◦ :

(7662 + 1.2302 + 1.2802)/12− 3.2762/36 = 13.389

et (9042 + 1.1172 + 1.2042)/12− 3.2252/36 = 3.970 .

On peut verifier que le total de ces deux composantes est bien egal au total deslignes du tableau 10.3.2 relatives au facteur gibberelline et a l’interaction.

302 ANALYSE DE LA VARIANCE A DEUX CRITERES 10.3.3

Quant au facteur durees d’eclairement, on a par exemple, pour la premierecolonne du tableau 10.3.4 :

(7662 + 9042)/12− 1.6702/24 = 793 .b

10.3.3 Le modele aleatoire : echantillons de plusieursobservations

1◦ Dans le cas du modele aleatoire, on considere une double infinite ou quasi-infinite de populations et, en vue de comparer les moyennes de ces populations,on realise un echantillonnage a deux degres, semblable a celui dont il a ete ques-tion au paragraphe 9.3.1.1◦. On choisit tout d’abord au hasard p q populations(unites du premier degre), correspondant a p variantes du premier critere de clas-sification et q variantes du deuxieme critere de classification. On choisit ensuite,independamment dans chacune de ces p q populations, un echantillon d’un effectifque nous supposerons constant et egal a n (unites du deuxieme degre).

Tel pourrait etre le cas par exemple si on souhaitait chiffrer, simultanement,l’importance des ecarts entre les resultats obtenus a l’aide de differents appareilsde mesure d’un meme type et par differents operateurs susceptibles d’utiliser cesappareils. On pourrait alors choisir au hasard, d’une part, p exemplaires de l’appa-reil auquel on s’interesse, et d’autre part, q operateurs, auxquels on demanderaitd’effectuer chacun un meme nombre n de mesures a l’aide de chacun des appareils.

2◦ Dans ces conditions, les moyennes theoriques relatives aux populations quisont l’objet d’observations doivent etre considerees comme aleatoires. Nous lesdesignerons par Mij , Mi. et M.j .

Dans l’exemple qui vient d’etre considere, Mij serait la moyenne theoriquede l’ensemble des mesures qui pourraient etre realisees par l’operateur j a l’aidede l’appareil i , Mi. serait la moyenne theorique de l’ensemble des mesures quipourraient etre realisees a l’aide de l’appareil i , pour l’ensemble des operateurs,et M.j serait la moyenne theorique de l’ensemble des mesures qui pourraient etrerealisees par l’operateur j , pour l’ensemble des appareils. La moyenne generalede l’ensemble de toutes les mesures qui pourraient etre realisees, quel que soitl’appareil et quel que soit l’operateur, reste une constante, que nous continueronsa designer par m.. .

3◦ En consequence, les effets principaux et les termes d’interaction sont euxaussi aleatoires et deviennent :

Ai = Mi. −m.. , Bj = M.j −m.. et Cij = (AB)ij = Mij −Mi. −M.j + m.. .

Le modele theorique est alors :

Xijk −m.. = Ai + Bj + Cij + Dijk .

10.3.3 MODELES CROISES A EFFECTIFS EGAUX : ASPECTS INFERENTIELS 303

En plus des conditions definies au paragraphe 10.1.3◦, on doit supposer que lesvariables aleatoires Ai , Bj et Cij sont toutes normales, independantes les unesdes autres, de moyennes nulles, et de variances constantes, respectivement egales aσ2

A , σ2B et σ2

C . En raison des hypotheses formulees quant au caractere aleatoire etsimple de l’echantillonnage, ces variables sont egalement independantes des ecartsresiduels Dijk .

4◦ Les trois hypotheses nulles sont dans ces conditions :

H0 : σ2A = 0 , H0

0 : σ2B = 0 et H00

0 : σ2C = 0 .

Comme pour le modele fixe, les deux premieres ont trait, separement, aux deuxcriteres de classification, tandis que la troisieme est relative a l’interaction des deuxcriteres.

Toutefois, une nuance importante doit etre introduite, dans la mesure ou ceshypotheses concernent, non pas seulement les p q populations pour lesquelles desobservations sont disponibles, mais bien la double infinite ou quasi-infinite despopulations considerees au depart. Comme en analyse de la variance a un criterede classification, la nullite de la variance implique dans chaque cas l’egalite desmoyennes de toutes les populations considerees (§ 9.3.3.5◦).

5◦ Les esperances mathematiques des carres moyens sont alors :

E(CMa) = σ2 + nσ2C + q nσ2

A , E(CMb) = σ2 + nσ2C + pnσ2

B ,

E(CMab) = σ2 + nσ2C et E(CMr) = σ2 .

On observe que la composante σ2C , relative a l’interaction, intervient ici, non seule-

ment dans l’esperance mathematique du carre moyen de l’interaction, mais aussidans les esperances mathematiques des deux carres moyens factoriels. Pour s’as-surer de la nullite de σ2

A et de σ2B , il faudra donc comparer les carres moyens

factoriels CMa et CMb , non pas au carre moyen residuel CMr , mais bien au carremoyen de l’interaction CMab .

6◦ Toujours dans les conditions definies ci-dessus, on peut demontrer que,quand les differentes hypotheses nulles sont vraies, les distributions d’echantillon-nage des sommes des carres des ecarts, divisees par σ2, sont des distributions χ2,independantes les unes des autres et de memes nombres de degres de liberte queprecedemment.

7◦ En fonction de tout ce qui vient d’etre dit, le test de l’hypothese H000 , relative

a l’interaction, doit etre realise comme dans le cas du modele fixe (§ 10.3.2.6◦).Les tests relatifs aux deux autres hypotheses doivent etre realises, par contre, en

304 ANALYSE DE LA VARIANCE A DEUX CRITERES 10.3.4

calculant les valeurs :

Fa = CMa/CMab et Fb = CMb/CMab ,

et en se referant aux distributions F de Fisher-Snedecor a p−1 et (p−1) (q−1)degres de liberte d’une part, q− 1 et (p− 1) (q− 1) degres de liberte d’autre part.

8◦ Il est en outre possible d’estimer comme suit les differentes composantes dela variance :

bσ2A = (CMa − CMab)/(q n) , bσ2

B = (CMb − CMab)/(pn) ,

bσ2C = (CMab − CMr)/n et bσ2 = CMr ,

en se limitant chaque fois aux cas ou les differences de carres moyens sont positives.

Des limites de confiance peuvent egalement etre determinees par des proceduresanalogues a celles que nous avons presentees en analyse de la variance a un criterede classification (§ 9.3.3.7◦).

10.3.4 Le modele mixte : echantillons de plusieursobservations

1◦ Dans le cas du modele mixte, on considere une simple infinite ou quasi-infinite de populations, l’un des criteres de classification, par exemple le premier,possedant un nombre fini p de modalites, et l’autre possedant un nombre infini,ou au moins un tres grand nombre de modalites. Pour comparer les moyennes del’ensemble des populations, on realise egalement un echantillonnage a deux degres,mais au premier degre, l’echantillonnage ne concerne que le critere de classificationqui possede une infinite ou une quasi-infinite de modalites. On choisit au hasard unnombre fini q de ces modalites et on y associe les p modalites du critere fixe. Commeprecedemment, on choisit ensuite, independamment dans chacune des p q popula-tions ainsi definies, un echantillon d’un effectif que nous supposerons egalementconstant et egal a n .

Une telle situation se presente par exemple quand on souhaite comparer lesresultats de p methodes de mesures donnees, qui peuvent etre appliquees a unensemble infini ou quasi infini d’objets ou d’individus. Les methodes de mesuresconstituent un critere de classification fixe, et les objets ou les individus suscep-tibles d’etre mesures un critere de classification aleatoire. On peut alors choisirau hasard un sous-ensemble de q individus a mesurer, et soumettre ces q indivi-dus a chacune des p methodes, en effectuant chaque fois un meme nombre n derepetitions des mesures.

10.3.4 MODELES CROISES A EFFECTIFS EGAUX : ASPECTS INFERENTIELS 305

d On notera que l’expression modele mixte est souvent utilisee pour designer, nonpas specifiquement le modele d’analyse de la variance dont il est question ici, maisbien le modele lineaire mixte, qui permet de prendre en consideration, dans uncontexte beaucoup plus general, un ou plusieurs facteurs fixes et un ou plusieursfacteurs aleatoires (§ 16.5.3).b

2◦ Dans les conditions qui viennent d’etre definies, les moyennes theoriquesMij et M.j , qui sont liees au critere de classification aleatoire, sont des variablesaleatoires, tandis que les moyennes mi. , qui ne dependent que du critere de clas-sification fixe, sont des constantes, tout comme la moyenne generale m.. .

Les effets principaux et les termes d’interaction sont en consequence :

ai = mi. −m.. , Bj = M.j −m.. et Cij = (aB)ij = Mij −mi. −M.j + m.. .

Les uns (ai) sont fixes, et les autres (Bj et Cij) sont aleatoires.

3◦ Le modele theorique s’ecrit donc :

Xijk −m.. = ai + Bj + Cij + Dijk .

Comme dane le cas du modele aleatoire, on suppose, en plus des conditions duparagraphe 10.1.3◦, que les variables aleatoires Bj et Cij sont toutes normales,independantes les unes des autres, de moyennes nulles et de variances constantes,respectivement egales a σ2

B et σ2C . Ces variables sont egalement independantes des

ecarts residuels Dijk .

4◦ Les hypotheses nulles sont alors :

H0 : a1 = a2 = . . . = ap = 0 ou m1. = m2. = . . . = mp. ,

H00 : σ2

B = 0 et H000 : σ2

C = 0 .

Bien qu’il n’y ait pas de changement d’ecriture, par comparaison avec le modelefixe pour la premiere, et par comparaison avec le modele aleatoire pour les deuxdernieres, ces hypotheses n’ont pas exactement la meme signification que prece-demment. La premiere hypothese, par exemple, implique qu’il n’y a pas de dif-ferences de moyennes entre les p modalites du facteur fixe, les moyennes etantrelatives a l’infinite ou la quasi-infinite de modalites du facteur aleatoire, et passeulement aux q modalites pour lesquelles des observations sont realisees.

Dans l’exemple evoque ci-dessus, cette hypothese a trait a l’egalite des resultatsobtenus par les p methodes de mesures, pour l’ensemble suppose infini ou quasi in-fini des individus qui pourraient etre mesures, et pas seulement pour les q individusqui ont ete ou qui seront effectivement l’objet de mesures.

306 ANALYSE DE LA VARIANCE A DEUX CRITERES 10.3.4

5◦ Comme precedemment, on peut demontrer que les esperances mathemati-ques des carres moyens sont dans ces conditions :

E(CMa) = σ2 + nσ2C +

q n

p− 1

pX

i=1

a2i ,

E(CMb) = σ2 + pnσ2B , E(CMab) = σ2 + nσ2

C et E(CMr) = σ2 .

Ces resultats sont intermediaires entre ceux qui concernent le modele fixe etceux qui ont trait au modele aleatoire (§ 10.3.2.4◦ et 10.3.3.5◦), mais ils peuventparaıtre quelque peu surprenants. On constate en effet que le terme aleatoire d’in-teraction σ2

C intervient ici dans l’esperance mathematique du carre moyen relatifau facteur fixe (CMa), mais pas dans l’esperance mathematique du carre moyenrelatif au facteur aleatoire (CMb), alors qu’on aurait pu attendre le contraire. Nousjustifierons intuitivement ces resultats au paragraphe 10.3.5.2◦.

Pour s’assurer de la nullite de tous les ai d’une part, et de σ2B d’autre part,

il faut donc comparer le carre moyen du facteur fixe (CMa) au carre moyen del’interaction (CMab), et le carre moyen du facteur aleatoire (CMb) au carre moyenresiduel (CMr). La comparaison relative au facteur fixe est realisee comme pourle modele aleatoire, tandis que la comparaison relative au facteur aleatoire estrealisee comme pour le modele fixe.

6◦ Rien ne doit etre ajoute a ce qui a ete dit anterieurement au sujet desdistributions d’echantillonnage et du test relatif a l’interaction.

Quant aux tests qui concernent les deux autres hypotheses, ils doivent etreeffectues, en fonction de ce qui vient d’etre expose, en calculant les quantites :

Fa = CMa/CMab et Fb = CMb/CMr ,

et en se referant aux distributions F de Fisher-Snedecor a p−1 et (p−1) (q−1)degres de liberte d’une part, q − 1 et p q (n− 1) degres de liberte d’autre part.

7◦ Des estimations et des limites de confiance peuvent etre calculees pour lesdifferences de moyennes, comme dans le cas du modele fixe (§ 10.3.2.7◦), mais ensubstituant le carre moyen de l’interaction CMab au carre moyen residuel CMr ,et en modifiant en consequence le nombre de degres de liberte de la variable t deStudent.

La composante de variance relative au facteur aleatoire doit, quant a elle, etreestimee comme suit :

bσ2B = (CMb − CMr)/(pn) ,

10.3.4 MODELES CROISES A EFFECTIFS EGAUX : ASPECTS INFERENTIELS 307

tandis que les deux autres composantes de variances peuvent etre estimees commedans le cas du modele aleatoire (§ 10.3.3.8◦).

L’ensemble de ces informations, de meme que celles qui concernent les modelesfixe et aleatoire, peut etre deduit egalement du tableau 10.3.7, qui sera presenteau paragraphe suivant.

d 8◦ Les modeles mixtes d’analyse de la variance a deux et plus de deux criteresde classification sont parfois presentes sous deux formes differentes, l’une dite res-treinte 14 et l’autre dite non restreinte 15 [Hocking, 1973 ; Schwarz, 1993 ; Voss,1999]. La presentation que nous avons adoptee est celle du modele restreint.b

Exemple 10.3.4. Etude de la variabilite des resultats en spectrometrie infra-rouge : analyse de la variance.

Les responsables d’un laboratoire d’analyse chimique par spectrometrie dans leproche infrarouge se sont interesses a la variabilite des resultats qu’ils obtenaient,en matiere de teneurs en proteines du ble. En particulier, ils se sont interrogessur l’importance des differences qui pouvaient decouler des etapes successives depreparation des matieres a analyser. Nous considerons ici le probleme du broyage,en examinant les resultats obtenus a l’aide de trois moulins.

Cinq echantillons de grains de ble ont ete preleves au hasard dans un arrivagerelativement important et divises chacun en trois sous-echantillons. Pour chacundes echantillons, les sous-echantillons ont ensuite ete affectes au hasard aux troismoulins et deux analyses chimiques ont ete effectuees dans chaque cas [Dardenne,1990]. Les tableaux 10.3.5 et 10.3.6 presentent, d’une part les donnees initiales, asavoir les teneurs en proteines, exprimees en pourcentages de la matiere seche, etd’autre part les resultats de l’analyse de la variance.

Tableau 10.3.5. Teneurs en proteines, en pourcentages de la matiere seche,observees pour cinq echantillons de ble broyes a l’aide de trois moulins.

EchantillonsMoulins

1 2 3 4 5

1 13,33 13,62 13,53 13,60 13,9713,43 13,33 13,75 13,44 13,32

2 13,04 13,26 13,49 13,05 13,2813,34 13,49 13,59 13,44 13,67

3 13,24 13,33 13,07 13,47 13,4613,25 13,46 13,33 13,04 13,32

Le modele d’analyse de la variance est un modele mixte, si on considere queles trois moulins constituent un facteur fixe et que les cinq echantillons de ble

14 En anglais : constrained model, restricted model.15 En anglais : unconstrained model, unrestricted model.

308 ANALYSE DE LA VARIANCE A DEUX CRITERES 10.3.4

Tableau 10.3.6. Etude de la variabilite des resultats en spectrometrieinfrarouge : tableau d’analyse de la variance.

Sources Degres Sommes des carres CarresF P

de variation de liberte des ecarts moyens

Moulins 2 0,2925 0,14623 8,70 ** 0,0098Echantillons 4 0,2073 0,05183 1,16 0,37Interaction 8 0,1345 0,01681 0,38 0,92Variation residuelle 15 0,6684 0,04456

Totaux 29 1,3027

constituent un facteur aleatoire. Le modele aurait aussi pu etre aleatoire si, aulieu d’etudier les trois moulins disponibles dans le laboratoire envisage, on avaitconsidere trois moulins choisis au hasard dans une production de moulins dont onaurait voulu etudier l’homogeneite.

Dans l’optique du modele mixte, l’interaction des deux criteres de classificationet les differences entre echantillons sont testees par rapport a la variation residuelle,tandis que les differences entre moulins sont testees par rapport a l’interaction. Lestests mettent uniquement en evidence des differences hautement significatives entreles moulins. Nous completerons ulterieurement cette analyse (exemple 10.3.5).

On remarquera que le carre moyen de l’interaction (0,01681) est inferieurau carre moyen residuel (0,04456), alors qu’on pouvait attendre plus logique-ment une difference se marquant dans l’autre sens, puisqu’en termes d’esperancesmathematiques, le premier est toujours superieur ou egal au second.

Une telle constatation, qui n’a cependant rien d’exceptionnel, peut parfoiscontribuer a mettre en evidence certaines anomalies (valeurs aberrantes de cer-tains residus par exemple). Dans le cas present, aucune anomalie d’aucune sorten’apparaıt cependant.

d On pourra remarquer en outre que les donnees du tableau 10.3.5 sont egalementcelles qui, presentees d’une autre maniere (tableau 7.3.1), nous ont deja servi aillustrer le test de conformite d’un ecart-type, en l’occurrence un ecart-type quicorrespond a l’ecart-type residuel de l’analyse de la variance consideree ici (exemple7.3.1).

D’autre part, dans l’analyse de la variance que nous venons de presenter, nousavons suppose que, pour chaque echantillon (au sens de l’experimentateur) de ble,les deux donnees initiales relatives a chaque moulin constituent un echantillon(au sens du statisticien) aleatoire et simple de deux observations. Cette hypotheserevient a supposer qu’il n’y a pas de difference systematique entre, dans chaquecas, la premiere et la deuxieme observation. On pourrait verifier cette absence dedifference systematique en introduisant, dans l’analyse de la variance, un troisiemefacteur correspondant a l’ordre de realisation des mesures. On se trouverait alors

10.3.5 MODELES CROISES A EFFECTIFS EGAUX : ASPECTS INFERENTIELS 309

dans un cas d’analyse de la variance a trois criteres de classification, avec une seuleobservation par cellule (§ 11.2.4).b

10.3.5 Echantillons de plusieurs observations :tableau recapitulatif et notions complementaires

1◦ Les paragraphes precedents ont montre que la distinction entre les troismodeles croises d’analyse de la variance a deux criteres de classification est essen-tielle, non seulement en ce qui concerne l’interpretation des hypotheses nulles, etdonc les conclusions, mais aussi en ce qui concerne la maniere dont les tests, lesestimations et les determinations de limites de confiance doivent etre realises.

Un tableau recapitulatif fait la synthese de l’ensemble des informations relativesaux esperances mathematiques (tableau 10.3.7). Ce tableau contient en effet, pourles trois modeles, les coefficients des differentes composantes qui interviennent dansles esperances mathematiques des carres moyens.

Tableau 10.3.7. Tableau recapitulatif des esperances mathematiques des carresmoyens, pour les modeles croises a effectifs egaux d’analyse de la variancea deux criteres de classification : echantillons de plusieurs observations.

Carres Modele fixe Modele mixte Modele aleatoiremoyens σ2 (ab)2ij b2

j a2i σ2 σ2

aB σ2B a2

i σ2 σ2AB σ2

B σ2A

CMa 1 + 1 n + 1 n q nCMb 1 + 1 p n 1 n p nCMab 1 + 1 n 1 nCMr 1 1 1

Dans un but d’allegement des notations, les coefficients relatifs aux composan-tes fixes n’ont toutefois pas ete integralement retranscrits, le signe + indiquantseulement que telle ou telle composante intervient dans telle ou telle esperancemathematique, et cela toujours comme une fonction croissante des carres destermes ai , bj , etc. En outre, pour bien mettre en evidence les distinctions entreles differents modeles et pour bien identifier les differentes interactions, nous avonsutilise les notations (ab)ij , σ2

aB et σ2AB , de preference a cij et σ2

C .

Ce tableau permet de reperer facilement, dans chaque cas, les comparaisonsqui doivent etre realisees, en vue de tester la nullite de l’un ou l’autre element,ainsi que la maniere dont les differentes composantes de la variance doivent etreestimees.

2◦ Le fait que les esperances mathematiques puissent conduire a des tests diffe-rents d’un cas a l’autre surprend souvent les utilisateurs de l’analyse de la varian-ce, qui ont tendance a n’y voir qu’une subtilite mathematique, sans justificationpratique. En realite, les differentes procedures ne font que confirmer le bon sens, et

310 ANALYSE DE LA VARIANCE A DEUX CRITERES 10.3.5

c’est pour le modele mixte, dont les tests sont apparemment les plus inattendus,que les resultats deduits du raisonnement mathematique s’expliquent intuitive-ment le mieux.

Reprenons par exemple l’etude des differents types de sondes (exemples 10.2.1et 10.3.1), en supposant qu’on veuille effectuer la comparaison, non pas dans deuxtypes de sols donnes, mais bien dans l’ensemble d’une certaine region. L’etude nepouvant etre realisee en tous les points de la region consideree, qui constituentun ensemble infini, on doit alors choisir un certain nombre de points de faconcompletement aleatoire et, en ces quelques points, on peut effectuer chaque fois unmeme nombre de prelevements de terre a l’aide de chacune des sondes. Le facteursondes est en consequence un facteur fixe et le facteur lieux un facteur aleatoire.Supposons en outre qu’il existe une certaine interaction sondes-lieux, c’est-a-direque les differences entre sondes puissent etre differentes d’un point d’observationa l’autre.

Dans ces conditions, les differences de moyennes observees entre les sondesdependent des lieux qui sont choisis et le facteur lieux intervient donc, par l’in-termediaire de l’interaction, dans l’esperance mathematique du facteur sondes. Parcontre, les differences de moyennes observees entre les lieux ne dependent pas destypes de sondes mis en œuvre, puisque tous les types de sondes sont chaque foispris en compte : le facteur types de sondes n’intervient donc aucunement, memepas indirectement, dans l’esperance mathematique du facteur lieux.

On notera enfin qu’on peut aussi resumer la situation en disant que le choix dela base de comparaison (interaction ou variation residuelle), relative a un facteurdonne, ne depend pas de la nature de ce facteur lui-meme, mais bien de la naturedu facteur qui lui est associe.

3◦ Le fait de comparer un facteur principal avec l’interaction, dans le cas dumodele mixte ou du modele aleatoire, a pour consequence de reduire, souvent demaniere drastique, le nombre de degres de liberte du denominateur de la variable Fcorrespondante. On a en effet toujours :

(p− 1) (q − 1) < p q (n− 1) .

Il peut en resulter une perte importante de puissance des tests et de precision desestimations.

Quand l’interaction n’est pas significative, il est possible de remedier dans unecertaine mesure a cet inconvenient en procedant a un regroupement 16 des termesd’interaction et residuel, de maniere a definir une nouvelle base de comparaisonpour les deux facteurs principaux :

CM0r =

SCEab + SCEr

(p− 1) (q − 1) + p q (n− 1)=

SCEab + SCEr

p q n− p− q + 1.

En l’absence de toute interaction et quel que soit le modele d’analyse de la va-riance, le tableau 10.3.7 montre en effet que les carres moyens CMab et CMr sont

16 En anglais : pooling.

10.3.5 MODELES CROISES A EFFECTIFS EGAUX : ASPECTS INFERENTIELS 311

alors tous deux des estimations non biaisees de σ2 et que c’est par rapport a σ2

que toutes les comparaisons doivent etre realisees.

Le carre moyen CM0r est une moyenne ponderee de CMab et CMr , les coef-

ficients de ponderation etant les nombres de degres de liberte et, en l’absenced’interaction, ce carre moyen constitue la meilleure estimation non biaisee de σ2.

Cette operation de regroupement de deux sources de variation doit cependantetre realisee avec prudence. Une interaction peut en effet etre non significative touten etant caracterisee par un carre moyen qui differe largement du carre moyenresiduel. Une precaution utile consiste a adopter en consequence un niveau de si-gnification relativement eleve (par exemple 0,20 ou 0,25 , voire meme 0,50), pour letest prealable 17 relatif a l’interaction [Hines, 1996 ; Mead et al., 1975 ; Wolde-Tsadik et Afifi, 1980].

d 4◦ Diverses methodes d’estimation des composantes de la variance et de leursrapports, semblables a celles auxquelles nous avons fait allusion au paragraphe9.3.3, existent egalement pour les modeles mixte et aleatoire d’analyse de la va-riance a deux criteres de classification. On peut consulter a ce sujet les publicationsde Lee et Kapadia [1984], et Ting et Graybill [1991], ainsi que, d’une maniereplus generale, les references citees au paragraphe 16.4.5.3◦.b

Exemple 10.3.5. Etude de la variabilite des resultats en spectrometrie infra-rouge : regroupement de deux sources de variation.

Les donnees de l’exemple 10.3.4 permettent d’illustrer l’operation de regroupe-ment de deux sources de variation.

L’interaction n’etant pas significative dans ce cas, puisque son carre moyen estmeme inferieur au carre moyen residuel (tableau 10.3.6), on peut en effet ecrire :

CM0r = (0,1345 + 0,6684)/(8 + 15) = 0,03491 .

On en deduit les nouvelles valeurs suivantes des variables F et les probabilitescorrespondantes :

F 0a = 0,1462/0,03491 = 4,19 et P(F ≥ 4,19) = 0,028 ,

F 0b = 0,05183/0,03491 = 1,48 et P(F ≥ 1,48) = 0,24 ,

respectivement avec 2 et 23 degres de liberte d’une part, 4 et 23 degres de liberted’autre part.

On observe ainsi une certaine reduction du degre de signification des differencesentre les trois moulins, sans aucun changement de conclusion en ce qui concerneles differences entre echantillons.

17 En anglais : preliminary test.

312 ANALYSE DE LA VARIANCE A DEUX CRITERES 10.3.6

On peut egalement determiner sur cette base des limites de confiance pour lesdifferences de moyennes entre moulins, la demi-longueur des intervalles de confian-ce des differences etant, pour un degre de confiance egal a 0,95 et avec 23 degresde liberte en ce qui concerne la variable t de Student (§ 10.3.2.7◦) :

2,069p

2 (0,03491)/10 = 0,17 % .

De meme, on peut eventuellement calculer, si cela presente un interet, des esti-mations de composantes de la variance, a savoir, espectivement pour la variabiliteentre echantillons et pour la variabilite residuelle (§ 10.3.4.7◦) :

bσ2B = (0,05183− 0,03491)/6 = 0,0028 et bσ2 = 0,0349 .

On pourrait aussi exprimer ces composantes en termes d’ecarts-types ou de coef-ficients de variation.

10.3.6 Le cas des echantillons d’une seule observation

1◦ Le cas des echantillons d’une seule observation (n = 1) doit etre considereseparement, car il se distingue a divers points de vue du cas general des echantillonsde plusieurs observations (n > 1).

Dans ce cas particulier, le modele fixe du paragraphe 10.3.2.2◦ devient en effet :

Xij −m.. = ai + bj + cij + Dij .

Ce modele montre que les termes cij et Dij , tous deux identifies par les memesindices i et j , ne peuvent plus etre dissocies.

Quant aux modeles mixte et aleatoire correspondants, ils peuvent etre obtenusde la meme facon en remplacant, selon les cas, ai , bj et cij , par Ai , Bj et Cij .

2◦ Les hypotheses nulles, les esperances mathematiques des carres moyens et lesdistributions d’echantillonnage ne sont pas modifiees, par comparaison avec le casgeneral, si ce n’est bien sur que l’effectif n est toujours egal a l’unite, et que, commepour les aspects descriptifs, tout ce qui a trait a la variation residuelle disparaıt(§ 10.2.5.2◦). Le tableau 10.3.8 resume l’ensemble des informations relatives auxesperances mathematiques, selon le meme principe que le tableau 10.3.7 pour lecas general.

3◦ Ce tableau met tout d’abord en evidence le fait que, quel que soit le mo-dele considere, aucun test n’est possible, selon la procedure habituelle, en ce quiconcerne l’interaction.

Il montre aussi qu’aucun test ne peut etre realise non plus pour les deux criteresde classification dans le cas du modele fixe, ni pour le facteur aleatoire dans le casdu modele mixte, sauf precisement en l’absence d’interaction, c’est-a-dire pour le

10.3.6 MODELES CROISES A EFFECTIFS EGAUX : ASPECTS INFERENTIELS 313

Tableau 10.3.8. Tableau recapitulatif des esperances mathematiques des carresmoyens, pour les modeles croises a effectifs egaux d’analyse de la variance

a deux criteres de classification : echantillons d’une seule observation.

Carres Modele fixe Modele mixte Modele aleatoiremoyens σ2 (ab)2ij b2

j a2i σ2 σ2

aB σ2B a2

i σ2 σ2AB σ2

B σ2A

CMa 1 + 1 1 + 1 1 qCMb 1 + 1 p 1 1 pCMab 1 + 1 1 1 1

modele additif (§ 10.2.4.2◦). Rien n’est modifie par contre pour le facteur fixe dumodele mixte, ni pour les deux criteres de classification du modele aleatoire.

A ce propos, nous voudrions mettre le lecteur en garde contre le fait que, dansle cas envisage ici, certains logiciels statistiques fournissent indistinctement lesrapports F relatifs aux deux criteres de classification, sans emettre aucune reservea leur sujet [Schwarz, 1993].

d 4◦ Plusieurs tests d’absence d’interaction ou tests d’additivite 18 ont ete pro-poses en vue de remedier a la situation qui vient d’etre decrite, en particulier dansle cas du modele fixe [Alin et Kurt, 2006 ; Boik, 1993 ; Kharrati-Kopaei etSadooghi-Alvandi, 2007]. Le test de Tukey 19 est le plus couramment utilise.

Le principe de ce test est de subdiviser la somme des carres des ecarts del’interaction en une composante de non-additivite, a un degre de liberte, et unevariation ✭✭ residuelle ✮✮, a p q−p−q degres de liberte, et de tester ensuite la premierepar rapport a la deuxieme, selon les procedures habituelles. La composante de non-additivite est definie de la maniere suivante :

SCEadd =

µ pX

i=1

qX

j=1

£xij (xi. − x..) (x.j − x..)

§∂2

∑ pX

i=1

(xi. − x..)2∏∑ qX

j=1

(x.j − x..)2∏ .

Le test de signification de cette composante peut etre considere comme un testde signification du coefficient de regression β , qui interviendrait dans un modeleou l’interaction eventuelle cij correspondrait au produit des effets principaux ai

et bj :Xij −m.. = ai + bj + β (ai bj) + Dij .

Si une interaction est presente, il est parfois possible aussi de l’eliminer, ouau moins d’en reduire l’importance, en effectuant l’une ou l’autre transformation

18 En anglais : test of additivity.19 En anglais : Tukey’s test.

314 ANALYSE DE LA VARIANCE A DEUX CRITERES 10.3.6

de variable, qui prend en compte prioritairement cet element, plutot que l’egalitedes variances ou la normalite des distributions [Cressie, 1978 ; Fuchs, 1979 ;Schlesselman, 1973].b

5◦ Tres souvent, le facteur aleatoire du modele mixte est un facteur subsidiaire,qui intervient dans le seul but de rendre plus puissant le test relatif au facteur fixe.Il n’y a alors aucun inconvenient a ne pas pouvoir en tester la signification.

Il en est ainsi par exemple quand on compare diverses methodes ou diversinstruments de mesure, en soumettant aux differentes methodes ou aux differentsinstruments les memes individus, choisis au hasard dans une population donnee,plutot que des individus distincts d’une methode ou d’un instrument a l’autre. Ilen est frequemment ainsi egalement dans le cas des experiences en blocs aleatoirescomplets 20, dites aussi en dispositif stratifie 21, c’est-a-dire des experiences au seindesquelles les individus observes sont reunis en groupes aussi homogenes que pos-sible, tels que des ensembles de parcelles voisines dans un essai en champ [STAT1,§ 2.3.5.2◦ ; Dagnelie, 2003].

6◦ Le test de signification du facteur subsidiaire est alors avantageusementremplace par la determination du gain de puissance lie a ce facteur, en termesd’efficacite relative 22. Le principe de cette determination est le suivant.

Si on n’avait pas tenu compte du facteur subsidiaire individus ou blocs, l’ana-lyse de la variance aurait ete une analyse a un critere de classification. La sommedes carres des ecarts residuelle de cette analyse aurait ainsi pris la place, a la fois,de la somme des carres des ecarts entre individus ou entre blocs SCEb et de lasomme des carres des ecarts de l’interaction SCEab . Le quotient :

(SCEb + SCEab)±£

(q − 1) + (p− 1) (q − 1)§,

c’est-a-dire aussi (SCEb +SCEab)±£

p (q−1)§, est donc l’equivalent du carre moyen

residuel de l’analyse de la variance a un critere de classification.On peut en consequence obtenir une estimation de l’efficacite relative en divi-

sant ce quotient par le carre moyen de l’interaction. En effet, on obtient bien, decette maniere, le rapport des bases de comparaison des deux analyses.

d On notera que le fait de tester ou ne pas tester la signification du facteursubsidiaire, notamment dans le cas des experiences en blocs aleatoires complets,est l’objet d’avis parfois divergents [Gates, 1995 ; Samuels et al., 1991].b

7◦ L’introduction d’un facteur controle subsidiaire, destine a augmenter lasensibilite des comparaisons, est une generalisation du principe du test t par paires(§ 8.5.2).

Il est bon de savoir a cet egard que, dans le cas particulier des echantillons d’uneseule observation, l’analyse de la variance a deux criteres de classification est une

20 En anglais : randomized complete block.21 En anglais : stratified design.22 En anglais : relative efficiency.

10.3.6 MODELES CROISES A EFFECTIFS EGAUX : ASPECTS INFERENTIELS 315

generalisation du test t par paires, au meme titre que l’analyse de la variance a uncritere de classification peut etre consideree comme une generalisation du test trelatif aux echantillons independants (§ 9.3.5.2◦). Les valeurs F sont en effet egales,ici aussi, aux carres des valeurs t correspondantes, tant pour les valeurs observeesque pour les valeurs theoriques.

Il faut noter toutefois que les conditions sous-jacentes, de normalite et d’egalitedes variances, qui sont emises en analyse de la variance sont plus restrictives quecelles qui concernent le test t par paires.

Exemple 10.3.6. Comparaison des resultats obtenus par trois methodes d’analysechimique : analyse de la variance a deux criteres de classification.

Nous avons presente anterieurement les resultats obtenus par trois methodesd’analyse chimique, pour 30 echantillons de matieres fecales, et nous avons comparedeux de ces methodes a l’aide notamment du test t par paires (exemple 8.5.1). Nousnous proposons de comparer ici l’ensemble des trois methodes par l’analyse de lavariance a deux criteres de classification.

Le modele envisage est un modele mixte, si on considere que les trois methodesd’analyse sont des methodes bien definies (critere fixe) et, au contraire, que les30 prelevements de matieres fecales sont representatifs de l’ensemble des preleve-ments qui auraient pu etre soumis a l’analyse (critere aleatoire).

Les resultats de l’analyse de la variance sont donnes dans le tableau 10.3.9. Ilsamenent a conclure a l’existence de differences significatives de moyennes entre lestrois methodes d’analyse, au niveau de probabilite 0,05 .

Tableau 10.3.9. Comparaison des resultats obtenus par trois methodesd’analyse chimique : tableau d’analyse de la variance.

Sources Degres Sommes des carres CarresF P

de variation de liberte des ecarts moyens

Methodes d’analyse 2 35,76 17,88 3,62 * 0,033Prelevements 29 15.341,79 529,03Interaction 58 286,24 4,935

Totaux 89 15.663,79

Il faut noter que, si les valeurs individuelles et la distribution des residus del’analyse de la variance ne presentent aucune anomalie particuliere, la methode deLevene met cependant en evidence une certaine heterogeneite des variances. Cetelement ne met pas en cause la conclusion de l’analyse de la variance, mais devraitinciter a une certaine prudence dans la realisation d’eventuelles comparaisons deuxa deux des moyennes relatives aux trois methodes d’analyse.

On remarquera aussi que le gain de precision, qui resulte du fait que les memesechantillons de matieres fecales ont ete soumis aux trois methodes d’analyse chimi-

316 ANALYSE DE LA VARIANCE A DEUX CRITERES 10.3.6

que, est tres important. Si des echantillons differents avaient ete pris en considera-tion, l’etude statistique des resultats aurait consiste en une analyse de la variancea un critere de classification, dont le carre moyen residuel aurait pu etre :

CMr = (15.341,79 + 286,24)/(29 + 58) = 179,63 .

Comparee au carre moyen de l’interaction, qui sert de denominateur dans l’analysede la variance a deux criteres de classification (CMab = 4,935), cette valeur faitapparaıtre une efficacite relative de la methode adoptee de l’ordre de 36 ou 3.600 %,par rapport a un echantillonnage qui aurait ete independant pour les trois metho-des d’analyse.

Il aurait donc fallu disposer de trois ensembles d’environ 1.100 echantillons etrealiser pres de 3.300 analyses, pour obtenir, avec des echantillons independants,une precision equivalente a celle que fournit l’analyse des 30 memes echantillonspar les trois methodes.

En outre, on peut aussi verifier empiriquement l’equivalence entre l’analyse dela variance relative a deux modalites et le test t par paires. En se limitant auxdeux premieres methodes d’analyse chimique, on obtient en effet une valeur Fobs

egale a 10,4 , avec 1 et 29 degres de liberte, alors que la valeur tobs correspondanteest egale a 3,23 , avec 29 degres de liberte (exemple 8.5.1).

dExemple 10.3.7. Comparaison des resultats obtenus par trois methodes d’analysechimique : test d’additivite.

L’analyse de la variance de l’exemple precedent n’implique pas que la condi-tion d’additivite doit etre satisfaite, puisque le test realise concerne uniquementle facteur fixe d’un modele mixte. Les donnees considerees permettent toutefoisd’illustrer l’emploi du test de Tukey.

A partir des observations initiales (tableau 8.5.1) et des differentes moyennesqu’on peut en deduire, on obtient :

SCEadd = (− 8,2703)2±£

(1,1919) (5.113,9)§

= 0,011 .

Cette somme des carres des ecarts, qui se confond avec le carre moyen correspon-dant, puisqu’elle ne possede qu’un seul degre de liberte, doit etre comparee aucarre moyen residuel obtenu par difference (tableau 10.3.9) :

CMr = (286,24− 0,011)/57 = 5,022 .

La valeur observee de la variable F , a 1 et 57 degres de liberte, est doncquasi nulle, et on peut accepter sans hesiter l’hypothese d’additivite, ou d’absenced’interaction, du modele d’analyse de la variance. Il serait donc possible, dans cecas, de tester la signification des deux criteres de classification, si cela s’averaitnecessaire.b

10.3.7 MODELES CROISES A EFFECTIFS EGAUX : ASPECTS INFERENTIELS 317

10.3.7 L’analyse des observations successives

1◦ Une attention toute particuliere doit etre accordee aux problemes que sou-leve l’analyse des observations successives, effectuees sur les memes individus aplusieurs dates ou a plusieurs moments differents. De telles observations sont aussiqualifiees de mesures repetees ou de donnees longitudinales 23. Il peut s’agir enparticulier de la comparaison de courbes de croissance 24.

L’etude des donnees de ce type est souvent realisee dans l’optique du modelelineaire general et de ses extensions (modele lineaire mixte notamment), dont ilsera question aux paragraphes 16.4 et 16.5. Nous ne presentons ici que quelquesnotions plus elementaires.

2◦ On peut tout d’abord etre tente de considerer le facteur temps comme uncritere de classification supplementaire, dans une analyse de la variance classique.L’analyse serait alors une analyse a deux criteres de classification si on etudie unseul facteur, autre que le facteur temps, a trois criteres de classification si on etudiesimultanement deux facteurs, autres que le facteur temps, etc.

Cette approche n’est cependant pas correcte d’une maniere generale, car lesresidus observes aux differents moments, pour un meme individu, ne sont le plussouvent pas independants les uns des autres.

Ainsi, dans un phenomene de croissance, un individu nettement inferieur a lamoyenne de son groupe a un moment donne est en general inferieur aussi a lamoyenne de son groupe a d’autres moments. Les residus relatifs a un tel individuont donc tendance a etre tous ou presque tous negatifs, un raisonnement analoguepouvant bien sur etre tenu egalement pour tout individu qui serait nettementsuperieur a la moyenne de son groupe.

d Une analyse qui serait realisee de cette facon est parfois assimilee a celle quiconcerne les experiences avec parcelles divisees 25 [Dagnelie, 2003]. Les individusobserves sont alors consideres comme l’equivalent des grandes parcelles, et lesobservations effectuees aux differents moments sur chacun des individus commel’equivalent des petites parcelles (ou sous-parcelles).b

3◦ L’analyse de la variance qui fait intervenir le temps comme un critere declassification supplementaire peut neanmoins etre realisee dans certaines condi-tions ou moyennant certaines adaptations.

d On peut en effet demontrer que l’analyse de la variance reste applicable, enl’absence d’independance des residus, pour autant que certaines conditions, moinsrestrictives que les conditions habituelles, soient satisfaites. Ces conditions sontconnues sous les noms de conditions de symetrie composee ou de sphericite ou de

23 En anglais : successive measurements, repeated measurements, longitudinal data.24 En anglais : growth curve.25 En anglais : split-plot.

318 ANALYSE DE LA VARIANCE A DEUX CRITERES 10.3.7

circularite 26, ou encore conditions de Greenhouse et Geisser ou de Huynh etFeldt 27.

La condition de symetrie composee, par exemple, implique que, pour les dif-ferentes populations qui sont comparees, les matrices de variances et covariancesrelatives aux observations effectuees aux differents moments sont egales entre elles,et telles que d’une part toutes les variances sont egales, et d’autre part toutes lescovariances sont aussi egales.

En outre, quand de telles conditions ne sont pas remplies, il est possible d’ap-porter a l’analyse de la variance certaines corrections, qui consistent en des reduc-tions des nombres de degres de liberte. Ces reductions, auxquelles sont egalementassocies les noms de Geisser et Greenhouse et de Huynh et Feldt, sont fonc-tion du degre de non-sphericite des matrices de variances et covariances [Bathkeet al., 2009 ; Greenhouse et Geisser, 1959 ; Huynh et Feldt, 1970].b

4◦ Une autre solution, beaucoup plus simple, mais souvent largement satisfai-sante, a pour principe de condenser l’ensemble des donnees qui concernent chacundes individus en un ou, eventuellement, en quelques parametres, et de soumettreensuite ce ou ces parametres a une analyse de la variance qui ne fait pas intervenirle facteur temps.

Dans des etudes de croissance par exemple, on peut calculer par regression,pour chacun des individus, une vitesse ou un taux de croissance, et soumettre lesdifferentes vitesses ou les differents taux de croissance a l’analyse de la variance.

d 5◦ On trouvera des informations complementaires relatives aux differentes ap-proches dans l’abondante litterature specialisee, sous forme de livres [Davis 2002 ;Diggle et al., 2002 ; Fitzmaurice et al., 2004 ; Hand et Crowder, 1996 ; Ver-beke et Molenberghs, 2001] et d’articles [Everitt, 1995 ; Omar et al., 1999].b

Exemple 10.3.8. Etude de la croissance de differentes varietes de pruniers : prin-cipes de diverses analyses de la variance relatives a des observations successives.

La croissance en grosseur (diametre ou circonference) des tiges des arbres frui-tiers est un bon indicateur de leur vigueur avant qu’ils n’entrent en production.Une etude a ete realisee dans cette optique pour diverses varietes de pruniers, desmesures de circonference ayant ete effectuees arbre par arbre a une hauteur don-nee, au cours des neuf annees qui ont suivi la plantation [Liard et Rolin, 1966].Comme nous ne ferons que presenter differents modeles d’analyse de la variance,sans traiter effectivement des valeurs numeriques, nous ajoutons simplement, pourconcretiser les choses, que les circonferences etaient en moyenne de l’ordre de 8 a10 cm au cours de la premiere annee et de 20 a 25 cm au cours de la neuviemeannee.

26 En anglais : compound symmetry, sphericity, circularity.27 En anglais : Greenhouse-Geisser’s condition, Huynh-Feldt’s condition.

10.3.7 MODELES CROISES A EFFECTIFS EGAUX : ASPECTS INFERENTIELS 319

Nous supposons tout d’abord qu’on a etudie trois varietes et observe huit arbrespour chacune des trois varietes, de telle sorte que le nombre total de mesures estegal a 216, pour l’ensemble des neuf annees d’observations.

On pourrait alors etre tente de realiser une analyse de la variance a deux crite-res de classification, a savoir les facteurs varietes et annees. Une telle analyse estesquissee dans la partie superieure gauche du tableau 10.3.10.

Tableau 10.3.10. Etude de la croissance de trois varietes de pruniers :schemas de trois tableaux d’analyse de la variance.

Sources Degresde variation de liberte

Varietes 2Annees 8Interaction 16Variation residuelle 189

Total 215

Sources Degresde variation de liberte

Varietes 2Variation residuelle 21

Total 23

Sources Degresde variation de liberte

Varietes 2Variation residuelle 1 21

Total partiel 23

Annees 8Interaction 16Variation residuelle 2 168

Total general 215

En considerant les deux criteres comme fixes, on devrait effectuer dans ce castoutes les comparaisons par rapport a la variation residuelle, avec 189 degres deliberte (§ 10.3.2.6◦ ou 10.3.5.1◦). Cette analyse est cependant tout a fait incor-recte, car on ne dispose evidemment pas de 189 residus independants les uns desautres, puisque seuls 24 arbres ont ete observes, et que les residus relatifs a unmeme arbre ont toute raison d’etre, pour chacun d’eux, fortement correles d’uneannee a l’autre.

Une deuxieme solution consiste a subdiviser l’analyse de la variance en deuxparties, comme l’indique la moitie droite du tableau 10.3.10. La premiere partiede l’analyse ne fait alors intervenir que les differences entre arbres, a l’exclusionde toute influence du facteur annees, la composante ✭✭ variation residuelle 1 ✮✮ etanten fait la variation ✭✭ entre arbres dans les varietes ✮✮. La deuxieme partie reunitau contraire tous les elements qui, d’une maniere ou d’une autre, dependent de larepetition des mesures au cours des differentes annees successives.

Seule la premiere partie de cette analyse peut etre realisee, d’une maniere ge-nerale, sans restriction.

320 ANALYSE DE LA VARIANCE A DEUX CRITERES 10.3.7

d La deuxieme partie de cette analyse ne pourrait etre realisee que moyennantune des conditions auxquelles il a ete fait allusion ci-dessus ou, sinon, moyennantune reduction des nombres de degres de liberte 28.b

La solution la plus simple consiste cependant a n’utiliser que l’analyse de lavariance a un critere de classification, en effectuant une ou plusieurs analyses dutype esquisse dans la partie inferieure gauche du tableau 10.3.10. De telles analysespeuvent etre realisees annee par annee, soit sur les circonferences observees elles-memes, soit sur les accroissements de circonferences, c’est-a-dire les differencesentre les circonferences observees au cours des annees consecutives. De telles ana-lyses permettent de voir a quel moment des differences apparaissent de manieresignificative ou se marquent le plus.

Mais des analyses de la variance de ce type peuvent egalement etre realiseessur des parametres tels que l’accroissement annuel moyen. Un tel accroissementpeut etre calcule arbre par arbre, soit en fonction des seules valeurs extremes(differences entre, dans chaque cas, la derniere et la premiere observation, diviseespar 8), soit en fonction de l’ensemble des observations, comme un coefficient deregression, pour autant bien sur que la croissance en circonference soit relativementconstante, de telle sorte que la regression soit relativement lineaire.

A cet egard, on notera que le coefficient de regression est en fait une simplefonction lineaire des differentes observations. Pour un arbre donne, observe pen-dant neuf annees consecutives, et si on designe les observations par x1 , . . . ,x9 , lecoefficient de regression est en effet :

b = (− 4x1 − 3x2 − 2x3 − x4 + x6 + 2x7 + 3x8 + 4x9)/60 .

Il en resulte notamment que, si les conditions d’application de l’analyse de la va-riance sont satisfaites pour les differentes observations annuelles, elles le sont ega-lement pour les accroissements annuels moyens qui seraient estimes par regression.

Ce principe s’applique evidemment aussi a toute autre fonction des differentesobservations, comme par exemple la moyenne ou des contrastes, dont nous parle-rons au paragraphe 12.2.2 et qui permettent d’aborder la regression non lineaire(§ 12.2.3).

Nous n’avons considere jusqu’a present que la situation la plus simple, qui nefait intervenir au depart qu’un seul facteur (trois varietes dans le cas envisage).Le probleme peut evidemment etre etendu a un plus grand nombre de facteurs,chaque facteur supplementaire donnant naissance a un critere de classificationsupplementaire dans les differents types d’analyses de la variance que nous avonsenvisages.

28 On notera que cette deuxieme solution peut etre consideree aussi comme un cas particulier(n = 1) du modele IV d’analyse de la variance partiellement hierarchisee a trois criteres declassification, dont il est question au paragraphe 11.3.3, la ✭✭ variation residuelle 1 ✮✮ etant lavariation ✭✭ entre arbres dans varietes ✮✮ et la ✭✭ variation residuelle 2 ✮✮ etant l’interaction ✭✭ annees-arbres dans varietes ✮✮. Comme nous l’avons deja signale, cette analyse de la variance s’apparenteen outre a celle qui concerne les experiences aleatoires avec parcelles divisees [Dagnelie, 2003].

10.3.8 MODELES CROISES A EFFECTIFS EGAUX : ASPECTS INFERENTIELS 321

Ainsi, les analyses de la variance realisees annee par annee ou sur des coef-ficients de regression seraient des analyses a deux criteres de classification si onconsiderait, par exemple, non pas seulement trois varietes, mais bien trois varietesgreffees chacune sur deux porte-greffe differents.

10.3.8 Les methodes non parametriques et robustes

1◦ Quand les conditions de normalite et d’egalite des variances enoncees auparagraphe 10.1.3◦ ne sont pas satisfaites, l’analyse de la variance a deux criteresde classification peut ceder la place a differentes methodes non parametriqueset robustes. Parmi celles-ci, nous ne presentons de facon detaillee que le test deFriedman 29, qui concerne le cas des echantillons d’une seule observation, dansl’optique des experiences en blocs aleatoires complets (§ 10.3.6.5◦).

Comme le test de Kruskal et Wallis (§ 9.3.6), pour l’analyse de la variancea un critere de classification, il s’agit d’une methode basee sur l’etude des rangs.

2◦ Nous envisageons cette methode en considerant le test relatif au premiercritere de classification. Dans ce cas, on doit determiner les rangs des observationsseparement pour les differentes modalites du deuxieme critere, puis calculer lessommes Xi. de ces rangs pour les differentes modalites du premier critere. On endeduit ensuite la quantite :

χ2obs =

12p q (p + 1)

pX

i=1

X2i. − 3 q (p + 1) ,

p et q designant comme precedemment, respectivement, le nombre de modalitesdu premier et le nombre de modalites du deuxieme critere de classification.

Cette quantite est approximativement une valeur observee d’une variable χ2

a p − 1 degres de liberte, et l’hypothese d’identite des distributions relatives auxdifferentes modalites du premier critere de classification doit etre rejetee, au niveaude signification α , quand :

P(χ2 ≥ χ2obs) ≤ α ou χ2

obs ≥ χ21−α .

3◦ L’approximation est tres rapidement satisfaisante, mais il y a lieu neanmoinsd’effectuer des calculs plus precis ou d’utiliser des tables particulieres quand lesnombres de modalites des deux criteres de classification sont tres reduits (p = 3et q < 10 , ou p = 4 et q < 5).

Des tables sont donnees notamment par Likes et Laga [1980] et Owen [1962],et figurent dans les principaux ouvrages relatifs aux methodes non parametriques.Une adaptation du test de Friedman est egalement suggeree par Sepanski [2007].

29 En anglais : Friedman’s test.

322 ANALYSE DE LA VARIANCE A DEUX CRITERES 10.3.8

D’autre part, en presence d’ex aequo, la valeur χ2obs definie ci-dessus doit etre

corrigee en la divisant par :

1−nX£

k (k2 − 1)§o±£

p q (p2 − 1)§,

la sommation s’etendant aux differentes series d’ex aequo et k designant le nombrede termes de ces differentes series.

d 4◦ On peut verifier que la quantite χ2obs est, a une constante pres, le carre moyen

factoriel qu’on obtiendrait pour le premier critere de classification, en soumettantles rangs a l’analyse de la variance a un ou a deux criteres.

La valeur χ2obs est aussi une mesure de la concordance entre les classements

qui sont realises pour le premier critere de classification, separement pour lesdifferentes modalites du deuxieme critere. Il pourrait s’agir, plus specifiquement,des preferences 30 ou des classements qui pourraient etre etablis, pour differentsproduits, par differents juges ou par les differents membres d’un jury [Taplin,1997]. A ce titre, la valeur χ2

obs est etroitement liee au coefficient de concordancede Kendall, dont il sera question au paragraphe 13.5.4.

En outre, quand le critere de classification considere ne possede que deux mo-dalites, le test de Friedman se confond avec le test des signes, que nous avonsevoque anterieurement, sans le presenter explicitement (§ 8.5.3.5◦).

Enfin, on pourrait egalement formuler ici des commentaires semblables a ceuxque nous avons emis precedemment, entre autres choses en ce qui concerne l’effi-cacite asymptotique du test (§ 8.4.3.6◦).b

d 5◦ Dans le cas des echantillons de plusieurs observations, differents tests basessur le principe des rangs alignes peuvent etre utilises. Les rangs sont alors calculesglobalement, pour l’ensemble des observations, puis ils sont corriges ou ✭✭ alignes ✮✮

de maniere a eliminer dans chaque cas l’influence des elements autres que celuiqu’on souhaite tester.

Ainsi, pour realiser le test relatif a l’interaction, on elimine l’influence des deuxfacteurs principaux, et pour effectuer le test relatif par exemple au premier facteur,on elimine l’influence de l’interaction et du deuxieme facteur [Mansouri, 1998 ;Mansouri et Chang, 1995 ; O’Gorman, 2001 ; Richter et Payton, 1999].Cette facon de proceder peut etre consideree comme une extension du test deKruskal et Wallis (§ 9.3.6).

D’autres approches ont aussi ete envisagees, notamment par randomisation etdans l’optique des hypotheses alternatives ordonnees [Gao et Alvo, 2005 ; Luhet Guo, 2004 ; Manly et Francis, 1999 ; Nelson, 2000b].b

30 En anglais : preference.

10.3.8 MODELES CROISES A EFFECTIFS EGAUX : ASPECTS INFERENTIELS 323

Exemple 10.3.9. Comparaison des resultats obtenus par trois methodes d’analysechimique : test de Friedman.

Nous illustrons l’emploi du test de Friedman en reprenant les donnees del’exemple 10.3.6, relatives a la comparaison des resultats obtenus par trois metho-des d’analyse chimique.

Les donnees initiales du tableau 8.5.1 et les rangs correspondants figurent par-tiellement dans le tableau 10.3.11. On en deduit :

χ2obs =

12(3) (30) (4)

(69,52 + 512 + 59,52)− (3) (30) (4) = 5,72 ,

et avec deux degres de liberte :

P(χ2 ≥ 5,72) = 0,058 .

Tableau 10.3.11. Comparaison des resultats obtenus par trois methodesd’analyse chimique : teneurs en lutecium, en microgrammes par gramme

de cendres, et rangs (donnees partielles).

Teneurs RangsEchant.

1 2 3 1 2 3

1 133 129 138 2 1 32 131 132 138 1 2 33 119 121 121 1 2,5 2,54 124 124 121 2,5 2,5 15 123 124 124 1 2,5 2,5...

......

......

......

30 137 136 134 3 2 1

Totaux 69,5 51 59,5

Les differences entre les trois methodes d’analyse apparaıtraient ainsi, a pre-miere vue, comme non significatives. Il faut noter toutefois que la proportion desex aequo est importante (11 cas sur 30), et que la correction qui les concernent nedoit donc pas etre negligee.

Cette correction conduit a diviser la valeur obtenue ci-dessus par :

1− (11) (6)±£

(30) (3) (8)§

= 0,9083 .

On en deduit alors :

χ2obs = 6,29 et P(χ2 ≥ 6,29) = 0,043 .

Les differences observees doivent donc etre considerees, au contraire, commesignificatives, ce qui ne fait d’ailleurs que confirmer la conclusion de l’analyse dela variance a deux criteres de classification (exemple 10.3.6).

324 ANALYSE DE LA VARIANCE A DEUX CRITERES 10.4.1

10.4 Les modeles croises a effectifs inegaux

10.4.1 Principes generaux

1◦ Quand les effectifs des differents echantillons ne sont pas egaux, l’analysede la variance a deux criteres de classification peut se compliquer sensiblement.

D’une part, en ce qui concerne le volet descriptif de l’analyse, les effets desdeux criteres de classification ne sont plus nettement separes. Ainsi, les moyennesrelatives aux differentes modalites du premier critere de classification par exemplepeuvent etre influencees par le deuxieme critere, en raison du fait que les inegalitesd’effectifs attribuent, dans ces differentes moyennes, des poids inegaux aux diffe-rentes modalites de ce deuxieme critere. L’exemple 10.4.3 illustre tres bien cephenomene.

D’autre part, en ce qui concerne le volet inferentiel, il en resulte notammentque, d’une maniere generale, les variables χ2 relatives aux differentes sources devariation ne sont plus independantes les unes des autres, ce qui peut affecter larealisation des tests d’hypotheses.

2◦ L’inegalite des effectifs peut etre liee tout d’abord au fait qu’une ou plu-sieurs observations sont manquantes 31, dans un ensemble de donnees qui, nor-malement, aurait du etre caracterise par des effectifs egaux. Une telle situationpeut resulter par exemple de la mortalite de certaines plantes ou de certains ani-maux, ou d’autres accidents susceptibles de survenir au cours de toute experienceplanifiee, initialement, de telle sorte que les effectifs soient en principe egaux.

Dans ce cas, et pour autant que la proportion des donnees manquantes ne soitpas trop elevee, il est possible de proceder a une estimation de ces donnees, cequi conduit a des solutions relativement simples. Nous envisagerons cette questiond’une part pour les echantillons de plus d’une observations (§ 10.4.2) et d’autrepart pour les echantillons d’une seule observation (§ 10.4.3).

3◦ L’inegalite des effectifs peut etre liee egalement a la nature meme des don-nees ou des phenomenes observes. Il peut s’agir par exemple de donnees d’enquetes,collectees sans qu’on ait voulu assurer l’egalite des effectifs ou sans qu’il ait etepossible d’assurer une telle egalite. Mais il peut s’agir aussi d’experiences pour les-quelles le materiel disponible n’a pas permis une organisation equilibree (nombresinegaux de graines ou d’animaux disponibles pour differentes provenances ou dif-ferentes races, par exemple).

Si on designe par nij les effectifs des differents echantillons, qui correspondentaux differentes modalites des deux criteres de classification, et par ni. et n.j leseffectifs totaux calcules separement pour chacun des deux criteres, les donneessont, le plus souvent, telles que la condition de proportionnalite :

nij = ni. n.j/n.. ,31 En anglais : missing data, missing value.

10.4.1 MODELES CROISES A EFFECTIFS INEGAUX 325

n’est pas satisfaite pour toutes les valeurs de i et de j . De telles donnees sont ditesnon orthogonales 32 et necessitent l’emploi de procedures particulieres d’analyse,qui sont plus complexes.

Ce probleme est generalement traite dans l’optique du modele lineaire, dontil sera question ulterieurement (§ 16.4.4). Nous nous contenterons ici d’illustrercette situation par la presentation de deux exemples, sans donner d’informationstheoriques detaillees (§ 10.4.4).

d 4◦ Une situation intermediaire entre le cas des effectifs egaux et le cas non or-thogonal est celle des effectifs proportionnels 33. Cette situation correspond au casou les effectifs des echantillons ne different qu’en fonction d’un seul critere de clas-sification (effectifs ni dependant uniquement du premier critere ou nj dependantuniquement du deuxieme critere).

Les effectifs totaux sont alors egaux pour un des deux criteres et inegaux pourl’autre, de telle sorte que le modele d’analyse de la variance est equilibre pour uncritere et non equilibre pour l’autre. En outre, la condition de proportionnalite deseffectifs, presentee ci-dessus, est satisfaite.

Cette situation est relativement proche du cas des effectifs egaux et peut etretraitee par des methodes peu differentes de celles que nous avons exposees auparagraphe 10.3 [Dagnelie, 1970].b

d 5◦ En outre, au probleme des donnees manquantes, peuvent etre associes lesproblemes de donnees melangees et permutees, parfois dites aussi, plus globale-ment, donnees alterees ou faussees 34. Il s’agit de donnees melangees quand unresultat unique a ete observe accidentellement a la place de deux ou plusieurs re-sultats distincts (rendement global relatif a deux ou plusieurs arbres ou parcelles, ala place des rendements individuels relatifs aux differents arbres ou aux differentesparcelles). Il s’agit de donnees permutees si deux ou plusieurs traitements ont eteappliques par inadvertance a la place l’un de l’autre.

Ces problemes particuliers peuvent etre resolus notamment par l’analyse de lacovariance (§ 17.3.3.3◦).b

d 6◦ D’une maniere plus generale, on trouvera des informations complementairesrelatives aux questions de donnees manquantes dans divers livres et articles telsque ceux de Allison [2001], Little et Rubin [2002], McKnight et al. [2007], etSpilke et al. [2005].b

32 En anglais : non-orthogonal data.33 En anglais : proportionate sample sizes.34 En anglais : spoilt data, messy data.

326 ANALYSE DE LA VARIANCE A DEUX CRITERES 10.4.2

10.4.2 L’estimation des donnees manquantes :echantillons de plusieurs observations

1◦ Dans le cas des echantillons de plusieurs observations, initialement de memeeffectif, l’estimation d’une ou plusieurs donnees manquantes peut etre realiseetres facilement en utilisant chaque fois, comme valeur estimee, la moyenne desobservations qui sont disponibles pour l’echantillon considere.

Cette facon de proceder a pour consequence d’annuler les residus relatifs auxobservations estimees, ce qui conduit a reduire la somme des carres des ecartsresiduelle au prorata du nombre de donnees estimees. On peut compenser cettereduction en diminuant les nombres de degres de liberte de la variation residuelleet de la variation totale d’autant d’unites qu’il y a de donnees estimees.

2◦ Cette approche peut etre suivie quand la proportion de donnees manquantesn’est pas trop elevee (moins de 10 % du nombre total d’observations par exemple),et pour autant que la repartition des donnees manquantes soit independante desdeux criteres de classification. En particulier, la procedure generale relative au casnon orthogonal (§ 10.4.4 et 16.4.4), ou d’autres procedures, doivent etre utiliseeslorsque toutes les observations d’un ou plusieurs echantillons sont manquantes.

Quand la repartition des donnees manquantes est etroitement liee a un ouaux deux criteres de classification, on peut aussi envisager dans certains cas deresoudre le probleme en eliminant toutes les donnees relatives a la ou aux mo-dalites pour laquelle ou pour lesquelles la proportion de donnees manquantes estparticulierement elevee.

Exemple 10.4.1. Comparaison de trois types de sondes dans deux types de sols :analyse de la variance avec estimation prealable d’une donnee.

L’exemple 10.3.2, relatif au controle des conditions d’application de l’analysede la variance, pour trois types de sondes et deux types de sols, a mis en evidence lapresence d’une donnee suspecte, qui figure dans le tableau 10.2.2 (x114 = 53). Pourvoir quelle peut etre l’influence de cette valeur, il suffit de l’eliminer de l’analyseen la remplacant, comme si elle etait manquante, par une valeur estimee basee surles trois autres observations du meme echantillon :

bx114 = (43 + 45 + 46)/3 = 44,67.

Le tableau 10.4.1 presente les resultats obtenus de cette facon. Dans ce tableau,les nombres de degres de liberte de la variation residuelle et de la variation totaleont ete reduits d’une unite.

Par comparaison avec le tableau 10.3.1, on constate tout d’abord que l’elimi-nation de la valeur suspecte provoque une reduction de plus de 40 % du carremoyen residuel. On peut observer aussi que l’influence du facteur types de solsest toujours considerable et que la composante d’interaction reste largement nonsignificative.

10.4.3 MODELES CROISES A EFFECTIFS INEGAUX 327

Tableau 10.4.1. Comparaison de trois types de sondes dans deux types de sols :tableau d’analyse de la variance, apres estimation d’une donnee.

Sources Degres Sommes des carres CarresF P

de variation de liberte des ecarts moyens

Types de sols 1 138,6 138,6 39,0 *** 0,0000Types de sondes 2 25,6 12,8 3,61 * 0,049Interaction 2 4,6 2,3 0,65 0,53Variation residuelle 17 60,4 3,55

Totaux 22 229,2

La situation est plus delicate en ce qui concerne le facteur types de sondes,auquel on s’interesse en realite plus particulierement. La probabilite afferente ace critere de classification passe en effet de 0,039 (tableau 10.3.1) a 0,049 (ou defacon plus precise 0,0495). Le facteur types de sondes reste donc significatif, maisdans des conditions tout a fait limites.

Ce cas concret met bien en evidence l’importance des consequences possibles detoute decision, souvent subjective, d’eliminer ou non une ou plusieurs observationssuspectes.

d Il est interessant de noter que la solution proposee au paragraphe 10.4.4, en cequi concerne le cas non orthogonal (effectifs inegaux), donnerait une valeur Fobs

egale a 3,58 au lieu de 3,61 , et une probabilite correspondante egale a 0,0504 aulieu de 0,0495 . Selon cette procedure, les differences observees ne seraient doncpas significatives, mais de facon tout aussi limite, ce qui souligne mieux encorela prudence avec laquelle il y a lieu d’aborder la question de l’elimination ou lanon-elimination de valeurs suspectes.b

10.4.3 L’estimation des donnees manquantes :echantillons d’une seule observation

1◦ Dans le cas des echantillons d’une seule observation, le meme principe qu’auparagraphe precedent, a savoir l’annulation des residus relatifs aux valeurs qui doi-vente etre estimees, peut etre adopte en vue de proceder a l’estimation d’eventuellesdonnees manquantes. Pour une seule observation manquante, ce principe conduita la relation suivante :

bxij = (pX 0i. + q X 0

.j −X 0..)

±£(p− 1) (q − 1)

§,

les sommes X 0i. , X 0

.j et X 0.. ne faisant evidemment pas intervenir la valeur man-

quante.

Quand deux ou plusieurs observations sont manquantes, cette relation peutetre utilisee par approximations successives, comme le montre l’exemple 10.4.2. Il

328 ANALYSE DE LA VARIANCE A DEUX CRITERES 10.4.3

est egalement possible, dans ce cas, de traiter le probleme sans iterations, par laresolution de systemes d’equations lineaires comportant autant d’equations qu’ily a de donnees manquantes.

De plus, tant pour une que pour deux ou plusieurs donnees manquantes, leprobleme peut etre resolu aussi par l’analyse de la covariance (§ 17.3.3.3◦).

Dans tous les cas, les nombres de degres de liberte de l’interaction et de lavariation totale doivent etre reduits d’autant d’unites qu’on a estime de valeursmanquantes.

2◦ Ces diverses approches, qui sont toutes basees sur le principe des moindrescarres, fournissent des estimations non biaisees pour les moyennes et pour le carremoyen de l’interaction, mais elle donne par contre des valeurs surestimees en cequi concerne les carres moyens factoriels.

L’erreur systematique correspondante est d’autant plus importante que le nom-bre de donnees estimees est plus eleve. En consequence, on n’emploiera ces proce-dures que quand les donnees manquantes ne representent qu’une faible proportionde l’ensemble. Une limite de 10 % de donnees manquantes, maximum, paraıt rai-sonnable.

d D’autres approches sont presentees notamment par Hunt et Triggs [1989],et Kala [1998].b

Exemple 10.4.2. Comparaison des resultats obtenus par trois methodes d’analysechimique : analyse de la variance avec estimation prealable d’une ou deux donnees.

On peut illustrer les procedures qui viennent d’etre presentees en supposantpar exemple que, pour les donnees relatives a la comparaison de trois methodesd’analyse chimique (exemple 10.3.6), la derniere observation (x3,30) est manquanteou a du etre eliminee.

On aurait alors (tableau 8.5.1) :

X 03. = 3.478 , X 0

.30 = 273 , X 0.. = 10.683

et bx3,30 =£3 (3.478) + 30 (273)− 10.683

§±£(2) (29)

§= 136,91 .

Le tableau 10.4.2 presente les resultats de l’analyse de la variance qui ont ete ob-tenus en substituant cette derniere valeur a celle qui intervenait anterieurement(x3,30 = 134), et en reduisant d’une unite les nombres de degres de liberte del’interaction et de la variation totale.

Ce tableau n’est guere different du tableau initial (tableau 10.3.9), ce qui n’arien de surprenant si on tient compte du fait qu’une seule valeur sur 90 a ainsi eteestimee.

d De meme, on peut illustrer la question de l’estimation de deux donnees man-quantes en supposant qu’en outre, l’observation x1,13 est manquante ou a du etreeliminee.

10.4.4 MODELES CROISES A EFFECTIFS INEGAUX 329

Tableau 10.4.2. Comparaison des resultats obtenus par trois methodesd’analyse chimique : tableau d’analyse de la variance,

apres estimation d’une donnee.

Sources Degres Sommes des carres CarresF P

de variation de liberte des ecarts moyens

Methodes d’analyse 2 37,17 18,59 3,77 * 0,029Prelevements 29 15.434,60 532,23Interaction 57 280,77 4,926

Totaux 88 15.752,54

Il faut alors donner a titre provisoire une valeur quelconque, telle que la valeurde la moyenne generale ou une valeur proche de la moyenne generale, a une desdeux observations manquantes, c’est-a-dire par exemple :

bx1,13 = 120 .

En fonction de cette valeur, on obtient pour x3,30 :

X 03. = 3.478 , X 0

.30 = 273 , X 0.. = 10.707

et bx3,30 =£3 (3.478) + 30 (273)− 10.707

§±£(2) (29)

§= 136,50 .

Ensuite, selon le meme processus et en repartant de cette derniere valeur, ona pour x1,13 :

X 01. = 3.529 , X 0

.13 = 186 , X 0.. = 10.723,50

et bx1,13 =£3 (3.529) + 30 (186)− 10.723,50

§±£(2) (29)

§= 93,85 .

Et on peut poursuivre ce calcul iteratif, en estimant successivement a tour derole chacune des deux valeurs manquantes, la convergence etant toujours extre-mement rapide. Le resultat final, qui est independant de la valeur choisie commepoint de depart, est :

bx1,13 = 93,85 et bx3,30 = 136,95 .

L’analyse de la variance peut ensuite etre realisee comme ci-dessus, mais enreduisant cette fois de deux unites les nombres de degres de liberte de l’interactionet de la variation totale.b

10.4.4 Le cas non orthogonal

Comme nous l’avons signale au paragraphe 10.4.1.3◦, nous n’envisageons icil’analyse de la variance a deux criteres de classification, dans le cas non orthogonal,

330 ANALYSE DE LA VARIANCE A DEUX CRITERES 10.4.4

que par la presentation de deux exemples. Nous reviendrons ulterieurement surcette question de maniere plus detaillee, dans le cadre de l’etude du modele lineaire(§ 16.4.4).

Le premier exemple n’est pas relatif a des donnees reelles. Il est en fait inspired’un exemple classique du a Yates [1933] et deja repris notamment par Finney[1980]. Cet exemple a l’avantage d’etre particulierement parlant.

Exemple 10.4.3. Etude de la croissance en poids de poussins en fonction du sexeet de trois traitements : analyse de la variance.

Un ensemble de 45 œufs de poules a ete subdivise de facon completementaleatoire en trois lots de 15 œufs, au moment de la mise en incubation, et destraitements differents (par exemple differentes temperatures d’incubation) ont eteappliques aux differents lots. Apres eclosion, les poussins ont tous ete eleves dansdes conditions identiques, puis peses a un meme age de reference. Le sexe despoussins, dont on sait a priori qu’il induit de fortes differences de poids, pouvaitalors etre aussi observe.

Les poids obtenus, exprimes en decagrammes, ainsi que les effectifs, les sommeset les moyennes des poids, figurent dans le tableau 10.4.3. Il n’est evidemment passurprenant que, dans de telles conditions, les effectifs relatifs aux differentes combi-naisons des deux criteres de classification (sexes et traitements) soient inegaux 35.

On remarquera que les moyennes marginales, dont les symboles sont affectes icidu signe ✭✭ prime ✮✮ (x0i.. et x0.j.) sont a la fois des moyennes arithmetiques simples del’ensemble des observations considerees, et des moyennes arithmetiques pondereesdes moyennes xij. correspondantes, les coefficients de ponderation etant les effectifsnij relatifs a ces dernieres moyennes. Ainsi, la valeur 22,7, qui apparaıt dans laderniere ligne du tableau, est a la fois la moyenne arithmetique simple des poidsdes 15 poussins relatifs au traitement 1 (soit 340/15), et une moyenne pondereedes moyennes 28,2 et 19,9 , les coefficients de ponderation etant les effectifs 5 et 10 :

[5 (28,2) + 10 (19,9)]/15 = 22,7.

Un rapide examen des moyennes marginales confirme tout d’abord la grandedifference de poids entre les animaux des deux sexes (x01.. = 26,8 et x02.. = 19,1).Un tel examen semble indiquer egalement que le traitement 3 (x0.3. = 25,1) ainduit des poids sensiblement superieurs aux deux autres traitements (x0.1. = 22,7et x0.2. = 22,3).

Cette conclusion est toutefois en contradiction avec ce que montrent les moyen-nes xij. . Ces moyennes ne sont en effet pas globalement superieures pour le trai-tement 3 (x13. = 27,5 et x23. = 18,2), par comparaison avec les traitements 1 et 2(x11. = 28,2 et x21. = 19,9 d’une part, x12. = 25,0 et x22. = 18,3 d’autre part). En

35 On peut eventuellement verifier, par un test d’independance, que les effectifs consideres n’ontrien d’anormal. On obtient en effet, par ce test (§ 6.2.2), une valeur χ2

obs egale a 5,04 , avec deuxdegres de liberte, et une probabilite P(χ2 ≥ 5,04) egale a 0,080 .

10.4.4 MODELES CROISES A EFFECTIFS INEGAUX 331

Tableau 10.4.3. Poids de 45 poussins, en decagrammes, effectifs, totauxet moyennes, en fonction des deux sexes et de trois traitements.

Traitement 1 Traitement 2 Traitement 3(j = 1) (j = 2) (j = 3)

25 30 21 26 23 28Males 26 33 22 27 24 29(i = 1) 27 22 28 25 31

24 30 26 3225 26 32

27

15 20 16 18 15 19Femelles 18 21 17 20 17 22(i = 2) 19 21 18 21

20 2220 23

Effectifs : nij ni.

Males 5 9 11 25Femelles 10 6 4 20

n.j 15 15 15 45

Totaux : Xij. Xi..

Males 141 225 303 669Femelles 199 110 73 382

X.j. 340 335 376 1.051

Moyennes : xij. x0i..

Males 28,2 25,0 27,5 26,8Femelles 19,9 18,3 18,2 19,1

x0.j. 22,7 22,3 25,1 23,4

realite, la superiorite apparente du traitement 3 , par rapport aux traitements 1et 2 , resulte essentiellement de la plus forte proportion d’individus males, de poidsplus eleves, dans le cas de ce traitement (n13 = 11 , par comparaison avec n11 = 5et n12 = 9), et n’est nullement liee au traitement lui-meme.

A ces problemes d’interpretation des moyennes, s’ajouterait une incoherencerelative aux sommes des carres des ecarts, si on appliquait sans precautions, a cecas non orthogonal, les procedures classiques de calcul de l’analyse de la variancea un et a deux criteres.

En utilisant la relation generale relative aux effectifs eventuellement inegaux,telle qu’elle est presentee en analyse de la variance a un critere de classification(§ 9.2.3.4◦), on obtiendrait en effet les sommes des carres des ecarts factorielles :

SCEa = 652,0 et SCEb = 66,7.

332 ANALYSE DE LA VARIANCE A DEUX CRITERES 10.4.4

D’autre part, en calculant et en additionnant les sommes des carres des ecartsrelatives aux six groupes d’individus (§ 10.2.3.2◦), on aurait, pour la somme resi-duelle :

SCEr = 42,8 + 74,0 + 98,7 + 44,9 + 17,3 + 26,8 = 304,5 .

Enfin, la somme des carres des ecarts totale etant :

SCEt = 1.014,3 ,

la somme des carres des ecarts de l’interaction devrait etre, par difference :

SCEab = 1.014,3− 652,0− 66,7− 304,5 = − 8,9 .

Cette valeur negative est bien sur tout a fait inadmissible.

Le tableau 10.4.4, qui presente deux decompositions distinctes de la somme descarres des ecarts totale, montre comment on peut resoudre ce probleme de maniererelativement simple.

Tableau 10.4.4. Etude de la croissance en poids de poussins en fonction du sexeet de trois traitements : tableau d’analyse de la variance non orthogonale.

Degres S. des carres CarresSources de variation F P

de liberte des ecarts moyens

Sexes 1 652,0 652,0Trait. : moy. ajustees 2 46,2 23,1 2,96 0,064Interaction 2 11,6 5,8 0,74 0,48Variation residuelle 39 304,5 7,81

Traitements 2 66,7 33,4Sexes : moy. ajustees 1 631,5 631,5 80,9 *** 0,0000Interaction 2 11,6 5,8 0,74 0,48Variation residuelle 39 304,5 7,81

Totaux 44 1.014,3

Outre les lignes d’interaction et de variation residuelle, la premiere partie de cetableau contient une ligne relative au facteur sexes, obtenue comme ci-dessus sanstenir compte de l’existence du facteur traitements, et une ligne relative au facteurtraitements, obtenue au contraire en eliminant l’influence du facteur sexes, par lecalcul de moyennes ajustees. Il apparaıt ainsi que, comme l’interaction, le facteurtraitements est non significatif, bien qu’il soit proche de la limite de signification.

De meme, la deuxieme partie du tableau 10.4.4 contient une ligne relativeaux traitements, ignorant les differences entre sexes, et une ligne relative auxsexes, avec elimination de l’effet des traitements. Cette deuxieme partie ne presentetoutefois guere d’interet dans le cadre du probleme envisage ici, les differences entresexes etant bien connues, et l’objectif poursuivi etant essentiellement l’etude destraitements.

10.5.1 MODELES HIERARCHISES 333

Nous donnerons plus d’informations a ce sujet, notamment quant au conceptde moyenne ajustee et en suggerant d’autres options, au paragraphe 16.4.4.

Exemple 10.4.4. Comparaison des resultats obtenus par trois methodes d’analysechimique : analyse de la variance non orthogonale.

L’exemle 10.4.2 a ete consacre a la comparaison de trois methodes d’analysechimique, pour lesquelles une ou deux observations auraient ete manquantes. Onpeut envisager le meme probleme sous l’angle de l’analyse de la variance nonorthogonale.

Sans donner plus de details, nous presentons dans le tableau 10.4.5 les resultatsqui peuvent etre obtenus en supposant, comme dans l’exemple 10.4.2, que laderniere observation (x3,30) est manquante. Nous nous limitons en outre, dansce tableau, a la seule decomposition de la somme des carres des ecarts totale quiest utile en vue de comparer les differentes methodes d’analyse.

Tableau 10.4.5. Comparaison des resultats obtenus par trois methodesd’analyse chimique : tableau d’analyse de la variance non orthogonale.

Degres Sommes des carres CarresSources de variation F P

de liberte des ecarts moyens

Prelevements 29 15.153,07 522,52Methodes : moy. ajust. 2 37,06 18,53 3,76 * 0,029Interaction 57 280,77 4,926

Totaux 88 15.470,90

Comme dans l’exemple precedent, la premiere ligne provient d’un calcul directde la somme des carres des ecarts relative au facteur prelevements, tandis que ladeuxieme ligne est liee, pour le facteur methodes d’analyse, a la determination demoyennes ajustees (§ 16.4.4).

On peut constater la tres grande similitude avec les resultats anterieurs, deduitsde l’estimation de la donnee manquante (tableau 10.4.2).

10.5 Les modeles hierarchises

10.5.1 Principes generaux

1◦ Les modeles hierarchises d’analyse de la variance a deux criteres de classi-fication correspondent a des situations ou un des deux criteres est subordonne al’autre.

Il en est ainsi par exemple quand on compare les productions laitieres d’unememe race bovine dans deux ou plusieurs regions, en choisissant au hasard et

334 ANALYSE DE LA VARIANCE A DEUX CRITERES 10.5.2

independamment plusieurs exploitations agricoles dans chaque region, et en me-surant dans chacune d’elles les productions de plusieurs betes, elles aussi choisiesau hasard et independamment. Le facteur exploitations est alors subordonne aufacteur regions, puisque le choix des exploitations est realise a l’interieur de cha-cune des regions, sans qu’il n’y ait aucune correspondance entre les differentesexploitations des differentes regions.

Dans ces conditions, il ne se justifie pas, en particulier, de calculer la moyen-ne x.1. , qui serait relative aux premieres exploitations des differentes regions, lamoyenne x.2. , qui serait relative aux deuxiemes exploitations des differentes re-gions, etc., c’est-a-dire les moyennes x.j. , relatives au deuxieme critere de classi-fication. Il se justifie par contre toujours de calculer les moyennes relatives auxdifferentes regions, c’est-a-dire les moyennes xi.. relatives au premier critere declassification.

2◦ Dans ce type de problemes, le critere de classification subordonne est ge-neralement aleatoire, tandis que le critere de classification principal peut etre,indifferemment, fixe ou aleatoire. Les modeles d’analyse de la variance a prendreen consideration sont donc un modele mixte et un modele aleatoire.

Le modele mixte correspond a un ensemble d’echantillonnages a deux degres,realises independamment les uns des autres, pour les differentes modalites du pre-mier critere de classification. Le modele aleatoire correspond a un echantillonnagea trois degres 36, qui generalise l’echantillonnage a deux degres.

En outre, on peut distinguer ici egalement des modeles equilibres, a effectifsconstants aux differents niveaux de l’echantillonnage, et des modeles non equili-bres, a effectifs inegaux.

3◦ Dans la suite, et comme pour les modeles croises, nous envisagerons se-parement les aspects descriptifs (§ 10.5.2) et les aspects inferentiels (§ 10.5.3) del’analyse.

10.5.2 Les aspects descriptifs

1◦ Comme precedemment (§ 10.2.2.1◦), nous representerons les observationsinitiales par le symbole xijk et nous adopterons en outre les conventions suivantesen ce qui concerne les effectifs.

Nous designerons par p le nombre de modalites du premier critere de classifi-cation, par qi (i = 1 , . . . , p) les nombres de modalites, eventuellement inegaux,du deuxieme critere de classification, pour les differentes modalites du premiercritere, et par nij (i = 1 , . . . , p et j = 1 , . . . , qi) les effectifs, eventuellementinegaux aussi, des differents echantillons. Dans l’exemple auquel nous avons faitallusion ci-dessus, il s’agirait respectivement du nombre p de regions etudiees, des

36 En anglais : three-stage sampling.

10.5.2 MODELES HIERARCHISES 335

nombres qi d’exploitations agricoles observees dans les differentes regions, et desnombres nij de betes observees dans les differentes exploitations.

2◦ On peut alors designer aussi par q. le nombre total de modalites du deuxiemecritere de classification, par ni. (i = 1 , . . . , p) les effectifs totaux des echantillonsrelatifs a chacune des modalites du premier critere de classification, et par n.. l’ef-fectif total de tous les echantillons. Il s’agirait, dans notre exemple, du nombretotal q. d’exploitations agricoles observees, des nombres totaux ni. de betes ob-servees dans les differentes regions, et du nombre total n.. de betes observees pourl’ensemble des differentes regions.

Dans le cas equilibre, les effectifs q et n sont constants, et on a en particulier :

ni. = q n et n.. = p q n .

3◦ Dans le cas general, les moyennes relatives aux differents niveaux de lahierarchie sont, du niveau inferieur au niveau superieur :

xij. =1

nij

nijX

k=1

xijk , xi.. =1

ni.

qiX

j=1

nijX

k=1

xijk =1

ni.

qiX

j=1

(nij xij.)

et x... =1n..

pX

i=1

qiX

j=1

nijX

k=1

xijk =1n..

pX

i=1

qiX

j=1

(nij xij.) =1n..

pX

i=1

(ni. xi..) .

Ces differentes relations se simplifient bien sur sensiblement dans le cas equilibre.

4◦ Dans ces conditions, le modele observe s’ecrit :

xijk − x... = (xi.. − x...) + (xij. − xi..) + (xijk − xij.) .

Il contient un terme de moins que le modele croise, le deuxieme terme du deuxiememembre remplacant, a la fois, le terme relatif au deuxieme facteur et le terme d’in-teraction (§ 10.2.2.2◦).

5◦ L’equation d’analyse de la variance est en consequence :

pX

i=1

qiX

j=1

nijX

k=1

(xijk − x...)2 =pX

i=1

£ni. (xi.. − x...)2

§+

pX

i=1

qiX

j=1

£nij (xij. − xi..)2

§

+pX

i=1

qiX

j=1

nijX

k=1

(xijk − xij.)2 ,

336 ANALYSE DE LA VARIANCE A DEUX CRITERES 10.5.2

ou encore :

SCEt = SCEa + SCEb|a + SCEr .

Tous les termes de cette equation sont identiques a ceux qui concernent lesmodeles croises (§ 10.2.2.3◦), a l’exception du terme SCEb|a . Celui-ci designe lasomme des carres des ecarts entre les differentes modalites du deuxieme criterede classification, a l’interieur des differentes modalites du premier critere. Dansl’exemple considere ci-dessus, il s’agirait de la variation entre exploitations agri-coles, a l’interieur des regions.

Ce terme prend la place, a la fois, de la variation factorielle relative au deuxiemecritere de classification et de la variation de l’interaction. Dans le cas equilibre eten supposant qu’on calcule, comme pour les modeles croises, des moyennes x.j. ,on aurait d’ailleurs strictement :

SCEb|a = SCEb + SCEab .

6◦ Les nombres de degres de liberte qui correspondent aux differentes sommesdes carres des ecarts sont tels que :

n.. − 1 = (p− 1) + (q. − p) + (n.. − q.) ,

c’est-a-dire aussi, dans le cas equilibre :

p q n− 1 = (p− 1) + p (q − 1) + p q (n− 1) .

Comme precedemment, on peut en deduire les differents carres moyens etconstituer ensuite le tableau d’analyse de la variance (tableau 10.5.1).

Tableau 10.5.1. Tableau d’analyse de la variance a deux criteresde classification, dans le cas des modeles hierarchises.

Sources Degres Sommes des carres Carresde variation de liberte des ecarts moyens

Facteur a p− 1 SCEa CMa

Facteur b (dans a) q. − p SCEb|a CMb|aVariation residuelle n.. − q. SCEr CMr

Totaux n.. − 1 SCEt

d 7◦ Lors de la realisation des calculs a l’aide de logiciels statistiques, le modelepresente ici doit etre clairement distingue des modeles consideres anterieurement.

En ce qui concerne par exemple les commandes ✭✭ anova ✮✮ et ✭✭ glm ✮✮ du logicielMinitab, et en utilisant exclusivement des lettres majuscules, le modele croise

10.5.2 MODELES HIERARCHISES 337

relatif au cas des echantillons de plusieurs observations s’ecrit (§ 10.2) :

X = A B A*B ,

A et B designant les deux facteurs principaux et A*B designant l’interaction, lacomposante residuelle ne devant pas etre mentionnee. De meme, pour le modelecroise relatif au cas des echantillons d’une seule observation (§ 10.3.6), on a :

X = A B ,

l’analyse de la variance ne comportant pas de terme d’interaction a proprementparler.

Quant au modele hierarchise dont il est question ici, l’ecriture correspondanteest :

X = A B(A) ,

B(A) designant le facteur B subordonne a A.Les memes presentations ou d’autres formes plus ou moins semblables doivent

etre utilisees pour d’autres logiciels.b

d 8◦ Quant a l’eventuelle realisation ✭✭ manuelle ✮✮ des calculs, la meilleure solu-tion consiste a effectuer tout d’abord une analyse de la variance a un critere declassification pour chacune des p modalites du premier facteur.

La somme des carres des ecarts residuelle de l’analyse a deux criteres de clas-sification peut alors etre obtenue tres facilement en additionnant les sommes descarres des ecarts residuelles des p analyses a un critere. De meme, la somme descarres des ecarts relative au deuxieme critere de classification peut etre obtenueen additionnant les sommes des carres des ecarts factorielles des p analyses a uncritere.

Enfin, si on designe par Xi.. et X... , respectivement, les sommes relatives auxdifferentes modalites du premier critere de classification et la somme generale, lasomme des carres des ecarts relative a ce critere est :

SCEa =pX

i=1

(X2i../ni.)−X2

.../n.. .

Cette formule est identique a celle du paragraphe 9.2.3.4◦, en ajoutant toutefois unpoint en indice a chaque symbole, puisqu’une sommation supplementaire intervientpour chacun des elements pris en consideration.b

Exemple 10.5.1. Comparaison et etude de l’homogeneite des rendements four-ragers de deux types de prairies : analyse de la variance.

Nous avons etudie anterieurement, par l’analyse de la variance a un critere declassification, l’homogeneite des rendements fourragers d’un ensemble de prairies(exemple 9.3.3).

338 ANALYSE DE LA VARIANCE A DEUX CRITERES 10.5.2

Les donnees disponibles concernent en fait, non pas un seul ensemble de prai-ries, mais bien deux types de prairies [Calembert, 1962]. Dans chacun d’eux, troisprairies ont ete choisies au hasard et independamment, et les rendements fourragersont ete determines chaque fois en cinq endroits differents, eux-memes choisis auhasard et independamment dans chacune des six prairies. Ces donnees permettent,a la fois, de comparer les deux types de prairies et d’etudier l’homogeneite desrendements a l’interieur de ces deux types de prairies (variabilite d’une prairie al’autre et variabilite a l’interieur des prairies).

Le tableau 10.5.2 reunit l’ensemble des donnees et le tableau 10.5.3 presenteles resultats de l’analyse de la variance, y compris les tests F , dont il sera questionulterieurement (exemple 10.5.2).

Tableau 10.5.2. Comparaison et etude de l’homogeneite des rendementsfourragers de deux types de prairies : rendements observes,

en tonnes de matiere seche par hectare.

Type 1 Type 2Parcelles

Prairie 1 Prairie 2 Prairie 3 Prairie 1 Prairie 2 Prairie 3

1 2,06 1,59 1,92 2,91 1,57 2,432 2,99 2,63 1,85 3,27 1,82 2,173 1,98 1,98 2,14 3,45 2,69 2,374 2,95 2,25 1,33 3,92 3,25 2,895 2,70 2,09 1,83 4,34 3,11 2,24

Tableau 10.5.3. Comparaison et etude de l’homogeneite des rendementsfourragers de deux types de prairies : tableau d’analyse de la variance.

Degres S. des carres CarresSources de variation F P

de liberte des ecarts moyens

Differences entre typesde prairies 1 3,4273 3,4273 2,47 0,19

Differences entre prairies(dans les types de prairies) 4 5,5410 1,3852 5,79 ** 0,0021

Differences entre parcelles(dans les prairies) 24 5,7419 0,2392

Totaux 29 14,7102

Au point de vue purement descriptif, on se contentera de constater l’augmen-tation progressive des valeurs des carres moyens du niveau inferieur (✭✭ dans lesprairies ✮✮) au niveau superieur (✭✭ entre types de prairies ✮✮).

10.5.3 MODELES HIERARCHISES 339

10.5.3 Les aspects inferentiels

1◦ Comme nous l’avons signale au paragraphe 10.5.1.2◦, deux modeles d’analy-se de la variance, l’un mixte et l’autre aleatoire, doivent etre pris en considerationdans le cas hierarchise.

En ce qui concerne le modele mixte, on s’interesse a un nombre fini p de mo-dalites du premier critere de classification, et a une infinite ou une quasi-infinitede variantes du deuxieme critere de classification, pour chacune des modalites dupremier critere. Un nombre fini q. de ces variantes sont choisies pour etre obser-vees, les nombres de variantes observees par modalite du premier critere etantegaux a qi . Le choix de ces variantes est effectue de maniere aleatoire et simple,et independamment d’une modalite a l’autre.

Quant au modele aleatoire, par contre, le nombre de modalites est considerecomme infini ou quasi infini pour les deux criteres de classification. Les p modalitesobservees du premier critere de classification sont tout d’abord choisies de manierealeatoire et simple, puis les q. modalites du deuxieme critere de classification sontchoisies comme pour le modele mixte.

2◦ Dans ces conditions, les differentes moyennes theoriques sont mi. , Mj|i etm.. pour le modele mixte, Mi. , Mj|i et m.. pour le modele aleatoire.

Les effets principaux correspondants sont, d’une part :

ai = mi. −m.. et Bj|i = Mj|i −mi. ,

et d’autre part :

Ai = Mi. −m.. et Bj|i = Mj|i −Mi. .

3◦ Le modele theorique s’ecrit alors 37 :

Xijk −m.. = ai + Bj|i + Dijk ou Xijk −m.. = Ai + Bj|i + Dijk .

Toutes les variables aleatoires Ai , Bj|i et Dijk sont supposees normales, indepen-dantes les unes des autres, de moyennes nulles, et de variances respectives σ2

A , σ2B

et σ2.Comme dans le cas du modele observe (§ 10.5.2.4◦), le terme relatif au deuxieme

critere de classification (Bj|i) prend la place de deux termes presents dans les mo-deles croises (Bj et Cij).

4◦ Les hypotheses nulles sont ici, pour le modele mixte :

H0 : a1 = a2 = . . . = ap = 0 ou m1. = m2. = . . . = mp. et H00 : σ2

B = 0 ,

37 Par souci de concordance avec ce que nous avons fait precedemment, nous conservons icila notation Dijk pour designer les ecarts residuels. Nous aurions aussi pu specifier clairement lahierarchie en introduisant, au contraire, la notation Dk|j|i , de meme que nous aurions pu utiliserle symbole Dk|ij pour les modeles croises.

340 ANALYSE DE LA VARIANCE A DEUX CRITERES 10.5.3

et pour le modele aleatoire :

H0 : σ2A = 0 et H0

0 : σ2B = 0 .

Les hypotheses relatives au premier critere de classification doivent etre inter-pretees comme precedemment. Par contre, l’hypothese relative a σ2

B doit etreconsideree comme une hypothese d’egalite des moyennes des infinites ou quasi-infinites de modalites du deuxieme critere de classification, a l’interieur des p oude l’infinite ou quasi-infinite de modalites du premier critere.

5◦ En vue de simplifier la presentation, nous ne considerons dans la suite quele cas des modeles equilibres, a effectifs q et n constants.

Les esperances mathematiques des carres moyens sont alors :

E(CMa) = σ2 + nσ2B +

q n

p− 1

pX

i=1

a2i ou E(CMa) = σ2 + nσ2

B + q nσ2A ,

E(CMb|a) = σ2 + nσ2B et E(CMr) = σ2 .

De meme, dans les conditions qui viennent d’etre definies, les distributionsd’echantillonnage des sommes des carres des ecarts, divisees par σ2, sont toujoursdes distributions χ2, independantes les unes des autres.

6◦ Les tests d’hypotheses peuvent etre effectues en consequence en calculantles quantites :

Fa = CMa/CMb|a et Fb = CMb|a/CMr ,

et par comparaison avec les distributions F de Fisher-Snedecor a p−1 et p (q−1)degres de liberte d’une part, p (q − 1) et p q (n− 1) degres de liberte d’autre part.

Eventuellement, il peut etre utile de regrouper, comme dans le cas des modelescroises (§ 10.3.5.3◦), les deux dernieres sources de variation.

7◦ Enfin, des estimations de moyennes, de differences de moyennes et de com-posantes de la variance, ainsi que des determinations de limites de confiance,peuvent etre realisees selon les memes principes que precedemment (§ 10.3.2.7◦et 10.3.3.8◦).

d Des informations complementaires, relatives notamment au cas non equilibreet a l’estimation des composantes de la variance, peuvent etre trouvees dans lesouvrages cites au paragraphe 16.4.5.3◦, ainsi que dans certains articles specifiques,tels ceux de Hernandez et al. [1992], Rao et Heckler [1997], et Sen et al.[1992].b

10.5.3 MODELES HIERARCHISES 341

Exemple 10.5.2. Comparaison et etude de l’homogeneite des rendements four-ragers de deux types de prairies : suite de l’analyse de la variance.

En ce qui concerne le probleme etudie au cours de l’exemple 10.5.1, s’il s’agitbien de deux types donnes de prairies, le modele d’analyse de la variance doitetre considere comme mixte, les types de prairies constituant un facteur fixe et lesprairies elles-memes un facteur aleatoire.

Le test de l’hypothese d’egalite des rendements des deux types de prairies doitetre realise par rapport aux differences entre prairies, avec 1 et 4 degres de liberte,et le test de l’hypothese de nullite de ces differences, par rapport aux differencesentre parcelles, avec 4 et 24 degres de liberte. Le premier test conduit a un resultatnon significatif, et le second fait apparaıtre des differences hautement significatives(tableau 10.5.3). Ce dernier test confirme en fait, en l’amplifiant, la conclusionanterieure, relative aux prairies du premier type (exemple 9.3.3).

Le controle de l’hypothese d’egalite des variances par la methode de Levenemet toutefois en evidence une certaine inegalite des variances entre prairies, lesvaleurs extremes de ces variances etant dans le rapport de 1 a 7. Les effectifs etantconstants aux differents niveaux de l’echantillonnage, cette situation ne met pasen cause les conclusions des tests, et ne devrait pas empecher la determinationeventuelle de limites de confiance pour la difference de rendements entre les deuxtypes de prairies. Il y aurait par contre lieu d’etre prudent et d’envisager le recoursa l’une ou l’autre transformation de variable en vue de l’estimation eventuelle decomposantes de la variance.

Cet exemple permet aussi de formuler quelques remarques complementairesd’interet general. La premiere, que nous avons deja evoquee dans le cadre del’exemple 2.2.1, a trait au choix de la base de comparaison relative aux differencesentre types de prairies.

A cet egard, on peut voir facilement ce que les memes observations auraientdonne comme resultats si on avait neglige le facteur prairies, en considerant qu’ondispose de 15 observations aleatoires et independantes pour chacun des deux types.On aurait alors realise une analyse de la variance a un critere de classification, dontla composante factorielle aurait ete identique a la premiere composante de l’analysea deux criteres, et dont la composante residuelle aurait reuni les deux dernierescomposantes de cette analyse.

On aurait obtenu de cette maniere :

Fobs = 3,4273/0,4030 = 8,50 et P(F ≥ 8,50) = 0,0069 ,

avec 1 et 28 degres de liberte, l’analyse mettant en evidence, indument, une diffe-rence hautement significative de rendement entre les deux types de prairies. Cetteapproche aurait aussi donne une precision tout a fait illusoire a d’eventuelles limitesde confiance de la difference de moyennes.

Cet exemple souligne donc bien la necessite de toujours prendre en considera-tion toutes les sources de variation qui interviennent dans le probleme etudie, etde choisir dans chaque cas les bases de comparaison qui s’imposent.

342 ANALYSE DE LA VARIANCE A DEUX CRITERES 10.6.1

Une deuxieme remarque concerne le choix des effectifs, aux differents niveauxde l’echantillonnage.

Nous avons souligne anterieurement l’interet qu’il y aurait eu a augmenterle nombre de prairies, en le portant de 3 a 5 ou a 7 par exemple, et a reduireeventuellement le nombre de parcelles par prairies, en le ramenant de 5 a 3 oua 2 par exemple, dans l’optique de l’estimation des composantes de la variance(exemple 9.4.4). Ce principe reste entierement d’application en ce qui concerne lacomparaison des rendements moyens des deux types de prairies.

Sans aucun calcul de puissance et sans realiser ici aucune determination precisedes effectifs, on peut en effet constater tout simplement qu’avec 5 ou 7 prairiespour chacun des deux types, le nombre de degres de liberte relatif aux differencesentre prairies aurait ete egal a 8 ou a 12 , au lieu de 4 . En consequence, pour unememe valeur numerique de cette variable, la probabilite associee a la variable Faurait ete sensiblement plus reduite, les valeurs critiques correspondantes F0,95

etant d’ailleurs egales a 4,75 ou 5,32 , au lieu de 7,71 (table IV), soit une reductionde l’ordre de 30 ou 40 %. Nous reviendrons sur ce point au cours de l’exemple10.6.2.

10.6 La puissance et la determinationdes nombres d’observations

10.6.1 Principes generaux

1◦ Les principes que nous avons presentes anterieurement a propos de l’ana-lyse de la variance a un critere de classification (§ 9.4) restent d’application,d’une maniere generale, pour l’analyse a deux criteres. Nous nous contenteronsdonc de les rappeler brievement, en considerant successivement les modeles croises(§ 10.6.2) et les modeles hierarchises (§ 10.6.3), et en nous limitant aux problemesde determination des nombres d’observations dans le cas des echantillons de memeeffectif.

d 2◦ En ce qui concerne la puissance des tests, on peut se referer eventuellementaux publications citees au paragraphe 9.4.2.3◦.

Le cas echeant, il faudra etre particulierement attentif a la determination desparametres de decentrage. Pour le premier facteur d’un modele fixe d’analyse de lavariance a deux criteres de classification, par exemple, le parametre qui remplacela valeur ∏ definie au paragraphe 9.4.2.4◦ est :

∏ =q n

σ2

pX

i=1

a2i .

b

10.6.2 PUISSANCE ET NOMBRES D’OBSERVATIONS 343

10.6.2 Le cas des modeles croises

1◦ Pour le modele croise fixe, les nombres de modalites p et q des deux criteresde classification sont determines a priori, et seul l’effectif n doit etre fixe.

Les formules et l’abaque relatifs au test t d’egalite de deux moyennes (§ 8.4.4.1◦)restent applicables en premiere approximation, toujours en considerant que le coef-ficient de variation cv est le coefficient de variation correspondant au carre moyenresiduel, et que la difference δr est l’amplitude des moyennes, exprimee en valeurrelative (§ 9.4.3.1◦). Il faut noter toutefois que les effectifs qui sont donnes par cesformules et cet abaque ne sont plus ici les effectifs n des differents echantillons,mais bien les effectifs totaux relatifs aux differentes modalites des deux criteres declassification, c’est-a-dire le produit q n en ce qui concerne le premier critere et leproduit pn en ce qui concerne le deuxieme critere.

d De meme, l’abaque presente a la figure 9.4.1 peut toujours etre utilise, en vued’obtenir des informations plus precises, pour autant que le nombre de degres deliberte du carre moyen residuel soit au moins de l’ordre de 15 a 20.b

2◦ Dans le cas du modele croise mixte, le probleme de la determination desnombres d’observations est double, puisqu’il faut fixer, non seulement l’effectif n ,mais aussi le nombre de modalites q du facteur aleatoire. Le principe de base est, iciegalement, d’augmenter au maximum cette derniere valeur, en diminuant autantque possible l’effectif n (§ 9.4.4.2◦). On notera que le cas extreme n = 1 conduiraita ne disposer que d’une observation par population, avec toutes les limitationsqu’une telle situation impliquerait (§ 10.3.6.3◦).

En outre, en ce qui concerne la determination du nombre d’observations relatifau facteur fixe, il ne faut pas perdre de vue que la base de comparaison n’est plusla composante residuelle, mais bien la composante d’interaction.

d Des tables particulieres, relatives au cas des blocs aleatoires complets, avec uneobservation par cellule, sont fournies notamment pas Kastenbaum et al. [1970b].b

3◦ Enfin, dans le cas du modele croise aleatoire, le principe est toujours d’aug-menter au maximum les nombres p et q de variantes, en diminuant autant quepossible l’effectif n .

Exemple 10.6.1. Comparaison de trois types de sondes dans deux types de sols :determination des nombres d’observations.

Reprenons encore en consideration les donnees de l’exemple 10.2.1, dans l’op-tique cette fois de la determination des nombres d’observations, et envisageonsplus particulierement le probleme de la comparaison des trois types de sondes.

Le coefficient de variation correspondant au carre moyen residuel est pratique-ment egal a 6 % (tableaux 10.2.2 et 10.2.3) :

cv =p

6,25±42,00 = 6,0 % .

344 ANALYSE DE LA VARIANCE A DEUX CRITERES 10.6.3

Si on souhaite mettre en evidence des differences de moyennes de l’ordre de 5 %,entre les trois types de sondes, les formules et l’abaque du paragraphe 8.4.4.1◦ in-diquent qu’il faut disposer de 12 observations pour des risques d’erreur de premiereet de deuxieme espece α et β egaux respectivement a 0,05 et 0,5 , et de 30 observa-tions pour des risques d’erreur egaux a 0,05 et 0,1 . Tenant compte de l’existencedu facteur types de sols, qui comporte deux modalites, ces resultats doivent etreinterpretes de la maniere suivante :

q = 2 et n = 6 ou 15 ,

soit respectivement 6 ou 15 observations pour chacune des six combinaisons destrois types de sondes et deux types de sols.

Inversement, on peut aussi determiner, a l’aide des memes relations, les diffe-rences qui peuvent etre mises en evidence a partir des observations dont on dispose,c’est-a-dire pour des effectifs n egaux a 4 . On obtient ainsi 6 %, soit environ 2,5 mgde P2O5 par 100 gr de terre seche, pour des risques d’erreur egaux a 0,05 et 0,5 ,et 9,7 ou 10 %, soit environ 4 mg de P2O5 par 100 gr de terre seche, pour desrisques d’erreur egaux a 0,05 et 0,1 .

On pourra remarquer que ces differents resultats sont tres proches de ceux quedonnerait l’abaque de la figure 9.4.1.

10.6.3 Le cas des modeles hierarchises

1◦ En ce qui concerne le modele hierarchise mixte, on a toujours interet adiminuer le plus possible l’effectif n . On peut meme envisager de reduire cet effectifa 1 , ce qui a comme consequence de revenir a une analyse de la variance a un cri-tere de classification, en perdant alors toute information relative au dernier niveaude variation, mais en disposant d’un maximum de puissance pour comparer lesdifferentes modalites du facteur fixe.

Le nombre p de ces modalites etant connu et l’effectif n ayant ete fixe a savaleur minimum possible, il reste a determiner le nombre q de modalites du facteuraleatoire. Cette determination peut etre realisee comme pour le modele croisemixte (§ 10.6.2.2◦), mais en faisant intervenir ici la composante relative au facteuraleatoire comme base de comparaison.

2◦ Enfin, en ce qui concerne le modele hierarchise aleatoire, le principe de baseest de reduire a la fois les valeurs de q et de n aux minimums possibles, mais sansjamais descendre a 1 si on souhaite pouvoir identifier toutes les composantes de lavariance.

EXERCICES 345

Exemple 10.6.2. Comparaison et etude de l’homogeneite des rendements four-ragers de deux types de prairies : determination des nombres d’observations.

Pour le probleme envisage dans le cadre des exemples 10.5.1 et 10.5.2, lescomposantes de la variance peuvent etre estimees comme suit (tableau 10.5.3) :

bσ2B = (1,3852− 0,2392)/5 = 0,2292 et bσ2 = 0,2392 ,

et la base de comparaison relative au critere types de prairies est :

CMb|a = 1,3852 ou 1,39 .

On peut tout d’abord constater que cette base de comparaison serait reduitede moitie si le nombre de parcelles observees par prairie etait ramene a 3 , au lieude 5 , et des deux tiers si ce nombre de parcelles etait ramene a 2 , puisque :

0,2392 + 2 (0,2292) = 0,6976 ou 0,70 et 0,2392 + 0,2292 = 0,4684 ou 0,47.

Pour un meme nombre total d’observations, et tenant compte en outre de l’accrois-sement du nombre de degres de liberte qui en resulterait pour le facteur prairies(exemple 10.5.2), la puissance du test serait alors considerablement augmentee.

En supposant qu’on puisse adopter la valeur la plus reduite (n = 2), et qu’onsouhaite, par exemple, mettre en evidence une difference de rendement de l’ordrede 10 % entre les deux types de prairies, pour des risques d’erreur de premiere etde deuxieme espece α et β egaux respectivement a 0,05 et 0,1 , on peut determinerla valeur de q de la maniere suivante :

x... = 2,491 , cv =p

0,4684±2,491 = 27,5 % ,

q n = 21 (0,2752)/0,102 = 159 et q = 80 .

Cet effectif de 80 prairies pour chacun des deux types de prairies, avec deux mesuresde rendement par prairie, peut paraıtre exorbitant. C’est cependant le ✭✭ prix apayer ✮✮ pour atteindre l’objectif fixe, tenant compte de la tres grande variabiliteobservee. Une reduction a un quart de cet effectif, soit q = 20 , conduirait a undoublement de la difference de rendement qu’on peut esperer mettre en evidence,soit 20 % au lieu de 10 %.

Exercices

10.1. Les resultats suivants, exprimes en µA , ont ete obtenus en analysant une substanceherbicide par polarographie, a deux temperatures differentes, au cours de quatre journees,considerees comme aleatoires, et chaque fois avec deux repetitions. Procedez a l’analysede ces resultats, de maniere a mettre en evidence l’existence eventuelle d’une difference

346 ANALYSE DE LA VARIANCE A DEUX CRITERES

significative due au facteur temperature et, le cas echeant, estimez cette difference etdeterminez ses limites de confiance.

Temperatures Jour 1 Jour 2 Jour 3 Jour 4

25◦ 3,58 et 3,48 3,50 et 3,44 3,48 et 3,52 3,54 et 3,6040◦ 3,55 et 3,58 3,55 et 3,63 3,59 et 3,57 3,63 et 3,60

10.2. Une experience en blocs aleatoires complets a ete realisee dans le but de verifiers’il y a, parmi dix varietes d’orge, des differences significatives de rendements et, le casecheant, d’identifier les varietes les plus productives. Procedez a l’analyse des resultatsdonnes ci-dessous, qui sont des rendements exprimes en tonnes par hectare.

VarietesBlocs

1 2 3 4 5 6 7 8 9 10

1 5,57 6,09 6,21 7,06 6,52 6,24 6,09 6,76 6,65 7,952 5,79 6,57 6,73 7,36 6,31 7,69 6,83 7,27 7,48 6,773 6,14 7,51 6,86 7,02 5,90 7,41 6,54 6,81 8,35 7,594 5,83 7,27 6,84 7,25 6,14 7,55 7,35 6,35 8,33 7,49

10.3. Vingt-quatre porcelets, appartenant a six nichees differentes, ont ete soumis aquatre traitements differents, un porcelet de chacune des nichees etant soumis a chacundes traitements. En fonction des accroissements en poids suivants, observes au coursd’une meme periode et exprimes en kg, une donnee etant manquante, peut-on admettrequ’il n’y a pas de differences significatives de croissance d’un traitement a l’autre ?

NicheesTraitements

1 2 3 4 5 6

1 59,0 69,4 75,0 71,2 60,3 68,62 64,9 71,4 72,2 78,0 68,2 77,03 69,2 72,0 74,1 81,7 58,3 –4 67,0 77,4 74,7 81,3 64,6 78,5

10.4. Les resultats suivants sont relatifs a la vitesse moyenne de croissance, en mm parjour, des pedoncules floraux observes sur huit plantes de cyclamen, reparties au hasardentre deux milieux de culture. Peut-on conclure sur cette base a l’existence d’une diffe-rence significative de vitesse de croissance entre les deux milieux ?

Milieu 1 Milieu 2Pl. 1 Pl. 2 Pl. 3 Pl. 4 Pl. 1 Pl. 2 Pl. 3 Pl. 4

0,76 0,97 0,58 0,86 0,81 1,07 0,62 0,930,66 0,74 0,57 0,93 0,77 0,82 0,99 1,070,61 0,51 1,02 0,950,65 0,62 0,79

0,66

10.5. Procedez a l’analyse des donnees de l’exemple 4.3.1 (tableau 4.3.1).

Chapitre 11

L’analyse de la variance atrois et plus de trois criteresde classification

Sommaire

11.1 Introduction11.2 L’analyse de la variance a trois criteres de classification :

modeles croises a effectifs egaux11.3 L’analyse de la variance a trois criteres de classification :

modeles hierarchises a effectifs egaux11.4 L’analyse de la variance a plus de trois criteres de classification

348 ANALYSE DE LA VARIANCE A TROIS ET PLUS DE TROIS CRITERES 11.1

11.1 Introduction

1◦ L’analyse de la variance a trois criteres de classification 1 et, d’une maniereplus generale, l’analyse de la variance a un nombre quelconque de criteres de clas-sification 2 presentent la meme diversite de modeles que l’analyse a deux criteres(§ 10.1.1◦) : modeles croises et hierarchises, modeles fixes, aleatoires et mixtes, etmodeles a effectifs egaux et inegaux. Cette diversite s’accentue meme, en raisonde l’existence dans chaque cas de plusieurs modeles mixtes et de differents typesde modeles hierarchises.

Nous envisagerons successivement l’analyse a trois criteres de classification, ence qui concerne les modeles croises (§ 11.2) et les modeles hierarchises (§ 11.3),puis l’analyse a un nombre quelconque de criteres de classification (§ 11.4). Nousprocederons toujours par analogie avec ce qui a ete vu anterieurement, maisde maniere sensiblement plus rapide, et nous nous en tiendrons ici au cas desechantillons de meme effectif, en considerant ulterieurement le cas des effectifsinegaux, sous l’angle du modele lineaire (§ 16.4.5).

Les exemples 11.2.1, 11.2.4 et 11.3.2 sont des illustrations des problemes con-sideres au cours de ce chapitre.

2◦ Les memes principes que precedemment restent en vigueur en ce qui con-cerne les conditions d’application de l’analyse de la variance : populations normaleset de memes variances, et echantillons aleatoires, simples et independants (§ 9.1.3◦et 10.1.3◦).

d 3◦ Les references bibliographiques generales du paragraphe 9.1.4◦ peuventtoujours etre consultees ici egalement, en plus de celles qui sont citees dans letexte. Elles peuvent etre completees par les references relatives au modele lineaire(§ 16.1.5◦).

Il faut noter en outre que nous nous limitons a la presentation de l’analysede la variance classique, a l’exclusion d’autres possibilites, telles que les modelesa effets principaux additifs et interactions multiplicatives (modeles AMMI) et lesmethodes non parametriques et robustes. Certaines des references donnees auxparagraphes 10.3.1.2◦ et 10.3.8.5◦ peuvent eventuellement fournir des indicationsrelatives a ces diverses possibilites, dans le cas de trois ou plus de trois criteresde classification. On peut y ajouter le travail de van Eeuwijk et Kroonenberg[1998].b

1 En anglais : three-way analysis of variance.2 En anglais : multi-way analysis of variance.

11.2.2 MODELES CROISES A TROIS CRITERES 349

11.2 L’analyse de la variance a trois criteresde classification : modeles croisesa effectifs egaux

11.2.1 Principes generaux

Comme en analyse de la variance a un et a deux criteres de classification,nous presenterons successivement les aspects descriptifs (§ 11.2.2) et les aspectsinferentiels (§ 11.2.3) de l’analyse a trois criteres, en nous limitant, dans un premiertemps, aux echantillons de plusieurs observations. Nous envisagerons ensuite le casparticulier des echantillons d’une seule observation (§ 11.2.4).

11.2.2 Les aspects descriptifs : echantillons de plusieursobservations

1◦ Pour trois criteres de classification et dans le cas des effectifs egaux,on peut considerer qu’on a p q r echantillons ou series d’observations d’effectif n ,et designer les observations individuelles par xijkl (i = 1 , . . . , p , j = 1 , . . . , q ,k = 1 , . . . , r , et l = 1 , . . . ,n).

A partir de ces observations, on peut calculer les differentes moyennes sui-vantes :

xijk. , xij.. , xi.k. , x.jk. , xi... , x.j.. , x..k. et x.... .

Ces moyennes sont relatives, respectivement, aux differentes combinaisons des mo-dalites des trois facteurs consideres simultanement (p q r moyennes xijk.), aux dif-ferentes combinaisons des modalites des trois facteurs consideres deux a deux(p q moyennes xij.. , p r moyennes xi.k. , et q r moyennes x.jk.), aux differentes mo-dalites des trois facteurs consideres individuellement (p moyennes xi... , q moyen-nes x.j.. , et r moyennes x..k.), et a l’ensemble des p q r n observations (moyennegenerale x....).

2◦ Dans ces conditions, le modele observe s’ecrit :

xijkl − x.... =(xi... − x....) + (x.j.. − x....) + (x..k. − x....) + (xij.. − xi... − x.j.. + x....)+ (xi.k. − xi... − x..k. + x....) + (x.jk. − x.j.. − x..k. + x....)+ (xijk. − xij.. − xi.k. − x.jk. + xi... + x.j.. + x..k. − x....) + (xijkl − xijk.) .

Le deuxieme membre de ce modele contient successivement trois termes de varia-tion factorielle lies individuellement aux trois criteres de classification, trois termesd’interaction des differents facteurs consideres deux a deux, un terme d’interactiondes trois facteurs consideres simultanement, et un terme de variation residuelle.

350 ANALYSE DE LA VARIANCE A TROIS ET PLUS DE TROIS CRITERES 11.2.2

Les interactions des differents facteurs consideres deux a deux se presententet doivent etre interpretees comme en analyse de la variance a deux criteres declassification (§ 10.2.4). Ces interactions simples sont appelees interactions de deuxfacteurs ou interactions du premier ordre 3.

Le terme d’interaction des trois facteurs ou interaction du deuxieme ordre 4

apparaıt ici pour la premiere fois. Ce terme est nul, pour toutes les valeurs de i ,de j et de k , quand les interactions de deux des facteurs, quels qu’ils soient, nedependent pas du troisieme facteur. Nous reviendrons sur ce point au paragraphe11.2.3.3◦.

3◦ L’equation d’analyse de la variance relative a ce modele observe est :

SCEt = SCEa + SCEb + SCEc + SCEab + SCEac + SCEbc + SCEabc + SCEr ,

les lettres a , b et c etant associees, respectivement, a chacun des trois facteurs.Aux differentes sommes des carres des ecarts, correspondent des nombres de

degres de liberte lies par la relation :

p q r n− 1 = (p− 1) + (q − 1) + (r − 1) + (p− 1) (q − 1) + (p− 1) (r − 1)+ (q − 1) (r − 1) + (p− 1) (q − 1) (r − 1) + p q r (n− 1) .

Ces differentes relations se justifient comme en analyse de la variance a deuxcriteres de classification (§ 10.2.2.3◦ et 10.2.2.4◦).

4◦ Comme precedemment toujours, la division des sommes des carres des ecartspar les nombres de degres de liberte permet de definir les carres moyens, et l’en-semble des resultats peut etre presente sous la forme d’un tableau d’analyse de lavariance. Le tableau 11.2.2, relatif a l’exemple 11.2.1, en est une illustration, pourdes valeurs de p , q , r et n egales respectivement a 2 , 2 , 3 et 5 .

d 5◦ En generalisant ce qui a ete dit au paragraphe 10.5.2.7◦, le modele croised’analyse de la variance a trois criteres de classification peut etre presente de lamaniere suivante, en vue de la realisation des calculs a l’aide, par exemple, dulogiciel Minitab :

X = A B C A*B A*C B*C A*B*C ,

l’expression A*B*C designant l’interaction des trois facteurs.Ici comme ailleurs, les simples lettres A , B , C , etc. peuvent etre remplacees

par d’autres symboles, pour assurer dans chaque cas une certaine adaptation auprobleme considere. Ainsi, en ce qui concerne l’exemple 11.2.1, qui fait intervenirdes facteurs clous, anneaux et vitesses, on pourrait ecrire :

X = CL ANN VIT CL*ANN CL*VIT ANN*VIT CL*ANN*VIT .

3 En anglais : two-factor interaction, first-order interaction.4 En anglais : three-factor interaction, second-order interaction.

11.2.2 MODELES CROISES A TROIS CRITERES 351

D’autre part, nous ne donnons plus aucune information generale quant a larealisation ✭✭ manuelle ✮✮ des calculs, les donnees etant pratiquement toujours trai-tees par ordinateur.

Seule la methode de Yates 5, relative au cas des facteurs qui ne possedentchacun que deux modalites, est encore utilisee assez couramment ✭✭ a la main ✮✮.Son emploi est particulierement simple a l’aide de tableurs et cette methode estillustree par l’exemple 11.2.2.b

d 6◦ On notera aussi que tout ce qui a ete dit au paragraphe 10.4.2 en matiered’estimation des donnees manquantes peut etre applique aux modeles croisesd’analyse de la variance a trois criteres de classification.b

Exemple 11.2.1. Etude de la resistance de panneaux de particules a l’arrachagedes clous : analyse de la variance.

Une des qualites essentielles qui sont exigees des panneaux agglomeres, consti-tues de particules ou de fibres de bois, est la resistance de ces panneaux a l’arra-chage des clous. Au cours d’un essai preliminaire, destine a preciser les conditionsde mesure de cette propriete, on a etudie simultanement l’influence de trois fac-teurs : la grosseur des clous, le diametre des anneaux sur lesquels sont deposeesles eprouvettes soumises aux essais, et la vitesse d’arrachage [Carre, 1963].

Les essais ont ete effectues sur des eprouvettes carrees de 50 mm de cote, lesmodalites des trois facteurs etant : 6,5 et 8 mm de diametre en ce qui concerneles tetes des clous (i = 1 et 2), 22 et 30 mm de diametre en ce qui concerne lesdiametres des anneaux servant de supports (j = 1 et 2), 22 , 45 et 90 mm parminute en ce qui concerne les vitesses d’arrachage (k = 1 , 2 et 3). En outre, cinqeprouvettes ont ete utilisees pour chacune des 12 combinaisons des modalites destrois facteurs (l = 1 , . . . , 5). Le tableau 11.2.1 reunit l’ensemble des observationsrealisees, exprimees en kilogrammes.

La presentation de ce tableau, qui contient non seulement les valeurs observees,mais aussi les valeurs de tous les indices, correspond aux exigences de la plupartdes logiciels statistiques. La presentation la plus classique est en effet, dans le casenvisage ici, un tableau de 60 lignes et cinq colonnes, ou eventuellement quatrecolonnes, la colonne l n’etant pas indispensable.

Le tableau 11.2.2 donne les resultats de l’analyse de la variance, y compris lesresultats des tests F , dont il sera question ulterieurement (exemple 11.2.3).

d Exemple 11.2.2. Etude de la resistance de panneaux de particules a l’arrachagedes clous : realisation de l’analyse de la variance par la methode de Yates.

En vue d’illustrer la methode de calcul de Yates, on peut reprendre les memesdonnees, en eliminant par exemple les observations relatives a la troisieme vitesse

5 En anglais : Yates’s method.

352 ANALYSE DE LA VARIANCE A TROIS ET PLUS DE TROIS CRITERES 11.2.2

Tableau 11.2.1. Resistance de panneaux de particules a l’arrachage des clous(xijkl), en kg, pour deux grosseurs de clous (i), deux diametres d’anneaux (j),

trois vitesses d’arrachage (k), et dans chaque cas cinq eprouvettes (l).

i j k l xijkl

1 1 1 1 541 1 1 2 561 1 1 3 581 1 1 4 511 1 1 5 57

1 1 2 1 571 1 2 2 581 1 2 3 611 1 2 4 591 1 2 5 55

1 1 3 1 601 1 3 2 681 1 3 3 611 1 3 4 611 1 3 5 67

i j k l xijkl

1 2 1 1 541 2 1 2 511 2 1 3 471 2 1 4 511 2 1 5 59

1 2 2 1 521 2 2 2 561 2 2 3 521 2 2 4 521 2 2 5 53

1 2 3 1 631 2 3 2 541 2 3 3 651 2 3 4 621 2 3 5 60

i j k l xijkl

2 1 1 1 672 1 1 2 712 1 1 3 722 1 1 4 702 1 1 5 81

2 1 2 1 792 1 2 2 802 1 2 3 812 1 2 4 802 1 2 5 85

2 1 3 1 782 1 3 2 782 1 3 3 772 1 3 4 832 1 3 5 79

i j k l xijkl

2 2 1 1 672 2 1 2 662 2 1 3 622 2 1 4 712 2 1 5 69

2 2 2 1 722 2 2 2 672 2 2 3 752 2 2 4 702 2 2 5 71

2 2 3 1 782 2 3 2 812 2 3 3 672 2 3 4 762 2 3 5 75

Tableau 11.2.2. Etude de la resistance de panneaux de particules a l’arrachagedes clous : tableau d’analyse de la variance.

Sources Degres S. des carres CarresF P

de variation de liberte des ecarts moyens

Grosseurs des clous 1 4.403,3 4.403,3 344 *** 0,0000Diametres des anneaux 1 355,3 355,3 27,8 *** 0,0000Vitesses d’arrachage 2 632,1 316,0 24,7 *** 0,0000

Clous-anneaux 1 29,4 29,4 2,30 0,14Clous-vitesses 2 86,2 43,1 3,37 * 0,043Anneaux-vitesses 2 54,0 27,0 2,11 0,13

Clous-anneaux-vitesses 2 10,3 5,1 0,40 0,67

Variation residuelle 48 614,0 12,79

Totaux 59 6.184,6

d’arrachage (k = 3). On se trouve bien, alors, en presence de trois facteurs posse-dant chacun deux modalites. Une telle situation est dite 2× 2× 2 , ou encore 23.

Le tableau 11.2.3 contient les observations en question, les valeurs 1 et 2 destrois indices etant remplacees, respectivement, par − 1 et 1 , et la colonne l , quin’a aucune utilite ici, ayant ete supprimee.

11.2.2 MODELES CROISES A TROIS CRITERES 353

Tableau 11.2.3. Resistance de panneaux de particules a l’arrachage des clous(xijkl), en kg, pour deux grosseurs de clous (i), deux diametres d’anneaux (j),

deux vitesses d’arrachage (k), et dans chaque cas cinq eprouvettes.

i j k xijkl

– 1 – 1 – 1 54– 1 – 1 – 1 56– 1 – 1 – 1 58– 1 – 1 – 1 51– 1 – 1 – 1 57

– 1 – 1 1 57– 1 – 1 1 58– 1 – 1 1 61– 1 – 1 1 59– 1 – 1 1 55

i j k xijkl

– 1 1 – 1 54– 1 1 – 1 51– 1 1 – 1 47– 1 1 – 1 51– 1 1 – 1 59

– 1 1 1 52– 1 1 1 56– 1 1 1 52– 1 1 1 52– 1 1 1 53

i j k xijkl

1 – 1 – 1 671 – 1 – 1 711 – 1 – 1 721 – 1 – 1 701 – 1 – 1 81

1 – 1 1 791 – 1 1 801 – 1 1 811 – 1 1 801 – 1 1 85

i j k xijkl

1 1 – 1 671 1 – 1 661 1 – 1 621 1 – 1 711 1 – 1 69

1 1 1 721 1 1 671 1 1 751 1 1 701 1 1 71

Ce tableau permet de calculer facilement les sommes de produits suivantes :X

i, j, k, l

(i xijkl) = 363 ,X

i, j, k, l

(j xijkl) = − 115 ,X

i, j, k, l

(k xijkl) = 81 ,

X

i, j, k, l

(i j xijkl) = − 37,X

i, j, k, l

(i k xijkl) = 47,X

i, j, k, l

(j k xijkl) = − 35 ,

etX

i, j, k, l

(i j k xijkl) = − 13 ,

les differentes sommes etant toutes etendues a l’ensemble des 40 observations. Dufait de la conversion des valeurs des indices i , j et k , en − 1 et 1 , ces sommes deproduits permettent elles-memes de calculer aisement les sommes des carres desecarts factorielles et d’interactions :

SCEa = (363)2/40 = 3.294,2 , SCEb = (− 115)2/40 = 330,6 ,

SCEc = (81)2/40 = 164,0 , SCEab = (− 37)2/40 = 34,2 ,

SCEac = (47)2/40 = 55,2 , SCEbc = (− 35)2/40 = 30,6 ,

et SCEabc = (− 13)2/40 = 4,2 .

Ces differentes valeurs figurent dans le tableau 11.2.4.En outre, la somme des carres des ecarts totale peut etre calculee tout a fait

normalement pour l’ensemble des observations, et la somme des carres des ecartsresiduelle peut etre calculee par difference. Les resultats ainsi obtenus figurentegalement dans le tableau 11.2.4. Le tout est tres comparable au contenu du tableau11.2.2.

354 ANALYSE DE LA VARIANCE A TROIS ET PLUS DE TROIS CRITERES 11.2.3

Tableau 11.2.4. Etude de la resistance de panneaux de particules a l’arrachagedes clous : tableau d’analyse de la variance dans le cas 23.

Sources Degres S. des carres CarresF P

de variation de liberte des ecarts moyens

Grosseurs des clous 1 3.294,2 3.294,2 297 *** 0,0000Diametres des anneaux 1 330,6 330,6 29,8 *** 0,0000Vitesses d’arrachage 1 164,0 164,0 14,8 *** 0,0005

Clous-anneaux 1 34,2 34,2 3,09 0,088Clous-vitesses 1 55,2 55,2 4,98 * 0,033Anneaux-vitesses 1 30,6 30,6 2,76 0,11

Clous-anneaux-vitesses 1 4,2 4,2 0,38 0,54

Variation residuelle 32 355,0 11,09

Totaux 39 4.268,0

Les trois premieres sommes de produits determinees ci-dessus permettent decalculer aussi tres facilement les differences de moyennes liees aux trois facteursprincipaux :

x2... − x1... = 363/20 = 18,2 kg , x.2.. − x.1.. = − 115/20 = − 5,8 kg

et x..2. − x..1. = 81/20 = 4,0 kg .

Enfin, les differentes sommes des produits permettent d’estimer les effets princi-paux et les termes d’interaction, qui seront definis au paragraphe 11.2.3 :

ba2 = 363/40 = 9,1 kg , bb2 = − 115/40 = − 2,9 kg , bc2 = 81/40 = 2,0 kg ,

( bab)22 = − 37/40 = − 0,9 kg , ( bac)22 = 47/40 = 1,2 kg ,

(bbc)22 = − 35/40 = − 0,9 kg et ( cabc)222 = − 13/40 = − 0,3 kg .b

11.2.3 Les aspects inferentiels : echantillons de plusieursobservations

1◦ Dans le cas de l’analyse de la variance a trois criteres de classification, quatremodeles croises differents doivent etre consideres : un modele fixe, deux modelesmixtes et un modele aleatoire. Ces modeles correspondent respectivement a trois,deux, un et zero facteurs fixes d’une part, et simultanement zero, un, deux et troisfacteurs aleatoires d’autre part.

2◦ Par analogie avec le modele fixe a deux criteres de classification (§ 10.3.2.2◦)et avec le modele observe a trois criteres (§ 11.2.2.2◦), le modele theorique fixe a

11.2.3 MODELES CROISES A TROIS CRITERES 355

trois criteres s’ecrit :

Xijkl −m... = ai + bj + ck + (ab)ij + (ac)ik + (bc)jk + (abc)ijk + Dijkl .

Les termes ai , bj et ck sont les effets principaux des trois facteurs. Les expressions(ab)ij , (ac)ik et (bc)jk designent les valeurs theoriques des interactions de deuxfacteurs. Et les quantites (abc)ijk sont les differents termes de l’interaction destrois facteurs.

3◦ En ce qui concerne ce dernier point, nous avons dit anterieurement quel’interaction des trois facteurs est nulle quand les interactions de deux facteursne dependent pas du troisieme facteur (§ 11.2.2.2◦). Nous pouvons preciser icique la nullite de l’interaction, ou l’absence d’interaction des trois facteurs, corres-pond au fait que les termes (ab)ij d’interaction des deux premiers facteurs, quipourraient etre calcules separement pour les differentes modalites k du troisiemefacteur, ne different pas d’une modalite a l’autre de ce facteur ; ou ce qui est stric-tement equivalent, que les quantites (ac)ik qui seraient calculees separement pourles differentes modalites j du deuxieme facteur ne varient pas d’une modalite al’autre de ce facteur ; ou encore, ce qui est toujours strictement equivalent, queles termes (bc)jk calcules separement pour les differentes modalites i du premierfacteur ne different pas non plus d’une modalite a l’autre de ce facteur.

4◦ De meme, les deux modeles theoriques mixtes sont, d’une part, pour deuxfacteurs fixes (a et b) et un facteur aleatoire (C) :

Xijkl −m... = ai + bj + Ck + (ab)ij + (aC)ik + (bC)jk + (abC)ijk + Dijkl ,

et d’autre part, pour un facteur fixe (a) et deux facteurs aleatoires (B et C) :

Xijkl −m... = ai + Bj + Ck + (aB)ij + (aC)ik + (BC)jk + (aBC)ijk + Dijkl .

Enfin, le modele theorique aleatoire est :

Xijkl −m... = Ai + Bj + Ck + (AB)ij + (AC)ik + (BC)jk + (ABC)ijk + Dijkl .

En ce qui concerne ces divers modeles, on doit etre specialement attentif ala distinction qui est faite entre les lettres minuscules et les lettres majuscules,notamment dans les differentes interactions. On remarquera aussi que ces troismodeles comportent respectivement trois, un et zero termes non aleatoires, alorsque le modele fixe en comporte sept.

Dans chaque cas, on suppose que les differentes composantes aleatoires sontnormales, independantes les unes des autres, de moyennes nulles et de variancechaque fois constante.

5◦ Les hypotheses nulles auxquelles on s’interesse sont, pour chaque modele,au nombre de sept. Pour les composantes non aleatoires, elles concernent la nullite

356 ANALYSE DE LA VARIANCE A TROIS ET PLUS DE TROIS CRITERES 11.2.3

des effets principaux ou des termes d’interaction (§ 10.3.2.3◦ et 10.3.4.4◦), tandisque pour les composantes aleatoires, elles s’expriment en termes de nullite desvariances (§ 10.3.3.4◦ et 10.3.4.4◦).

6◦ Comme en analyse de la variance a deux criteres de classification, le choix descomparaisons a realiser depend des esperances mathematiques des carres moyens.Celles-ci sont presentees dans le tableau 11.2.5, selon les memes principes que pre-cedemment (§ 10.3.5.1◦). En particulier, le signe + indique, comme precedemment,que les esperances mathematiques sont, selon les cas, des fonctions croissantes descarres des termes ai , bj , etc.

d On notera que nous nous en tenons ici egalement a la presentation de laforme restreinte de l’analyse de la variance, qui nous paraıt la plus pertinente(§ 10.3.4.8◦).b

7◦ Quand on dispose d’echantillons de plusieurs observations, tous les testspeuvent etre facilement realises dans le cas du modele fixe, et cela toujours parrapport au carre moyen residuel. Il en est de meme pour le premier modele mixte(facteurs a et b fixes), mais alors soit par rapport au carre moyen residuel, soit parrapport aux diverses interactions qui font intervenir le facteur aleatoire (C).

Des difficultes nouvelles apparaissent par contre en ce qui concerne le deuxiememodele mixte, qui ne comporte qu’un facteur fixe (a), et le modele aleatoire. Ainsi,dans ces deux cas, le premier facteur, qu’il soit fixe (a) ou aleatoire (A), ne possedeaucune base de comparaison qui soit adequate d’une maniere generale. Ce facteurpeut toutefois etre teste par rapport a son interaction avec le deuxieme facteur(aB ou AB), si son interaction avec le troisieme facteur (aC ou AC) est nulle,ou inversement, par rapport a son interaction avec le troisieme facteur, si soninteraction avec le deuxieme facteur est nulle. Il en est de meme pour le deuxiemeet le troisieme facteur dans le cas du modele aleatoire.

8◦ Des regroupements de sommes des carres des ecarts peuvent parfois etre rea-lises, comme en analyse de la variance a deux criteres de classification (§ 10.3.5.3◦).De tels regroupements se justifient d’ailleurs plus ici, dans la mesure ou les nombresde degres de liberte associes aux differentes interactions sont generalement d’autantplus reduits que le nombre de criteres de classification est plus eleve.

A cet egard, on peut recommander de proceder, dans toute la mesure du pos-sible, a des regroupements suffisamment importants pour eviter d’effectuer destests F avec moins de 10 degres de liberte au denominateur.

d 9◦ On peut envisager aussi de realiser certaines comparaisons en faisant inter-venir d’autres fonctions lineaires des carres moyens. Ainsi, le tableau 11.2.5 montrepar exemple que la quantite CMab +CMac−CMabc pourrait etre une base de com-paraison adequate pour le carre moyen CMa relatif au premier facteur, dans le casdu deuxieme modele mixte et du modele aleatoire. Un probleme se pose toutefoisen ce qui concerne la determination des nombres de degres de liberte a affecter ade telles fonctions de deux ou plusieurs carres moyens.

11.2.3 MODELES CROISES A TROIS CRITERES 357

Tab

leau

11.2

.5.E

sper

ance

sm

athe

mat

ique

sde

sca

rres

moy

ens,

pour

les

diffe

rent

sm

odel

escr

oise

sd’

anal

yse

dela

vari

ance

atr

ois

criter

esde

clas

sific

atio

n.

Car

res

Model

efixe

Model

em

ixte

(aet

bfixes

)m

oyen

2(a

bc)2 ij

k(b

c)2 jk

(ac)

2 ik(a

b)2 ij

c2 kb2 j

a2 i

σ2

σ2 abC

σ2 bC

σ2 aC

(ab)

2 ijσ

2 Cb2 j

a2 i

CM

a1

+1

qn

+C

Mb

1+

1p

n+

CM

c1

+1

pqn

CM

ab

1+

1n

+C

Ma

c1

+1

qn

CM

bc

1+

1p

n

CM

abc

1+

1n

CM

r1

1

Car

res

Model

em

ixte

(afixe)

Model

eal

eato

ire

moy

ens

σ2

σ2 aB

2 BC

σ2 aC

σ2 aB

σ2 C

σ2 B

a2 i

σ2

σ2 A

BC

σ2 B

2 AC

σ2 A

2 Cσ

2 Bσ

2 A

CM

a1

nqn

rn

+1

nqn

rn

qrn

CM

b1

pn

prn

1n

pn

rn

prn

CM

c1

pn

pqn

1n

pn

qn

pqn

CM

ab

1n

rn

1n

rn

CM

ac

1n

qn

1n

qn

CM

bc

1p

n1

np

n

CM

abc

1n

1n

CM

r1

1

358 ANALYSE DE LA VARIANCE A TROIS ET PLUS DE TROIS CRITERES 11.2.3

La solution la plus couramment utilisee est connue sous le nom de methodeou test F approche de Satterthwaite 6. Cette methode implique le calcul denombres de degres de liberte approximatifs, comme pour le test de Welch, relatifa l’egalite de deux moyennes (§ 8.4.2.3◦). Dans le cas considere ici, ce nombre dedegres de liberte est :

(CMab + CMac − CMabc)2/(CM2ab/kab + CM2

ac/kac + CM2abc/kabc) ,

si on designe par kab , kac et kabc , respectivement, les nombres de degres de libertede CMab , CMac et CMabc .b

d 10◦ D’une maniere plus generale, pour une fonction lineaire quelconquec1 CM1 + . . . + ch CMh , de h carres moyens, dont les nombres de degres de li-berte individuels sont k1 , . . . , kh , le nombre de degres de liberte approche est :

(c1 CM1 + . . . + ch CMh)2±(c2

1 CM21/k1 + . . . + c2

h CM2h/kh) .

On retrouve en particulier le cas du test de Welch (§ 8.4.2.3◦), en tenantcompte des relations suivantes :

CM1 = SCE1/(n1 − 1) , c1 = 1/n1 et k1 = n1 − 1 ,

CM2 = SCE2/(n2 − 1) , c2 = 1/n2 et k2 = n2 − 1 .

Des informations complementaires et d’autres solutions sont presentees parChiang [2001], Khuri [1995], Mosier et Graybill [1995], et Zhou et Mathew[1994].b

11◦ Des estimations de moyennes, de differences de moyennes et de com-posantes de la variance, ainsi que des calculs de limites de confiance, peuventetre realises comme en analyse de la variance a deux criteres de classification(§ 10.3.2.7◦, 10.3.3.8◦ et 10.3.4.7◦).

d En outre, les formules donnees ci-dessus permettent de determiner de faconapprochee les limites de confiance de fonctions lineaires de carres moyens, et doncde fonctions lineaires ou de rapports de fonctions lineaires de composantes de lavariance, qui generalisent le rapport de composantes de la variance considere enanalyse a un critere de classification (§ 9.3.3.8◦).

En matiere de composantes de la variance, on peut eventuellement se refereraussi aux indications bibliographiques du paragraphe 16.4.5.3◦.b

Exemple 11.2.3. Etude de la resistance de panneaux de particules a l’arrachagedes clous : suite de l’analyse de la variance.

En ce qui concerne les conditions d’application, l’examen des donnees du ta-bleau 11.2.1 et des residus de l’analyse de la variance realisee dans le cadre de

6 En anglais : Satterthwaite’s approximate F -test.

11.2.3 MODELES CROISES A TROIS CRITERES 359

l’exemple 11.2.1 (tableau 11.2.2) ne met en evidence aucune anomalie importante.Le seul point quelque peu preoccupant est l’existence d’une certaine difference devariance entre les residus relatifs aux trois vitesses d’arrachage des clous, les va-leurs absolues des residus etant, en moyenne, sensiblement moins elevees pour lavitesse intermediaire que pour les deux vitesses extremes (moyennes des valeursabsolues des residus egales a 2,8 , 1,6 et 2,9 kg, respectivement pour 22 , 45 et90 mm par minute).

Mais un autre element auquel il y a lieu d’etre tout specialement attentif dansune telle situation est l’ordre de realisation des differents essais. Les hypothesesd’identite des distributions et d’independance des residus, sous-jacentes a l’analysede la variance, impliquent en effet que les 60 mesures ont ete effectuees dans unordre completement aleatoire.

Or, en pratique, on pourrait etre tente de realiser les manipulations dans unordre systematique, en modifiant le moins souvent possible le reglage des appareils.Dans le cas considere ici, il pourrait etre plus facile, par exemple, d’effectuer enpremier lieu les 20 mesures relatives a la vitesse inferieure, puis les 20 mesuresrelatives a la vitesse intermediaire, et enfin seulement les 20 mesures relatives a lavitesse superieure.

Une telle facon de faire peut toutefois engendrer des interferences difficilementprevisibles entre les facteurs dont on veut estimer l’effet et d’autres facteurs qui nesont pas controles. Il en serait ainsi, notamment, si les trois vitesses d’arrachageetaient prises en consideration successivement, comme nous venons de l’evoquer,si les eprouvettes subissaient au cours du temps une dessiccation progressive noncontrolee, et si le degre d’humidite des eprouvettes avait une influence sur la re-sistance a la traction. Les facteurs vitesse d’arrachage, dont l’etude est un desobjectifs de l’experience, et humidite des eprouvettes, dont on ignore l’importance,seraient alors totalement confondus, en s’additionnant ou en s’annulant peut-etre,au moins dans une certaine mesure.

La repartition aleatoire, eventuellement avec certaines restrictions dont on tientcompte au moment de l’analyse, comme dans le cas des blocs aleatoires complets,est toujours une condition essentielle des experiences dont les resultats sont soumisa l’analyse de la variance. Les consequences possibles d’une repartition systema-tique des traitements sont illustrees de facon plus concrete par l’exemple 11.4.2,ainsi que dans Dagnelie [2003].

Cela etant, comme les trois criteres de classification sont fixes, le modele d’ana-lyse de la variance est lui aussi fixe, et tous les tests doivent etre realises par rapportau carre moyen residuel (tableau 11.2.5).

L’examen des resultats des tests montre tout d’abord que l’interaction destrois facteurs et les interactions des facteurs grosseurs des clous et diametres desanneaux d’une part, diametres des anneaux et vitesses d’arrachage d’autre part,ne sont pas significatives (tableau 11.2.2). L’interaction des facteurs grosseurs desclous et vitesses d’arrachage est, par contre, tout juste significative. L’absenced’interaction entre les trois facteurs doit etre interpretee comme etant le fait que

360 ANALYSE DE LA VARIANCE A TROIS ET PLUS DE TROIS CRITERES 11.2.4

l’interaction grosseurs des clous-vitesses d’arrachage est, aux fluctuations aleatoirespres, la meme pour les deux diametres d’anneaux.

Quant aux facteurs principaux, ils font tous trois apparaıtre des differences treshautement significatives. Mais en raison de l’existence d’une interaction significa-tive en ce qui les concerne, il faudrait en principe tester les facteurs grosseurs desclous et vitesses d’arrachage separement pour leurs differentes modalites. Les va-leurs respectives des deux probabilites (P = 0,043 pour l’interaction et P = 0,0000pour les deux facteurs) indiquent toutefois que les conclusions des tests relatifsaux facteurs principaux ne peuvent pas etre influencees de facon sensible par cetteinteraction.

On peut alors rechercher eventuellement, en fonction des besoins, des limitesde confiance pour les moyennes et les differences de moyennes, a savoir, en ce quiconcerne les grosseurs des clous :

x(6,5) = 57,1 et x(8) = 74,3 kg ,

les diametres des anneaux :

x(22) = 68,1 et x(30) = 63,3 kg ,

et les vitesses d’arrachage :

x(22) = 61,7, x(45) = 65,8 et x(90) = 69,6 kg .

En raison de l’interaction significative grosseurs des clous-vitesses d’arrachage,on pourrait aussi avoir interet a considerer les moyennes qui sont relatives simul-tanement a ces deux facteurs :

x(6,5; 22) = 53,8 , x(6,5; 45) = 55,5 et x(6,5; 90) = 62,1 kg ,

x(8; 22) = 69,6 , x(8; 45) = 76,0 et x(8; 90) = 77,2 kg .

11.2.4 Le cas des echantillons d’une seule observation

1◦ Comme en analyse de la variance a deux criteres de classification (§ 10.2.5),quand les differents echantillons ne sont constitues chacun que d’une seule observa-tion, toutes les mentions relatives a la variation residuelle disparaissent du modeleobserve, de l’equation d’analyse de la variance, des nombres de degres de liberte,etc.

2◦ Les mentions CMr disparaissent aussi des tableaux d’esperances mathema-tiques des carres moyens, ce qui reduit, parfois considerablement, les possibilitesde comparaison.

Ainsi, le tableau 11.2.5 montre que plus aucune comparaison n’est possible dansle cas du modele fixe, si ce n’est en supposant la nullite de certaines interactions.

11.2.4 MODELES CROISES A TROIS CRITERES 361

De meme, les comparaisons relatives au facteur aleatoire (C) et a ses interac-tions avec les facteurs fixes (a et b) ne sont pas possibles non plus pour le premiermodele mixte, et la comparaison relative a l’interaction des deux facteurs aleatoires(B et C) n’est pas possible pour le deuxieme modele mixte.

d Aucune difficulte n’apparaıt cependant si on peut supposer que le modele estadditif, c’est-a-dire qu’il ne fait intervenir aucune interaction. Cette hypothese peutetre verifiee dans une certaine mesure par une generalisation du test d’additivitede Tukey (§ 10.3.6.4◦) et par divers autres tests qui poursuivent le meme objectif[Marasinghe et Boik, 1993 ; Zafar-Yab, 1993].b

d 3◦ Differents cas particuliers d’analyse de la variance a trois criteres de clas-sification, relatifs a des echantillons d’une seule observation, peuvent etre pris enconsideration en relation avec divers dispositifs experimentaux. Il en est ainsi parexemple pour les modeles relatifs aux dispositifs en carre latin, en ✭✭ cross-over ✮✮

et en parcelles divisees [Dagnelie, 1970, 2003].b

d 4◦ Enfin, le probleme de l’estimation des donnees manquantes doit aussi etreaborde, le cas echeant. Ce probleme souleve souvent plus de difficultes qu’en ana-lyse de la variance a deux criteres de classification (§ 10.4.3), et il peut necessiterl’emploi de formules particulieres, liees aux differents dispositifs experimentauxdont il vient d’etre question.

Ce probleme peut egalement etre resolu par l’analyse de la covariance(§ 17.3.3.3◦) ou par l’utilisation du modele lineaire (§ 16.4.5).b

Exemple 11.2.4. Determination d’une fumure optimale pour le ble : analyse dela variance.

Une experience en blocs aleatoires complets a ete realisee sur ble au Rwanda,en vue de determiner autant que possible une fumure phospho-calcique opti-male [Neel et De Prins, 1973]. Trois doses d’acide phosphorique (100 , 200 et300 kg/ha) et trois doses de chaux (1.000 , 4.500 et 8.000 kg/ha) ont ete comparees,les neuf combinaisons des deux engrais ayant ete affectees chacune au hasard et in-dependamment a une parcelle, au sein de chacun des blocs, qui etaient au nombrede trois 7.

Le tableau 11.2.6 donne les rendements observes, en kg par parcelle de 18 m2,les differents niveaux de fumures etant representes par les valeurs 1 , 2 et 3 desindices i et j qui leur sont affectes. Le tableau 11.2.7 presente aussi les resultatsde deux analyses de la variance. On remarquera qu’une des donnees initiales estmanquante et a du etre estimee, comme il est indique ci-dessous. Ceci a notammentpour consequence de reduire d’une unite les nombres de degres de liberte de laderniere composante et du total, dans chacune des deux analyses (§ 10.4.3.1◦).

7 D’autres fumures ont egalement ete etudiees au cours de cette experience, mais elles peuventetre negligees ici sans aucun inconvenient [Dagnelie, 2003].

362 ANALYSE DE LA VARIANCE A TROIS ET PLUS DE TROIS CRITERES 11.2.4

Tableau 11.2.6. Determination d’une fumure optimale pour le ble : rendementsobserves pour neuf fumures et trois blocs, en kg par parcelle de 18 m2.

Fumures BlocsP2O5 CaO 1 2 3

1 1 1,30 0,80 2,011 2 2,05 2,37 2,521 3 2,07 2,60 2,25

2 1 – 2,36 2,712 2 2,99 2,92 3,632 3 2,62 2,89 3,43

3 1 2,61 2,06 3,293 2 3,22 2,93 3,853 3 3,15 3,35 3,67

Tableau 11.2.7. Determination d’une fumure optimale pour le ble :tableaux d’analyse de la variance.

Degres S. des carres CarresSources de variation F P

de liberte des ecarts moyens

Phosphore 2 6,2949 3,1474 60,2 ** 0,0010Calcium 2 3,5022 1,7511 13,8 * 0,016Blocs 2 1,9191 0,9596

Phosphore-calcium 4 0,1525 0,0381 0,57 0,69Phosphore-blocs 4 0,2093 0,0523Calcium-blocs 4 0,5062 0,1266

Phosphore-calcium-blocs 7 0,4665 0,0666

Totaux 25 13,0507

Phosphore 2 6,2949 3,1474 39,9 *** 0,0000Calcium 2 3,5022 1,7511 22,2 *** 0,0000Interaction 4 0,1525 0,0381 0,48 0,75Blocs 2 1,9191 0,9596Variation residuelle 15 1,1820 0,0788

Totaux 25 13,0507

Les criteres de classification phosphore et calcium sont des criteres fixes, tandisque le facteur blocs doit etre considere comme aleatoire, les blocs etant represen-tatifs de l’ensemble du territoire auquel on souhaite pouvoir appliquer les resultatsobtenus. Le modele d’analyse de la variance est donc un modele mixte, du premiertype presente au paragraphe 11.2.3.4◦, mais avec un effectif n egal a 1 .

La deuxieme partie du tableau des esperances mathematiques (tableau 11.2.5)montre que les deux facteurs principaux et leur interaction doivent etre testes par

11.2.4 MODELES CROISES A TROIS CRITERES 363

rapport aux interactions correspondantes avec le facteur blocs. Les resultats desdifferents tests figurent dans la partie superieure du tableau 11.2.7.

Toutefois, ces tests sont tres peu puissants, car ils sont caracterises par de tresfaibles nombres de degres de liberte aux denominateurs (respectivement quatre,quatre et sept degres de liberte). Il y a donc lieu d’envisager de regrouper certainessources de variation.

Un tel regroupement est possible pour les trois interactions qui font intervenirle facteur blocs, puisque les carres moyens de ces interactions sont tous du memeordre de grandeur (0,0523 , 0,1266 et 0,0666). Ce regroupement donne naissance ala ✭✭ variation residuelle ✮✮ qui apparaıt dans la partie inferieure du tableau 11.2.7,les trois tests devant alors etre realises par rapport a cette base de comparaisoncommune. L’augmentation du nombre de degres qui resulte de ce regroupement acomme consequence de mettre en evidence des differences nettement plus signifi-catives, pour les deux facteurs.

Tres souvent, dans le cas des experiences en blocs aleatoires complets, cettedeuxieme presentation de l’analyse de la variance est envisagee seule, sans pas-ser par la premiere presentation. Cette deuxieme presentation peut d’ailleurs etreconsideree aussi comme une analyse de la variance a deux criteres de classification,completee par une decomposition de la somme des carres des ecarts factorielle. Ils’agit en effet de l’analyse de la variance qui fait intervenir, dans un premier temps,un facteur fumures global, avec huit degres de liberte pour les neuf fumures, unfacteur blocs, avec deux degres de liberte pour les trois blocs, et une interactionfumures-blocs, avec normalement 16 degres de liberte, cette derniere composantecorrespondant a la ✭✭ variation residuelle ✮✮ du tableau 11.2.7. Dans un deuxiemetemps, la composante globale fumures peut etre divisee en trois composantes in-dividuelles, relatives a chacun des deux facteurs principaux, chaque fois avec deuxdegres de liberte, et a l’interaction de ces deux facteurs, avec quatre degres deliberte.

L’estimation de la donnee manquante a en fait ete realisee ici dans cette op-tique, a l’aide de la formule du paragraphe 10.4.3.1◦, le resultat obtenu etant 2,25 .

Quant au facteur blocs, on peut en mesurer l’importance en termes d’efficaciterelative (§ 10.3.6.6◦). On obtient :

(1,9191 + 1,1820)/(2 + 15) = 0,1824 et 0,1824/0,0788 = 2,31 ,

soit une efficacite relative d’environ 230 %, pour l’experience en blocs aleatoirescomplets, par comparaison avec une experience completement aleatoire.

Enfin, en ce qui concerne le controle des conditions d’application de l’analysede la variance, on peut remarquer que les residus different sensiblement, en valeurabsolue, d’un niveau de fumure phosphorique a l’autre, et aussi d’un bloc a l’autre.Cette inegalite de variances ne prete toutefois pas a consequence, en ce qui concerneles resultats des differents tests F .

On remarquera que l’analyse de la variance ne permet pas de resoudre le proble-me pose au depart, a savoir la determination d’une fumure optimale, mais permet

364 ANALYSE DE LA VARIANCE A TROIS ET PLUS DE TROIS CRITERES 11.2.4

seulement de voir dans quelle mesure les differences observees sont significatives.Nous reviendrons ulterieurement au probleme initial (exemples 12.2.2 et 15.2.1).

dExemple 11.2.5. Comparaison de quatre provenances de viande par analyse sen-sorielle : analyse de la variance.

Les responsables d’un reseau de magasins d’alimentation ont mis en place unsysteme de controle permanent de la qualite des viandes livrees par differentsfournisseurs. A cette fin, ils organisent regulierement des seances de degustation,au cours desquelles un certain nombre de juges experimentes sont appeles a donner,pour les differentes provenances, des notes relatives a plusieurs proprietes particu-lieres (tendrete, saveur, etc.), ainsi qu’une appreciation globale. Nous consideronsici les appreciations globales fournies par cinq juges, au cours de quinze seancesde degustation, a propos de viandes provenant de quatre fournisseurs differents[Delvaux, 1991].

Les notes emises par les juges peuvent varier de facon continue de 1 a 7, res-pectivement pour les appreciations ✭✭ mauvais ✮✮ et ✭✭ excellent ✮✮, mais l’examen desdonnees initiales, que nous ne reproduisons pas ici, montre que la majorite desnotes sont en fait des valeurs entieres allant de 1 a 6 , les valeurs extremes ob-servees etant 1,0 et 6,8 , et la moyenne generale etant egale a 3,95 . Nous avonssignale anterieurement que l’analyse de la variance pouvait etre appliquee sansinconvenients majeurs a de telles donnees (§ 9.1.3◦), et ce fait est confirme notam-ment par Rayner et Seyb [1988] en ce qui concerne l’analyse a trois criteres declassification.

Si on considere que les juges sont representatifs de l’ensemble des consomma-teurs potentiels, et que les seances sont representatives des differents momentsauxquels des controles pourraient etre realises, le modele d’analyse de la variancea prendre en consideration est un modele croise mixte a un critere de classificationfixe (fournisseurs) et deux criteres aleatoires (juges et seances de degustation).Il s’agit du deuxieme modele du paragraphe 11.2.3.4◦, dans le cas d’un effectif negal a 1 .

Le tableau 11.2.8 donne les resultats de l’analyse de la variance, y compris lesresultats des tests qui sont immediatement realisables, conformement a ce qu’in-dique la partie inferieure gauche du tableau 11.2.5.

On note tout d’abord l’importance de l’interaction fournisseurs-seances, quipourrait etre l’indice d’une moindre regularite dans le temps de la qualite desproduits de l’un ou l’autre fournisseur. Un examen attentif de cette interaction sejustifie donc.

Deux approches au moins sont possibles. Une premiere approche consiste adeterminer les termes d’interaction xi.k. − xi... − x..k. + x.... (i = 1 , . . . , 4 etk = 1 , . . . , 15), et a examiner ces termes par la realisation de tests de normaliteet par la recherche d’eventuelles valeurs aberrantes (chapitre 3). Une deuxiemeapproche a pour principe d’effectuer des analyses de la variance a deux criteresde classification, separement pour chacun des fournisseurs, de maniere a identifier

11.2.4 MODELES CROISES A TROIS CRITERES 365

Tableau 11.2.8. Comparaison de quatre provenances de viandepar analyse sensorielle : tableau d’analyse de la variance.

Sources Degres S. des carres CarresF P

de variation de liberte des ecarts moyens

Fournisseurs 3 12,7627 4,2542Juges 4 162,8542 40,7136 31,9 *** 0,0000Seances 14 27,1909 1,9422 1,52 0,13

Fournisseurs-juges 12 16,0730 1,3394 1,92 * 0,035Fournisseurs-seances 42 61,1243 1,4553 2,08 *** 0,0006Juges-seances 56 71,4598 1,2761

Fourn.-juges-seances 168 117,4050 0,6988

Totaux 299 468,8699

l’importance du facteur seances pour les differents fournisseurs. Ces deux appro-ches mettent effectivement en evidence des differences de comportement entre lesfournisseurs, et en particulier la plus grande regularite de l’un d’entre eux.

En raison du degre de signification de l’interaction fournisseurs-seances, la rea-lisation du test du facteur fournisseurs, auquel on s’interesse cependant principa-lement, ne se justifie guere. En principe, ce test devrait etre effectue par rapport al’une ou l’autre des deux interactions fournisseurs-juges et fournisseurs-seances, sices interactions etaient non significatives, ou par rapport au resultat d’un regrou-pement de l’une ou l’autre, ou de l’une et l’autre de ces deux interactions, avecl’interaction fournisseurs-juges-seances (tableau 11.2.5).

La methode de Satterthwaite pourrait aussi conduire a considerer la quan-tite suivante comme base de comparaison relative au facteur fournisseurs :

1,3394 + 1,4553− 0,6988 = 2,0959 ,

et cela avec un nombre de degres de liberte qui serait approximativement :

2,09592/(1,33942/12 + 1,45532/42 + 0,69882/168) = 22 .

Cette methode conduirait a une conclusion de non-signification des differencesentre fournisseurs (Fobs = 2,03 et P = 0,14).

Un autre element qui doit retenir l’attention est le caractere tres hautementsignificatif des differences entre juges (tableau 11.2.8).

A cet egard, l’examen des residus de l’analyse de la variance et de leur dis-tribution ne met en evidence, a premiere vue, aucune anomalie particuliere, lesvaleurs extremes des residus reduits etant egales a − 3,16 et +2,64 , et leur dis-tribution pouvant etre consideree comme tres proche d’une distribution normale.Toutefois, l’analyse de la variance qui peut etre realisee pour les valeurs absoluesdes residus, dans l’optique du test de Levene (§ 7.5.3.3◦), montre l’existence de

366 ANALYSE DE LA VARIANCE A TROIS ET PLUS DE TROIS CRITERES 11.3.1

differences importantes entre les juges, l’un d’entre eux etant caracterise par desresidus nettement inferieurs aux quatre autres.

Un retour aux donnees initiales permet de constater que ce juge a toujoursdonne des appreciations relativement elevees et limitees a un domaine de variationfort etroit (allant de 4,0 a 6,1), par comparaison avec les autres juges (respective-ment de 1,0 a 5,0 , de 1,0 a 5,8 , de 1,8 a 6,4 , et de 2,0 a 6,8). Cet element expliquedans une tres large mesure, a la fois, les differences de moyennes et les differencesde variances entre juges. Il peut suggerer de recommencer l’analyse en eliminantles observations relatives au juge en question.

Cet exemple, dont nous ne pousuivons pas plus loin la discussion, met bien enevidence les difficultes que peut soulever l’interpretation des resultats d’une analysede la variance, meme tout a fait classique, surtout en presence d’interactions. Ilsouligne l’attention qu’il faut donc toujours accorder a de telles interpretations. Onpeut ajouter aussi que, dans le cas considere, le probleme reel peut eventuellementetre plus complexe encore, ou au contraire etre simplifie, du fait de l’existenced’analyses de la variance relatives a d’autres caracteristiques (tendrete, saveur,etc.).b

11.3 L’analyse de la variance a trois criteresde classification : modeles hierarchisesa effectifs egaux

11.3.1 Principes generaux

1◦ Pour trois criteres de classification, les modeles hierarchises d’analyse dela variance sont plus nombreux encore que les modeles croises. Non seulement lesdifferents criteres peuvent etre fixes ou aleatoires, mais en outre, leur hierarchisa-tion peut se presenter de differentes facons.

Ainsi, si on designe les trois criteres par a , b et c , le critere c peut tout d’abordetre subordonne au critere b , ce dernier etant lui-meme subordonne au critere a .Le modele est alors completement hierarchise 8.

Mais il peut arriver egalement que deux des trois criteres, par exemple b et c ,soient a la fois croises entre eux et subordonnes au troisieme (a). De meme, deuxdes trois criteres, par exemple a et b , peuvent etre croises entre eux, le troisieme (c)leur etant subordonne. Enfin, deux des trois criteres, par exemple b et c , peuventetre a la fois subordonnes l’un a l’autre et croises avec le troisieme (a). Tous cesmodeles sont dits partiellement hierarchises 9. Ils sont en fait a la fois partiellementcroises et partiellement hierarchises.

8 En anglais : completely hierarchical model.9 En anglais : partially hierarchical model.

11.3.2 MODELES HIERARCHISES A TROIS CRITERES 367

2◦ Les quatre cas qui viennent d’etre evoques sont presentes sous forme deschemas dans la figure 11.3.1. Les lignes accompagnees des lettres a , b et c desi-gnent chaque fois les trois criteres de classification, tandis que les petites lignesisolees indiquent dans chaque cas la position d’eventuelles repetitions des observa-tions, pour des effectifs n superieurs a 1 .

Figure 11.3.1. Representation schematique des differents modelescompletement hierarchise (I) et partiellement hierarchises (II, III et IV)

d’analyse de la variance a trois criteres de classification.

On notera que de telles repetitions sont indispensables dans les cas I et III,pour qu’ils s’agissent bien d’analyses a trois criteres de classification. L’absencede repetitions reduirait en effet ces modeles a des analyses de la variance a deuxcriteres de classification, de type hierarchise dans le cas I et de type croise dans lecas III.

On remarquera aussi qu’a ce stade, nous ne faisons aucune distinction entrecriteres fixes et criteres aleatoires, les lettres a , b et c devant donc etre considereescomme etant, selon les cas, soit des minuscules, soit des majuscules.

3◦ Dans la suite, nous envisagerons successivement les modeles completementhierarchises (§ 11.3.2) et les modeles partiellement hierarchises (§ 11.3.3), en nouslimitant toujours ici aux cas ou les nombres de modalites sont constants auxdifferents niveaux, et ou les echantillons sont de meme effectif.

11.3.2 Les modeles completement hierarchises

1◦ En ce qui concerne les modeles completement hierarchises, toutes les interac-tions disparaissent. Et par analogie avec l’analyse a deux criteres de classification

368 ANALYSE DE LA VARIANCE A TROIS ET PLUS DE TROIS CRITERES 11.3.2

(§ 10.5.2), les aspects descriptifs de l’analyse de la variance peuvent etre resumesde la maniere suivante :

xijkl − x.... = (xi... − x....) + (xij.. − xi...) + (xijk. − xij..) + (xijkl − xijk.) ,

SCEt = SCEa + SCEb|a + SCEc|b|a + SCEr

et p q r n− 1 = (p− 1) + p (q − 1) + p q (r − 1) + p q r (n− 1) .

2◦ Les criteres de classification subordonnes etant en general tous aleatoires,deux modeles theoriques, l’un mixte et l’autre aleatoire, doivent etre pris en con-sideration. Ils s’ecrivent :

Xijkl −m... = ai + Bj|i + Ck|j|i + Dijkl

et Xijkl −m... = Ai + Bj|i + Ck|j|i + Dijkl .

3◦ Les esperances mathematiques des carres moyens sont presentees dans letableau 11.3.1, toujours selon les memes principes que precedemment (§ 10.3.5.1◦et 11.2.3.6◦). Ces esperances indiquent la maniere dont les tests d’hypotheses etles estimations des composantes de la variance doivent etre realises.

Tableau 11.3.1. Esperances mathematiques des carres moyens,pour les modeles completement hierarchises d’analyse de la variance

a trois criteres de classification.

Carres Modele mixte (a fixe) Modele aleatoiremoyens σ2 σ2

C|B|a σ2B|a a2

i σ2 σ2C|B|A σ2

B|A σ2A

CMa 1 n r n + 1 n r n q r nCMb|a 1 n r n 1 n r nCMc|b|a 1 n 1 nCMr 1 1

d 4◦ Quant a l’execution des calculs, les modeles d’analyse de la variance consi-deres ici peuvent etre presentes par exemple de la maniere suivante, pour le logicielMinitab, par extension de ce qui a ete dit au paragraphe 10.5.2.7◦ :

X = A B(A) C(B) ou X = A B(A) C(A B) ,

B(A) indiquant que le facteur B est subordonne au facteur A , tandis que C(B) etC(A B) indiquent que le facteur C est subordonne au facteur B ou, plus explicite-ment, aux facteurs A et B .b

11.3.2 MODELES HIERARCHISES A TROIS CRITERES 369

Exemple 11.3.1. Comparaison des hauteurs moyennes des arbres de trois typesde hetraies : analyse de la variance a trois criteres de classification.

Au cours du chapitre 9, nous avons compare les hauteurs moyennes des arbresde trois types de hetraies, par l’analyse de la variance a un critere de classification(exemples 9.2.1 et 9.3.1). Les donnees de base que nous avons prises en conside-ration etaient des hauteurs moyennes observees en 37 endroits differents (tableau2.3.1). Nous avions aussi signale que ces hauteurs moyennes avaient ete obtenuesen reperant chaque fois les cinq arbres les plus gros, au sein d’une parcelle d’unedimension donnee, et en mesurant deux fois la hauteur de chacun de ces cinq arbres(exemple 2.3.1).

Dans ces conditions, l’etude detaillee des 370 mesures initiales peut conduirea la realisation d’une analyse de la variance completement hierarchisee a trois cri-teres de classification, qui correspond au premier schema de la figure 11.3.1. Lestrois criteres, tous hierarchises les uns par rapport aux autres, sont les types dehetraies, les points d’observation, aussi appeles ✭✭ stations ✮✮, et les arbres. Les deuxmesures realisees pour chacun des arbres constituent les repetitions. Le criteretypes de hetraies est fixe, tandis que les deux autres criteres de classification sontaleatoires, de telle sorte que le modele d’analyse de la variance est mixte.

Le tableau 11.3.2 presente les resultats de cette analyse. Comme l’indique letableau 11.3.1, chacun des criteres de classification doit etre teste par rapport aucritere qui lui est immediatement subordonne. On peut constater ainsi que toutesles differences sont au moins hautement significatives.

Tableau 11.3.2. Comparaison des hauteurs moyennes des arbres de trois typesde hetraies : tableau d’analyse de la variance a trois criteres de classification.

Sources Degres S. des carres CarresF P

de variation de liberte des ecarts moyens

Types de hetraies 2 485,71 242,86 7,08 ** 0,0027Stations 34 1.165,41 34,28 9,42 *** 0,0000Arbres 148 538,57 3,639 6,29 *** 0,0000Mesures 185 107,08 0,5788

Totaux 369 2.296,77

Les carres moyens relatifs aux facteurs stations et arbres, et a la variationresiduelle (differences entre mesures), permettent d’estimer les composantes de lavariance suivantes :

bσ2 = 0,5788 , bσ2C|B|a = (3,639− 0,5788)/2 = 1,530

et bσ2B|a = (34,28− 3,639)/10 = 3,064 ,

370 ANALYSE DE LA VARIANCE A TROIS ET PLUS DE TROIS CRITERES 11.3.3

soit aussi en termes d’ecarts-types, respectivement pour les differences entre me-sures relatives a un meme arbre, entre arbres dans une meme station, et entrestations dans un meme type de hetraies :

bσ = 0,76 , bσC|B|a = 1,24 et bσB|a = 1,75 m .

Quant aux differences entre types de hetraies, on peut observer que le resultatdu test est pratiquement identique a celui qui a ete obtenu anterieurement (exemple9.3.1). En fait, les deux premieres sommes des carres des ecarts factorielles (485,71et 1.165,41) sont a peu de chose pres egales a 10 fois celles calculees precedemment(tableau 9.2.2 : 48,88 et 116,65). Le facteur 10 provient du fait que ces sommes decarres d’ecarts sont calculees ici a partir de 10 fois plus d’observations (cinq arbres× deux mesures, dans chaque station), et les differences mineures, par rapport auxresultats anterieurs multiplies par 10 , decoulent du fait que les premiers calculs ontete realises en partant de hauteurs moyennes par station arrondies a une decimale.

L’analyse de la variance a trois criteres de classification n’apporte donc aucuneinformation complementaire, par comparaison avec l’analyse a un critere, en cequi concerne le principal objectif de l’etude. Sa realisation ne se justifie que dansl’optique de la detection d’eventuelles valeurs aberrantes, en ce qui concerne lesdonnees initiales, et de l’estimation des composantes de la variance 10.

11.3.3 Les modeles partiellement hierarchises

1◦ L’etude des modeles partiellement hierarchises d’analyse de la variance estplus complexe que celle des modeles croises et des modeles completement hierar-chises. Contrairement a ces derniers, les modeles partiellement hierarchises font eneffet intervenir certaines interactions, mais contrairement aux modeles croises, ilsne les contiennent pas toutes.

Les schemas de la figure 11.3.1 facilitent cependant grandement les choses. Lesintersections des lignes qui apparaissent dans ces schemas indiquent en effet les in-teractions qui sont presentes dans les differents modeles. Ainsi, en ce qui concernele schema II de cette figure, l’interaction (bc)jk , relative aux deux facteurs qui sontcroises, doit etre presente dans le modele, alors que les trois autres interactions,qui feraient toutes intervenir au moins deux facteurs subordonnes l’un a l’autre(a et b , a et c , ou a , b et c), ne doivent pas y figurer.

10 On pourra aussi remarquer que le probleme envisage n’est pas strictement equilibre, puisqueles effectifs qui concernent les differents types de hetraies ne sont pas egaux. Ce fait ne modifietoutefois pas la maniere dont le test relatif aux types de hetraies doit etre realise, et n’a aucuneincidence sur les estimations des composantes de la variance relatives aux facteurs subordonnesstations et arbres, et a la variation residuelle.

11.3.3 MODELES HIERARCHISES A TROIS CRITERES 371

2◦ Dans ces conditions, le modele observe, l’equation d’analyse de la varianceet les nombres de degres de liberte sont :

xijkl − x.... = (xi... − x....) + (xij.. − xi...) + (xi.k. − xi...)+ (xijk. − xij.. − xi.k. + xi...) + (xijkl − xijk.) ,

SCEt = SCEa + SCEb|a + SCEc|a + SCEbc|a + SCEr

et p q r n− 1 = (p− 1) + p (q − 1) + p (r − 1) + p (q − 1) (r − 1) + p q r (n− 1) .

Ces relations sont intermediaires entre celles qui concernent les modeles croi-ses (§ 11.2.2) et celles qui sont relatives aux modeles completement hierarchises(§ 11.3.2.1◦).

Les deuxieme et troisieme termes du second membre du modele observe onttrait, respectivement, a l’effet du facteur b et a l’effet du facteur c , pour les differen-tes modalites du facteur a . Par comparaison avec le modele croise (§ 11.2.2.2◦),ces deux termes prennent la place, d’une part, de l’effet du facteur b et de sonl’interaction avec le facteur a , et d’autre part, de l’effet du facteur c et de soninteraction avec, aussi, le facteur a .

De meme, le quatrieme terme du second membre represente l’interaction desfacteurs b et c , pour les differentes modalites du facteur a . Il remplace le termed’interaction des facteurs b et c et le terme d’interaction des trois facteurs.

3◦ Toujours dans le meme cas (schema II de la figure 11.3.1), deux modelestheoriques, l’un mixte et l’autre aleatoire, doivent etre consideres. Le modele mixte(a fixe et B et C aleatoires) est :

Xijkl −m... = ai + Bj|i + Ck|i + (BC)jk|i + Dijkl ,

et le modele aleatoire peut etre obtenu en remplacant a par A .

4◦ De meme, sans en developper les aspects descriptifs, on peut ecrire commesuit le modele mixte relatif au troisieme cas (schema III) de la figure 11.3.1, pourdeux facteurs fixes (a et b) et un facteur aleatoire (C) :

Xijkl −m... = ai + bj + (ab)ij + Ck|ij + Dijkl .

Un autre modele mixte, a un facteur fixe (a) et deux facteurs aleatoires (B et C),et un modele aleatoire peuvent etre obtenus en remplacant soit uniquement b , soita et b par des majuscules.

Ces trois modeles sont tres proches des modeles croises a deux criteres declassification (§ 10.3.2.2◦, 10.3.3.3◦ et 10.3.4.3◦). Comme nous l’avons deja signa-le (§ 11.3.1.2◦), ils s’y ramenent d’ailleurs dans le cas d’echantillons d’une seuleobservation.

372 ANALYSE DE LA VARIANCE A TROIS ET PLUS DE TROIS CRITERES 11.3.3

5◦ Enfin, pour le schema IV de la figure 11.3.1, on a comme premier modelemixte :

Xijkl −m... = ai + bj + (ab)ij + Ck|j + (aC)ik|j + Dijkl .

On peut en deduire deux autres modeles mixtes et un modele aleatoire, en rem-placant soit uniquement a , soit uniquement b , soit a et b par des majuscules.

6◦ Les esperances mathematiques des carres moyens sont donnees, pour lesdifferents cas et de la meme maniere que precedemment, dans les tableaux 11.3.3a 11.3.5. Elles indiquent la facon dont les tests d’hypotheses et les estimationsdes composantes de la variance doivent etre realises, eventuellement moyennantcertains regroupements des sommes des carres des ecarts (§ 10.3.5.3◦ et 11.2.3.8◦).

Tableau 11.3.3. Esperances mathematiques des carres moyens,pour deux modeles d’analyse de la variance correspondant

au schema II de la figure 11.3.1.

Carres Modele mixte (a fixe) Modele aleatoiremoyens σ2 σ2

BC|a σ2C|a σ2

B|a a2i σ2 σ2

BC|A σ2C|A σ2

B|A σ2A

CMa 1 n q n r n + 1 n q n r n q r nCMb|a 1 n r n 1 n r nCMc|a 1 n q n 1 n q nCMbc|a 1 n 1 nCMr 1 1

Tableau 11.3.4. Esperances mathematiques des carres moyens,pour trois modeles d’analyse de la variance correspondant

au schema III de la figure 11.3.1.

Carres Modele mixte (a et b fixes) Modele mixte (a fixe)moyens σ2 σ2

C|ab (ab)2ij b2j a2

i σ2 σ2C|aB σ2

aB σ2B a2

i

CMa 1 n + 1 n r n +CMb 1 n + 1 n p r nCMab 1 n + 1 n r nCMc|ab 1 n 1 nCMr 1 1

Carres Modele aleatoiremoyens σ2 σ2

C|AB σ2AB σ2

B σ2A

CMa 1 n r n q r nCMb 1 n r n p r nCMab 1 n r nCMc|ab 1 nCMr 1

11.3.3 MODELES HIERARCHISES A TROIS CRITERES 373

Tableau 11.3.5. Esperances mathematiques des carres moyens,pour quatre modeles d’analyse de la variance correspondant

au schema IV de la figure 11.3.1.

Carres Modele mixte (a et b fixes) Modele mixte (a fixe)moyens σ2 σ2

aC|b σ2C|b (ab)2ij b2

j a2i σ2 σ2

aC|B σ2C|B σ2

aB σ2B a2

i

CMa 1 n + 1 n r n +CMb 1 p n + 1 p n p r nCMab 1 n + 1 n r nCMc|b 1 p n 1 p nCMac|b 1 n 1 nCMr 1 1

Carres Modele mixte (b fixe) Modele aleatoiremoyens σ2 σ2

AC|b σ2C|b σ2

Ab b2j σ2

A σ2 σ2AC|B σ2

C|B σ2AB σ2

B σ2A

CMa 1 n q r n 1 n r n q r nCMb 1 n p n r n + 1 n p n r n p r nCMab 1 n r n 1 n r nCMc|b 1 n p n 1 n p nCMac|b 1 n 1 nCMr 1 1

d Ces esperances mathematiques indiquent egalement les comparaisons pour les-quelles l’utilisation de fonctions lineaires des carres moyens doit etre envisagee, enl’absence de sources de variation adequates (§ 11.2.3.9◦).b

7◦ Les differents modeles relatifs au schema IV de la figure 11.3.1 presententun interet particulier, dans la mesure ou ils correspondent au cas relativement fre-quent des experiences en blocs aleatoires complets repetees en differents endroitsou a differents moments (par exemple au cours de plusieurs annees ou de plusieursperiodes de culture). Dans ce cas, le facteur blocs (C) est subordonne au facteurlieux ou moments (b ou B), tandis que le facteur principal qui justifie l’organisationde l’experience (a ou A) est croise, a la fois, avec le facteur lieux ou moments etavec le facteur blocs.

d 8◦ En vue de la realisation des calculs a l’aide du logiciel Minitab par exemple,les differents modeles partiellement hierarchises qui viennent d’etre envisages peu-vent etre presentes de la maniere suivante, par extension de ce qui a ete dit ante-rieurement (§ 11.2.2.5◦ et 11.3.2.4◦) :

X = A B(A) C(A) B*C(A) , X = A B A*B C(A B)

et X = A B A*B C(B) A*C(B) .

On notera la parfaite correspondance entre ces differentes presentations et les sche-mas II a IV de la figure 11.3.1.b

374 ANALYSE DE LA VARIANCE A TROIS ET PLUS DE TROIS CRITERES 11.3.3

Exemple 11.3.2. Etude des qualites technologiques du bois d’epicea : principesde l’analyse de la variance.

Au cours d’une vaste etude relative aux qualites technologiques du bois d’epiceacommun (Picea abies Karst.), 45 emplacements representatifs d’une region don-nee ont ete choisis et, en chacun de ces emplacements, deux arbres ont egalementete choisis et abattus. Dans chacun de ces arbres, quatre eprouvettes de 1 m delongueur et 5 cm sur 5 cm de section ont ensuite ete prelevees, a raison de deuxeprouvettes dans la partie inferieure des arbres et deux eprouvettes dans la partiemediane des arbres. Les 360 eprouvettes ont enfin ete l’objet d’une serie d’obser-vations, physiques, anatomiques et mecaniques, telles que des mesures de densite(ou masse volumique), de largeur des cernes (croissance annuelle), de resistance ala flexion, etc. [Dupont, 1984 ; Grayet, 1980].

Le facteur arbres est necessairement subordonne au facteur emplacements (oustations), les arbres etant bien sur totalement independants les uns des autresd’un endroit a l’autre. Le facteur niveaux (partie inferieure ou partie mediane desarbres) est par contre croise, tant avec le facteur arbres qu’avec le facteur stations,puisque les memes niveaux existent pour chacun des arbres, dans chacune desstations. Le modele d’analyse de la variance correspond donc au schema IV de lafigure 11.3.1, les trois criteres de classification etant les niveaux (a), les stations (b)et les arbres (c), et les eprouvettes constituant les repetitions.

De plus, les criteres stations et arbres doivent etre consideres comme aleatoires,puisque ces elements sont representatifs de l’ensemble d’une region, tandis que lecritere niveaux est fixe. Le modele est donc semblable a celui qui est presenteau paragraphe 11.3.3.5◦, en affectant une lettre minuscule aux niveaux (a) et deslettres majuscules aux stations et aux arbres (B et C).

Le schema de l’analyse de la variance qui correspond a cette situation, pourchacune des caracteristiques qui ont ete mesurees, est presente dans le tableau11.3.6.

Tableau 11.3.6. Etude des qualites technologiques du bois d’epicea :schema de l’analyse de la variance.

DegresSources de variation

de liberte

Niveaux 1Stations 44Niveaux-stations 44Arbres (dans stations) 45Niveaux-arbres (dans stations) 45Repetitions (eprouvettes) 180

Total 359

11.4.2 ANALYSE A PLUS DE TROIS CRITERES 375

Les esperances mathematiques qui sont resumees dans la deuxieme partie dutableau 11.3.5 montrent que les differences entre niveaux doivent etre compareesa l’interaction niveaux-stations, les differences entre stations aux differences entrearbres (dans les stations), les differences entre arbres (dans les stations) aux dif-ferences entre eprouvettes, l’interaction niveaux-stations a l’interaction niveaux-arbres (dans les stations), et cette derniere aux differences entre eprouvettes.

d Au vu du tableau 11.3.6, on pourrait faire remarquer que, sauf pour le facteurniveaux, les nombres de degres de liberte sont tous relativement importants, etque le materiel experimental aurait pu etre mieux utilise en prenant en compteun ou plusieurs facteurs supplementaires. Nous verrons a l’exemple 11.4.4 que teletait bien le cas en realite.b

11.4 L’analyse de la variance a plus de troiscriteres de classification

11.4.1 Principes generaux

1◦ Nous envisagerons assez rapidement, d’une maniere generale, les modelescroises (§ 11.4.2) et les modeles hierarchises (§ 11.4.3) d’analyse de la variance aun nombre quelconque de criteres de classification. Nous nous limiterons cependanttoujours au cas des echantillons de meme effectif, le cas des echantillons d’effectifsinegaux pouvant etre aborde dans l’optique du modele lineaire (§ 16.4.5).

2◦ Si les principes de base de l’analyse de la variance a deux et a trois criteres declassification sont bien compris, leur extension a quatre et plus de quatre criteresest relativement simple. De plus, la realisation des calculs par ordinateur ne posepas de probleme particulier.

Il faut noter toutefois que l’interpretation des resultats de l’analyse de la va-riance se complique souvent de plus en plus, au fur et a mesure de l’augmentationdu nombre de criteres de classification. En pratique, il ne faut donc s’engagerqu’avec prudence dans la planification et la realisation d’analyses de la variance aquatre et plus de quatre criteres de classification.

11.4.2 Les modeles croises a effectifs egaux

1◦ Nous avons vu anterieurement que, pour l’analyse a un critere de classifica-tion et pour les modeles croises a deux et a trois criteres, dans le cas des echantillonsde plusieurs observations, le modele observe et l’equation d’analyse de la variancecomportent l’un et l’autre, successivement, deux, quatre et huit termes (§ 9.2.2,10.2.2 et 11.2.2). Par extension, on en deduit facilement que, pour les modelescroises a h criteres de classification, et toujours dans le cas des echantillons deplusieurs observations, le nombre de termes est egal a 2h.

376 ANALYSE DE LA VARIANCE A TROIS ET PLUS DE TROIS CRITERES 11.4.2

Ces differents termes concernent les h facteurs principaux, les h (h − 1)/2 in-teractions de deux facteurs, les h (h − 1) (h − 2)/6 interactions de trois facteurs,. . . , les h (h−1) (h−2)/6 interactions de h−3 facteurs, les h (h−1)/2 interactionsde h− 2 facteurs, les h interactions de h− 1 facteurs, l’interaction des h facteurs,et la variation residuelle.

Dans le cas des echantillons de meme effectif, on peut aussi determiner aise-ment les differents nombres de degres de liberte, en faisant intervenir des quantites(p1 − 1), (p2 − 1), . . . , a la place de (p− 1), (q− 1), . . . (§ 11.2.2.3◦), les symbolesp1 , p2 , . . . designant les nombres de modalites des differents facteurs.

2◦ Toujours par extension de ce qui concerne les analyses de la variance a un,deux et trois criteres de classification, le nombre de modeles theoriques differentsest egal a h + 1 , a savoir un modele fixe, h − 1 modeles mixtes, et un modelealeatoire.

La principale question est alors la determination, pour les differents modeles,des esperances mathematiques des carres moyens. Diverses procedures ont ete pro-posees a ce sujet [Boyd, 1980 ; Gaylor et al., 1970 ; Hartley, 1967 ; Schultz,1955], et des tables sont donnees notamment par Abt [1963], pour quatre criteresde classification. Le probleme est aussi resolu par divers logiciels statistiques.

Le choix des tests d’hypotheses et des estimations des composantes de la va-riance, en fonction des esperances mathematiques des carres moyens, souleve lesmemes problemes qu’en analyse de la variance a trois criteres de classification(§ 11.2.3.7◦). Les memes solutions, de regroupement de sommes des carres desecarts et d’utilisation de fonctions lineaires des carres moyens, doivent etre envi-sagees (§ 11.2.3.8◦ et 11.2.3.9◦).

3◦ Le cas des echantillons d’une seule observation presente aussi des difficul-tes semblables a celles de l’analyse de la variance a trois criteres de classification(§ 11.2.4).

d Ce cas particulier est important, en vue notamment d’etudier des nombresrelativement eleves de criteres de classification, qui possedent alors generalementchacun deux modalites seulement (cas 2h). La methode de Yates (§ 11.2.2.5◦),qui s’etend facilement a un nombre quelconque de criteres de classification, estparticulierement interessante dans ce dernier cas.

Il y a toutefois lieu de tenir compte du fait que le nombre de tests aug-mente tres rapidement en fonction du nombre de criteres de classification. Enl’absence de toute correction, il peut en resulter une augmentation considerabledu risque de premiere espece, comme dans toute realisation de tests multiples[STAT1, § 10.3.5.1◦]. Des tables particulieres, basees notamment sur le principede Bonferroni, et le recours a des diagrammes apparentes aux diagrammes deprobabilite (§ 3.3.2) permettent de surmonter cette difficulte [Lawson et al., 1998 ;Ludwig et al., 1986 ; Pearson et Hartley, 1966-1972 ; Taylor, 1994] 11.b

11 Des informations complementaires et un exemple sont presentes a ce sujet dans Dagnelie[2003].

11.4.2 ANALYSE A PLUS DE TROIS CRITERES 377

Exemple 11.4.1. Etude des conditions de gazeification du bois de hetre et d’epi-cea : analyse de la variance.

Une etude a ete menee en vue d’identifier l’importance de differents facteurssusceptibles d’influencer la production de gaz par carbonisation du bois de hetreet d’epicea. Quatre facteurs ont ete pris en consideration : deux types differentsde gazogenes, les deux essences (hetre et epicea), trois types de plaquettes debois qui sont introduites dans les gazogenes (ces trois types de plaquettes etantcaracterises essentiellement par leurs dimensions), et quatre degres d’humidite deces plaquettes (bois frais et bois seche a trois degres d’humidite differents). Toutesles combinaisons des differentes modalites des quatre facteurs ont ete envisagees etune mesure a ete realisee pour chaque combinaison de ces modalites. La principalevariable observee etait le rendement de l’operation, exprime en proportion du ren-dement theorique qui pouvait etre calcule a partir des caracteristiques de la matierepremiere [Lacrosse, 1990]. Les resultats obtenus figurent dans le tableau 11.4.1.

Les modalites des differents facteurs etant toutes definies a priori par l’experi-mentateur, le modele d’analyse de la variance est un modele croise fixe a quatrecriteres de classification, avec une observation pour chaque combinaison des diffe-rentes modalites (n = 1). Les resultats de l’analyse sont donnes dans le tableau11.4.2.

La determination des esperances mathematiques des carres moyens montreque, comme pour deux et pour trois criteres de classification (premiere partie dutableau 10.3.7 et premiere partie du tableau 11.2.5), tous les tests devraient etrerealises par rapport a la variation residuelle. Toutefois, cette composante n’etantpas connue, en l’absence de repetitions, on doit envisager d’effectuer les tests parrapport a certaines interactions. De plus, les interactions sont toutes caracteriseespar de faibles nombres de degres de liberte, ce qui incite aussi a proceder a desregroupements.

Cette situation, qui peut paraıtre surprenante au premier abord, est en faittres courante dans les etudes qui font intervenir plus de deux ou trois facteurs.

L’examen des resultats de l’analyse de la variance montre que les carres moyensdes interactions ✭✭ gaz.-hum. ✮✮, ✭✭ ess.-hum. ✮✮, ✭✭ gaz.-ess.-hum. ✮✮, ✭✭ gaz.-plaq.-hum. ✮✮,✭✭ ess.-plaq.-hum. ✮✮ et ✭✭ gaz.-ess.-plaq.-hum. ✮✮ sont du meme ordre de grandeur (ta-bleau 11.4.2). Ces differentes composantes peuvent donc etre regroupees, en don-nant naissance a une ✭✭ variation residuelle ✮✮, a laquelle est associe un total de27 degres de liberte. Tous les tests peuvent alors etre realises par rapport a cettecomposante, comme le montre le tableau 11.4.3.

L’interpretation des resultats ainsi obtenus est delicate, en raison de la pre-sence d’un nombre important d’interactions significatives. Un examen attentif desmoyennes permet cependant de montrer que, d’une part, le troisieme type de pla-quettes, dont les dimensions sont tres differentes des deux autres, et d’autre part,le bois frais ont des comportements fort particuliers. Ces deux modalites ont aussi,globalement, des rendements nettement inferieurs aux autres.

378 ANALYSE DE LA VARIANCE A TROIS ET PLUS DE TROIS CRITERES 11.4.2

Tableau 11.4.1. Rendements observes au cours de la gazeification du boisde hetre et d’epicea, en pourcentages, pour deux types de gazogenes,

les deux essences, trois types de plaquettes et quatre degres d’humiditede la matiere premiere.

Gaz. Ess. Plaq. Hum. Rdt

1 1 1 1 74,41 1 1 2 71,31 1 1 3 69,61 1 1 4 56,4

1 1 2 1 66,11 1 2 2 72,01 1 2 3 67,11 1 2 4 55,1

1 1 3 1 63,41 1 3 2 65,61 1 3 3 61,81 1 3 4 61,0

1 2 1 1 76,81 2 1 2 72,01 2 1 3 67,71 2 1 4 61,0

1 2 2 1 76,31 2 2 2 69,51 2 2 3 66,91 2 2 4 59,9

1 2 3 1 76,01 2 3 2 72,71 2 3 3 71,71 2 3 4 61,6

Gaz. Ess. Plaq. Hum. Rdt

2 1 1 1 78,62 1 1 2 80,52 1 1 3 74,92 1 1 4 63,4

2 1 2 1 72,42 1 2 2 72,72 1 2 3 63,62 1 2 4 57,6

2 1 3 1 67,22 1 3 2 62,42 1 3 3 64,62 1 3 4 62,0

2 2 1 1 78,72 2 1 2 74,52 2 1 3 67,12 2 1 4 64,8

2 2 2 1 76,02 2 2 2 79,92 2 2 3 73,32 2 2 4 58,8

2 2 3 1 65,72 2 3 2 67,32 2 3 3 60,62 2 3 4 58,8

On peut donc considerer, sans inconvenients majeurs, la possibilite d’ecarterde l’analyse l’une ou l’autre de ces deux modalites, ce qui peut conduire a realiserdeux analyses de la variance du meme type que ci-dessus, portant l’une sur 32 ob-servations (en l’absence des observations relatives au troisieme type de plaquettes),et l’autre sur 36 observations (en l’absence des observations relatives au bois frais).

La premiere de ces deux analyses fournit des conclusions extremement simples.En effet, apres regroupement de certaines interactions, trois des quatre facteursprincipaux apparaissent comme significatifs, a des degres divers, et seule l’interac-tion essences-plaquettes est legerement significative (tableau 11.4.4).

On peut noter aussi que, dans les differents cas, les residus des analyses de lavariance ne presentent aucune anomalie particuliere. Le principal point auquel il y

11.4.2 ANALYSE A PLUS DE TROIS CRITERES 379

Tableau 11.4.2. Etude des conditions de gazeification du bois de hetreet d’epicea : premier tableau d’analyse de la variance.

Sources Degres S. des carres Carresde variation de liberte des ecarts moyens

Gazogenes 1 18,13 18,13Essences 1 60,52 60,52Plaquettes 2 249,20 124,60Humidites 3 1.187,56 395,85

Gaz.-ess. 1 37,98 37,98Gaz.-plaq. 2 119,49 59,74Gaz.-hum. 3 10,34 3,45Ess.-plaq. 2 57,93 28,96Ess.-hum. 3 22,94 7,65Plaq.-hum. 6 132,23 22,04

Gaz.-ess.-plaq. 2 60,26 30,13Gaz.-ess.-hum. 3 23,68 7,89Gaz.-plaq.-hum. 6 19,73 3,29Ess.-plaq.-hum. 6 61,61 10,27

Gaz.-ess.-plaq.-hum. 6 66,86 11,14

Totaux 47 2.128,46

Tableau 11.4.3. Etude des conditions de gazeification du bois de hetreet d’epicea : deuxieme tableau d’analyse de la variance.

Sources Degres S. des carres CarresF P

de variation de liberte des ecarts moyens

Gazogenes 1 18,13 18,13 2,39 0,13Essences 1 60,52 60,52 7,97 ** 0,0088Plaquettes 2 249,20 124,60 16,4 *** 0,0000Humidites 3 1.187,56 395,85 52,1 *** 0,0000

Gaz.-ess. 1 37,98 37,98 5,00 * 0,034Gaz.-plaq. 2 119,49 59,74 7,86 ** 0,0020Ess.-plaq. 2 57,93 28,96 3,81 * 0,035Plaq.-hum. 6 132,23 22,04 2,90 * 0,026

Gaz.-ess.-plaq. 2 60,26 30,13 3,97 * 0,031

Variation residuelle 27 205,16 7,598

Totaux 47 2.128,46

a lieu d’etre attentif, en ce qui concerne les conditions d’application de l’analyse, estla repartition completement aleatoire des 48 essais qui ont ete realises. L’exemplesuivant a trait a cette condition (exemple 11.4.2).

380 ANALYSE DE LA VARIANCE A TROIS ET PLUS DE TROIS CRITERES 11.4.2

Tableau 11.4.4. Etude des conditions de gazeification du bois de hetreet d’epicea : troisieme tableau d’analyse de la variance.

Sources Degres S. des carres CarresF P

de variation de liberte des ecarts moyens

Gazogenes 1 93,50 93,50 12,6 ** 0,0016Essences 1 23,63 23,63 3,20 0,086Plaquettes 1 61,88 61,88 8,37 ** 0,0080Humidites 3 1.183,50 394,50 53,3 *** 0,0000

Essences-plaquettes 1 51,26 51,26 6,93 * 0,015

Variation residuelle 24 177,49 7,395

Totaux 31 1.591,26

d Pour de telles analyses de la variance, la question de savoir comment realiserles regroupements de maniere aussi objective que possible est souvent posee. Unesolution frequemment adoptee consiste a tester toutes les composantes de l’analysede la variance initiale par rapport a l’interaction d’ordre superieur, meme si lestests ainsi realises n’ont aucun fondement rigoureux, et a regrouper les interactionsqui sont non significatives, a un niveau egal par exemple a 0,20 ou 0,25 , voire meme0,50 (§ 10.3.5.3◦).

Dans le cas du tableau 11.4.2 par exemple, il s’agirait d’effectuer tous les testspar rapport a l’interaction ✭✭ gaz.-ess.-plaq.-hum. ✮✮, et on peut effectivement cons-tater que toutes les interactions que nous avons regroupees sont non significativesde cette maniere, meme au niveau 0,50 . On peut aussi remarquer que, sur base duniveau de signification 0,20 , l’interaction ✭✭ plaq.-hum. ✮✮ aurait egalement pu etreintegree a la variation residuelle. Il en aurait resulte une augmentation de cettederniere, dont le carre moyen aurait alors ete egal a 10,22 , au lieu de 7,598 , eten consequence, une moindre signification de toutes les composantes, ainsi qu’uneplus grande simplicite d’interpretation.

Cet exemple met ainsi en evidence le caractere malgre tout assez subjectif detelles procedures de regroupement.b

Exemple 11.4.2. Etude des conditions de gazeification du bois de hetre et d’epi-cea : importance de la randomisation.

Dans des situations semblables a celle de l’exemple precedent, ou de l’exemple11.2.1 (etude de la resistance de panneaux de particules a l’arrachage des clous), larepartition completement au hasard ou randomisation 12 de l’ensemble des mani-pulations peut s’averer tres difficile a realiser, voire meme etre quasi insurmontableen pratique. Dans de telles situations, une repartition completement aleatoire im-plique en effet des contraintes telles que passer a tout moment d’un type de ga-

12 En anglais : randomization.

11.4.2 ANALYSE A PLUS DE TROIS CRITERES 381

zogene a l’autre (exemple precedent) ou modifier a tout moment des reglages devitesse (exemple 11.2.1).

Certains dispositifs experimentaux particuliers, dont les dispositifs avec parcel-les divisees [Dagnelie, 2003], permettent de faire face, au moins dans une certainemesure, a ces difficultes. Mais, pour des raisons de facilite, certains experimenta-teurs peuvent etre tentes de realiser l’ensemble des manipulations dans un ordresystematique, tout en effectuant l’analyse des resultats comme si la succession desmanipulations avait ete determinee de maniere completement aleatoire. Nous vou-drions illustrer les consequences possibles d’une telle attitude, a l’aide des donneesde l’exemple precedent.

Dans ce but, nous supposerons que les 48 observations presentees dans le ta-bleau 11.4.1 ont ete obtenues, non pas de facon completement aleatoire, mais dansl’ordre selon lequel elles figurent dans ce tableau, ce qui revient a dire que tout cequi concerne le premier type de gazogene a ete realise avant tout ce qui concernele deuxieme type de gazogene, que pour chacun de ces deux types d’appareil, toutce qui concerne la premiere essence a ete realise avant tout ce qui concerne ladeuxieme essence, etc. Nous supposerons en outre qu’en raison de facteurs quine sont pas maıtrises (evolution des caracteristiques des materiaux utilises ou desreglages de certains appareils de mesure, par exemple), les resultats subissent dansle temps une tres legere evolution systematique, positive ou negative, qu’on peutqualifier de gradient ou de derive.

Plus concretement, nous supposerons que la derive a ete lineaire et egale a 1 %sur l’ensemble de l’experience, la premiere observation restant egale a 74,4 % etla derniere observation devenant 59,8 %, au lieu de 58,8 %. De facon tout a faitarbitraire, la deuxieme observation deviendrait ainsi 71,3213 , au lieu de 71,3 , latrosieme observation 69,6426 , au lieu de 69,6 , etc., la derive etant egale a 0,0213d’une ligne a l’autre du tableau 11.4.1. On notera qu’une telle derive est tres faible,par comparaison avec l’amplitude des valeurs observees, qui vont de 55,1 a 80,5 %.

Le tableau 11.4.5 indique ce que deviendrait dans ces conditions le contenudu tableau 11.4.3. On remarquera tout d’abord, et on pourrait demontrer, que laderive envisagee, c’est-a-dire une derive lineaire, ne modifie pas les termes d’inter-action, ce qui justifie d’ailleurs le fait de proceder ici aux memes regroupements quepour les donnees initiales. Mais on peut remarquer aussi que la derive considereeconduit a une modification des resultats de l’analyse de la variance pour l’ensembledes quatre facteurs principaux, les changements etant surtout importants pour lepremier facteur.

Il s’agit, pour ce facteur, d’un quasi-doublement de la somme des carres desecarts, du carre moyen et de la valeur Fobs , la probabilite P etant reduite dans unrapport de l’ordre de 3,5 a 1 . Ce facteur, initialement non significatif (P = 0,13),deviendrait ainsi significatif (P = 0,038).

Une derive deux fois plus importante conduirait aussi aux resultats suivants,pour la premiere ligne du tableau :

60,77, 60,77, 8,00 et 0,0087,

382 ANALYSE DE LA VARIANCE A TROIS ET PLUS DE TROIS CRITERES 11.4.3

Tableau 11.4.5. Etude des conditions de gazeification du bois de hetreet d’epicea : tableau d’analyse de la variance avec derive lineaire.

Sources Degres S. des carres CarresF P

de variation de liberte des ecarts moyens

Gazogenes 1 36,32 36,32 4,78 * 0,038Essences 1 75,07 75,07 9,88 ** 0,0040Plaquettes 2 234,24 117,12 15,4 *** 0,0000Humidites 3 1.176,84 392,28 51,6 *** 0,0000

Gaz.-ess. 1 37,98 37,98 5,00 * 0,034Gaz.-plaq. 2 119,49 59,74 7,86 ** 0,0020Ess.-plaq. 2 57,92 28,96 3,81 * 0,035Plaq.-hum. 6 132,23 22,04 2,90 * 0,026

Gaz.-ess.-plaq. 2 60,26 30,13 3,97 * 0,031

Variation residuelle 27 205,16 7,598

Totaux 47 2.135,51

au lieu de :36,32 , 36,32 , 4,78 et 0,038 ,

le facteur gazogenes apparaissant alors comme hautement significatif. Et d’autresresultats pourraient etre obtenus en considerant que les 48 observations ont eterealisees selon d’autres ordres systematiques, ou encore en considerant une derivenegative au lieu d’une derive positive [Dagnelie, 2000]. On constate ainsi qu’unederive meme peu importante peut influencer de facon tres sensible les resultats del’analyse de la variance.

11.4.3 Les modeles hierarchises a effectifs egaux

1◦ Les problemes poses par les modeles completement hierarchises a effectifsegaux sont dans l’ensemble extremement simples, meme pour un nombre quel-conque de criteres de classification.

En effet, pour h criteres, le modele observe, l’equation d’analyse de la varian-ce et les modeles theoriques comportent toujours h + 1 termes seulement. Cesdifferents termes sont relatifs aux h facteurs principaux, subordonnes les uns auxautres de proche en proche, et a la variation residuelle.

D’autre part, si on suppose comme precedemment que seul le premier critere declassification peut etre fixe ou aleatoire (§ 11.3.2.2◦), tous les criteres subordonnesetant aleatoires, deux modeles seulement doivent etre consideres. L’un est mixteet l’autre aleatoire.

Enfin, pour ces deux modeles, les esperances mathematiques des carres moyensfont toujours intervenir, pour chacun des facteurs, la composante relative au fac-

11.4.3 ANALYSE A PLUS DE TROIS CRITERES 383

teur considere et toutes les composantes relatives aux facteurs qui lui sont subor-donnes (§ 11.3.2.3◦). Toutes les comparaisons doivent donc etre realisees, chaquefois, par rapport a la composante de niveau immediatement inferieur.

2◦ La situation se complique au contraire tres rapidement en ce qui concerneles modeles partiellement hierarchises. Pour quatre criteres de classification parexemple, Harter et Lum [1955] denombrent deja 49 modeles differents.

Comme pour trois criteres, des schemas semblables a ceux de la figure 11.3.1peuvent etre fort utiles, en vue d’identifier les termes qui doivent figurer dansles differents modeles observes et theoriques et dans les equations d’analyse de lavariance correspondantes.

Quant aux esperances mathematiques des carres moyens, elles peuvent etre ob-tenues selon les principes evoques au paragraphe 11.4.2.2◦. Les tables de Harteret Lum [1955] donnent egalement les resultats relatifs aux differents modeles aquatre criteres de lassification.

d 3◦ Dans le cas des modeles completement hierarchises et, dans une moindremesure, des modeles partiellement hierarchises, les nombres de degres de libertedifferent considerablement d’un critere de classification a l’autre. Ainsi, pour lesmodeles completement hierachises dont les differents criteres de classification necomportent chacun que deux modalites (p = q = r = . . . = 2), les nombres dedegres de liberte sont les puissances succesives de 2 , a savoir un degre de libertepour le premier critere de classification, deux degres de liberte pour le deuxiemecritere, quatre degres de liberte pour le troisieme critere, etc. Il en resulte degrandes differences de precision en ce qui concerne les estimations des composantesde la variance.

Certains modeles particuliers, connus sous le nom de modeles echelonnes 13,permettent de remedier a cette situation [Cheol Jung et al., 2008 ; Khattreeet al., 1997 ; Ojima, 1998, 2000].b

Exemple 11.4.3. Interpretation des resultats d’un ensemble d’essais d’engrais :principes de l’analyse de la variance.

Nous considerons un ensemble d’essais d’engrais faisant tous intervenir les huitmemes fumures, et realises de facon independante en six lieux differents et aucours de deux annees consecutives, chaque fois en deux blocs aleatoires complets[Van Renterghem et Dagnelie, 1963]. Nous insistons tout specialement surle fait qu’il s’agit bien d’essais independants, non seulement d’un lieu a l’autre,mais aussi d’une annee a l’autre, les essais ayant ete organises dans six stationsde recherche et, chaque fois, dans des champs d’experiences differents d’une anneea l’autre 14. Les observations effectuees sont des rendements par parcelle, et plusparticulierement dans le cas present, des rendements en coton.

13 En anglais : staggered model.14 Si au contraire, les memes champs d’experiences et les memes parcelles avaient ete observes

au cours de deux annees consecutives, dans chacune des stations de recherche, le probleme auraitete un probleme de mesures repetees, au sens ou il en a ete question au paragraphe 10.3.7.

384 ANALYSE DE LA VARIANCE A TROIS ET PLUS DE TROIS CRITERES 11.4.3

Dans ces conditions, les facteurs fumures, annees et lieux sont croises, puisqueles memes fumures sont appliquees au cours des deux annees et dans les differentslieux, et qu’en outre, les memes lieux sont pris en consideration au cours des deuxannees. Le facteur blocs, par contre, est croise avec le facteur fumures, puisqueles memes fumures se retrouvent dans les differents blocs, mais il est subordonneaux facteurs annees et lieux, puisque des blocs differents (et aussi des parcellesdifferentes) sont observes d’une annee a l’autre et d’un lieu a l’autre. Le modeled’analyse de la variance est donc un modele partiellement hierarchise a quatrecriteres de classification, dans le cas d’echantillons d’une seule observation, enl’occurrence une observation de rendement par parcelle (n = 1).

Ce modele est presente de maniere schematique dans la partie gauche de lafigure 11.4.1, les differentes lettres etant les initiales des quatre criteres de classi-fication. A l’examen des intersections qui apparaissent dans cette figure, on cons-tate que le modele observe et le modele theorique de l’analyse de la variancedoivent contenir les interactions fumures-annees, fumures-lieux, annees-lieux, etdonc fumures-annees-lieux, ainsi que l’interaction fumures-blocs (dans les anneeset les lieux). L’analyse de la variance correspondante est esquissee dans le tableau11.4.6.

Figure 11.4.1. Interpretation des resultats d’un ensemble d’essais d’engrais :representation schematique de deux modeles d’analyse de la variance.

Si on considere en outre que le facteur fumures est fixe et que les facteursannees, lieux et blocs (dans les annees et les lieux) sont aleatoires, le modeled’analyse de la variance est un modele mixte, ce que souligne aussi la premierepartie de la figure 11.4.1, par la presence d’une lettre minuscule pour le premierfacteur et de lettres majuscules pour les trois autres facteurs. Par analogie avecce qui a ete vu anterieurement (troisieme partie du tableau 11.2.5), le critere declassification fumures, auquel on s’interesse principalement, doit etre teste autantque possible par rapport a l’interaction fumures-annees ou a l’interaction fumures-lieux, ou encore a un regroupement de l’une ou l’autre de ces deux composantes,ou de l’ensemble de ces deux composantes et de l’interaction fumures-annees-lieux.

En vue de la realisation des calculs, le modele peut etre presente par exemplede la facon suivante pour le logiciel Minitab :

X = F A L F*A F*L A*L F*A*L B(A L) .

11.4.3 ANALYSE A PLUS DE TROIS CRITERES 385

Tableau 11.4.6. Interpretation des resultats d’un ensemble d’essais d’engrais :schema du tableau d’analyse de la variance.

DegresSources de variation

de liberte

Fumures 7Annees 1Lieux 5

Fumures-annees 7Fumures-lieux 35Annees-lieux 5

Fumures-annees-lieux 35

Blocs (dans annees et lieux) 12Fumures-blocs (dans annees et lieux) 84

Total 191

Mais le probleme reel est en fait sensiblement plus complexe, si on tient comptede ce que les huit fumures etudiees n’etaient pas independantes les unes des autres,mais etaient les combinaisons de deux doses (ou de l’absence et de la presence)d’azote, de deux doses (ou de l’absence et de la presence) de phosphore, et de deuxdoses (ou de l’absence et de la presence) de potassium, c’est-a-dire un ensemblede 23 fumures de type NPK. Dans ces conditions, l’analyse de la variance faitintervenir six criteres de classification, au lieu de quatre, toujours dans le cadred’un modele partiellement hierarchise mixte a effectifs unitaires. Le schema decette analyse est presente dans la partie droite de la figure 11.4.1, les trois matieresfertilisantes etant designees par des lettres minuscules, de maniere a maintenir ladistinction entre les criteres fixes et les criteres aleatoires.

La ligne fumures du tableau 11.4.6 doit alors etre subdivisee en sept compo-santes individuelles, a savoir les trois facteurs principaux azote, phosphore et potas-sium, et leurs quatre interactions (azote-phosphore, azote-potassium, phosphore-potassium et azote-phosphore-potassium). Il en est de meme pour chacune deslignes fumures-annees, fumures-lieux et fumures-annees-lieux. On est ainsi amenea augmenter considerablement, a priori, le nombre de composantes, mais celles-cine possedent evidemment que de tres petits nombres de degres de liberte (un degrede liberte dans tous les cas ou le facteur lieux n’intervient pas et cinq degres deliberte chaque fois que le facteur lieux intervient). Il s’averera donc indispensabled’effectuer des regroupements d’interactions, en fonction des resultats observes 15.

15 On notera que le probleme dont nous nous inspirons ici etait en realite plus complexe encore,dans la mesure ou un facteur supplementaire magnesium etait egalement pris en consideration,et ou le dispositif experimental etait un dispositif en blocs incomplets, base sur le principe du✭✭ confounding ✮✮ [Dagnelie, 2003 ; Van Renterghem et Dagnelie, 1963].

386 ANALYSE DE LA VARIANCE A TROIS ET PLUS DE TROIS CRITERES 11.4.3

Exemple 11.4.4. Etude des qualites technologiques du bois d’epicea : principesde l’analyse de la variance (suite).

Un retour a l’exemple 11.3.2 permet de donner brievement d’autres illustrationsdes modeles partiellement hierarchises d’analyse de la variance a plus de troiscriteres de classification. En effet, la presentation que nous avons adoptee dans cetexemple, en ce qui concerne l’etude des qualites technologiques du bois d’epicea,etait volontairement simplifiee, par rapport a la realite.

Pour rappel, il s’agissait d’un ensemble de 45 stations, de deux arbres parstation et de quatre eprouvettes par arbre, a raison de deux eprouvettes a deuxniveaux differents (partie inferieure et partie mediane des arbres). Dans la presen-tation de l’exemple 11.3.2, nous avons implicitement suppose, d’une part, que les45 stations avaient ete choisies de maniere completement aleatoire dans la regionconsideree, et d’autre part, que les deux eprouvettes constituaient elles aussi, danschaque arbre et a chaque niveau, un echantillon aleatoire et simple, ces echantillonsetant independants les uns des autres.

En realite, les 45 stations avaient ete choisies de maniere a representer troisclasses de production des peuplements (forets peu productives, forets moyenne-ment productives et forets tres productives) et trois categories de grosseur desarbres (arbres de moins de 90 cm de circonference, arbres de 90 a 120 cm decirconference et arbres de plus de 120 cm de circonference), chacune des neuf com-binaisons de ces deux criteres etant representee par cinq stations, considerees a cestade comme choisies tout a fait au hasard.

Dans ces conditions, le modele d’analyse de la variance serait un modele par-tiellement hierarchise mixte a cinq criteres de classification, avec des echantillonsde deux observations (deux eprouvettes). Une representation schematique de cemodele est donnee dans la partie gauche de la figure 11.4.2, les differents criteresetant designes par leurs initiales, toujours minuscules pour les facteurs fixes (ni-veaux, classes de production et categories de grosseur des arbres) et majusculespour les facteurs aleatoires (stations, dans les classes de production et les categoriesde grosseur des arbres, et arbres, dans les stations).

Figure 11.4.2. Etude des qualites technologiques du bois d’epicea :representation schematique de deux modeles d’analyse de la variance.

11.4.3 ANALYSE A PLUS DE TROIS CRITERES 387

Mais en outre, aux deux niveaux pris en consideration dans chacun des arbres,les deux eprouvettes n’avaient pas non plus ete choisies de maniere completementaleatoire et independamment d’un niveau a l’autre. A chaque niveau en effet, uneeprouvette avait ete prelevee systematiquement dans la partie centrale du tronc etune autre eprouvette dans la partie exterieure du tronc.

Il y a donc lieu de considerer la position des eprouvettes comme un sixiemecritere de classification, mais alors sans repetitions, puisqu’on ne dispose plus qued’une eprouvette pour chaque combinaison des differentes modalites des six fac-teurs. Le modele d’analyse de la variance correspondant est esquisse dans la partiedroite de la figure 11.4.2 16.

Pour les deux cas envisages, on peut deduire de cette figure les interactions quidoivent apparaıtre dans les modeles d’analyse de la variance, ainsi que les schemasdes tableaux d’analyse de la variance. Toujours selon les memes conventions, re-latives notamment au logiciel Minitab, le premier modele par exemple peut etrepresente sous la forme :

X = N C G N*C N*G C*G N*C*G S(C G) N*S(C G)

A(S C G) N*A(S C G) .

Les deux derniers exemples, que nous n’avons fait qu’esquisser, accompagnes deleurs notes de bas de page, illustrent la grande diversite des situations auxquelleson peut etre confronte en analyse de la variance.

16 Ici egalement, le probleme original etait en fait plus complexe encore, dans la mesure oul’etude prenait en consideration un troisieme niveau (correspondant a la partie superieure desarbres), toujours avec prelevement de deux eprouvettes, mais avec un positionnement des deuxeprouvettes different de celui des autres niveaux [Dupont, 1984 ; Grayet, 1980].