38
20/01/01 20/01/01 Tests statistiques Note pédagogique Christophe Benavent Professeur à l'IAE de Lille Table des matières 1. LE PRINCIPE DES TESTS STATISTIQUES.................................................................................3 1.1. LA NATURE LOGIQUE D'UN TEST .........................................................................................................3 1.2. UNE PROCEDURE DE PRISE DE DECISION ..............................................................................................5 1.2.1. La décision...............................................................................................................................5 1.2.2. La procédure de test .................................................................................................................7 1.3. TYPES DE TEST..................................................................................................................................9 1.3.1. Test uni et bilatéral ..................................................................................................................9 1.3.2. Tests paramètriques et non paramètriques .............................................................................. 10 1.3.3. Echantillons indépendants et appariés.................................................................................... 11 1.4. TABLEAU DES PROBLEMES ET TESTS APPROPRIES............................................................................... 12 2. PROBLEMES A UN ECHANTILLON ......................................................................................... 13 2.1. TEST PARAMETRIQUE ...................................................................................................................... 13 2.1.1. Test Z et t ............................................................................................................................... 13 2.2. NON PARAMETRIQUES ...................................................................................................................... 14 2.2.1. Test binomial.......................................................................................................................... 14 2.2.2. Test du c2............................................................................................................................... 15 2.2.3. . Test de Kolmogorov Smirnov ................................................................................................ 16 2.2.4. Test des signes........................................................................................................................ 16 3. PROBLEME A 2 ECHANTILLONS ............................................................................................. 17 3.1. TESTS PARAMETRIQUES ................................................................................................................... 17 3.1.1. Echantillons indépendants ...................................................................................................... 17 3.1.2. Echantillons appariés ............................................................................................................. 19 3.2. TESTS NON PARAMETRIQUES ............................................................................................................ 20 3.2.1. Echantillon indépendants ....................................................................................................... 20 3.2.2. Echantillons dépendants ......................................................................................................... 25 4. PROBLEMES A PLUS DE 3 ECHANTILLONS .......................................................................... 29 4.1. TESTS PARAMETRIQUES ................................................................................................................... 29 4.1.1. Analyse de variance ............................................................................................................... 29 4.1.2. Comparaison par paires. ........................................................................................................ 30 4.2. TESTS NON PARAMETRIQUES ............................................................................................................ 30 4.2.1. Tests pour des échantillons independants. .............................................................................. 30 4.2.2. Test pour plus de 3 échantillons dépendants ........................................................................... 33 5. PROBLEMES D'ASSOCIATION.................................................................................................. 34 5.1. CORRELATION DE PEARSON ............................................................................................................. 34 5.1.1. Test de Bonfferroni ................................................................................................................. 34

Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

20/01/01 20/01/01

Tests statistiquesNote pédagogique

Christophe BenaventProfesseur à l'IAE de Lille

Table des matières

1. LE PRINCIPE DES TESTS STATISTIQUES.................................................................................3

1.1. LA NATURE LOGIQUE D'UN TEST .........................................................................................................31.2. UNE PROCEDURE DE PRISE DE DECISION ..............................................................................................5

1.2.1. La décision...............................................................................................................................51.2.2. La procédure de test .................................................................................................................7

1.3. TYPES DE TEST..................................................................................................................................91.3.1. Test uni et bilatéral ..................................................................................................................91.3.2. Tests paramètriques et non paramètriques..............................................................................101.3.3. Echantillons indépendants et appariés....................................................................................11

1.4. TABLEAU DES PROBLEMES ET TESTS APPROPRIES...............................................................................12

2. PROBLEMES A UN ECHANTILLON .........................................................................................13

2.1. TEST PARAMETRIQUE ......................................................................................................................132.1.1. Test Z et t ...............................................................................................................................13

2.2. NON PARAMETRIQUES ......................................................................................................................142.2.1. Test binomial..........................................................................................................................142.2.2. Test du χ2...............................................................................................................................152.2.3. . Test de Kolmogorov Smirnov................................................................................................162.2.4. Test des signes........................................................................................................................16

3. PROBLEME A 2 ECHANTILLONS.............................................................................................17

3.1. TESTS PARAMETRIQUES ...................................................................................................................173.1.1. Echantillons indépendants......................................................................................................173.1.2. Echantillons appariés.............................................................................................................19

3.2. TESTS NON PARAMETRIQUES............................................................................................................203.2.1. Echantillon indépendants .......................................................................................................203.2.2. Echantillons dépendants.........................................................................................................25

4. PROBLEMES A PLUS DE 3 ECHANTILLONS..........................................................................29

4.1. TESTS PARAMETRIQUES ...................................................................................................................294.1.1. Analyse de variance ...............................................................................................................294.1.2. Comparaison par paires. ........................................................................................................30

4.2. TESTS NON PARAMETRIQUES............................................................................................................304.2.1. Tests pour des échantillons independants. ..............................................................................304.2.2. Test pour plus de 3 échantillons dépendants ...........................................................................33

5. PROBLEMES D'ASSOCIATION..................................................................................................34

5.1. CORRELATION DE PEARSON .............................................................................................................345.1.1. Test de Bonfferroni.................................................................................................................34

Page 2: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 2

5.1.2. Comparaison de corrélations. pour deux sous-échantillons ....................................................345.2. CORRELATION DE RANG DE SPEARMAN ............................................................................................355.3. CORRELATION DE RANG DE SPEARMAN ............................................................................................35

6. LES VOIES ALTERNATIVES ......................................................................................................37

6.1. LES TESTS ROBUSTES.......................................................................................................................376.2. L'INFERENCE BAYESIENNE ...............................................................................................................376.3. L'ANALYSE FIDUCIAIRE........................................................................ ERREUR! SIGNET NON DÉFINI.

Page 3: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 3

1. Le principe des Testsstatistiques

1.1. La nature logique d'un test

Le problème essentiel dans une démarche scientifique est souvent d'établir une relation entre deuxconcepts qu'elle soit une association ou une comparaison. Ce travail est généralement justifié par unethéorie. Le raisonnement qu'on pourrait souhaiter retenir est le suivant :

Je pense T, donc je dois observer le fait A.

Or j'observe A

Donc T est vrai.

En fait ce raisonnement est fallacieux dans la mesure où une théorie alternative T', permet dejustifier le fait A. Le seul raisonnement que l'on puisse tenir est en fait le suivant.

Je pense T, donc je dois observer le fait A

Or je n'observe pas A

Donc T est faux.

Ce raisonnement est correct (modus tollens). Il invalide la théorie en montrant que la déduction netient pas. Le travail de recherche consiste (en grande partie) à élaborer des hypothèses et à les valider.De ce point de vue, il est plus correct de parler de processus de réfutation, ou au moins d'épreuve1. Unexemple d'hypothèse est le suivant :

1 En ce sens, d’un point de vue épistémologique, la procédure des tests statistique correspond exactement à laconception de la science proposée par Popper.

Page 4: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 4

Les entreprises en situation de turbulence ont de meilleurs résultats si leur structure ont uncaractère « organiques ».

Cette hypothèse générale doit être testée. Elle résulte d'abord d'une réflexion théorique, à partir delaquelle elle a été déduite. (La théorie est par exemple celle des systèmes ouverts, celle de l'écologieetc...).

La structure de cette hypothèse est la suivante :

Si E=turbulent et O=organique alors Po=élevée

Si E=turbulent et O=mécanique alors Pm=bas.

On ne peut vérifier directement cette hypothèse. Il s'agira donc de la formuler sous une forme quise prête aux tests statistiques. On va donc construire ce que l'on appelle l'hypothèse nulle.L'environnement est identique dans les deux situations, on n'en tiendra pas compte, il ne fait que définirle contexte. On compare deux types d'entreprises sur un critère. Ce que l'on cherche est de montrer quePo>Pm. Or on a vu que logiquement on ne peut démontrer la vérité de la théorie à partir de la vérité dufait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière formulation est appeléehypothèse nulle. L'autre hypothèse est appelée hypothèse alternative.

Quelle est la signification du terme hypothèse nulle?

- négation d'une hypothèse de recherche.

- spécification d'un paramètre égal à zéro. L'hypothèse nulle est exacte (Po-Pm=0), l'hypothèsealternative est indéfinie.

- hypothèse sur la base de laquelle est définie la distribution de probabilité (théorie de ladécision).

Le test de signification d'un point de vue statistique peut être envisagé sous deux grandesapproches bien souvent confondues :

1) l'approche de Fisher qui conçoit le test comme une procédure d'épreuve de propositionsscientifiques dans un contexte d'information limité (échantillon). Cette approche favorise la suspensiondu jugement : autrement dit si on est amené à rejeter l'hypothèse nulle, la théorie est considérée commevraie jusqu'à nouvel ordre; et si l'on accepte H0 (on ne peut rejeter H0) on rejette la théorie.

2) l'approche de la théorie de la décision : il faut rejeter prendre une décision au coût le plusfaible.

Dans les deux cas, et c'est le point important, on se trouve en situation d'incertitude. Cetteincertitude est due au processus d'échantillonnage. Les faits qui nous permettent d'invaliderempiriquement une théorie nous sont donnés en nombre limité. Ceci même si la population est étudiéesystématiquement (en effet celle-ci peut varier dans le temps). Le problème du test d'hypothèse est doncun problème de comparaison entre deux types de fluctuations : des fluctuations prédites par la théorie,des fluctuations produites par l'échantillonnage et les erreurs de mesures.

Page 5: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 5

1.2. Une procédure de prise de décision

Les tests statistiques répondent tous à une procédure constante. Celle-ci est composée de deuxéléments, d’abord un tableau de prise de décision, qui inclue divers risques d’erreur. Ensuite uneséquence d’étapes, dont les seules variations sont les statistiques utilisées selon la situation.

1.2.1. La décision.

La logique du test est donnée dans le tableau suivant. Compte tenu d’une hypothèse nulleaffirmant l’absence de différence ou une absence de relation, quatre situations sont possibles. On peutdécider que H0 est soit vraie soit fausse, en réalité (mais nous ne le savons pas) elle est vraie ou fausse.

Imaginons que l’on teste l’hypothèse nulle suivante : les hommes gagnent autant que les femmes àniveau de qualification et d’ancienneté égaux. On cherchera à montrer que la différence de salairemoyen est égale. Selon les résultats de ce calcul, on peut prendre deux décisions : H0 est vraie, H0 estfausse.

Si compte-tenu de la différence calculée on décide que H0 est fausse (il y a une différence), soiton a raison, en réalité il y a des différences de salaires, soit on se trompe. Dans ce cas on affirme unerelation entre sexe et salaire alors qu’il n’y a rien. Cette erreur doit être minimisée. Ce risque est appelérisque α de première espèce. En pratique on en fixe le niveau de manière subjective (généralement 1%ou 5%). C’est le risque maximum que l’on est prêt à prendre. Imaginons que le risque est de 8%, il y adonc 8% de dire que H0 est fausse alors qu’en réalité elle est vraie. Il y a 8% de chance de direqu’homme et femmes diffèrent en salaires alors qu’il n’en ait rien. Si le risque tolérable est de 5%, onpréférera ne pas prendre ce risque et on ne rejettera pas l’hypothèse. Symétriquement si on prend unrisque de 5%, on a un seuil de confiance de 95% de rejeter l’hypothèse nulle a raison.

Si compte-tenu de la différence calculée on décide que H0 est vraie (pas de différence), soit on araison (il n’y a pas de différence), soit on a tord. On affirme qu’il n’y a pas de relation, alors qu’enréalité les salaires sont différents. En décidant H0 est vraie, on omet, on néglige, un phénomène, unautre risque apparaît, on l’appelle β le risque de seconde espèce.

La notion de puissance du test est définie à partir du risque de seconde espèce : puissance=(1-β).Elle indique la probabilité que l'on admette à raison l’existence de la relation. Cohen2 a fait l'étude decette puissance en marketing. Il conclue à la relative puissance des tests (d'environ 0,8). Cette puissanceest liée à plusieurs facteurs :

- le test lui-même. Les tests paramétriques appliqués dans de bonnes conditions sont les pluspuissants

- la taille de l'échantillon : plus l'échantillon est grand et plus la puissance est grande.

- le risque alpha : plus ce risque est faible et plus faible est la puissance.

- l'intensité de la relation ou de la différence.

2 Cohen

Page 6: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 6

H0

(Pas de relation; pas dedifférence)

En réalité vraie

(Il n'existe pas de relation)

En réalité fausse

(Il existe une différence)

Décision H0 fausse

(Rejet de l'hypothèse nulle)

Erreur de type I : risque α

de dire qu'il y a quelque chosealors qu'il n'y a rien (risqued'illusion)

1-α

Décision H0 vraie

(Acceptation de l'hypothèsenulle)

1- β : puissance du test Erreur de type II :(risque β)

de dire qu'il n'y a rien alors qu'il y aquelque chose. (risque denégligence)

La notion de niveau de significativité est différente du niveau de risque. Généralement on neprend en compte que le risque de première espèce, ce risque est calculé, il est comparé au niveau designificativité, qui apparaît comme un seuil de décision. Par exemple, on se donne un niveau de 5% cequi signifie que l'on accepte à l'avance de faire une erreur dans 1 cas sur 20, le risque calculé est de 8%.Ce risque dépasse le seuil qu'on s'est donné, on ne le prendra donc pas. Par contre si on accepte dechoisir un niveau de significativité de 10%, alors on conclura à l’existence de la relation. Plus le niveauest élevé et plus on a de chance de faire apparaître de relation, malheureusement, plus nombreusesseront les relations fallacieuses. Si le risque de première espèce est lié uniquement à la taille del'échantillon et à l'intensité de l'effet, la significative n'est l'affaire que du chercheur. Le choix de sonniveau dépend généralement du type de problème posé. Dans une étude à caractère exploratoire unrisque relativement élevé sera accepté (5%), dans une étude confirmatoire des seuils plus faibles serontnécessaire.

On a invoqué l'idée d'intensité de la relation ou de la différence. Cette intensité détermine lesrisques de première et de seconde espèce. Mais ces derniers ne la mesure pas. Autrement dit on peuttester une hypothèse avec des risques de première et seconde espèce respectés sans que la relationconfirmée soit très forte. La taille de l’effet peut être défini comme d'influence de la variation d'unevariable explicative sur une variable expliquée. C'est pour cela qu'avant toute étude statistique, il fautbien analyser les conditions et hypothèses afin de fixer correctement H0 et H1, et choisir de façonrationnelle les risques alpha et bêta. Ce qui veut dire qu'il n'est pas toujours justifié de prendre un risquealpha systématiquement égal à 5%.

Le problème du test est ici de choisir la décision qui maximise le gain, ou minimise les pertes, enconnaissant les risques et en connaissant le coût des alternatives. Si le calcul des risques est dans la pluspart des cas possibles, le coût, ou les gains des alternatives sont beaucoup plus difficile à établir dans lecadre de la recherche pure. La stratégie choisie est celle de Fisher. Elle revient à considérer qu'il estglobalement plus grave d'affirmer une différence ou une relation qui n'existe pas, que d'ignorer unerelation ou une différence existante.

Exemple, on expérimente un nouveau traitement médical qui coûte très cher, H0 est : le traitementest inefficace, H1 : le traitement est efficace. Le risque alpha de première espèce est le risque de traiteralors que le traitement est inefficace. Le coût de l'erreur de première espèce est donc le coût dutraitement, et ce qui compte dans ce cas pour déterminer alpha, c'est le produit : alpha x coût de l'erreurde première espèce = alpha x coût du traitement.

Page 7: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 7

D'autre part, dans certains tests de produits, il est nécessaire de se pencher sur un risque dit de 3èespèce et noté gamma. Ce risque représente le risque de conclure que B est meilleur que A (on lancedonc B) alors qu'en fait A est meilleur que B.

1.2.2. La procédure de test

La logique procédurale d'un test est la suivante :

1) A partir d'une théorie on déduit des faits.

2) ces faits sont les hypothèses de recherche.

3) on transforme ces hypothèses de recherche en hypothèses testables (nulleet alternative).

4) on choisit le test approprié .

5) on choisit des critères de décisions (zone de rejet).

6) on calcule la statistique à partir d'un échantillon aléatoire.

7) on prend la décision.

8) on infère la véracité de la théorie.

Le dernier point pour bien comprendre la nature d'un test est de comprendre la signification d'unestatistique de test. L'exemple d'un test du χ2 est suggestif.

1) En théorie des organisations, la théorie contingente stipule que la performance d’undépartement dépend essentiellement de la correspondance entre de degré d’incertitude de la tâche et lemode d’organisation. En distinguant trois niveaux d’incertitude on obtient la correspondance suivante.En supposant que seules les formes organisationnelles performantes survivent on en déduit que les deuxvariables doivent être fortement liées.

Incertitude

Mode de management Exemples

Forte Moyenne Faible

Systématique ( des routines règlentl’organisation du travail).

Fast-food ++ - --

Par exception (les routinesorganisent le travail, mais une marged’appréciation et d’initiative estlaissée aux agents).

Coiffeur - ++ -

Développemental (les tâches sontdes projets, l’organisation est trèsflexible, tout est laissé à l’initiatived’experts).

Bûcheron -- - ++

2) l’hypothèse est simple : il y a dépendance entre degré d’incertitude et mode de management.

Page 8: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 8

3) l’hypothèse nulle est celle de l’indépendance des deux variables. L’hypothèse alternative estcelle d’une dépendance doit être caractérisée. Pour l’hypothèse nulle il suffira de comparer deuxtableaux : celui de la distribution observée et celui de la distribution sous la condition d’indépendance.Ce dernier tableau est calculé en faisant le produit des marges et des colonnes.

4) le test approprié est celui du χ2. Cette quantité permet de mesurer l’écart entre les deuxtableaux. On sait qu’elle se distribue selon une loi de probabilité déterminée par le nombre de degré deliberté. En l’occurrence (3-1)(3-1)=4.

5) Nous situant dans le cadre d’une recherche exploratoire, nous adoptons un seuil de risquealpha de 5%. La distribution du χ2 sous 4 degrés de liberté à la forme suivante. Plus précisément, unrisque de 5% correspond à un seuil de χ2=9,44. Autrement dit la probabilité d’avoir un χ2 supérieur à9,44 n’est que de 5%. Si le χ2 calculé a une valeur de 12 celui-ci signifie simplement qu’il y a moins de5 chances sur chances d’obtenir une telle valeur alors que les deux variables sont indépendantes.

0,000

0,005

0,010

0,015

0,020

0,025

0,030

0,035

0,040

0,20

00,

600

1,00

01,

400

1,80

02,

200

2,60

03,

000

3,40

03,

800

4,20

04,

600

5,00

05,

400

5,80

06,

200

6,60

07,

000

7,40

07,

800

8,20

08,

600

9,00

09,

400

9,80

010

,200

10,6

0011

,000

11,4

0011

,800

12,2

0012

,600

13,0

0013

,400

13,8

0014

,200

14,6

0015

,000

5%

95%

6 ) On réalise une enquête. 160 unités de travail sont étudiées. Leur tableau de répartition est lesuivant :

Incertitude

Mode de management

Forte Moyenne Faible Total

Systématique 30 10 5 45

Par exception 10 45 10 65

5 10 35 50

Total 45 65 50 160

La statistique du χ2 associée à ce tableau est de 90,53.

7) la valeur seuil est de 9,44. La valeur observée est très largement supérieure on en conclut qu’ily a une très faible probabilité d’avoir une erreur de première espèce (la probabilité associée à une valeurdu χ2 supérieure à 90,53 est de l’ordre de 1*E-18, c’est à dire nulle). On rejettera donc sans discussionl’hypothèse nulle.

Page 9: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 9

8) On retiendra donc temporairement la théorie de la contingence, en restant prudent. Le test n’apas permis de vérifier la théorie. Simplement de dire qu’elle n’était pas réfutée. Dans ce cas précis letest choisis est insuffisant. En effet si on suit la théorie la répartition suit une configuration particulière(sureffectif dans la diagonale). Or imaginons le tableau suivant :

Incertitude

Mode de management

Forte Moyenne Faible Total

Systématique 10 10 35 55

Par exception 30 10 10 50

5 45 5 55

Total 45 65 50 160

Le test du χ2 nous permettrait sans discussion de confirmer la relation, mais nous aurions alorsune configuration contraire à ce qui était attendu.

1.3. Types de test

La pratique des tests statistiques nécessite que l’on distingue différentes situations. Celles-ci sontdécrites par trois éléments : le sens du test (comparaison unilatérale ou bilatérale); la possibilité de faireappel à une loi de distribution connue liée à la taille et à la nature des échelles de mesures; l’appariementdes mesures.

1.3.1. Test uni et bilatéral

On considère deux formules promotionnelles A et B, A étant la formule habituellement employéeet B une formule de substitution moins coûteuse, que l'on se propose de tester.

Soit fa le rendement réalisé par la formule A (par ex fa = 10%) et fb celui de la formule B (parexemple fb = 9%). On utilisera pour la comparaison 2 échantillons (ou tranches de clientèle) de tailleélevée n = 10 000, afin de diminuer au maximum l'erreur absolue commise, c'est à dire de diminuerl'intervalle de confiance3. La question que l'on pose est : la différence fa-fb observée sur les 2échantillons est-elle significative ? Dépend -t-elle des fluctuations d’échantillonnage ou d’une cause plusprécise?

On doit donc choisir entre 2 hypothèses H0 et H1 au niveau de la population totale :

H0 : Pa = Pb (hypothèse nulle) ou D = Pa-Pb = 0 aux fluctuations aléatoires près

3Il convient de remarquer qu'à partir d'une taille d'échantillon de 1000 individus, l'erreur absolue ne diminue plusbeaucoup eu égard à une taille d'échantillon plus grande.

Page 10: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 10

H1 : Pa>Pb (hypothèse alternative) ou D = Pa-Pb > 0 aux fluctuations près.

Ici ce test est dit unilatéral dans la mesure où l'on exclut d'emblée l'hypothèse D < 0. Il faut doncavoir toutes raisons de penser que A est meilleur que B. Si le moindre doute existe, l’hypothèsealternative est H1 : Pa>Pb ou Pa<Pb. Et on a affaire à un test bi-latéral.

Si l'hypothèse H0 est vraie, on sait que d = fa-fb suit une loi normale de moyenne E(fa)-E(fb) =Pa-Pb = 0 et de variance σd² = V(fa)+ V(fb) = Pa(1-Pa)/na + Pb(1-Pb)/nb. Cette variance est la somme desvariances d'échantillonnage. Comme dans l'hypothèse H0, Pa = Pb, notons P0 = Pa = Pb, il vient alors :

σd² = P0(1-P0) (1/na + 1/nb)

On estime habituellement P0 par : P0 = (nafa + nbfb)/(na + nb). C'est donc une moyenne pondéréedes 2 pourcentages de remontée observés. si on est en présence d'une variable numérique σd² est estimépar

U= (d - D)/σd soit puisque sous H0, D = 0, U = d/σd

Donc dans la table de U, d/σd a 95% de chances d'être inférieur à 1,645, 90% de chances d'êtreinférieur à 1,282....

Dans le cas d’un test bilatéral, on s'intéresse à l'existence d'une différence entre les deux formules,quel que soit son signe : Pa différent de Pb.

On rejettera donc H0 si la différence observée d est trop grande en valeur absolue. Attention dansce cas, la zone de rejet de H0 pour alpha = 5% est :

d > 1,96 σd, soit d/σd > 1,96.

Dans notre exemple précédent, H1 resterait donc vraie, mais la limite pour d significatifdeviendrait 0,8 point au lieu de 0,68.

1.3.2. Tests paramètriques et nonparamètriques

Un certain nombre de tests s’appuie sur une hypothèse : la variable étudiée suit une loi dedistribution connue (loi binomiale, loi normale etc..). C’est la connaissance de cette loi qui permet decalculer la statistique de test et ensuite les probabilités de risque. C’est ainsi que dans le cas précédent,on fait l’hypothèse que D suit une loi particulière : la loi normale. Ce type de test est appelé testparamétrique.

Un test est dit non-paramétrique, lorsqu'il ne dépend pas de paramètres, tels moyenne, écarttype...etc, ou que son application n'exige pas une distribution particulière de la variable ou des variablesétudiées. Par exemple, dans un test en t, il faut que la distribution des variables soit normale et devariance similaire, dans un test du χ², on ne demande aucune condition de distribution aux variables.

Le χ² est en effet un test non paramétrique très utilisé. D'autre part, certaines variablesqualitatives, comme les variables ordinales peuvent être analysées par l'intermédiaire des tests nonparamétriques.

Page 11: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 11

Dans le cas d’un test non paramétrique, on n'a pas besoin de connaître a priori la distribution desvariables. Ces tests sont peu sensibles aux valeurs aberrantes. Plus un échantillon est petit, plus il estsensible aux valeurs aberrantes. On privilégiera donc les tests non paramètriques lorsque leséchantillons sont petits. Il en résulte que les échantillons n'ont pas de taille minimale requise. Ilspermettent ainsi des traitements statistiques sur de petits échantillons (<30 individus).

Ils ne nécessitent pas la connaissance des valeurs, mais des rangs respectifs. Si on veut comparerdeux équipes sportives A et B, lors d'une épreuve de course, il suffit d'avoir l'ordre d'arrivée descoureurs : A, A, B, B, B, A, B, A, A, B.... pour pouvoir comparer. Si par contre, on possède les tempsde course de chacun, il faudra les transformer en série ordinale, c’est à dire en classement. Un autreintérêt de ces tests, est qu'ils sont peu sensibles aux valeurs aberrantes, car très souvent, on ne travaillepas sur les valeurs elle mêmes, mais sur le rang des valeurs. Ceci est d’autant plus appréciables que leséchantillons sont petits, en effet dans ce cas des statistiques telles que la moyenne deviennent sensiblesaux valeurs aberrantes.

Les tests non paramétriques sont nombreux, et ils sont très importants quoique souvent sousutilisés. Ces tests sont donc pratiquement toujours utilisables.

1.3.3. Echantillons indépendants et appariés.

Deux grandes situations de tests doivent être distinguées : celle où deux ou plusieurs populationsdistinctes sont mesurées sur une même variable et celle où ce sont les mêmes populations. Dans cederniers cas on parle de mesures appariées. Les mêmes individus sont mesurés sur une mêmes variablesdans des situations distinctes.

La différence statistique entre ces deux situations est que dans la première il n’y a pas decorrélation entre la mesure sur un groupe et celle de l’autre groupe, alors que dans la seconde unecorrélation substantielle peut être enregistrée. Ceci affectera de manière considérable le calcul desstatistiques de test.

D’un point de vue pratique ces deux situations concernent d’une part le problème decomparaisons de groupes différents : comparer le salaires des hommes à celui des femmes, d’autre pascelui de la comparaison d’un même groupe dans deux situations différentes : par exemple mesurerl’évolution des salaires entre une période t et une période t-1 chez les hommes.

Page 12: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 12

1.4. Tableau des problèmes et testsappropriés.

Echantillons indépendants Echantillons appariés

paramètriques non-paramètriques paramètriques non-paramètriques

1 échantillon -Test Z et t (M) - Test binomial (N)

- Test du CHI2 (N)

- Kolmogorov-Smirnov (O)

2 échantillons -test en Z et t pour2 moyennes ou 2proportion (M)

-Test F (M)

- Test de Fisher etChi2 (N)

-test de lamédiane(O)

- test de Mann-Withney(O)

- Test des rangs

- Test KS

- test de Siegel

-test t sur ladifférence demoyenne (M)

-McNemar (N)

-Test signé deWilcoxon (O)

-Test des signes(O)

- Tests depermutation pourpaires répliquée(M)

- Test de Moses

3 échantillons etplus

-ANOVA, test F(M)

-Test de Kruskall-Wallis (O)

- Test de lamédiane (O)

- Test J deJonckeehe (O)

- Anova (mesurerépétée) (M)

- Analyse decovariance (M)

-Q de Cochran (N)

- Analyse deVariance deFriedman (O)

Association -r Pearson (M) -Kendall(M)

-Spearman(M)

-W deconcordance(M)

-Coefficient Kd’agréement(M)

-Statistique γ(M)

Page 13: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 13

2. Problèmes à unéchantillon

Ce type de problème concerne essentiellement la comparaison à un standard où encore lescomparaison d’une distribution empirique à une ditribution théorique (le standard). Les exemplessuivants illustrent les situations concrêtes qui requièrent ce type de test :

Exemples : La communauté européenne impose aux X de contenir au plus Y. Dans un lot du produit onmesure Y sur n objets. La mesure est de Y’. Doit-on conclure que l’ensemble du lot dépasse lanorme?Dans une enquête, 54% des répondants sont des femmes. Est-ce que l’échantillon n’est pasbiaisé sachant que dans la population le taux est de 52%?

2.1. Test paramétrique

2.1.1. Test Z et t

Les tests Z et t de comparaison à un standard sont utilisés selon la taille de l’échantillon. Inférieurà 30 on utilise le t, supérieur à 30 c’est le test Z qui sera retenu. Dans les deux cas l’hypothèse nulle estcelle de l’égalité de la moyenne de la variable à un standard S.

La statistique Z est calculée en faisant : Z=X S

s n

−/

autrement dit on fait le rapport entre l’écart

au standard et l’écart-type d’échantillonnage de la moyenne. Z se distribue selon une loi normale centréeréduite. Lorsque n est inférieur à 30, on utilisera la statistique t distribuée selon la loi de student. Onpeut aussi appliquer ce test à une proportion lorsque n>>30, dans le cas contraire on utilisera le testbinomial (voir ci-dessus).

Page 14: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 14

z

Le test peut prendre une forme bilatérale ou uni latérale selon les problèmes. Bien souvent dans lapratique il s’agira d’un test unilétral : le souci courrant est de savoir si la moyenne d’un échantillondépasse une certaine valeur, qu’elle soit en dessous ne pose aucun problème.

Exemple d’application :

A la sortie d’un atelier de fabrication de foies gras un prélévements aléatoire de 10 boites est réalisé.On mesure le taux de Staphillocoque dorée celui-ci est en moyenne de 12/ooo, l’écart-type est de 2/ooo;la norme tolérée est de 10/ooo. Doit-on considérer que la production est audelà de la norme?Onprendra un intervalle de confiance de 99%.

l’hypothèse Ho est Tx=norme, l’hypothèse alternative H1 est Tx>norme

La valeur t correspond à p(x>t)=0,01 est de 3,24. La statistique Z est de 3,16. On est donc dans la zoned’acceptation. On ne peut rejeter l’hypothèse nulle, par conséquent on considera que le produit estdans la norme. Par contre si p(x>t)=0,05, la statistique du test aurait été de 2,26 et l’on aurait rejetél’hypothèse nulle.

Si au lieu de 10 observations, on aurait eu 30 observations, on aurait choisit le test Z et calculé lesseuilscritiques sur la base de la loi normale.

2.2. non paramètriques

2.2.1. Test binomial

La variable considérée comprend 2 modalités. l'hypothèse nulle est celle d'une distribution auhasard (pièce de monnaie) c'est à dire p=q=0.5. p(a) mesure la probabilité d’obtenir a objets dans unecatégorie et (n-a) dans une autre.

p(a) =n!

a!(n - a)!p qa n-a

Page 15: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 15

Par exemple la probabilité d’observer l'éventualité 5 hommes dans un échantillon de 20 alors quep=q=0,5 est de 20!

5!(20 - 5)!0 5 0 55 15, , =1,478 %.

Si l'échantillon est supérieur ou égal à 30 on utilise l'approximation par une loi normale, qui serad'autant plus précise que p est proche de 0.5. La distribution d'échantillonnage est alors proche d'une loinormale de moyenne np est de variance np(1-p). On teste l'hypothèse par la statistique Z avec unecorrection de continuité :

Z=(a

1

2) - np

np(1- p)

±

2.2.2. Test du χχ2

La variable considérée comprend 2 modalité ou plus, et elle est catégorielle. Il s'agit de comparerune distribution observée à une distribution théorique

Exemple :

On observe dans un échantillon de 100 observations les proportion suivantes

Modalités Proportionobservée

Standard Chi2

A 0,1 0,2 5

B 0,2 0,2 0

C 0,4 0,2 20

D 0,1 0,2 5

E 0,2 0,2 0

total 30

On calcule la statistique du χ2.Le test le plus utilisé est le test du χχ². Pour un χ², il faut auminimum 5 individus par case d'effectifs théoriques, sinon il faut appliquer la correction de Yates, quiôte ½ au terme (Observé - théorique). C'est à dire que le χ² s'écrira :

[ ]χ ²=

− −∑

O T

T

12

2

Cette correction n'est valable que pour les variables à 2 classes, car elle dérive de l'approximationd'une Loi Binômiale par une Loi normale (correction de continuité). Cependant le χ² est utilisable quelleque soit la distribution des variables. Le fait qu'un test non paramétrique tende vers une Loi normale,n'oblige pas que les variables suivent une Loi normale.

Page 16: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 16

2.2.3. . Test de Kolmogorov Smirnov

Lorsque les conditions d'utilisation du test du chi² ne seront pas vérifiées (effectifs théoriques <5),un test utile est le test de Kolmogorov Smirnov. Il s’utilise lorsque le standard n’est pas constituéd’une seule valeur, mais reflète une distribution multinomiale.C'est un test permettant de vérifierl'ajustement d'une fonction de répartition observée sur un échantillon à une fonction de répartitionthéorique. Ce test peut être utilisée pour tester la normalité de n'importe quelle distribution. (normale,poisson, binomiale). Ce test pourra être utilisé si il est possible d'ordonner les valeurs d'une variable,qu'elle soit qualitative ou quantitative. Une première étape consistera à calculer les fréquence relativescumulées (pourcentages) des distributions théoriques et observées.

Soient F0(i) le pourcentage cumulé observé jusqu'à la modalité i de la distribution et Ft(i) lepourcentage cumulé théorique. Pour chaque modalité, il est possible de calculer la différence entre F0(i)et Ft(i). On s'intéresse à la valeur absolue de la différence maximum existant entre ces deux fréquencescumulées telle que :

D = max |F0(i) - Ft(i)|

Dans un second temps, on compare cette valeur à celle de la table du D de Kolmogorov-Smirnov,pour un risque alpha donné. Si on considère un risque alpha de 5% et si l'effectif des observations estsupérieur à 35, D peut être approximé par la formule suivante :

D = 1,36/ n

Si le D calculé est inférieur au D de la table pour un seuil donné, les différences ne sont passignificatives.

Modalités % observé % cumulé % théorique % cumulé |F0(i) - Ft(i)|

m1

m2

m3

45%

11%

44%

45%

56%

100%

49%

10%

41%

49%

59%

100%

4%

3%

0%

Total 100% 100%

Ici D = 0,04, dans la table le seuil à 5% est de 0,089. On peut donc conclure qu'il n'existe pas dedifférence significative entre la distribution observée et la distribution théorique. puisqu’on ne rejette pasl’hypothèse.

2.2.4. Test des signes

Un test sur une variable de bernouilli basé sur le nombre de run (séquence de cas ayant la mêmevaleur).

Page 17: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 17

3. Problème à 2échantillons

3.1. Tests paramètriques

3.1.1. Echantillons indépendants

3.1.1.1. Test de comparaison de moyenne unilatéral

On teste deux produits auprès de deux échantillons (100 pour chacun) de consommateurs. Lesuns notent le produit A, les autres le produits B. On obtient les résultats suivants:

moyenne ecart-type

A : 7,8 3,1

B : 6,5 3,2

Le problème posé est de savoir si la différence d=Ma-Mb est significative? Dans la population lesnotes sont de Ya ey Yb. On pose donc les hypothèses suivantes :

H0: Ya=Yb et H1 : Ya>Yb.

Il s’agit ici d’un test unilatéral. Si H0 est vraie on doit avoir D=0. Soit Na et Nb les tailles deséchantillon A et B. et Sa et Sb les variances dans la population. En supposant que A et B se distribuentde manière normale. D se distribue aussi de manière normale et a pour variance :

S

n

S

na

a

b

b

+ Sa/Na+Sb/Nb. (les deux échantillons étants indépendants).

Page 18: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 18

D suit donc une loi normale de paramètre x=0 et σd=σ σa

a

b

bn n

2 2

+ . On peut donc calculer la

variable centrée réduite U de D : U=d/σd. .Cette statistique se distribue selon la loi normale centréeréduite. On sait par lecture dans une table que la probabilité que U>1,645 est de 5%.

Dans notre exemple d=1,3 et σd=0,446. La statistique du test U=2,918. Il y a donc moins de 5%de chance de rejeter l’hypothèse nulle à tors. On acceptera donc l’hypothèse alternative Ya>Yb.

3.1.1.2. Test de comparaison de moyenne bilatéral

Si nous n’avions pas de forte raison de penser que dans le produit A soit supérieur au produit B.La formulation de l’hypothèse aurait été différente.

H0: Ya=Yb et H1 : Ya>Yb ouYa<Yb

Ici la zone de rejet est donnée par la valeur absolue de U. La différence peut être positive ounégative. La valeur de U correspondant à un risque de 5% (P(d>U)=5%) est de 1,96. notre statistique atoujours la même valeur 2,98. Elle se situe donc dans la zone de rejet.

α=2,5%

d d=1,96d=-1,96d=-3,09 d=3,09

α=2%o

On rejetera donc l’hypothèse nulle et on concluera à la différence entre les deux moyennes.Cependant si le seuil de risque acceptable avait été fixé à 2o/oo, la statistique du test étant de 3,09. notrestatistique ne serait pas entrée dans la zone de rejet. L’hypothèse nulle aurait donc été acceptée.

3.1.1.3. Test de comparaison de proportion.

La même méthode peut être utilisée pour tester deux proportions. Prenons l’exemple suivant. Onmesure la proportion d’individuant ayant l’intention d’acheter un microordinateur multimédia dans deuxrégion Nord et sud. Au nord 80% des 100 individus interrogés veulent en acheter un, au sud 75% de150 individus partagent la même intention.

L’hypothèse nulle est Pnord=Psud. ou Pnord-Psud=0.

La loi de la statistique du test est que d se distribue de manière normale ave une espérance de 0 etune variance de :

Page 19: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 19

σ dN N

n

s s

s

p p

n

p p

n2 1 1

=−

+−( ) ( )

Sous l’hypothèse H0 on eput poser Pnord=Psud=Po

On a donc σ d o on s

p pn n

2 11 1

= − +

( )

On ne connait pas po, il faut donc l’estimer. Ceci peut se faire en pondérant les observations :

pn p n p

p pon n s s

n s

=++

Dans l’exemple po=77% et σ d =0,05432. U=0,77/0,0676=14,17. La valeur critique (seuil de

rejet pour un risque de 5% est de 1,96) on est donc largement audessus et on rejetera sans discussionl’hypothèse nulle.

3.1.2. Echantillons appariés

Dans les exemples précédents la comparaison des deux produits A et B se faisait en employantdes individus différents. Ici on va considérer une situation différente: ce sont les mêmes individus quinotent les deux produits4. Reprenons les mêmes résultats. On a maintenant 100 individus qui donnentdeux notes.

moyenne ecart-type

A : 7,8 3,1

B : 6,5 3,2

d 1,3 2,7

Le problème du calcul de la statistique du test est que les échantillons n’étant plus indépendant(les notes sont probablement corrélées), il n’est plus possible de calculer la variance de d en faisant lasomme des deux variances. Dans ce cas on a :

V(Ya-Yb)=V(Ya)+V(Yb)-2cov(Ya,Yb).

On va donc d’abord calculer les écarts Ya-Yb, puis en calculer la moyenne et la variance. Lastatistique de test z est obtenue en faisant :

4 Les deux procédures ont le même but mais dans le second cas on interroge deux fois moins d’individus, le testsera donc moins coûteux. Dans cette éventualité, on présentera les produits A et B dans un ordre aléatoire afind’éliminer des effets d’apprentissages.

Page 20: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 20

uz

s nz

=/

Dans notre exemple V(Ya-Yb)=V(Ya)+V(Yb)-2cov(Ya,Yb).=2,72=3,12+3,22-2*cov

donc cov=(3,12+3,22-2,72)/2=6,28.

On peut donc en déduire la corrélation entre les deux variables : 0,63. La statistique du test seraici de 4,81. On remarque que cette valeur est plus faible que dans le cas des échantillons non-appariés.Ceci est du essentiellement à la méthode d’estimation de la variance d’échantillonnage. Ici on perd desobservations (n=100) et une partie de la variance .

3.2. Tests non paramètriques

3.2.1. Echantillon indépendants

3.2.1.1. . le test de fischer

ur tableau croisé 2X2; quand les données sont rares (moins de 5 individus par case).

p = (A + B)! (C + D)! (A + C)! (B + D)!

n!A!B!C!D!

3.2.1.2. le test du χ2

Voir notice pédagogique

3.2.1.3. . Mann-Whitney U

Soient deux échantillons A et B d'effectifs na et nb, avec par exemple na = 7 et nb = 8. Lataille des échantillons n'est pas forcément identique. Le test en "t" de Student ne peut pas s'appliquer carl'effectif est trop petit, et on ne connaît pas la Loi de distribution des valeurs des séries A et B, ou l'onsait que leur distribution n'est pas normale.

La première étape va consister à réaliser un interclassement des valeurs des deux groupes, c'est àdire que l'on va mettre les différentes valeurs dans l'ordre, et on va essayer de chiffrer le classement desvaleurs de A par rapport à celles de B.

Exemple : soient les valeurs suivantes :

Page 21: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 21

A B

valeurs

a1

a2

a3

a4

a5

a6

a7

8

10

21

23

50

73

79

b1

b2

b3

b4

b5

b6

b7

b8

22

46

51

76

89

114

118

132

On va classer les valeurs et la deuxième étape consistera à calculer le U de ba, c'est à dire, pourchaque "a" le nombre de "b" qui lui sont inférieur et ensuite on effectuera la somme des Uba. De lamême façon on peut calculer la somme des Uab.

Uba Uab

8 a1 0

10 a2 0

21 a3 0

22 b1 3

23 a4 1

46 b2 4

50 a5 2

51 b3 5

73 a6 3

76 b4 6

79 a7 4

89 b5 7

114 b6 7

118 b7 7

132 b8 7

Page 22: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 22

10 46

Tout revient en fait à comparer tous les couples possibles (ai,bi), qui sont au nombre de na x nbdonc ici 56 (7 x 8) et on collige le nombre de cas ou bi est < à ai. De ce fait Uba + Uab = na x nb.

Dans une troisième étape, on teste la significativité.Si na et nb sont petits (c'est à dire < 10) onprend la table de U. Quand on utilise cette table, il faut prendre le plus petit des Uba/Uab et n1 est leplus petit des échantillons. On sera amené à rejeter H0 si la valeur de U observée est inférieure à lavaleur de la table. Attention car souvent pour les autres tests, on rejette H0 si la valeur observée estsupérieure à la valeur de la table. H0 signifie ici : "les deux répartitions sont identiques" ou "les deuxéchantillons sont issus de la même population". Si on rejette H0, on peut dire que les valeurs de A et deB sont significativement différentes.

Dans notre exemple, la valeur théorique lue dans la table est de 10. La différence est doncsignificative si Uab < 10. Ici c'est tout juste, mais on peut rejeter H0 quand même.

Si na et nb sont supérieurs ou égaux à 10, Uba ou Uab tend vers une Loi normale. Cependant,pour utiliser la Loi normale, il nous faut connaître la moyenne et la variance. Sous H0, E(Uba) =E(Uab) = na x nb/2, on a donc ici la moyenne

et

σ2 112

Ua b a bn n n n= + +( )

le test à effectuer sera alors :

ZU

n n

n n n n

baa b

a b a b

=−

+ +2

112

( )

et Z suit une loi de l'écart réduit, ou une Loi de Student avec un nombre de degrés de libertéinfini. Un test non-paramétrique du fait que deux échantillons indépendants proviennent de la mêmepopulation. C'est un test plus puissant que celui de la médiane car il use les rangs des cas traités.

3.2.1.4. Moses extreme reactions

Moses Test of Extreme Reaction

Nonparametric test for comparing the range of a variable for two groups. The group with thelower identifying value is labeled the 'control' group and the other group is labeled the experimentalgroup. The procedure combines the two groups and ranks values from smallest to largest. The span ofthe control group is the difference between the ranks of its largest and smallest values plus 1. An exact1-tailed probability is computed for the span and then recomputed after dropping a specified number(default = 5%) of control group members from each end of its span. It is a measure of how much

Page 23: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 23

extreme values affect the span of the control group. Recoding to reverse the 'control' and 'experimental'groups is possible.

3.2.1.5. Wald-Wolfowitz runs

Wald-Wolfowitz Runs Test

A nonparametric test of the hypothesis that 2 samples come from the same population. Thevalues of the observations from both samples are combined and ranked from smallest to largest. Runsare sequences of values from the same group. If there are too few runs, it suggests that the 2 samplescome from different distributions.

3.2.1.6. W de Wilcoxon

Dans un premier temps, on interclasse les deux séries, ensuite on fait la somme des rangs d'ungroupe.

La somme des rangs des "a" plus la somme des rangs des "b" est égale à la somme des na + nbpremiers entiers, qui est égale à : n(n+1)/2, avec ici n = na + nb. donc il sort que Wa + Wb = n(n+1)/2soit ici dans notre exemple n = 15 et Wa + Wb = (15 x16 )/2 = 120

X i Wa Wb

8 a1 1

10 a2 2

21 a3 3

22 b1 4

23 a4 5

46 b2 6

50 a5 7

51 b3 8

73 a6 9

76 b4 10

79 a7 11

89 b5 12

114 b6 13

118 b7 14

132 b8 15

38 82

En troisième lieu, on fait le test. Ici comme pour le test en U, W tend vers une Loi normale si naet nb sont grands. Il existe une table du W, mais elle est plus compliquée à lire que celle du U. Si les

Page 24: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 24

deux échantillons sont égaux, la plus petite valeur que peut prendre Wa est la somme des na premiersentiers :

na(na+1)/2

le classement est du type : a a a a a a a a a b b b b b ,

inversement, la plus grande valeur que prendre Wa est le cas ou les "b" sont placés les premiers :b b b b b b b b b a a a a a a a , c'est à dire :

[(na + nb)(na + nb + 1)/2] - nb(nb + 1)/2

si les deux échantillons sont issus de la même population, c'est à dire sous l'hypothèse H0, on peutcalculer l'espérance mathématique de Wa, qui est la moyenne des deux valeurs ci dessus. soit :

E Wan n na a b( )

( )= + + 12

E Wbn n nb a b( )

( )= + + 12

et

σ²( )

Wa b a bn n n n= + + 1

12

c'est donc la même variance que pour le U de Mann et Withney. La somme des n premiers entiersest égale à n(n+1)/2, et la somme des carrés des n premiers entiers est n(n+1)(2n+1)/6. Quand na ounb sont grands, alors :

Wn n n

n n n n

xa a b

a b a b

− + +

+ +

( )

( )

12

112

,

suit une Loi de l'écart réduit ou un t de Student avec un ddl égal à l'infini. On peut passer de U àW par la formule suivante :

Uba Wana na= − +( )1

2

↑ somme des n premiers entiers

Les tests en U et en W sont donc utilisables si on ne connaît que les rangs et non les valeurs dedeux séries. Ils sont utilisables par exemple pour faire classer une gamme de produits par deuxéchantillons de petite taille de consommateurs.

S' ils se trouvent dans le même groupe, l'ordre n'a alors que peu d'importance, on met donc enpremier un élément avant l'autre au hasard. S' ils appartiennent à des groupes différents, on peut avoirrecours à diverses procédures :

Page 25: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 25

- pour le W, on fait un rang moyen, par exemple 3,5 pour deux ex aequo, 3,33 pour trois... Ilexiste des équations assez complexes de correction du test dans le cas des ex aequo.

En fait plus il existe d' ex aequo plus le test perd de sa puissance. Pour certains auteurs, laposition des ex aequo sera tirée au sort.

- pour le test en U, il est possible de ne pas tenir compte des ex aequo. Dans ce cas, il fautenlever les paires d'ex aequo du classement.

3.2.2. Echantillons dépendants

3.2.2.1. Runs

Runs TestA one-sample nonparametric test for randomness in a dichotomous variable. A run isany sequence of cases having the same value. The total number of runs in a sample is a measure ofrandomness in the order of the cases in the sample. Too many or too few runs can suggest a non-random (dependent) ordering. The runs test is only appropriate when the order of cases is meaningful.

3.2.2.2. McNemar

Le test de McNemar pour deux variables binomiales appariées test l’éventualité que les paires deréponses discordantes (1,0) et (0,1) sont également vraisemblable. Ce test est particulièrement utile dansdes plans avant-après pour detecter les passages d’une catégories à l’autre.

On dispose les données :

après

avant

0 1

0 A B

1 C D

χ 221

=− −

+C A D

A D

( )

3.2.2.3. T de Wilcoxon

C'est un test pour série appariées. Si ce sont les mêmes individus qui sont à l'origine des deuxmesures, on dit que l'échantillon est auto-apparié, si les individus sont différents mais choisis de façon àce qu'ils se ressemblent au maximum sur un certain nombre de critères censés avoir un lien avec lamesure, on parle alors d'échantillon apparié.

Page 26: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 26

La première étape consiste à faire la différence des valeurs de chaque paire. Ensuite on ordonneles différences par valeur absolue croissante. Les différences auront un signe positif ou négatif, lesdifférences nulles seront éliminées

Signe D A B D Rang

-

-

-

+

+

-

+

-

-

+

-

a1

.

.

.

.

.

.

.

.

.

an

b1

.

.

.

.

.

.

.

.

.

bn

d1

.

.

.

.

.

.

.

.

.

dn

ri

.

.

.

.

.

.

.

.

.

rn

Il faut maintenant regarder si la somme des rangs des différences positives diffère ou non de lasomme des rangs des différences négatives. La somme de tous les rangs est égale à la somme des npremiers entiers :

Σ Σ( ) ( )( )+ + − = +n n 1

2

avec n = nombre de paires non nulles

Autrement dit, sous l'hypothèse nulle, les deux séries de valeurs ne sont pas différentes de façonsignificative, on aura donc autant de rangs positifs que négatifs:

H0 : Σ Σ( ) ( )

( )( )+ = − =

+= +

n nn n

122

14

, c'est en fait la moyenne

Si au contraire, les séries diffèrent, les sommes des rangs positifs et négatifs seront différentes. Letest en T consiste à comparer les rangs positifs ou négatifs à la valeur théorique ci-dessus, sous H0.

Page 27: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 27

Soit P la somme des rangs positifs et M la somme des rangs négatifs, on prend la plus petite desdeux valeurs, donc T = min(P,M), et on lit la valeur théorique de T dans la table, en fonction du nombre"n" de paires non nulles. La différence n'est jamais significative, si "n" est inférieur à 6. Si T observé >T théorique, il n'existe pas de différence significative entre les deux séries.

Exemple :

soit un échantillon de 7 consommateurs qui notent 2 produits :

Signe Conso Prod A Prod B d val abso rang

+

+

-

-

+

+

-

1

2

3

4

5

6

7

9

7

4

7,5

8,5

7,5

5

6

5

8

9

5

5

6

3

2

4

1,5

3,5

2,5

1

5

3

7

2

6

4

1

moy = 6,92 6,28

P = 5 + 3 + 6 + 4 = 18, M = 7 + 2 + 1 = 10

Donc ici, T = 10, on lit dans la table, pour "n" = 7, T théorique = 2. Il n'existe donc pas dedifférence significative entre les deux séries. T tend vers une Loi normale si le nombre de paires estsuffisamment grand, c'est à dire > 20. Dans ce cas, il faut connaître la variance de T, et toujours, sousH0, elle est égale à

σ σ σ² ² ² ( )( )T n n n= = = + ++ −

124

1 2 1 = 1/4 de la somme des n premiers carrés

et

ZT

n n

n n n

Loi Ecart r duit=− +

+ +≈

( )

( )( )

14

124

1 2 1

é

Page 28: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 28

avec T = minimum des sommes des rangs positifs ou négatifs

Page 29: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 29

4. Problèmes à plus de 3échantillons

4.1. Tests paramètriques

4.1.1. Analyse de variance

L’analyse de variance à un facteur teste l’hypothèse que les moyenne des groupes sont touteségales:

H0 : µ1=µ2=...=µk

en pratique on utilisera des contrastes c’est à dire des valeurs ci telles que cii

k

=∑ =

1

0

L’hypothèse nulle est donc cii

k

i=∑ =

1

et l’hypothèse alternative cii

k

i=∑ ≠

1

La statistique du test est le F de Fisher-Snedecor. Celui-ci est le rapport de la somme des carrésdes écarts interclasses sur la somme du carré moyen intraclasse. Ce rapport vise en fait à comparer lesécarts des moyennes des groupes, par rapport aux écarts des individus par rapport à leur groupe. Siceux-ci diffèrent plus des moyennes de leur groupe, que ces dernières entre elle, on considérera leurdifférences insuffisantes.

Pour calculer ce rapport on dispose les données de la manière suivante :

Page 30: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 30

Source devariation

SCE (somme descarrés des écarts)

DDL Carré moyen F

Intern y yi i

i

( )∑ − 2k-1 SCE/k-1 CM Inter/CM Intra

Intra

j Oj

ii

i

y y∈∑∑ −( )2

n-k SCE/n-k

La lecture des tables compte tenu des k-1 et n-k paramètres permet de déterminer la valeur seuilet par conséquent la zone de rejet.

4.1.2. Comparaison par paires.

L’analyse de variance permet de déceler au moins une différence significative, mais ne rend pascompte des écarts deux-à deux.

4.2. Tests non paramètriques

4.2.1. Tests pour des échantillonsindependants.

4.2.1.1. Kruskal-Wallis

Le test de kruskall-Wallis est l'exact pendant du test d'analyse de variance à 1 facteur. La seuledifférence est que le test d'exerce sur une moyenne de rang. Il sert à tester l’hypothèse que les kéchantillons viennent de population dont la tendance centrale est égale.

Le test est vivement recommandé dans tous les cas où l'on ignore la lois de distribution d'unevariable, que l'on possède un petit échantillon et que l'on veut comprare plusieurs groupes d'individusdans l'échantillon.

Dans l'ANOVA simple, on avait un seul facteur à k modalités, mais il existe plusieurs conditionsd'emploi de cette procédure : normalité des variables, variance égale...si ces conditions ne sont pas

Page 31: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 31

respectées, on peut alors utiliser le test de Kruskal et Wallis, qui va permettre l'étude des liaisons entreun caractère quantitatif et un caractère qualitatif à k classes. C'est donc un équivalent non paramétriquede l'ANOVA. On aura donc un tableau du type :

Les xij sont donc initialement des données quantitatives. On va alors substituer, à chaque valeur,son rang par rapport à l'ensemble des valeurs. Chaque xij est alors remplacé par le rij correspondant.On obtient le tableau ci- dessous :

1 2 ........j............k 1 2 ........j............k

x11 x1j x1k

.

;

xi1 xij xik

;

;

x1n xnj xnk

r11 r1j r1k

;

;

ri1 rij rik

;

;

r1n rnj rnk

Pour chaque colonne de 1 à k, d'effectif nj, on peut calculer le rang moyen Wmj.Le rang moyengénéral sera Wm, N sera la somme des nj, c'est à dire le total général des effectifs et Wm = (N+1)/2

sous H0 :

HN

n Wm Wm

Nj j=

−+

11

12

Σ ( )

Le H de Kruskal et Wallis suit une Loi du CHI² à k-1 ddl. On peut simplifier les calculs enappliquant la formule suivante :soit Wj = somme des rangs de la colonne j, N = effectif total, nj =effectif colonne j

HN N

W

nNj

j

=+

− +∑121

3 1( )

²( )

4.2.1.2. . Test de la Mediane

On ordonne dans un premier temps les données, puis on construit un tableau de contingence. Oncalcule la médiane de l'interclassement : (n+1)/2 = (15 + 1)/2 = 8

Page 32: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 32

8 a1

10 a2

21 a3

22 b1

23 a4

46 b2

50 a5

51 b3

73 a6

76 b4

79 a7

89 b5

114 b6

118 b7

132 b8

On compte ensuite le nombre de valeurs de a > à M et < M , on fait la même chose pour b. Onpeut alors construire le tableau suivant :

< M > M

Effectifs A 5 2

Effectifs B 3 5

NB : le nombre d'échantillons n'est pas limité à deux.

Sur ce tableau, on peut faire un CHI² à 1 ddl (Attention toutefois à avoir plus de 5 individus parcase pour les valeurs calculées, sinon appliquer la correction de Yates)

Page 33: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 33

4.2.2. Test pour plus de 3 échantillonsdépendants

4.2.2.1. Analyse de variance de Friedman

Le test d’analyse de variance de Friedman teste l’hypothèse nulle que k variables appariéesproviennent de la même population. Chaque individu est classé sur chacune des variables k (rand de 1 àk). Le test s’appuie sur ces rangs. La statistique du test suit une loi du chi2 à c-1 degré de liberté

χ 2 212

13 1=

+− +∑

lc cR l cj

j( )( )

avec l le nombre de lignes, c le nombre de colonne, Rj la somme des rangs par colonne.

4.2.2.2. Cochran's Q

Le test Q de Cochran est une extension du test de McNemar à une situation à k échantillon. Ilteste l’hypothèse nulle que plusieurs variables binomiales, ont la même moyenne (test de proportionségales). Les variables sont mesurées sur des échantillons appariés.

La statistique du test, Q, est donnée par :

Q c

c g g

c l c l

j

j j

c

j

c

c c= −

∑ ∑

∑ ∑( )1

2

1 1

2

1

2

1

avec c le nombre d’échantillons, gj et li le total des observations.

Cette statistique se distribue selon une loi du chi2 à c-1 DDL.

4.2.2.3. Kendall's W

Page 34: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 34

5. Problèmes d'association

5.1. Corrélation de Pearson

5.1.1. Test de Bonfferroni

5.1.2. Comparaison de corrélations. pourdeux sous-échantillons

L'hypothèse nulle est celle de l'égalité des deux corrélations r1 et r1

On utilise la transformation Z de Fischer :

Z = 12 ln(

1+r1-r )

la statistique du test est donnée par :

Z1- Z2

s(Z1- Z2)

avec

σ(Z1-Z2) = (1

N1- 3+

1

N2 - 3)

Page 35: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 35

5.2. Corrélation de rang de Spearman

A chaque observation X1, ...,Xn, on associe son rang i dans l'échantillon observé et son rang Ridans l'échantillon ordonné. Sous l'hypothèse H0 d'indépendance des Xi, aucune corrélation n'estobservée.

Elle se calcule de la manière suivante5: On compte le nombre d'interversion par rapport à l'odred'observation, c'est à sire si i<j alors que Xi>Xj:

Q = i=1

n-1

∑ 1 * +(Xi - Xj)j=i+1

n

·

La corrélation des rangs de Kendall, appelée aussi tau de Kendall est égale à :

τ = 1-4Q

n(n -1)

5.3. Corrélation de rang de Spearman

A Chaque observation X1, ...,Xn, on associe son rang i dans l'échantillon observé et son rang Ridans l'échantillon ordonné. Sous l'hypothèse H0 d'indépendance des Xi, aucune corrélation n'estobservée. Elle se calcule de la manière suivante6:

rs =

(Ri - R*) (i - i*)

(Ri - R*)2 (i - i*)2

i=1

n

i=1

n

i=1

n

∑ ∑

rs peut s'exprimer plus simplement :

=1-6

n(n -1)2(Ri - i)2

i=1

n

5Lecoutre J-P ET Tassi P. (1987), Statistiques non paramétriques et Robustesse, Economica, Paris p150-155.

6Lecoutre J-P ET Tassi P. (1987), Statistiques non paramétriques et Robustesse, Economica, Paris

Page 36: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 36

Le signe indique le sens relatif des rangs.

Sour H0 on démontre7 que

Corr(rs, τ) =2(n+1)

2n(2n+5)

Approximativement les valeurs de ces deux coefficients sont dans le rapport 2/3 ou 3/2.

7 Kendall, M.G. (1962), Rank Correlation methods, Griffin, Londres.

Page 37: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 37

6. Les voies alternatives

La théorie des test doit beacoup à Fisher. Mais on ne doit pas croire pour autant que c'est la seuleperspective pour les tests statistiques. On en examine 3 qui respectivement s'appuient sur des stratégiede sous-échantillonnage, sur le raisonnement probabiliste et enfin sur une mesure de la confianceaccordée.

6.1. Les tests robustes

6.2. L'inférence bayesienne

Soit l’exemple suivant. On tire un échantillon de 10 personnes. Ces personnes appartiennent àtrois groupes : les consommateurs de A, ceux de B et ceux de C. Les proportions de fidèles sontresectivement de 30%, 50%, et 70%. Parmis les 10 personnes tirées, 8 d’entres-elles sont fidèles. Uneestimation a priori de la repartition dans la population de ceux qui préfèrent A, B et C est de 20%, 33%,et 47%. De quelle population proviennent les personnes interrogées?

Si elle viennent de A alors la probabilité d’avoir 8 fidèles sur 10 est de :

( )p D A( / ) . ( , ) ,= − =810 8 20 3 1 0 3 0 00145

Si elle viennent de B alors

( )p D B( / ) . ( , ) ,= − =810 8 20 5 1 0 5 0 04394

et de C

( )p D A( / ) . ( , ) ,23347= − =810 8 20 7 1 0 7 0

Page 38: Tests statistiques · L A NATURE LOGIQUE D 'UN TEST.....3 1.2. U NE PROCEDURE DE PRISE DE DECISION ... fait. On cherchera donc à en démontrer la fausseté : Po-Pm=0. Cette dernière

http://christophe.benavent.free.fr 38

On en déduit donc que la probabilité que les probabilités que les individus viennent de A B et Csont de 0?2%, 11,5% et 88,3%.

Cette technique peut être généraliser pour inférer certaine valeur

cas d’une proportion.

On note π la vraie valeur dans la population. Celle d’individus fidèles. On supposera que cettedistribution suit une loi beta. Celles-ci nous permet donc de spécifier la distribution de probabilité apriori. On pense ici que cette proportion est de l’ordre de 0,3 avec un ecart-type de 0,1. Ceci nouspermet de calculer les paramètres de la loi8 : 6 et 14.

Imaginons que l’on fasse une enquête sur 1830 personnes. Parmis celles-ci 420 sont fidele. Quelleest la probabilité d’avoir cette distribution sachant que la vraie proportion est π? Cette probabilitérépond à la loi binomiale de manière évidente :

p D C( / ) ( )π π π= −4201830 420 14101

donc

p Dp D

p D

CB

p D

( / )( / )

( / )

( )( , )

( )

( / )

ππ π

π π

π π π π

π π= =

− −

∫ ∫0

1

4201830 420 1410 5 13

0

1

11

6 141

Pour calculer cette expression simplement remarquons que l’integrale doit être une constante etque le numerateur peut être simplifié on doit donc obtenir à la constante K près:

p D K( / ) ( )π π π= −426 14241

Pour obtenir K remarquons que l’on peut l’obtenir simplement en appliquant

1/(B(426;1424)=(426-1424-1)!/(426-1)!(1424-1)!

En fait le calcul est inutile. La moyenne a posteriori est obtenu simplement en faisant426/426+1424=23,03% et la variance 0.230(1-0.230)/(426+1424+1)=0.0000958 ou un ecartype de0,98%.

En approximant la loi beta par une distribution normale on obtient donc un intervalle de confianceà 95% de 0,23 +/- 1,9%.

De manière synthètique on obtient =

p= m+a/(n+a+b)

8 Voir chapitre probabilité