Tests NON paramétriques

Preview:

DESCRIPTION

Tests NON paramétriques. UE 45.2CHV. Pierre MORETTO, Université Paul Sabatier, Toulouse III. Tests non paramétriques. Les étapes. Conditions d’utilisation Test sur les fréquences (Khi²) Comparaisons d’échantillon: Données Non appariées (Mann & Withney) Données appariées - PowerPoint PPT Presentation

Citation preview

TESTS NON PARAMÉTRIQUES

Pierre MORETTO, Université Paul Sabatier, Toulouse

III.

UE 45.2 CHV

Tests non paramétriquesLe

s éta

pes

Conditions d’utilisation Test sur les fréquences (Khi²) Comparaisons d’échantillon:

Données Non appariées (Mann & Withney)

Données appariées (Wilcoxon)

Condition d’utilisation

Les données sont dîtes non paramétriques lorsque: Les valeurs sont nominales, ordinales,

d’intervalle ou de rapport (Cf CH I) Le nombre de sujets est insuffisant pour

vérifier la normalité de la distribution La distribution n’est pas normale (Gaussienne)

Dans ces cas, les tests non paramétriques sont de rigueur

Condition d’utilisation et utilités

Khi² non paramétrique: compare 2 ou plus séries de données nominales arrangées en catégories pondérées par leurs fréquences d’apparition.

Le U de Mann et Withney détermine la signification de la différence entre 2 variables ordinales non appariées

Le test « W » de Wilcoxon : idem à U mais pour variables appariées

Compare 2 ou plus séries de données nominales arrangées en catégories pondérées par leurs fréquences d’apparition.

Cas 1: Comparer distribution de contingences d’1 variable nominale (types de chaussure)

Le Khi² (²) non paramétrique

Le Khi² (²) non paramétriqueExemple:

Les chaussures de marque « X » sont classées de A à E suivant leur niveau de technicité et leur coût de production.

Pour optimiser le gain, X sait qu’il doit vendre 10% de A, 30% de B, 35 de C, 20% de D et 5% de F

Sur 141 chaussures, un magasin M vend finalement A(30), B(57), C(32), D(15) et E(7).

Le magasin optimise-t-il son engagement vis-à-vis de la marque X ?

Le Khi² (²) non paramétrique Ce premier exemple illustre l’application du

test à une série de fréquences observées dans des groupes (variable nominale).

Il s’agit ici de comparer les volumes de vente attendus à ceux observés d’où ce premier tableau:

  A B C D EVentes 30 57 32 15 7Fréquence de vente (N=141) 0,21 0,40 0,23 0,11 0,05Fréquence attendues 0,1 0,3 0,35 0,2 0,05

² non paramétrique

L’indice ² est calculé sur la base de la différence entre Obs et Théo:

Appliqué à nos valeurs:

Théo

ThéoObs )²(²

  A B C D E

Ventes 30 57 32 15 7

Fréquence attendues 0,1 0,3 0,35 0,2 0,05

Ventes attendues 14 42 49 28 7

(O-T)²/T 18 5 6 6 0

Khi² 35,32

² non paramétrique

Détermination du Khi² théorique Lecture au risque et ddl=catégories-1

Nb: ici 5 catégories de A à E

² non paramétrique

Décision finale: ² calculé est de 35 ² théorique est de 13.28

² calculé >² théorique au risque considéré donc la différence est significative au risque .

La magasin sera enjoint de revoir la promotion des chaussures pour corriger ses ventes.

Compare 2 ou plus séries de données nominales arrangées en catégories pondérées par leurs fréquences d’apparition.

Cas 2: Comparer distribution de contingences sur 2 variables nominales (type d’entraînement et niveaux d’habilété)

² non paramétrique

Le Khi² (²) non paramétrique Exemple: 2 groupes de nageurs apprennent le

Crawl grâce à des méthodes différentes (A et B).

A la fin d’entraînements menés sur 5 semaines, l’observateur classe les sujets en « Bons », « Moyens » et « Mauvais »

Niveaux d'habileté

Méthode Bons Moyens Mauvais

A 15 27 13

B 21 19 12

² non paramétrique

Comment comparer ces 2 méthodes d’apprentissage du crawl ? 1) Considérer le classement niveau

d’habileté toutes méthodes confondues 2) En déduire une fréquence d’apparition

théoriqueNiveaux d'habileté

Méthode Bons Moyens Mauvais Total

A 15 27 13 55

B 21 19 12 52

Total 36 46 25

36/107 « bons »

Soit 34%

² non paramétrique

Répété pour chaque niveaux d’habileté Déduire un nombre de sujets théorique indépendant

de l’entraînement pour chaque groupe: Ex: Théoriquement « Bons » en méthode A:

0.34*55=18.5

Niveaux d'habileté

Méthode Bons Moyens Mauvais Total

A 15 27 13 55

B 21 19 12 52

Total 36 46 25 107

% Attendus 0,34 0,43 0,23

Effectifs Attendus

Méthode Bons Moyens Mauvais Total

A 18,50 23,64 12,85 55

B 17,50 22,36 12,15 52

Total 36 46 25

² non paramétrique

Déterminer un effectif théorique pour chaque groupe

² non paramétrique

Nous avons donc un effectif observé et un théorique

Le test du ² va permettre de comparer ces 2 effectifs

Observés Niveaux d'habiletéMéthode Bons Moyens Mauvais

A 15 27 13B 21 19 12

ThéoriqueMéthode Bons Moyens Mauvais

A 18,50 23,64 12,85B 17,50 22,36 12,15

² non paramétrique

L’indice est calculé sur la base de la différence entre Obs et Théo:

Appliqué à nos valeurs:

Théo

ThéoObs )²(²

Observées Théoriques (O-T)² (O-T)²/T

Bons 15 18,50 12,28 0,664

21 17,50 12,28 0,702

Moyens 27 23,64 11,26 0,476

19 22,36 11,26 0,504

Mauvais 13 12,85 0,02 0,002

12 12,15 0,02 0,002

 

Khi² 2,35

² non paramétrique

Détermination du Khi² théorique Lecture au risque et ddl=(ligne-1)*(colonne-1)

Nb: ligne et colonne du tableau

² non paramétrique

Décision finale: ² calculé est de 2.35 ² théorique est de 4.61

² calculé <² théorique au risque considéré donc la différence n’est pas significative au risque .

La méthode d’apprentissage n’a pas d’effet sur la maîtrise finale de l’habileté et les méthodes A et B se valent.

Tests non paramétriquesLe

s éta

pes

Conditions d’utilisation Test sur les fréquences (Khi²) Comparaisons d’échantillon:

Données Non appariées (Mann & Withney)

Données appariées (Wilcoxon)

Compare 2 séries de variables ordinales ou réelles non appariées et non gaussiennes.

Test « U » de Mann et Withney

Mann et Withney

Soit 2 échantillons x et y de nx et ny variables ordinales,

Le test de Mann & Withney va comparer les rangs des 2 séries de variables

x 11 21 25 52 71 79 Nx= 6

y 22 43 72 91 116   Ny= 5

Mann et Withney

Détermination des rangs

Arrangement par ordre croissant des x et y11 21 22 25 43 52 71 72 79 91 116

x/y x x y x y x x y x y y

Rangs 1 2 3 4 5 6 7 8 9 10 11

Arrangement par ordre croissant des x et y11 21 22 25 43 52 71 72 79 91 116

x/y x x y x y x x y x y yRangs 1 2 3 4 5 6 7 8 9 10 11

Nombre de y<x

0 0 1 2 2 3 8 Ux/y

Nombre de x<y

2 3 5 6 6 22 Uy/x

Vérifications: Ux/y+Uy/x=Nx*Ny 30

Mann et Withney

Classement et calcul de l’indice « U »

Mann & Withney

Hypothèse Ho correspondant à une alternance des valeurs x et y implique que Uo=Nx.Ny/2Dans la table des U, n1 est le plus petit des effectifs

(Nx et Ny) 5 n1

et n2-n1 est la différence des effectifs: 1 n2-n1

Détermination du « u » Théorique À la colonne n1 et ligne n2-n1

Mann & Withney

Hypothèse Ho correspondant à une alternance des valeurs x et y implique que Uo=Nx.Ny/2

Le plus petit des 2 « U » est comparé à la valeur théorique au risque

Dans la table des U, n1 est le plus petit des effectifs (Nx et Ny) 5 n1

et n2-n1 est la différence des effectifs: 1 n2-n1

donc 3 Uthéorique, 0,05

1 Uthéorique, 0,01

Mann & Withney

Règle de décision:Si, au risque alpha, U (plus petit des Ux/y

et Uy/x) < Uthéorique alors les populations diffèrent significativement.

Donc ici:8>3 (ou 1) et la différence n’est pas

significative au risque de 5% (1%)

Compare 2 séries appariées de variables ordinales ou réelles non gaussiennes.

Test « W » de Wilcoxon

Arrangement par ordre croissant des x et y11 21 22 25 43 52 71 72 79 91 116

x/y x x y x y x x y x y yRangs 1 2 3 4 5 6 7 8 9 10 11

Rang de y<x

1 2 4 6 7 9 29 Wx/y

Rang de x<y

3  5 8 10 11 37 Wy/x

Wilcoxon

Le début du test est identique à Mann & Withney

Classement et calcul de l’indice « W »

Wilcoxon vers Mann & Withney Hypothèse Wo correspondant à une alternance

des valeurs x et y implique que Wo=nx.(N+1)/2

A ce niveau, il existe une équivalence entre « W » de Wilcoxon et « U » de Mann et Withney.

Retour sur la règle de décision du « U »

)1.(2

1 xxx nnWU

Règle de décision:Si, au risque alpha, U (plus petit des Ux/y

et Uy/x) < Uthéorique alors les populations diffèrent significativement.

Donc ici:8>3 (ou 1) et la différence n’est pas

significative au risque de 5% (1%)

Wilcoxon vers Mann & Withney

Les cours sont en ligne sur le site du STAPSL3_UE45.2.

Merci de votre attention

Recommended