26
Statistiques Statistiques Séance 10 Séance 10 N. Yamaguchi N. Yamaguchi

Statistiques Séance 10 N. Yamaguchi. Résumé de la séance précédente Les ANOVA –À 1 facteur à n niveaux –À 1 facteur à mesures répétées –À 2 facteurs

Embed Size (px)

Citation preview

Page 1: Statistiques Séance 10 N. Yamaguchi. Résumé de la séance précédente  Les ANOVA –À 1 facteur à n niveaux –À 1 facteur à mesures répétées –À 2 facteurs

StatistiquesStatistiques

Séance 10Séance 10

N. YamaguchiN. Yamaguchi

Page 2: Statistiques Séance 10 N. Yamaguchi. Résumé de la séance précédente  Les ANOVA –À 1 facteur à n niveaux –À 1 facteur à mesures répétées –À 2 facteurs

Résumé de la séance Résumé de la séance précédenteprécédente

Les ANOVALes ANOVA– À 1 facteur à n niveauxÀ 1 facteur à n niveaux– À 1 facteur à mesures répétéesÀ 1 facteur à mesures répétées– À 2 facteurs (+ notion d’interaction)À 2 facteurs (+ notion d’interaction)

Les corrélationsLes corrélations– Test paramétrique: PearsonTest paramétrique: Pearson– Test non paramétrique: SpearmanTest non paramétrique: Spearman

Page 3: Statistiques Séance 10 N. Yamaguchi. Résumé de la séance précédente  Les ANOVA –À 1 facteur à n niveaux –À 1 facteur à mesures répétées –À 2 facteurs

Rappel : corrélation de Rappel : corrélation de SpearmanSpearman

Prend en compte les Prend en compte les rangsrangs Exercice sur SpearmanExercice sur Spearman

Page 4: Statistiques Séance 10 N. Yamaguchi. Résumé de la séance précédente  Les ANOVA –À 1 facteur à n niveaux –À 1 facteur à mesures répétées –À 2 facteurs

ExerciceExercice

Sujet Note de maths Note de français

1 15 18

2 5 10

3 15 10

4 5 11

5 12 16

6 8 12

7 10 14

Page 5: Statistiques Séance 10 N. Yamaguchi. Résumé de la séance précédente  Les ANOVA –À 1 facteur à n niveaux –À 1 facteur à mesures répétées –À 2 facteurs

Le Khi (Chi) 2Le Khi (Chi) 2

Ou Ou χχ22

Page 6: Statistiques Séance 10 N. Yamaguchi. Résumé de la séance précédente  Les ANOVA –À 1 facteur à n niveaux –À 1 facteur à mesures répétées –À 2 facteurs

Pourquoi faire?Pourquoi faire?

Comparer des Comparer des distributionsdistributions ou des ou des formes de distributionsformes de distributions

Etude des Etude des fréquencesfréquences ou des ou des effectifseffectifs impliquant des variables impliquant des variables nominalesnominales. Pas de variables . Pas de variables continues!continues!

Exemple du début : la BU.Exemple du début : la BU.

Page 7: Statistiques Séance 10 N. Yamaguchi. Résumé de la séance précédente  Les ANOVA –À 1 facteur à n niveaux –À 1 facteur à mesures répétées –À 2 facteurs

Comparaison d’une distr observée Comparaison d’une distr observée et d’une distr théoriqueet d’une distr théorique

Une seule variable nominaleUne seule variable nominale On analyse une seule distribution.On analyse une seule distribution. Question : est-elle homogène (= Question : est-elle homogène (=

semblable à la distribution théorique)semblable à la distribution théorique) H0: oui. Répartition homogène des H0: oui. Répartition homogène des

effectifs.effectifs.

Page 8: Statistiques Séance 10 N. Yamaguchi. Résumé de la séance précédente  Les ANOVA –À 1 facteur à n niveaux –À 1 facteur à mesures répétées –À 2 facteurs

Exemple (1) cf I. LehisteExemple (1) cf I. Lehiste

Perception du contexte d’une phrase par Perception du contexte d’une phrase par 30 auditeurs.30 auditeurs.

Tableau pour la phrase lue isolémentTableau pour la phrase lue isolément Comparaison avec la distrib théorique: Comparaison avec la distrib théorique:

répartition homogène des effectifs.répartition homogène des effectifs. Note: variable nominale à 4 modalités (les Note: variable nominale à 4 modalités (les

rentrer comme une variable continue ds rentrer comme une variable continue ds Statview)Statview)

H0?H0?

Page 9: Statistiques Séance 10 N. Yamaguchi. Résumé de la séance précédente  Les ANOVA –À 1 facteur à n niveaux –À 1 facteur à mesures répétées –À 2 facteurs

ProcédureProcédure

Données: comme une variable Données: comme une variable continuecontinue– Pas d’étiquettes!Pas d’étiquettes!– Pas besoin de rentrer la distribution Pas besoin de rentrer la distribution

théoriquethéorique Analyse:Analyse:

– Analyse univariée > Khi 2 (désselectionner Analyse univariée > Khi 2 (désselectionner test-t) > rentrer la distrib théorique!!!test-t) > rentrer la distrib théorique!!!

– Menu Analyse > test-t > Editer analyse > Menu Analyse > test-t > Editer analyse > Khi 2Khi 2

Page 10: Statistiques Séance 10 N. Yamaguchi. Résumé de la séance précédente  Les ANOVA –À 1 facteur à n niveaux –À 1 facteur à mesures répétées –À 2 facteurs

RésultatsRésultats

Valeur du Khi 2 à comparer avec p.Valeur du Khi 2 à comparer avec p. Hypothèse nulle non rejetéeHypothèse nulle non rejetée Conclusion?Conclusion? Mais…Mais…

Page 11: Statistiques Séance 10 N. Yamaguchi. Résumé de la séance précédente  Les ANOVA –À 1 facteur à n niveaux –À 1 facteur à mesures répétées –À 2 facteurs

Exemple (2ème partie)Exemple (2ème partie)

Même phrase lue à l’initiale. Même phrase lue à l’initiale. Distribution aléatoire?Distribution aléatoire?

Données: on rajoute une colonneDonnées: on rajoute une colonne Procédure : même chose. On peut Procédure : même chose. On peut

assigner une autre variable!assigner une autre variable! RésultatsRésultats ConclusionConclusion

Page 12: Statistiques Séance 10 N. Yamaguchi. Résumé de la séance précédente  Les ANOVA –À 1 facteur à n niveaux –À 1 facteur à mesures répétées –À 2 facteurs

Un autre cas du Chi 2Un autre cas du Chi 2

Comparaison de 2 distributions Comparaison de 2 distributions indépendantesindépendantes

Voir si les 2 distributions sont Voir si les 2 distributions sont homogènes. (répartition de homogènes. (répartition de fréquences)fréquences)

Hypothèse nulle: il n’y a pas de Hypothèse nulle: il n’y a pas de relation entre les fréquences des relation entre les fréquences des lignes et les fréquences des colonneslignes et les fréquences des colonnes

Page 13: Statistiques Séance 10 N. Yamaguchi. Résumé de la séance précédente  Les ANOVA –À 1 facteur à n niveaux –À 1 facteur à mesures répétées –À 2 facteurs

ExempleExemple

Étude sur l’efficacité d’une méthode Étude sur l’efficacité d’une méthode d’enseignement des langues: labo vs d’enseignement des langues: labo vs méthode traditionnelleméthode traditionnelle

Tableau de contingence

Page 14: Statistiques Séance 10 N. Yamaguchi. Résumé de la séance précédente  Les ANOVA –À 1 facteur à n niveaux –À 1 facteur à mesures répétées –À 2 facteurs

Calcul du Chi 2Calcul du Chi 2

Tableau de contingence: la Tableau de contingence: la colonnecolonne ds laquelle un sujet se trouve (= ds laquelle un sujet se trouve (= réussite vs échec) est contingente (= réussite vs échec) est contingente (= dépend de) la dépend de) la ligneligne ds laquelle le ds laquelle le sujet se trouve (= exp vs méthode sujet se trouve (= exp vs méthode trad)trad)

H0: il n’y a pas de relation entre ligne H0: il n’y a pas de relation entre ligne et colonneet colonne

Page 15: Statistiques Séance 10 N. Yamaguchi. Résumé de la séance précédente  Les ANOVA –À 1 facteur à n niveaux –À 1 facteur à mesures répétées –À 2 facteurs

Calcul du Chi 2 (suite)Calcul du Chi 2 (suite)

Calcul de la fréquence attendue si H0 Calcul de la fréquence attendue si H0 est vraie, pour chaque cellule du est vraie, pour chaque cellule du tableau:tableau:

Page 16: Statistiques Séance 10 N. Yamaguchi. Résumé de la séance précédente  Les ANOVA –À 1 facteur à n niveaux –À 1 facteur à mesures répétées –À 2 facteurs

Calcul du Chi 2 (suite)Calcul du Chi 2 (suite)

Résultat global par rapport à toutes Résultat global par rapport à toutes les cellules.les cellules.

Procédure:Procédure:– DonnéesDonnées– Tableau de contigence > tableau Tableau de contigence > tableau

résumé et Chi 2 des cellulesrésumé et Chi 2 des cellules

Page 17: Statistiques Séance 10 N. Yamaguchi. Résumé de la séance précédente  Les ANOVA –À 1 facteur à n niveaux –À 1 facteur à mesures répétées –À 2 facteurs

RésultatsRésultats

Tableau résuméTableau résumé– DDL : (C-1)(R-1)DDL : (C-1)(R-1)– Valeur Chi 2 et pValeur Chi 2 et p– Résultats? H0?Résultats? H0?

Chi 2 des cellulesChi 2 des cellules– Décomposition du Chi 2 global selon les Décomposition du Chi 2 global selon les

cellules (contribution des cellules)cellules (contribution des cellules)

Page 18: Statistiques Séance 10 N. Yamaguchi. Résumé de la séance précédente  Les ANOVA –À 1 facteur à n niveaux –À 1 facteur à mesures répétées –À 2 facteurs

ExerciceExercice

Étude de Butler sur la poésie de Sylvia Étude de Butler sur la poésie de Sylvia Plath: distribution des longueurs de mots Plath: distribution des longueurs de mots dans 2 de ses recueilsdans 2 de ses recueils

Lgr motsLgr mots 1 – 31 – 3 4 – 64 – 6 7 – 97 – 9 10 -10 -1212

>12>12

« The « The Colossus Colossus »»

34733473 37433743 12721272 285285 5454

« Winter « Winter trees »trees »

30003000 26742674 753753 165165 1818

Page 19: Statistiques Séance 10 N. Yamaguchi. Résumé de la séance précédente  Les ANOVA –À 1 facteur à n niveaux –À 1 facteur à mesures répétées –À 2 facteurs

ExerciceExercice

Quelle est H0?Quelle est H0? Quels sont les résultats?Quels sont les résultats?

Page 20: Statistiques Séance 10 N. Yamaguchi. Résumé de la séance précédente  Les ANOVA –À 1 facteur à n niveaux –À 1 facteur à mesures répétées –À 2 facteurs

Rappel! Quel test utiliser?Rappel! Quel test utiliser?

Il faut connaître:Il faut connaître:– Le type de distribution: test Le type de distribution: test

paramétrique ou non paramétrique?paramétrique ou non paramétrique?– Le nombre de variables et le nombre de Le nombre de variables et le nombre de

leurs modalitésleurs modalités– Le type de données: fréquences, Le type de données: fréquences,

mesures?mesures?– Ce qu’on veut étudier!Ce qu’on veut étudier!

Page 21: Statistiques Séance 10 N. Yamaguchi. Résumé de la séance précédente  Les ANOVA –À 1 facteur à n niveaux –À 1 facteur à mesures répétées –À 2 facteurs

1. Tester les différences entre 1. Tester les différences entre groupesgroupes

Groupes indépendants : ce ne sont pas Groupes indépendants : ce ne sont pas les mêmes sujets!les mêmes sujets!

ParamétriqueParamétrique– 1 variable nominale à 2 modalités; 1 variable nominale à 2 modalités;

mesures : test-t indépendantmesures : test-t indépendant– (test-t univarié: moyenne théorique)(test-t univarié: moyenne théorique)– 1 variable nominale à 3 ou + modalités, 1 variable nominale à 3 ou + modalités,

mesures: ANOVA à 1 facteur à n mesures: ANOVA à 1 facteur à n niveauxniveaux

Page 22: Statistiques Séance 10 N. Yamaguchi. Résumé de la séance précédente  Les ANOVA –À 1 facteur à n niveaux –À 1 facteur à mesures répétées –À 2 facteurs

1. Tester les différences entre 1. Tester les différences entre groupesgroupes

Paramétriques (suite):Paramétriques (suite):– 2 variables nominales: ANOVA à 2 2 variables nominales: ANOVA à 2

facteursfacteurs Non paramétriques:Non paramétriques:

– 1 variable nominale à 2 modalités; 1 variable nominale à 2 modalités; mesures: test U de Mann-Whitneymesures: test U de Mann-Whitney

– 1 variable nominale à 3 ou + modalités, 1 variable nominale à 3 ou + modalités, mesures: test des rangs de Kruskal-mesures: test des rangs de Kruskal-WallisWallis

Page 23: Statistiques Séance 10 N. Yamaguchi. Résumé de la séance précédente  Les ANOVA –À 1 facteur à n niveaux –À 1 facteur à mesures répétées –À 2 facteurs

2. Tester les différences entre 2. Tester les différences entre variablesvariables

Mêmes sujets, mais conditions Mêmes sujets, mais conditions différentesdifférentes

Paramétriques:Paramétriques:– 1 variable continue (mesures), 1 variable 1 variable continue (mesures), 1 variable

indépendante (à 2 modalités = 2 indépendante (à 2 modalités = 2 conditions): test-t appariéconditions): test-t apparié

– 1 variable continue (mesures), 1 variable 1 variable continue (mesures), 1 variable indépendante (à 3 ou + modalités = 3 ou indépendante (à 3 ou + modalités = 3 ou + conditions): ANOVA à mesures répétées+ conditions): ANOVA à mesures répétées

Page 24: Statistiques Séance 10 N. Yamaguchi. Résumé de la séance précédente  Les ANOVA –À 1 facteur à n niveaux –À 1 facteur à mesures répétées –À 2 facteurs

2. Tester les différences entre 2. Tester les différences entre variablesvariables

Non paramétriques:Non paramétriques:– Mesures, 1 variable indépendante (à 2 Mesures, 1 variable indépendante (à 2

modalités = 2 conditions): test des modalités = 2 conditions): test des rangs de Wilcoxonrangs de Wilcoxon

– Fréquences / effectifs, 1 variable Fréquences / effectifs, 1 variable indépendante aux modalités indépendante aux modalités dichotomiques: Chi 2dichotomiques: Chi 2

Page 25: Statistiques Séance 10 N. Yamaguchi. Résumé de la séance précédente  Les ANOVA –À 1 facteur à n niveaux –À 1 facteur à mesures répétées –À 2 facteurs

2. Tester les différences entre 2. Tester les différences entre variablesvariables

Non paramétriques (suite)Non paramétriques (suite)– 1 variable continue (mesures), 1 1 variable continue (mesures), 1

variable indépendante (à 3 ou + variable indépendante (à 3 ou + modalités = 3 ou + conditions): test de modalités = 3 ou + conditions): test de FriedmanFriedman

Page 26: Statistiques Séance 10 N. Yamaguchi. Résumé de la séance précédente  Les ANOVA –À 1 facteur à n niveaux –À 1 facteur à mesures répétées –À 2 facteurs

3. Tester les relations entre 3. Tester les relations entre variablesvariables

Paramétriques: corrélation de Paramétriques: corrélation de PearsonPearson

Non paramétriques: corrélation des Non paramétriques: corrélation des rangs de Spearman ou Chi 2 rangs de Spearman ou Chi 2 (fréquences / effectifs et variable à (fréquences / effectifs et variable à modalités catégorielles)modalités catégorielles)