Statistiques Séance 10 N. Yamaguchi. Résumé de la séance précédente Les ANOVA –À 1 facteur...

Preview:

Citation preview

StatistiquesStatistiques

Séance 10Séance 10

N. YamaguchiN. Yamaguchi

Résumé de la séance Résumé de la séance précédenteprécédente

Les ANOVALes ANOVA– À 1 facteur à n niveauxÀ 1 facteur à n niveaux– À 1 facteur à mesures répétéesÀ 1 facteur à mesures répétées– À 2 facteurs (+ notion d’interaction)À 2 facteurs (+ notion d’interaction)

Les corrélationsLes corrélations– Test paramétrique: PearsonTest paramétrique: Pearson– Test non paramétrique: SpearmanTest non paramétrique: Spearman

Rappel : corrélation de Rappel : corrélation de SpearmanSpearman

Prend en compte les Prend en compte les rangsrangs Exercice sur SpearmanExercice sur Spearman

ExerciceExercice

Sujet Note de maths Note de français

1 15 18

2 5 10

3 15 10

4 5 11

5 12 16

6 8 12

7 10 14

Le Khi (Chi) 2Le Khi (Chi) 2

Ou Ou χχ22

Pourquoi faire?Pourquoi faire?

Comparer des Comparer des distributionsdistributions ou des ou des formes de distributionsformes de distributions

Etude des Etude des fréquencesfréquences ou des ou des effectifseffectifs impliquant des variables impliquant des variables nominalesnominales. Pas de variables . Pas de variables continues!continues!

Exemple du début : la BU.Exemple du début : la BU.

Comparaison d’une distr observée Comparaison d’une distr observée et d’une distr théoriqueet d’une distr théorique

Une seule variable nominaleUne seule variable nominale On analyse une seule distribution.On analyse une seule distribution. Question : est-elle homogène (= Question : est-elle homogène (=

semblable à la distribution théorique)semblable à la distribution théorique) H0: oui. Répartition homogène des H0: oui. Répartition homogène des

effectifs.effectifs.

Exemple (1) cf I. LehisteExemple (1) cf I. Lehiste

Perception du contexte d’une phrase par Perception du contexte d’une phrase par 30 auditeurs.30 auditeurs.

Tableau pour la phrase lue isolémentTableau pour la phrase lue isolément Comparaison avec la distrib théorique: Comparaison avec la distrib théorique:

répartition homogène des effectifs.répartition homogène des effectifs. Note: variable nominale à 4 modalités (les Note: variable nominale à 4 modalités (les

rentrer comme une variable continue ds rentrer comme une variable continue ds Statview)Statview)

H0?H0?

ProcédureProcédure

Données: comme une variable Données: comme une variable continuecontinue– Pas d’étiquettes!Pas d’étiquettes!– Pas besoin de rentrer la distribution Pas besoin de rentrer la distribution

théoriquethéorique Analyse:Analyse:

– Analyse univariée > Khi 2 (désselectionner Analyse univariée > Khi 2 (désselectionner test-t) > rentrer la distrib théorique!!!test-t) > rentrer la distrib théorique!!!

– Menu Analyse > test-t > Editer analyse > Menu Analyse > test-t > Editer analyse > Khi 2Khi 2

RésultatsRésultats

Valeur du Khi 2 à comparer avec p.Valeur du Khi 2 à comparer avec p. Hypothèse nulle non rejetéeHypothèse nulle non rejetée Conclusion?Conclusion? Mais…Mais…

Exemple (2ème partie)Exemple (2ème partie)

Même phrase lue à l’initiale. Même phrase lue à l’initiale. Distribution aléatoire?Distribution aléatoire?

Données: on rajoute une colonneDonnées: on rajoute une colonne Procédure : même chose. On peut Procédure : même chose. On peut

assigner une autre variable!assigner une autre variable! RésultatsRésultats ConclusionConclusion

Un autre cas du Chi 2Un autre cas du Chi 2

Comparaison de 2 distributions Comparaison de 2 distributions indépendantesindépendantes

Voir si les 2 distributions sont Voir si les 2 distributions sont homogènes. (répartition de homogènes. (répartition de fréquences)fréquences)

Hypothèse nulle: il n’y a pas de Hypothèse nulle: il n’y a pas de relation entre les fréquences des relation entre les fréquences des lignes et les fréquences des colonneslignes et les fréquences des colonnes

ExempleExemple

Étude sur l’efficacité d’une méthode Étude sur l’efficacité d’une méthode d’enseignement des langues: labo vs d’enseignement des langues: labo vs méthode traditionnelleméthode traditionnelle

Tableau de contingence

Calcul du Chi 2Calcul du Chi 2

Tableau de contingence: la Tableau de contingence: la colonnecolonne ds laquelle un sujet se trouve (= ds laquelle un sujet se trouve (= réussite vs échec) est contingente (= réussite vs échec) est contingente (= dépend de) la dépend de) la ligneligne ds laquelle le ds laquelle le sujet se trouve (= exp vs méthode sujet se trouve (= exp vs méthode trad)trad)

H0: il n’y a pas de relation entre ligne H0: il n’y a pas de relation entre ligne et colonneet colonne

Calcul du Chi 2 (suite)Calcul du Chi 2 (suite)

Calcul de la fréquence attendue si H0 Calcul de la fréquence attendue si H0 est vraie, pour chaque cellule du est vraie, pour chaque cellule du tableau:tableau:

Calcul du Chi 2 (suite)Calcul du Chi 2 (suite)

Résultat global par rapport à toutes Résultat global par rapport à toutes les cellules.les cellules.

Procédure:Procédure:– DonnéesDonnées– Tableau de contigence > tableau Tableau de contigence > tableau

résumé et Chi 2 des cellulesrésumé et Chi 2 des cellules

RésultatsRésultats

Tableau résuméTableau résumé– DDL : (C-1)(R-1)DDL : (C-1)(R-1)– Valeur Chi 2 et pValeur Chi 2 et p– Résultats? H0?Résultats? H0?

Chi 2 des cellulesChi 2 des cellules– Décomposition du Chi 2 global selon les Décomposition du Chi 2 global selon les

cellules (contribution des cellules)cellules (contribution des cellules)

ExerciceExercice

Étude de Butler sur la poésie de Sylvia Étude de Butler sur la poésie de Sylvia Plath: distribution des longueurs de mots Plath: distribution des longueurs de mots dans 2 de ses recueilsdans 2 de ses recueils

Lgr motsLgr mots 1 – 31 – 3 4 – 64 – 6 7 – 97 – 9 10 -10 -1212

>12>12

« The « The Colossus Colossus »»

34733473 37433743 12721272 285285 5454

« Winter « Winter trees »trees »

30003000 26742674 753753 165165 1818

ExerciceExercice

Quelle est H0?Quelle est H0? Quels sont les résultats?Quels sont les résultats?

Rappel! Quel test utiliser?Rappel! Quel test utiliser?

Il faut connaître:Il faut connaître:– Le type de distribution: test Le type de distribution: test

paramétrique ou non paramétrique?paramétrique ou non paramétrique?– Le nombre de variables et le nombre de Le nombre de variables et le nombre de

leurs modalitésleurs modalités– Le type de données: fréquences, Le type de données: fréquences,

mesures?mesures?– Ce qu’on veut étudier!Ce qu’on veut étudier!

1. Tester les différences entre 1. Tester les différences entre groupesgroupes

Groupes indépendants : ce ne sont pas Groupes indépendants : ce ne sont pas les mêmes sujets!les mêmes sujets!

ParamétriqueParamétrique– 1 variable nominale à 2 modalités; 1 variable nominale à 2 modalités;

mesures : test-t indépendantmesures : test-t indépendant– (test-t univarié: moyenne théorique)(test-t univarié: moyenne théorique)– 1 variable nominale à 3 ou + modalités, 1 variable nominale à 3 ou + modalités,

mesures: ANOVA à 1 facteur à n mesures: ANOVA à 1 facteur à n niveauxniveaux

1. Tester les différences entre 1. Tester les différences entre groupesgroupes

Paramétriques (suite):Paramétriques (suite):– 2 variables nominales: ANOVA à 2 2 variables nominales: ANOVA à 2

facteursfacteurs Non paramétriques:Non paramétriques:

– 1 variable nominale à 2 modalités; 1 variable nominale à 2 modalités; mesures: test U de Mann-Whitneymesures: test U de Mann-Whitney

– 1 variable nominale à 3 ou + modalités, 1 variable nominale à 3 ou + modalités, mesures: test des rangs de Kruskal-mesures: test des rangs de Kruskal-WallisWallis

2. Tester les différences entre 2. Tester les différences entre variablesvariables

Mêmes sujets, mais conditions Mêmes sujets, mais conditions différentesdifférentes

Paramétriques:Paramétriques:– 1 variable continue (mesures), 1 variable 1 variable continue (mesures), 1 variable

indépendante (à 2 modalités = 2 indépendante (à 2 modalités = 2 conditions): test-t appariéconditions): test-t apparié

– 1 variable continue (mesures), 1 variable 1 variable continue (mesures), 1 variable indépendante (à 3 ou + modalités = 3 ou indépendante (à 3 ou + modalités = 3 ou + conditions): ANOVA à mesures répétées+ conditions): ANOVA à mesures répétées

2. Tester les différences entre 2. Tester les différences entre variablesvariables

Non paramétriques:Non paramétriques:– Mesures, 1 variable indépendante (à 2 Mesures, 1 variable indépendante (à 2

modalités = 2 conditions): test des modalités = 2 conditions): test des rangs de Wilcoxonrangs de Wilcoxon

– Fréquences / effectifs, 1 variable Fréquences / effectifs, 1 variable indépendante aux modalités indépendante aux modalités dichotomiques: Chi 2dichotomiques: Chi 2

2. Tester les différences entre 2. Tester les différences entre variablesvariables

Non paramétriques (suite)Non paramétriques (suite)– 1 variable continue (mesures), 1 1 variable continue (mesures), 1

variable indépendante (à 3 ou + variable indépendante (à 3 ou + modalités = 3 ou + conditions): test de modalités = 3 ou + conditions): test de FriedmanFriedman

3. Tester les relations entre 3. Tester les relations entre variablesvariables

Paramétriques: corrélation de Paramétriques: corrélation de PearsonPearson

Non paramétriques: corrélation des Non paramétriques: corrélation des rangs de Spearman ou Chi 2 rangs de Spearman ou Chi 2 (fréquences / effectifs et variable à (fréquences / effectifs et variable à modalités catégorielles)modalités catégorielles)

Recommended