125
Introduction sur les tests statistiques Le test du χ 2 Cours 4: Une introduction aux tests statistiques, le test du χ 2 Clément Rau Laboratoire de Mathématiques de Toulouse Université Paul Sabatier-IUT GEA Ponsan Module: Stat inférentielles Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ 2

Cours 4: Une introduction aux tests statistiques, le test du 2

Embed Size (px)

Citation preview

Page 1: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Cours 4: Une introduction aux testsstatistiques, le test du χ2

Clément RauLaboratoire de Mathématiques de ToulouseUniversité Paul Sabatier-IUT GEA Ponsan

Module: Stat inférentielles

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 2: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

1 Introduction sur les tests statistiquesIntroductionIdée de la théorie des tests statistiquesUn premier exemple de test

2 Le test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemplesExemple 1 : Adéquation à une loiExemple 2 : IndépendanceExemple 3 : Homogénéité

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 3: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

IntroductionIdée de la théorie des tests statistiquesUn premier exemple de test

Introduction

L’une des fonctions des statistiques est de proposer, àpartir d’observations d’un phénomène aléatoire, uneestimation d’un des paramètres du phénomène.Les statistiques servent aussi à prendre des décisions.Peut on considérer qu’un médicament est plus efficacequ’un placebo ? Le nombre de consultations de Google parseconde suit il une loi de Poisson ? Les gènes pilotant lacouleur des yeux et ceux des cheveux sont ils sur lesmêmes chromosomes ?

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 4: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

IntroductionIdée de la théorie des tests statistiquesUn premier exemple de test

Introduction

L’une des fonctions des statistiques est de proposer, àpartir d’observations d’un phénomène aléatoire, uneestimation d’un des paramètres du phénomène.Les statistiques servent aussi à prendre des décisions.Peut on considérer qu’un médicament est plus efficacequ’un placebo ? Le nombre de consultations de Google parseconde suit il une loi de Poisson ? Les gènes pilotant lacouleur des yeux et ceux des cheveux sont ils sur lesmêmes chromosomes ?

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 5: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

IntroductionIdée de la théorie des tests statistiquesUn premier exemple de test

Introduction

Il y a deux points communs (au moins) à toutes ces questions :leurs réponses sont des oui-non et le phénomène sous-jacentest aléatoire.

Les tests statistiques vont permettre d’apporter une réponse àdes questions manichéennes en contrôlant l’aléa inhérent à la

situation.

En statistiques, les deux éventualités sont appelées deshypothèses et sont notées :

H0 (hypothèse nulle) et H1 (hypothèse alternative).

Souvent H1 sera le contraire de H0. Dans tous les cas, lepostulat est qu’une et une seule des deux hypothèses est vraie.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 6: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

IntroductionIdée de la théorie des tests statistiquesUn premier exemple de test

Introduction

Il y a deux points communs (au moins) à toutes ces questions :leurs réponses sont des oui-non et le phénomène sous-jacentest aléatoire.

Les tests statistiques vont permettre d’apporter une réponse àdes questions manichéennes en contrôlant l’aléa inhérent à la

situation.

En statistiques, les deux éventualités sont appelées deshypothèses et sont notées :

H0 (hypothèse nulle) et H1 (hypothèse alternative).

Souvent H1 sera le contraire de H0. Dans tous les cas, lepostulat est qu’une et une seule des deux hypothèses est vraie.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 7: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

IntroductionIdée de la théorie des tests statistiquesUn premier exemple de test

Introduction

Il y a deux points communs (au moins) à toutes ces questions :leurs réponses sont des oui-non et le phénomène sous-jacentest aléatoire.

Les tests statistiques vont permettre d’apporter une réponse àdes questions manichéennes en contrôlant l’aléa inhérent à la

situation.

En statistiques, les deux éventualités sont appelées deshypothèses et sont notées :

H0 (hypothèse nulle) et H1 (hypothèse alternative).

Souvent H1 sera le contraire de H0. Dans tous les cas, lepostulat est qu’une et une seule des deux hypothèses est vraie.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 8: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

IntroductionIdée de la théorie des tests statistiquesUn premier exemple de test

Introduction

Il y a deux points communs (au moins) à toutes ces questions :leurs réponses sont des oui-non et le phénomène sous-jacentest aléatoire.

Les tests statistiques vont permettre d’apporter une réponse àdes questions manichéennes en contrôlant l’aléa inhérent à la

situation.

En statistiques, les deux éventualités sont appelées deshypothèses et sont notées :

H0 (hypothèse nulle) et H1 (hypothèse alternative).

Souvent H1 sera le contraire de H0. Dans tous les cas, lepostulat est qu’une et une seule des deux hypothèses est vraie.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 9: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

IntroductionIdée de la théorie des tests statistiquesUn premier exemple de test

Esquisse d’idée de la théorie des tests

Un test statistique est un algorithme qui conduit à ne pasrejetter H0 ou rejetter H0 à partir des observations duphénomène.L’idée de base des tests, est de trouver une statistique(une fonction des observations) dont on connait la loi (ouqui s’approxime par une loi connue) si H0 est vraie, et quine se comporte pas de la même manière selon que H0 ouH1 est vraie.Le "qui s’approxime par une loi connue" dans la phraseprécédente, est en général une conséquence du TCL. Ondevine ainsi l’importance capitale de ce Théorème danscette théorie.)

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 10: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

IntroductionIdée de la théorie des tests statistiquesUn premier exemple de test

Esquisse d’idée de la théorie des tests

Un test statistique est un algorithme qui conduit à ne pasrejetter H0 ou rejetter H0 à partir des observations duphénomène.L’idée de base des tests, est de trouver une statistique(une fonction des observations) dont on connait la loi (ouqui s’approxime par une loi connue) si H0 est vraie, et quine se comporte pas de la même manière selon que H0 ouH1 est vraie.Le "qui s’approxime par une loi connue" dans la phraseprécédente, est en général une conséquence du TCL. Ondevine ainsi l’importance capitale de ce Théorème danscette théorie.)

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 11: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

IntroductionIdée de la théorie des tests statistiquesUn premier exemple de test

Esquisse d’idée de la théorie des tests

Un test statistique est un algorithme qui conduit à ne pasrejetter H0 ou rejetter H0 à partir des observations duphénomène.L’idée de base des tests, est de trouver une statistique(une fonction des observations) dont on connait la loi (ouqui s’approxime par une loi connue) si H0 est vraie, et quine se comporte pas de la même manière selon que H0 ouH1 est vraie.Le "qui s’approxime par une loi connue" dans la phraseprécédente, est en général une conséquence du TCL. Ondevine ainsi l’importance capitale de ce Théorème danscette théorie.)

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 12: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

IntroductionIdée de la théorie des tests statistiquesUn premier exemple de test

Exemple

On a n tirages de v.a indépendantes, notées X1,X2, ...,Xn.On ignore leur lois, on connait σ2 = Var(X1) et on sedemande si E(X1) = 5 ?Grace au TCL, on sait immédiatement que si E(X1) vaut 5alors on a une fonctionnelle des observations Xi qui tendvers une loi connue (et cela ne sachant quasiment rien surla loi des Xi ! ! !) à savoir :

√n(Xn − 5)

σ

L−→n→∞

N (0; 1),

ce qui est "vérifiable" ...

Précisons les choses avec un exemple plus concret.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 13: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

IntroductionIdée de la théorie des tests statistiquesUn premier exemple de test

Exemple

On a n tirages de v.a indépendantes, notées X1,X2, ...,Xn.On ignore leur lois, on connait σ2 = Var(X1) et on sedemande si E(X1) = 5 ?Grace au TCL, on sait immédiatement que si E(X1) vaut 5alors on a une fonctionnelle des observations Xi qui tendvers une loi connue (et cela ne sachant quasiment rien surla loi des Xi ! ! !) à savoir :

√n(Xn − 5)

σ

L−→n→∞

N (0; 1),

ce qui est "vérifiable" ...

Précisons les choses avec un exemple plus concret.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 14: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

IntroductionIdée de la théorie des tests statistiquesUn premier exemple de test

Exemple

On a n tirages de v.a indépendantes, notées X1,X2, ...,Xn.On ignore leur lois, on connait σ2 = Var(X1) et on sedemande si E(X1) = 5 ?Grace au TCL, on sait immédiatement que si E(X1) vaut 5alors on a une fonctionnelle des observations Xi qui tendvers une loi connue (et cela ne sachant quasiment rien surla loi des Xi ! ! !) à savoir :

√n(Xn − 5)

σ

L−→n→∞

N (0; 1),

ce qui est "vérifiable" ...

Précisons les choses avec un exemple plus concret.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 15: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

IntroductionIdée de la théorie des tests statistiquesUn premier exemple de test

Exemple

On a n tirages de v.a indépendantes, notées X1,X2, ...,Xn.On ignore leur lois, on connait σ2 = Var(X1) et on sedemande si E(X1) = 5 ?Grace au TCL, on sait immédiatement que si E(X1) vaut 5alors on a une fonctionnelle des observations Xi qui tendvers une loi connue (et cela ne sachant quasiment rien surla loi des Xi ! ! !) à savoir :

√n(Xn − 5)

σ

L−→n→∞

N (0; 1),

ce qui est "vérifiable" ...

Précisons les choses avec un exemple plus concret.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 16: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

IntroductionIdée de la théorie des tests statistiquesUn premier exemple de test

Exemple

On a n tirages de v.a indépendantes, notées X1,X2, ...,Xn.On ignore leur lois, on connait σ2 = Var(X1) et on sedemande si E(X1) = 5 ?Grace au TCL, on sait immédiatement que si E(X1) vaut 5alors on a une fonctionnelle des observations Xi qui tendvers une loi connue (et cela ne sachant quasiment rien surla loi des Xi ! ! !) à savoir :

√n(Xn − 5)

σ

L−→n→∞

N (0; 1),

ce qui est "vérifiable" ...

Précisons les choses avec un exemple plus concret.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 17: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

IntroductionIdée de la théorie des tests statistiquesUn premier exemple de test

On suppose que la taille d’une population suit une loiGaussienne N (µ;σ). On connait σ2 mais la valeur µ estinconnue.Certaines circonstances aménent à formuler la questionsuivante : la moyenne théorique µ est-elle égale à unecertaine valeur µ0 ? Pour cela, on désire faire le testsuivant :

H0 : << µ = µ0 >> contre H1 : << µ 6= µ0 >> .

Soit un échantillon X1, ...,Xn des tailles de n personnes de lapopulation. H0 implique que Xi ∼ N (µ0;σ). Ainsi, pour n

grand, le TCL donne alors que la v.a.

Un :=

√nσ

(Xn − µ0) suit une N (0; 1).

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 18: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

IntroductionIdée de la théorie des tests statistiquesUn premier exemple de test

On suppose que la taille d’une population suit une loiGaussienne N (µ;σ). On connait σ2 mais la valeur µ estinconnue.Certaines circonstances aménent à formuler la questionsuivante : la moyenne théorique µ est-elle égale à unecertaine valeur µ0 ? Pour cela, on désire faire le testsuivant :

H0 : << µ = µ0 >> contre H1 : << µ 6= µ0 >> .

Soit un échantillon X1, ...,Xn des tailles de n personnes de lapopulation. H0 implique que Xi ∼ N (µ0;σ). Ainsi, pour n

grand, le TCL donne alors que la v.a.

Un :=

√nσ

(Xn − µ0) suit une N (0; 1).

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 19: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

IntroductionIdée de la théorie des tests statistiquesUn premier exemple de test

On suppose que la taille d’une population suit une loiGaussienne N (µ;σ). On connait σ2 mais la valeur µ estinconnue.Certaines circonstances aménent à formuler la questionsuivante : la moyenne théorique µ est-elle égale à unecertaine valeur µ0 ? Pour cela, on désire faire le testsuivant :

H0 : << µ = µ0 >> contre H1 : << µ 6= µ0 >> .

Soit un échantillon X1, ...,Xn des tailles de n personnes de lapopulation. H0 implique que Xi ∼ N (µ0;σ). Ainsi, pour n

grand, le TCL donne alors que la v.a.

Un :=

√nσ

(Xn − µ0) suit une N (0; 1).

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 20: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

IntroductionIdée de la théorie des tests statistiquesUn premier exemple de test

On suppose que la taille d’une population suit une loiGaussienne N (µ;σ). On connait σ2 mais la valeur µ estinconnue.Certaines circonstances aménent à formuler la questionsuivante : la moyenne théorique µ est-elle égale à unecertaine valeur µ0 ? Pour cela, on désire faire le testsuivant :

H0 : << µ = µ0 >> contre H1 : << µ 6= µ0 >> .

Soit un échantillon X1, ...,Xn des tailles de n personnes de lapopulation. H0 implique que Xi ∼ N (µ0;σ). Ainsi, pour n

grand, le TCL donne alors que la v.a.

Un :=

√nσ

(Xn − µ0) suit une N (0; 1).

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 21: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

IntroductionIdée de la théorie des tests statistiquesUn premier exemple de test

On suppose que la taille d’une population suit une loiGaussienne N (µ;σ). On connait σ2 mais la valeur µ estinconnue.Certaines circonstances aménent à formuler la questionsuivante : la moyenne théorique µ est-elle égale à unecertaine valeur µ0 ? Pour cela, on désire faire le testsuivant :

H0 : << µ = µ0 >> contre H1 : << µ 6= µ0 >> .

Soit un échantillon X1, ...,Xn des tailles de n personnes de lapopulation. H0 implique que Xi ∼ N (µ0;σ). Ainsi, pour n

grand, le TCL donne alors que la v.a.

Un :=

√nσ

(Xn − µ0) suit une N (0; 1).

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 22: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

IntroductionIdée de la théorie des tests statistiquesUn premier exemple de test

On suppose que la taille d’une population suit une loiGaussienne N (µ;σ). On connait σ2 mais la valeur µ estinconnue.Certaines circonstances aménent à formuler la questionsuivante : la moyenne théorique µ est-elle égale à unecertaine valeur µ0 ? Pour cela, on désire faire le testsuivant :

H0 : << µ = µ0 >> contre H1 : << µ 6= µ0 >> .

Soit un échantillon X1, ...,Xn des tailles de n personnes de lapopulation. H0 implique que Xi ∼ N (µ0;σ). Ainsi, pour n

grand, le TCL donne alors que la v.a.

Un :=

√nσ

(Xn − µ0) suit une N (0; 1).

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 23: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

IntroductionIdée de la théorie des tests statistiquesUn premier exemple de test

Vu l’allure de la densité de la normale centrée réduite, ondéfinit une zone rejet Rα de la forme,

Rα =]−∞;−tα[∪]tα; +∞[,

où le nombre tα est donné par la table N (0; 1) de la v.a. Uavec

P(|U| > tα) = α.

Si on choisit α = 0,05, on a tα = 1,96 d’aprés la tableN (0; 1). Et si choisit α = 0,1, on a tα = 1,645.Il reste alors à calculer la valeur u de U à partir del’échantillon et à décider en fonction de l’appartenance deu à Rα ou non.

si u ∈ Rα on rejette H0 avec un risque d’erreur α %si u /∈ Rα on ne rejette pas H0 avec un risque d’erreur α %

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 24: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

IntroductionIdée de la théorie des tests statistiquesUn premier exemple de test

Vu l’allure de la densité de la normale centrée réduite, ondéfinit une zone rejet Rα de la forme,

Rα =]−∞;−tα[∪]tα; +∞[,

où le nombre tα est donné par la table N (0; 1) de la v.a. Uavec

P(|U| > tα) = α.

Si on choisit α = 0,05, on a tα = 1,96 d’aprés la tableN (0; 1). Et si choisit α = 0,1, on a tα = 1,645.Il reste alors à calculer la valeur u de U à partir del’échantillon et à décider en fonction de l’appartenance deu à Rα ou non.

si u ∈ Rα on rejette H0 avec un risque d’erreur α %si u /∈ Rα on ne rejette pas H0 avec un risque d’erreur α %

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 25: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

IntroductionIdée de la théorie des tests statistiquesUn premier exemple de test

Vu l’allure de la densité de la normale centrée réduite, ondéfinit une zone rejet Rα de la forme,

Rα =]−∞;−tα[∪]tα; +∞[,

où le nombre tα est donné par la table N (0; 1) de la v.a. Uavec

P(|U| > tα) = α.

Si on choisit α = 0,05, on a tα = 1,96 d’aprés la tableN (0; 1). Et si choisit α = 0,1, on a tα = 1,645.Il reste alors à calculer la valeur u de U à partir del’échantillon et à décider en fonction de l’appartenance deu à Rα ou non.

si u ∈ Rα on rejette H0 avec un risque d’erreur α %si u /∈ Rα on ne rejette pas H0 avec un risque d’erreur α %

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 26: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

IntroductionIdée de la théorie des tests statistiquesUn premier exemple de test

Vu l’allure de la densité de la normale centrée réduite, ondéfinit une zone rejet Rα de la forme,

Rα =]−∞;−tα[∪]tα; +∞[,

où le nombre tα est donné par la table N (0; 1) de la v.a. Uavec

P(|U| > tα) = α.

Si on choisit α = 0,05, on a tα = 1,96 d’aprés la tableN (0; 1). Et si choisit α = 0,1, on a tα = 1,645.Il reste alors à calculer la valeur u de U à partir del’échantillon et à décider en fonction de l’appartenance deu à Rα ou non.

si u ∈ Rα on rejette H0 avec un risque d’erreur α %si u /∈ Rα on ne rejette pas H0 avec un risque d’erreur α %

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 27: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

1 Introduction sur les tests statistiquesIntroductionIdée de la théorie des tests statistiquesUn premier exemple de test

2 Le test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemplesExemple 1 : Adéquation à une loiExemple 2 : IndépendanceExemple 3 : Homogénéité

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 28: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Point de départ

Soit (X1, ...,Xn) un échantillon (de loi inconnue).Soit c1, ..., ck , une partition en classe de l’ensemble desvaleurs possibles que peuvent prendre les Xi .L’hypothèse à tester porte sur les probabilités des classes,pour lesquelles on se donne des valeurs théoriquesPtheo(c1), ...,Ptheo(ck ).

H0 : ∀i = 1, ..., k , P(Xj ∈ ci) =Ptheo(ci).

(On veut savoir si la probabilité de tomber dans la classe ci estbien Ptheo(ci).)

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 29: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Point de départ

Soit (X1, ...,Xn) un échantillon (de loi inconnue).Soit c1, ..., ck , une partition en classe de l’ensemble desvaleurs possibles que peuvent prendre les Xi .L’hypothèse à tester porte sur les probabilités des classes,pour lesquelles on se donne des valeurs théoriquesPtheo(c1), ...,Ptheo(ck ).

H0 : ∀i = 1, ..., k , P(Xj ∈ ci) =Ptheo(ci).

(On veut savoir si la probabilité de tomber dans la classe ci estbien Ptheo(ci).)

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 30: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Point de départ

Soit (X1, ...,Xn) un échantillon (de loi inconnue).Soit c1, ..., ck , une partition en classe de l’ensemble desvaleurs possibles que peuvent prendre les Xi .L’hypothèse à tester porte sur les probabilités des classes,pour lesquelles on se donne des valeurs théoriquesPtheo(c1), ...,Ptheo(ck ).

H0 : ∀i = 1, ..., k , P(Xj ∈ ci) =Ptheo(ci).

(On veut savoir si la probabilité de tomber dans la classe ci estbien Ptheo(ci).)

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 31: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Point de départ

Soit (X1, ...,Xn) un échantillon (de loi inconnue).Soit c1, ..., ck , une partition en classe de l’ensemble desvaleurs possibles que peuvent prendre les Xi .L’hypothèse à tester porte sur les probabilités des classes,pour lesquelles on se donne des valeurs théoriquesPtheo(c1), ...,Ptheo(ck ).

H0 : ∀i = 1, ..., k , P(Xj ∈ ci) =Ptheo(ci).

(On veut savoir si la probabilité de tomber dans la classe ci estbien Ptheo(ci).)

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 32: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Point de départ

Soit (X1, ...,Xn) un échantillon (de loi inconnue).Soit c1, ..., ck , une partition en classe de l’ensemble desvaleurs possibles que peuvent prendre les Xi .L’hypothèse à tester porte sur les probabilités des classes,pour lesquelles on se donne des valeurs théoriquesPtheo(c1), ...,Ptheo(ck ).

H0 : ∀i = 1, ..., k , P(Xj ∈ ci) =Ptheo(ci).

(On veut savoir si la probabilité de tomber dans la classe ci estbien Ptheo(ci).)

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 33: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Point de départ

Remarque : Le test du khi-deux concerne uniquement les loisdiscrètes, mais on peut l’utiliser aussi pour des échantillonscontinus regroupés en classes.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 34: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Point de départ

La distribution empirique (observée) Pobs est celle desfréquences de l’échantillon dans les classes :

Pobs(cj) =1n

∑i=1...n

1cj(Xi)

=Nombre de Xi tombant dans la classe cj

n.

Il ne reste plus qu’à jauger l’écart entre la distribution empiriqueet la distribution théorique (supposée). Si notre hypothèse est"correcte", cet écart doit être "petit"...

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 35: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Point de départ

La distribution empirique (observée) Pobs est celle desfréquences de l’échantillon dans les classes :

Pobs(cj) =1n

∑i=1...n

1cj(Xi)

=Nombre de Xi tombant dans la classe cj

n.

Il ne reste plus qu’à jauger l’écart entre la distribution empiriqueet la distribution théorique (supposée). Si notre hypothèse est"correcte", cet écart doit être "petit"...

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 36: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Point de départ

La distribution empirique (observée) Pobs est celle desfréquences de l’échantillon dans les classes :

Pobs(cj) =1n

∑i=1...n

1cj(Xi)

=Nombre de Xi tombant dans la classe cj

n.

Il ne reste plus qu’à jauger l’écart entre la distribution empiriqueet la distribution théorique (supposée). Si notre hypothèse est"correcte", cet écart doit être "petit"...

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 37: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Pincipe du test

On mesure l’adéquation de la distribution empirique à ladistribution théorique par la distance du khi-deux de Ptheopar rapport à Pobs, par la quantité :

Dχ2(Ptheo,Pobs) =∑

i=1...k

(Ptheo(ci)− Pobs(ci))2

Ptheo(ci).

La "distance" du khi-deux est donc une moyenne pondéréed’écarts quadratiques entre les valeurs de Ptheo et Pobs.Ce n’est pas une distance au sens usuel du terme,puisqu’elle n’est même pas symétrique.La loi de probabilité de Dχ2(Ptheo,Pobs) n’a pasd’expression explicite en général.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 38: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Pincipe du test

On mesure l’adéquation de la distribution empirique à ladistribution théorique par la distance du khi-deux de Ptheopar rapport à Pobs, par la quantité :

Dχ2(Ptheo,Pobs) =∑

i=1...k

(Ptheo(ci)− Pobs(ci))2

Ptheo(ci).

La "distance" du khi-deux est donc une moyenne pondéréed’écarts quadratiques entre les valeurs de Ptheo et Pobs.Ce n’est pas une distance au sens usuel du terme,puisqu’elle n’est même pas symétrique.La loi de probabilité de Dχ2(Ptheo,Pobs) n’a pasd’expression explicite en général.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 39: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Pincipe du test

On mesure l’adéquation de la distribution empirique à ladistribution théorique par la distance du khi-deux de Ptheopar rapport à Pobs, par la quantité :

Dχ2(Ptheo,Pobs) =∑

i=1...k

(Ptheo(ci)− Pobs(ci))2

Ptheo(ci).

La "distance" du khi-deux est donc une moyenne pondéréed’écarts quadratiques entre les valeurs de Ptheo et Pobs.Ce n’est pas une distance au sens usuel du terme,puisqu’elle n’est même pas symétrique.La loi de probabilité de Dχ2(Ptheo,Pobs) n’a pasd’expression explicite en général.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 40: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Pincipe du test

On mesure l’adéquation de la distribution empirique à ladistribution théorique par la distance du khi-deux de Ptheopar rapport à Pobs, par la quantité :

Dχ2(Ptheo,Pobs) =∑

i=1...k

(Ptheo(ci)− Pobs(ci))2

Ptheo(ci).

La "distance" du khi-deux est donc une moyenne pondéréed’écarts quadratiques entre les valeurs de Ptheo et Pobs.Ce n’est pas une distance au sens usuel du terme,puisqu’elle n’est même pas symétrique.La loi de probabilité de Dχ2(Ptheo,Pobs) n’a pasd’expression explicite en général.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 41: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Pincipe du test

On mesure l’adéquation de la distribution empirique à ladistribution théorique par la distance du khi-deux de Ptheopar rapport à Pobs, par la quantité :

Dχ2(Ptheo,Pobs) =∑

i=1...k

(Ptheo(ci)− Pobs(ci))2

Ptheo(ci).

La "distance" du khi-deux est donc une moyenne pondéréed’écarts quadratiques entre les valeurs de Ptheo et Pobs.Ce n’est pas une distance au sens usuel du terme,puisqu’elle n’est même pas symétrique.La loi de probabilité de Dχ2(Ptheo,Pobs) n’a pasd’expression explicite en général.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 42: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Principe du test

Le test du χ2 est fondé sur la propriété suivante assez"magique" :

Proposition

1 Sous l’hypothèse H0, la loi de la variable aléatoiren × Dχ2(Ptheo,Pobs) converge quand n tend vers l’infini,vers la loi du khi-deux de paramètre k-1.

2 Si l’hypothèse H0 est fausse, alors la variablen × Dχ2(Ptheo,Pobs) tend vers l’infini.

( Pour le point 2, appliquer k fois la loi des grands nombres, onobtient un terme linéaire en n).

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 43: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Principe du test

Le test du χ2 est fondé sur la propriété suivante assez"magique" :

Proposition

1 Sous l’hypothèse H0, la loi de la variable aléatoiren × Dχ2(Ptheo,Pobs) converge quand n tend vers l’infini,vers la loi du khi-deux de paramètre k-1.

2 Si l’hypothèse H0 est fausse, alors la variablen × Dχ2(Ptheo,Pobs) tend vers l’infini.

( Pour le point 2, appliquer k fois la loi des grands nombres, onobtient un terme linéaire en n).

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 44: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Principe du test

Le test du χ2 est fondé sur la propriété suivante assez"magique" :

Proposition

1 Sous l’hypothèse H0, la loi de la variable aléatoiren × Dχ2(Ptheo,Pobs) converge quand n tend vers l’infini,vers la loi du khi-deux de paramètre k-1.

2 Si l’hypothèse H0 est fausse, alors la variablen × Dχ2(Ptheo,Pobs) tend vers l’infini.

( Pour le point 2, appliquer k fois la loi des grands nombres, onobtient un terme linéaire en n).

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 45: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Principe du test

Le test du χ2 est fondé sur la propriété suivante assez"magique" :

Proposition

1 Sous l’hypothèse H0, la loi de la variable aléatoiren × Dχ2(Ptheo,Pobs) converge quand n tend vers l’infini,vers la loi du khi-deux de paramètre k-1.

2 Si l’hypothèse H0 est fausse, alors la variablen × Dχ2(Ptheo,Pobs) tend vers l’infini.

( Pour le point 2, appliquer k fois la loi des grands nombres, onobtient un terme linéaire en n).

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 46: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Loi d’un χ2

Rappel :

FIGURE: Densité de la loi d’un χ2 (à plus de 3 paramètres).

A partir de là, on calcule la zone de rejet unilatéraleRα =]tα,+∞] au risque α en déterminant tα dans la table de laloi χ2 par P(n × Dχ2(Ptheo,Pobs) > tα) = α.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 47: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Loi d’un χ2

Rappel :

FIGURE: Densité de la loi d’un χ2 (à plus de 3 paramètres).

A partir de là, on calcule la zone de rejet unilatéraleRα =]tα,+∞] au risque α en déterminant tα dans la table de laloi χ2 par P(n × Dχ2(Ptheo,Pobs) > tα) = α.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 48: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Principe du test

En pratique, la statistique du test du khi-deux se calcule sous laforme suivante :

U = nDχ2 =∑

i=1...k

(ntheo(ci)− nobs(ci))2

ntheo(ci),

où1 ntheo(ci) est l’effectif théorique de la classe ci , à savoir le

produit nPtheo(ci),2 nobs(ci) est l’effectif observé de la classe ci .

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 49: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Principe du test

En pratique, la statistique du test du khi-deux se calcule sous laforme suivante :

U = nDχ2 =∑

i=1...k

(ntheo(ci)− nobs(ci))2

ntheo(ci),

où1 ntheo(ci) est l’effectif théorique de la classe ci , à savoir le

produit nPtheo(ci),2 nobs(ci) est l’effectif observé de la classe ci .

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 50: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Les trois types de test du χ2

1 Le test du χ2 d’adéquation à une loi de probabilité sur unensemble fini. Est il raisonnable de penser que lesrésultats que j’observe sont des réalisations i.i.d d’une loi(p1,p1, ...,pk ) sur un ensemble 1,2, ..., k.Exemple, H0 : « le caractére X suit-il une loi particulière ? »

2 Le test χ2 d’homogénéité de plusieurs échantillons : deuxmédicaments ont-ils le même effet (guérison, étatstationnaire...) sur la population atteinte ?Exemple, H0 : « le caractére X suit-il la même loi dansdeux populations données ? »

3 Le test du χ2 d’indépendance.Exemple,H0 : « les caractéres X et Y sont-ilsindépendants ? »

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 51: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Les trois types de test du χ2

1 Le test du χ2 d’adéquation à une loi de probabilité sur unensemble fini. Est il raisonnable de penser que lesrésultats que j’observe sont des réalisations i.i.d d’une loi(p1,p1, ...,pk ) sur un ensemble 1,2, ..., k.Exemple, H0 : « le caractére X suit-il une loi particulière ? »

2 Le test χ2 d’homogénéité de plusieurs échantillons : deuxmédicaments ont-ils le même effet (guérison, étatstationnaire...) sur la population atteinte ?Exemple, H0 : « le caractére X suit-il la même loi dansdeux populations données ? »

3 Le test du χ2 d’indépendance.Exemple,H0 : « les caractéres X et Y sont-ilsindépendants ? »

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 52: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Les trois types de test du χ2

1 Le test du χ2 d’adéquation à une loi de probabilité sur unensemble fini. Est il raisonnable de penser que lesrésultats que j’observe sont des réalisations i.i.d d’une loi(p1,p1, ...,pk ) sur un ensemble 1,2, ..., k.Exemple, H0 : « le caractére X suit-il une loi particulière ? »

2 Le test χ2 d’homogénéité de plusieurs échantillons : deuxmédicaments ont-ils le même effet (guérison, étatstationnaire...) sur la population atteinte ?Exemple, H0 : « le caractére X suit-il la même loi dansdeux populations données ? »

3 Le test du χ2 d’indépendance.Exemple,H0 : « les caractéres X et Y sont-ilsindépendants ? »

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 53: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Les trois types de test du χ2

1 Le test du χ2 d’adéquation à une loi de probabilité sur unensemble fini. Est il raisonnable de penser que lesrésultats que j’observe sont des réalisations i.i.d d’une loi(p1,p1, ...,pk ) sur un ensemble 1,2, ..., k.Exemple, H0 : « le caractére X suit-il une loi particulière ? »

2 Le test χ2 d’homogénéité de plusieurs échantillons : deuxmédicaments ont-ils le même effet (guérison, étatstationnaire...) sur la population atteinte ?Exemple, H0 : « le caractére X suit-il la même loi dansdeux populations données ? »

3 Le test du χ2 d’indépendance.Exemple,H0 : « les caractéres X et Y sont-ilsindépendants ? »

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 54: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Les trois types de test du χ2

1 Le test du χ2 d’adéquation à une loi de probabilité sur unensemble fini. Est il raisonnable de penser que lesrésultats que j’observe sont des réalisations i.i.d d’une loi(p1,p1, ...,pk ) sur un ensemble 1,2, ..., k.Exemple, H0 : « le caractére X suit-il une loi particulière ? »

2 Le test χ2 d’homogénéité de plusieurs échantillons : deuxmédicaments ont-ils le même effet (guérison, étatstationnaire...) sur la population atteinte ?Exemple, H0 : « le caractére X suit-il la même loi dansdeux populations données ? »

3 Le test du χ2 d’indépendance.Exemple,H0 : « les caractéres X et Y sont-ilsindépendants ? »

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 55: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Les trois types de test du χ2

1 Ces trois tests ont un principe commun qui est le suivant :on répartit les observations dans k classes dont leseffectifs sont notés n1,obs, ...,nk ,obs.

2 L’hypothèse H0 permet de calculer les effectifs théoriques,notés n1,theo, ...,nk ,theo (ni,theo represente l’effectif théoriquedans la classe i).

3 On rejette H0 si les effectifs observés sont trop différentsdes effectifs théoriques. Pour cela on donc utilise lastatistique de test décrite précédement :

U =∑

i=1..k

(ni,obs − ni,theo)2

ni,theo.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 56: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Les trois types de test du χ2

1 Ces trois tests ont un principe commun qui est le suivant :on répartit les observations dans k classes dont leseffectifs sont notés n1,obs, ...,nk ,obs.

2 L’hypothèse H0 permet de calculer les effectifs théoriques,notés n1,theo, ...,nk ,theo (ni,theo represente l’effectif théoriquedans la classe i).

3 On rejette H0 si les effectifs observés sont trop différentsdes effectifs théoriques. Pour cela on donc utilise lastatistique de test décrite précédement :

U =∑

i=1..k

(ni,obs − ni,theo)2

ni,theo.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 57: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Les trois types de test du χ2

1 Ces trois tests ont un principe commun qui est le suivant :on répartit les observations dans k classes dont leseffectifs sont notés n1,obs, ...,nk ,obs.

2 L’hypothèse H0 permet de calculer les effectifs théoriques,notés n1,theo, ...,nk ,theo (ni,theo represente l’effectif théoriquedans la classe i).

3 On rejette H0 si les effectifs observés sont trop différentsdes effectifs théoriques. Pour cela on donc utilise lastatistique de test décrite précédement :

U =∑

i=1..k

(ni,obs − ni,theo)2

ni,theo.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 58: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Les trois types de test du χ2

Fait : Le point central est que grace à la propriété 2.1, on peutprouver que lorsque la taille de l’échantillon augmente,

la statistique U tend vers la loi d’un χ2(k − 1−m),

où k est le nombre de classes et m est le nombre deparamètres estimées nécessaires au calcul des effectifsthéoriques (les Ni doivent être supérieur à 5).

Il faut donc s’assurer que les effectifs théoriques sont plusgrands que 5 et faire des regroupements de classes si besoinest.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 59: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Les trois types de test du χ2

Fait : Le point central est que grace à la propriété 2.1, on peutprouver que lorsque la taille de l’échantillon augmente,

la statistique U tend vers la loi d’un χ2(k − 1−m),

où k est le nombre de classes et m est le nombre deparamètres estimées nécessaires au calcul des effectifsthéoriques (les Ni doivent être supérieur à 5).

Il faut donc s’assurer que les effectifs théoriques sont plusgrands que 5 et faire des regroupements de classes si besoinest.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 60: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Les trois types de test du χ2

Rappel :

FIGURE: Densité de la loi d’un χ2 (à plus de 3 paramètres).

A partir de là, on calcule la zone de rejet unilatéraleRα =]tα,+∞] au risque α en déterminant tα dans la table de laloi χ2(k − 1−m) par P(U > tα) = α.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 61: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Les trois types de test du χ2

Rappel :

FIGURE: Densité de la loi d’un χ2 (à plus de 3 paramètres).

A partir de là, on calcule la zone de rejet unilatéraleRα =]tα,+∞] au risque α en déterminant tα dans la table de laloi χ2(k − 1−m) par P(U > tα) = α.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 62: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

FIGURE: Densité de la loi d’un χ2 (à plus de 3 paramètres).

La règle décision est la suivante : si u =∑

i=1..k(ni,obs−ni,theo)

2

ni,theoappartient à Rα, on rejette H0

si u =∑

i=1..k(ni,obs−ni,theo)

2

ni,theon’appartient pas à Rα, on accepte H0

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 63: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

FIGURE: Densité de la loi d’un χ2 (à plus de 3 paramètres).

La règle décision est la suivante : si u =∑

i=1..k(ni,obs−ni,theo)

2

ni,theoappartient à Rα, on rejette H0

si u =∑

i=1..k(ni,obs−ni,theo)

2

ni,theon’appartient pas à Rα, on accepte H0

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 64: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Attention aux formes des densités des χ2.

FIGURE: Densité de divers χ2.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 65: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Les trois types de test du χ2

Remarque

1 Contrairement aux autres tests, les tests du χ2 n’exigentpas de formuler l’hypothèse alternative H1, qui correspondà la négation de H0.

2 Les effectifs théoriques doivent être supérieurs à 5. Si cen’est pas le cas, il faut regrouper des classes.

3 Dans la statistique U = χ2(k − 1−m), on manipule deseffectifs et non des pourcentages.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 66: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Ex 1 : Adéquation à une loi

On observe le nombre X d’accidents journaliers sur unepériode de 50 jours dans une certaine ville. On obtient :

Nombre d’accidents Nombre de jours0 211 182 73 34 1

On constate que X = 0.9 et que var(X ) = 0,97. Peut onaffirmer que X suit une loi de Poisson au risque α = 0.05 ?

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 67: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Ex 1 : Adéquation à une loi

On observe le nombre X d’accidents journaliers sur unepériode de 50 jours dans une certaine ville. On obtient :

Nombre d’accidents Nombre de jours0 211 182 73 34 1

On constate que X = 0.9 et que var(X ) = 0,97. Peut onaffirmer que X suit une loi de Poisson au risque α = 0.05 ?

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 68: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Ex 1 : Adéquation à une loi

On observe le nombre X d’accidents journaliers sur unepériode de 50 jours dans une certaine ville. On obtient :

Nombre d’accidents Nombre de jours0 211 182 73 34 1

On constate que X = 0.9 et que var(X ) = 0,97. Peut onaffirmer que X suit une loi de Poisson au risque α = 0.05 ?

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 69: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

X = 0.9⇒ on prend 0.9 pour le paramètre de la loi de Poisson.Soit H0 : " X suit une loi de Poisson de paramètre 0.9".

on dresse donc le tableau suivant :

Nbr d’accidents Nbr de jours Nbr de jours théorique0 21 50× e−0.9 = 20.3301 18 50× e−0.9 × 0.9 = 18.295

au moins 2 11 50× (1− e−0.9(1 + 0.9)) = 11.376

On a regroupé les 3 dernières classes pour avoir un effectifthéorique supérieur à 5 dans la dernière classe.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 70: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

X = 0.9⇒ on prend 0.9 pour le paramètre de la loi de Poisson.Soit H0 : " X suit une loi de Poisson de paramètre 0.9".

on dresse donc le tableau suivant :

Nbr d’accidents Nbr de jours Nbr de jours théorique0 21 50× e−0.9 = 20.3301 18 50× e−0.9 × 0.9 = 18.295

au moins 2 11 50× (1− e−0.9(1 + 0.9)) = 11.376

On a regroupé les 3 dernières classes pour avoir un effectifthéorique supérieur à 5 dans la dernière classe.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 71: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

X = 0.9⇒ on prend 0.9 pour le paramètre de la loi de Poisson.Soit H0 : " X suit une loi de Poisson de paramètre 0.9".

on dresse donc le tableau suivant :

Nbr d’accidents Nbr de jours Nbr de jours théorique0 21 50× e−0.9 = 20.3301 18 50× e−0.9 × 0.9 = 18.295

au moins 2 11 50× (1− e−0.9(1 + 0.9)) = 11.376

On a regroupé les 3 dernières classes pour avoir un effectifthéorique supérieur à 5 dans la dernière classe.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 72: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

X = 0.9⇒ on prend 0.9 pour le paramètre de la loi de Poisson.Soit H0 : " X suit une loi de Poisson de paramètre 0.9".

on dresse donc le tableau suivant :

Nbr d’accidents Nbr de jours Nbr de jours théorique0 21 50× e−0.9 = 20.3301 18 50× e−0.9 × 0.9 = 18.295

au moins 2 11 50× (1− e−0.9(1 + 0.9)) = 11.376

On a regroupé les 3 dernières classes pour avoir un effectifthéorique supérieur à 5 dans la dernière classe.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 73: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Dans cet exemple, on a k = 3 classes et m = 1 paramètreestimé ( à savoir le paramètre λ = X = 0.9 de la loi dePoisson) nécessaire au calcul des effectifs théoriques.Donc k − 1−m= 1 est le nombre de d.d.l de U ;On calcule alors Rα = [tα; +∞[ à l’aide de la table χ2(1)

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 74: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Dans cet exemple, on a k = 3 classes et m = 1 paramètreestimé ( à savoir le paramètre λ = X = 0.9 de la loi dePoisson) nécessaire au calcul des effectifs théoriques.Donc k − 1−m= 1 est le nombre de d.d.l de U ;On calcule alors Rα = [tα; +∞[ à l’aide de la table χ2(1)

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 75: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Dans cet exemple, on a k = 3 classes et m = 1 paramètreestimé ( à savoir le paramètre λ = X = 0.9 de la loi dePoisson) nécessaire au calcul des effectifs théoriques.Donc k − 1−m= 1 est le nombre de d.d.l de U ;On calcule alors Rα = [tα; +∞[ à l’aide de la table χ2(1)

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 76: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Dans cet exemple, on a k = 3 classes et m = 1 paramètreestimé ( à savoir le paramètre λ = X = 0.9 de la loi dePoisson) nécessaire au calcul des effectifs théoriques.Donc k − 1−m= 1 est le nombre de d.d.l de U ;On calcule alors Rα = [tα; +∞[ à l’aide de la table χ2(1)

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 77: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Dans cet exemple, on a k = 3 classes et m = 1 paramètreestimé ( à savoir le paramètre λ = X = 0.9 de la loi dePoisson) nécessaire au calcul des effectifs théoriques.Donc k − 1−m= 1 est le nombre de d.d.l de U ;On calcule alors Rα = [tα; +∞[ à l’aide de la table χ2(1)

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 78: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Pour finir, on calcule

u = U(ω)

=(21− 20.33)2

20.33+

(18− 18.295)2

18.295+

(11− 11.376)2

11.376= 0.039 /∈ Rα.

Et donc, on ne rejette pas H0 au risque d’erreur 0.05.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 79: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Pour finir, on calcule

u = U(ω)

=(21− 20.33)2

20.33+

(18− 18.295)2

18.295+

(11− 11.376)2

11.376= 0.039 /∈ Rα.

Et donc, on ne rejette pas H0 au risque d’erreur 0.05.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 80: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Ex 2 : Indépendance

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 81: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Traduction du formalisme pour le test d’indépendance

Soient Y et Z deux v.a. :

Y : Ω→ 1, ..., r

Z : Ω→ 1, ..., s.

La loi de (Y ,Z ) est donnée par une matriceP = (pi,j)1≤i≤r , 1≤j≤s à coefficients positifs dont la sommevaut 1,

pi,j = P(Y = i , Z = j).

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 82: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Traduction du formalisme pour le test d’indépendance

Soient Y et Z deux v.a. :

Y : Ω→ 1, ..., r

Z : Ω→ 1, ..., s.

La loi de (Y ,Z ) est donnée par une matriceP = (pi,j)1≤i≤r , 1≤j≤s à coefficients positifs dont la sommevaut 1,

pi,j = P(Y = i , Z = j).

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 83: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Notons pour 1 ≤ i ≤ r et 1 ≤ j ≤ s,

pi. = P(Y = i) = pi,1 + pi,2 + ...+ pi,s

etp.j = P(Z = j) = p1,j + p2,j + ...+ pr ,j .

Les v.a. Y et Z sont indépendantes si et seulement si,pour tous i et j , on a :

pi,j = pi.p.j

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 84: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Notons pour 1 ≤ i ≤ r et 1 ≤ j ≤ s,

pi. = P(Y = i) = pi,1 + pi,2 + ...+ pi,s

etp.j = P(Z = j) = p1,j + p2,j + ...+ pr ,j .

Les v.a. Y et Z sont indépendantes si et seulement si,pour tous i et j , on a :

pi,j = pi.p.j

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 85: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Soient un échantillon (Y1,Z1), ..., (Yn,Zn) de ces v.a, on définitalors les v.a. suivantes :

Ni,j = cardl ∈ [1; n]; (Yl ,Zl) = (i , j),

nombre d’observations où (Y ,Z ) tombe sur (i , j).

Ni. = Ni,1 + ...+ Ni,s

nombre d’observations où Y vaut i .

N.j = N1,j + ...+ Nr ,j

nombre d’observations où Z vaut j .

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 86: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Soient un échantillon (Y1,Z1), ..., (Yn,Zn) de ces v.a, on définitalors les v.a. suivantes :

Ni,j = cardl ∈ [1; n]; (Yl ,Zl) = (i , j),

nombre d’observations où (Y ,Z ) tombe sur (i , j).

Ni. = Ni,1 + ...+ Ni,s

nombre d’observations où Y vaut i .

N.j = N1,j + ...+ Nr ,j

nombre d’observations où Z vaut j .

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 87: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Soient un échantillon (Y1,Z1), ..., (Yn,Zn) de ces v.a, on définitalors les v.a. suivantes :

Ni,j = cardl ∈ [1; n]; (Yl ,Zl) = (i , j),

nombre d’observations où (Y ,Z ) tombe sur (i , j).

Ni. = Ni,1 + ...+ Ni,s

nombre d’observations où Y vaut i .

N.j = N1,j + ...+ Nr ,j

nombre d’observations où Z vaut j .

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 88: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Soient un échantillon (Y1,Z1), ..., (Yn,Zn) de ces v.a, on définitalors les v.a. suivantes :

Ni,j = cardl ∈ [1; n]; (Yl ,Zl) = (i , j),

nombre d’observations où (Y ,Z ) tombe sur (i , j).

Ni. = Ni,1 + ...+ Ni,s

nombre d’observations où Y vaut i .

N.j = N1,j + ...+ Nr ,j

nombre d’observations où Z vaut j .

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 89: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Soient un échantillon (Y1,Z1), ..., (Yn,Zn) de ces v.a, on définitalors les v.a. suivantes :

Ni,j = cardl ∈ [1; n]; (Yl ,Zl) = (i , j),

nombre d’observations où (Y ,Z ) tombe sur (i , j).

Ni. = Ni,1 + ...+ Ni,s

nombre d’observations où Y vaut i .

N.j = N1,j + ...+ Nr ,j

nombre d’observations où Z vaut j .

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 90: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Soient un échantillon (Y1,Z1), ..., (Yn,Zn) de ces v.a, on définitalors les v.a. suivantes :

Ni,j = cardl ∈ [1; n]; (Yl ,Zl) = (i , j),

nombre d’observations où (Y ,Z ) tombe sur (i , j).

Ni. = Ni,1 + ...+ Ni,s

nombre d’observations où Y vaut i .

N.j = N1,j + ...+ Nr ,j

nombre d’observations où Z vaut j .

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 91: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Alors,

Pobs(i , j) =Ni,j

net sous l’hypothèse d’independance

Ptheo(i , j) =Ni.

nN.j

n

Ainsi, dans ce cas, on a :

nDχ2(Ptheo,Pobs) =∑

i=1..r

∑j=1..s

(Ni,j −Ni.N.j

n )2

Ni.N.jn

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 92: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Alors,

Pobs(i , j) =Ni,j

net sous l’hypothèse d’independance

Ptheo(i , j) =Ni.

nN.j

n

Ainsi, dans ce cas, on a :

nDχ2(Ptheo,Pobs) =∑

i=1..r

∑j=1..s

(Ni,j −Ni.N.j

n )2

Ni.N.jn

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 93: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Alors,

Pobs(i , j) =Ni,j

net sous l’hypothèse d’independance

Ptheo(i , j) =Ni.

nN.j

n

Ainsi, dans ce cas, on a :

nDχ2(Ptheo,Pobs) =∑

i=1..r

∑j=1..s

(Ni,j −Ni.N.j

n )2

Ni.N.jn

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 94: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Proposition

Soit Un =∑

i=1..r∑

j=1..s(Ni,j−

Ni.N.jn )2

Ni.N.jn

, alors

Un

→ χ2((r − 1)(s − 1)) en loi si Y et Z indépendantes,→ +∞ p.s sinon.

quand n tend vers l’infini.

RemarqueAvec les notations du fait 1, on a içi : k = rs etm = r − 1 + s − 1 (puisque la donnée des r − 1 premierscoefficients de la loi de Y donne le dernier et idem pour Z etque la donnée des lois marginales (sous hyp d’indépendance),détermine la loi du couple). Ainsi, k −m − 1 = (r − 1)(s − 1).

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 95: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Proposition

Soit Un =∑

i=1..r∑

j=1..s(Ni,j−

Ni.N.jn )2

Ni.N.jn

, alors

Un

→ χ2((r − 1)(s − 1)) en loi si Y et Z indépendantes,→ +∞ p.s sinon.

quand n tend vers l’infini.

RemarqueAvec les notations du fait 1, on a içi : k = rs etm = r − 1 + s − 1 (puisque la donnée des r − 1 premierscoefficients de la loi de Y donne le dernier et idem pour Z etque la donnée des lois marginales (sous hyp d’indépendance),détermine la loi du couple). Ainsi, k −m − 1 = (r − 1)(s − 1).

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 96: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Proposition

Soit Un =∑

i=1..r∑

j=1..s(Ni,j−

Ni.N.jn )2

Ni.N.jn

, alors

Un

→ χ2((r − 1)(s − 1)) en loi si Y et Z indépendantes,→ +∞ p.s sinon.

quand n tend vers l’infini.

RemarqueAvec les notations du fait 1, on a içi : k = rs etm = r − 1 + s − 1 (puisque la donnée des r − 1 premierscoefficients de la loi de Y donne le dernier et idem pour Z etque la donnée des lois marginales (sous hyp d’indépendance),détermine la loi du couple). Ainsi, k −m − 1 = (r − 1)(s − 1).

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 97: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Exemple concret : Yeux et Cheveux...

Depuis la terrasse d’un café ensoleillée, un statisticien en pleintravail a noté les couleurs des yeux et des cheveux de 124passants.

XXXXXXXXXXXYeuxCheveux

blonds brun roux noir

bleus 25 9 7 3gris 13 17 7 10marrons 7 13 5 8

Les deux critéres sont ils indépendants au niveau 5% ?

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 98: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Exemple concret : Yeux et Cheveux...

Depuis la terrasse d’un café ensoleillée, un statisticien en pleintravail a noté les couleurs des yeux et des cheveux de 124passants.

XXXXXXXXXXXYeuxCheveux

blonds brun roux noir

bleus 25 9 7 3gris 13 17 7 10marrons 7 13 5 8

Les deux critéres sont ils indépendants au niveau 5% ?

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 99: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Exemple concret : Yeux et Cheveux...

Soient les 2 v.a.

Y : Ω→ bleu,gris,noirZ : Ω→ blond ,brun, roux ,noir.

on notera i = 1 [resp. 2,3] pour bleu [resp. gris, noir], et j = a[resp. b, c,d ] pour blond [resp. brun, roux,noir]. On calcule lesNi. et N.j . On a :

N1. = nbr total de personnes ayant les yeux bleus =25 + 9 + 7 + 3 = 44, puis N2. = 47, N3. = 33N.a = nbr total de personnes ayant les cheveux blonds =45, N.b = 39, N.c = 19, N.d = 21.Enfin, on vérifie que l’effectif total n vaut bien 124 avec parexemple

∑i Ni. = 124.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 100: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Exemple concret : Yeux et Cheveux...

Soient les 2 v.a.

Y : Ω→ bleu,gris,noirZ : Ω→ blond ,brun, roux ,noir.

on notera i = 1 [resp. 2,3] pour bleu [resp. gris, noir], et j = a[resp. b, c,d ] pour blond [resp. brun, roux,noir]. On calcule lesNi. et N.j . On a :

N1. = nbr total de personnes ayant les yeux bleus =25 + 9 + 7 + 3 = 44, puis N2. = 47, N3. = 33N.a = nbr total de personnes ayant les cheveux blonds =45, N.b = 39, N.c = 19, N.d = 21.Enfin, on vérifie que l’effectif total n vaut bien 124 avec parexemple

∑i Ni. = 124.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 101: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Exemple concret : Yeux et Cheveux...

Soient les 2 v.a.

Y : Ω→ bleu,gris,noirZ : Ω→ blond ,brun, roux ,noir.

on notera i = 1 [resp. 2,3] pour bleu [resp. gris, noir], et j = a[resp. b, c,d ] pour blond [resp. brun, roux,noir]. On calcule lesNi. et N.j . On a :

N1. = nbr total de personnes ayant les yeux bleus =25 + 9 + 7 + 3 = 44, puis N2. = 47, N3. = 33N.a = nbr total de personnes ayant les cheveux blonds =45, N.b = 39, N.c = 19, N.d = 21.Enfin, on vérifie que l’effectif total n vaut bien 124 avec parexemple

∑i Ni. = 124.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 102: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Exemple concret : Yeux et Cheveux...

Soient les 2 v.a.

Y : Ω→ bleu,gris,noirZ : Ω→ blond ,brun, roux ,noir.

on notera i = 1 [resp. 2,3] pour bleu [resp. gris, noir], et j = a[resp. b, c,d ] pour blond [resp. brun, roux,noir]. On calcule lesNi. et N.j . On a :

N1. = nbr total de personnes ayant les yeux bleus =25 + 9 + 7 + 3 = 44, puis N2. = 47, N3. = 33N.a = nbr total de personnes ayant les cheveux blonds =45, N.b = 39, N.c = 19, N.d = 21.Enfin, on vérifie que l’effectif total n vaut bien 124 avec parexemple

∑i Ni. = 124.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 103: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Exemple concret : Yeux et Cheveux...

Soient les 2 v.a.

Y : Ω→ bleu,gris,noirZ : Ω→ blond ,brun, roux ,noir.

on notera i = 1 [resp. 2,3] pour bleu [resp. gris, noir], et j = a[resp. b, c,d ] pour blond [resp. brun, roux,noir]. On calcule lesNi. et N.j . On a :

N1. = nbr total de personnes ayant les yeux bleus =25 + 9 + 7 + 3 = 44, puis N2. = 47, N3. = 33N.a = nbr total de personnes ayant les cheveux blonds =45, N.b = 39, N.c = 19, N.d = 21.Enfin, on vérifie que l’effectif total n vaut bien 124 avec parexemple

∑i Ni. = 124.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 104: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Exemple concret : Yeux et Cheveux...

Soient les 2 v.a.

Y : Ω→ bleu,gris,noirZ : Ω→ blond ,brun, roux ,noir.

on notera i = 1 [resp. 2,3] pour bleu [resp. gris, noir], et j = a[resp. b, c,d ] pour blond [resp. brun, roux,noir]. On calcule lesNi. et N.j . On a :

N1. = nbr total de personnes ayant les yeux bleus =25 + 9 + 7 + 3 = 44, puis N2. = 47, N3. = 33N.a = nbr total de personnes ayant les cheveux blonds =45, N.b = 39, N.c = 19, N.d = 21.Enfin, on vérifie que l’effectif total n vaut bien 124 avec parexemple

∑i Ni. = 124.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 105: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Exemple concret : Yeux et Cheveux...

On peut alors construire le tableau des effectifs théoriquesNi.N.j/n.

XXXXXXXXXXXYeuxCheveux

blonds brun roux noir

bleus 44× 45/124 ' 15,97 13,84 6,74 7,45gris 17,05 14,78 7,2 7,96marrons 11,98 10,38 5,06 5,59

FIGURE: Tableau des effectifs théoriques

On calcule alors la statistique Un.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 106: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Exemple concret : Yeux et Cheveux...

On peut alors construire le tableau des effectifs théoriquesNi.N.j/n.

XXXXXXXXXXXYeuxCheveux

blonds brun roux noir

bleus 44× 45/124 ' 15,97 13,84 6,74 7,45gris 17,05 14,78 7,2 7,96marrons 11,98 10,38 5,06 5,59

FIGURE: Tableau des effectifs théoriques

On calcule alors la statistique Un.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 107: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Exemple concret : Yeux et Cheveux...

On peut alors construire le tableau des effectifs théoriquesNi.N.j/n.

XXXXXXXXXXXYeuxCheveux

blonds brun roux noir

bleus 44× 45/124 ' 15,97 13,84 6,74 7,45gris 17,05 14,78 7,2 7,96marrons 11,98 10,38 5,06 5,59

FIGURE: Tableau des effectifs théoriques

On calcule alors la statistique Un.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 108: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Exemple concret : Yeux et Cheveux...

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 109: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Exemple concret : Yeux et Cheveux...

Et donc on rejette l’hypothèse d’indépendance de la couleurdes yeux et de la couleur des cheveux.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 110: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Exemple concret : Yeux et Cheveux...

Et donc on rejette l’hypothèse d’indépendance de la couleurdes yeux et de la couleur des cheveux.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 111: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Ex 3 : Homogénéité

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 112: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Traduction du formalisme pour le test d’homogénéité

Les test du χ2 permettent aussi de tester l’homogénéité deplusieurs échantillons.

On étudie un caractère pouvant prendre k valeursA1,A2, ...,Ak (ou k modalités, ou à valeurs dans k classes).On dispose de l échantillons E1,E2, ...,El différents.Pour tout i ∈ 1, ..., k, on connaît l’effectif observé Oi,j dela valeur Ai dans l’échantillon Ej .

Oi,j = nb de fois où l’on "tombe" dans Ai parmi l’échantillon Ej .

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 113: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Traduction du formalisme pour le test d’homogénéité

Les test du χ2 permettent aussi de tester l’homogénéité deplusieurs échantillons.

On étudie un caractère pouvant prendre k valeursA1,A2, ...,Ak (ou k modalités, ou à valeurs dans k classes).On dispose de l échantillons E1,E2, ...,El différents.Pour tout i ∈ 1, ..., k, on connaît l’effectif observé Oi,j dela valeur Ai dans l’échantillon Ej .

Oi,j = nb de fois où l’on "tombe" dans Ai parmi l’échantillon Ej .

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 114: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Traduction du formalisme pour le test d’homogénéité

Les test du χ2 permettent aussi de tester l’homogénéité deplusieurs échantillons.

On étudie un caractère pouvant prendre k valeursA1,A2, ...,Ak (ou k modalités, ou à valeurs dans k classes).On dispose de l échantillons E1,E2, ...,El différents.Pour tout i ∈ 1, ..., k, on connaît l’effectif observé Oi,j dela valeur Ai dans l’échantillon Ej .

Oi,j = nb de fois où l’on "tombe" dans Ai parmi l’échantillon Ej .

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 115: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Traduction du formalisme pour le test d’homogénéité

Les test du χ2 permettent aussi de tester l’homogénéité deplusieurs échantillons.

On étudie un caractère pouvant prendre k valeursA1,A2, ...,Ak (ou k modalités, ou à valeurs dans k classes).On dispose de l échantillons E1,E2, ...,El différents.Pour tout i ∈ 1, ..., k, on connaît l’effectif observé Oi,j dela valeur Ai dans l’échantillon Ej .

Oi,j = nb de fois où l’on "tombe" dans Ai parmi l’échantillon Ej .

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 116: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Traduction du formalisme pour le test d’homogénéité

On souhaite tester :

"H0 : les échantillons sont issus de la même loi "contre

"H1 : les échantillons n’ont pas même loi."

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 117: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Traduction du formalisme pour le test d’homogénéité

On définit :

Oi. = Oi,1 + ...+ Oi,l

Oi. représente l’effectif observé de la valeur Ai parmi laréunion de tous les échantillons.

O.j = O1,j + ...+ Ok ,j

Oj. représente l’effectif de l’échantillon j .L’effectif total est :

n =∑

i=1..k

∑j=1..l

Oi,j =∑

i=1..k

Oi. =∑

j=1..l

O.j

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 118: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Traduction du formalisme pour le test d’homogénéité

On définit :

Oi. = Oi,1 + ...+ Oi,l

Oi. représente l’effectif observé de la valeur Ai parmi laréunion de tous les échantillons.

O.j = O1,j + ...+ Ok ,j

Oj. représente l’effectif de l’échantillon j .L’effectif total est :

n =∑

i=1..k

∑j=1..l

Oi,j =∑

i=1..k

Oi. =∑

j=1..l

O.j

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 119: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Traduction du formalisme pour le test d’homogénéité

On définit :

Oi. = Oi,1 + ...+ Oi,l

Oi. représente l’effectif observé de la valeur Ai parmi laréunion de tous les échantillons.

O.j = O1,j + ...+ Ok ,j

Oj. représente l’effectif de l’échantillon j .L’effectif total est :

n =∑

i=1..k

∑j=1..l

Oi,j =∑

i=1..k

Oi. =∑

j=1..l

O.j

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 120: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Traduction du formalisme pour le test d’homogénéité

On définit :

Oi. = Oi,1 + ...+ Oi,l

Oi. représente l’effectif observé de la valeur Ai parmi laréunion de tous les échantillons.

O.j = O1,j + ...+ Ok ,j

Oj. représente l’effectif de l’échantillon j .L’effectif total est :

n =∑

i=1..k

∑j=1..l

Oi,j =∑

i=1..k

Oi. =∑

j=1..l

O.j

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 121: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Traduction du formalisme pour le test d’homogénéité

On a la propriété :

Proposition

Soit Un =∑

i=1..k∑

j=1..l(Oi,j−

Oi.O.jn )2

Oi.O.jn

alors,

Un

→ χ2((k − 1)(l − 1)) en loi si H0 vraie→ +∞ p.s sinon

quand n tend vers l’infini.

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 122: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Exemple concret : Y a t il un nouvel Omo ?

On cherche à invalider la reflexion suivante qui affirme quetoute les lessives se valent. On utilise trois lessives appelées A,B et C. Une fois que la machine à laver a effectué sonprogramme, on classe à la sortie du lavage les vetements entrois catégories : très sale (TS), légérement sale (LS) et propre(P). On obtient le tableau suivant :

XXXXXXXXXXXLessiveLinge

TS LS P

A 30 65 205B 23 56 121C 75 125 300

Peut on dire au niveau 5% que toutes les lessives sontidentiques ?

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 123: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Exemple concret : Y a t il un nouvel Omo ?

On cherche à invalider la reflexion suivante qui affirme quetoute les lessives se valent. On utilise trois lessives appelées A,B et C. Une fois que la machine à laver a effectué sonprogramme, on classe à la sortie du lavage les vetements entrois catégories : très sale (TS), légérement sale (LS) et propre(P). On obtient le tableau suivant :

XXXXXXXXXXXLessiveLinge

TS LS P

A 30 65 205B 23 56 121C 75 125 300

Peut on dire au niveau 5% que toutes les lessives sontidentiques ?

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 124: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Exemple concret : Y a t il un nouvel Omo ?

On cherche à invalider la reflexion suivante qui affirme quetoute les lessives se valent. On utilise trois lessives appelées A,B et C. Une fois que la machine à laver a effectué sonprogramme, on classe à la sortie du lavage les vetements entrois catégories : très sale (TS), légérement sale (LS) et propre(P). On obtient le tableau suivant :

XXXXXXXXXXXLessiveLinge

TS LS P

A 30 65 205B 23 56 121C 75 125 300

Peut on dire au niveau 5% que toutes les lessives sontidentiques ?

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2

Page 125: Cours 4: Une introduction aux tests statistiques, le test du 2

Introduction sur les tests statistiquesLe test du χ2

Point de départPrincipe du testLes trois types de test du χ2

Trois exemples

Exemple concret : Y a t il un nouvel Omo ?

On cherche à invalider la reflexion suivante qui affirme quetoute les lessives se valent. On utilise trois lessives appelées A,B et C. Une fois que la machine à laver a effectué sonprogramme, on classe à la sortie du lavage les vetements entrois catégories : très sale (TS), légérement sale (LS) et propre(P). On obtient le tableau suivant :

XXXXXXXXXXXLessiveLinge

TS LS P

A 30 65 205B 23 56 121C 75 125 300

Peut on dire au niveau 5% que toutes les lessives sontidentiques ?

Clément Rau Cours 4: Une introduction aux tests statistiques, le test du χ2