Upload
serge-armand
View
103
Download
0
Embed Size (px)
Citation preview
11
ProblèmeProblème1. Garçons ou filles : qui réussi le mieux au bac ?
2. Cigarette et cancer : y a t il un lien ?
3. Prévention routière : moins d’accident chez les verbalisés ?
Autre formulation :
1. Y a t il un lien entre sexe et réussite au bac ?
2. Y a t il un lien entre cancer et cigarette ?
3. Y a t il un lien entre accident et verbalisation ?
22
MesuresMesures
EffectifAdmis Garçon 10Admis Fille 42Refusé Garçon 5Refusé Fille 18
Garçons FillesRefusés 5 18Admis 10 42
Résultat SexeIsabelle Ref FSylvain Adm GLucie Adm Fjean Ref GZoé Adm F… … …
Données brutes
Tableau des effectifs
Tableau croisé
33
Théorie…Théorie…• Définition : Hypothèse nulle (=H0) : il n’y a pas de lien entre
la variable sexe et la variable résultat.
• Si H0 est vrai : le pourcentage des Admis est le même chez les garçons que chez les filles
Garçons FillesRefusés 10 10Admis 10 10
Garçons FillesRefusés 10 20Admis 10 20
Garçons FillesRefusés 10 20Admis 20 40
Garçons FillesRefusés 50% 50%Admis 50% 50%
Garçons FillesRefusés 50% 50%Admis 50% 50%
Garçons FillesRefusés 33% 33%Admis 67% 67%
44
… et pratique… et pratique
Garçons FillesRefusés 5 18Admis 10 42
Garçons FillesRefusés 33% 30%Admis 67% 70%
Garçons FillesRefusés 25% 20%Admis 75% 80%
Garçons FillesRefusés 34% 35%Admis 66% 65%
On mesure : Dans d’autres lycées :
Garçons FillesRefusés 70% 65%Admis 30% 35%
55
ProblèmeProblème• Une différence significative cache probablement une cause
• Quand peut-on considérer qu’une différence est significative ? Quand est-elle du au hasard ?
Garçons FillesRefusés 34% 35%Admis 66% 65%
Garçons FillesRefusés 34% 39%Admis 66% 61%
Garçons FillesRefusés 34% 50%Admis 66% 50%
66
SolutionSolution• Test du 2 (prononcez khi2) permet de trancher :
• Le 2 est un indice que l’on calcule à partir d’un tableau croisé.
• Quand on l’a trouvé, il permet de décider si oui ou non les variations du tableau soit du au hasard :
Garçons FillesRefusés 5 18Admis 10 42
2=0,062
2=0,062 IncertitudeOn ne sait pas si la différence est due au hasard des mesures ou a un lien entre les deux variables
2=8,68
2=8,68 Pas de hasardOn en est sûr, une telle différence ne peut pas être due au hasard : il y a un lien entre les deux variables.
Fumeur Non fumeurCancer 10 5
Non cancer 65 154
77
Calcul du 2 Calcul du 2 On utilise des tableaux :
• Effectifs observés (tableau croisé)
• Effectifs théoriques
• Ecarts bruts
• Ecarts au carré et pondérés
• Formule du 2
• Lecture de la table
88
1 : Effectifs observés1 : Effectifs observés
Garçons Filles TotalRefusés 5 18 23Admis 10 42 52Total 15 60 75
99
2 : Effectifs théoriques2 : Effectifs théoriques
Résultats
Pour chaque case : effectif théorique = total colonne x total ligne
total généralGarçons Filles Total
Refusés 23Admis 52Total 15 60 75
Garçons Filles TotalRefusés 15x23/75 6x23/75 23Admis 15x52/75 60x52/75 52Total 15 60 75
Garçons Filles TotalRefusés 4,6 18,4 23Admis 10,4 41,6 52Total 15 60 75
Totaux
Calcul par case
1010
3 : Ecarts bruts3 : Ecarts bruts• Pour chaque case : écarts bruts = effectif théorique - observé
–
=Effectifs théoriques Effectifs observés
Tableau des écarts bruts
Garçons FillesRefusés 4,6 18,4Admis 10,4 41,6
Garçons FillesRefusés 5 18Admis 10 42
Garçons FillesRefusés -0,4 0,4Admis 0,4 -0,4
1111
4 : Ecarts au carré et pondérés4 : Ecarts au carré et pondérés
• Pour chaque case : Ecart au carré pondéré =
Garçons Filles
Refusés (-0,4)2/4,6 (0,4)2/18,4
Admis (-0,4)2/10,4 (-0,4)2/41,6
(ecart brut)2
effectif théorique
Garçons FillesRefusés 0,035 0,009Admis 0,015 0,004
1212
5 : Formule du 25 : Formule du 2
• Le 2 est la somme des écarts au carré pondérés
2 =(ecart brut)2
effectif théorique
2 =0,035+0,015+0,009+0,004=0,63
Garçons FillesRefusés 0,035 0,009Admis 0,015 0,004
1313
2 en bref2 en bref
2 =(effectif théorique – effectif observé)2
effectif théorique
1414
GénéralisationGénéralisation• Y a t il un lien entre couleur des yeux et des cheveux ?
1 : Effectifs observés
CheveuxBlond Bruns Noir Roux Total
Bleus 25 9 3 7 44
Yeux Vert 13 17 10 7 47
Marron 7 13 8 5 33Total 45 39 21 19 124
1515
2 : Effectifs théoriques2 : Effectifs théoriques
CheveuxBlond Bruns Noir Roux Total
Bleus 44
Yeux Vert 47
Marron 33Total 45 39 21 19 124
CheveuxBlond Bruns Noir Roux Total
Bleus 16,0 13,8 7,5 6,7 44
Yeux Vert 17,1 14,8 8,0 7,2 47
Marron 12,0 10,4 5,6 5,1 33
Total 45 39 21 19 124
Pour chaque case : effectif théorique = total colonne x total ligne
total général
1616
3 : Ecarts bruts3 : Ecarts bruts• Pour chaque case : écarts bruts = effectif théorique - observé
–
=Effectifs théoriques Effectifs observés
Tableau des écarts bruts
Blond Bruns Noir RouxBleus 25 9 3 7
Vert 13 17 10 7
Marron 7 13 8 5
Blond Bruns Noir RouxBleus 16,0 13,8 7,5 6,7
Vert 17,1 14,8 8,0 7,2
Marron 12,0 10,4 5,6 5,1
Blond Bruns Noir RouxBleus -9,0 4,8 4,5 -0,3Vert 4,1 -2,2 -2,0 0,2
Marron 5,0 -2,6 -2,4 0,1
1717
4 : Ecarts au carré et pondérés4 : Ecarts au carré et pondérés
• Pour chaque case : Ecart au carré pondéré = (ecart brut)2
effectif théorique
Blond Bruns Noir Roux
Bleus (-9,0)2/16,0 (4,8)2/13,8 (4,5)2/7,5 (-0,3)2/6,7
Vert (4,1)2/17,1 (-2,2)2/14,8 (-2,0)2/8,0 (0,2)2/7,2
Marron (5,0)2/12,0 (-2,6)2/10,4 (-2,4)2/5,6 (0,1)2/5,1
Blond Bruns Noir RouxBleus 5,11 1,69 2,66 0,01Vert 0,96 0,33 0,52 0,01
Marron 2,07 0,66 1,04 0,00
1818
5 : 25 : 2
2 =(ecart brut)2
effectif théorique
2 =5,11+0,96+2,07+1,69+0,33+0,66+2,66+0,52+1,04+0,01+0,00+0,00=15,05
Blond Bruns Noir RouxBleus 5,11 1,69 2,66 0,01Vert 0,96 0,33 0,52 0,01
Marron 2,07 0,66 1,04 0,00
1919
6 : DDL6 : DDL• DDL=Degré de liberté
DDL=(Nombre de colonnes-1)x(Nombre de lignes-1)
DDL = (2-1)x(2-1) = 1 DDL=(4-1)x(3-1)=6
Blond Bruns Noir RouxBleus 16,0 13,8 7,5 6,7
Vert 17,1 14,8 8,0 7,2
Marron 12,0 10,4 5,6 5,1
Garçons FillesRefusés 5 18Admis 10 42
2020
Lecture de la tableLecture de la table
2=0,63 avec DDL=1 : il y a entre 50% et 10% de chances que les différences observées entre garçons et filles soient dues au hasard. C’est trop faible :
On ne peut pas conclure
Pourcentage50% 10% 5% 1%
1 0,455 2,706 3,841 6,635
2 1,386 4,605 5,991 9,21
DDL 3 2,366 6,251 7,815 11,3454 3,357 7,779 9,488 13,2775 4,351 9,236 11,07 15,0866 … … … …
Garçons FillesRefusés 5 18Admis 10 42
2121
TableTable
2=15,05 avec DDL=6 : il y a entre 5% et 1% de chances que les différences observées entre fumeurs et non fumeurs soient dues au hasard. C’est suffisant :
On peut conclure :
Il y a un lien entre les variables Cancer et Fumeur
Pourcentage50% 10% 5% 1%
1 0,455 2,706 3,841 6,635
2 1,386 4,605 5,991 9,21
DDL 3 2,366 6,251 7,815 11,3454 3,357 7,779 9,488 13,2775 4,351 9,236 11,07 15,0866 … … … …
Blond Bruns Noir RouxBleus 16,0 13,8 7,5 6,7
Vert 17,1 14,8 8,0 7,2
Marron 12,0 10,4 5,6 5,1