On a deux variables quantitatives. On cherche sil y a un lien entre les 2 variables

Preview:

Citation preview

On a deux variables quantitatives.

On cherche s’il y a un lien entre les 2 variables

1. Garçons ou filles : qui réussi le mieux au bac ?

2. Cigarette et cancer : y a t il un lien ?3. Prévention routière : moins d’accident chez

les verbalisés ?

Autre formulation :

1. Y a t il un lien entre sexe et réussite au bac ?2. Y a t il un lien entre cancer et cigarette ?3. Y a t il un lien entre accident et

verbalisation ?

H0 : il n’y a pas de lien entre la variable sexe et la variable résultat.

EffectifAdmis Garçon 10Admis Fille 42Refusé Garçon 5Refusé Fille 18

Garçons FillesRefusés 5 18Admis 10 42

Résultat SexeIsabelle Ref FSylvain Adm GLucie Adm Fjean Ref GZoé Adm F… … …

Données brutesTableau des effectifs

Tableau croisé

Garçons FillesRefusés 5 18Admis 10 42

Garçons FillesRefusés 50 10Admis 50 70

Garçons FillesRefusés 30 15Admis 30 15

Dans notre lycée :

Pas de différenceH0 n’est pas rejetable

Différence énorme On rejette H0

Variabilité biologique ?Différence significative ?

On veut un indice qui reflète les disparités de notre tableau.

On veut qu’il soit grand pour

et petit pour :

Garçons FillesRefusés 50 10Admis 50 70

Garçons FillesRefusés 30 15Admis 30 15

Pour le calculer :1. Tableau des effectifs observés (tableau

croisé) 2. Tableau des effectifs attendus3. Tableau des écarts4. Tableau des écarts au carré et pondérés5. 2

Garçons Filles TotalRefusés 5 18 23Admis 10 42 52Total 15 60 75

Résultats

Pour chaque case : effectif attendu = total colonne x total ligne

total généralGarçons Filles Total

Refusés 23Admis 52Total 15 60 75

Garçons Filles TotalRefusés 15x23/75 6x23/75 23Admis 15x52/75 60x52/75 52Total 15 60 75

Garçons Filles TotalRefusés 4,6 18,4 23Admis 10,4 41,6 52Total 15 60 75

Totaux

Calcul par case

Pour chaque case : écart brut = effectifs observés – effectifs

attendus

=

Effectifs attendusEffectifs observés

Tableau des écarts bruts

Garçons FillesRefusés 4,6 18,4Admis 10,4 41,6

Garçons FillesRefusés 5 18Admis 10 42

Garçons FillesRefusés 0,4 -0,4Admis -0,4 0,4

Pour chaque case : Écart au carré pondéré =

Garçons Filles

Refusés (0,4)2/4,6 (-0,4)2/18,4

Admis (-0,4)2/10,4 (0,4)2/41,6

(écart brut)2

effectif attendu

Garçons FillesRefusés 0,035 0,009Admis 0,015 0,004

Le 2 est la somme des écarts au carré pondérés

2 = (Écart au carré pondéré)

2 =0,035+0,015+0,009+0,004=0,63

Garçons FillesRefusés 0,035 0,009Admis 0,015 0,004

Y a t il un lien entre couleur des yeux et des cheveux ?

H0 : il n’y a pas de lien entre la couleur des yeux et celle des cheveux

CheveuxBlond Bruns Noir Roux Total

Bleus 25 9 3 7 44

Yeux Vert 13 17 10 7 47

Marron 7 13 8 5 33Total 45 39 21 19 124

CheveuxBlond Bruns Noir Roux Total

Bleus 44

Yeux Vert 47

Marron 33Total 45 39 21 19 124

CheveuxBlond Bruns Noir Roux Total

Bleus 16,0 13,8 7,5 6,7 44

Yeux Vert 17,1 14,8 8,0 7,2 47

Marron 12,0 10,4 5,6 5,1 33

Total 45 39 21 19 124

Pour chaque case : effectif attendus = total colonne x total ligne

total général

Pour chaque case : écart brut = effectif observé – effectif

attendu

=

Effectifs attendusEffectifs observés

Tableau des écarts bruts

Blond Bruns Noir RouxBleus 25 9 3 7

Vert 13 17 10 7

Marron 7 13 8 5

Blond Bruns Noir RouxBleus 16,0 13,8 7,5 6,7

Vert 17,1 14,8 8,0 7,2

Marron 12,0 10,4 5,6 5,1

Blond Bruns Noir RouxBleus 9,0 -4,8 -4,5 0,3Vert -4,1 2,2 2,0 -0,2

Marron -5,0 2,6 2,4 -0,1

Pour chaque case : Ecart au carré pondéré = (écart brut)2

effectif attendu

Blond Bruns Noir Roux

Bleus (9,0)2/16,0 (-4,8)2/13,8 (-4,5)2/7,5 (0,3)2/6,7

Vert (-4,1)2/17,1 (2,2)2/14,8 (2,0)2/8,0 (-0,2)2/7,2

Marron (-5,0)2/12,0 (2,6)2/10,4 (2,4)2/5,6 (-0,1)2/5,1

Blond Bruns Noir RouxBleus 5,11 1,69 2,66 0,01Vert 0,96 0,33 0,52 0,01

Marron 2,07 0,66 1,04 0,00

2 = (écart au carré pondéré)

2 = 5,11+1,69+2,66+0,01+

0,96+0,33+0,52+0,01+

2,07+0,66+1,04+0,00 = 15,05

Blond Bruns Noir RouxBleus 5,11 1,69 2,66 0,01Vert 0,96 0,33 0,52 0,01

Marron 2,07 0,66 1,04 0,00

2Obs

=(effectifs observés – effectifs théoriques)2

effectif théorique

Quand un 2 est-il grand ?

A B C D ETrès grand 0,3 0,2 0,3 0,2 0,1Grand 0,2 0,1 0,1 0,1 0,3Moyen 0,3 0,3 0,2 0,3 0,1Petit 0,1 0,3 0,1 0,2 0,3Très petit 0,2 0,2 0,3 0,3 0,2

Homme FemmeAdmis 0,2 0,1Refusé 0,1 2,2

2=2,6 2=5,3

DDL=Degrés de liberté

DDL=(Nombre de colonnes-1)x(Nombre de lignes-1)

DDL = (2-1)x(2-1) = 1 DDL=(4-1)x(3-1) = 6 Blond Bruns Noir Roux

Bleus 16,0 13,8 7,5 6,7

Vert 17,1 14,8 8,0 7,2

Marron 12,0 10,4 5,6 5,1

Garçons FillesRefusés 5 18Admis 10 42

R : chisq.test(effectifs Observés)

χ2 1 2 3 4 5 6 7 8 9 10 11 12 130,00 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00%

0,50 47,95% 77,88% 91,89% 97,35% 99,21% 99,78% 99,94% 99,99% 100,00% 100,00% 100,00% 100,00% 100,00%

1,00 31,73% 60,65% 80,13% 90,98% 96,26% 98,56% 99,48% 99,82% 99,94% 99,98% 99,99% 100,00% 100,00%

1,50 22,07% 47,24% 68,23% 82,66% 91,31% 95,95% 98,23% 99,27% 99,71% 99,89% 99,96% 99,99% 100,00%

2,00 15,73% 36,79% 57,24% 73,58% 84,91% 91,97% 95,98% 98,10% 99,15% 99,63% 99,85% 99,94% 99,98%

2,50 11,38% 28,65% 47,53% 64,46% 77,65% 86,85% 92,71% 96,17% 98,09% 99,09% 99,58% 99,82% 99,92%

3,00 8,33% 22,31% 39,16% 55,78% 70,00% 80,88% 88,50% 93,44% 96,43% 98,14% 99,07% 99,55% 99,79%

3,50 6,14% 17,38% 32,08% 47,79% 62,34% 74,40% 83,52% 89,92% 94,11% 96,71% 98,23% 99,09% 99,54%

4,00 4,55% 13,53% 26,15% 40,60% 54,94% 67,67% 77,98% 85,71% 91,14% 94,73% 96,99% 98,34% 99,12%

4,50 3,39% 10,54% 21,23% 34,25% 47,99% 60,93% 72,07% 80,94% 87,55% 92,20% 95,29% 97,26% 98,46%

5,00 2,53% 8,21% 17,18% 28,73% 41,59% 54,38% 66,00% 75,76% 83,43% 89,12% 93,12% 95,80% 97,52%

5,50 1,90% 6,39% 13,86% 23,97% 35,79% 48,15% 59,92% 70,30% 78,87% 85,54% 90,46% 93,92% 96,25%

Probabilité qu'il n'y ait pas de lien entre les deux variables

DDL

χ2

2=2,6DDL=1p=0,11

2=5,3DDL=6p=0,51

Sexe / Réussite :

2Obs=0,63 et DDL=1

P=0.11

On ne peut pas rejeter H0,

Il n’y a pas de lien entre Sexe et Réussite

C. Cheveux / C. Yeux :

2Obs=15,05 et DDL=6

P=0,0167

On peut rejeter H0,

Il y a un lien entre C. Cheveux et C. Yeux

>5%

<5%

Écarts au carré pondérés

Parce que Blond / Bleus = 5,11 et que Noir / Bleus = 2,66 Ces deux cases « apportent » beaucoup au 2

Blond Bruns Noir RouxBleus 5,11 1,69 2,66 0,01Vert 0,96 0,33 0,52 0,01

Marron 2,07 0,66 1,04 0,00

Cases qui apportent beaucoup : Sur le tableau des écarts au carré pondéré

Apport positif ou négatifs ? Sur le tableau des écarts, Blonds / Bleus = + 9 : il y en a

beaucoup.

On dit qu’ils sont

sur-représentés

Sur le tableau des écarts, Noirs / Bleus = - 4,5 : il en manque beaucoup.

On dit qu’ils sont

sous-représentés

Blond Bruns Noir RouxBleus 9,0 -4,8 -4,5 0,3Vert -4,1 2,2 2,0 -0,2

Marron -5,0 2,6 2,4 -0,1

Blond Bruns Noir RouxBleus 5,11 1,69 2,66 0,01Vert 0,96 0,33 0,52 0,01

Marron 2,07 0,66 1,04 0,00

Écarts au carré pondérés Écarts

Recommended