28
http://christophe.genolini.free.frLicence Stat-info CM3b : 1 Les groupes

Http://christophe.genolini.free.frLicence Stat-infoCM3b : 1 Les groupes

Embed Size (px)

Citation preview

Page 1: Http://christophe.genolini.free.frLicence Stat-infoCM3b : 1 Les groupes

http://christophe.genolini.free.fr Licence Stat-info CM3b : 1

Les groupesLes groupes

Page 2: Http://christophe.genolini.free.frLicence Stat-infoCM3b : 1 Les groupes

http://christophe.genolini.free.fr Licence Stat-info CM3b : 2

RappelRappel

• Un amphi de 200 élèves : loi normale moyenne X et écart type s– Un élève : on peut connaître la probabilité de sa note

– Exemple, X=10, s=2, • l’élève à 14 Z= (14-10)/2 Top 2,5%

• L’élève à 11 Z= (11-10)/2 Top 31%

• Comment faire pour un groupe d’élèves ?– Sur un groupe, les bonnes notes sont compensées par les mauvaises

– Extrêmement improbable qu’un groupe ait 14 de moyenne

8 ; 14 ; 16 ; 16 ; 18

– Une moyenne de 12, c’est déjà beaucoup :

8 ; 10 ; 12 ; 14 ; 16

Page 3: Http://christophe.genolini.free.frLicence Stat-infoCM3b : 1 Les groupes

http://christophe.genolini.free.fr Licence Stat-info CM3b : 3

Comment faire ?Comment faire ?

Individu

• On compare la note d’un individu à la distribution des notes

• On conclut grâce à la loi normale

Groupe de taille N

• On compare un groupe de taille N à la distribution des groupes de taille N.

Plus précisément, on compare la moyenne d’un groupe avec la distribution des moyennes des groupes de taille N

• On conclut grâce à la loi normale

Page 4: Http://christophe.genolini.free.frLicence Stat-infoCM3b : 1 Les groupes

http://christophe.genolini.free.fr Licence Stat-info CM3b : 4

ExempleExemple

• VOS notes d’anglais de l’an dernier

• Notes d’anglais par groupe de 4

Page 5: Http://christophe.genolini.free.frLicence Stat-infoCM3b : 1 Les groupes

http://christophe.genolini.free.fr Licence Stat-info CM3b : 5

Distribution d’échantillonnage des moyennesDistribution d’échantillonnage des moyennes

• On prend un groupe E au hasard de taille N

• On calcule sa moyenne E = 10,2

• On recommence avec beaucoup de groupes

9,6 9,7 10,3 10,8 10,0 10,3 11,2

• On obtient une distribution

• C’est la distribution d’échantillonnage

des moyennes

Page 6: Http://christophe.genolini.free.frLicence Stat-infoCM3b : 1 Les groupes

http://christophe.genolini.free.fr Licence Stat-info CM3b : 6

Théorème central limiteThéorème central limite

• Soit X une variable suivant une loi normale de moyenne X écart type sx

• On note EX la distribution d’échantillonnage des moyennes.

• Alors – EX suit une loi normale

– Cette loi normale a pour moyenne X

– Cette loi normale a pour écart type sx / N

XEXE Nss X

EX

Page 7: Http://christophe.genolini.free.frLicence Stat-infoCM3b : 1 Les groupes

http://christophe.genolini.free.fr Licence Stat-info CM3b : 7

Exemple des Notes d’anglaisExemple des Notes d’anglais

• Les notes d’anglais suivent– la loi normale (plus ou moins)

– de moyenne X=10,5

– et d’écart type sX = 3

• Sa distribution d’échantillonnage des moyennes (groupes de taille 4)– suit une loi normale

– de moyenne EX=10,5

– et d’écart type sEX =3/4 = 3/2=1,5

0

10

20

30

40

50

60

3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

0

10

20

30

40

50

60

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Page 8: Http://christophe.genolini.free.frLicence Stat-infoCM3b : 1 Les groupes

http://christophe.genolini.free.fr Licence Stat-info CM3b : 8

Exemple des notesExemple des notes

• Un amphi de 200 élèves suit– la loi normale

– de moyenne X=10

– et d’écart type sX = 2

• Sa distribution d’échantillonnage des moyennes (groupes de taille 25)– suit une loi normale

– de moyenne EX=10

– et d’écart type sEX =2/25 = 2/5=0,4

Page 9: Http://christophe.genolini.free.frLicence Stat-infoCM3b : 1 Les groupes

http://christophe.genolini.free.fr Licence Stat-info CM3b : 9

Ne mélangeons pas tout !Ne mélangeons pas tout !

• X est la moyenne de la distribution X (moyenne de l’amphi)

• G est la moyenne du groupe G (moyenne des APA, taille 25)

• EX est la distribution d’échantillonnage des moyennes des groupes de taille 25.– Comme toute distribution, EX a une moyenne.

• EX est la moyenne de la distribution EX

Si c’est clair, tout le reste est facile !

Page 10: Http://christophe.genolini.free.frLicence Stat-infoCM3b : 1 Les groupes

http://christophe.genolini.free.fr Licence Stat-info CM3b : 10

ExempleExemple

Page 11: Http://christophe.genolini.free.frLicence Stat-infoCM3b : 1 Les groupes

http://christophe.genolini.free.fr Licence Stat-info CM3b : 11

ProblèmeProblème

• Un amphi : moyenne X=10, écart type sX=2

• Le groupe des APA (25 élèves) : moyenne G=11

• Quelle la probabilité qu’une groupe de taille 25 ait 11 ou plus ?

Page 12: Http://christophe.genolini.free.frLicence Stat-infoCM3b : 1 Les groupes

http://christophe.genolini.free.fr Licence Stat-info CM3b : 12

1. H01. H0

• H0 : la différence n’est pas significative.

Page 13: Http://christophe.genolini.free.frLicence Stat-infoCM3b : 1 Les groupes

http://christophe.genolini.free.fr Licence Stat-info CM3b : 13

2. Données2. Données

• G=11, moyenne de l’amphi X=10, écart type sX=2

• On va comparer la moyenne du groupe à la distribution d’échantillonnage des moyennes EX :

– EX=10

– sEX =2/25 = 2/5=0,4

Page 14: Http://christophe.genolini.free.frLicence Stat-infoCM3b : 1 Les groupes

http://christophe.genolini.free.fr Licence Stat-info CM3b : 14

3. Test3. Test

• On utilise la loi normale :

– Avec un individu :

– Avec un groupe :

s

XxZ

2,50,4

1011

s

EXGZ

EX

Page 15: Http://christophe.genolini.free.frLicence Stat-infoCM3b : 1 Les groupes

http://christophe.genolini.free.fr Licence Stat-info CM3b : 15

4. Probabilité4. Probabilité

• Z=2,5 P=0,62%– Un groupe de taille 25 a 0,62% de chances d’avoir une

moyenne dans [11 ; +∞]

Page 16: Http://christophe.genolini.free.frLicence Stat-infoCM3b : 1 Les groupes

http://christophe.genolini.free.fr Licence Stat-info CM3b : 16

5. Conclusion5. Conclusion

• P<5%, on rejette H0

Page 17: Http://christophe.genolini.free.frLicence Stat-infoCM3b : 1 Les groupes

http://christophe.genolini.free.fr Licence Stat-info CM3b : 17

Autre formulation de la solutionAutre formulation de la solution

EXsEXGZ

Ns

XG

s

EXGZ

XEX

5,22521011 Z5,2

4,01011 Z

Page 18: Http://christophe.genolini.free.frLicence Stat-infoCM3b : 1 Les groupes

http://christophe.genolini.free.fr Licence Stat-info CM3b : 18

s et σs et σ

Page 19: Http://christophe.genolini.free.frLicence Stat-infoCM3b : 1 Les groupes

http://christophe.genolini.free.fr Licence Stat-info CM3b : 19

Quand on ne connaît pas Quand on ne connaît pas

• Dans l’exemple précédent, on a comparé la moyenne d’un groupe G à la moyenne de la population X. Coup de chance, on connaissait l’écart type de la population.

• Problème : Si on ne connaît pas X, comment faire ?

• Solution : On fait une approximation, on remplace X par sG

Page 20: Http://christophe.genolini.free.frLicence Stat-infoCM3b : 1 Les groupes

http://christophe.genolini.free.fr Licence Stat-info CM3b : 20

Exemple des salairesExemple des salaires

• Un groupe de 10 femmes comparent leur salaire à celui des employés :

• Salaire moyen des employés : – moyenne=28 k$,

– Écart type=?

• Salaire des 10 femmes : 24, 27, 31, 21, 19, 26, 30, 22, 15, 36– Moyenne = 25,1 k$

– Écart type = 5,9

• Solution théorique :10/s

25,128Z

Général Salaire

Page 21: Http://christophe.genolini.free.frLicence Stat-infoCM3b : 1 Les groupes

http://christophe.genolini.free.fr Licence Stat-info CM3b : 21

Solution réelleSolution réelle• On approxime l’écart type des salaires moyens des hommes

par l’écart type des salaires moyens des femmes

est remplacé par

10/s

25,128Z

Général Salaire

105,9/

25,128

10/s

25,128Z

femmes Salaire

Page 22: Http://christophe.genolini.free.frLicence Stat-infoCM3b : 1 Les groupes

http://christophe.genolini.free.fr Licence Stat-info CM3b : 22

T de studentT de student

Page 23: Http://christophe.genolini.free.frLicence Stat-infoCM3b : 1 Les groupes

http://christophe.genolini.free.fr Licence Stat-info CM3b : 23

Approximation : sG n’est pas X Approximation : sG n’est pas X

• Si N est grand (N>30) : pas de problème, sG est presque égal à X

• Si N est petit (N<30 ) : sG est une sous estimation de X – Donc le Z obtenue serait trop grand (par rapport à celui qu’on obtiendrait

si on connaissait X )

Dans ce cas, on remplace Z par le T de Student

Ns

XGT

G

Page 24: Http://christophe.genolini.free.frLicence Stat-infoCM3b : 1 Les groupes

http://christophe.genolini.free.fr Licence Stat-info CM3b : 24

T de StudentT de Student

• La table du T change selon la taille de l’échantillon

• Un échantillon de taille N a un degré de liberté (ddl) de N-1.

• On trouve la probabilité du T de Student grâce– A Excel : Loi.Student

– A la table papier

Page 25: Http://christophe.genolini.free.frLicence Stat-infoCM3b : 1 Les groupes

http://christophe.genolini.free.fr Licence Stat-info CM3b : 25

Table du TTable du TT 1 2 3 4 5 6 7 8 9 100,0 50,00% 50,00% 50,00% 50,00% 50,00% 50,00% 50,00% 50,00% 50,00% 50,00%0,1 46,83% 46,47% 46,33% 46,26% 46,21% 46,18% 46,16% 46,14% 46,13% 46,12%0,2 43,72% 43,00% 42,71% 42,56% 42,47% 42,40% 42,36% 42,32% 42,30% 42,27%0,3 40,72% 39,62% 39,19% 38,96% 38,81% 38,71% 38,64% 38,59% 38,55% 38,52%0,4 37,89% 36,39% 35,80% 35,48% 35,28% 35,15% 35,05% 34,98% 34,92% 34,88%0,5 35,24% 33,33% 32,57% 32,17% 31,91% 31,74% 31,62% 31,53% 31,45% 31,39%0,6 32,80% 30,47% 29,54% 29,04% 28,73% 28,52% 28,37% 28,26% 28,17% 28,09%0,7 30,56% 27,82% 26,72% 26,13% 25,76% 25,51% 25,33% 25,19% 25,08% 24,99%0,8 28,52% 25,38% 24,11% 23,43% 23,00% 22,71% 22,50% 22,34% 22,22% 22,12%0,9 26,67% 23,16% 21,72% 20,95% 20,47% 20,14% 19,90% 19,72% 19,58% 19,46%1,0 25,00% 21,13% 19,55% 18,70% 18,16% 17,80% 17,53% 17,33% 17,17% 17,04%1,1 23,49% 19,30% 17,58% 16,65% 16,07% 15,67% 15,39% 15,17% 14,99% 14,86%1,2 22,11% 17,65% 15,81% 14,82% 14,19% 13,77% 13,46% 13,22% 13,04% 12,89%1,3 20,87% 16,16% 14,22% 13,17% 12,52% 12,07% 11,74% 11,49% 11,30% 11,14%1,4 19,74% 14,82% 12,80% 11,71% 11,02% 10,55% 10,21% 9,95% 9,75% 9,59%1,5 18,72% 13,62% 11,53% 10,40% 9,70% 9,21% 8,86% 8,60% 8,39% 8,23%1,6 17,78% 12,54% 10,40% 9,24% 8,52% 8,04% 7,68% 7,41% 7,20% 7,03%1,7 16,93% 11,56% 9,38% 8,22% 7,49% 7,00% 6,65% 6,38% 6,17% 6,00%1,8 16,14% 10,68% 8,48% 7,31% 6,59% 6,10% 5,74% 5,48% 5,27% 5,10%1,9 15,42% 9,89% 7,68% 6,51% 5,79% 5,31% 4,96% 4,70% 4,49% 4,33%2,0 14,76% 9,18% 6,97% 5,81% 5,10% 4,62% 4,28% 4,03% 3,83% 3,67%2,1 14,15% 8,53% 6,33% 5,18% 4,49% 4,02% 3,69% 3,45% 3,26% 3,10%2,2 13,58% 7,94% 5,76% 4,63% 3,95% 3,51% 3,19% 2,95% 2,77% 2,62%2,3 13,05% 7,41% 5,25% 4,15% 3,49% 3,06% 2,75% 2,52% 2,35% 2,21%2,4 12,57% 6,92% 4,79% 3,72% 3,08% 2,66% 2,37% 2,16% 1,99% 1,87%2,5 12,11% 6,48% 4,39% 3,34% 2,72% 2,33% 2,05% 1,85% 1,69% 1,57%2,6 11,69% 6,08% 4,02% 3,00% 2,41% 2,03% 1,77% 1,58% 1,44% 1,32%2,7 11,29% 5,71% 3,69% 2,70% 2,14% 1,78% 1,53% 1,35% 1,22% 1,12%2,8 10,92% 5,37% 3,39% 2,44% 1,90% 1,56% 1,33% 1,16% 1,04% 0,94%2,9 10,57% 5,06% 3,13% 2,21% 1,69% 1,37% 1,15% 0,99% 0,88% 0,79%3,0 10,24% 4,77% 2,88% 2,00% 1,50% 1,20% 1,00% 0,85% 0,75% 0,67%

Page 26: Http://christophe.genolini.free.frLicence Stat-infoCM3b : 1 Les groupes

http://christophe.genolini.free.fr Licence Stat-info CM3b : 26

Exemple des salairesExemple des salaires

• On calcule T :

• DDL 9 P=5,27%

On ne peut pas rejeter H0

1,79105,1

2825,1

Ns

XGT

G

Page 27: Http://christophe.genolini.free.frLicence Stat-infoCM3b : 1 Les groupes

http://christophe.genolini.free.fr Licence Stat-info CM3b : 27

ATTENTION : DDLATTENTION : DDL

Pour le 2

• DDL = (colonnes-1)x(lignes-1)

Pour le T de Student

• DDL = effectifs - 1

Page 28: Http://christophe.genolini.free.frLicence Stat-infoCM3b : 1 Les groupes

http://christophe.genolini.free.fr Licence Stat-info CM3b : 28

RécapitulatifRécapitulatif

• On connaît sXOn conclut grâce à la table de la loi normale

• On ne connaît pas X • N est grand (N>30)

On conclut grâce à la table de la loi normale

• On ne connaît pas X

• N est petit (N<30)

On conclut grâce à la table du T de Student

NsXGZ

X

NsXGZ

G

NsXGT

G