Upload
clarice-morice
View
111
Download
2
Embed Size (px)
Citation preview
http://christophe.genolini.free.fr Licence Stat-info CM3b : 1
Les groupesLes groupes
http://christophe.genolini.free.fr Licence Stat-info CM3b : 2
RappelRappel
• Un amphi de 200 élèves : loi normale moyenne X et écart type s– Un élève : on peut connaître la probabilité de sa note
– Exemple, X=10, s=2, • l’élève à 14 Z= (14-10)/2 Top 2,5%
• L’élève à 11 Z= (11-10)/2 Top 31%
• Comment faire pour un groupe d’élèves ?– Sur un groupe, les bonnes notes sont compensées par les mauvaises
– Extrêmement improbable qu’un groupe ait 14 de moyenne
8 ; 14 ; 16 ; 16 ; 18
– Une moyenne de 12, c’est déjà beaucoup :
8 ; 10 ; 12 ; 14 ; 16
http://christophe.genolini.free.fr Licence Stat-info CM3b : 3
Comment faire ?Comment faire ?
Individu
• On compare la note d’un individu à la distribution des notes
• On conclut grâce à la loi normale
Groupe de taille N
• On compare un groupe de taille N à la distribution des groupes de taille N.
Plus précisément, on compare la moyenne d’un groupe avec la distribution des moyennes des groupes de taille N
• On conclut grâce à la loi normale
http://christophe.genolini.free.fr Licence Stat-info CM3b : 4
ExempleExemple
• VOS notes d’anglais de l’an dernier
• Notes d’anglais par groupe de 4
http://christophe.genolini.free.fr Licence Stat-info CM3b : 5
Distribution d’échantillonnage des moyennesDistribution d’échantillonnage des moyennes
• On prend un groupe E au hasard de taille N
• On calcule sa moyenne E = 10,2
• On recommence avec beaucoup de groupes
9,6 9,7 10,3 10,8 10,0 10,3 11,2
• On obtient une distribution
• C’est la distribution d’échantillonnage
des moyennes
http://christophe.genolini.free.fr Licence Stat-info CM3b : 6
Théorème central limiteThéorème central limite
• Soit X une variable suivant une loi normale de moyenne X écart type sx
• On note EX la distribution d’échantillonnage des moyennes.
• Alors – EX suit une loi normale
– Cette loi normale a pour moyenne X
– Cette loi normale a pour écart type sx / N
XEXE Nss X
EX
http://christophe.genolini.free.fr Licence Stat-info CM3b : 7
Exemple des Notes d’anglaisExemple des Notes d’anglais
• Les notes d’anglais suivent– la loi normale (plus ou moins)
– de moyenne X=10,5
– et d’écart type sX = 3
• Sa distribution d’échantillonnage des moyennes (groupes de taille 4)– suit une loi normale
– de moyenne EX=10,5
– et d’écart type sEX =3/4 = 3/2=1,5
0
10
20
30
40
50
60
3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
0
10
20
30
40
50
60
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
http://christophe.genolini.free.fr Licence Stat-info CM3b : 8
Exemple des notesExemple des notes
• Un amphi de 200 élèves suit– la loi normale
– de moyenne X=10
– et d’écart type sX = 2
• Sa distribution d’échantillonnage des moyennes (groupes de taille 25)– suit une loi normale
– de moyenne EX=10
– et d’écart type sEX =2/25 = 2/5=0,4
http://christophe.genolini.free.fr Licence Stat-info CM3b : 9
Ne mélangeons pas tout !Ne mélangeons pas tout !
• X est la moyenne de la distribution X (moyenne de l’amphi)
• G est la moyenne du groupe G (moyenne des APA, taille 25)
• EX est la distribution d’échantillonnage des moyennes des groupes de taille 25.– Comme toute distribution, EX a une moyenne.
• EX est la moyenne de la distribution EX
Si c’est clair, tout le reste est facile !
http://christophe.genolini.free.fr Licence Stat-info CM3b : 10
ExempleExemple
http://christophe.genolini.free.fr Licence Stat-info CM3b : 11
ProblèmeProblème
• Un amphi : moyenne X=10, écart type sX=2
• Le groupe des APA (25 élèves) : moyenne G=11
• Quelle la probabilité qu’une groupe de taille 25 ait 11 ou plus ?
http://christophe.genolini.free.fr Licence Stat-info CM3b : 12
1. H01. H0
• H0 : la différence n’est pas significative.
http://christophe.genolini.free.fr Licence Stat-info CM3b : 13
2. Données2. Données
• G=11, moyenne de l’amphi X=10, écart type sX=2
• On va comparer la moyenne du groupe à la distribution d’échantillonnage des moyennes EX :
– EX=10
– sEX =2/25 = 2/5=0,4
http://christophe.genolini.free.fr Licence Stat-info CM3b : 14
3. Test3. Test
• On utilise la loi normale :
– Avec un individu :
– Avec un groupe :
s
XxZ
2,50,4
1011
s
EXGZ
EX
http://christophe.genolini.free.fr Licence Stat-info CM3b : 15
4. Probabilité4. Probabilité
• Z=2,5 P=0,62%– Un groupe de taille 25 a 0,62% de chances d’avoir une
moyenne dans [11 ; +∞]
http://christophe.genolini.free.fr Licence Stat-info CM3b : 16
5. Conclusion5. Conclusion
• P<5%, on rejette H0
http://christophe.genolini.free.fr Licence Stat-info CM3b : 17
Autre formulation de la solutionAutre formulation de la solution
EXsEXGZ
Ns
XG
s
EXGZ
XEX
5,22521011 Z5,2
4,01011 Z
http://christophe.genolini.free.fr Licence Stat-info CM3b : 18
s et σs et σ
http://christophe.genolini.free.fr Licence Stat-info CM3b : 19
Quand on ne connaît pas Quand on ne connaît pas
• Dans l’exemple précédent, on a comparé la moyenne d’un groupe G à la moyenne de la population X. Coup de chance, on connaissait l’écart type de la population.
• Problème : Si on ne connaît pas X, comment faire ?
• Solution : On fait une approximation, on remplace X par sG
http://christophe.genolini.free.fr Licence Stat-info CM3b : 20
Exemple des salairesExemple des salaires
• Un groupe de 10 femmes comparent leur salaire à celui des employés :
• Salaire moyen des employés : – moyenne=28 k$,
– Écart type=?
• Salaire des 10 femmes : 24, 27, 31, 21, 19, 26, 30, 22, 15, 36– Moyenne = 25,1 k$
– Écart type = 5,9
• Solution théorique :10/s
25,128Z
Général Salaire
http://christophe.genolini.free.fr Licence Stat-info CM3b : 21
Solution réelleSolution réelle• On approxime l’écart type des salaires moyens des hommes
par l’écart type des salaires moyens des femmes
est remplacé par
10/s
25,128Z
Général Salaire
105,9/
25,128
10/s
25,128Z
femmes Salaire
http://christophe.genolini.free.fr Licence Stat-info CM3b : 22
T de studentT de student
http://christophe.genolini.free.fr Licence Stat-info CM3b : 23
Approximation : sG n’est pas X Approximation : sG n’est pas X
• Si N est grand (N>30) : pas de problème, sG est presque égal à X
• Si N est petit (N<30 ) : sG est une sous estimation de X – Donc le Z obtenue serait trop grand (par rapport à celui qu’on obtiendrait
si on connaissait X )
Dans ce cas, on remplace Z par le T de Student
Ns
XGT
G
http://christophe.genolini.free.fr Licence Stat-info CM3b : 24
T de StudentT de Student
• La table du T change selon la taille de l’échantillon
• Un échantillon de taille N a un degré de liberté (ddl) de N-1.
• On trouve la probabilité du T de Student grâce– A Excel : Loi.Student
– A la table papier
http://christophe.genolini.free.fr Licence Stat-info CM3b : 25
Table du TTable du TT 1 2 3 4 5 6 7 8 9 100,0 50,00% 50,00% 50,00% 50,00% 50,00% 50,00% 50,00% 50,00% 50,00% 50,00%0,1 46,83% 46,47% 46,33% 46,26% 46,21% 46,18% 46,16% 46,14% 46,13% 46,12%0,2 43,72% 43,00% 42,71% 42,56% 42,47% 42,40% 42,36% 42,32% 42,30% 42,27%0,3 40,72% 39,62% 39,19% 38,96% 38,81% 38,71% 38,64% 38,59% 38,55% 38,52%0,4 37,89% 36,39% 35,80% 35,48% 35,28% 35,15% 35,05% 34,98% 34,92% 34,88%0,5 35,24% 33,33% 32,57% 32,17% 31,91% 31,74% 31,62% 31,53% 31,45% 31,39%0,6 32,80% 30,47% 29,54% 29,04% 28,73% 28,52% 28,37% 28,26% 28,17% 28,09%0,7 30,56% 27,82% 26,72% 26,13% 25,76% 25,51% 25,33% 25,19% 25,08% 24,99%0,8 28,52% 25,38% 24,11% 23,43% 23,00% 22,71% 22,50% 22,34% 22,22% 22,12%0,9 26,67% 23,16% 21,72% 20,95% 20,47% 20,14% 19,90% 19,72% 19,58% 19,46%1,0 25,00% 21,13% 19,55% 18,70% 18,16% 17,80% 17,53% 17,33% 17,17% 17,04%1,1 23,49% 19,30% 17,58% 16,65% 16,07% 15,67% 15,39% 15,17% 14,99% 14,86%1,2 22,11% 17,65% 15,81% 14,82% 14,19% 13,77% 13,46% 13,22% 13,04% 12,89%1,3 20,87% 16,16% 14,22% 13,17% 12,52% 12,07% 11,74% 11,49% 11,30% 11,14%1,4 19,74% 14,82% 12,80% 11,71% 11,02% 10,55% 10,21% 9,95% 9,75% 9,59%1,5 18,72% 13,62% 11,53% 10,40% 9,70% 9,21% 8,86% 8,60% 8,39% 8,23%1,6 17,78% 12,54% 10,40% 9,24% 8,52% 8,04% 7,68% 7,41% 7,20% 7,03%1,7 16,93% 11,56% 9,38% 8,22% 7,49% 7,00% 6,65% 6,38% 6,17% 6,00%1,8 16,14% 10,68% 8,48% 7,31% 6,59% 6,10% 5,74% 5,48% 5,27% 5,10%1,9 15,42% 9,89% 7,68% 6,51% 5,79% 5,31% 4,96% 4,70% 4,49% 4,33%2,0 14,76% 9,18% 6,97% 5,81% 5,10% 4,62% 4,28% 4,03% 3,83% 3,67%2,1 14,15% 8,53% 6,33% 5,18% 4,49% 4,02% 3,69% 3,45% 3,26% 3,10%2,2 13,58% 7,94% 5,76% 4,63% 3,95% 3,51% 3,19% 2,95% 2,77% 2,62%2,3 13,05% 7,41% 5,25% 4,15% 3,49% 3,06% 2,75% 2,52% 2,35% 2,21%2,4 12,57% 6,92% 4,79% 3,72% 3,08% 2,66% 2,37% 2,16% 1,99% 1,87%2,5 12,11% 6,48% 4,39% 3,34% 2,72% 2,33% 2,05% 1,85% 1,69% 1,57%2,6 11,69% 6,08% 4,02% 3,00% 2,41% 2,03% 1,77% 1,58% 1,44% 1,32%2,7 11,29% 5,71% 3,69% 2,70% 2,14% 1,78% 1,53% 1,35% 1,22% 1,12%2,8 10,92% 5,37% 3,39% 2,44% 1,90% 1,56% 1,33% 1,16% 1,04% 0,94%2,9 10,57% 5,06% 3,13% 2,21% 1,69% 1,37% 1,15% 0,99% 0,88% 0,79%3,0 10,24% 4,77% 2,88% 2,00% 1,50% 1,20% 1,00% 0,85% 0,75% 0,67%
http://christophe.genolini.free.fr Licence Stat-info CM3b : 26
Exemple des salairesExemple des salaires
• On calcule T :
• DDL 9 P=5,27%
On ne peut pas rejeter H0
1,79105,1
2825,1
Ns
XGT
G
http://christophe.genolini.free.fr Licence Stat-info CM3b : 27
ATTENTION : DDLATTENTION : DDL
Pour le 2
• DDL = (colonnes-1)x(lignes-1)
Pour le T de Student
• DDL = effectifs - 1
http://christophe.genolini.free.fr Licence Stat-info CM3b : 28
RécapitulatifRécapitulatif
• On connaît sXOn conclut grâce à la table de la loi normale
• On ne connaît pas X • N est grand (N>30)
On conclut grâce à la table de la loi normale
• On ne connaît pas X
• N est petit (N<30)
On conclut grâce à la table du T de Student
NsXGZ
X
NsXGZ
G
NsXGT
G