Moyennes
— 13 —
Les cordes sont de diamètres variables. Si on les remplace par deuxcordes de même diamètre, le diamètre moyen, le résultat devrait être lemême. Ici le résultat, c’est sans doute la résistance qui est proportionnelleà la section des cordes.
En appelant d1 et d2 les diamètres des cordes et d le diamètremoyen, on doit avoir!:
†
pd12
4+
pd22
4=2 pd2
4 (surface d'un cercle : S =
pd2
4)
soit d2 =d1
2 +d22
2=2,5
ou d =d1
2 +d22
2ª1,58
Le diamètre moyen est de 1,58cm. Cette moyenne qui fait intervenirles carrés s’appelle une moyenne q u a d r a t i q u e . La moyennearithmétique (1,5cm) est ici mal adaptée!: deux cordes de 1,5cm dediamètre seraient moins résistantes que l’ensemble formé par les deuxcordes proposées de 1 et 2cm de diamètre.
2.3.2. Formules
Pour une variable x, les formules de moyenne quadratique Qs’écrivent!:
Q =
xi2Â
npour une moyenne simple
et Q =
nixi2Â
niÂpour une moyenne pondérée avec des effectifs ni.
Les calculs s’enchaînent de la manière suivante!:
Valeursxi
zi = xi2 z Q = z
La moyenne quadratique de plusieurs grandeurs est l aracine carrée de la moyenne arithmétique de leurs carrés.
c a r r é r a c i n ec a r r é e
M o y e n n ear i thmét ique
Moyennes
— 14 —
2.3.3. Écart-type
Reprenons encore une fois l’exemple des âges des enfants. Pourmesurer la dispersion à partir des écarts à la moyenne, il était apparunécessaire de prendre les écarts en valeur absolue, de façon à éviter le jeude compensation entre les écarts positifs et les écarts négatifs.
Une autre méthode tout aussi efficace pour obtenir des grandeurspositives consiste à élever artificiellement les écarts au carré. Le tableaudu § 2.1.3. devient alors!:
ni ei ei2
niei2
442
+0,8+0,2+1,2
0,640,041,44
+2,56+0,16+2,88
ni = 10Â niei2 = 5,6Â
Moyenne : V =
niei2Â
niÂ= 0,56
Cette moyenne s’appelle la variance.
La variance est la moyenne des carrés des écarts autour d ela moyenne.
Elle se mesure en (années)2. Pour obtenir une caractéristique dedispersion qui s’exprime en années, on calcule la racine carrée!: c’estl’écart-type! :
s = V =
niei2Â
niª 0,75
Le procédé est le même que pour les diamètres au paragrapheprécédent. Les écarts sont en moyenne de 0,75 année (9 mois). Le résultatest du même ordre de grandeur que l’écart absolu moyen. L’interprétationest la même!: ±O,75 année d’écart autour de la moyenne arithmétique.
L’écart-type est la moyenne quadratique des écarts autourde la moyenne arithmétique.
2.3.4. Formule développée de l’écart-type
Contrairement aux apparences, l’écart-type est beaucoup plus facileà calculer que l’écart absolu moyen. Cela tient aux propriétés des carrésqui se développent agréablement!:
†
(xi - x )2 = xi2 -2xix + x 2
ni(xi - x )2 = nixi2 -2nixix +nix 2
Moyennes
— 15 —
†
ni(xi - x )2 = n1x12 -2n1x1x +n1x 2Â
+n2x22 -2n2x2x +n2x 2
+ ... nixi
2 -2x nixi + x 2 niÂÂÂ
†
V =ni(xi - x )2Â
niÂ=
nixi2Â
niÂ-2x nixiÂ
niÂ+ x 2 niÂ
niÂ
V =nixi
2ÂniÂ
-2x 2 + x 2
†
V =nixi
2ÂniÂ
- x 2
Cette dernière formule (formule développée) définit unedeuxième manière de calculer la variance et donc l’écart-type. Elle peut selire!:
La variance, c’est la moyenne des carrés moins le carré d ela moyenne.
Cette formule ne fait intervenir la moyenne qu’une seule fois à lafin des calculs et non pas à chaque ligne dans le tableau. Elle est pluspratique pour des calculs “à la main”. Quant à la calculette, c’est la seuleformule qu’elle puisse utiliser. Comme il n’y a pas de formule développéepour l’écart absolu moyen, il n’y a pas de touche “écart absolu moyen”sur la calculette.
ni xi nixi nixi2
442
91011
364022
+324+400+242
ni = 10Â nixi = 98Â nixi2 = 966Â
†
V =966100
-9810
Ê
Ë Á
ˆ
¯ ˜ 2
= 0,56 s ª 0,75
2.3.5. Décomposition de la variance
Lorsque deux ou plusieurs groupes sont réunis, la variance du grandgroupe peut se calculer à partir des moyennes et variances de chaquesous-groupe.
Pour deux sous-groupes a et b, on peut reprendre les notationsintroduites au paragraphe 2.1.4. pour les moyennes!:
†
nax a = xiaÂ
†
nbx b = xibÂ
†
nx = xia& b = xi
a + xi
b = nax a +nbx b
De même, pour les variances!:
†
nasa2 = (xi
a - x a )2
†
nbsb2 = (xi
b - x b)2
†
ns 2 = (xia& b - x )2 = (xi
a - x )2 + (xi
b - x )2
Dans le groupe a on peut décomposer la somme des carrés des écarts enintroduisant la moyenne du groupe a!:
†
(xia - x )2 = (xi - x a ) + (x a - x )[ ]2
aÂ
= (xi - x a )2
a + (x a - x )2
a +2 (xi - x a )(
a x a - x )
et dans la dernière sommation,
†
(x a - x ) est une constante qui peut semettre en facteur, donc devant le signe somme!:
†
2 (xi - x a )(a x a - x ) =2(x a - x ) (xi - x a )
a = 0
ce qui fait apparaître la somme des écarts à la moyenne dans le groupe a.Cette somme est nulle (cf. § 2.1.2. ), de sorte qu’on a tout simplement!:
†
(xia - x )2 = nasa
2 +na (x a - x )2
et une relation analogue dans le groupe b ce qui donne finalement pourla variance du grand groupe!:
†
s 2 =nasa
2 +nbsb2
na +nb+
na (x a - x )2 +nb(x b - x )2
na +nb
moyenne des variance desvariances moyennes
C’est la formule de décomposition de la variance qui peut segénéraliser facilement quel que soit le nombre de sous-groupes a, b, c, d,etc.
La moyenne des variances s’appelle aussi variance intra-groupes(dispersion à l’intérieur des groupes) et la variance des moyenness’appelle variance inter-groupes (dispersion entre les groupes).
Il n’y a pas de formule analogue pour les autres caractéristiques dedispersion comme l’étendue, l’intervalle interquartile ou l’écart absolumoyen. On retrouve l’avantage déjà signalé au paragraphe 2.1.4. Auniveau européen, par exemple, on peut calculer la variance ou l’écart-typeà partir des moyennes et des écarts-types nationaux.
2.3.6. Échantillons
Lorsque la dispersion dans une population est estimée à partir d’unéchantillon aléatoire, on démontre que la formule normale conduirait àsous-estimer la variance. On dit qu’il y a un biais dans l’estimation. Onobtient une formule plus correcte (sans biais) en divisant la somme descarrés des écarts par n–1 au lieu de n!:
†
sn-12 =
(xi - x )2Ân-1
=n
n-1sn
2
Les calculettes proposent les deux types de formules sn et sn–1. SurExcel, les fonctions s’appellent ECARTYPEP pour un calcul sur unepopulation entière et ECARTYPE pour un calcul à partir d’un échantillon.
Moyennes
— 17 —
2.4. Moyenne géométrique
2.4.1. Action
Une action a vu son cours doubler en un an et être multiplié par 8l’année suivante. Quel est le coefficient multiplicateur moyen!?
Le cours de l’action a été multiplié par 16 (2x8) en deux ans, ce quirevient au même qu’un coefficient multiplicateur de 4 pour les deuxannées consécutives. Ici, la moyenne de 2 et 8 est donc 4. Cette moyennes’appelle une moyenne géométrique. Comme les suites géométriques,elle est basée sur la multiplication. La différence avec une moyennearithmétique saute aux yeux!:
• 2x8 = 16 = 4x4 Moyenne géométrique!: 4• 2+8 = 10 = 5+5 Moyenne arithmétique!: 5
2.4.2. Formules
Pour 2 valeurs x1 et x2, la moyenne géométrique G s’écrit!:
G = x1x2
Et plus généralement pour n valeurs, en notant P l’opérateur produit!:
G = xi’( )
1 npour une moyenne simple
et G = xi
ni’( )1
ni pour une moyenne pondérée.
La moyenne géométrique de n valeurs est égale à la racinenième de leur produit
2.4.3. Logarithmes
On se souvient que les logarithmes transforment les produits ensommes. Ils permettent donc de faire apparaître une moyennearithmétique dans le calcul de la moyenne géométrique!:
log G =
log xiÂn
pour une moyenne simple
et log G =
ni log xiÂniÂ
pour une moyenne pondérée.
Le logarithme de la moyenne géométrique de plusieurs valeurs estégal à la moyenne arithmétique de leurs logarithmes.
Moyennes
— 18 —
Les calculs s’enchaînent de la manière suivante!:
Valeursxi
zi = l og xi z
†
G =10Z
2.5. Comparaison de moyennes
2.5.1. Calculs
La moyenne de deux nombres est toujours comprise entre ces deuxnombres. Si les deux nombres sont proches, toutes les moyennes sontvoisines. Mais si les deux nombres sont éloignés l’un de l’autre, les écartsentre les différentes moyennes peuvent être très grands comme on peuts’en rendre compte après quelques essais!:
1° nombre x 1 2 6 40 0,001
2° nombre y 2 8 12 120 1000
Harmonique H 1,33 3,2 8 60 0,002
Géométrique G 1,41 4 8,5 69 1
Arithmétique A 1,5 5 9 80 500
Moy
enne
s
Quadratique Q 1,58 5,8 9,5 89 707
Toutes ces moyennes vérifient les relations!:
H < G < A < Q et G2 = H A
Pour la démonstration, on écrit les moyennes de 2 nombres x et ypositifs!:
†
H =2xyx + y
G= xy A =x + y
2 Q =
x2 + y2
2
et on forme les expressions suivantes!:
†
• A-H =x + y
2-
2xyx + y
=(x + y)2 -4xy
2(x + y)=
(x - y)2
2(x + y)> 0 donc H < A
†
• Q 2 - A2 =x2 + y2
2-
x + y2
Ê
Ë Á
ˆ
¯ ˜ 2
=(x + y)2 -2xy
4=
(x - y)2
4> 0 donc A < Q
logarithme expo-n e n t i e l l e
M o y e n n ear i thmét ique
Moyennes
— 19 —
†
• HA = 2xyx+y
¥x+y
2= xy =G2
La moyenne géométrique de deux nombres est aussi la moyennegéométrique de leur moyenne arithmétique et de leur moyenneharmonique, ce qui prouve, au passage, que la moyenne G est compriseentre H et A.
Le classement des moyennes se trouve ainsi justifié.
2.5.2. Construction géométrique
Une construction géométrique intéressante permet de réunir surune même figure les 4 moyennes les plus courantes à l’aide de deux demi-cercles et quelques perpendiculaires.
O
Q
A
H
G
x y
•!OA représente la moyenne arithmétique de x et y (en effet, OAest un rayon du grand cercle, donc moitié du diamètre x+y ),
•!OG représente la moyenne géométrique de x et y (car OG estla hauteur du triangle rectangle de sommet O inscrit dans le grand demi-cercle),
•!OH représente la moyenne harmonique de x et y (d’après larelation !OG2!=!OH x OA dans le triangle rectangle OGA ),
•!OQ représente la moyenne quadratique de x et y.
Pour démontrer cette dernière proposition, on remarque que
†
AG =y - x
2= AQ (rayon du petit cercle)
OQ 2 = OA2 + AQ 2 =x + y
2Ê
Ë Á
ˆ
¯ ˜ 2
+y - x
2Ê
Ë Á
ˆ
¯ ˜ 2
=x2 + y2
2
Moyennes
— 20 —
mat ion
M o y e n n ear i thmét ique
2.5.3. Définitions anciennes
Les différentes moyennes sont connues depuis très longtemps. Maisautrefois, avant l’invention du langage algébrique, les définitions devaientemprunter le langage ordinaire, ce qui rendait les choses beaucoup moinsfaciles.
Étant donnés 3 nombres ordonnés du plus grand au plus petit, onpeut proposer plusieurs manières de placer le deuxième nombre,intermédiaire entre le premier et le troisième.
•!Exemple!1. «!L’excès du premier nombre par rapport audeuxième est le même que l’excès du deuxième par rapport autroisième!». En langage algébrique, en notant a, b, c, les 3 nombres!:
†
a-b = b -c soit b =a+c2
C'est la moyenne arithmétique.
•!Exemple!2. «!Le premier nombre est au deuxième ce que ledeuxième est au troisième!».
†
ab
=bc
soit b = ac C'est la moyenne géométrique.
•!Exemple!3. «!Le premier nombre dépasse le deuxième d’unefraction de lui-même, tandis que le deuxième dépasse le troisième de lamême fraction du troisième!».
†
a-ba
=b -c
c soit 1
b=
1a
+1c
2 C'est la moyenne harmonique.
La moyenne harmonique aurait été introduite par Hippase deMétaponte (autour de 500 avant J.-C.), un mathématicien grec, discipledirect de Pythagore et chef de file des “acousmatiques”, les candidats àl’initiation.
2.6. Moyennes généralisées
2.6.1. Principe
Pour s’adapter à des situations particulières, on peut généraliser leschéma de calcul d’une moyenne M!:
Valeursxi
†
zi = f(xi) z
†
M = f-1(Z )
Transformation transformationinverse
Moyennes
— 21 —
2.6.2. Moments
On peut considérer, en particulier,des moments centrés d’ordre k!:
†
mk =1n
(xi - x  )k
• m1 = 0 (somme des écarts à la moyenne)
• m2 = s2 (variance)
m3 et m4 sont des coefficients qui permettent de caractériser laforme d’une distribution statistique.
Pour plus de commodité , on définit des coefficients sans dimension(qui ne dépendent pas des unités)!:
†
a3 =m3
s 3 et
†
a4 =m4
s 4
a3 caractérise la symétrie!:
• a3 = 0 pour une distribution symétrique.• a3 > 0 pour une distribution dissymétrique à droite (queue à droite).• a3 < 0 pour une distribution dissymétrique à gauche (queue à gauche).
a3 > 0 a3 = 0 a3 < 0
a4 caractérise l’aplatissement (on dit aussi “kurtosis” pour faire savant)!:
• a4 = 3 pour une distribution normale (loi de Gauss)• a4 > 3 pour une distribution plutôt pointue (leptokurtique)• a4 < 3 pour une distribution plutôt plate (platykurtique)
Pour avoir un coefficient centré, on peut aussi utiliser b4 = a4 – 3
a4 > 3 a4 = 3 a4 < 3 b4 > 0 b4 = 0 b4 < 0
Moyennes
— 22 —
3. Changements de variables
3.1. Principe généralLa moyenne arithmétique et l’écart-type sont certainement les types
de moyennes les plus utilisés. Pour bien comprendre ce qui se passe lorsd’un changement de variable, nous utiliserons deux exemples concrets.
3.1.1. Un coup de vieux
Un groupe de 10 amis se réunit. La moyenne d’âge est de 25 ansavec un écart-type de 18 mois. Deux années passent et les mêmes amis serencontrent toujours. Que sont devenus la moyenne et l’écart-type dugroupe!?
Tous les âges ont augmenté de 2 ans. Le total des 10 âges a doncaugmenté de 20 ans. En divisant par 10 pour obtenir la moyenne, onconstate bien sûr que la moyenne aussi a augmenté de 2 ans.
Les écarts, au contraire, sont inchangés!: si l’un des amis avait 1 ande plus que la moyenne, 2 ans après, il aura toujours 1 an de plus que lamoyenne. Si aucun écart ne change, l’écart-type ne change pas non plus,puisqu’il se calcule comme moyenne quadratique des écarts.
Conclusion!: dans le cas d’un décalage uniforme (une translation),la moyenne subit le même décalage, mais l’écart-type est inchangé. Ladispersion reste la même.
3.1.2. Notes
Dans une classe, la moyenne est de 12 sur 20 avec un écart-type de2 points. Le directeur décide qu’il faut noter sur 10 et toutes les notes sontdonc divisées par 2. Quel est l’effet de ce changement sur la moyenne etl’écart-type!?
La somme des notes est divisée par 2 et donc la moyenne aussi. Lanouvelle moyenne est de 6 sur 10.
Pour un élève qui avait 14, par exemple, donc 2 points au-dessus dela moyenne, la nouvelle note passe à 7, donc 1 point au-dessus de lamoyenne. Les écarts sont divisés par 2. L’écart type résume les écarts, il estdonc lui aussi divisé par 2.
Conclusion!: dans le cas d’un changement d’échelle (dilatation),moyenne et écart-type suivent le même changement d’échelle.
3.2. FormulesSi on note xi la variable d’origine et zi la nouvelle variable, on peut
rassembler les deux sortes de changements de variable dans la formulesuivante!:
Moyennes
— 23 —
†
zi =xi -b
a ou xi = azi +b
Pour la moyenne, on peut écrire!:
†
x = nixiÂniÂ
=ni(azi +b)
niÂ
x = a niziÂniÂ
+b niÂniÂ
x = az +b ou
†
z = x -ba
La moyenne suit le même changement que la variable.
Et pour la variance ou l’écart-type!:
†
sx2 =
ni(xi - x )2ÂniÂ
=ni(azi -az )2
niÂ
sx2 = a2 ni(zi - z )2Â
niÂ= a2sz
2
†
sz =s xa
L’écart-type n’est pas influencé par le décalage.
3.3. Simplification des calculsLes formules de changement de variable étant très simples, on peut
s’en servir aussi pour des changements de variables artificiels, dans le seulbut de simplifier les calculs.
Par exemple, pour calculer la moyenne entre des salaires de 1.414,1.417, 1.420 et 1.425 Euros on peut se décaler de 1.420 Euros pourtravailler avec –6, –3, 0 et +5. La moyenne est –1 qui correspond à 1.419Euros.
Autre exemple, pour calculer la moyenne de 400, 500 et 900, onpeut se contenter de travailler avec 4, 5, et 9. La moyenne est 6, quicorrespond donc 600.
On pourra se reporter aux exercices 4.2. et 4.3.
3.4. Variables centrées réduitesUn changement de variable très intéressant consiste à choisir
†
b = x et a = sx . On obtient ainsi dans tous les cas une variable de moyennenulle et d’écart-type égal à 1. On parle d’une variable centrée-réduite.
Pour les grands tableaux avec de nombreuses variables, cela permetde voir du premier coup d’œil comment une valeur se situe par rapport àla moyenne. Les valeurs positives signalent les grandeurs qui se trouventau-dessus de la moyenne. Et inversement, les valeurs négatives signalentles grandeurs qui se trouvent au-dessous de la moyenne. Les valeursproches de zéro correspondent à des résultats proche de la moyenne et lesgrandeurs supérieures à 2 ou 3 en valeur absolue correspondent à desrésultats très éloignés de la moyenne (voir ex. 4.4).
Moyennes
— 24 —
4. Exercices en pagaille
4.1. AchatsOn a relevé le montant en Euros de 80 achats effectués dans un
magasin au cours d’une journée.
14,28 62,03 65,73 82,18 82,43 84,90 36,34 29,6396,90 48,42 42,66 84,04 62,41 38,15 51,75 52,06
113,88 34,78 37,83 69,05 35,93 111,60 92,77 109,8878,22 26,37 4,29 66,53 62,27 39,34 98,53 59,6887,41 109,96 90,81 51,36 88,34 25,01 87,12 24,2298,88 41,01 66,54 57,66 40,17 71,74 45,56 78,8651,02 10,05 65,94 88,73 57,33 61,07 19,58 0,7772,77 15,94 104,76 68,85 93,08 75,34 50,46 46,9571,22 32,91 2,80 79,29 77,47 58,79 75,00 111,14
104,11 54,42 38,54 91,48 45,13 15,42 102,45 62,28
Calculer la moyenne et l’écart-type• directement à partir des données!;• en regroupant les données par classes d’amplitude 10 Euros!;• en regroupant les données par classes d’amplitude 20 Euros!;• en regroupant les données par classes d’amplitude 30 Euros.
Comparer les résultats obtenus par les différentes méthodes.
4.2. SalairesOn donne la distribution de
salaires ci-contre pour un groupede 100 personnes. Effectuer unchangement de variable judicieuxpour calculer plus facilement lamoyenne et l’écart-type. Inter-préter les résultats.
Salaires ni
800 à 825 Euros 17825 à 850 Euros 28850 à 875 Euros 25875 à 900 Euros 18900 à 925 Euros 12
Comment adapter les résultats si les 100 personnes constituent unéchantillon aléatoire à partir duquel on cherche à estimer lescaractéristiques d’une population beaucoup plus large!?
4.3. EurosDans une entreprise, le salaire moyen est de 8.000 Francs avec un
écart-type de 1.000 Francs. On passe à l’Euro. Que deviennent cescaractéristiques!?