Download pdf - Moyennesmrad/STAT2010/Polymoyennes2.pdf · à la section des cordes. En appelant d ... les carrés s’appelle une moyenne ... Une action a vu son cours doubler en un an et être

Moyennes

— 13 —

Les cordes sont de diamètres variables. Si on les remplace par deuxcordes de même diamètre, le diamètre moyen, le résultat devrait être lemême. Ici le résultat, c’est sans doute la résistance qui est proportionnelleà la section des cordes.

En appelant d1 et d2 les diamètres des cordes et d le diamètremoyen, on doit avoir!:

†

pd12

4+

pd22

4=2 pd2

4 (surface d'un cercle : S =

pd2

4)

soit d2 =d1

2 +d22

2=2,5

ou d =d1

2 +d22

2ª1,58

Le diamètre moyen est de 1,58cm. Cette moyenne qui fait intervenirles carrés s’appelle une moyenne q u a d r a t i q u e . La moyennearithmétique (1,5cm) est ici mal adaptée!: deux cordes de 1,5cm dediamètre seraient moins résistantes que l’ensemble formé par les deuxcordes proposées de 1 et 2cm de diamètre.

2.3.2. Formules

Pour une variable x, les formules de moyenne quadratique Qs’écrivent!:

Q =

xi2Â

npour une moyenne simple

et Q =

nixi2Â

niÂpour une moyenne pondérée avec des effectifs ni.

Les calculs s’enchaînent de la manière suivante!:

Valeursxi

zi = xi2 z Q = z

La moyenne quadratique de plusieurs grandeurs est l aracine carrée de la moyenne arithmétique de leurs carrés.

c a r r é r a c i n ec a r r é e

M o y e n n ear i thmét ique

Moyennes

— 14 —

2.3.3. Écart-type

Reprenons encore une fois l’exemple des âges des enfants. Pourmesurer la dispersion à partir des écarts à la moyenne, il était apparunécessaire de prendre les écarts en valeur absolue, de façon à éviter le jeude compensation entre les écarts positifs et les écarts négatifs.

Une autre méthode tout aussi efficace pour obtenir des grandeurspositives consiste à élever artificiellement les écarts au carré. Le tableaudu § 2.1.3. devient alors!:

ni ei ei2

niei2

442

+0,8+0,2+1,2

0,640,041,44

+2,56+0,16+2,88

ni = 10Â niei2 = 5,6Â

Moyenne : V =

niei2Â

niÂ= 0,56

Cette moyenne s’appelle la variance.

La variance est la moyenne des carrés des écarts autour d ela moyenne.

Elle se mesure en (années)2. Pour obtenir une caractéristique dedispersion qui s’exprime en années, on calcule la racine carrée!: c’estl’écart-type! :

s = V =

niei2Â

niÂª 0,75

Le procédé est le même que pour les diamètres au paragrapheprécédent. Les écarts sont en moyenne de 0,75 année (9 mois). Le résultatest du même ordre de grandeur que l’écart absolu moyen. L’interprétationest la même!: ±O,75 année d’écart autour de la moyenne arithmétique.

L’écart-type est la moyenne quadratique des écarts autourde la moyenne arithmétique.

2.3.4. Formule développée de l’écart-type

Contrairement aux apparences, l’écart-type est beaucoup plus facileà calculer que l’écart absolu moyen. Cela tient aux propriétés des carrésqui se développent agréablement!:

†

(xi - x )2 = xi2 -2xix + x 2

ni(xi - x )2 = nixi2 -2nixix +nix 2

Moyennes

— 15 —

†

ni(xi - x )2 = n1x12 -2n1x1x +n1x 2Â

+n2x22 -2n2x2x +n2x 2

+ ... nixi

2 -2x nixi + x 2 niÂÂÂ

†

V =ni(xi - x )2Â

niÂ=

nixi2Â

niÂ-2x nixiÂ

niÂ+ x 2 niÂ

niÂ

V =nixi

2ÂniÂ

-2x 2 + x 2

†

V =nixi

2ÂniÂ

- x 2

Cette dernière formule (formule développée) définit unedeuxième manière de calculer la variance et donc l’écart-type. Elle peut selire!:

La variance, c’est la moyenne des carrés moins le carré d ela moyenne.

Cette formule ne fait intervenir la moyenne qu’une seule fois à lafin des calculs et non pas à chaque ligne dans le tableau. Elle est pluspratique pour des calculs “à la main”. Quant à la calculette, c’est la seuleformule qu’elle puisse utiliser. Comme il n’y a pas de formule développéepour l’écart absolu moyen, il n’y a pas de touche “écart absolu moyen”sur la calculette.

ni xi nixi nixi2

442

91011

364022

+324+400+242

ni = 10Â nixi = 98Â nixi2 = 966Â

†

V =966100

-9810

Ê

Ë Á

ˆ

¯ ˜ 2

= 0,56 s ª 0,75

2.3.5. Décomposition de la variance

Lorsque deux ou plusieurs groupes sont réunis, la variance du grandgroupe peut se calculer à partir des moyennes et variances de chaquesous-groupe.

Pour deux sous-groupes a et b, on peut reprendre les notationsintroduites au paragraphe 2.1.4. pour les moyennes!:

†

nax a = xiaÂ

†

nbx b = xibÂ

†

nx = xia& bÂ = xi

aÂ + xi

bÂ = nax a +nbx b

De même, pour les variances!:

†

nasa2 = (xi

aÂ - x a )2

†

nbsb2 = (xi

bÂ - x b)2

†

ns 2 = (xia& bÂ - x )2 = (xi

aÂ - x )2 + (xi

bÂ - x )2

Dans le groupe a on peut décomposer la somme des carrés des écarts enintroduisant la moyenne du groupe a!:

†

(xiaÂ - x )2 = (xi - x a ) + (x a - x )[ ]2

aÂ

= (xi - x a )2

aÂ + (x a - x )2

aÂ +2 (xi - x a )(

aÂ x a - x )

et dans la dernière sommation,

†

(x a - x ) est une constante qui peut semettre en facteur, donc devant le signe somme!:

†

2 (xi - x a )(aÂ x a - x ) =2(x a - x ) (xi - x a )

aÂ = 0

ce qui fait apparaître la somme des écarts à la moyenne dans le groupe a.Cette somme est nulle (cf. § 2.1.2. ), de sorte qu’on a tout simplement!:

†

(xiaÂ - x )2 = nasa

2 +na (x a - x )2

et une relation analogue dans le groupe b ce qui donne finalement pourla variance du grand groupe!:

†

s 2 =nasa

2 +nbsb2

na +nb+

na (x a - x )2 +nb(x b - x )2

na +nb

moyenne des variance desvariances moyennes

C’est la formule de décomposition de la variance qui peut segénéraliser facilement quel que soit le nombre de sous-groupes a, b, c, d,etc.

La moyenne des variances s’appelle aussi variance intra-groupes(dispersion à l’intérieur des groupes) et la variance des moyenness’appelle variance inter-groupes (dispersion entre les groupes).

Il n’y a pas de formule analogue pour les autres caractéristiques dedispersion comme l’étendue, l’intervalle interquartile ou l’écart absolumoyen. On retrouve l’avantage déjà signalé au paragraphe 2.1.4. Auniveau européen, par exemple, on peut calculer la variance ou l’écart-typeà partir des moyennes et des écarts-types nationaux.

2.3.6. Échantillons

Lorsque la dispersion dans une population est estimée à partir d’unéchantillon aléatoire, on démontre que la formule normale conduirait àsous-estimer la variance. On dit qu’il y a un biais dans l’estimation. Onobtient une formule plus correcte (sans biais) en divisant la somme descarrés des écarts par n–1 au lieu de n!:

†

sn-12 =

(xi - x )2Ân-1

=n

n-1sn

2

Les calculettes proposent les deux types de formules sn et sn–1. SurExcel, les fonctions s’appellent ECARTYPEP pour un calcul sur unepopulation entière et ECARTYPE pour un calcul à partir d’un échantillon.

Moyennes

— 17 —

2.4. Moyenne géométrique

2.4.1. Action

Une action a vu son cours doubler en un an et être multiplié par 8l’année suivante. Quel est le coefficient multiplicateur moyen!?

Le cours de l’action a été multiplié par 16 (2x8) en deux ans, ce quirevient au même qu’un coefficient multiplicateur de 4 pour les deuxannées consécutives. Ici, la moyenne de 2 et 8 est donc 4. Cette moyennes’appelle une moyenne géométrique. Comme les suites géométriques,elle est basée sur la multiplication. La différence avec une moyennearithmétique saute aux yeux!:

• 2x8 = 16 = 4x4 Moyenne géométrique!: 4• 2+8 = 10 = 5+5 Moyenne arithmétique!: 5

2.4.2. Formules

Pour 2 valeurs x1 et x2, la moyenne géométrique G s’écrit!:

G = x1x2

Et plus généralement pour n valeurs, en notant P l’opérateur produit!:

G = xi’( )

1 npour une moyenne simple

et G = xi

ni’( )1

niÂ pour une moyenne pondérée.

La moyenne géométrique de n valeurs est égale à la racinenième de leur produit

2.4.3. Logarithmes

On se souvient que les logarithmes transforment les produits ensommes. Ils permettent donc de faire apparaître une moyennearithmétique dans le calcul de la moyenne géométrique!:

log G =

log xiÂn

pour une moyenne simple

et log G =

ni log xiÂniÂ

pour une moyenne pondérée.

Le logarithme de la moyenne géométrique de plusieurs valeurs estégal à la moyenne arithmétique de leurs logarithmes.

Moyennes

— 18 —

Les calculs s’enchaînent de la manière suivante!:

Valeursxi

zi = l og xi z

†

G =10Z

2.5. Comparaison de moyennes

2.5.1. Calculs

La moyenne de deux nombres est toujours comprise entre ces deuxnombres. Si les deux nombres sont proches, toutes les moyennes sontvoisines. Mais si les deux nombres sont éloignés l’un de l’autre, les écartsentre les différentes moyennes peuvent être très grands comme on peuts’en rendre compte après quelques essais!:

1° nombre x 1 2 6 40 0,001

2° nombre y 2 8 12 120 1000

Harmonique H 1,33 3,2 8 60 0,002

Géométrique G 1,41 4 8,5 69 1

Arithmétique A 1,5 5 9 80 500

Moy

enne

s

Quadratique Q 1,58 5,8 9,5 89 707

Toutes ces moyennes vérifient les relations!:

H < G < A < Q et G2 = H A

Pour la démonstration, on écrit les moyennes de 2 nombres x et ypositifs!:

†

H =2xyx + y

G= xy A =x + y

2 Q =

x2 + y2

2

et on forme les expressions suivantes!:

†

• A-H =x + y

2-

2xyx + y

=(x + y)2 -4xy

2(x + y)=

(x - y)2

2(x + y)> 0 donc H < A

†

• Q 2 - A2 =x2 + y2

2-

x + y2

Ê

Ë Á

ˆ

¯ ˜ 2

=(x + y)2 -2xy

4=

(x - y)2

4> 0 donc A < Q

logarithme expo-n e n t i e l l e


Moyennes

— 19 —

†

• HA = 2xyx+y

¥x+y

2= xy =G2

La moyenne géométrique de deux nombres est aussi la moyennegéométrique de leur moyenne arithmétique et de leur moyenneharmonique, ce qui prouve, au passage, que la moyenne G est compriseentre H et A.

Le classement des moyennes se trouve ainsi justifié.

2.5.2. Construction géométrique

Une construction géométrique intéressante permet de réunir surune même figure les 4 moyennes les plus courantes à l’aide de deux demi-cercles et quelques perpendiculaires.

O

Q

A

H

G

x y

•!OA représente la moyenne arithmétique de x et y (en effet, OAest un rayon du grand cercle, donc moitié du diamètre x+y ),

•!OG représente la moyenne géométrique de x et y (car OG estla hauteur du triangle rectangle de sommet O inscrit dans le grand demi-cercle),

•!OH représente la moyenne harmonique de x et y (d’après larelation !OG2!=!OH x OA dans le triangle rectangle OGA ),

•!OQ représente la moyenne quadratique de x et y.

Pour démontrer cette dernière proposition, on remarque que

†

AG =y - x

2= AQ (rayon du petit cercle)

OQ 2 = OA2 + AQ 2 =x + y

2Ê

Ë Á

ˆ

¯ ˜ 2

+y - x

2Ê

Ë Á

ˆ

¯ ˜ 2

=x2 + y2

2

Moyennes

— 20 —

mat ion


2.5.3. Définitions anciennes

Les différentes moyennes sont connues depuis très longtemps. Maisautrefois, avant l’invention du langage algébrique, les définitions devaientemprunter le langage ordinaire, ce qui rendait les choses beaucoup moinsfaciles.

Étant donnés 3 nombres ordonnés du plus grand au plus petit, onpeut proposer plusieurs manières de placer le deuxième nombre,intermédiaire entre le premier et le troisième.

•!Exemple!1. «!L’excès du premier nombre par rapport audeuxième est le même que l’excès du deuxième par rapport autroisième!». En langage algébrique, en notant a, b, c, les 3 nombres!:

†

a-b = b -c soit b =a+c2

C'est la moyenne arithmétique.

•!Exemple!2. «!Le premier nombre est au deuxième ce que ledeuxième est au troisième!».

†

ab

=bc

soit b = ac C'est la moyenne géométrique.

•!Exemple!3. «!Le premier nombre dépasse le deuxième d’unefraction de lui-même, tandis que le deuxième dépasse le troisième de lamême fraction du troisième!».

†

a-ba

=b -c

c soit 1

b=

1a

+1c

2 C'est la moyenne harmonique.

La moyenne harmonique aurait été introduite par Hippase deMétaponte (autour de 500 avant J.-C.), un mathématicien grec, discipledirect de Pythagore et chef de file des “acousmatiques”, les candidats àl’initiation.

2.6. Moyennes généralisées

2.6.1. Principe

Pour s’adapter à des situations particulières, on peut généraliser leschéma de calcul d’une moyenne M!:

Valeursxi

†

zi = f(xi) z

†

M = f-1(Z )

Transformation transformationinverse

Moyennes

— 21 —

2.6.2. Moments

On peut considérer, en particulier,des moments centrés d’ordre k!:

†

mk =1n

(xi - x Â )k

• m1 = 0 (somme des écarts à la moyenne)

• m2 = s2 (variance)

m3 et m4 sont des coefficients qui permettent de caractériser laforme d’une distribution statistique.

Pour plus de commodité , on définit des coefficients sans dimension(qui ne dépendent pas des unités)!:

†

a3 =m3

s 3 et

†

a4 =m4

s 4

a3 caractérise la symétrie!:

• a3 = 0 pour une distribution symétrique.• a3 > 0 pour une distribution dissymétrique à droite (queue à droite).• a3 < 0 pour une distribution dissymétrique à gauche (queue à gauche).

a3 > 0 a3 = 0 a3 < 0

a4 caractérise l’aplatissement (on dit aussi “kurtosis” pour faire savant)!:

• a4 = 3 pour une distribution normale (loi de Gauss)• a4 > 3 pour une distribution plutôt pointue (leptokurtique)• a4 < 3 pour une distribution plutôt plate (platykurtique)

Pour avoir un coefficient centré, on peut aussi utiliser b4 = a4 – 3

a4 > 3 a4 = 3 a4 < 3 b4 > 0 b4 = 0 b4 < 0

Moyennes

— 22 —

3. Changements de variables

3.1. Principe généralLa moyenne arithmétique et l’écart-type sont certainement les types

de moyennes les plus utilisés. Pour bien comprendre ce qui se passe lorsd’un changement de variable, nous utiliserons deux exemples concrets.

3.1.1. Un coup de vieux

Un groupe de 10 amis se réunit. La moyenne d’âge est de 25 ansavec un écart-type de 18 mois. Deux années passent et les mêmes amis serencontrent toujours. Que sont devenus la moyenne et l’écart-type dugroupe!?

Tous les âges ont augmenté de 2 ans. Le total des 10 âges a doncaugmenté de 20 ans. En divisant par 10 pour obtenir la moyenne, onconstate bien sûr que la moyenne aussi a augmenté de 2 ans.

Les écarts, au contraire, sont inchangés!: si l’un des amis avait 1 ande plus que la moyenne, 2 ans après, il aura toujours 1 an de plus que lamoyenne. Si aucun écart ne change, l’écart-type ne change pas non plus,puisqu’il se calcule comme moyenne quadratique des écarts.

Conclusion!: dans le cas d’un décalage uniforme (une translation),la moyenne subit le même décalage, mais l’écart-type est inchangé. Ladispersion reste la même.

3.1.2. Notes

Dans une classe, la moyenne est de 12 sur 20 avec un écart-type de2 points. Le directeur décide qu’il faut noter sur 10 et toutes les notes sontdonc divisées par 2. Quel est l’effet de ce changement sur la moyenne etl’écart-type!?

La somme des notes est divisée par 2 et donc la moyenne aussi. Lanouvelle moyenne est de 6 sur 10.

Pour un élève qui avait 14, par exemple, donc 2 points au-dessus dela moyenne, la nouvelle note passe à 7, donc 1 point au-dessus de lamoyenne. Les écarts sont divisés par 2. L’écart type résume les écarts, il estdonc lui aussi divisé par 2.

Conclusion!: dans le cas d’un changement d’échelle (dilatation),moyenne et écart-type suivent le même changement d’échelle.

3.2. FormulesSi on note xi la variable d’origine et zi la nouvelle variable, on peut

rassembler les deux sortes de changements de variable dans la formulesuivante!:

Moyennes

— 23 —

†

zi =xi -b

a ou xi = azi +b

Pour la moyenne, on peut écrire!:

†

x = nixiÂniÂ

=ni(aziÂ +b)

niÂ

x = a niziÂniÂ

+b niÂniÂ

x = az +b ou

†

z = x -ba

La moyenne suit le même changement que la variable.

Et pour la variance ou l’écart-type!:

†

sx2 =

ni(xi - x )2ÂniÂ

=ni(aziÂ -az )2

niÂ

sx2 = a2 ni(zi - z )2Â

niÂ= a2sz

2

†

sz =s xa

L’écart-type n’est pas influencé par le décalage.

3.3. Simplification des calculsLes formules de changement de variable étant très simples, on peut

s’en servir aussi pour des changements de variables artificiels, dans le seulbut de simplifier les calculs.

Par exemple, pour calculer la moyenne entre des salaires de 1.414,1.417, 1.420 et 1.425 Euros on peut se décaler de 1.420 Euros pourtravailler avec –6, –3, 0 et +5. La moyenne est –1 qui correspond à 1.419Euros.

Autre exemple, pour calculer la moyenne de 400, 500 et 900, onpeut se contenter de travailler avec 4, 5, et 9. La moyenne est 6, quicorrespond donc 600.

On pourra se reporter aux exercices 4.2. et 4.3.

3.4. Variables centrées réduitesUn changement de variable très intéressant consiste à choisir

†

b = x et a = sx . On obtient ainsi dans tous les cas une variable de moyennenulle et d’écart-type égal à 1. On parle d’une variable centrée-réduite.

Pour les grands tableaux avec de nombreuses variables, cela permetde voir du premier coup d’œil comment une valeur se situe par rapport àla moyenne. Les valeurs positives signalent les grandeurs qui se trouventau-dessus de la moyenne. Et inversement, les valeurs négatives signalentles grandeurs qui se trouvent au-dessous de la moyenne. Les valeursproches de zéro correspondent à des résultats proche de la moyenne et lesgrandeurs supérieures à 2 ou 3 en valeur absolue correspondent à desrésultats très éloignés de la moyenne (voir ex. 4.4).

Moyennes

— 24 —

4. Exercices en pagaille

4.1. AchatsOn a relevé le montant en Euros de 80 achats effectués dans un

magasin au cours d’une journée.

14,28 62,03 65,73 82,18 82,43 84,90 36,34 29,6396,90 48,42 42,66 84,04 62,41 38,15 51,75 52,06

113,88 34,78 37,83 69,05 35,93 111,60 92,77 109,8878,22 26,37 4,29 66,53 62,27 39,34 98,53 59,6887,41 109,96 90,81 51,36 88,34 25,01 87,12 24,2298,88 41,01 66,54 57,66 40,17 71,74 45,56 78,8651,02 10,05 65,94 88,73 57,33 61,07 19,58 0,7772,77 15,94 104,76 68,85 93,08 75,34 50,46 46,9571,22 32,91 2,80 79,29 77,47 58,79 75,00 111,14

104,11 54,42 38,54 91,48 45,13 15,42 102,45 62,28

Calculer la moyenne et l’écart-type• directement à partir des données!;• en regroupant les données par classes d’amplitude 10 Euros!;• en regroupant les données par classes d’amplitude 20 Euros!;• en regroupant les données par classes d’amplitude 30 Euros.

Comparer les résultats obtenus par les différentes méthodes.

4.2. SalairesOn donne la distribution de

salaires ci-contre pour un groupede 100 personnes. Effectuer unchangement de variable judicieuxpour calculer plus facilement lamoyenne et l’écart-type. Inter-préter les résultats.

Salaires ni

800 à 825 Euros 17825 à 850 Euros 28850 à 875 Euros 25875 à 900 Euros 18900 à 925 Euros 12

Comment adapter les résultats si les 100 personnes constituent unéchantillon aléatoire à partir duquel on cherche à estimer lescaractéristiques d’une population beaucoup plus large!?

4.3. EurosDans une entreprise, le salaire moyen est de 8.000 Francs avec un

écart-type de 1.000 Francs. On passe à l’Euro. Que deviennent cescaractéristiques!?