5
Cours - Méthodes 1. Diagramme en boîte et écart-interquartile DÉFINITION : Diagramme en boîte Le diagramme en boîte d’une série statistique est le graphique suivant : Valeur minimale Valeur maximale médiane Q 1 Q 3 où l’axe est gradué régulièrement de sorte que l’on puisse y faire figurer les valeurs minimale et maximale, le 1 er quartile Q 1 , la médiane et le 3 e quartile Q 3 (voir lexique pour les rappels). MÉTHODE 1 Tracer un diagramme en boîte Ex. 13 p. 255 Exercice d’application Dans une exploitation agricole, on a prélevé un échantillon de 125 tomates cerise afin de vérifier leur calibrage. On obtient les résultats suivants : Diamètre (en mm) 35 36 37 38 39 40 Effectif 21 27 16 23 17 21 Dresser le diagramme en boîte de cette série statistique. Correction On peut commencer par calculer les effectifs cumulés croissants : Diamètre (en mm) 35 36 37 38 39 40 Effectifs cumulés croissants 21 48 64 87 104 125 On détermine ensuite les valeurs nécessaires au tracé du diagramme en boîte. La valeur minimale de cette série est 35 et sa valeur maximale est 40. On calcule 125 2 = 62, 5 donc la médiane est la 63 e valeur c’est-à-dire 37. On calcule 125 4 = 31, 25 donc Q 1 est la 32 e valeur c’est-à-dire Q 1 = 36. On calcule 125 × 3 4 = 93, 75 donc Q 3 est la 94 e valeur c’est-à-dire Q 3 = 39. On en déduit alors le diagramme en boîte de la série : 34 35 36 37 38 39 40 41 Min Max Médiane Q 1 Q 3 REMARQUE : Pour une série constituée d’un nombre suffisamment élevé de valeurs diffé- rentes, le diagramme en boîte sépare la série en quatre sous-séries d’effectifs sensiblement égaux, regroupant donc chacune environ 25 % des valeurs. 250 Chapitre SP1. Statistiques

Cours statistiques

Embed Size (px)

Citation preview

Cours - Méthodes

1. Diagramme en boîte et écart-interquartile

DÉFINITION : Diagramme en boîte

Le diagramme en boîte d’une série statistique est le graphique suivant :

Valeur minimale Valeur maximalemédianeQ1 Q3

où l’axe est gradué régulièrement de sorte que l’on puisse y faire figurer les valeurs minimale

et maximale, le 1er quartile Q1, la médiane et le 3e quartile Q3 (voir lexique pour les rappels).

MÉTHODE 1 Tracer un diagramme en boîte Ex. 13 p. 255

Exercice d’application

Dans une exploitation agricole, on a prélevé un échantillon de 125 tomates cerise afin de vérifier

leur calibrage.

On obtient les résultats suivants :

Diamètre (en mm) 35 36 37 38 39 40

Effectif 21 27 16 23 17 21

Dresser le diagramme en boîte de cette série statistique.

Correction

On peut commencer par calculer les effectifs cumulés croissants :

Diamètre (en mm) 35 36 37 38 39 40

Effectifs cumulés

croissants21 48 64 87 104 125

On détermine ensuite les valeurs nécessaires au tracé du diagramme en boîte.

• La valeur minimale de cette série est 35 et sa valeur maximale est 40.

• On calcule125

2= 62, 5 donc la médiane est la 63e valeur c’est-à-dire 37.

• On calcule125

4= 31, 25 donc Q1 est la 32e valeur c’est-à-dire Q1 = 36.

• On calcule125 × 3

4= 93, 75 donc Q3 est la 94e valeur c’est-à-dire Q3 = 39.

On en déduit alors le diagramme en boîte de la série :

34 35 36 37 38 39 40 41

Min MaxMédianeQ1 Q3

REMARQUE : Pour une série constituée d’un nombre suffisamment élevé de valeurs diffé-

rentes, le diagramme en boîte sépare la série en quatre sous-séries d’effectifs sensiblement

égaux, regroupant donc chacune environ 25 % des valeurs.

250 Chapitre SP1. Statistiques

Cours - Méthodes

DÉFINITION : Intervalle et écart interquartile

Pour une série statistique de premier et troisième quartiles Q1 et Q3 :

l’intervalle interquartile de la série est [Q1 ; Q3] ;

l’écart interquartile est Q3 − Q1.

Exemple Dans l’exemple précédent, l’intervalle interquartile est [36 ; 39] et l’écart interquar-

tile est 39 − 36 = 3.

REMARQUES :

L’intervalle interquartile contient au moins (et environ, si la série est constituée d’un

nombre suffisamment élevé de valeurs différentes) la moitié des valeurs de la série.

L’écart interquartile est insensible aux valeurs extrêmes.

L’écart interquartile est un indicateur de dispersion de la série : plus il est faible, plus la

série est homogène.

D’une manière générale, un indicateur qui permet de décrire les écarts entre différentes

valeurs de la série est dit « de dispersion ». C’est le cas de l’étendue par exemple.

MÉTHODE 2 Comparer deux séries statistiques Ex. 15 p. 256

Tracer les diagrammes en boîte de deux séries (ou plus) sur le même graphique permet de

les comparer, notamment en observant leur écart interquartile respectif, même si elles n’ont

pas le même effectif.

Exercice d’application

On donne ci-dessous les diagrammes en boîte des séries statistiques donnant les temps des

coureurs des deux demi-finales du 100 m masculin aux championnats du monde d’athlétisme

de 2013.

9,8 9,9 10,0 10,1 10,2 10,3 10,4 Temps (en s)

Demi-finale no 1

Demi-finale no 2

1) Dans quelle demi-finale les coureurs ont-ils été globalement les plus rapides ?

2) Laquelle a été la plus équilibrée ?

Correction

1) On remarque que tous les indicateurs (minimum, Q1, médiane, Q3 et maximum) de la demi-

finale no 2 sont inférieurs à ceux de la demi-finale no 1 : les coureurs de la demi-finale no 2

ont donc été globalement plus rapides.

2) Quand on mesure avec une règle graduée, on constate que l’écart-interquartile est plus petit

pour la demi-finale no 2 que pour la demi-finale no 1 (et l’étendue sensiblement égale), on

peut donc penser que la demi-finale no 2 a été plus équilibrée.

Chapitre SP1. Statistiques 251

Cours - Méthodes

2. Variance et écart-type

DÉFINITION : Variance et écart-type

Soit x1, x2, . . . , xn une série statistique de moyenne x.

La variance V est donnée par la formule :

V =(x1 − x)2 + (x2 − x)2 + . . . + (xn − x)2

n=

n

∑i=1

(xi − x)2

n.

Si l’on peut écrire la série sous forme de tableau d’effectifs :

Valeur x1 x2 ... xp

Effectif n1 n2 ... np

La formule précédente de la variance devient :

V =n1 (x1 − x)2 + n2 (x2 − x)2 + . . . + np (xn − x)2

n1 + n2 + . . . + np=

p

∑i=1

ni (xi − x)2

p

∑i=1

ni

.

L’écart-type σ d’une série statistique est σ =√

V.

MÉTHODE 3 Déterminer l’écart-type Ex. 23 p. 257 et Ex. 24 p. 257

Exercice d’application

1) Déterminer l’écart-type σ de la série de valeurs 2 ; 3 ; 4 ; 8 ; 9 ; 12 ; 13 et 41.

2) Déterminer l’écart-type σ de la série.

Valeur 0 1 2 3

Effectif 4 18 6 4

Correction

1) On commence par calculer la moyenne x̄ =2 + 3 + 4 + 8 + 9 + 12 + 13 + 41

8= 11, 5.

On en déduit que la variance est :

V =(2 − 11, 5)2 + (3 − 11, 5)2 + (4 − 11, 5)2 + . . . + (13 − 11, 5)2 + (41 − 11, 5)2

8

V =1110

8= 138, 75.

L’écart-type est σ =√

138, 75 ≈ 11, 8.

2) On commence par calculer la moyenne x =4 × 0 + 18 × 1 + 6 × 2 + 4 × 3

4 + 18 + 6 + 4= 1,312 5.

On en déduit que la variance est :

V =4 (0 − 1,312 5)2 + 18 (1 − 1,312 5)2 + 6 (2 − 1,312 5)2 + 4 (3 − 1,312 5)2

4 + 18 + 6 + 4

=22,875

32≈ 0,715.

L’écart-type est σ =

√22,875

32≈ 0,8.

252 Chapitre SP1. Statistiques

Cours - Méthodes

MÉTHODE 4 Déterminer l’écart-type avec la calculatrice : série de valeurs Ex. 23 p. 257

Exercice d’application

Déterminer l’écart-type σ de la série de valeurs 2 ; 3 ; 4 ; 8 ; 9 ; 12 ; 13 et 41.

Correction

Calculatrice TI

• On appuie sur la touche ;

• on choisit le menu 1:Edite... ;

• on saisit les valeurs 2 ; 3 ; etc. dans L1 ;

• on appuie sur la touche puis on appuie

sur la flèche de droite pour se déplacer

sur CALC ;

• on choisit 1:Stats 1-Var puis on écrit

L1 avec puis afin d’obtenir

et on valide avec ;

• l’écart-type est la valeur

donc σ ≈ 11, 8 (et la moyenne est x = 11,5).

Calculatrice CASIO

• On appuie sur la touche et on choisit

le menu 2 : STAT ;

• on saisit les valeurs 2 ; 3 ; etc. dans List 1 ;

• on choisit le menu CALC puis SET ;

• on règle 1Var XLIST sur List 1 et

1Var Freq sur 1 puis on appuie sur la

touche ;

• on choisit le menu 1VAR ;

• l’écart-type est

donc σ ≈ 11, 8 (et la moyenne est x = 11,5).

MÉTHODE 5 Déterminer l’écart-type avec la calculatrice : tableau d’effectifs Ex. 24 p. 257

Exercice d’application

Déterminer l’écart-type σ de la série.

Valeur 0 1 2 3

Effectif 4 18 6 4

Correction

Calculatrice TI

• On appuie sur la touche ;

• on choisit le menu 1:Edite... ;

• on saisit les valeurs 0 ; 1 ; 2 et 3 dans L1 et

les effectifs 4 ; 18 ; 6 et 4 dans L2 ;

• on appuie sur la touche puis on appuie

sur la flèche de droite pour se déplacer

sur CALC ;

• on choisit 1:Stats 1-Var puis on écrit L1,L2

afin d’obtenir et

on valide avec ;

• l’écart-type est donc

σ ≈ 0, 8 (et la moyenne est x ≈ 1, 3125).

Calculatrice CASIO

• On appuie sur la touche et on choisit

le menu 2 : STAT ;

• on saisit les valeurs 0 ; 1 ; 2 et 3 dans List 1

et les effectifs 4 ; 18 ; 6 et 4 dans List 2 ;

• on choisit le menu CALC ;

• on règle 1Var XLIST sur List 1 et

1Var Freq sur List 2 puis on appuie sur

la touche ;

• on choisit le menu 1VAR ;

• l’écart-type est donc

σ ≈ 0, 8 (et la moyenne est x ≈ 1, 3125).

REMARQUES :

La variance et l’écart-type sont des indicateurs de dispersion autour de la moyenne, plus

ils sont petits, plus la série est homogène.

Généralement, on détermine la variance et l’écart-type à l’aide de la calculatrice.

Chapitre SP1. Statistiques 253

Cours - Méthodes

REMARQUE : La moyenne x et l’écart-type σ s’expriment dans la même unité que les valeurs

de la série (analyse dimensionnelle).

Cela a un sens de parler des intervalles [x − σ ; x + σ], [x − 2σ ; x + 2σ], etc. qui sont souvent

utilisés en statistiques.

Exemple Lors d’un TP ayant pour but de mesurer la masse volumique d’un métal, exprimée

en g/cm3, les sept groupes d’une classe ont trouvé :

7,95 ; 8,02 ; 7,61 ; 8,11 ; 8,02 ; 8,05 ; 8,04.

La calculatrice donne la moyenne x ≈ 7,97 g/cm3 et l’écart-type σ ≈ 0,15 g/cm3 de cette série

de valeurs.

L’intervalle [x − 2σ ; x + 2σ] est donc [7,67 ; 8,27] à 10−2 près, dont on peut remarquer qu’il

contient 6 des 7 valeurs, soit67≈ 86 % des valeurs.

3. Résumé d’une série statistique

MÉTHODE 6 Résumer une série statistique Ex. 30 p. 258

On peut résumer une série statistique, c’est-à-dire en donner une tendance globale, par :

• le couple médiane-écart interquartile, qui n’est pas sensible aux valeurs extrêmes : on le

privilégie donc quand on étudie une série dont les valeurs extrêmes sont moins importantes

ou moins significatives que les valeurs centrales ;

• le couple moyenne-écart-type, qui est sensible aux valeurs extrêmes : on le privilégie donc

quand on étudie une série dont les valeurs extrêmes sont aussi importantes ou aussi signi-

ficatives que les autres.

Dans les deux cas, on utilise un indicateur de position (la médiane ou la moyenne) et un

indicateur de dispersion (l’écart interquartile ou l’écart-type).

Exercice d’application

Pour chacune des deux situations suivantes, dire s’il est préférable de résumer la série sta-

tistique correspondante par le couple médiane-écart interquartile ou par le couple moyenne-

écart-type.

• Situation 1 : On étudie la série statistique des salaires et allocations chômage des Français

en 2014 en vue d’en observer les inégalités.

• Situation 2 : On étudie les résultats d’une enquête d’un fabricant de chaussures portant sur

la taille de chaussure de ses clients afin de déterminer la production de quelles pointures

privilégier.

Correction

• Dans la situation 1, les valeurs extrêmes sont très importantes puisque ce sont elles qui

illustrent les plus grandes inégalités : on préférera donc le couple moyenne-écart-type.

• Dans la situation 2, le fabricant souhaite savoir quelles pointures sont les plus portées et

ne s’intéresse donc pas aux très petites et très grandes pointures peu portées par ses clients

mais plutôt aux valeurs centrales : on préférera donc le couple médiane-écart interquartile.

254 Chapitre SP1. Statistiques