31
Statistiques 1 Statistiques A. Introduction La statistique est la science qui collecte, analyse et interprète des observations relatives à un même phénomène ; elle étudie méthodiquement un ensemble de données numériques, ce qui permet de faire un état de la situation présente et passée, de présenter ces données d'une manière intelligible et surtout de servir de base à la prévision. L’étude statistique d’un ensemble de données procède en 4 étapes aux objectifs bien définis : PHASE 1 : collecte des informations (enquête, sondage, référendum…) PHASE 2 : présentation des résultats : création de tableaux et diagrammes. PHASE 3 : analyse des tableaux : recherche de valeurs caractéristiques. PHASE 4 : interprétation des paramètres : cette phase n’est plus du ressort du mathématicien, mais bien du sociologue, du politologue, etc. B. Données statistiques 1. Individus - Caractères - Modalités Vocabulaire Une population est un ensemble soumis à une étude statistique. Les individus sont les éléments de la population. L’effectif (total ) de la population est le nombre d’individus de cette population. On le note souvent n. Une série statistique est un ensemble de valeurs collectées portées sur une liste comme, par exemple, la taille des élèves d'une classe, le nombre de voix obtenues par l'ensemble des personnes sur une liste,...

6tq art aph statistiques

Embed Size (px)

DESCRIPTION

 

Citation preview

Page 1: 6tq art aph statistiques

Statistiques

1

Statistiques

A. Introduction

La statistique est la science qui collecte, analyse et interprète des observations

relatives à un même phénomène ; elle étudie méthodiquement un ensemble de

données numériques, ce qui permet de faire un état de la situation présente et passée,

de présenter ces données d'une manière intelligible et surtout de servir de base à la

prévision.

L’étude statistique d’un ensemble de données procède en 4 étapes aux objectifs bien

définis :

PHASE 1 : collecte des informations (enquête, sondage, référendum…)

PHASE 2 : présentation des résultats : création de tableaux et diagrammes.

PHASE 3 : analyse des tableaux : recherche de valeurs caractéristiques.

PHASE 4 : interprétation des paramètres : cette phase n’est plus du ressort du

mathématicien, mais bien du sociologue, du politologue, etc.

B. Données statistiques

1. Individus - Caractères - Modalités

Vocabulaire

Une population est un ensemble soumis à une étude statistique.

Les individus sont les éléments de la population.

L’effectif (total) de la population est le nombre d’individus de cette population.

On le note souvent n.

Une série statistique est un ensemble de valeurs collectées portées sur une liste

comme, par exemple, la taille des élèves d'une classe, le nombre de voix obtenues par

l'ensemble des personnes sur une liste,...

Page 2: 6tq art aph statistiques

Statistiques

2

Un caractère statistique est une propriété étudiée sur la population.

Il peut être qualitatif ou quantitatif.

- Un caractère est qualitatif s'il est non mesurable comme, par exemple, la

marque d'une voiture, l'activité professionnelle, la nationalité, la profession...

- Un caractère est quantitatif s'il peut se mesurer, c'est-à-dire si on peut lui

attribuer une valeur numérique comme, par exemple, l'âge, le poids, le revenu

annuel, le nombre d’enfants...

Les modalités d’un caractère sont les différentes formes qu’il peut prendre.

Un caractère quantitatif peut être discret ou continu.

- Il est discret si le caractère ne peut prendre qu’un nombre limité de valeurs

comme, par exemple, le nombre d'enfants d'une famille, le nombre de voitures

que possède une famille,...

- Il est continu si le caractère peut prendre toutes les valeurs dans un

intervalle étendu, où le nombre théorique de possibilités est énorme, voire

infini, comme par exemple, la taille d’un être humain,…

Exemples

1) Lors d’une étude statistique sur l’âge du personnel d’une entreprise, la popul ation sera

composée de l’ensemble des membres du personnel, les individus seront les per s onnes et

le caractère sera l’âge . Ce caractère est q uantitatif .

2) Si on étudie la répartition par marque du parc automobile belge, la population sera

composée d e l’ensemble de toutes les voitures immatriculées en Belgique et les individus

de la série seront l es voitures. Le caractère est l a marque.

Les modalités du caractère sont : A udi, Citroën, Mercedes. Ce caractère est q ualit atif.

3) Si on demande à chaque élève d’une classe combien d’animaux domestiques il possède, la

population sera composée e st l’ensemble des élasse, les individus sont l es é lève s,

le caractère étudié est e st le nombre d’animaux par élève.

Les modalités sont 0 , 1, 2, ….. . C’est un caractère q uantitatif.

Page 3: 6tq art aph statistiques

Statistiques

3

Exercice : Les variables suivantes sont-elles qualitatives ou quantitatives ?

Dans le cas quantitatif, précise si la variable est discrète ou continue

1) Couleur de 10000 voitures passant à un carrefour un jour donné.

2) Poids de 500 singes

3) Destinations proposées dans une brochure de vacances

4) Nombre d’enfants dans une famille.

5) Statut marital d’une personne.

6) Nombre de fleurs produites par une plante.

7) Professions exercées par 1500 personnes interrogées dans la rue.

2. Echantillons

Vocabulaire

Pour diverses raisons pratiques (population trop étendue, coût de l’opération), on

réduit la collecte des données à un groupe restreint, l’échantillon, sélectionné avec

soin pour pouvoir extrapoler à l’ensemble de la population les conclusions tirées de

la seule étude de ce groupe ; il est donc crucial que l’échantillon soit représentatif de

la population, et c’est là une phase bien délicate.

Un échantillon est donc une partie représentative de la population totale.

Exemple

Lors de l’étude du revenu moyen des Belges, on sélectionne « au hasard » 1000

personnes qui participeront à un sondage et qui sont censés représenter la

population.

Remarque

Une tâche difficile consiste à choisir correctement l’échantillon de la population.

En effet, si on étudie la capacité respiratoire de la population belge, il est important

de ne pas choisir uniquement des personnes âgées, ou uniquement des sportifs de

haut niveau.

Page 4: 6tq art aph statistiques

Statistiques

4

3. Tri des données

Vocabulaire

Commençons par un exemple qui permettra de connaître le vocabulaire.

Dans le tableau brut ci-dessous, on a indiqué les résultats des élèves de sixième

année d’une école, sur 10, à une interrogation de maths.

8 1 3 7 6 5 6 7 9 10 1 0

8 1 5 8 7 6 3 5 2 10 9 9

7 6 4 4 8 7 8 9 7 6 1 3

5 4 6 6 7 9 10 7 5 2 9 10

8 1 5 9 4 6 8 6 7 9 10 1

0 2 6 6 7 4 5 6 8 7 6 2

4 9 8 9 7 6 7 5 4 10 1 9

8 4 9 6 6 3 4 7 8 1 10 6

4 5 7 1 3 5 9 4 10 8 6 1

3 9 8 8 1 5 2 6 7 5 6 4

La population est l ’ensemble des élèves de sixième.

Les individus sont l es élèves des classes de sixième.

Le caractère étudié est l e résu ltat obtenu à une interrogation en maths.

C’est un caractère q ualitatif.

L’effectif de la population est 1 20.

Ce tableau n’étant pas très parlant, nous allons construire un nouveau tableau qui

sera recensé et ordonné.

Remplis le tableau ci-dessous (page 7) à l’aide des informations données pour

chacune des colonnes.

a) Dans la première colonne, on indique, par ordre croissant, les modalités xk,

c’est-à-dire les différentes notes dans l’échelle des notations.

La modalité n’est pas toujours un nombre, elle peut aussi être un intervalle

(on parle alors de classes) ou un symbole (F ou M pour le sexe…) lorsque le

caractère étudié est qualitatif.

Page 5: 6tq art aph statistiques

Statistiques

5

b) La deuxième colonne contient, pour chacune des lignes, le nombre d’élèves

ayant obtenu la note reprise dans la première colonne.

Ces nombres sont les effectifs correspondant à chacune des modalités.

Ils se notent ek ou nk.

L’effectif d’une modalité est le nombre de fois que cette modalité apparaît dans le

tableau brut.

Cette colonne te permet de répondre à la question :

Combien d’élèves ont obtenu 6/10?

Réponds aux questions suivantes :

Combien d’élèves ont obtenu moins de 6 /10 (6 compris)?

Combien d’élèves ont obtenu moins de 8 /10 (8 compris)?

Combien d’élèves ont obtenu plus de 7 /10 (7 non compris)?

L’effectif total est la somme des effectifs des différentes modalités du caractère

statistique étudié. Il est noté n.

On indique l’effectif total dans la dernière case de la deuxième colonne.

Quel est l’effectif total de cette série ?

c) Dans le cas d’un caractère statistique quantitatif et si les modalités figurent

dans un tableau ordonné,

L’effectif cumulé d’une modalité (ou d’une classe) est la somme des effectifs de cette

modalité (ou classes) et de celles qui la précèdent.

On indique les effectifs cumulés dans la troisième colonne.

La dernière case de cette colonne contient l’effectif total.

Les effectifs cumulés se notent k , qui se lit nu.

À l’aide des informations de cette colonne, réponds aux questions suivantes :

Combien d’élèves ont-ils eu moins de 7 /10 (7 compris)?

Combien d’élèves ont-ils eu moins de 5 /10 (5 non compris)?

Combien d’élèves ont-ils eu plus de 6 /10 (6 compris)?

Page 6: 6tq art aph statistiques

Statistiques

6

d) La quatrième colonne reprend la fréquence de chaque modalité.

La fréquence d’une modalité est le quotient de l’effectif de cette modalité et de

l’effectif total n.

La fréquence de la modalité xk d’effectif nk se note fk et vaut kk

nf

n .

Ce nombre est généralement exprimé en pourcentage.

Réponds aux questions suivantes :

Quel pourcentage d’élèves a obtenu un résultat de 3/10 ?

Quel pourcentage d’élèves a obtenu le maximum ?

e) La cinquième colonne reprend les fréquences cumulées de chaque modalité.

La fréquence cumulée d’une modalité (ou d’une classe) est le quotient de l’effectif

cumulé de cette modalité et de l’effectif total.

La fréquence cumulée de la modalité xk se note Fk et vaut kkF

n

.

Réponds aux questions suivantes :

Quel pourcentage d’élèves a obtenu un résultat inférieur ou égal 3/10 ?

Quel pourcentage d’élèves a obtenu un résultat strictement inférieur à 5 ?

Quel pourcentage d’élèves a obtenu un résultat non strictement inférieur à 7 ?

Quel pourcentage d’élèves a obtenu un résultat supérieur ou égal à 8 ?

Page 7: 6tq art aph statistiques

Statistiques

7

Tableau recensé et ordonné (à remplir)

Remarques

- On peut également définir la fréquence cumulée d’une modalité (ou d’une classe)

comme la somme des fréquences de cette modalité (ou de cette classe) et de celles

qui la précèdent. Cependant, dans ce cas, des erreurs d’arrondis sont fréquentes et

rendent les résultats souvent approximatifs.

- Lorsque les résultats d’un caractère statistique quantitatif sont trop nombreux, il

est souvent avantageux de les regrouper par classes d’individus.

Ces classes ont généralement la même largeur.

On parle de manière analogue de l’effectif et de la fréquence d’une classe.

- Lorsque l’on étudie un caractère qualitatif, les effectifs cumulés et fréquences

cumulées n’ont aucun sens.

- Quand l’effectif correspondant à une modalité est nul, il n’est pas obligatoire de

l’indiquer dans le tableau.

Page 8: 6tq art aph statistiques

Statistiques

8

Exemples

Dans chacun des exemples proposés, complète les cases manquantes

1) Caractère ……………………………

Population : 30 élèves d’une classe

Caractère : sexe

Modalités : masculin – féminin

Tableau brut :

M M F M M F

M F M F M F

F M M F M M

F M F M M F

M M M F F F

Tableau ordonné :

………….

kx …………….

kn

…………………

kk

nf

n

M 17 1730

0,567 ou 56,7 %

F 13 1330

0,433 ou 43,3 %

Total : …………….. 1 ou 100 %

2) Caractère ……………………………

Population : 25 élèves d’une classe

Caractère : cotes obtenues (sur 20) à un contrôle de géographie

Modalités : …………………………

Tableau brut :

12 03 13 15 17

11 15 13 13 18

11 13 20 12 ….

08 12 05 08 ….

10 17 05 15 ….

Page 9: 6tq art aph statistiques

Statistiques

9

Tableau ordonné :

Modalités

………….

Effectifs

…………

Fréquences k

k

nf

n

………….

…………..

k

……………

……………

Fk

03 1 1

0,04 ou 4%25

1 0,04

05 2 2

0,08 ou 8%25

3 0,12

08 2 2

0,08 ou 8%25

5 0,20

10 1 1

0,04 ou 4%25

6 0,24

11 3 3

0,12 ou 12%25

9 0,36

12 3 3

0,12 ou 12%25

12 0,48

13 4 4

0,16 ou 16%25

16 0,64

15 3 3

0,12 ou 12%25

19 0,76

17 2 2

0,08 ou 8%25

21 0,84

18 1 1

0,04 ou 4%25

22 0,88

19 1 1

0,04 ou 4%25

23 0,92

……. 2 2

0,08 ou 8%25

25 1

Total : n = 25 1 ou 100 %

3) Caractère quantitatif à grouper en classes

Population : 80 virements inférieurs à 120 €

Caractère : montants des virements

Tableau brut :

5 20 80 35 8 44 80 28 114 60

60 101 45 102 67 116 48 79 14 57

61 39 7 40 105 30 42 119 90 90

100 48 49 50 67 119 78 65 60 118

17 114 72 107 10 77 84 54 36 45

117 39 82 40 60 24 59 100 113 79

76 74 5 110 99 97 86 19 62 58

21 32 87 54 32 54 92 93 36 60

Page 10: 6tq art aph statistiques

Statistiques

10

0

1

2

3

4

5

3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

On regroupe les virements par tranches de 20 € : [0 ;20[ ; [20 ;40[, …..

[100 ;120[.

Tableau ordonné :

Modalités

kx Effectifs

kn Fréquences

…………….

Effectifs

cumulés

…….

Fréquences

Cumulées

…….

[0,20[

[20,40[

[40,60[

[60,80[

[80,100[

[100,120[

Total :

4. Graphiques

Après avoir collecté des données et les avoir ordonnées dans des tableaux structurés, il est

intéressant de pouvoir les représenter graphiquement. Il existe différents types de

graphiques : à bâtonnets, en rectangles, circulaires, figuratifs, en pyramides, …. Des logiciels

informatiques, de type Excel, sont d’une aide précieuse et efficace dans la confection de

graphiques liés à des données statistiques.

1) Diagramme en bâtonnets

Dans un tel diagramme, la longueur d’un « bâtonnet » représente

l’effectif de la modalité correspondante.

En reprenant la situation des différentes cotes obtenues par les 25

élèves au contrôle de géographie, on a

Page 11: 6tq art aph statistiques

Statistiques

11

2) Histogramme

Une représentation graphique au moyen de rectangles s’appelle un

histogramme. La base de chaque rectangle correspond à l’intervalle de la

classe et l’aire de chaque rectangle est proportionnelle à la fréquence de la

classe correspondante.

En reprenant l’exemple des montants des virements dans lequel l’intervalle de

la classe est 20 €.

[0;20[

[20;40[

[40,60[[60;80[

[80;100[

[100;120[

0

5

10

15

20

3) Diagramme circulaire

En reprenant l’exemple du nombre de filles et de garçons dans une classe de

30 élèves, on a

filles

43%garçons

57%

L’amplitude de l’angle au centre du secteur circulaire représentant la modalité

« garçon » vaut 17

360 20430

.

Cette représentation est souvent utilisée lors des élections.

Page 12: 6tq art aph statistiques

Statistiques

12

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0,16

0,18

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

0

1

2

3

4

5

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

4) Polygone des effectifs et des fréquences

La construction du polygone des effectifs ou des fréquences est analogue à

celle du diagramme en bâtonnets mais, plutôt que de tracer des segments

verticaux, on relie les points de coordonnées ( , )k kx n dans le cas des effectifs et

( , )k kx f dans le cas des fréquences par des segments de droites pour tracer

finalement une ligne brisée.

En reprenant l’exemple des cotes obtenues lors d’un contrôle de géographie

par 25 élèves d’une classe, on a

1) Polygone des effectifs :

2) Polygone des fréquences

Page 13: 6tq art aph statistiques

Statistiques

13

0

0,2

0,4

0,6

0,8

1

1,2

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

0

5

10

15

20

25

30

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

5) Diagramme des effectifs cumulés et des fréquences cumulées

On porte en abscisses les différentes modalités (xk) et en ordonnées k (pour

les effectifs cumulés) ou Fk (pour les fréquences cumulées)

En reprenant l’exemple des cotes obtenues lors d’un contrôle de géographie

par 25 élèves d’une classe, on a

1) Diagramme des effectifs cumulés

2) Diagramme des fréquences cumulées

Page 14: 6tq art aph statistiques

Statistiques

14

C. Exercices

1. Dans une classe de 25 élèves, on a demandé à chaque étudiant de donner le

nombre d’animaux domestiques qu’il possède. Voici un diagramme en bâtonnets

représentant les données :

Identifie, en justifiant, le diagramme circulaire qui représente cette situation

A B C

2. Dans une université belge, on a relevé les nationalités d’un certain nombre

d’étudiants. Voici les résultats récoltés :

Nationalité Nombre d’étudiants

Belge 551

Française 356

Luxembourgeoise 267

Espagnole 68

Allemande 45

Non européens 213

a) Quel est l’effectif total de la série ?

b) Complète le tableau afin d’obtenir les fréquences de chacune des modalités.

Les effectifs et fréquences cumulés ont-ils un sens ?

d) Représente graphiquement ces données

sous la forme d’un diagramme à bâtonnets (l’axe horizontal

représente les nationalités et l’axe vertical les effectifs

correspondants).

sous la forme d’un diagramme circulaire (l’amplitude d’un angle au

centre est proportionnelle à l’effectif de la série statistique).

2 32%

1 24%

3 28%

4 16%

2 32%

1 24%

3 28%

4 16%

0

2

4

6

8

10

1 2 3 4

Nombre d'animaux domestiques

No

mb

re d

'étu

dia

nts

Page 15: 6tq art aph statistiques

Statistiques

15

3. Une enquête de police relative au nombre de procès-verbaux dressés à des

automobilistes en Belgique en 2003 a fourni les résultats suivants :

Nombre de procès-

verbaux (xk) 0 1 2 3 4 5 6 7 + de 7

Nombre

d’automobilistes (nk) 468 330 120 54 13 8 4 2 1

a) Combien d’automobilistes ont été sanctionnés ?

b) Complète le tableau suivant de la manière indiquée :

Modalités

xi

Effectifs

ni

Effectifs cumulés

i

Fréquences

ii

nf

n

Fréquences cumulées

iiF

n

0 468 468

1 330 468 + 330 = 798

2 120 798 + 120 = 918

…… ….. …..

c) Que représente dans la 3e colonne le nombre 798 ?

d) Combien d’automobilistes ont reçu moins de trois contraventions ?

e) Combien d’automobilistes ont reçu au moins trois contraventions ?

f) Représente le polygone des effectifs cumulés.

g) Représente le polygone des fréquences cumulées.

h) Compare les deux graphiques réalisés.

Page 16: 6tq art aph statistiques

Statistiques

16

4. De la truie aux porcelets

Dans le tableau suivant sont répertoriés le nombre de porcelets produits par une

truie au cours d’une année pour un élevages de 62 truies.

17 12 18 16 16 10 18 21 16 21 17

14 19 18 19 18 19 14 18 18 15 16

15 16 17 19 14 16 16 21 16 20

16 16 14 17 10 16 16 17 17 16

17 18 18 11 19 15 19 17 11 15

14 13 18 20 20 18 16 21 18 17

Ce tableau de 62 nombres n’est pas très parlant et, de plus, il n’est pas facile à

manipuler. Aussi, pour que ces résultats soient plus simples d’utilisation, nous

allons grouper certains résultats.

a) Forme des classes de longueur 2 : [10 ;12[ ; [12 ;14[ ;…. ;[20 ;22[ et

détermines-en le centre. Dresse ensuite un tableau de la forme :

Modalités Nombre de porcelets

par truie

Effectifs Nombre de

truies

Effectifs

cumulés

Centre de

la classe Fréquences

Fréquences

cumulées

[10 ;12[

…..

b) Construis un histogramme représentatif de cette série (la longueur de la base

de ces rectangles est la longueur des classes et la hauteur est l’effectif de

cette classe).

c) À l’aide du tableau ci-dessus, détermine :

le pourcentage de truies produisant moins de 16 porcelets

le pourcentage de truies produisant au moins 14 porcelets.

d) Détermine le nombre moyen de porcelets produits par truie au cours de

l’année (Lorsqu’il s’agit d’une enquête dont les résultats ont été répartis en

classes, il convient de prendre comme représentant le centre de celle-ci).

5. Voici un ensemble de nombres représentant les cotes attribuées, sur un maximum

égal à 20, à 50 élèves lors d’un examen de mathématique

10, 13, 7, 12, 16, 8, 10, 13, 18, 12, 12, 11, 11, 15, 13, 4, 8, 10, 14, 12, 9, 14, 12, 10, 18, 7, 12,

13, 16, 10, 15, 9, 12, 16, 13, 11, 12, 8, 14, 11, 15, 10, 13, 12, 13, 10, 16, 14, 11, 12

a) Dresse un tableau recensé et ordonné complet (modalités, effectifs, effectifs

cumulés, fréquences, fréquences cumulées)

b) Dessine le polygone des effectifs et le polygone des fréquences cumulées

Page 17: 6tq art aph statistiques

Statistiques

17

D. Symbole sommatoire

Le symbole sommatoire signifie qu’il faut faire la somme de toutes les

expressions obtenues en donnant à i toutes les valeurs entières entre la première

valeur indiquée sous le symbole et la dernière qui est indiquée au-dessus du symbole.

Exemples

5 7

2 2 2 2 2 2

i 1 i 3

i 1 2 3 4 5 15 , i 1 3 1 4 1 5 1 6 1 7 1

Ce symbole permet de simplifier de nombreuses formules mathématiques.

Exercices

1) Écris les expressions suivantes sans le symbole sommatoire et calcule-les quand

c’est possible :

a) 5

i 2

b) 7

i 0

2i 3

c) 100

i 1

i

d) 10

1k

k

e) 3

i 1

2

i

f) 2

3

i 0

i 1

g) n

i 1

2i 1

h) 5

0

3k

k

i) 3

i 1

3 0i

j) 7

i 2

3

k) 100

i 1

0

l) 9

3

0k

k

2) Écris les expressions suivantes à l’aide du symbole sommatoire :

a. 2 + 4 + 6 + 8 + ….+ 64

b. 2 + 22 + 23 + …. + 218

c. 1 + 4 + 9 + … + 225

d. 0+3+6+9+12+15

e. 1 1 11 ...

4 9 100

f. 5 5 5...

8 27 512

3) Voici deux formules. À quoi correspondent-elles ? 1

p

i

i

n

1

k

i

i

f

4) Écris les expressions suivantes en détaillant chacun des termes :

a) 6

1

j

j

x

b) 5

1j

m

c) 5

2

0

1k

k

y

d) 10

1

k k

k

f x

5) Écris les expressions suivantes en utilisant le symbole de sommation

a) 2 2 2

1 2 99....x x x b) 1 1 2 2 17 17....x z x z x z

c) 4 4 4

1 1 2 2 17 17....x y x y x y d) 2 181 3 3 .... 3

Page 18: 6tq art aph statistiques

Statistiques

18

E. Paramètres de position ou valeurs centrales

Dans le cas des caractères quantitatifs, on pourrait essayer de tirer davantage d’informations

à propos de la population observée. Une idée est de regarder la tendance centrale. Il existe

trois paramètres de position ou valeurs centrales.

1. Moyenne arithmétique

Définition

La moyenne arithmétique, notée x , des n nombres x1, x2, ..., xn est le nombre

1 2

1

... 1 nn

i

i

x x xx x

n n

On utilise parfois une autre formulation pour la moyenne arithmétique :

Si n1 est l’effectif de la modalité x1, n2 celui de la modalité x2 , ..., np celui de la

modalité xp et n l’effectif total (n = n1 + n2 + ... + np),

alors

1 1 2 2

1

..... 1 pp p

i i

i

x n x n x nx n x

n n

Exemples

1) Six élèves ont présenté un examen oral de mathématiques ; les résultats sont les

suivants : 8 – 10 – 10 – 13 – 14 – 14 .

La moyenne arithmétique est alors x

En consignant les notes obtenues par les élèves dans un tableau groupé, on obtient :

Modalités (notes : xk)

Effectifs (nk)

La moyenne arithmétique des notes peut alors se calculer de la manière suivante :

x

Page 19: 6tq art aph statistiques

Statistiques

19

2) Lorsqu’il s’agit d’un caractère quantitatif dont les résultats ont été répartis en

classes, il convient de prendre comme représentant le centre de celle-ci.

En reprenant l’exemple des 80 virements de moins de 120 €, on dresse le tableau

Modalités

kx Centres Effectifs

kn

[0,20[ 10 8

[20,40[ 30 12

[40,60[ 50 16

[60,80[ 70 17

[80,100[ 90 12

[100,120[ 110 15

Dans ce cas,

x

Remarque

Calculer la moyenne arithmétique d’un caractère qualitatif n’a aucun sens.

2. Médiane

La moyenne arithmétique ne suffit pas toujours pour décrire une population d’un point de

vue statistique car elle peut être fortement influencée par ses valeurs extrêmes.

Définition

La médiane, notée M, d’une série statistique à caractère quantitatif est la valeur du

caractère telle que la moitié de l’effectif total lui est inférieure ou égale et l’autre

moitié lui est supérieure ou égale.

Exemples

Cas où l’effectif total est impair :

Cinq élèves ont présenté un examen oral de mathématiques ; les résultats

sont les suivants : 8 – 9 – 10 – 13 – 14. La médiane est 10 car deux cotes lui

sont inférieures et deux lui sont supérieures.

Cas où l’effectif total est pair :

Six élèves ont présenté un examen oral de mathématiques ; les résultats

sont les suivants : 8 – 9 – 10 – 13 – 14 - 15 .

La médiane est la moyenne arithmétique de 10 et de 13, à savoir 11,5 car

deux cotes leur sont inférieures et deux leur sont supérieures. Il est à noter

ici que la médiane et la moyenne coïncident.

Page 20: 6tq art aph statistiques

Statistiques

20

3. Quartiles

Définition

Les quartiles partagent la population en quatre groupes de même effectif.

Exemples

1) Dans la série 2 - 8 - 8 - 9 - 10 - 12 - 13 - 13 - 13 - 15 - 16 - 18 - 20, nous avons

Q1 =

Q2 = (le 2ème quantile correspond toujours à la médiane)

Q3 =

2) Dans la série 2 - 4 - 5 - 6 - 6 - 7 - 8 - 8 - 9 - 10 - 10, nous avons

Q1 =

Q2 =

Q3 =

4. Mode

Définition

Le mode est la valeur du caractère auquel correspond l’effectif le plus élevé.

On parle de classe modale dans le cas d’un caractère quantitatif dont les modalités

ont été regroupées en classes.

Exemples

1) Cinq élèves ont présenté un examen oral de mathématiques ; les résultats sont les

suivants : 8 – 10 – 10 – 13 – 14. Le mode est 10, c’est la cote la plus fréquente.

2) Dans l’exemple des montants des 80 virements, la classe modale est [60;80[.

Remarques

1) Le mode (ou la classe modale) d’une population peut ne pas être unique.

Par exemple, la série 8 – 10 – 10 – 13 – 14 - 14 n’a pas de mode unique.

(les cotes 10 et 14 apparaissent un même nombre de fois).

2) En statistiques, le mot « mode » est masculin. Il a cependant pour origine le mot

« mode » au féminin qui correspond à une « tendance dominante ».

Page 21: 6tq art aph statistiques

Statistiques

21

5. Exercices

1. Voici les cotes obtenues par 25 élèves d’une classe lors d’un contrôle de géographie

( il s’agit de l’exercice 2 page 8)

12 03 13 15 17 11 15 13 13 18 11 13 20 12 11

08 12 05 08 19 10 17 05 15 20

a) Détermine la moyenne de cette série

b) Détermine la médiane et les quartiles

c) Détermine le mode

2. Une enquête de police relative au nombre de procès-verbaux dressés à des

automobilistes en Belgique en 2003 a fourni les résultats suivants :

( il s’agit de l’exercice 3 page 15)

Nombre de procès-

verbaux (xk) 0 1 2 3 4 5 6 7 + de 7

Nombre

d’automobilistes (nk) 468 330 120 54 13 8 4 2 1

a) Détermine la moyenne de cette série

b) Détermine la médiane et les quartiles

c) Détermine le mode

Page 22: 6tq art aph statistiques

Statistiques

22

F. Paramètres de dispersion d’une série statistique

Voici les cotes obtenues (sur 20) à trois contrôles par Marie et Pierre :

Marie : 09 – 10 – 11

Pierre : 00 – 10 – 20

Ces deux séries ont la même moyenne arithmétique (à savoir …....)

et la même médiane ( à savoir …..…).

Cependant, elles diffèrent radicalement ; la seconde série paraît plus dispersée que la

première qui semble plus groupée autour des valeurs centrales.

Nous allons déterminer de nouveaux paramètres qui vont caractériser cette dispersion.

1. Etendue

Définition

L’étendue d’une série statistique est la différence entre la plus grande et la plus petite

valeur de la série.

Exemples

Série 1 : 312 – 314 – 317 – 320 – 322 Série 2 : 267 – 292 – 317 – 342 – 367

L’étendue de la 1re série est

et celle de la 2e série est

Bien que le calcul de l’étendue d’une série statistique soit particulièrement simple,

ce paramètre a pour gros désavantage de ne tenir compte que des deux valeurs

extrêmes.

L’étendue pour Marie est et pour Pierre est

2. Ecart moyen

Une idée parmi d’autres serait de calculer comment les résultats s’écartent par rapport à

la moyenne, c’est-à-dire de calculer ix x où xi désigne n’importe quelle modalité et x

la moyenne arithmétique.

Définition

L’écart moyen d’une série statistique est 1

1 p

i i

i

n x xn

.

Page 23: 6tq art aph statistiques

Statistiques

23

Exemples

Reprenons l’exemple ci-dessus et calculons la moyenne des écarts:

xi ni ix x xi ni ix x

312 1 267 1

314 1 292 1

317 1 317 1

320 1 342 1

322 1 367 1

La moyenne des écarts (l’écart moyen) pour chacun des exemples vaut

Que vaut la moyenne des écarts pour Pierre et Marie ?

Cette caractéristique n’est donc d’aucune utilité puisque les écarts négatifs

sont compensés par les écarts positifs.

3. Ecart moyen absolu

Afin d’éviter les désagréments dus aux signes, on introduit des valeurs absolues pour

le calcul des écarts.

Définition

L’écart moyen absolu d’une série statistique, noté e, est la moyenne des valeurs

absolues des écarts de chaque valeur par rapport à la moyenne.

1 1 2 2

1

1 1...

p

p p i i

i

e n x x n x x n x x n x xn n

Exemples

Reprenons la série 1 ci-dessus : 312 – 314 – 317 – 320 – 322

xi ni ix x

312 1

314 1

317 1

320 1

322 1

La moyenne des écarts moyens absolus est donc égale à

Cette valeur signifie qu’en moyenne, les valeurs s’écartent de 3,2 autour de la

moyenne arithmétique.

Page 24: 6tq art aph statistiques

Statistiques

24

Reprenons à présent la série 2 : 267 – 292 – 317 – 342 – 367

xi ni ix x

267 1

292 1

317 1

342 1

367 1

La moyenne des écarts moyens absolus est donc égale à

.

Cette valeur signifie qu’en moyenne, les valeurs s’écartent de 30 autour de la

moyenne arithmétique.

La deuxième série est donc beaucoup plus dispersée que la première.

Quel est l’écart moyen absolu pour Pierre et pour Marie ?

Pour qui les résultats sont-ils les plus dispersés ?

4. Variance - Ecart-type

Afin de mettre davantage en évidence les différences entre les variables très écartées de la

moyenne et la moyenne, on remplace les écarts par leur carré.

Définitions - Notations

La variance, notée V, d’une série statistique est la moyenne arithmétique des

carrés des écarts par rapport à la moyenne de toutes les valeurs de la série.

2 2 2

21 1 2 2

1

... 1 pp p

i i

i

n x x n x x n x xV n x x

n n

L’écart-type, noté , est la racine carrée positive de la variance.

2

1

1 p

i i

i

V n x xn

.

Remarques

1) L’importance en statistiques de l’écart-type réside dans le fait que, généralement,

- l’intervalle 2 ; 2m m contient 95% de la population autour de la moyenne ;

- l’intervalle 3 ; 3m m contient 99% de la population autour de la moyenne.

2) Dans le cas d’un caractère quantitatif dont les modalités sont regroupées par

classes, les xi doivent être remplacés par les centres des classes.

Page 25: 6tq art aph statistiques

Statistiques

25

Exemples

Série 1 : 312 – 314 – 317 – 320 – 322 317x

xi ni 2

i in x x

312 1

314 1

317 1

320 1

322 1

La variance est donc égale à et l’écart-type vaut environ

Série 2 : 267 – 292 – 317 – 342 – 367 317x

xi ni 2

i in x x

267 1

292 1

317 1

342 1

367 1

La variance est donc égale à et l’écart-type vaut environ

5. Intervalle interquartile

Définition

L’intervalle interquartile d’une série statistique est l’intervalle dont les

extrémités sont Q1 et Q3 , lorsque Q1 est le 1er quartile et Q3 le 3e quartile.

Dans un tableau groupé, cet intervalle contient généralement la moitié de la

population.

Exemple

En reprenant l’exemple des cotes obtenues par les 25 élèves d’une classe au contrôle

de géographie (exemple 2 page 8), le 1er quartile Q1 étant ……. et le 3e quartile Q3

étant ……., l’intervalle interquartile est […….,…….] et contient …….% de la

population.

Page 26: 6tq art aph statistiques

Statistiques

26

Paramètres de position et de dispersion : Résumé

A. PARAMETRES DE POSITION

1) Moyenne arithmétique : x = somme de toutes les valeurs de la série

effectif total

2) Médiane : Nombre qui partage la série en deux parties d’effectifs égaux.

On la note M.

3) Quartiles : Nombres qui partagent la série en quatre parties d’effectifs

égaux.

On les note Q1, Q2 et Q3 et on a toujours Q2 = M.

Attention ! Avant de rechercher la médiane et les quartiles, il faut

commencer par ordonner les valeurs.

4) Mode : Modalité dont l’effectif est le plus élevé (=modalité qui apparaît le

plus grand nombre de fois dans la série)

Remarque : Lorsqu’il n’y a aucune modalité qui domine, on dit qu’il n’y a pas

de mode.

B. PARAMETRES DE DISPERSION

1) Etendue = Différence entre la plus grande et la plus petite valeur de la série.

2) Ecart moyen = Moyenne des écarts par rapport à la moyenne.

Ce paramètre est inutile car il vaut toujours 0.

3) Ecart moyen absolu = Moyenne des valeurs absolues des écarts par rapport

à la moyenne. On le note e.

4) Variance = Moyenne des carrés des écarts par rapport à la moyenne.

On la note V.

5) Ecart-type = racine carrée positive de la variance. On le note .

6) Intervalle inter-quartile = [Q1 ;Q3]

Remarque : - l’intervalle 2 ; 2m m contient 95% de la population

- l’intervalle 3 ; 3m m contient 99% de la population

Page 27: 6tq art aph statistiques

Statistiques

27

C. EXEMPLE

Considérons la série : 4 - 9 - 3 - 6 - 10 - 15 - 2 - 18 - 3 - 3

1) Moyenne : 4 9 3 6 10 15 2 18 3 3

7,310

x

2) Médiane : On commence par ordonner la série : 2 - 3 - 3 - 3 - 4 - 6 - 9 - 10 - 15- 18

La médiane est 5 (c’est la moyenne entre 4 et 6). Il y a exactement 5

valeurs inférieures à 5 et 5 valeurs supérieures à 5.

3) Quartiles : On a Q1 = 3, Q2 = M = 5 et Q3 = 10

4) Mode : Le mode est 3 car c’est cette valeur qui apparaît le plus grand nombre de

fois dans la série.

5) Etendue : L’étendue est 16 : c’est la différence entre 18 et 2

6) Ecart moyen : Il vaut toujours 0

7) Ecart moyen absolu / Variance / Ecart-type

ix | |ix x 2( )ix x

2 5,3 28,09

3 4,3 18,49

3 4,3 18,49

3 4,3 18,49

4 3,3 10,89

6 1,3 1,69

9 1,7 2,89

10 2,7 7,29

15 7,7 59,29

18 10,7 114,49

On a 5,3 4,3 4,3 4,3 3,3 1,3 1,7 2,7 7,7 10,7

4,5610

e

On a 28,09 18,49 18,49 18,49 10,89 1,69 2,89 7,29 59, 29 114,49

28,0110

M

On a 28,01 5,29M

Ici, l’intervalle 3 ; 3 [7,3 3 . 5,29 ; 7,3 3 . 5,29] [ 8,57;23,17]m m contient bien toute

la population

Page 28: 6tq art aph statistiques

Statistiques

28

G. Exercices

1. Après avoir calculé le mode (ou la classe modale) ainsi que la moyenne des séries

suivantes, représente ces données par un diagramme en bâtons ou un histogramme :

1e situation : nombre de téléviseurs par famille d’une classe

Modalités Effectif

0 2

1 13

2 7

3 3

4 1

5 1

2e situation : âge des arbres d’une forêt

Classes Effectif

[0,15[ 997

[15,30[ 1617

[30,45[ 3114

[45,60[ 1514

[60,75[ 1865

[75,90[ 213

2. Une classe de 4e année est composée de 30 élèves dont 10 filles et 20 garçons. Le

relevé des tailles exprimées en cm de chaque élève a donné les résultats suivants :

Pour les filles : 170 ;174 ;180 ;185 ;176 ;180 ;180 ;171 ;181 ;172

Pour les garçons : 175 ;170 ;174 ;173 ;170 ;180 ;172 ;170 ;179 ;

168 ;174 ;174 ;175 ;182 ;170 ;170 ;172 ;168 ;173 ;185

a. 1) Calcule la taille moyenne des filles.

2) Calcule la taille moyenne des garçons.

3) Déduis-en la taille moyenne d’un élève de cette classe.

3. Arthur a obtenu aux cours de mathématiques les cotes (sur 20) suivantes :

17 ;13 ;x ;12 ;08 ;13.

Détermine la valeur de x si on t’informe que sa moyenne est de 13 sur 20.

Page 29: 6tq art aph statistiques

Statistiques

29

4 Une entreprise dispose de 60 camions et désire étudier le taux de panne. Pour cela,

le chef mécanicien note, jour après jour, pendant le mois d’avril, le nombre de

camions en panne. Ses observations ont été les suivantes.

5 4 6 3 6 5

7 0 2 2 2 4

3 5 1 1 0 1

2 5 5 7 6 7

5 4 3 5 6 5

a. Détermine la moyenne, le mode et la médiane de cette série statistique.

b. Calcule la variance puis l’écart-type de cette série.

5. Dans un petit potager, on a récolté 140 gousses de haricots et on a dénombré le

nombre de grains de chaque gousse. On a obtenu les résultats suivants :

Nombre

de grains

(xi)

1 2 3 4 5 6 7 8 9 10

Nombre

de

gousses

(ni)

3 5 9 18 32 38 20 7 6 2

a) Calcule la moyenne x de cette série.

b) Que vaut l’écart-moyen de cette série ?

c) Calcule l’écart-moyen absolu de cette série ?

d) Construis les lignes te permettant de calculer la variance et l’écart-type.

6. On a interrogé 40 personnes quant au nombre de livres qu’elles ont lus l’an dernier.

Les résultats sont les suivants :

15 24 31 30 25 7 4 1

2 8 13 21 17 2 32 34

34 25 21 13 17 20 18 14

5 18 0 24 3 14 1 2

11 27 33 19 7 2 4 25

a. Ordonne les résultats obtenus.

b. Calcule la médiane, le mode, les quartiles et la moyenne arithmétique.

c. Calcule l’étendue, la variance et l’écart-type.

Page 30: 6tq art aph statistiques

Statistiques

30

7. On étudie les précipitations dans les villes de Bruxelles et de Paris. Cette étude a

été réalisée sur une période d’un an. Les mesures sont exprimées en mm.

Mois Bruxelles Paris

Janvier 71,3 60,4

Février 62,3 54,7

Mars 57,3 67,2

Avril 63,5 54,2

Mai 49,6 43,2

Juin 34,3 23,2

Juillet 25,2 18,6

Août 13,9 18,2

Septembre 33,5 29,6

Octobre 49,8 54,2

Novembre 52,3 53,2

Décembre 64,5 65,7

a. Dans quelle ville pleut-il le plus en moyenne ?

b. Quelle est la ville dans laquelle les précipitations sont les plus régulières ?

8. Un organisme a interrogé 300 familles de 8 enfants. On leur a demandé combien de

garçons figuraient parmi ces 8 enfants. On a obtenu les résultats suivants :

Nombre de

garçons xi

Effectif

ni

0 17

1 28

2 54

3 68

4 58

5 38

6 27

7 8

8 2

a. Quel est le caractère étudié ? Est-il quantitatif ou qualitatif ?

b. Quelle est la valeur du caractère qui a le plus grand effectif ?

c. Quelle est la moyenne, la médiane, la variance et l’écart-type de cette série ?

d. Représente graphiquement cette situation.

Page 31: 6tq art aph statistiques

Statistiques

31

9. Lors d’un recensement, on a relevé le nombre d’enfants dans 100 familles

Nombre de d’enfants Effectifs

0 9

1 23

2 26

3 16

4 13

5 7

6 3

7 2

8 1

a) Calcule la moyenne de cette série

b) Calcule la médiane, les quartiles et le mode

c) Calcule l’écart moyen absolu de cette série

d) Calcule la variance et l’écart-type