22
Tableaux de distributions et histogramme

Tableaux de distributions et histogramme. Certaines distributions de données peuvent être très longues. Ainsi, il est souvent nécessaire de condenser

Embed Size (px)

Citation preview

Page 1: Tableaux de distributions et histogramme. Certaines distributions de données peuvent être très longues. Ainsi, il est souvent nécessaire de condenser

Tableaux de distributions

et

histogramme

Page 2: Tableaux de distributions et histogramme. Certaines distributions de données peuvent être très longues. Ainsi, il est souvent nécessaire de condenser

Certaines distributions de données peuvent être très longues.

Ainsi, il est souvent nécessaire de condenser ces données sous une forme plus propice à l’analyse statistique.

Les tableaux de distribution et les diagrammes sont des outils qui permettent une meilleure compréhension des phénomènes étudiés.

Ils permettent de faire de meilleures prédictions et de prendre de meilleures décisions.

Page 3: Tableaux de distributions et histogramme. Certaines distributions de données peuvent être très longues. Ainsi, il est souvent nécessaire de condenser

Les listes de distribution sont importantes car elles permettent d’obtenir des informations précises.

Cependant, il n’est pas facile de voir ce qui ressort le plus.

6

Exemple:

Page 4: Tableaux de distributions et histogramme. Certaines distributions de données peuvent être très longues. Ainsi, il est souvent nécessaire de condenser

La même étude ( synthétisée ) fait apparaître un phénomène très clair.

Page 5: Tableaux de distributions et histogramme. Certaines distributions de données peuvent être très longues. Ainsi, il est souvent nécessaire de condenser

Le tableau à données condensées.

Lorsqu’une distribution comporte un petit nombre de données différentes et qu’elles ont tendance à se répéter, il convient de les compiler dans un tableau dont les données sont condensées.

Total

Âge Effectif

23456789

101112

Répartition des enfants d’une garderie

21162221211

21

Page 6: Tableaux de distributions et histogramme. Certaines distributions de données peuvent être très longues. Ainsi, il est souvent nécessaire de condenser

Le tableau à données condensées.

Exemple : Voici une liste de données représentant l’âge d’un groupe d’enfants à une garderie.

2, 2, 3, 4, 5, 5, 5, 5, 5, 5, 6, 6, 7, 7, 8, 8, 9, 10, 10, 11, 12.

Voici le tableau de distribution :

Total

Âge Effectif

23456789

101112

Répartition des enfants d’une garderie

On place le caractère de l’étude ( les données ).

Ici, l’âge.Ce sont les effectifs.

Cette colonne indique le nombre de fois que la donnée se répète.

Il reste à compiler.

21162221211

21

Il faut toujours indiquer le nombre total de données.

Il faut toujours donner un titre.

Page 7: Tableaux de distributions et histogramme. Certaines distributions de données peuvent être très longues. Ainsi, il est souvent nécessaire de condenser

Total

Âge Effectif

23456789

101112

Répartition des enfants d’une garderie

21162221211

21

Le tableau est complété.

Il donne plusieurs informations.

n = 21 données

Mo = 5 ans

Médiane :

La médiane est donc la 11e donnée en partant du début.

On compte les effectifs à partir du début.

n ÷ 2 = 10,5

10 données

11e donnée

Md = 6 ans

La moyenne :

On fait :

( 2X2 + 3X1 + 4X1 + 5X6 + 6X2 + 7X2 + 8X2 + 9X1 + 10X2 + 11X1 + 12 X 1 )

21

x ≈ 6,43

total des effectifs

la somme des produits des valeurs par leur effectif

Page 8: Tableaux de distributions et histogramme. Certaines distributions de données peuvent être très longues. Ainsi, il est souvent nécessaire de condenser

On utilise ce type de tableau lorsque les données de la distribution n’ont pas tendance à se répéter et qu’il y a un très grand nombre de possibilités.

Le tableau de données groupées en classes

Consommation d’eau hebdomadaire

[ 0 , 10 [

[ 10 , 20 [

[ 20 , 30 [

[ 30, 40 [

[ 40 , 50 [

Quantité (L)

Total

Effectif

10

9

7

11

13

50

Page 9: Tableaux de distributions et histogramme. Certaines distributions de données peuvent être très longues. Ainsi, il est souvent nécessaire de condenser

Le tableau de données groupées en classes

Voici les données recueillies lorsqu’on a demandé à 50 élèves la quantité d’eau qu’ils consomment par semaine :

Exemple :

2, 2, 5, 5, 6, 6, 6, 7, 7, 8, 10, 11, 11, 13, 13, 13, 13, 15, 17, 24, 24, 24, 26, 27, 27, 29, 30, 30, 30, 32, 33, 33, 34, 36, 37, 38, 39, 40, 41, 42, 44, 44, 45, 45, 46, 46, 47, 47, 47, 47.

La 1ère étape est d’écrire la liste en ordre croissant.

Ce qui est fait ici.

La 2e étape est de regrouper toutes ces données en classes.

Page 10: Tableaux de distributions et histogramme. Certaines distributions de données peuvent être très longues. Ainsi, il est souvent nécessaire de condenser

Déterminer les classes

1) Calculer l’étendue : Max. – min. =

2, 2, 5, 5, 6, 6, 6, 7, 7, 8, 10, 11, 11, 13, 13, 13, 13, 15, 17, 24, 24, 24, 26, 27, 27, 29, 30, 30, 30, 32, 33, 33, 34, 36, 37, 38, 39, 40, 41, 42, 44, 44, 45, 45, 46, 46, 47, 47, 47, 47.

47 – 2 = 45

2) Déterminer le nombre de classes :

Il n’y a pas de règle stricte pour trouver le nombre de classes;

un tableau compte habituellement entre 5 et 10 classes.

Il s’agit de faire une représentation facile à lire.

3) Déterminer la largeur des classes.

On divise l’étendue par le nombre de classes retenues.

S’il y a 5 classes.

Largeur d’une classe : étenduenombre de classes

=

455

≈ 9

La largeur de chaque classe pourrait être de 10 unités.

Page 11: Tableaux de distributions et histogramme. Certaines distributions de données peuvent être très longues. Ainsi, il est souvent nécessaire de condenser

Les classes seront donc : [ 0 , 10 [

[ 10 , 20 [

[ 20 , 30 [

[ 30 , 40 [

[ 40 , 50 [

La façon d’écrire les classes doit respecter des règles.

Les classes doivent avoir la même largeur.

Ici, chaque classe a une largeur de 10 unités.

La classe [ 0 , 10 [ signifie que toutes les données comprises entre 0 inclus et 10 exclu y seront inscrites.

La classe [ 10 , 20 [ signifie que toutes les données comprises entre 10 inclus et 20 exclu y seront inscrites.

Les classes doivent être choisies de telle sorte que la plus petite et la plus grande données y soient incluses.

2, 2, 5, 5, 6, 6, 6, 7, 7, 8, 10, 11, 11, 13, 13, 13, 13, 15, 17, 24, 24, 24, 26, 27, 27, 29, 30, 30, 30, 32, 33, 33, 34, 36, 37, 38, 39, 40, 41, 42, 44, 44, 45, 45, 46, 46, 47, 47, 47, 47.

2 sera inclus dans [ 0 , 10 [ et 47 sera inclus dans [ 40 , 50 [ donc correct.

Chaque classe débute par un crochet fermé et se termine par un crochet ouvert.

Page 12: Tableaux de distributions et histogramme. Certaines distributions de données peuvent être très longues. Ainsi, il est souvent nécessaire de condenser

2, 2, 5, 5, 6, 6, 6, 7, 7, 8, 10, 10, 11, 13, 13, 13, 13, 15, 17, 24, 24, 24, 26,

27, 27, 29, 30, 30, 30, 32, 33, 33, 34, 36, 37, 38, 39, 40, 41, 42, 44, 44,

45, 45, 46, 46, 47, 47, 47, 47.

On peut maintenant compiler les données.

Consommation d’eau hebdomadaire

[ 0 , 10 [

[ 10 , 20 [

[ 20 , 30 [

[ 30, 40 [

[ 40 , 50 [

Quantité (L)

Total

Effectif

10

9

7

11

13

50

Page 13: Tableaux de distributions et histogramme. Certaines distributions de données peuvent être très longues. Ainsi, il est souvent nécessaire de condenser

Le tableau est complété.

Il donne plusieurs informations.

n = 50 données

Mode :

Dans un tableau à données groupées en classe, on peut avoir une classe modale .

Il s’agit de la classe possédant le plus d’effectifs.

Ici, la classe modale est [ 40 , 50 [.

On ne peut pas connaître avec précision le mode.

Cependant, on peut l’estimer.

On prend alors le milieu de la classe modale : ( 40 + 50 ) ÷ 2 = 45

Mo ≈ 45 L

Consommation d’eau hebdomadaire

[ 0 , 10 [

[ 10 , 20 [

[ 20 , 30 [

[ 30, 40 [

[ 40 , 50 [

Quantité (L)

Total

Effectif

10

9

7

11

13

50

Page 14: Tableaux de distributions et histogramme. Certaines distributions de données peuvent être très longues. Ainsi, il est souvent nécessaire de condenser

Le tableau est complété.

Il donne plusieurs informations.

Médiane :

n ÷ 2 = 25

La médiane est donc la moyenne de la 25e et 26e donnée.

On compte les effectifs à partir du début.

19 données

+ 6 données

La classe contenant la médiane s’appelle la classe médiane.

On ne peut pas connaître avec précision la médiane.

Cependant, on peut l’estimer.

On prend alors le milieu de la classe médiane : ( 20 + 30 ) ÷ 2 = 25

Md ≈ 25 L

Ici, la classe médiane est [ 20 , 30 [.

Consommation d’eau hebdomadaire

[ 0 , 10 [

[ 10 , 20 [

[ 20 , 30 [

[ 30, 40 [

[ 40 , 50 [

Quantité (L)

Total

Effectif

10

9

7

11

13

50

Page 15: Tableaux de distributions et histogramme. Certaines distributions de données peuvent être très longues. Ainsi, il est souvent nécessaire de condenser

Le tableau est complété.

Il donne plusieurs informations.

La moyenne :

On ne peut pas calculer précisément la moyenne dans un tableau de données groupées en classes.

Cependant, on peut l’estimer.

On fait :

la somme des produits des milieux des classes par leur effectiftotal des effectifs

( 5 X 10 + 15 X 9 + 25 X 7 + 35 X 11 + 45 X 13 )

50=

1 330

50≈ 26,6

x ≈ 26,6 L

Remarque : Comme le milieu de la première classe est 5 et que les classes ont toutes une largeur de 10, le milieu de chacune des classes augmentera de 10 unités.

Consommation d’eau hebdomadaire

[ 0 , 10 [

[ 10 , 20 [

[ 20 , 30 [

[ 30 , 40 [

[ 40 , 50 [

Quantité (L)

Total

Effectif

10

9

7

11

13

50

Page 16: Tableaux de distributions et histogramme. Certaines distributions de données peuvent être très longues. Ainsi, il est souvent nécessaire de condenser

L’histogramme

10 20 30 40 50

2

4

6

8

10

12

14

Litres0

Élèves

Consommation d’eau hebdomadaire

L’histogramme est la représentation graphique d’un tableau de données groupées en classes.

Page 17: Tableaux de distributions et histogramme. Certaines distributions de données peuvent être très longues. Ainsi, il est souvent nécessaire de condenser

L’histogramme

Reprenons notre exemple :

Pour construire l’histogramme, il faut :

2

4

6

8

10

12

14

En abscisse, on place les classes.

On utilise la limite inférieure de chaque classe.

10 20 30 40 50 Litres

En ordonnée, on place les effectifs.

Élèves

- tracer, graduer également et identifierles axes;

On trace des rectangles de même largeur et de hauteur correspondant à l’effectif de chaque classe.

0

Consommation d’eau hebdomadaire

[ 0 , 10 [

[ 10 , 20 [

[ 20 , 30 [

[ 30, 40 [

[ 40 , 50 [

Quantité (L)

Total

Effectif

10

9

7

11

13

50

Page 18: Tableaux de distributions et histogramme. Certaines distributions de données peuvent être très longues. Ainsi, il est souvent nécessaire de condenser

Il ne faut pas oublier le titre.Consommation d’eau hebdomadaire

L’histogramme donne aussi beaucoup d’informations.

Le total des données : n = 50

109

13

11

7

La classe modale :

et le mode en prenant le milieu de la classe modale : Mo ≈ 45 L

[ 40 , 50 [

2

4

6

8

10

12

14

10 20 30 40 50 Litres

Élèves

0

Page 19: Tableaux de distributions et histogramme. Certaines distributions de données peuvent être très longues. Ainsi, il est souvent nécessaire de condenser

Consommation d’eau hebdomadaire

109

13

8

11

n ÷ 2 = 50 ÷ 2 = 25

19 + 6

Md ≈ 25 L

La classe médiane :

La médiane est donc la moyenne de la 25e et 26e donnée.

On compte les effectifs à partir du début.

On ne peut pas connaître avec précision la médiane.

Cependant, on peut l’estimer.

On prend alors le milieu de la classe médiane : ( 20 + 30 ) ÷ 2 = 25

La classe médiane est donc [ 20 , 30 [.

2

4

6

8

10

12

14

10 20 30 40 50 Litres

Élèves

0

7

Page 20: Tableaux de distributions et histogramme. Certaines distributions de données peuvent être très longues. Ainsi, il est souvent nécessaire de condenser

la somme des produits des milieux des classes par leur effectiftotal des effectifs

La moyenne :

On ne peut pas calculer précisément la moyenne dans un histogramme.

Cependant, on peut l’estimer.

On fait :

Consommation d’eau hebdomadaire

109

13

8

11

2

4

6

8

10

12

14

10 20 30 40 50 Litres

Élèves

0

7

( 5 X 10 + 15 X 9 + 25 X 7 + 35 X 11 + 45 X 13 )

50=

1 330

50≈ 26,6

x ≈ 26,6 L

Page 21: Tableaux de distributions et histogramme. Certaines distributions de données peuvent être très longues. Ainsi, il est souvent nécessaire de condenser

Remarque :

[ 30 , 40 [

[ 40 , 50 [

[ 50 , 60 [

[ 60 , 70 [

[ 70 , 80 [

Données

Total

Effectif

[ 20 , 30 [ 3

6

10

12

8

5

44

S’il n’y a pas de classe qui débute à 0,

Il faudra penser à mettre une coupure d’axe.

20 30 40 50 60 70

2

4

6

8

10

12

14

080

Page 22: Tableaux de distributions et histogramme. Certaines distributions de données peuvent être très longues. Ainsi, il est souvent nécessaire de condenser

Interprétation

Mo ≈ 45 L Md ≈ 25 L x ≈ 26,6 L

-19 individus sont au-dessous de la moyenne.

Dans ce groupe d’élèves :

- La classe modale n’est pas centrale.

- La médiane ou la moyenne sont représentatives de la quantité moyenne de litres d’eau consommée par semaine.

- Il y a plus d’élèves qui boivent beaucoup d’eau.

- 24 individus sont au-dessus de la moyenne.

Il serait intéressant d’en comprendre la raison.

Consommation d’eau hebdomadaire

109

13

8

11

2

4

6

8

10

12

14

10 20 30 40 50 Litres

Élèves

0

7