68
Chapitre 1 : Les tableaux et représentations graphiques Pr. Abdelkrim EL MOUATASIM EST & FE de Guelmim Maroc Site internet : http://el-mouatasim.webs.com

Ch1 statistique v

Embed Size (px)

Citation preview

Page 1: Ch1 statistique v

Statistique DescriptiveChapitre 1 : Les tableaux et

représentations graphiques

Pr. Abdelkrim EL MOUATASIM

EST & FE de Guelmim

Maroc

Site internet : http://el-mouatasim.webs.com

Page 2: Ch1 statistique v

Objectifs de ce module

Savoir décrire et représenter une série statistique par un tableau et un ou plusieurs graphiques adaptés.

On fera des choix des représentations différents selon la nature du caractère.

Statistiques descriptives à une variable : représentations

Page 3: Ch1 statistique v

Introduction

La représentation tabulaire est préalable à toute analyse statistique.

Elle fait suite au travail préliminaire de collecte des données.

La représentation graphique d’un seul caractère repose sur une règle de proportionnalité des hauteurs ou aires des graphiques aux effectifs (ou fréquences).

Le choix d’un type de graphique dépendra de la nature du caractère étudié.

Page 4: Ch1 statistique v

Plan du chapitre 1

I. Caractères qualitatifs.

II. Caractères quantitatifs discrets.

III. Caractères quantitatifs continus.

Voici les parties que nous allons aborder :

Page 5: Ch1 statistique v

Plan de la partie

1. Représentation tabulaire. 2. Diagramme à bande.3. Diagramme circulaire.

Voici les chapitres que nous allons aborder :

Ⅰ. Caractères qualitatifs

Page 6: Ch1 statistique v

1. Représentation tabulaire

Tableau à simple entrée, sans hiérarchie (sauf si le caractère est ordinal).

La première colonne renseigne les modalités et les deux suivantes les effectifs et fréquences.

Si le caractère est ordinal, on pourra rajouter une dernière colonne avec les fréquences cumulées.

Ⅰ. Caractères qualitatifs

Page 7: Ch1 statistique v

Noms Situation de f amille

M.Azim Marié

MFarid Veuf

Mme Latifi Mariée

Melle Fatiha Célibataire

M. Ahmed Divorcé

M. Salih Marié

M. Berrada Divorcé

Mme Réda Divorcée

Melle Fatiha Célibataire

M. Halim Marié

M. Chadi Veuf

Mme Faouzi Mariée

... ...

Exemple: On a noté la situation familiale des 150 employés d'une entreprise.

1. Représentation tabulaire

Ⅰ. Caractères qualitatifs

Page 8: Ch1 statistique v

On ne s'intéresse pas à la situation personnelle de M. Azim ou de M. Farid, mais à la répartition du caractère "situation familiale" dans la population des 150 employés.

Pour cela il faut, pour chacune des modalités de la variable, déterminer l'effectif correspondant, c'est-à-dire le nombre de personnes ayant cette modalité : il faut dénombrer le nombre de célibataires, le nombre de mariés, etc..

Page 9: Ch1 statistique v

Cela peut se résumer par :

Modalités Eff ectif s

Marié 80

Célibataire 30

Veuf 20

Divorcé 20

Page 10: Ch1 statistique v

On notera x1, x2, ..., xk les différentes

modalités, et n1, n2, ... , nk les effectifs

associés.

Dans le tableau ci-dessus, x1 = "marié",

n1 =

k =

La somme des effectifs vaut :

La variable que nous venons de voir

est…

Page 11: Ch1 statistique v

On aurait pu tout aussi bien présenter les résultats sous la forme ci-dessus, par exemple.

Modalité Eff ectif

Célibataire 30

Marié 80

Divorcé 20

Veuf 20

Page 12: Ch1 statistique v

Par contre, s'il s'agit d'une variable ordinale, les modalités sont toujours présentées dans l'ordre :

x1 x2 .... xk , comme dans l'exemple ci-dessous.

Modalités = tailles

Eff ectif s = Nombre de personnes de cette taille

XS 10

S 25

M 40

L 32

XL 23

XXL 20

Page 13: Ch1 statistique v

L'ensemble des couples

{ (xi , ni ), i = 1, ... , k } est une série statistique (ordonnée), ou distribution observée de la variable.

La somme de tous les ni est-elle toujours égale à n, nombre des observations ? On notera ceci :

effectif total

Page 14: Ch1 statistique v

On appellera fréquence relative la valeur

que l'on peut aussi exprimer en pourcentage par fi x 100, c'est le pourcentage d'individus

pour lesquels la variable a pris la valeur xi.

Page 15: Ch1 statistique v

Complétez le tableau :

Modalités xi Eff ectif ni Fréquence relative f i %

Célibataire 30 0.2 20

Marié 80

Divorcé 20

Veuf 20 Eff ectif total : 150

A quoi est égal ici le total de la colonne fréquence ? Et celui de la colonne "pourcentage" ? Il y a, parmi les 150 employés, …….% qui sont mariés.

Page 16: Ch1 statistique v

2. Diagramme à bandes

Aussi appelé représentation par « tuyaux d’orgue ».

Les modalités sont placées sur un axe horizontal.

Les effectifs (ou fréquences) sont placés sur un axe vertical.

La hauteur de chaque tuyau est proportionnelle à l’effectif correspondant.

Permet de comparer d’un « coup d’œil » les différentes modalités.

Ⅰ. Caractères qualitatifs

Page 17: Ch1 statistique v

0

10

20

30

40

50

60

70

80

90

cadres ouvriers employés ouvriers

Série1

CSP ni fi Cadres 10 0,05 Agents de maîtrise 40 0,2 Employés 60 0,3 Ouvriers 90 0,45

Page 18: Ch1 statistique v

3. Diagramme circulaire

L’aire, et donc l’angle au centre d’un secteur, est proportionnelle à la fréquence (ou l’effectif) de la modalité considérée (d’où un angle de fi x 360° pour la modalité i).

Permet de bien visualiser la part relative de chaque modalité.

Ⅰ. Caractères qualitatifs

Page 19: Ch1 statistique v
Page 20: Ch1 statistique v

Ⅱ. Caractères quantitatifs discrets

Statistiques descriptives à une variable : représentations

Page 21: Ch1 statistique v

Plan de la partie

1. Représentation tabulaire. 2. Diagramme bâton.3. Courbe des fréquences

cumulées.

Voici les chapitres que nous allons aborder :

Ⅱ. Caractères quantitatifs discrets

Page 22: Ch1 statistique v

1. Représentation tabulaire

Tableau à simple entrée, où les données sont classées par ordre croissant.

La première colonne renseigne les différentes valeurs du caractère, et les trois suivantes les effectifs, fréquences et fréquences cumulées.

Ⅱ. Caractères quantitatifs discrets

Page 23: Ch1 statistique v

De même, pour une variable discrète, on notera x1 , x2 , ... , xk les valeurs rangées par

ordre croissant, et n1 , n2 , ... , nk les effectifs

correspondants.

Page 24: Ch1 statistique v

Noms Nombre d'enfants

M.Azim 2

MFarid 3

Mme Latifi 0

Melle Fatiha 0

M. Ahmed 1

M. Salih 0

M. Berrada 1

Mme Réda 0

Melle Fatiha 2

M. Halim 4

M. Chadi 1

Mme Faouzi 3

M. Ali 2

Melle Loubna 0

M Fatih 0

M. Said 1

M. Radi 2

Mme Faraj 2

Page 25: Ch1 statistique v

Ainsi, à partir de la série brute ci-dessus, construisez le tableau :

Nombre d'enfants xi Eff ectifs ni

0 6

Page 26: Ch1 statistique v

Nombre d'enf ants xi Eff ectif ni Fréquence relative f i

0 6 0.33

1 4 0.22

2 5 0.28

3 2 0.11

4 1 0.06

Total : 18 1

Page 27: Ch1 statistique v

Voyons un autre exemple : Pour étudier les appels téléphoniques arrivant à un central, on a noté, sur 96 jours comparables, le nombre d'appels reçus entre 9 h et 9 h 10. Les résultats sont consignés dans ce tableau :

Page 28: Ch1 statistique v

Quelle est la proportion de jours où le nombre d'appels a été de 2 ?

Nombre d'appels xi

Nombre de jours ni

Fréquence relative f i

% f i 100

0 2 0.0208 2.08

1 14 0.1458 14.58

2 23 0.2396 23.96

3 24 0.2500 25.00

4 18 0.1875 18.75

5 9 0.0938 9.38

6 6 0.0625 6.25

Total : 96 1 100

Page 29: Ch1 statistique v

Quelle est la proportion de jours où le nombre d'appels a été supérieur ou égale à 3?

Nombre d'appels xi

Nombre de jours ni

Fréquence relative f i

% f i 100

0 2 0.0208 2.08

1 14 0.1458 14.58

2 23 0.2396 23.96

3 24 0.2500 25.00

4 18 0.1875 18.75

5 9 0.0938 9.38

6 6 0.0625 6.25

Total : 96 1 100

Page 30: Ch1 statistique v

Combien y-a-t-il eu de jours où le nombre d'appels a été inférieur ou égal à 2 ?

Nombre d'appels xi

Nombre de jours ni

Fréquence relative f i

% f i 100

0 2 0.0208 2.08

1 14 0.1458 14.58

2 23 0.2396 23.96

3 24 0.2500 25.00

4 18 0.1875 18.75

5 9 0.0938 9.38

6 6 0.0625 6.25

Total : 96 1 100

Page 31: Ch1 statistique v

Plus généralement, si

{ (xi , ni ), i = 1, ..., K }est la distribution observée d'une variable discrète, n1 + n2 + ... + ni = Ni est le nombre d'individus pour lesquels la variable a été inférieure ou égale à xi..

On peut calculer Ni de proche en proche :

N1 = n1, N2 = N1 + n2, N3 = N2 + n3, etc ...

Les Ni sont les effectifs cumulés croissants.

Page 32: Ch1 statistique v

De même ni + ni+1 + ... + nk = N'i est le

nombre d'individus pour lesquels la variable a été supérieure ou égale à xi.

Il peut se calculer de proche en proche :

N'k = nk , N'k-1 = nk + nk-1 ,

Les N'i sont les effectifs cumulés

décroissants.

Page 33: Ch1 statistique v

On peut définir de même :

Fi = f1 + f2 + ... + fi , fréquences relative

cumulées croissantes obtenues de proche en proche par Fi+1 = fi+1 + Fi

F'i = fi + fi+1 + ... + fk , fréquences relative

cumulées décroissantes obtenues de proche en proche par F'i = F'i+1 + fi

Fi et F'i peuvent s'exprimer aussi en pourcentage

(en multipliant tout par 100).

Page 34: Ch1 statistique v

Complétez le tableau :

Nombre d'appels

Fréquence relative en %

Fréquences relative cumulées croissantes

Fréquences relative cumulées décroissantes

0 2.08 2.08 1 14.58 16.66 97.92

2 23.96 83.34

3 25.00 65.62 59.38

4 18.75 84.37 5 9.38 93.75 15.63

6 6.25 6.25

Page 35: Ch1 statistique v

2. Diagramme bâton

Diagramme bâton des effectifs

A chaque valeur du caractère portée en abscisse, on associe un « bâton » vertical dont la hauteur est proportionnelle à l’effectif.

Cette représentation permet de comparer les effectifs de chaque valeur du caractère.

Ⅱ. Caractères quantitatifs discrets

Page 36: Ch1 statistique v
Page 37: Ch1 statistique v

3. Courbe des fréquences cumulées

Représente l’évolution des fréquences cumulées.

Le caractère étant discret, la courbe est en « escalier ».

En effet, les valeurs étant séparées, entre chacune d’elle la fréquence cumulée est inchangée, d’où ces paliers.

Ⅱ. Caractères quantitatifs discrets

Page 38: Ch1 statistique v

3. Courbe des fréquences cumulées

Ⅱ. Caractères quantitatifs discrets

Diagramme en Escalier

0

20

40

60

80

100

120

0 1 2 3 4 5 6 7

Fré

qu

ence

rel

ativ

e cu

mu

lée

Page 39: Ch1 statistique v

Ⅲ. Caractères quantitatifs continus

Statistiques descriptives à une variable : représentations

Page 40: Ch1 statistique v

Plan de la partie

1. Représentation tabulaire. 2. Histogramme des densités de

fréquence.3. Polygone de fréquences4. Courbe des fréquences cumulées.

Voici les chapitres que nous allons aborder :

Ⅲ. Caractères quantitatifs continus

Page 41: Ch1 statistique v

1. Représentation tabulaire

Tableau à simple entrée, où les classes de données sont triées par ordre croissant.

La première colonne renseigne les différentes classes de valeurs du caractère, et les trois suivantes les effectifs, fréquences relatifs et fréquences cumulées.

Si les classes ne sont pas toutes de même amplitude, on rajoute une colonne contenant les densités de fréquence, i.e. la fréquence de la classe divisée par son amplitude.

Ⅲ. Caractères quantitatifs continus

Page 42: Ch1 statistique v

Lorsque la variable est continue, ou que la variable peut prendre un grand nombre de valeurs différentes, même si celle-ci est une variable discrète, il convient de regrouper ces valeurs en classes.

À chaque classe on fait correspondre une fréquence ou une fréquence relative, et l’on obtient alors une distribution de fréquence ou de fréquence relative pour valeurs groupées.

Pour construire une distribution de fréquence, de fréquence relative ou de fréquence relative cumulée pour valeurs groupées on doit procéder de la manière suivante :

1. Déterminer le nombre de classes 2. Déterminer l’amplitude des classes3. Déterminer les différentes classes

1. Représentation tabulaire

Page 43: Ch1 statistique v

Voyons l'exemple d'une série brute de 60 valeurs du CA mensuelle d’une entreprise (en 1000dh), et le tableau des effectifs obtenus.

L'inconvénient est que, comme on aura toujours un grand nombre de valeurs différentes, on obtiendra un grand nombre de petits effectifs, ne résumant finalement pas grande chose !

1. Représentation tabulaireExemple 1

Page 44: Ch1 statistique v
Page 45: Ch1 statistique v

CA (1000dh) Eff ectif s CA (1000dh) Eff ectif s

159 1 169 7

160 0 170 7

161 0 171 9

162 0 172 6

163 2 173 5

164 3 174 2

165 3 175 1

166 0 176 2

167 5 177 1

168 6 Total : 60

Page 46: Ch1 statistique v

Une variable continue ne prend pas des valeurs isolées, mais des valeurs appartenant à des intervalles. C'est pourquoi, au lieu de définir des effectifs par valeurs, on définira des effectifs par intervalles, appelés classes.

Page 47: Ch1 statistique v

Afin de simplifier la présentation on peut, quitte à perdre un peu d'information, regrouper les effectifs proches, par exemple

175 d’ effectif 1

176 d’ effectif 2

177 d’ effectif 1

peut être remplacé par [ 175 ; 178 [ d’ effectif 4.

Page 48: Ch1 statistique v

On découpera ainsi l'intervalle des valeurs en classes contiguës, de la forme :

[ e1 ; e2 [    [ e2 ; e3 [    [ e3 ; e4 [ ....

[ ek ; ek+1 [

et on notera n1, n2, ... , nk les effectifs

associés.

ni est le nombre d'individus appartenant à

la classe [ ei ; ei+1 [.

Page 49: Ch1 statistique v

Exemple 1

Classes de CA ( en 1000dh) Eff ectif s

[159 - 165 [ 6

[165 - 168 [ 8

[168 - 171 [ 20

[171 - 174 [ 20

[174 - 177 [ 5

[177 - 179 [ 1

Page 50: Ch1 statistique v

Exemple 1

Classes de CA ( en 1000dh) Eff ectif s

moins de 160 1

[160 - 165 [ 5

[165 - 170 [ 21

[170 - 175 [ 29

175 et plus 4

Page 51: Ch1 statistique v

Quel que soit le type de variable on a finalement, pour toute modalité, valeur xi ,

ou classe [ ei , ei+1 [, un effectif ni , tel que

Il est parfois utile, surtout pour faire des comparaisons entre plusieurs séries, de raisonner plutôt avec des fréquences relatifs.

Page 52: Ch1 statistique v

Les définitions d'effectifs et de fréquences cumulés restent les mêmes dans le cas d'une variable continue.

Page 53: Ch1 statistique v

1. Déterminer le nombre de classes :

1) (règle de Sturges)

2)

)(3.31 nLogNC

nNC Nombre d’observationsdans la série statistique

1. Représentation tabulaire

Page 54: Ch1 statistique v

2. Calculer l’amplitude des classes :

1) D’une façon plus ou moins arbitraire

2) En utilisant l’étendue

minmax xxE

CC N

EA

Des classes d’amplitudes égales

(Plus grande valeur de la série statistique – Plus petite valeur de la série statistique)

1. Représentation tabulaire

Page 55: Ch1 statistique v

3. Déterminer les différentes classes :

cc AxClasseAx 2min2min

cAxClassex min1min

ckc kAxClasseAkx minmin )1(

ccNcc ANxClasseANxc

minmin )1(

1. Représentation tabulaire

Page 56: Ch1 statistique v

Exemple 2 : Le tableau statistiqueExemple 2 : Le tableau statistique (valeurs groupées) (valeurs groupées)

Pour les trois dernières années, le débit mensuel moyen d'une rivière, exprimé en milliers de mètres cubes par seconde, a été le suivant :

Posons X = la variable statistique représentant le débit mensuel moyen d’une rivière.

Variable continue

Page 57: Ch1 statistique v

Exemple 2 : Le tableau statistiqueExemple 2 : Le tableau statistique (valeurs groupées) (valeurs groupées)

(1) Nombre de classes :

classesLogNC 1358.6)36(3.31

classesNC 636

(2) L’amplitude des classes : 97.008.005.1 E

17.01617.06

97.0CA

)( 3mdemilliersen

10.193.0

93.076.0

76.059.0

59.042.0

42.025.0

25.008.0

6

5

4

3

2

1

Classe

Classe

Classe

Classe

Classe

Classe

(3) Détermination des classes :

Débit D

Page 58: Ch1 statistique v

Exemple 2 : Le tableau statistiqueExemple 2 : Le tableau statistique (valeurs groupées) (valeurs groupées)

Distribution de fréquence, de fréquence relative et de fréquence relative cumulée :

Page 59: Ch1 statistique v

2. Histogramme des densités de fréquence.

Ensemble de rectangles contigus. Pour chaque classe on trace un rectangle :

de base B proportionnelle à l’amplitude de la classe

de hauteur h proportionnelle à la densité de fréquence de la classe

L’aire du rectangle sera alors proportionnelle à la fréquence de la classe.

Ⅲ. Caractères quantitatifs continus

Page 60: Ch1 statistique v

2. Histogramme des densités de fréquence.

Double interprétation :

On comparera les densités de fréquence des classes en comparant les hauteurs des rectangles.

On comparera les fréquences des classes en comparant les aires des rectangles.

Ⅲ. Caractères quantitatifs continus

Page 61: Ch1 statistique v

Age (ans)

Nombre de personnes dans cette

tranche d'âge

20 à 30 100

30 à 40 150

40 à 50 90

50 à 65 20

Page 62: Ch1 statistique v

Histogramme de fréquence pour valeurs groupées (exemple 2)

Histogramme de fréquence

0

5

10

15

20

25

0,08 - 0,249 0,25 - 0,419 0,42 - 0,589 0,59 - 0,759 0,76 - 0,929 0,93 et plus

Débit D (en milliers m3/sec)

Fré

qu

ence

Page 63: Ch1 statistique v

Histogramme de fréquence relative pour valeurs groupées (exemple 2)

Histogramme de fréquence relative

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,08 - 0,249 0,25 - 0,419 0,42 - 0,589 0,59 - 0,759 0,76 - 0,929 0,93 et plus

Débit D (en milliers de m3/sec)

Fré

qu

ence

rel

ativ

e

Page 64: Ch1 statistique v

3. Polygone de fréquences pour valeurs groupées (exemple 2)

Polygone de fréquence

0

5

10

15

20

25

moins de0,08

0,08 - 0,249 0,25 - 0,419 0,42 - 0,589 0,59 - 0,759 0,76 - 0,929 0,93 et plus

Débit D (en milliers de m3/sec)

Fré

qu

ence

Page 65: Ch1 statistique v

3. Polygone de fréquence relative pour valeurs groupées

Polygone de fréquence relative

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

moins de0,08

0,08 - 0,249 0,25 - 0,419 0,42 - 0,589 0,59 - 0,759 0,76 - 0,929 0,93 et plus

Débit D ( en milliers m3/sec)

Fré

qu

ence

rel

ativ

e

Page 66: Ch1 statistique v

4. Courbe des fréquences cumulées

Représente l’évolution des fréquences cumulées.

Le caractère étant continu, la courbe l’est également.

Pour la construire, on joint les points de coordonnées (bi,Fi) où bi désigne l’extrémité supérieure de la ième classe.

Ⅲ. Caractères quantitatifs continus

Page 67: Ch1 statistique v

Ogive de fréquence relative cumulée pour valeurs groupées

Ogive de fréquence relative cumulée

,00%

20,00%

40,00%

60,00%

80,00%

100,00%

120,00%

moins de0,08

0,08 -0,249

0,25 -0,419

0,42 -0,589

0,59 -0,759

0,76 -0,929

0,93 etplus

Débit D (en milliers m3/sec)

Fré

qu

ence

rel

ativ

e cu

mu

lée

Page 68: Ch1 statistique v

Synthèse

En plus des tableaux et graphiques, on résume l'observation d'une variable quantitative par un petit nombre de paramètres.