Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques...

Preview:

Citation preview

Deuxième partie : initiation au traitement quantitatif des

données ; éléments de statistiques descriptives

Introduction à la statistique

Tableau individu/variable

Caractère 1

sexe

Caractère 2

âge

Caractère 3

profession

… Caractère X

Individu 1

Individu 2

Individu n

I La statistique à une dimension : principaux types

de variables et leur représentation

P : population X : la variable xi : symbole d’une modalité i de chaque variable x1, x2, …xp : ensemble des modalités pour i allant

de 1 à p. ni : nombre d’individus ayant répondu xi à la

variable X n1, n2,…np : effectifs correspondant aux

modalités N : total des effectifs fi : fréquence soit ni/N

Distribution statistique de la population selon une

variable

Modalités xi

effectifs

Fréquence fi %

x1 n1 f1 = n1/N f1 *100

x2 n2 f2 = n2/N f2 *100

… …

xp np fp = np/N fp *100

Total N 1 100

Exemple

Modalité xi Effectifs ni

Fréquence fi %

Homme ; x1

40 40/110 = 0,36

36 %

Femme ; x2 70 70/110 = 0,64

64 %

Total 110 1 100 %

Autres conventions de notation

N = n1+ n1+…+ n1=p

iin

1

14070110/1110

70

110

40

1/.../1......

1/1/

21

11

1

111

NNexemple

NNNNN

ou

NN

nn

nnnnff

nnf

p

p

p

p

ii

p

ii

p

ii

I1 Les variables qualitatives

A/ Définition

B/ Les variables nominales

C/ Les variables ordinales

D/ La représentation des variables qualitatives

Origine sociale des étudiants de 1ère année de sociologie (1994-1995)

Modalités ni fi angle

indépendants

31 0,1 36°

Cadres et prof intellec sup

70 0,23 82,8°

Prof interm 76 0,24 86,4°

employés 26 0,08 28,8°

Ouvriers et inactifs

108 0,35 126°

Total 329 1 360°

• les diagrammes circulaires

Angle = 100 fi * 360/100 = 360 * fi

répartition des étudiants de sociologie selon l'origine sociale (enquête 1994-95)

10%

23%

24%

8%

35%

indépendants

cadres et pro intellecsup

prof interm

employés

ouvriers et inactifs

• Les tuyaux d’orgue

I2 Les variables quantitatives

Les variables discrètes

modalités effectifs

fréquence Effectifs cumulés Fréquence cumulée

0 n0 F0=n0/N n0 N0/N

1 n1 F1=n1/N n0+n1 (n0+n1)/N

…. … … …

xi ni Fi=ni/N n0+n1+…+ni (n0+n1+…+ni)/N

…. … … …

xp np Fp=np/N n0+n1+…+np= N (n0+n1+…+np)/N=1

Total N 1

Exemple : nombre d’enfants par couple

modalités

effectifs fréquence Effectifs cumulés

Fréquence cumulée

0 8 0,27 8 0,27

1 10 0,33 18 0,60

2 5 0,17 23 0,77

3 0 0 23 0,77

4 4 0,13 27 0,90

5 3 0,1 30 1

Total 30 1

Représentations des variables discrètes : les diagrammes en bâton

Les variables continues

- Données brutes non groupées

- Données groupées en classes

Variables continues groupées en classes

classes ni fi Centre de classe Ci

[y0-y1] n1 n1/N C1=(y0+y1)/2

[y1-y2] n2 n2/N C2=(y1+y2)/2

[yi-1-yi] ni ni/N Ci=(yi-1+yi)/2

[yp-1-yp] np np/N Cp=(yp-1+yp)/2

N 1

Exemple : résultat d’un amphi à un examen (cas de l’amplitude constante)

classes ni fi Centre de

classe Ci

[0-5] 39 39/145 = 0,27 2,5

[5-10] 58 58/145 = 0,4 7,5

[10-15] 36 36/145 = 0,25 12,5

[15-20] 12 12/145 = 0,08 17,5

145 1

Histogramme (amplitude constante)

Exemple : répartition des effectifs en 3 tranches d’âge d’amplitude variable

ni fi amplitude Ci

[20;30[ 2000 0,36 10 25

[30;50[ 3000 0,54 20 40

[50;55[ 500 0,09 5 52,5

Total 5500 1

Hi = ni/amplitude

Histogramme (amplitude variable)

Histogramme des fréquences (amplitude variable)

Tableau récapitulatifTypes de variables Type de tableaux Représentation

qualitatives

nominales

Effectifset

Fréquences

Diagramme circulaire

Tuyaux d’orgueordinales

quantitatives

discrètes

Effect, fréq, effect et fréq cumulés

Diagrammes en bâtons

continues

Non groupées : xi et ni ordonnés

Fonction FRE

Groupées en classes : effect, fréq, centre, amplitude

Histogrammes et histogrammes normés (amplitude variable)

II Les paramètres de position

II1 Le mode

Définition

Le mode M est la modalité de la variable qui correspond au plus grand effectif

Variables qualitatives

Modalités (xi) ni %

Indépendants 31 10 %

Cadres 70 23 %

Professions intermédiaires 76 24 %

Employés 26 8 %

Ouvriers et inactifs 108 35 %

total 329 100 %

Exemple : Origine sociale des étudiants de 1ère année de

sociologie (1994-1995)

Mode : ouvriers et inactifs

• Les variables quantitatives discrètes

Modalités (xi) Effectif ni Fréquence fi

0 8 0,27

1 10 0,33

2 5 0,17

3 0 0

4 4 0,13

5 3 0,1

Total 30 1

Mode : 1 enfant

• Les variables quantitatives continues (amplitude constante)

CM Li

21

1

M = mode

Li = borne inférieure de la classe modale

C = amplitude de la classe modale

∆1 = effectif classe modale – effectif classe précédente

∆2 = effectif classe modale – effectif classe suivante

Exemple : résultat d’un amphi à un examen (cas de l’amplitude constante)

Classes ni

[0;5[ 39

[5;10[ 58

[10;15[ 36

[15;20[ 12

145

M = 5 + (19/19+22)*5 = 7,32

• Les variables quantitatives continues (amplitude variable)

ni amplitude

hi

[20;30[ 2000 10 200

[30;50[ 3000 20 150

[50;55[ 500 10 100

5500

Même formule avec∆1 = valeur hi de la classe modale – valeur hi de la classe précédente∆2 = valeur hi de la classe modale – valeur hi de la classe suivanteM = 20 + (200/200+50)*10 = 28 ans

II2 La moyenne arithmétique

Les variables discrètes

NX

p

iii xn

1

Exemple : nombre d’enfants par couple

Modalités (xi)

Effectif ni

nixi

0 8 0

1 10 10

2 5 10

3 0 0

4 4 16

5 3 15

total 30 51

Moyenne = 51/30 = 1,70

• Les variables continues

Non groupées Groupées en classes

NX

p

iix

1

NX

p

iiiCn

1

Exemple : résultat d’un amphi à un examen

Classes ni Ci niCi

[0;5[ 39 2,5 97,5

[5;10[ 58 7,5 435

[10;15[ 36 12,5 450

[15;20[ 12 17,5 210

145 1192,5

Moyenne = 1192,5/145 = 8,22

II3 La médiane

La médiane est la valeur de la variable qui partage en 2 parties égales ou en 2 sous-ensemble égaux la population

La médiane est plus stable que la moyenne car elle n’est pas influencée par les valeurs extrêmes

• Les variables discrètes

x¡ n¡ effectifs cumulés

0 10 10

1 30 40

2 40 80

3 10 90

4 5 95

5 4 99

6 1 100

100

Nombre d’enfants par couple exemple 1

x¡ n¡ effectifs cumulés

0 5 5

1 25 30

2 20 50

3 15 65

4 15 80

5 12 92

6 8 100

100

Nombre d’enfants par couple exemple 2

• Les variables continues groupées en classes

C

NLiMe

nnn

i

i

11

...2

AvecLi : borne inférieure de la classe médianeni : effectif de la classe médianeC : amplitude de la classe médianen1+…+ni-1 : effectifs cumulés des classes précédant la classe médiane

Exemple : distribution de salaires

x¡ n¡ effectif cumulé

[0,2000[ 10 10

[2000,4000[ 30 40

[4000,6000[ 40 80

[6000,8000[ 10 90

[8000,10000[ 5 95

[10000,12000[ 4 99

≥ 12000 1 100

N=100

N/2 = 50 ===> intervalle médian correspond à l’effectif cumulé 80 soit [4000,6000[.L¡ = 4000

Me = 4000 + ((50-40)/40) 2000 = 4500 Frs

Recommended