21
1 STATISTIQUE COURS 2 L’OBSERVATION STATISTIQUE OU LA COLLECTE DES DONNÉES STATISTIQUES

Cours 2 La Collecte de Donnees

Embed Size (px)

Citation preview

Page 1: Cours 2 La Collecte de Donnees

1

STATISTIQUE

COURS 2L’OBSERVATION STATISTIQUE OU

LA COLLECTE DES DONNÉES STATISTIQUES

Page 2: Cours 2 La Collecte de Donnees

2

Les étapes de la recherche statistique

La recherche statistique représente l’ensemble des opérations de collecte, systématisation, traitement, stockage et analyse des données et des informations nécessaires aux études des phénomènes économiques et sociales.Toute la recherche statistique suppose trois étapes:- l’observation statistique;- le traitement statistique;- l’analyse statistique.

Page 3: Cours 2 La Collecte de Donnees

3

L’observation statistique L’observation statistique – la collecte de

données statistiques auprès les unités de la collectivité.L’observation statistique inclue 3 phases:

- l’analyse théorétique préalable dans laquelle est définie la collectivité analysée, sont définies les unités statistiques et sont choisies les caractéristiques d’enregistrement;

- l’élaboration du plan de l’observation: le temps d’observation, le lieu et l’unité qui présente des problèmes d’organisation, des formulaires et instructions d’enregistrement;

- l’enregistrement concret des données (la collecte des données).

Page 4: Cours 2 La Collecte de Donnees

4

L’observation statistiqueCritères des classification de l’observation statistique

1. Après le mode d’organisation de l’activité socio-économique

- observations permanentes - sont réalisées à l’aide du système informationnel statistique;

- observations spécialement organisées – recensements, enquêtes, monographies.

2. Après le temps auquel les données se réfèrent

- observations actuelles- consistent dans l’enregistrement et la systématisation permanente, comme sont produites, les caractéristiques des phénomènes analysés au niveau de la collectivité (les rapports statistiques);

- observations périodiques – l’enregistrement des données est réalisé aux intervalles de temps bien définies (le recensement);

- observations uniques (spéciales) – sont faites pour l’enregistrement statistique d’un événement non répétable.

Page 5: Cours 2 La Collecte de Donnees

5

L’observation statistique

3. Après le nombre des unités enregistrées

- observations totales - les données sont collectées auprès toutes les unités de la collectivité (le recensement, les rapports statistiques);

- observations partielles – supposent l’enregistrement des caractéristiques pour un nombre réduit des unités de la collectivité générale (le sondage statistique).

Page 6: Cours 2 La Collecte de Donnees

6

Les étapes de la recherche statistique

Le traitement statistique suppose:- la centralisation des données obtenues après

l’observation statistique;- le groupement des données;- la présentation des données sous forme de séries

statistiques, tableaux, graphiques;- le calcul des indicateurs statistiques.

▪ L’analyse des données suppose:- la comparaison des données;- la vérification des hypothèses statistiques;- la formulation des conclusions.

Bien qu’ils sont séparés pendant le temps et l’espace, ces trois étapes sont interdépendantes, respectivement dépendent les uns des autres en termes de l’authenticité des données.

Page 7: Cours 2 La Collecte de Donnees

7

Le traitement statistiquea) La centralisation des données – consiste dans la totalité des niveaux individuels obtenus après l’observation des unités de la collectivité.L’opération de centralisation des données doive être développée en respectant les conditions suivantes:

- la centralisation doive être précédée par le control des données collectées;

- les données qui seront centralisées doivent être comparables (doivent se référer à la même caractéristique observée en conditions unitaires et de s'exprimer dans la même unité de mesure);

- quand on veut obtenir aussi des sous-totaux, les sous-collectivités pour lesquelles on applique la centralisation doivent être homogènes.

Page 8: Cours 2 La Collecte de Donnees

8

Le traitement statistiqueb) Le groupement statistique des données- consiste dans la division de la collectivité dans

sous-ensembles homogènes après la variation d’une ou des plusieurs caractéristiques, nommé facteur de groupement.La classification des groupements peut être faite, en fonction du but de la recherche, ainsi:1. Apres le numéro des caractéristiques utilisés

- groupement simple – est réalisée après une seule caractéristique de groupement (le groupement des étudiants selon l’âge);

- groupement combiné (tableau combiné)- se réfère simultanément aux deux ou plusieurs caractéristiques de groupement (le groupement des étudiants en fonction de la moyenne du bac et la moyenne d’admission).

Page 9: Cours 2 La Collecte de Donnees

9

Le traitement statistique

2. Après le contenu des caractéristiques de groupement - groupements selon une caractéristique de temps

(chronologique) – se référent à la variation pendant le temps du phénomène analysé;

- groupements selon une caractéristique d’espace (territoriale) reflètent la variation dans l’espace des unités de la collectivité;

- groupements selon une caractéristique attributive, qui peuvent être réalisés soit selon une caractéristique exprimée par des mots, soit selon une caractéristique exprimée numérique.

3. Après la forme d’expression de la caractéristique- groupements exprimés par des mots (qualitatifs);- groupements exprimés numérique (quantitatifs), qui

peuvent être:- avec variation discrète (groupements selon variantes);- avec variation continue (groupements sur intervalles).

Page 10: Cours 2 La Collecte de Donnees

10

Le traitement statistique Le groupement selon variantes est utilisé

pour les collectivités ayant un volume petit, une amplitude réduite de la variation et dans lesquelles il existe un faible nombre de valeurs individuels distinctes (variantes). Si le nombre de valeurs est réduit, un groupe est crée pour chaque variante de la caractéristique (Exemple: groupement des familles selon le nombre d’enfants, groupement des appartements selon le nombre de chambres).

Le groupement sur intervalles de variation est utilisé quand la collectivité a une dimension grande, l’amplitude de la variation est grande et il existe un grand nombre de valeurs individuels distinctes.

Page 11: Cours 2 La Collecte de Donnees

11

Le traitement statistique

Les intervalles de variation peuvent être:

- égales – sont utilisés quand nous voulons systématiser les données et de mettre en évidence la forme de la répartition des unités de la collectivité;

- inégales- sont utilisés pour mettre en évidence les types qualitatives dans l’intérieur de la collectivité.

Page 12: Cours 2 La Collecte de Donnees

12

Le traitement statistique Le groupement suppose la réalisation des opérations

suivants:- la détermination de la caractéristique de groupement;- le calcul de l’amplitude de la variation (A) comme

différence entre la valeur maximale et la valeur minimale enregistrée par la caractéristique analysée

A = xmax – xmin

- la détermination de la taille de l’intervalle de groupement ou variation (h), basée sur le rapport entre l’amplitude de la variation et le nombre des groupes choisi

- quand le nombre de groupes (r) est connu

- quand le nombre de groupes n’est pas connu- la relation du Sturges- n = nombre des unités statistiques

r

Ah 1

n

Ah

lg322,312

Page 13: Cours 2 La Collecte de Donnees

13

Le traitement statistiqueQuand le résultat du rapport n’est pas un nombre entier il est arrondi par adjonction pour n’avoir pas des valeurs en dehors de l’intervalle de groupement.- la spécification de la limite inferieure et supérieure de l’intervalle de groupement – on part de l’xmin jusqu’à xmin+h, après xmin+h, xmin+2h…

La détermination du premier intervalle de groupement est réalisée en partant de la valeur minimale de la caractéristique (la limite inferieure) auquelle on ajoute la taille de l’intervalle de groupement (la limite supérieure).Il est nécessaire de préciser laquelle de ces deux limites est inclue dans l’intervalle.- la détermination du nombre d’unités statistiques inclues dans chaque intervalle, c’est-à-dire la fréquence absolue.

Page 14: Cours 2 La Collecte de Donnees

14

Le traitement statistiquec) La présentation des données

statistiques sous forme de séries, tableaux et graphiques

La série statistique définit la correspondance entre deux séries parallèles de données statistiques, où la première série représente la caractéristique de groupement et la deuxième le résultat de la centralisation des fréquences ou les valeurs d‘une autre caractéristique interdépendante.

La classification des séries statistiques après le contenu de la caractéristique de groupement:

-Séries de temps (chronologiques);-Séries d’espace (territoriales);-Séries de distribution (répartition).

Page 15: Cours 2 La Collecte de Donnees

15

Le traitement statistique Les séries de temps (chronologiques,

dynamiques) montrent l’évolution pendant le temps d’un phénomène ou décrivent un certain processus.

Variable temps(t)

Les valeurs de la caractéristique

ou le nombre des unités

(yt)

1 y1

2 y2

…t

…yt

n yn

Page 16: Cours 2 La Collecte de Donnees

16

Le traitement statistique

La production de céréales/habitant pendant la période 1991-1996

Série d’intervalles de temps (mois, trimestre, année) - exprime les résultats d’une activité développée pendant une période de temps. Les valeurs de la caractéristique peuvent être totalisés.

Année 1991 1992 1993 1994 1995 1996

Production (kg/habitant)

832,7

540,2 680,9 800,0 876,6 628,1

Page 17: Cours 2 La Collecte de Donnees

17

Le traitement statistique

L’évolution du stock de combustible

Série des moments - exprime le niveau auquel le phénomène analysé est arrivé pendant différents moments de temps. Les valeurs de la caractéristique ne peuvent pas être totalisés

Periode Stock de combustible (hl)

0 1

1 Janvier 2010 1 Février 2010

1 Mars 20101 Avril 2010 1 Mai 20101 Juin 20101 Juillet 2010

104,0103,8104,599,2

124,0127,8108,7

Page 18: Cours 2 La Collecte de Donnees

18

Le traitement statistique Les séries d’espace (territoriales)

présentent la variation territoriale de la caractéristique analysée.

Unités territoriales

Les valeurs de la

caractéristique ou le nombre

des unités

A yA

B yB

…I

…Yi

Z yZ

Page 19: Cours 2 La Collecte de Donnees

19

Le traitement statistique

Région de développement économique

Population occupée(mille pers.)

0 1

Nord-Est 9,7

Sud-Est 12,1

Sud 9,8

Sud-Ouest 9,2

Ouest 11,2

Nord-Ouest 12,1

Centre 14,0

Bucarest-Ilfov 14,7

TOTAL 92,8

Page 20: Cours 2 La Collecte de Donnees

20

Le traitement statistique

Les séries de distribution (répartition) des fréquences - sont utilisées pour les caractéristiques numériques de type attributif.

- Première série (ensemble de données) – les groupes formés selon la variation d’une caractéristique numérique ou qualitative;

- Seconde série – la fréquence de chaque groupe ou la valeur pour une caractéristique interdépendante.

Page 21: Cours 2 La Collecte de Donnees

21

Le traitement statistique

La distribution des étudiants selonle type de lycéeLycée(xi)

Nombre des étudiants

Mathématiques & physique

36

Economique 11

Autres 28