L’échantillonnage des enquêtes...

Preview:

Citation preview

L’échantillonnage des enquêtes ménages

- hors Emploi et DOM -

Enquêtes et Sondages - CNAM - UE STA 108

Sylvie Rousseau 12/01/07

2

Sommaire

I. Les principes généraux

II. La principale base de sondage : l’échantillon-maître

III. L’échantillonnage d’une enquête

3

I. Principes généraux

I.1. Objectif d’une enquête-ménagesI.2. Cadre institutionnelI.3. Définition d’un ménageI.4. L’unité d’échantillonnage I.5. Principes d’échantillonnage I.6. Modes de collecte

4

I.1. Objectif d’une enquête-ménages

Fournir de l’information sur la population pour éclairer le débat socialExemples :

• un seuil de revenu ;

• la proportion de locataires ;• l’état de santé moyen de la population ;• …

5

I.2. Cadre institutionnelProgramme d’enquêtes annuel visé par le Conseil National de l’information Statistique (publié au JO).

Le CNIS assure la concertation entre les producteurs et les utilisateurs de statistiques publiques.Enquêtes « d'intérêt général et de qualité statistique », ayant successivement reçu :

Avis d'opportunité : l'enquête répond à un besoin d'intérêt public, elle ne fait pas double emploi avec d'autres sources statistiques ;Avis de conformité attestant de la qualité de l'opération.

Loi sur le secret statistique (1951)Loi "Informatique et libertés" (1978)

6

I.3. Définition d’un ménage

ménage-logement » : ensemble des personnes habitant le même logement au titre de leur résidence principale

« ménage-unité de vie » : ensemble des personnes partageant la même résidence habituelle et le même budget

7

I.4. L’unité d’échantillonnage

C’est le logement « ordinaire »En l’absence de registres de populationGrâce au recensement de la population et au suivi de la construction neuve

On construit des échantillons de logts ordinairesOn atteint les ménages et/ou les individus par l'intermédiaire de leur logement

8

I.5. Principes d’échantillonnage

Echantillons probabilistes de logementsTous les logements principaux possèdent la même probabilité de participer à l’enquêtei.e. chaque logt tiré représente w ménages

Ex : w ≅ 2 000 pour une enquête de taille 10 000

à moins de viser davantage certaines populations

Un même logt ne peut-être interrogé pour des enquêtes distinctes entre deux recensements

9

I.6. Modes de collecte

Enquêtes généralement en face à faceQuelques enquêtes par téléphone

Camme, ré-interrogations Loyers et Charges

Coûts de collecte Stabilité du réseau d'enquêteurs

localisation de l’échantillon

10

Conclusion

Tirage des échantillons en 2 temps

1ère phase de localisation des enquêtes, i.e. tirage de bases de sondage intermédiaires:

l’Echantillon-Maître (EM99) pour les logts recensés en 1999 La Base de Sondage des Logements Neufs (BSLN) pour les

logements construits après mars 1999

2ème phase de tirage des échantillons des enquêtes dans ces 2 bases de sondage intermédiaires

11

II. La principale base de sondage: l’Echantillon-Maître (EM)

Entre contraintes pratiques et désir de précision

Etablir une réserve de logements localiséepour alimenter la plupart des enquêtes ménages

hors DOM, enquête Emploi, enquêtes locales,…

Optimiser la précision des résultats nationaux

12

13

1. Taille de l’EM99

2 022 889 logements 7 % des logts recensés en mars 99

Réserve calibrée dans l’optique des prévisions suivantes :

10 enquêtes nationales par année,de 10 000 ménages chacune en moyenne,pendant 6 ans (d’octobre 2001 à fin 2007)

14

2. Constitution de l’EM99

L’EM s’obtient selon un tirage stratifiéà 1 ou 2 degrés selon la strate

15

Région RRCommunes

rurales =>UP

Choix d'UP Choix d'UP

Choixde districts

Choix de districts

Région RRUU de moins de20000 habitants

Région RRUU de 20000 à

100000 habitants

Région RRUU de Paris

Région RRUU de plus de

100000 habitants

Stratification

Région RRUP rurales

Région RRUP "petit urbain"

Choix d'UP

Région RRUP "moyen urbain"

Région RRdistricts de strate 2

Région RRdistricts de strate 3

Région RRdistricts de strate 4

Choixde districts

EM

Exhaustifen logements

16

a. Stratification quadrillant le territoire selon les régions et la densité d’habitat

Collecte des enquêtes en Direction RégionaleLe degré d’urbanisation explique assez bien le comportement des ménages

(ex : logement, conditions de vie, …)

Cette stratification est un élément de qualité

17

87 strates de tirage

Strate de gestion

Nombre de communes* au RP 99

Nombre d’unités urbaines au RP 99

Nombre de régions

0 30 611 - 22 1 3 167 1 762 22 2 1 097 180 22 3 1 294 52 20 4 396 1 1

Total 36 565 1 995 87 * : tous arrondissements compris

18

Région RRCommunes

rurales =>UP

Choix d'UP Choix d'UP

Choixde districts

Choix de districts

Région RRUU de moins de20000 habitants

Région RRUU de 20000 à

100000 habitants

Région RRUU de Paris

Région RRUU de plus de

100000 habitants

Stratification

Région RRUP rurales

Région RRUP "petit urbain"

Choix d'UP

Région RRUP "moyen urbain"

Région RRdistricts de strate 2

Région RRdistricts de strate 3

Région RRdistricts de strate 4

Choixde districts

EM

Exhaustifen logements

19

b. Localisation des enquêtes dans des UP (i) Définition des UP

En strates 0, 1 et 2, une UP correspond au rayon d’action d’un enquêteurEn strates 2, 3 et 4 une UP = une UU

20

b. Localisation des enquêtes dans des UP (i) Définition des UP

En strate 0, une UP est formée de :- une ou plusieurs communes rurales contigües- situées dans la même région - où résident des ménages au profil de revenu voisin- ayant entre 1 800 à 3 600 logements principaux

⇒plus de 30 000 communes rurales regroupées en 2 227 UP

En strate 1, une UP est formée de :- de 1 ou 2 UU proches de la même région- de profil de revenu moyen le plus semblable possible - d’au moins 1 800 logements principaux

21

b. Localisation des enquêtes dans des UP (ii) Calibrage des UP – réserve minimale

En strates 0, 1 et 2, chaque UP contient au moins

30 × 10 × 6 = 1800 logements

1 UP = 1 enquêteur 10 enquêtes /an pendant 6 ans≤ 30interviews

Dans les strates 2, 3 et 4 : UP de plus de 20000 habitants (tirage d’US)

22

b. Localisation des enquêtes dans des UP (ii) Calibrage des UP – allocations d’UP

Dans une des strates 0, 1 ou 2 d’une région donnée de taille 400 000 logts par exemple, on retiendra :

On enquête environ 1 UP = 1 enquêteur 1 logement sur 2000 ≥ 20 interviews

UP10201

2000400000

23

b. Localisation des enquêtes dans des UP (ii) Calibrage des UP – allocations d’UP

Dans les strates 3 et 4, toutes les UP sont retenues et impactées avec un taux de sondage moyen de 1/2000Unité Urbaine

Nombre d'habitants

Nombre de logtsprincipaux

Nombre de FA

Nombre d’enquêteurs

Angoulême 100 000 46 000 23 1

2

≅ 4

≅ 7

Paris 9 644 507 4 039 349 2 020 ≅80

Reims 215 000 94 000 47

Nantes 500 000 234 000 117

Lille 1 001 000 388 000 194

24

b. Localisation des enquêtes dans des UP (iii) Tirage des UP

Stratifié dans 66 strates de tirage croisant 22 régions et les 3 strates de gestion 0, 1 et 2A probabilités inégales des UP proportionnellement à leur nombre de résidences principales dans la strate de tirageEquilibré sur des critères de revenu et d'âge au niveau de groupes de régions

revenu net total imposable (source DGI 1996)effectifs des 3 tranches d'âges [0,19] , [20,59] et [60,+] ans

(source RP99)

26

Région RRCommunes

rurales =>UP

Choix d'UP Choix d'UP

Choixde districts

Choix de districts

Région RRUU de moins de20000 habitants

Région RRUU de 20000 à

100000 habitants

Région RRUU de Paris

Région RRUU de plus de

100000 habitants

Stratification

Région RRUP rurales

Région RRUP "petit urbain"

Choix d'UP

Région RRUP "moyen urbain"

Région RRdistricts de strate 2

Région RRdistricts de strate 3

Région RRdistricts de strate 4

Choixde districts

EM

Exhaustifen logements

27

c. Choix de districts dans les UP retenues de plus de 20 000 habitants

Uniquement en strates de gestion 2, 3 et 4Tirage stratifié par groupes de communes pour garantir la dispersion géographique des districts Tirage à probabilités égales des districts dans l’UU (ex : 1 district sur 20 en strates 3 et 4)Tirage équilibré sur l’UU par la méthode du Cube sur les critères de revenu et d’âge

29

Région RRCommunes

rurales =>UP

Choix d'UP Choix d'UP

Choixde districts

Choix de districts

Région RRUU de moins de20000 habitants

Région RRUU de 20000 à

100000 habitants

Région RRUU de Paris

Région RRUU de plus de

100000 habitants

Stratification

Région RRUP rurales

Région RRUP "petit urbain"

Choix d'UP

Région RRUP "moyen urbain"

Région RRdistricts de strate 2

Région RRdistricts de strate 3

Région RRdistricts de strate 4

Choixde districts

EM

Exhaustifen logements

30

d. Désignation des logts retenus dans l’EM

Strates 0 et 1 : tous les logts des UP tirées

Strates 2, 3 et 4 : tous les logts des US sélectionnées dans les UP tirées

31

32

Ile de France

33

Bretagne

Quelques données numériques sur l'Echantillon-Maître

Strate 0 Strate 1 Strate 2 Strate 3 Strate 4 Total

Nombre d’UP au RP99

2 227 975 180 52 1 3 435

Nombre d’UP-EM 128 75 93 52 1 349

Nombre de communes EM

2 018 284 610 1317 415 4 644

Nombre total de logements RP99

7 382 976 4 934 454 3 839 693

7 988 099

4 549 934 28 696 156

Nombre total de logements EM

451 776 444 978 497 962 399 845 228 328 2 022 889

Proportion de logements EM

6 9 13 5 5 7

35

Remarque

En vue du tirage des enquêtes dans l’EM (qui obéit à un plan stratifié par groupes de communes), on a construit des groupes de communes en strates 0 et 1, avec :

- une commune en strate 1 - un regroupement de communes rurales

d’au moins 100 logements en strate 0

36

III. Echantillonnage d’une enquête

On échantillonne surtout des logements recensés comme principaux On sélectionne également des résidences secondaires, occasionnelles ou vacantes au RP99 pour tenir compte des changements intervenus depuis 1999On tire des logements neufs avec la même probabilité que les principaux (i.e. tous possèdent la même pondération)

37

III. Echantillonnage d’une enquêteDes enquêtes impactent davantage certaines catégories de populations

Mais après tirage de l’échantillon d’une telle enquête, l’ EM doit continuer d’être « représentatif » pour les enquêtes ultérieures

⇒ Tirage en 2 phases1) Tirage de S1 (n1 > n ) dans l’EM, à probas égales 2) Tirage de S2 dans S1 de taille n, à probas inégalesEnfin marquage dans l’EM des unités de S1

1 /2 1 /3

2 /3

1 /1

38

III. Echantillonnage d’une enquête

On impacte toutes les UP de l’EM Plan stratifié par groupes de communesTirage systématique des logts, dans chaque strate, sur un fichier trié par catégorie de logt au RPSi besoin, tirage en 2 phases

39

40

Conclusion et perspectives

Le contexte du nouveau recensement Enjeux organisationnels et choix méthodologiques

Choix des critères de stratificationZones d’emploi, activités économiques dominantes, Prix du locatif, proximité à des équipements, …

D’autres modes de collecteInternet, téléphone

De nouveaux besoins Panel de ménages, enquêtes locales

41

Bibliographiewww.cnis.frwww.insee.frL'échantillon maître de 1999 et application au tirage des unités primaires par la macro "Cube", L.Wilms, Journées de Méthodologie Statistique, 2002. La correction de la non-réponse par repondération et par imputation, N.Caron, Document de travail n°M0502,http://www.insee.fr/fr/nom_def_met/methodes/doc_travail/docs_doc_travail/M0502.pdfTechniques de sondage, P.Ardilly, Technip, 2006La méthode de partage des poids, P. Lavallée, Dunod, 2004

Recommended