17
Jean-Luc LIPATZ INSEE Unités statistiques Distributions de population

Jean-Luc LIPATZ INSEE Unités statistiques Distributions de population

Embed Size (px)

Citation preview

Page 1: Jean-Luc LIPATZ INSEE Unités statistiques Distributions de population

Jean-Luc LIPATZINSEE

Unités statistiquesDistributions de population

Page 2: Jean-Luc LIPATZ INSEE Unités statistiques Distributions de population

Page 2

Jean-Luc LIPATZ

L’environnement de travail› Des difficultés :

– Deux thèmes à la limite du fonctionnement de la spécification INSPIRE (s’agit il encore d’objets spatiaux?, « templates » peu pertinents).

– Deux thèmes où un inventaire complet est impossible à faire : plutôt donner un cadre qu’une modélisation des objets concrets

– Intérêt quasiment nul de la part d’Eurostat (cf. Insee!) – Des documents de référence nombreux collectés sans discernement et sans intérêt

pratique pour la modélisation.– Aucune remarque sur le fond jusqu’ici

› Un groupe bipolaire– Pôle statistique :

‐ DE (SSB,DeStatis)‐ NL (PWB,Statistics Nederland)‐ FR (JLL, Insee, éditeur)

– Pôle cartographique : ‐ PL (AK, facilitateur)‐ DE (UM, facilitateur) ‐ SU (MH, statistique Suède),‐ JRC (JG, éditeur)

Page 3: Jean-Luc LIPATZ INSEE Unités statistiques Distributions de population

Page 3

Jean-Luc LIPATZ

Unités statistiquesDe quoi parle-t-on

› La définition« A statistical unit is a spatial feature (polygon, line, point or grid

cell) that can attach statistical information »› L’interprétation

Un modèle générique décrivant le mode de constitution des unités statistique plutôt qu’un inventaire des unités statistiques

› Les questions qui se posent encore :– Que faire de l’héritage de l’annexe I (NUTS, carroyages)?– Quels identifiants?– Inclure un embryon de normalisation de quelques zonages?– Que faire des US sans géométrie?– Que faire des US définies par agrégation?

Page 4: Jean-Luc LIPATZ INSEE Unités statistiques Distributions de population

Page 4

Jean-Luc LIPATZ

Une unité statistique

Sa classe

Page 5: Jean-Luc LIPATZ INSEE Unités statistiques Distributions de population

Page 5

Jean-Luc LIPATZ

Le modèle générique› Unité statistique

– Identifiant– Nom (facultatif)– Géométrie– Période de validité– Classe

› Classe d’unités statistiques– Dimension : 0 (points), 1 (linéaires), 2 (surfaces), 3 (volumes)

‐Carreaux : un cas particulier de la dimension 2– Composition : par agrégation/par contour géométrique– Partition ou non – Famille– Position dans la hiérarchie des classes de la famille

› Famille de classes d’unités statistiques– Portée géographique– Origine (collecte/statistique/règlement)– Domaine d’usage– Documents de référence

Page 6: Jean-Luc LIPATZ INSEE Unités statistiques Distributions de population

Page 6

Jean-Luc LIPATZ

Exemple 1› La Communauté d’agglomération de Poitiers est une instance de la classe

“Communauté d’agglomération”, c’est un StatisticalUnitObject– Id (local) 248600157– Nom “Communauté d’agglomération de Poitiers (CAP)” – Géométrie composée des StatisticalUnitObject id in { 86194, 86041…}

› La classe “Communauté d’agglomération” est une instance de la classe StatisticalUnit– Dimension 2, non partition– Composition : aggrégation de “Communes”– Appartenant à la famille “EPCI”– Sans successeur ni predecesseur dans la famille

› La famille “EPCI” est une instance de la classe StatisticalUnitFamily– Portée géographique : FR– Origine : réglementaire– Domaine d’usage : tous

› NB la famille EPCI contient aussi les communautés de communes, les communautés urbaines)

Page 7: Jean-Luc LIPATZ INSEE Unités statistiques Distributions de population

Page 7

Jean-Luc LIPATZ

Exemple 2› L’IRIS « Trois quartiers » est un StatisticalUnitObject

– Id (local) 861940101– Nom “Trois quartiers” – Géométrie <quelque part à l’IGN!>

› La classe “IRIS” est une instance de la classe StatisticalUnit– Dimension 2, partition– Composition : contours géométriques– Appartenant à la famille “Diffusion infra-communale Insee”– Imbriqué dans le niveau TRIRIS, sans niveau inférieur

› La famille “Diffusion infra-communale Insee” est une instance de la classe StatisticalUnitFamily

– Portée géographique : FR– Origine : statistique– Domaine d’usage : diffusion– Documents de référence : sur le site insee.fr

Page 8: Jean-Luc LIPATZ INSEE Unités statistiques Distributions de population

Page 8

Jean-Luc LIPATZ

Se référer à une unité statistique

› Théoriquement l’identifiant suffit– C’est le message porté par la spécification des carroyages– Régle de nommage? URL/Famille/Classe/code

‐ www.insee.fr:COG:UU:86601‐ www.insee.fr:DiffusionInfracommunale:IRIS:86194

› Optimiser en injectant la géométrie?– FR : COG géré par l’Insee, géométrie par l’IGN– NL : géométrie gérée par le cadastre, géométrie généralisée

diffusée par SN› Que se passe t il pour des agrégats?

– FR : UU au fil des modifications communales

Page 9: Jean-Luc LIPATZ INSEE Unités statistiques Distributions de population

Page 9

Jean-Luc LIPATZ

La question des NUTS

›Dans la logique de la spécification les NUTS constituent une famille

›Dans l’annexe I, les unités statistiques sont un cas particulier d’unités adminsitratives. En fait c’est l’inverse!

›Contre exemples :–FR : NUTS 2 = ZEAT, LAU1 = Canton x commune

–NL : Les NUTS font référence à une ancienne version des UA

Page 10: Jean-Luc LIPATZ INSEE Unités statistiques Distributions de population

Page 10

Jean-Luc LIPATZ

La question des carroyages

› “INSPIRE Geographical grid systems form a georeferencing framework for the themes where grids with fixed and unambiguously defined location of equal-area grid cells are needed.”

› “For these regions [outside of continental Europe], MS are able to define their own grid although it must follow the same principles as laid down for the Pan-European grid…”

› Une projection (Lambert Azimuthal Equal Area) + des tailles de cellule (10n m) + un codage des identifiants (1kmNyyyyExxxx)

› Sauf que :– Geostat ESS-NET, ESPON : il faut une vision plus large– Les rares données existantes sont dans des systèmes plus

classiques, sans possibilité de conversion‐ Projection UTM, Lambert II‐ Cellules 125 m , 250 m, 500 m (Autriche)

Page 11: Jean-Luc LIPATZ INSEE Unités statistiques Distributions de population

Page 11

Jean-Luc LIPATZ

Questions de normalisation

› Fournis (des familles)–Les NUTS

–Les zonages de l’audit urbain

› Pas fourni–Un ensemble de zonages urbains (district – output area

– municipalité – agglomération) : pas stabilisé coté Eurostat et CE; enjeux règlementaires nationaux

Page 12: Jean-Luc LIPATZ INSEE Unités statistiques Distributions de population

Page 12

Jean-Luc LIPATZ

Distributions de populationDe quoi parle-t-on

› La définition– « Geographical distribution of people, including population

characteristics and activity level agregated by grid, administrative unit or other analytical unit ».

› L’interprétation– Un modèle générique avec emphase sur « distribution »

› Les questions qui se posent encore :– Objet spatial ou pas? Identifiant ou pas?– D’autres statistiques?– Quelle liste de variables?– Où sont les nomenclatures?– Liens avec SDMX?

Page 13: Jean-Luc LIPATZ INSEE Unités statistiques Distributions de population

Page 13

Jean-Luc LIPATZ

En-tête

Données

Page 14: Jean-Luc LIPATZ INSEE Unités statistiques Distributions de population

Page 14

Jean-Luc LIPATZ

Le modèle générique1) L’en-tête

› Quoi– Domaine (démographie, conditions de vie, activités…) – Variable (population, revenu/UC…)– Statistique (nombre, pourcentage, moyenne, quantile…)– Unité de compte (personne, euro,…)

› Sur quoi– Aire concernée : une unité statistique (y.c. UA)– Restriction à une sous population (p.e. actifs)– Dimension temporelle : référence/mesure/validité

› Découpé comment :– Classe d’US formant une partition de l’aire concernée– Nomenclature (tranches d’âge, secteur d’acticité, CS…)

Page 15: Jean-Luc LIPATZ INSEE Unités statistiques Distributions de population

Page 15

Jean-Luc LIPATZ

Le modèle générique2) Les données

› La portion de la partition :– Unité statistique– Poste de nomenclature

› La donnée– Valeur numérique– Commentaire, raison pour valeur manquante– Date de collecte

Page 16: Jean-Luc LIPATZ INSEE Unités statistiques Distributions de population

Page 16

Jean-Luc LIPATZ

Exemple : Distribution de population RP par âge quinquennal sur la région Poitou-Charentes

› Aire concernée = Région.54› Classe d’US = Commune› Période de référence = 2007› Période de mesure = [2005,2009]› Période de validité = [2009,2010]› Restriction = aucune› Domaine à une sous population = démographie› Variable = population› Nomenclature = âges quinquennaux› Statistique = nombre› Unité de compte = personne› Données

– Unité statistique = Commune 86091– Poste de nomenclature = âge 0-4– Valeur = 10– Unité statistique = Commune 86091– Poste de nomenclature = âge 5-9– Valeur = 20– …

Page 17: Jean-Luc LIPATZ INSEE Unités statistiques Distributions de population

Page 17

Jean-Luc LIPATZ

Questions de données

› Pas de normalisation›Données ménages, entreprises potentiellement

couvertes, mais pas de données bi-localisées.

›Ce ne sont pas des objets spatiaux :–Pas de géométrie

–Discussion en cours sur la nécessité d’un identifiant référable (= normalisation)