48
NUMERO SPECIAL Juillet - Août 2018 OPEN DATA Quelle(s) réutilisation(s) ? Quel accompagnement ? 66

OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

  • Upload
    others

  • View
    5

  • Download
    0

Embed Size (px)

Citation preview

Page 1: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

NUMERO SPECIALJuillet - Août 2018

OPEN DATAQuelle(s) réutilisation(s) ?Quel accompagnement ?

66

Page 2: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

Brèves p 4

• Zoom sur l’open data transport• L’internet des objets dans les collectivités : quelles données pour quels usages• Eformation : l’Open Data et vous• Supervision des données : feuille de route 2018-2019• Qui a ouvert Quoi ? Les résultats du recensement de Datactivist

Dossier

Introduction - Stratégie d’ouverture locale p 16

• Entretien avec Laurence Comparat, Présidente d’OpenDataFrance• « L’open data territoriale : où en est-on ? » article de Jean-Marie Bourgogne, Délé-

gué Général d’OpenDataFrance• L’exemple du Grand Lyon

1 L’accompagnement p 25

• DatARA - Urb@Data, une IDG ouverte à l’ensemble des acteurs publics de la ré-gion Auvergne-Rhône-Alpes

• Retour sur la mise en place de GéoGuyane• DataSud : rencontre avec Mathieu Kazmierski et Thomas Bekkers

2 Les réutilisations p 36

• Entretien avec Mathieu Garnier• Le Géocodage de la base SIRENE• Entretien avec Jean-Marc Lazard, Fondateur d’OpenDataSoft• Exemple entrepreunarial avec LKSpatialist

Petit glossaire réglementaire autour de l’open data p 46

Lectures

Calendrier

Page 3: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

L'ouverture des données n'a jamais autant été au centre des préoccupations de très nombreux acteurs. Ce numéro, comme un point d'étape pour profiter du paysage, montre tout le chemin parcouru et permet aussi d'avoir une idée de celui qui reste devant nous.

Au-delà de la transparence de l'action publique, il s'est agi très tôt de permettre la réutilisation de la donnée pour augmenter sa valeur d'usage tout en partageant ainsi son coût global pour la collectivité qui la produit. L'espoir d'une économie émergeant autour de ces données ouvertes a également été porté par cette vague puissante. Même si cela laisse parfois dubitatif les plus petites structures, la dimension économique conditionne d'une certaine manière le succès de certains projets. Copernicus, le programme européen d'observation de la Terre, avait fait le choix de la gratuité et de l'ouverture des données dès le départ, pour garantir une réutilisation massive et facilitée. Galileo, à l'inverse, disposait d'un modèle économique permettant un retour sur investissement (partiel) par des services payants adressés aux professionnels du positionnement de précision (inférieur au mètre) tout en offrant la gratuité pour le service de base (de l'ordre de 5m de précision). Le mouvement de libération des données pousse aujourd'hui à remettre en question ce modèle économique et à ouvrir les signaux de base de la constellation Galileo qui permettent la création de ces services de précision à valeur ajoutée. La commission européenne y travaille et l'offre concurrente l'y pousse également. Nous y reviendrons dans un prochain numéro.

L'ouverture des données rebat les cartes des modèles économiques, c'est une évidence. Mais avec suffisamment de recul, c'est certainement une belle opportunité, d'autant plus pour la sphère publique. A condition d'y voir clair et d'avoir une stratégie. C'est le cas par exemple du ministère de l'Ecologie qui se dote d'une feuille de route pour assurer la supervision générale de ses données.

Enfin, à titre individuel, nous avons la possibilité d'influer sur nos propres données à caractère personnel depuis le 25 mai dernier. Le côté répressif du RGPD devrait jouer son rôle pour faire évoluer les choses. Mais il y a aussi des démarches nouvelles, comme celle portée par la FING par exemple, qui nous proposent de radicalement changer notre point de vue sur les données que jusqu'ici nous consentions, résignés, à offrir sur un plateau, pire, sur des plate-formes. Ces démarches, #MyData, #SelfData ou autre #MesInfos, commencent à trouver un écho grandissant.

Ce numéro, spécial, a pris soin de faire le tour de nombreux aspects de l'ouverture des données et des mesures d'accompagnement qui lui sont nécessaires. Que tous ceux qui ont bien voulu lui consacrer de leur temps soient ici remerciés. En particulier Antoine Lemot, qui reprend le flambeau de l'assemblage final de votre lecture quadrimestrielle préférée, mais aussi Stéphane Lévêque qui veille à son contenu.

Bernard ALLOUCHE

Cerema Territoires et ville

Page 4: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

En 2015, la loi pour la croissance, l’activité etl’égalité des chances économiques (dite loiMacron) rendait déjà obligatoire l'ouverturedes données sur les transports publics et lesservices à la mobilité. Sur la demande duMinistère des Transports, le Ceremaaccompagne en pratique cette ouverture :nous nous en étions fait l'écho dans lenuméro 61 de Sign@ture.

Un observatoire, mis en ligne en septembre2016 sur la plateforme web Passim, a pour butde regrouper les données concernant lestransports collectifs, ainsi que les vélos etvéhicules en libre-service, ayant été publiées parles autorités organisatrices de la mobilité. Et afind’intégrer toutes les données déjà ouvertes surdes plateformes locales, le Cerema a référencésur data.gouv.fr celles qui n’y figuraient pasencore.

En matière d'open data dans le domaine dutransport et de la mobilité, le Cerema aégalement d’autres actions :

• l'ouvrage "L'Open Data en collectivité à lalumière des données de mobilité" paru en 2015 ;

• le projet Edredon, plateforme open data desdonnées de trafic routier.

En savoir plus sur ces projets :https://www.cerema.fr/fr/actualites/deux-observatoires-open-data-mobilite-geres-cerema

Cerema – Sign@ture n°66 4

Brèves

Zoom sur l’open data

transport

Stéphane Lévêque

Directeur de projets Ouverture et usages des données au Cerema

Page 5: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

Internet des objets dans lescollectivités : quelles données

pour quels usages ?

Optimisation de la gestion des réseaux ur-bains, information en temps réel pour mieuxgérer les déplacements… Les promesses del’Internet des objets suscitent un vif intérêtauprès des collectivités. Mais le marché destechnologies n’est pas encore stabilisé et lepassage à l’action est donc risqué. Le Cere-ma a étudié les premiers retours d’expé-rience, en partenariat avec l’Ecole des PontsParisTech et l’association Les Interconnec-tés, et propose un premier état des lieux surle sujet.

L’Internet des objets, ou « IoT » pour « Internetof things » en anglais, désigne les infrastructuresbasées sur des réseaux de capteurs communi-cants. La remontée d’information en provenance-du terrain ainsi générée, la data, permet l’amélio-

ration de la qualité de nombreux services : aide àla maintenance et à l’exploitation des réseaux,information en temps réel aux habitants, évalua-tion de politiques publiques, etc.

L’IoT séduit aisément les collectivités, car il al’avantage de proposer des retours sur investis-sement directs et mesurables, dès lors que deséconomies de fonctionnement sont générées parune gestion optimisée des réseaux d’eau, degaz, de transport, de collecte des déchets, etc.Des modèles économiques plus complexesémergent aussi à travers la valorisation des don-nées recueillies.

Les premiers retours d’expérience commencentà être disponibles, qui ont servi de base à l’étudeconduite par le Cerema, en partenariat avecl’École des Ponts ParisTech et l’association LesInterconnectés.

Cerema – Sign@ture n°66 5

Brèves

L’Internet des objets

dans les collectivités

Florent Boithias

Directeur de projets Villes et territoires intelligents au Cerema

Page 6: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

Optimiser la gestion de la ville grâce àl’acquisition de données d’usage

L’usage le plus évident de l’IoT concerne l’optimi-sation de la gestion des réseaux urbains grâce àla télé-relève, qu’il s’agisse des réseaux d’électri-cité, de chauffage ou encore d’eau. Ces sys-tèmes permettent notamment de repérer desphénomènes anormaux et coûteux à identifierautrement : fuites d’eau, défaillances d’isolation,mauvaise utilisation des équipements, gas-pillage, etc. Au-delà des économies de fluides di-rectement générées par une résolution accéléréedes dysfonctionnements, l’information ainsi dis-ponible permet d’optimiser l’organisation de lamaintenance et de travailler à l’optimisation del’usage des infrastructures. Par exemple, àSaint-Sulpice-la-Forêt, village de 1 400 habitantsen Ille-et-Vilaine, la mesure des consommationsénergétiques a permis une sensibilisation à labonne gestion des bâtiments publics et une opti-misation des agendas d’occupation pour minimi-ser les dépenses.

L’Internet des objets est également utilisé par lescollectivités pour réguler le trafic, au serviced’une meilleure qualité de vie et de l’attractivitédes centres-villes. Par exemple, la mise en placede capteurs de présence de véhicules sur lesplaces de stationnement constitue un levier pouraméliorer la rotation sur les places dédiées aucommerce de proximité et pour augmenter letaux de paiement. Ainsi, à Saint-Amand-Mon-trond, commune de 10 000 habitants dans leCher, les services de la ville reçoivent une notifi-cation en cas de dépassement du temps de sta-tionnement autorisé sur les places « minutes ».Ces capteurs permettent également une applica-tion optimisée du forfait post-stationnement, gé-nérant des revenus supplémentaires pour la col-lectivité.

Une connaissance fine des flux routiers entemps réel constitue en outre une aide à la déci-sion pour de nouveaux aménagements de voirieet pour une meilleure régulation du trafic. La Villede Rouen a quant à elle couplé des données detrafic et de qualité d’air devant une école pouroptimiser le trafic en fonction des nuisances me-surées. Elle joue pour cela sur la régulation des

feux tricolores. Il faut cependant disposer d’un iti-néraire de substitution afin de reporter le traficpour que le dispositif fonctionne bien.

Sur la base des données recueillies en tempsréel, des services aux usagers peuvent être dé-veloppés, tels que des calculateurs d’itinérairesmultimodaux et de prévision de trafic, comme leprojet Optimod à Lyon.Plus simplement, l’informa-tion sur la position destransports en commun etdonc sur les temps d’at-tente réels aux arrêtsconstitue en elle-mêmeune aide à la décision pré-cieuse pour les usagers,susceptible de favoriserleur utilisation des trans-ports collectifs.

Angers, de son côté, a ten-té de mesurer le taux deremplissage de ses silos àverre pour optimiser lestournées de ramassage.Les silos étant la plupartdu temps pleins en centre-ville, il s’est avéré que lepotentiel d’optimisationétait faible. Mais en périphérie, le remplissageplus hétérogène et moins fréquent des silos apermis une réelle rationalisation des tournées.

Cerema – Sign@ture n°66 6

Schéma de fonctionnement d'un capteur de remplissage CleanCap - Site d’E-Cube Labs, https ://www.ecubelabs.com/fr/ (source : étude Cerema)

Brèves L’internet des objets dans les collectivités

Copie d'écran de l'application Optimod à Lyon

Page 7: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

Pour faire des économies de matériaux et ré-duire l’impact sur l’environnement, des expéri-mentations concernant l’optimisation du salagedes routes par l’introduction de capteurs dans lachaussée ont été menées par l’agglomération deParis-Saclay et la Métropole de Lyon. Il s’agit dedéterminer en temps réel s’il est plus efficaced’épandre du sable ou du sel, selon la tempéra-ture mesurée, et s’il est réellement nécessaired’intervenir. Pour ce genre de dispositifs, le re-tour sur investissement dépend directement duclimat local et de la fréquence des épisodes degel.

D’autres cas d’usages sont également pos-sibles : l’éclairage intelligent, qui permet d’écono-miser de l’énergie et de repérer les pannes, lecontrôle des incivilités par télésurveillance ou en-core la mesure de la qualité de l’air et du bruitambiants, que ce soit de manière collaborative,grâce à des capteurs mobiles, ou par des cap-teurs fixes.

Obtenir des données de qualité

Pour que les données recueillies soient utiles, ilfaut avant tout qu’elles répondent à un besoinidentifié en amont ou révélé a posteriori. Pourcela, s’appuyer sur les équipes de terrain, quisont au contact des phénomènes à mesurer etqui sont susceptibles d’exploiter directement lesdonnées recueillies, constitue un facteur de suc-cès. Mais après cette phase d’identification dubesoin, il faut que les mesures réalisées soientfiables et représentatives des phénomènes phy-siques. Sur ce point, plusieurs paramètres sont àprendre en compte.

Tout d’abord, la précision intrinsèque du capteurjoue sur la qualité de mesure, mais égalementsur son coût. Ainsi, des capteurs onéreux nepourront pas être déployés en autant de pointsde mesure que des capteurs de moins bonnequalité, et un compromis sera alors nécessaire,en complément d’un algorithme d’extrapolationplus ou moins poussé pour couvrir les zones dé-pourvues de capteurs.

La fréquence d’enregistrement et la fréquencede transmission des données vers une centralede télé-relève constituent également des para-

mètres importants. En effet, la fréquence d’enre-gistrement doit être cohérente avec la fluctuationnaturelle du phénomène observé, tandis que lafréquence de transmission des données doit êtrefonction des performances du réseau de commu-nication utilisé. Toutes deux, ainsi que le proces-sus de mesure lui-même, consomment de l’éner-gie, et influent donc sur l’autonomie du capteurlorsque celui-ci fonctionne sur batterie.

Enfin, le positionnement des capteurs par rap-port aux phénomènes observés est lui aussi unélément déterminant. Par exemple, sur la Placede la Nation, à Paris, les capteurs de bruit ontessentiellement mesuré un bruit de fond, ce quin’a pas permis de cibler le bruit local de la voiede circulation à côté de laquelle ils étaient posi-tionnés.

En attendant des standards, miser surl’interopérabilité des formats de données

Le marché de l’Internet des objets n’est pas en-core stabilisé : les acteurs dominants ne sontpas encore connus, le potentiel d’innovation esttoujours élevé et l’offre n’est pas encore totale-ment standardisée. De ce fait, il faut rester pru-dent dans le choix des technologies et éviterl’enfermement dans une unique solution.

Pour cela, il est recommandé de miser sur uneinteropérabilité maximale, que ce soit entre lesréseaux de transmission ou entre les jeux dedonnées recueillis, afin de pouvoir croiser cesderniers et, par exemple, comparer des donnéesanciennes avec des données actuelles.

Cerema – Sign@ture n°66 7

Photo d’un capteur de qualité de l’air (particules fines, O 3, NO 2) - Site duconstructeur : Libelium http ://www.libelium.com (source : étude Cerema)

Brèves L’internet des objets dans les collectivités

Page 8: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

Concrètement, il faut chercher à conserver unmaximum de données contextuelles relatives àla mesure, telles que l’heure de la mesure ou laposition précise du capteur, par exemple, pouraugmenter les chances de pouvoir s’adapter àun ou plusieurs futur(s) standard(s). Il faut égale-ment assurer la portabilité des données lorsquel’on contractualise, afin de les conserver en casde changement d’opérateur.

Valoriser les données en les libérant, encréant de nouveaux services et en adaptant

les tarifications à l’usage

Le développement de l’Internet des objets posela question du modèle économique à développerpour pérenniser les infrastructures et les servicesmis en place. Au-delà du retour sur investisse-ment direct lié aux économies de fluides et demaintenance, ainsi qu’à l’optimisation de l’appli-cation du forfait post-stationnement, décrits plushaut, des modèles économiques plus originauxapparaissent, s’appuyant sur la valorisation desdonnées recueillies.

Tout d’abord, l’ouverture des données issues del’Internet des objets (open data) est source dedéveloppement socio-économique pour la collec-tivité, grâce à la création de nouveaux serviceset à la meilleure diffusion de l’information qu’ellepermet.

En parallèle, c’est une économie servicielle quise développe, grâce notamment aux croise-ments de données. La collectivité est ainsi enmesure de proposer le service de réalisationd’un itinéraire le plus rapidement possible au lieud’un simple moyen de transport. De même, pourla gestion des déchets, au lieu de fournir commeprestation le fait de débarrasser les déchets àdates fixes, il s’agit d’assurer un service de villepropre en ramassant les déchets quand cela estnécessaire. Au niveau de la contractualisation,cela se traduit par un développement des mar-chés portant sur des services et non sur desprestations.

Les modèles économiques évoluent aussi par latransformation de l’usager en producteur de don-nées. En effet, nombre de modèles économiquesdits de « plateforme » utilisent la donnée géné-

rée par les utilisateurs eux-mêmes pour assurerle service. La plateforme Waze, par exemple, op-timise ses calculs d’itinéraires en fonction des in-formations en temps réel en provenance de lacommunauté de ses utilisateurs. De même, àSaint-Amand-Montrond, les habitants peuventtransmettre des mesures de bruit réalisées parleur smartphone directement à leur collectivitévia une application dédiée.

Enfin, les objets connectés permettent d’avoirune connaissance plus fine et en temps réel desdegrés de fréquentation ou d’utilisation d’un ser-vice, et il devient alors possible d’envisager unetarification du service au plus proche du coûtsocial qu’il représente au moment où il est utilisé.Par exemple, dans les domaines de la distribu-tion d’eau ou d’électricité, le modèle dit « d’effa-cement » se développe, visant à lisser les picsde consommation par une tarification incitative,plus élevée aux heures de pointe.

Tout ceci nécessite des prises de décisionstransparentes, associant fortement les citoyens.L’enjeu est en effet la confiance à long terme desadministrés dans les dispositifs mis en place,qu’il s’agisse de la protection des données per-sonnelles ou de la transparence des algorithmesqui vont progressivement automatiser les villes.

Accéder à l’étude conduite par le Cerema, en partenariat avec l’École des Ponts ParisTech et l’association Les Interconnectés.

https://www.cerema.fr/fr/actualites/internet-objets-smart-city

Cerema – Sign@ture n°66 8

Brèves L’internet des objets dans les collectivités

Page 9: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

L'open data et vous : répondezaux quiz et obtenez votre badge

open data !

En ligne sur le site du Cerema(eformation.cerema.fr) depuis le 2 avril 2018,le nouveau module de E-formation « l’opendata et vous » s’adresse à tous les agents pu-blics qui souhaitent comprendre les principesde l’open data et son implication dans leurquotidien professionnel et privé.

Cette formation, proposée par la préfecture derégion Auvergne-Rhône-Alpes, a pour objectifd’acculturer les agents publics à l’open data, en-jeu devenu majeur notamment depuis la promul-gation de la Loi pour une République numé-rique en octobre 2016, et l'obligation pour les ad-ministrations de publier leurs données publiques.

Or, s i la réuss i te de l 'admin is t ra t ion nu -mér ique passe forcément par la formation desagents qui produisent quotidiennement de ladonnée, force est de constater qu’aujourd’huiencore l’open data demeure une not ionobscure pour une major i té et sembleêt re cantonnée à un mi l ieu d’experts e tde spécia l is tes.

Objectif : donner un premier niveau deconnaissance de l ’ open data

aux agents publics

Ce programme de formation a pour objectif d’ai-der à comprendre les principes de l’open data,ses implications dans la fonction publique et lerôle des agents vis-à-vis de la donnée publique.

Pour répondre au plus près des attentes des uti-lisateurs, les objectifs pédagogiques de la forma-tion “L’open data et vous” ont été co-construitsavec des agents publics. Le module a ensuitefait l’objet d’un test utilisateur avant d’être mis enligne.

Cerema – Sign@ture n°66 9

Brèves

E-Formation

L’Open Data et vous

Cédric Spérandio

Directeur du service de la modernisation et de la coordination régionale, Préfecture Auvergne-Rhône-Alpes

Fabrice Thiébaux

Directeur de projets en géomatique et formation à distance au Cerema

Page 10: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

Le parcours de formation est découpé en cinqthèmes :

La donnée au quotidien,

L’open data : un enjeu de société,

Open data et mission de service public,

Vous et le cycle de vie de la donnée,

Savoir trouver de la donnée.

Un module de formation simple, ludique etfacilement accessible

D’une durée totale de trois heures, ce pro-gramme a été pensé pour permettre aux agentsde le suivre à distance et en autonomie. Il peutaussi être proposé à un groupe d'agents en pré-sentiel par un animateur afin de faciliter l’appren-tissage, notamment pour les publics les plus éloi-gnés de l’utilisation des outils numériques.

Atout majeur pour la réussite d’une formation enligne, “L’open data et vous” mobilise plusieursvecteurs pédagogiques. En plus des textes, desvidéos, des infographies et des quiz permettenten effet aux utilisateurs de tester leurs apprentis-sages tout au long du parcours.

À l’issue de la formation, lesagents peuvent valoriser lescompétences acquisesgrâce à l’obtention d’unbadge numérique.

Ce module de formation enligne a été conçu dans lecadre d’un partenariat entre

la Préfecture de Région et son laboratoire d’inno-vations territoriales @RCHIPEL, le Cerema, leCNFPT et l’association OpenData France, avecle concours financier du Fonds Innovation Res-sources Humaines 2017.

La conception pédagogique, la production desressources, la mise en forme et la publication dela formation ont été assurées par le groupe Di-git@l du Cerema Territoires et Ville, sur la basedes connaissances et des savoirs apportés parl’ensemble des partenaires.

Le volet communication du projet a été accom-pagné par un Junior Lab du master 2 Médiationsurbaines, savoirs et expertises (MUSE) de l’Insti-tut de la communication, Université Lyon 2.

Pour accéder à la formation, inscrivez-vous

sur eformation.cerema.fr

Cerema – Sign@ture n°66 10

Brèves L’open data et vous

Depuis l'ouverture de la formation…

500 inscriptions 407 quiz réalisés

par les apprenants

73 badgesattribués aux plus courageux qui ont

répondu aux 5 questionnaires de

validation

70 % des inscritssont des agents de la fonction publique

d’État et

16 % sont issus de la

fonction publique territoriale

Les cadresde

catégorie A et A+ sont les plus

nombreux à suivre

cette formation (63 % des inscrits), suivis par les agents

de catégorie B (22 %

des inscrits)

Le CNFPThéberge la formation sur ces propres outils de e-formation pour la valoriser directement auprès des collectivités

Le Ministère de l’Intérieur va faire de même

Page 11: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

La superviseure générale desdonnées du MTES et du MCT

publie sa feuille de route 2018-2019

La supervision générale des données (SGD)du pôle ministériel MTES (Ministère de laTransition Ecologique et Solidaire) et MCT(Ministère de la Cohésion des Territoires) dé-veloppe son action au travers de la publica-tion de sa première feuille de route, 2 ansaprès la remise du rapport de préfiguration.

Pour mener à bien son action, Laurence Mon-noyer-Smith, Commissaire générale au déve-loppement durable (CGDD) et Superviseuregénérale des données, s’appuie depuis 2 anssur une task-force et un comité de correspon-dants « données » issus des directions géné-rales, de directions régionales et des princi-paux opérateurs concernés.

Une journée dédiée à la donnée a été organiséele 17 novembre 2017, moment fort destiné à l’ad-ministration centrale ou déconcentrée, aux opé-rateurs, au réseau scientifique et technique et or-ganismes sous tutelle, à tous les profils : du ma-nager aux agents, profil technique, métier ou ad-ministratif. Chacun a pu se faire un programmede découverte des différentes facettes de la don-née au travers des deux tables rondes et desvingt ateliers proposés.

Au niveau de l’État, l’administrateur général desdonnées marque dans son rapport au PremierMinistre sa volonté de renforcer le réseau desadministrateurs ministériels des données. LeMTES et le MCT sont précurseurs dans ce mou-vement.

C’est donc dans un contexte fertile que la feuillede route est mise au point. Son titre « La don-née : un nouveau bien essentiel pour la transitionécologique et solidaire et la cohésion des terri-toires » fait écho au titre du rapport de l’Adminis-trateur général des données (AGD) Henri Verdierparlant d’ « infrastructure essentielle ».

La feuille de route « ambitieuse, réaliste et adap-tée aux enjeux des services du pôle ministériel »présente 40 actions réparties dans 4 do-maines que sont la gouvernance de la donnée,l’architecture de la donnée, l’infrastructure appli-cative et technique et enfin la sécurité et laconformité. La prise en compte du besoin demontée en compétence à tous les échelons, in-formatiques comme métiers, apparaît en filconducteur dans ces actions.

Gouvernance de la donnée

Ce domaine traite des outils et moyens à dé-ployer afin que la donnée, bien essentiel, rentreau cœur des métiers au travers d’une gouver-nance à tous niveaux, en lien avec l’AGD. Ausein de la gouvernance à mettre en place, unetask-force composée d’agents du SG et duCGDD constitue le bras agile de la SGD pour les

Cerema – Sign@ture n°66 11

1

Brèves

Supervision des

donnéesFeuille de route 2018-2019

Benoît David

Chef de la Mission Information Géographique au CGDD

Oliver Dissard

Chargé de mission à la Mission Information Géographique au CGDD

Page 12: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

actions quotidiennes de la mise en œuvre decette gouvernance. Un comité des correspon-dants « données » des directions générales, dedirections régionales et de principaux opérateursse positionne en relai dans les deux sens pouralimenter la réflexion et faciliter tous leséchanges.

Un corpus de règles sera construit qui permettrade disposer d’un cadre de gestion et d’utilisationdes données clair et partagé.

Architecture de la donnée

Une production et une utilisation optimales desdonnées ne vont pas sans disposer d’un inven-taire de celles-ci muni de critères de classifica-tion pour en faciliter la recherche. Pour ouvrir lesusages de données métier, les valoriser et lesenrichir au travers de croisements, il convient, audépart, aux producteurs d’en modéliser lesconcepts afin qu’ils soient appropriés par lesautres métiers. Il convient aussi de travaillerdans le cadre plus large de l’État, notamment ens’acculturant au « service public de la donnée »ou en insérant nos travaux au regard du principe« dites-le-nous une fois ».

Infrastructure applicative et technique

Pour faciliter la transmission, le partage, la valo-risation des données par les métiers, il faut allé-ger au maximum le poids technologique de l’in-frastructure tout en offrant des briques technolo-giques modernes et des exemples d’infrastruc-tures qui donnent envie d’ « y aller », de décou-vrir et de construire. De nouveaux outils sont àmettre en place pour faciliter l’usage des don-nées par le « métier ».

Sécurité et conformité

L’ouverture des données ne va pas sans un mi-nimum de précautions et de mise en conformitéaux règles : tenir un registre des traitementsdans le cadre de la mise en œuvre du RGPD,gérer les droits d’accès et tracer les accès auxdonnées. La SGD accompagne les services mé-tiers dans ces étapes qui ne doivent pas devenirdes obstacles à l’ouverture des données.

Pour lire la feuille de route :

https://www.ecologique-solidaire.gouv.fr/missions-du-superviseur-general-des-donnees#e0

Cerema – Sign@ture n°66 12

BrèvesSupervision des

données

Page 13: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

« Qui a ouvert quoi ? » le recensement des données

des villes réalisé par Datactivist

Entre avril et septembre 2017, la stratégie surl’open data de 16 grandes villes françaises(Paris, Marseille, Grand Lyon, Toulouse, Nice,Rennes, Nantes, Montpellier, Bordeaux, Lille,Angers, Grenoble, Poitiers, Strasbourg, Mar-tigues et Saint-Malo) a été étudiée et fait l’ob-jet d’un recensement. Ce travail, réalisé surplus de 400 jeux de données, a été mené parTimothée Gidoin, membre de Datactivist.

Les objectifs de ce recensement étaient :

d’obtenir un « premier panorama des don-nées ouvrables par les villes »

d’avoir « un outil d’évaluation de la “commu-nicabilité” d’une donnée : le fait qu’une ville don-née a ouvert un jeu de données similairesprouve qu’il est possible légalement d’ouvrir cesdonnées dans une autre collectivité »

« de proposer un outil de pilotage d’une po-litique d’open data » qui permet de guider leschef-fe-s de projet d’open data vers de nouveauxjeux de données à ouvrir.

Sur la forme des stratégies d’open data, les ré-sultats du recensement mettent en avant 3sources de frictions principales et un manque dedialogue avec les réutilisateurs qui pourrait pour-tant atténuer ces frictions. Sur leur fond, ils pro-posent de reconsidérer politiquement l’approchede l’open data.

Première source de friction, « la grande hétéro-généité des données » publiées montre la dis-parité des politiques d’open data entre municipa-lités et ce malgré le socle commun de donnéeslocales proposé par Open Data France (et qui« aide à la mise en œuvre d’un ensemble cohé-rent, interopérable et prioritaire de données pro-duites au niveau local afin de constituer un gise-ment national de qualité »1).

La deuxième source de friction révélée par le re-censement est « une documentation des don-nées laconique » qui a deux effets négatifs :

une mauvaise indexation des données etdonc des difficultés de "découvrabilité" des don-nées ;

des difficultés de réutilisation par le publicpar manque d'informations sur la donnée.

1 Présentation du socle commun des données sur le site d’OpenDa-taLocal :http://opendatalocale.net/presentation/

Cerema – Sign@ture n°66 13

Brèves

Qui a ouvert quoi ?

Antoine Lemot

Chargé de mission géomatique au Cerema Ile-de-France

Graphique extrait du blog de datactivist (https://medium.com/datactivist)

Page 14: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

Enfin la troisième source de friction est lenombre « des données parfois inexploi-tables ». En cause, la qualité des données, leuractualité, leur complétude, leur structure (co-lonne en doublon, coordonnées géographiqueserronées, etc) qui empêchent ou compliquentfortement leur réutilisation.

Malheureusement, pour palier à ces 3 sourcesde frictions, il n’existe que « peu de méca-nismes de remontée des problèmes parles usagers ». Ainsi, des plateformesd’échanges, du type fil de commentaires, offrantla possibilité d’échanges et d’entraides entreusager n’ont été recensées que dans 6 villes.

Mais plus que « ces sources de frictions » le re-censement soutient la conclusion que l’objectifprincipal aujourd’hui pour les collectivités doitêtre de « passer de l’open data “de l’offre” àl’open data “de la demande” ». En effet, à l’en-contre de l’idéal des grands principes de l’opendata, les administrations cadenassent trop l’ou-verture (elles contrôlent l’ensemble du processdu choix de la donnée à ouvrir à sa publication)sans véritable consultation citoyenne.

Datactivist propose donc à travers le projet DO-DOdata de « réveiller les données qui dorment ».Soit de laisser au citoyen la liberté de proposerquelle donnée il souhaite voir ouverte. Les sub-ventions de la ville de Vitry-sur-Seine ou la miseà jour des autorisations de tournages de la villede Paris en sont des exemples.

Enfin, il est à signaler que Datactivist étend sonchamp d’investigation aux données ouvertes parles conseils départementaux et s’est lancé dansl’automatisation par le machine learning de cetravail de recensement.

Les résultats complets et l’analyse du recensement sont à retrouver sur :

https://medium.com/datactivist/qui-a-ouvert-quoi-le-recensement-des-donn%C3%A9es-des-villes-est-maintenant-ouvert-b7f697135c1f

Pour découvrir Datactivist, il suffit de suivre

le lien https://datactivist.coop/

Et le projet DODOdata est expliqué ici :

https://dododata.io/

Cerema – Sign@ture n°66 14

Brèves Qui a ouvert quoi ?

Tableur ne veut pas toujours dire données structurées - extrait dublog de datactivist (https://medium.com/datactivist)

Page 15: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

DOSSIERL'ouverture des données publiques prend un essor considérable depuis la loi pour une République numérique, qui acte le principe de l'ouverture par défaut des données publiques et liste des jeux de données de référence via le service public de la donnée.

L'objectif de ce dossier est de faire un point d'étape qualitatif de cette dynamique, en mettant l'accent sur les réutilisations et l'accompagnement.

Ainsi nous commencerons par analyser les aspects stratégiques de l’ouverture des données locales, avec l'interview de Laurence Comparat, présidente d'OpenDataFrance, autour des valeurs et des enjeux actuels de l'open data. En regard de cet entretien, l'article de Jean-Marie Bourgogne, Délégué général d'OpenDataFrance, précise l'état d'avancement de l'ouverture des données et les actions en cours. L’illustration du Grand Lyon viendra compléter ce tour d’horizon.

Pour parler d'accompagnement, nous avons voulu mettre l'accent sur les plateformes régionales : les infrastructures mises en place en Auvergne-Rhône-Alpes – DatARA – et en Guyane – GéoGuyane – sont en effet en train d'évoluer vers le grand public et l'ouverture des données. En regard de ces articles plus techniques, nous avons voulu un retour qualitatif avec un entretien croisé autour de DataSud, questionnant notamment les réutilisations.

La réutilisation justement, enjeu fort à venir, est traitée avec deux interviews : celle de Mathieu Garnier, réutilisateur enthousiaste, et celle de Jean-Marc Lazard, fondateur d’OpenDataSoft. Des exemples de réutilisation – réalisés respectivement par Christian Quest et par LKSpatialist – illustreront encore plus les propos.

Introduction : stratégie d’ouverture locale p. 16

1. L’accompagnement p. 25

2. La réutilisation p. 36

Page 16: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

Quelles sont les valeurs sous-tendues par l'open data ?

Historiquement, l’ouverture des données pu-bliques s’inscrit dans la mouvance du libre et descommuns. On y retrouve le principe d’avoir desbiens communs qui vont aider à l’appropriation,la diffusion ou l’élaboration de la connaissance. Ils’agit de permettre aux acteurs, qu’ils soient ci-toyens, entrepreneurs, chercheurs, ou encorejournalistes, de s’emparer de ces données et defaire sens au service de l’intérêt général.

C’est cela qui conduit à l’idée que l’on rend pu-bliques des données, sous des formats qui sontouverts, facilement réutilisables, et avec une li-berté de réutilisation. Le service public peut seretrouver assez facilement dans ces valeurs-là,car il est garant de la transparence de l’utilisationde l’argent public, et de l’intérêt général.

Une fois posée cette philosophie de base, sepose la question de comment les institutions s’yintègrent concrètement. Il y a des enjeux de dé-mocratie, de transparence de la vie publique,mais aussi, à l’échelle des collectivités territo-riales, d’animation et de connaissance du terri-toire.

Cette animation est à destination des réutilisa-trices et des réutilisateurs potentiels : citoyenneset citoyens, associations, chercheuses et cher-cheurs, journalistes, entreprises, etc. L’enjeu estde dialoguer avec ces acteurs-là pour que lesdonnées que l’on va rendre publiques puissentservir au territoire, et répondre à des besoins lo-caux.

Le fait de rendre les données disponibles gratui-tement entraîne une perte de visibilité sur lesréutilisations, et un dispositif d’animation permetd’avoir des retours : les données sont-elles réuti-lisées, par qui, dans quel but, conviennent-ellesaux utilisateurs, etc.

Cerema – Sign@ture n°66 16

Entretien

Laurence Comparat

Présidente de l’ association OpenDataFrance,Adjointe Open data, logiciels libres et Administration générale à la ville de Grenoble

introduction

Stratégie d’ouverture locale

Rencontre avec OpenDataFrance :

Laurence Comparat et Jean-Marie Bourgogne

L’exemple du Grand Lyon

Page 17: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

En quoi ces valeurs s’inscrivent-ellesdans le travail d'OpenDataFrance ?

OpenDataFrance a à la fois un rôle d’accompa-gnement des collectivités locales, en matièred’ouverture des données, un rôle de veille, et unrôle de contact avec différents acteurs. Nous dia-loguons par exemple avec les éditeurs de logi-ciels, pour voir comment accéder aux donnéesstockées dans les applications. Nous avons aus-si été en discussion avec l’État, lors de l’élabora-tion de la Loi Lemaire notamment. Une fois obte-nue l’obligation légale d’ouverture des données,la question s’est posée des moyens que l’on sedonne pour aider les acteurs publics concernés àla mise en œuvre effective. Il y avait un véritableenjeu à ne pas laisser les acteurs publics seuls,et cela a été tout le sens de la démarche Open-Data Locale en 2017.

Cette année, nous portons des projets autour del’observatoire de l’open data et de la qualité desdonnées (Validata), plus dans une démarched’analyse globale et d’outillage des acteurs, aus-si bien pour celles et ceux qui vont vouloir rendrede la donnée publique, que pour celles et ceuxqui vont l’utiliser. Il s’agit d’avoir une visionconsolidée de ce qu’est l’open data en Franceaujourd’hui : connaître ce qui est disponible,mais aussi sa qualité, au sens du format et de lafacilité de réutilisation. L’information diffusée estde qualité, car elle sert quotidiennement au fonc-tionnement de l’institution, mais il s’agit de savoirsi elle est réutilisable facilement.

OpenDataFrance a donc un accompagnement àla fois théorique – partager la philosophie del’open data – et très pratique, avec des outils quipermettent d’ouvrir effectivement les données.

Il y a un véritable enjeu à donner envie d’ouvrirles données, car l’obligation réglementaire –sans moyen associé – n’est pas forcément unemotivation suffisante. Il faut faire comprendretout l’intérêt qu’il y a pour l’institution à entrerdans une dynamique, à s’emparer du sujet pourelle-même.

Avec un recul de 5 ans (date de lacréation d’OpenDataFrance), ces

valeurs portées ont-elles avancéesgrâce à l’open data ?

Plus généralement où en est lemouvement ?

Il y a eu l’époque des pionniers, époque à la-quelle Rennes, Toulouse, Lyon, et d’autress’étaient lancés dans l’open data et avaient unpetit peu essuyé les plâtres. C’était des gens quiconnaissaient l’histoire et la philosophie del’open data, et qui étaient très motivés pour ça.

Aujourd’hui, les choses ont évolué. De très nom-breuses nouvelles collectivités sont entrées dansOpenData Locale l’année dernière : on a eu unpic, même si on est encore très loin d’avoir tou-ché tout le monde.

Et on a un profil nouveau : ce sont des acteursqui s’inscrivent dans le chemin qui a été ouvert,et qui ont peut-être moins de bagage historiqueet culturel sur la démarche, qui ont moins d’ex-pertise technique sur ces questions-là, qui ontune approche moins « militante ». C’est intéres-sant parce qu’ils bénéficient de la dynamique quia été créée par les pionniers, et qu’ils arriventaussi avec une approche plus pragmatique, plusinterrogative, sur le choix des données à rendrepubliques par exemple. Ces regards croisés,entre pionniers à la vision stratégique et avecune expérience de plusieurs années, et nou-veaux entrants aux questions très pratiques, sontintéressants et provoquent des échanges riches.

Cerema – Sign@ture n°66 17

Stratégie

d’ouverture localeEntretien avecLaurence Comparat

Page 18: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

Il est difficile de dire si l’open data en France aservi une dynamique démocratique et de trans-parence : en tout cas elle ne l’a pas desservie.

Toute la question est de savoir ce qui est faitavec les données, et c’est quelque chose de diffi-cile. Sur le principe, on n’a pas à demander decompte à l’utilisateur : les données sont en accèslibre. Tout la difficulté réside dans le fait d’avoirdes retours, y compris sur l’expertise citoyenne,sans brider la réutilisation. On a des contactsspontanés – à Grenoble par exemple, sur la qua-lité de l’air, il y a des débats sur les réseaux so-ciaux – mais c’est difficile à mesurer de manièresystématique.

Quels sont les grands types deréutilisations ?

Il y a des réutilisations assez classiques sur lesdonnées de transport, qui sont réutilisées y com-pris par les collectivités elles-mêmes. A la Métro-pole de Grenoble par exemple, nous avons dé-veloppé une application locale de mobilité grâceà nos données qui sont par ailleurs en opendata. Ainsi, en parallèle à l’ouverture d’un lot dedonnées, on offre aussi un service parce quec’est de notre compétence.

Les données cartographiques sont aussi beau-coup utilisées, y compris par des acteurs asso-ciatifs comme OpenStreetMap. Par exemple àDigne, il n’y avait pas de moyens suffisants pourun service SIG en interne, et un travail a été faitavec la communauté locale d'OpenStreetMappour réaliser, avec les agents de la collectivité etles habitants, la cartographie du territoire. La col-lectivité utilise les données qui ont été collectéespar OpenStreetMap pour gérer sa cartographieen interne.

On a aussides usagesplus commer-ciaux. Il y apar exemplel’application« Qui ditMiam » qui estpartie des

cantines à Toulouse, et offre maintenant un ser-vice payant aux collectivités en proposant, sur labase des menus de la cantine, une informationdes parents sur les menus, les allergènes, etc.

Des utilisations peuvent être plus citoyennes oumilitantes, avec les données sur la qualité del’air, les données financières, etc.

La diversité de ces réutilisations est intéres-sante : l’open data n’est pas utile qu’à un seultype d’acteur.

L’open data peut-elle favoriserl'émergence de start ups, agir sur

l’économie ? Est-ce une motivationdes collectivités ?

Cela dépendra du type de collectivité : une com-mune, une métropole, un département ou unerégion n’auront pas les mêmes motivations.

Dans les territoires dans lesquels il y a une dyna-mique autour des start ups – par exemples lesvilles et régions labellisées French Tech – c’estun des axes de la stratégie open data que des’adresser à ces acteurs-là.

Au début de l’open data, il y avait l’idée que l’onmettrait les données en ligne et que cela mar-cherait tout seul. On se rend compte que ce n’estpas vrai. Il faut entrer en dialogue avec les ac-teurs du territoire, car les données que l’on vamettre en ligne ne sont pas forcément celles quele territoire va attendre. Il faut dialoguer autourdes besoins en données pour répondre à plu-sieurs questions : qui possèdent les donnéesdont les acteurs ont besoin, peut-on les diffuser,faut-il les créer si elles n’existent pas, etc.

Cerema – Sign@ture n°66 18

Stratégie

d’ouverture localeEntretien avecLaurence Comparat

Page 19: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

On peut alors rentrer dans un cercle vertueux : lamise à disposition des données entraîne l’ex-pression de besoins par les acteurs du territoire,qui entraîne elle-même l’enrichissement desdonnées diffusées par la collectivité.

Les conseils donnés par OpenDataFrance re-lèvent de la stratégie et de la définition de priori-tés. Il ne faut pas forcément vouloir diffusertoutes les données tout de suite, mais plutôt y al-ler progressivement et définir les premières don-nées à ouvrir en fonction d’objectifs stratégiques,et de la cible. On ne rend pas publiques lesmêmes données selon que l’on s’adresse aumonde économique, aux citoyens, ou aux autresadministrations.

Pour éclairer ces choix, OpenDataFrance a défi-ni le socle commun des données locales, quisuggère une dizaine de lots de données que l’onpeut ouvrir en premier. Ces jeux de donnéesconcernent des compétences répandues, et sontformatés pour rendre plus facile leur création.Une autre façon de démarrer : se baser sur lesbesoins émis à l'encontre de la collectivité ; decette façon, on est sûr que les données vont êtreréutilisées.

Quels sont les dispositifs existants enmatière d’animation des acteurs ?

Il n’y a rien de vraiment normé : cela dépend desressources disponibles sur le territoire. Une com-mune peut par exemple se rapprocher de son in-tercommunalité si cette dernière a déjà une dé-marche open data. Les acteurs locaux peuventaussi servir de relais, pour la réutilisation oul’animation : acteurs FrenchTech, associationsactives sur le territoire – par exemple Datactivistou OpenStreetMap – etc.

Il est important pour une collectivité qui se lancedans une démarche d’open data de ne pas res-ter seule. Il y a suffisamment d’acteurs de l’opendata en France pour en trouver un à proximité,pour échanger des expériences. Ce sont ces ré-seaux locaux qui permettent un effet d’entraîne-ment.

Il y a peu de personnes formées à l’open datadans les institutions. On a besoin d’une fortemontée en compétence sur les enjeux de l’opendata, qui posent beaucoup de questions. Setourner vers des personnes qui ont déjà franchile pas de l’open data, cela permet de ne pas res-ter seul avec ses questions. Et cela permet ausside mutualiser.

C’est aussi l’intérêt d’une association commeOpenDataFrance : être une caisse de résonanceet un lieu d’échanges d’expériences.

Y a-t-il des acteurs autres que lescollectivités qui ouvrent leurs

données ? Sont-ils accompagnés parOpenDataFrance ?

OpenDataFrance est exclusivement en appuides collectivités locales. On estime qu’il y en a4000 qui tombent sous l’obligation de la Loi Le-maire.

Selon les cas, bien sûr, on rencontre d’autres ac-teurs. OpenDataFrance est notamment en rela-tion avec Etalab, car les collectivités peuvent uti-liser data.gouv.fr, le portail open data de l'Etat,pour publier leurs données.

On peut être en relation également avec lesmembres de l’enseignement supérieur et de larecherche, avec les services déconcentrés deL’État…

Par exemple, en Auvergne-Rhône-Alpes, dans lecadre d'OpenData Locale, l’un des animateursde la donnée à été le laboratoire @RCHIPEL, dela Préfecture de Région. Même si ce laboratoirese concentrait sur l’accompagnement des ser-vices de L’État, les démarches d’open data sontvraiment des démarches de territoire, et des pas-serelles peuvent se faire entre les différents ac-teurs. Les données des uns peuvent servir auxautres.

Cerema – Sign@ture n°66 19

Stratégie

d’ouverture localeEntretien avecLaurence Comparat

Stratégie

d’ouverture localeEntretien avecLaurence Comparat

Page 20: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

Quels enjeux voyez vous pour lasuite ?

Il y a clairement l'enjeu de la formation desagents et des élus, en lien avec le RGPD, et latransformation numérique des collectivités.Quand on arrive à rendre publique la donnée,c'est qu'il y a eu un travail en interne de structu-ration et de gestion de la donnée : l'open dataest la partie immergée d'autres démarches nu-mériques. Ce sont des questions qui montentfortement, mais il y a besoin d'une remise à ni-veau globale des agentes et des agents pourêtre capables de proposer les bons outils, lesbonnes méthodes, etc. Ce type de formation àl'organisation numérique et à la donnée devraitfaire partie d'une formation à l'arrivée en posteou des préparations aux concours.

Pour le reste, OpenDataFrance continue la dé-marche OpenData locale, pour favoriser la mon-tée en puissance des collectivités. De plus, ondéploie des outils d'observation – quantitative etqualitative – et de mise en qualité des donnéesdiffusées, pour les rendre le plus propre possibleafin qu'elles soit facilement réutilisables.

Entretien réalisé le 11 juin 2018, par Stéphane Lévêque

Cerema – Sign@ture n°66 20

Stratégie

d’ouverture localeEntretien avecLaurence Comparat

Page 21: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

Plus que quelques semaines et nous entronsdans le régime d’ouverture par défaut desdonnées publiques tel que le prévoit la loi Ré-publique Numérique, et dont la date d’appli-cation au plus tard est le 7 octobre 2018. Lescollectivités sont-elles prêtes ? quels ensei-gnements peut-on tirer des efforts mener cesderniers mois pour accompagner les acteurspublics ? quels sont les défis qui se pré-sentent à elles ?

Les écosystèmes s’enrichissent, les offresd’accompagnement s’étoffent et pourtant lescollectivités restent encore très démunies auregard des enjeux de la maîtrise desdonnées.

Comme nous l’avons vu pour le RGPD, règle-ment déjà ancien puisqu’il remonte à 2015, lescollectivités assument, ou plutôt affrontent, leséchéances avec discipline. Elles essaient decomprendre les enjeux et de transformer les« obligations en opportunités ». Mais cette for-mule cache souvent un sentiment de contrariétévis-à-vis des priorités et des ressources dispo-nibles de la collectivité. Les collectivités pré-fèrent-elles vraiment l’étreinte à la contrainte ?Ce n’est pas sûr et dans de très nombreux cas,ce qui était ressenti comme une obligation, unerupture, est perçu après sa mise en œuvrecomme un progrès, un avantage, que l’on ne re-mettrait plus en question aujourd’hui.

Des collectivités pionnières se sont engagéesdès 2010 dans l’ouverture des données. Plus de300 collectivités font de l’open data aujourd’hui,c’est beaucoup et c’est trop peu. Beaucoupparce que les collectivités importantes ayant descompétences dans le champ des grands ser-

vices urbains et de l’économie sont prêtes. Laquasi-totalité des régions, des métropoles et desgrandes agglomérations ont ouvert leurs don-nées depuis des années et poursuivent leurs ef-forts en étendant le périmètre de leur action versla Ville intelligente (optimisation des services ur-bains par les nouvelles technologies) ou la maî-trise du patrimoine informationnel de la collectivi-té (nomination d’un Administrateur Général desDonnées, etc). Mais la situation est bien diffé-rente au niveau des petites et moyennes collecti-vités. Sur un total de 4400 collectivités concer-nées par l’open data par défaut, seulement 5 %sont engagées dans un projet open data, et cetaux tombe à 0,5 % pour les plus petites (voir lesrésultats de l’Observatoire open data des terri-toires). Hormis quelques notables exceptions,l’open data n’est pas le sujet des petites com-munes, ni des territoires ruraux.

Pourtant, sous l’effet d’entraînement des régionset de pôles métropolitains, l’offre de soutien depetites et moyennes collectivités s’est étoffée :les régions, les départements, les métropoles,les structures de mutualisation (syndicats mixteset GIP) proposent souvent un accompagnementdes petites communes à travers une offre

de formation, de coaching et d’hébergement desdonnées (ex. DataSud, le département deHaute-Garonne, MontpellierMétropole, Redo-nAgglomération, etc). En 2017, sur les 130 nou-velles collectivités ayant ouvert leurs données,110 l’ont fait grâce au soutien très actif d’une col-lectivité de rang supérieur. Cela témoigne de lamaturité des collectivités les plus anciennesdans l’open data. Cela se traduit aussi par unecapitalisation des bonnes pratiques, une rationa-lisation des plateformes de publication et une

Cerema – Sign@ture n°66 21

Stratégie

d’ouverture localeOpen data territorial, Où en est-on ?

Article

« L’open data territorial, où en est-on ? »

Jean-Marie BourgogneDélégué Général d’OpenDataFrance

Page 22: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

plus grande homogénéité dans le type de don-nées publiées. La systématisation des dispositifsd’accompagnement locaux permettra sans doutele passage à l’échelle des collectivités ouvrantleurs données dans les toutes prochaines an-nées.

Mais cette factorisation de moyens locaux ne ré-pond pas totalement à deux grands défis : l’inter-opérabilité des données et l’appropriation desdonnées par les publics ciblés, c’est-à-dire la so-ciété civile (citoyens, entreprises, chercheurs etobservateurs) et les acteurs publics eux-mêmes.

Des données structurées etcompréhensibles

L’interopérabilité est vraiment un point essentielpour permettre l’émergence de services nou-veaux basés sur la donnée et pour faciliter leurappropriation. Pour répondre à ce besoin, il estnécessaire d’établir des normes, de fait ou régle-mentaires. C’est ainsi que l’État a encadré pardécrets la publication des données essentiellesdes marchés publics et celles des subventionspassées par les collectivités. Cela concourt àune publication homogène de données uniformi-sées au niveau national et cela offre ainsi la pos-sibilité de créer un observatoire de la commandepublique. C’est aussi le cas des Plans Locauxd’Urbanisme, des vitesses limites sur les voies,des bornes de recharges électriques, etc. Celaressemblerait à une liste à la Prévert si nous nereconnaissions pas que ces données sont indis-pensables pour nourrir des applications très utili-sées (nos GPS), nos voitures électriques, etc

Seules des données structurées et normaliséespermettent la constitution de tels référentiels.

La définition de ces standards nécessite unegouvernance pour encadrer la négociation entreles parties prenantes, pour définir les autoritésde régulation et les règles de gestion. Cette gou-vernance est en cours de mise en place à tra-vers les travaux d’Etalab et d’OpenDataFrance,mais il reste encore beaucoup à faire. Notonsque cette démarche révèle la maturité de la com-munauté « data » qui progresse vers le conceptde bien commun informationnel.

La contrepartie de cette amélioration de la quali-té « structurelle » des données est sans aucundoute l’augmentation de l’effort de production detelles données normalisées. D’une politique depublication « dans l’état », qui avait l’avantage defaciliter le travail de production, les collectivitésdoivent s’efforcer de traiter et convertir préalable-ment les données avant publication. Cette diffi-culté n’est pas négligeable et peu de collectivitésse sont réellement attelées à cette exigence.Pour les aider dans leurs démarches, des tra-vaux sont en cours pour intégrer des modulesd’export open data normalisés dans les logicielset les plateformes d’échange spécialisées pourles collectivités locales.

Des données, pour quoi faire ?

L’ouverture des données devient un élément dela transformation de l’action publique dans denombreuses collectivités et ce mouvement va encroissant, c’est un fait établi par l’observatoireopen data des territoires. En 2017, le nombre decollec-

tivités et de jeux de données ouvertes a cru deprès de 40 % par rapport à 2016. La loi répu-blique numérique va soutenir et amplifier cemouvement, on peut considérer qu’il est irréver-sible.

Cependant l’évaluation de l’impact de l’open datareste encore un sujet peu maîtrisé. Beaucoup d’acteurs publics s’intéressent aux changementsconcrets que cela engendre au sein des collecti-vités : Quels sont les usages les plus vertueux ?En quoi cela nourrit le monde économique, laville intelligente ? Comment estimer le gain deproductivité des services ?

Chaque acteur public peut témoigner de réutili-sations exemplaires grâce aux données ou-vertes : ici un service de tri de déchet collabora-tif, là des applications de services de proximité,ailleurs des offres de mobilité multi-modales, in-formations des parents sur le menu des can-tines, etc. Les administrations elles-mêmes ex-ploitent leurs propres données : outils d’analysedes données budgétaire, agenda des évène-ments municipaux, gestion des associations, etc.

Cerema – Sign@ture n°66 22

Stratégie

d’ouverture localeL’open data territorial, où en est-on ?

Page 23: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

De jeunes entreprises du numérique déve-loppent de nouveaux services, mais des entre-prises classiques enrichissent leur offre grâceaux données en open data : immobilier, tou-risme, agriculture. Les chercheurs, les observa-teurs, les associations utilisent tous les jours lesdonnées pour comprendre le potentiel des terri-toires et mesurer l’action publique.

Il existe de nombreuses études à ce sujet, mais ilapparaît nécessaire de collecter et de documen-ter de façon plus méthodologique les différentsusages qui naissent autour des données pu-bliques. Il sera aussi utile, quand cela se justifie,de s’intéresser au retour sur investissement pourles collectivités. Ce chantier de valorisation desusages des données ouvertes est à peine enta-mé. En collaboration avec la Fondation internetnouvelle génération, OpenDataFrance proposeraà la fin de l’année 2018 un chapitre entier sur cesujet.

Quels sont les prochains défis del’open data ?

De nombreux autres défis se cristallisent autourde la maîtrise des données : le partage et la gou-vernance des données privées, la protection desdonnées à caractère personnel, la donnée desvilles et celles des « champs », les algorithmesde traitement, la souveraineté des acteurs pu-blics dans un mode ouvert à tous les opérateursmondiaux. Nous traiterons ces points lors de pro-chains articles dans cette revue. Le rendez-vousest donné…

Cerema – Sign@ture n°66 23

Stratégie

d’ouverture localel’open data territorial,Où en est-on ?

Page 24: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

Nathalie Vernus-Prost, Administrateur général des données à la métropole de Lyon, anime la plateforme de données du Grand Lyon : www.data.grandlyon.com. La collectivité doit mettre en place un cadre de confiance autour de l’open data : le Grand Lyon est très attentif aux nouveaux usages qui sont faits de ces données, en animant des communautés de réutilisation des données. Le collectivité a mis en place deux licences particulières qui ont permis d’encourager les acteurs privés à diffuser leurs données au côté de la métropole notamment parce que ce dispositif permet d’identifier les réutilisations faites des données.

Pour Nathalie Vernus-Prost, il y a des enjeux politiques forts derrière une politique d’open data. Beaucoup d’acteurs se positionnent comme producteurs de données alternatifs aux institutions publiques. Celles ci doivent regagner la maîtrise de leur territoire et de leurs politiques publiques, être un vrai contrepoids aux plateformes mondialisées pour offrir des services publics à la hauteur des attentes des citoyens, garantir la gouvernance de la donnée sur les territoires.

La donnée permet à une collectivité de renforcer son rôle de fédérateur des acteurs du territoire pour mener à bien les politiques publiques : ainsi Le Grand Lyon a renforcé l’exercice de sa compétence et sa capacité d’action autour de la maîtrise de la mobilité, à partir des données qu’il produit et rassemble, notamment les données que les délégataires de service public sont tenues de fournir au bénéficiaire ou encore les données du secteur privé. Il procède de même avec sa nouvelle compétence énergie.

Parce que l’open data est avant tout un choix politique, il n’y a pas une, mais différentes politiques d’open data, qui renvoient à différentes finalités de politiques publiques.

Illustration

La stratégie du Grand Lyon

Encart réalisé par Christophe Badol, à partir des échanges ayant eu lieu lors de la COTITACentre-Est du jeudi 1er février 2018, consacrée à « l ’ouverture des données au service de

l’ aménagement et du développement durables des territoires ».

En savoir plus sur la COTITA Centre-Est du jeudi 1er février 2018, consacrée à « l ’ouverturedes données au service de l’ aménagement et du développement durables des territoires ».

https://www.cerema.fr/fr/actualites/ouverture-donnees-au-service-du-developpement-durable

Cerema – Sign@ture n°66 24

Stratégie

d’ouverture localeLa stratégie duGrand Lyon

Page 25: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

Les infrastructures de données géogra-phiques (IDG) PRODIGE Auvergne et GEO-RHONEALPES ont fusionné durant l’été2017 pour former DatARA. Ce nouveau dis-positif, bien que piloté par la Préfecture derégion Auvergne-Rhône-Alpes est ouvert àl’ensemble des acteurs publics de la région.DatARA est conçu à l’usage des services del’État, des établissements publics et des col-lectivités, mais aussi des organismes privéset des citoyens.

DatARA utilise les technologies PRODIGE (pilo-tage par la MIG du MTES2) et RESPIRE offrantnotamment les fonctions propres aux IDG (cata-logage de données géographiques ou géolocali-sables, création de cartes, gestion de copies fi-gées ou vivantes des ressources distantes, créa-tion de ressources dérivées, production de ser-vices web – visualisation et téléchargement, flux

2 Mission d’Information Géographique du Ministère de la Transition Écologique et Solidaire

ATOM pour s’abonner, gestion fine des droits,etc.).

Vers un véritable portail open datapour limiter les outils

Dans le contexte réglementaire actuel d’ouver-ture des données publiques, la Préfecture Au-vergne-Rhône-Alpes souhaite ouvrir un portailopen data pour ne pas démultiplier les outils misà disposition du public. De ce fait, d’une infra-structure de donnée géographique, DatARA vadevenir un véritable portail open data, un cata-logue régional fédérateur des données publiquesouvertes en région Auvergne-Rhône-Alpes. Cesévolutions s’appuient sur le projet Urb@Data.

Cerema – Sign@ture n°66 25

1L’accompagnement

Les exemples de :

DatARA-Urb@Data

GéoGuyane

DataSud

Article

DatARA - Urb@Data, une IDG ouverte à l’ensemble des acteurs publics de la région

Auvergne-Rhône-AlpesYorick Martin, chargé d’études « numérique », SGAR, Préfecture de

la région Auvergne-Rhône-Alpes

Page 26: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

Un laboratoire d’innovation pourrelever le défi

Urb@Data est un projet incubé par le laboratoired’innovation territorial de la Préfecture de régionAuvergne-Rhône-Alpes : @RCHIP∑L. Ce projeta pour but d’accompagner au plan technique, lesacteurs d’un territoire contraint réglementaire-ment, à libérer leurs données publiques (Direc-tive Inspire, Loi pour une République numérique,etc). Il se veut complémentaire des démarchesengagées par le gouvernement tel que le projetOpenData Locale piloté par OpenDataFrance etdes initiatives locales.

Urb@Data, pour répondre à ces objectifs, ambi-tionne :

d’étendre aux données non géographiquesou non géolocalisables les fonctionnalités desoutils de catalogage des portails d’informationsgéographiques ;

de proposer aux acteurs publics d’un terri-toire des solutions pour garantir la diffusion deleurs données en tenant compte des compé-tences, des moyens (humain et financier) et desdifférentes stratégies des acteurs ;

de structurer et organiser (urbaniser) du ni-veau communal au niveau national, les relationsentre les initiatives de ces différents acteurs d’unterritoire.

Un chantier ouvert fin 2017 pour unemise en service prévue en octobre

2018

Pour atteindre cette organisation, la Préfecturede la région Auvergne-Rhône-Alpes s’appuie surla plateforme DatARA. Plusieurs chantiers sonten cours et à venir pour atteindre les objectifs duprojet :

refonte de la charte graphique du site édito-rial RESPIRE,

migration vers la version 4.1 du progicielPRODIGE,

définition sous GeoNetwork d’un modèle defiche de métadonnée ISO 19139 permettant degérer des données ouvertes non géographiques,

développement d’un module PRODIGE demoissonnage DCAT pour accéder :

◦ dans un premier temps aux webser-vices de la plateforme data.gouv.fr,◦ et à l’API de PRODIGE permettant derecopier localement les données (gestion decopies vivantes ou figées autorisant des trai-tements non réslisables par des servicesweb : jointure entre données, etc.).

À l’issu de ces évolutions, il sera possible :

de saisir des données non géographiquesdans PRODIGE et de les consulter dans les ca-talogues des plateformes PRODIGE et data.-gouv.fr,

de saisir, moissonner des données non géo-graphiques de data.gouv.fr et de les consulterdans le catalogue des plateformes PRODIGE,

de générer des graphiques pour les don-nées non géographiques ainsi intégrées, en plusde cartes pour les données géolocalisables.

Une interopérabilité optimisée auservice des utilisateurs

Le module de moissonnage DCAT sera option-nel, au choix des instances PRODIGE. Son pro-cessus de moissonnage retenu permet le filtragedes données de data.gouv.fr par organisation etpar date. Il permet également la conversion entrela normalisation DCAT utilisée pour les métadon-nées dans le domaine de l’open data, et lanorme ISO des métadonnées utilisée pour lesdonnées géographiques. Son principe peut êtreillustré de la manière suivante :

Cerema – Sign@ture n°66 26

L’accompagnement DatARA-Urb@data

Page 27: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

Un utilisateur aura ainsi une vision globale et uni-fiée de l’offre en données en Auvergne-Rhône-Alpes. Il pourra rechercher, découvrir à traversles métadonnées, télécharger ou représenter etanalyser les données géographiques, non géolo-calisables, Inspire, non Inspire et ce quelle quesoit leur provenance (plateformes IDG territo-riales ou thématiques ou data.gouv.fr).

Plus d’infos sur http://www.datara.gouv.fr

Page suivante : schéma présentant l’organisationrégionale de DatARA

Cerema – Sign@ture n°66 27

L’accompagnement DatARA-Urb@data

Page 28: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

1 – Solution Plateforme de services numériques régionale de type PRODIGE (ex : DatARA)

- Services de l’État et partenaires : acteurs non outillés avec ou sans compte data.gouv.fr,

- Vecteur de publication, de diffusion des données (GeoNetwork : intégrant des nouveaux modèlesde fiches de métadonnées ISO 19139 pour des données ouvertes non géographiques),

- Catalogue fédérateur régional (un nouveau module PRODIGE moissonne data.gouv.fr),

- Relai pour le GéoCatalogue et data.gouv.fr.

2 – Solution type data.gouv.fr

- Partenaires, acteurs publiant leurs données sur data.gouv.fr pour exposer ses données. Ils nedisposent ni d’outil ni de site internet.

3 – Solution type propriétaire ou open source

- Partenaires, acteurs publiant leurs données sur leurs propres plateformes moissonnées pardata.gouv.fr.

4 – Solution type OpenDataLab (open source)

- Partenaires, acteurs ne disposant pas d'outil mais d’un compte sur data.gouv.fr et d’un siteinternet pour exposer ses données (API Métaclic3 : moissonnage data.gouv.fr).

3 MetaClic est un catalogue de données ouvertes libre et gratuit. Il permet d’intégrer dans un site Internet un catalogue des données diffu-sées par la plateforme http://www.data.gouv.fr.Ce logiciel a été développé dans le cadre du projet http://www.opendatalab.frPour en savoir plus : http://datakode.github.io/metaclic/

Cerema – Sign@ture n°66 28

Organisation régionale de DatARA

L’accompagnement DatARA-Urb@data

Page 29: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

En Guyane, le partage des données est unepréoccupation ancienne partagée par les ser-vices de l'Etat et l'Agence d'Urbanisme et deDéveloppement de la Guyane (AUDeG). Laconjonction entre développement de SIG etréglementation européenne a aboutit en 2013au lancement de GéoGuyane, Portail géogra-phique de la Guyane. Retour sur ce projetavec Sébastien Linares AJOUTER SES FONC-TIONS

Cartographie, Inspire et Prodige auxorigines du projet

La cartographie assistée par ordinateur, parceelle est utilisatrice et productrice de bases dedonnées, a été depuis le début des années1990, très demandeuse de partage de données.

En Guyane, le développementdes SIG, impulsé par la colla-boration entre AUDeG et ser-vice de l’État (DAF et DDE) aainsi posé les bases d’un projetde plateforme géographique.

Cette dynamique s’accélère en 2007 dans uncontexte réglementaire incitant à la diffusion del’information géographique au public (DirectiveINSPIRE et circulaire PRODIGE) ; et suite à unséminaire Inspire présentant la toute nouvelle di-rective européenne, un projet de plateforme estvéritablement lancé. Ce projet se concrétise en2009 avec une demande de financement aufonds européen de développement régional (FE-DER)

Puis en 2011, la création de la DEAL s’accom-pagne du lancement de Prodige Guyane auquels’associe l'AUDeG. Si Prodige est dans ces an-nées encore peu mature, l’opportunité d’un teloutil accessible à moindre coût pousse le projet.

Enfin en 2013, Géoguyane est véritablement lan-cé avec la signature d’une charte par 20 parte-naires.

Cerema – Sign@ture n°66 29

Article

Retour sur la mise en place de

GéoGuyane Article rédigé par Antoine Lemot, suite à l’entretien du 21 juin 2018 avec

Sébastien Linares, Responsable de l'unité information géographique, diffusion de la connaissance à la DEAL Guyane

L’accompagnement Géoguyane

« Le partage des données

est une préoccupation

ancienne »

Page 30: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

De Report et Carmen à Prodige ; desservices de l’État au grand public

Géoguyane permet aujourd’hui de répondre, enun seul outil, à la fois à l’objectif de partage desdonnées et à celui d’ouverture de ces donnéesau grand public. Pour Sébastien Linares, cetaboutissement est venu en deux temps.

Chronologiquement, le partage des donnéesentre services de l’État est le premier objectif, quiapparaît rapidement indispensable dans le do-maine des Systèmes d’Information géogra-phique. Pour y répondre, à la fin des années1990, l’outil REPORTS, développé par le CERTUpour le compte du CNIG et de l’AFNOR, proposeprincipalement la saisie, la consultation et l’im-port-export des fiches de métadonnées. Premierpas vers le partage des données, cet outil per-met donc de répondre à la question : "existe-t-ildes bases de données concernant un territoireparticulier, dont l’échelle et le contenu répondentà des besoins précis ? Et si oui, où et commentse les procurer ? "4

4 Le catalogage et les métadonnées : http://archives.cnig.gouv.fr/Front/docs/cms/catalogage-et-metadonnees_124018157232197700.htm

Puis, l’objectif d’ouverture des données au publicarrive plus tardivement, moins poussé par desexigences techniques et organisationnelle quepar des contraintes réglementaires venues del’Europe. En 2007 la directive INSPIRE appelle àla mise en place de véritables Infrastructuresd’Information Géographique et la diffusion desdonnées géographiques suivant des règles pré-cises. L’application « CARtographie du Ministèrede l’ENvironnement » (CARMEN) vient alors ré-pondre à ces exigences en "favorisant l’échangeet la réutilisation des données entre différentessources d’informations (protocoles d’interopéra-bilité, catalogage, etc)"5.

Les outils REPORTS et CARMEN ont donc per-mis de répondre à ce double objectif de partageet de diffusion des données géographiques, maisséparément et chacun avec des lacunes. Le dé-veloppement de PRODIGE est venu apporter unoutil complet proposant à la fois l’hébergementdes données géographiques, la création et le ca-talogage des métadonnées, la production de

5 Présentation de Podige : http://www.geoinformations.developpement-durable.gouv.fr/presentation-de-prodige-a1568.html

Cerema – Sign@ture n°66 30

L’accompagnement Géoguyane

Organisation

Les principes d’organisation et de fonctionnement du partenariat GéoGuyane sont définis dans sa charte. Ils se basent sur trois instances : un comité de pilotage, un comité des administrateurs de données, une équipe projet. De plus, des groupes de travail spécifiques et autonomes peuvent être créés pour définir, organiser et produire des données. L' AUDeG et la DEAL, acteurs historiques du projet constituent avec le SGAR, l'équipe projet, présidé par le Préfet de Région de la Guyane

Page 31: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

cartes, et la mise à disposition des données, mé-tadonnées et cartes.

D’un outil aux fonctionnalités plutôt simples –REPORTS – et d’un public restreint – les ser-vices de l’État –, la Guyane a su passer judicieu-sement, en 13 ans, à un outil multifonctionnel etouvert à tous.

Aujourd’hui sous l'enjeu de démocratisation del’information, les objectifs du projet sont forts :

porter à connaissance du public les don-nées produites en Guyane,

développer la mutualisation et le partagedes informations existantes,

accroître l’efficacité des services produc-teurs et utilisateurs d’information géographique,

favoriser le développement de l’informationgéographique en Guyane.

L’ouverture des données : unparadigme fort à promouvoir

Si la mise à place de la plateforme a été confron-tée à quelques problèmes techniques et organi-sationnels inhérents à tous projets de cette en-vergure, c’est peut-être la question de l'ouverturedes données au grand public qui a apporté desfreins à son développement.

Des périmètres métiers (carrières, ICPE), pourlesquels les données étaient considérées encorerécemment comme sensibles et ne devant pasfaire l’objet de diffusion au public, ont été réti-cents à participer. Pour Sébastien Linares, celaest donc passé par une « véritable révolution »et de gros efforts de sensibilisation de la part dela DEAL : organisation de journées INSPIRE pré-sentant et vulgarisant la directive, accompagne-ments personnalisés aidant à la diffusion desdonnées sur le portail.

L’interopérabilité plutôt que lemonopole : un gage pour l'open data

En Guyane, deux plateformes institutionnels sontproposées : Géoguyane qui est celle d’“État” etGuyane-SIG celles des collectivités territoriales.Chacune d’elle a donc desmodes de gouvernance et de fi-nancement différents. Mais,pour Sébastien Linares, loind’être en concurrence ou decréer une redondance qui “per-drait” les citoyens, ces deuxportails sont complémentairesdans un contexte d’interopéra-bilité dont la priorité est bienl’ouverture des données.

Ainsi depuis 2017 GeoGuyane permet un mois-sonnage vers Guyane-SIG, comme vers le Geo-catalogue et geo.data.gouv.fr. En raison des exi-gences du format, le moissonnage vers INSPIREet assuré par l'intermédiaire du Geocatalogue.

Une appropriation démocratique

Entre nombre de données ouvertes et nombrede consultations sur le portail, les résultats sontconvaincants. Ainsi en 2018, Géoguyane af-fichent plus de 800 séries de données actuelle-ment ouvertes dont 1/4 proviennent de la DEALet 9 894 visiteurs.

Cerema – Sign@ture n°66 31

L’accompagnement Géoguyane

"Géoguyane se développe

dans un contexte d'interopérabilité et

non de non monopole avec comme priorité l'ouverture des

données"

Page 32: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

Les consultations du portail par le public sont untrès bon indicateur de sa bonne santé et de sonutilité démocratique. Grâce à Prodige, des outilsde suivi fins permettent d’analyser l'utilisation deGéoGuyane. Les statistiques montrent que troissujets sont très “écoutés” : le foncier, les risquesmajeurs et technologiques, les activités minières.Pour ces dernières, le portail enregistre un pic detéléchargement lors du versement des titres etautorisations d’activité.

Ce constat montre que le public a compris l’op-portunité de l’open data, et que à la fois les pro-fessionnels du secteur, les associations de pro-tection de l’environnement ou les citoyens ayantun projet immobilier savent se saisir de l'outilpour trouver les informations qu’ils souhaitentconsulter et mettre à l’épreuve.

une démarche à poursuivre

Aujourd’hui, pour Sébastien Linares, l’ambitionde Geoguyane est forte dans sa simplicité : amé-liorer la qualité du service. Cela passe par uneconsolidation du patrimoine, une meilleure dispo-nibilité et actualisation des données ainsi que parla prise en compte de tous les acteurs privés etpublics, spécialistes ou profaneet de leur participation.

Le projet se doit de communi-quer sur l’open data tant vers lesdétenteurs de données pour lespousser à les diffuser, que versle public pour l’inciter à s’en em-parer. Ainsi la DEAL répond ré-gulièrement aux sollicitationsd’utilisateurs, un travail avec la DAF est en courset une sollicitation de projet est venue du Recto-rat de l’Académie de Guyane.

Plus d’infos sur https://www.geoguyane.fr/

Cerema – Sign@ture n°66 32

" Améliorer la qualité du

service par "la consolidation du

patrimoine, la disponibilité et

l'actualisation des données "

L’accompagnement Géoguyane

Page 33: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

Mathieu Kazmierski est chargé de l’open dataau Centre Régional d’Information GEographique(CRIGE) PACAetThomas Bekkers est en quelque sorte sonhomologue à la Région Sud Provence-Alpes-Côte d’Azur. Il est chef de projet Donnéesouvertes et intelligentes au sein du service SmartRégion.Nous les avons interrogés tous deux sur lacréation de la plateforme de donnéesDataSud, une solution mutualisée dediffusion de données ouvertes etgéographiques et intelligentes à l’échelle duterritoire régional.

La fusion des plateformes dedonnées géographiques et d’open

data en Région Sud

Le 24 juin 2016 a été décidée la fusion de deuxplateformes de diffusion de données PACA :celle du géoportail CRIGE PACA (identifié par laloi NOTRE), et celle de la Région appelée Open-PACA. Mathieu Kazmierski, chargé de missionopen data au CRIGE PACArelate : « On a coutume dedire au CRIGE que 80 %des données ouvertes sontgéographiques, et que 80 %des données géographiquessont ouvertes (enfinpresque) ! »

Cerema – Sign@ture n°66 33

« On a coutume de dire au CRIGE que 80% des

données ouvertes sont géographiques, et que

80% des données géographiques sont

ouvertes (enfin presque) ! »

Rencontre avec

Mathieu Kazmierski et Thomas Bekkers« Le point sur DataSud », propos recueillis et mis en forme par

Mathieu Rajerison

L’accompagnement DataSud

Page 34: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

Les besoins de faire face aux demandes crois-santes des réutilisateurs et de souscrire à desexigences réglementaires ont motivé cetteconvergence : « Celles de la directive INSPIREen premier lieu, mais aussi celles qui concernentpar exemple les données d’urbanisme qui ali-mentent les Schémas de Cohérence Territorialeou les Plans Climat Air-Énergie Territorial, sansoublier les Plans Locaux d’Urbanisme ou lesdonnées cadastrales ».

En aparté, Mathieu Kazmierski précised’ailleurs : « on trouvait déjà il y a 15 ans sur legéoportail du CRIGE les ingrédients d’un ‘’opendata avant l’heure’’ », à savoir : « la mise enplace de la première “licence étendue” sur lesdonnées de l'IGN ou encore la diffusion gratuitedes orthophotographies sur chaque départe-ment ».

Thomas Bekkers, chef de projet Open et Smartdata au Conseil Régional PACA ajoute que « Lescommanditaires partagent également des enjeuxcommuns de première importance, comme lesquestions de souveraineté, de production debien numérique commun ou encore de contribu-tion OpenSource ». La question de simplifier etdécloisonner l’accès aux données est au cœurde DataSud. M. Kazmierski parle ainsi « de faci-liter la lisibilité des dispositifs de contribution endonnées à l’échelle régionale, en créant un gui-chet unique de dépôt mariant l’open et le geo ».

La prise en compte de réutilisateursaux profils variés

Unifier l’accès demanded’anticiper différents pro-fils de réutilisateurs. Àce propos, Mathieu Kaz-mierski affirme qu' « uncitoyen ne pratique pasun catalogue de don-nées de la même façonqu’une start-up ou un

service de L’État. ». Pour ce faire, il ajoute que«(…), dans DATASUD, nous avons fait le choixd’avoir 2 niveaux de description : un niveau"simple " avec les champs basiques et un niveau"exhaustif " ».

En plus de niveaux d’accès différenciés, Data-Sud propose une palette très riche de services :« une API d’accès au catalogue, une API6 d’ac-cès aux données statistiques, un datastore, lapossibilité de diffusion des données sur accèsrestreint, de les synchroniser à distance, et sur-tout une approche "multi-utilisateurs". (...) Maisune API, même bien documentée comme c’estle cas dans DATASUD, n’est pas à proprementparler à la portée de tout le monde ! ». C’est pourcela que la plateforme propose de « créer despetites dataviz7 simples sur les données statis-tiques » . Toutes ces fonctionnalités ont étéconçues avec un mot d’ordre : « simplifier ! ».

Encourager et documenter lesréutilisations

Qui dit plate-forme d’échanges sous-entend depouvoir capter les réutilisations faites des don-nées. Au sujet de la traçabilité des réutilisateurs,Thomas Bekkers et Mathieu Kazmierski re-grettent : « Une des forces et faiblesses del’open data est de maintenir l’anonymat d’accèsaux données ». Ainsi,ils ont connaissancedes réutilisations prin-cipalement par « dé-clarations volontaireset de connaissancepar animation du ré-seau des acteurs de la donnée en région ».Toutsera en tout cas accompli afin de mettre en va-leur les réutilisations. Selon eux, « déclarer uneréutilisation doit être aussi logique et immédiatque renseigner la date de création d’une donnéeou son producteur », et « à la manière de data.-gouv.fr, les réutilisations feront partie des méta-données d’un jeu de données ».Des évènementstels que les hackathons, ou les différents chal-lenges OpenPaca mettent à l’honneur l’opendata et les réutilisations, souvent grâce à des uti-lisateurs avertis. Mais l’open data ne doit pasêtre qu’affaire de spécialistes. Il est primordiald’assurer l’acculturation d’une frange non négli-geable de la population à la dimension data.

6 Application Programming Interface (Interface de Programmation)7 Datavisualisation (infographie)

Cerema – Sign@ture n°66 34

« Une des forces et faiblesses de l'Open

Data est de maintenir l'anonymat d'accès

aux données »

L’accompagnement DataSud

« un citoyen ne pratique pas un catalogue de données de la même façon qu’une start-up ou un service de l’Etat. »

Page 35: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

Mathieu Kazmierski détaille à ce titre : « plu-sieurs projets financés par la Région incluentdes actions de formations (des Espaces PublicsNumériques) ou d’acculturation comme l’organi-sation de meetups, de carto-parties ou de projetsde sensibilisation de différents publics ». « Nousintervenons à la demande dans des meet-ups,comme avec Nodya ou à l’ESDAC par exemple,ou dans le cadre d’initiatives nationales commeOpenDataLocale, pour parler de données ou-vertes et géographiques. (…) Nous avons colla-boré dans un Géocamp sur les équipements desgares, participé à l’organisation des State Of theMap 2017 en Avignon. Nous organisons réguliè-rement des ateliers autour des outils contribu-tifs » pour enfin conclure au sujet de la data lite-racy : « Le pendant proche de la notion de " litté-ratie numérique " dans notre métier, c’est l’ani-mation de réseaux et d’ateliers pour l’accultura-

tion des élus et deleurs techniciens ».

DataSud est une pla-teforme toute aussiouverte que les don-nées qu’elle hé-berge. Voici cer-taines attentes

qu’elle énonce à propos des utilisateurs : « Fairedes demandes de données qui ne seraient pasencore diffusées, préciser les faiblesses et pro-blèmes rencontrés en matière d’expérience utili-sateur, tester et utiliser les APIs, ou encore noussignaler des erreurs dans les métadonnées oules données » car « [l']objectif est de reproduireet d’innover dans l’animation autour de jeux dedonnées, identifiées comme des données mo-trices par la communauté ».

Connaître la qualité desdonnées

Il est essentiel d’assurer ou depréciser le niveau de fiabilitédes données, car elles peuventpotentiellement être exploitées par tout typed’usagers. Au-delà de la pure ouverture des don-nées, « viennent ensuite la qualification desdonnées puis l’accompagnement des produc-

teurs et des écosystèmes qui se construisent au-tour de leurs données. C’est le point d’entréevers un cercle vertueux d’amélioration en continudes jeux de données ! ».8

Avenir de DataSud

Côté données, nous devrions voir ouverte :« (…) une partie des données touristiques éma-nant du système d’information touristique API-DAE ou [des données] dans les thématiques dela formation et de l’emploi, du patrimoine ou dela mobilité (…) une démarche transverse très ac-tive en matière de données Energie (…) ». Enfin,dans le domaine de la Smart City, DataSud es-père récupérer « [des] données issues des ré-seaux et infrastructures intelligentes (capteurs)émanant des projets de Smart City et d'IoT9 (…)Smart City et Open Data convergent en termesd’outils et de besoins ».Côté outils : « Une se-conde phase de développement prévue en 2018doit apporter tout un lot de fonctionnalités géo-graphiques et participatives avancées ».

Côté évènements : « un hackathon est (…) pré-vu en 2019. Coorganisé par la Région etOrange, il portera sur la production de services àpartir des données de l’Énergie, cela dans uncontexte de portage d’un projet de Recherche etDéveloppement "FlexGRID Data" ». « Noussommes en cours de construction avec la Pré-fecture de région d’un projet ambitieux pour l’or-ganisation d’un hackathon réunissant servicesdéconcentrés de l’État et start-ups ».

Plus d’infos sur https://www.datasud.fr/

8 A ce sujet, voir la démarche QuaDoGeo, avec notamment le sémi-naire Cerema-CRIGE PACA : https://www.cerema.fr/fr/actualites/seminaire-quadogeo-mise-pratique-qualification-donnees 9 Internet of things (Internet des objets)

Cerema – Sign@ture n°66 35

« Le pendant proche de la notion de " littératie numérique " dans notre métier, c’est l’animation de réseaux et d’ateliers pour l’acculturation des élus et de leurs techniciens »

« C’est le point d’entrée vers un cercle vertueux

d’amélioration en continu des jeux

de données ! »

L’accompagnement DataSud

Page 36: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

Comment t’est venue l’idée debidouiller les données ?

La première plateforme d’open data qui a suscitémon intérêt est celle de Paris où j’habitais àl’époque. Elle était encore peu connue, mais ony trouvait quelques jeux de données à partir des-quelles j’allais pouvoir effectuer des analyses,principalement des cartes, qui m’intriguaient d’unpoint de vue personnel. C’est un excellent pré-texte pour acquérir de nouvelles compétencestechniques, que ce soit dans le traitement desdonnées ou leur visualisation. Grâce à ce portail,j’ai pu m’intéresser aux arbres à Paris, aux résul-tats des élections par bureau de vote ou encoreaux noms de rue grâce à la base Fantoir. Aupa-ravant ces infos-là n’étaient pas structurées etencore moins diffusées par les services munici-paux qui ne devaient pas en percevoir l’intérêtpotentiel pour le grand public. Mais certains croi-sements ont pourtant un intérêt, comme ceux demon analyse sur les bibliothèques montrant dansquels quartiers les ‘Tintin’ ou les ‘Titeufs’ étaientles plus empruntés, et la corrélation de ces em-prunts avec le niveau de vie. Puis il y a trois ansje me suis formé au logiciel open source R pourélargir mes compétences en statistique et encartographie. L’ouverture de mon premier blog(qui est tombé dans les limbes d’internet entre-temps) a coïncidé avec cette période de manipu-lation de données, il me permet de garder unetrace de mes travaux en même temps que de lespartager.

Quelles réutilisations ont le plus desuccès ?

La première réutilisation qui a été plus largementpartagée concernait la géographie du sport réali-sée à partir des données des licences sportivesdétenues par le Ministère des Sports. Cette carte(http://www.slate.fr/story/79066/carte-france-sports-plus-pratiques-commune) détaillait les

sports les plus pratiqués par commune. Cen’était pas aussi complet que l’atlas publié par leministère des sports en parallèle de la diffusiondes données, mais on apportait un autre regardsur le sujet : j’ai édité les graphiques et les cartesen collaboration avec le journaliste qui a écrit surle sujet.

Cerema – Sign@ture n°66 36

Entretien avec

Mathieu Garnier « Matamix »

Mathieu Garnier est un scientifique de la donnée (data scientist) qui s'adonne à de multiples expériences sur la base de données ouvertes, souvent géographiques, et en partage le fruit sur son blog [https://mtmx.github.io/] pour le plus grand plaisir de ses lecteurs.

2

La réutilisation

Rencontre avec Mathieu Garnier

Le Géocodage de la base SIRENE

Rencontre avec Jean-Marc Lazard

Exemple de LKSpatialist

Blog de Matamix : https://mtmx.github.io/

Page 37: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

C’est le même genre de coopération qui a per-mis d’aboutir à une série d’articles sur les topo-nymes (http://www.slate.fr/story/116421/rues-departements-heros-regionaux) et les person-nages qu’on retrouve le plus sur les panneauxde rues. La base des équidés a également étéune belle découverte puisqu’elle a enfin réponduà une question qu’on était nombreux à se poser,à savoir quels sont les noms les plus courantsdes poneys.

Quelle forme de réutilisation suscitele plus d’intérêt, de curiosité ?

L’appétit pour les cartes a progressé aussi viteque leur réalisation a été facilitée par les outilsinformatiques. Elles ont généralement plus d’im-pact que les graphiques car tout le monde, à peuprès, sait lire une carte. Lire une carte, l’interpré-ter est dans la culture d’à peu près chacun. Lesgifs, ces images animées qui défilent en boucle,ont aussi du succès, car ils ont une dimensiondynamique mais facilement lisible et parta-geable, j’essaie d’en produire de plus en plus.

Les applications, enfin, représentent une formetrès intéressante, mais elles demandent plus detemps en création.

J’ai par exemple créé une petite appli qui permetde distinguer différents types de campagnes àpartir de données diverses(https://mtmx.github.io/blog/appli_campagnes/) :relief, élevage avec nombre de vaches et demoutons, points d’eau, données météorolo-giques Ceci afin de choisir à titre personnel desdestinations de vacances. Il n’y a pas longtemps,je me suis rendu dans le Nord-Est dans un coinque m’avait suggéré mon appli à partir des cri-tères que je lui avais fixés. Je m’attelle rarementau développement d’applications parce qu’il estplus chronophage : la manipulation ludique desdonnées doit rester un plaisir et non une cor-vée…

Es-tu sollicité par des médias, desjournaux, pour réaliser des articles

basés sur de l’open data

Je ne réalise des articles sur mon blog quequand j’ai le temps, et ma connaissance des su-jets est souvent superficielle. La partie bibliogra-phique est souvent réalisée par quelqu’und’autre. Dans le cas des médias, il s’agit de jour-nalistes. Certains de mes articles sont apparusdans des journaux locaux. Par exemple, ma car-tographie des rues de la soif, réalisée sous letitre de bistrographiehttps://mtmx.github.io/blog/bistrographie/, a eu ledroit à un encart dans le journal Ouest Francecar c’est la rue Saint-Michel à Rennes qui estchampionne de sa catégorie tandis que mon ar-ticle sur les “trous perdus” (les endroits les pluséloignés de toute habitation) avait eu droit à unebrève dans quelques titres de la presse quoti-dienne régionale dont un journal local ariégeois.

Cerema – Sign@ture n°66 37

La réutilisationEntretien avec

Matamix

Blog de Matamix : https://mtmx.github.io/

Page 38: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

Comment qualifierais-tu tes lecteurs, sitant est que tu les connais ?

Spécialistes de la donnée ou utilisateurslambda

Je pense que mes lecteurs ne sont en majoritépas des spécialistes de la donnée, ni des techni-ciens. Les articles publiés sur mon blog nerentrent pas dans les détails techniques quipourraient être obscurs pour les non-initiés. Parcontre, grâce à la plateforme github sur lequelest hébergé mon nouveau site, les scripts sontdisponibles pour quiconque souhaite com-prendre la méthode employée voire répliquerl’analyse et l’adapter. Ça m’oblige à documenterles scripts, à soigner le code, et cette rigueur estun bon réflexe à prendre.

Une anecdote assez marrante à propos de l’ar-ticle sur les trous perdus : un lecteur racontaitqu’il avait randonné dans son département pouratteindre ce fameux point et y avait planté undrapeau

Réutiliser de l’open data est-il selon toià la portée de tout le monde ? Quel estle niveau requis ? Que conseillerais-tu

comme méthodes, outils, à celles etceux qui aimeraient se lancer ?

De plus en plus d’outils libres et accessibles àtous permettent de réaliser des graphiques etdes cartes. L’outil magrit (http://magrit.cnrs.fr/)réalisé par le CNRS permet avec une grande fa-cilité de réaliser des cartes, par exemple, toutcomme kepler.gl(https://uber.github.io/kepler.gl/#/) lancé tout ré-cemment. Aussi, sur certains portails open data,des visionneuses graphiques accompagnent do-rénavant chaque jeu de donnée et rendent ainsila donnée brute plus présentable et visuelle sansnécessité de manipulation préalable. L’utilisationde logiciels open-source, dont un des atouts estla gratuité, pour explorer les données ouvertesme paraît vraiment avantageuse aujourd’huiavec une amélioration continue de leur ergono-

mie et de nombreux supports de formation gra-tuits en ligne. L’enjeu est ce que les experts ap-pellent la littératie des données : la culture de ladonnée afin que tout un chacun dispose a mini-ma des bases leur permettant d’accéder à l’uni-vers open data, qu’ils ne soient pas démunisface à des chiffres et qu’ils puissent pourquoi pasdéceler des interprétations erronées.

Est-ce que la disponibilité de donnéespivot, souveraines, a permis de faire

de belles réutilisations ?

La base Sirene de l’Insee contient une multituded’informations intéressantes, sa diffusion gratuitedébut 2017 était attendue avec impatience. Denombreux services ont été créés pour l’enrichiret la rendre plus facilement interrogeable maisles réutilisations ludiques ont été finalementrares. Je m’en suis servi pour quantifier la pré-sence des bars dans le pays, mais aussi pourillustrer un papier d’un journaliste sur les nou-veaux types de restauration et de commerces debouche en région parisienne. Plus globalement,les données dites « de référence »(https://www.data.gouv.fr/fr/reference) ont prisune place considérable dans le paysage : lesproduits de l’IGN et de l’Insee font aussi partiede ce spectre et avec leur diffusion plus largequ’auparavant, de nouvelles formes d’utilisationsont émergé.

Cerema – Sign@ture n°66 38

La réutilisationEntretien avec

Matamix

Page 39: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

Quelles sont les données que tu utilisesle plus ? Et celles dont tu penses qu’il

serait intéressant de disposer ?

La base adresse nationale est un outil crucialque ce soit pour les administrations ou les entre-prises du secteur privé, je l’utilise régulièrement.D’après les annonces faites à la suite de la Loipour une République Numérique, on devrait voirarriver de nouvelles sources de données prove-nant notamment des Services Publics Industrielset Commerciaux. Disposer de données anonymi-sées d’opérateurs de téléphonie mobile ou detransports afin de pouvoir cartographier les fluxde population est un enjeu majeur. Une autresource potentielle m’intéresse à titre personnel :la base des chiens et chats recensés en France(https://www.i-cad.fr/)dans laquelle sont rensei-gnées un tas d’infos sur l’animal (nom, couleur,race…) et son propriétaire. Cette donnée est gé-rée par le Ministère de l’Agriculture mais admi-nistrée par un organisme privé. Il est évidentqu’un accès à des données anonymisées issuesde cette base serait prometteur en termes d’ana-lyses de tous poils sur les liens entre les hu-mains et les animaux.

De façon plus générale, je m’informe moins sys-tématiquement qu’avant sur la publication de pe-tits jeux de données locaux. À mon sens, l’enjeuporte dorénavant sur les gros socles de donnéesstructurants, sur leur qualité (documentation, ac-tualisation…) ainsi que sur leur mode de diffu-sion via des API par exemple. OpenStreetMap,projet collaboratif de grande envergure, s’estrendu indispensable pour l’exploitation d’un tasd’informations géolocalisées. Le web scrapingest aussi une alternative pour récupérer des don-nées, je suis notamment un grand fan de wikipe-dia et de ces listes en tous genres.

Entretien réalisé par Mathieu Rajerison

Cerema – Sign@ture n°66 39

La réutilisationEntretien avec

Matamix

Page 40: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

Illustration

Le géocodage de la base SIRENE

par Christian Quest

Rédaction : Antoine Lemot

Cerema – Sign@ture n°66 40

Depuis le 5 janvier 2017, la base SIRENE de l'INSEE est disponible en open data sur le site de data.gouv.fr, mais malheureusement pour les géomaticiens, cette livraison est au format CSV et non géolocalisable directement...

En proposant un géocodage minutieux et de qualité de cette source importante de données, Christian Quest, porte-parole d'OpenStreetMap (OSM) France et coordinateur du projet BAN chez Etalab, nous offre un exemple de transformation et de réutilisation de données ouvertes... ainsi qu'un cercle vertueux de la démarche open data.

Transformer pour améliorer, ...Le travail de Christian Quest a, dans un premier temps, consisté à nettoyer le fichier CSV diffusé par l'INSEE : modification de l'encodage de l'ISO à l'UTF8, normalisation des libellés et des quotes. Cette première étape lui a permis de passer d'un CSV de 8,5Go à 4,2Go.

... réutiliser des données déjà ouvertes ...Ensuite, étape clef, le géocodage des données est effectué à partir de trois bases elles-mêmes accessible en open data : la BAN (Base Adresse Nationale), la BANO (Base d'Adresses Nationale Ouverte d'OSM) et la POI (Points d'Intérêt d'OSM).

... , au passage, en profiter pour comparer…Pour arriver à un géocodage le plus exhaustif possible, Christian Quest a combiné les résultats obtenus par la BAN et la BANO. Ce double utilisation lui a permis de comparer et sélectionner l'adresse la plus proche de celle initialement proposée dans la base SIRENE.

...produire une nouvelle donnée,Le résultat est donc un fichier CSV pour chaque département avec un champ longitude et un champ latitude permettant une géolocalisation ponctuelle directe.

et enfin ouvrir l'ensemble de la démarche.Pour compléter cet important travail, Christian Quest propose :

- les résultats de son géocodage en Licence Ouverte sous http://data.cquest.org/geo_sirene/last/ (avant industrialisation),

- les scripts sous la plateforme d'herbergement GitHub https://github.com/cquest/geocodage-spd/tree/master/insee-sirene

- le retour des utilisateurs si des problèmes sont détectéshttps://github.com/cquest/geocodage-spd/issues

Des informations plus précises sur la démarche sont disponibles ici : https://medium.com/@cq94/g%C3%A9ocodage-de-la-base-sirene-2f0e14e87a8d

La réutilisation Géocodage de la base SIRENE

Page 41: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

Comment êtes-vous venu à l’opendata ?

OpenDataSoft existe depuis 6 ans. L’entreprise aété créée avec l’objectif de développer et mettresur le marché, via une plate-forme, une offredestinée au partage et à l’ouverture des don-nées. Avec la volonté de s’inscrire dans un mou-vement d’ouverture et de partage notamment surla thématique des villes et des territoires, pour la-quelle il y a un fort enjeu associé de transpa-rence et d’innovation. Toutes les parties pre-nantes (publiques et privées) ont un besoin departager, entre elles ou avec d’autres, les don-nées qui constituent l’information et la base de laconnaissance pour disposer des outils d’évalua-tion, pour prendre de meilleures décisions et dé-velopper de nouveaux services aux publics. Il y a20 ans, pour diffuser et partager simplement descontenus en ligne, les CMS (systèmes de ges-tion de contenu) n’existaient pas. Nous avons faitle même constat pour les données il y a 6 ans etavons décidé de créer une plate-forme conçuespécifiquement pour le partage et l’échange dedonnées par et pour le plus grand nombre.

L’objectif était de rendre le plus simple et rapidepossible la réutilisation de données issues d’ap-plications métiers diverses, afin de révéler leurvaleur, en permettant de les restituer dans desformats standards, de les analyser ou de lesagréger. Pour cela, car les données viennentd’horizons métier divers avec des différences degenèse, de format, de standard, il nous est appa-ru logique également d’appor-ter une solution de normalisa-tion via les API. Cette normali-sation permet d’aller au-delàdes standards métiers exis-tants, pour toucher le plusgrand nombre avec des for-mats les plus répandus et re-connus sur le Web et le mo-bile. Notre vision de départc’était de traiter cette chaînelogistique, de la collecte à la diffusion. Ensuite,au fil du temps, la typologie très variée des utili-sateurs de notre solution a permis de faire évo-luer continuellement cette dernière, tant sur lesquestions de collecte de données, de modèleéconomique que d’exploitation des données.Avec des clients dans 17 pays – surtout en Eu-rope et moyen orient, un peu en Amérique duNord – nous intervenons dans des secteurs va-riés, avec toutefois 40 % de collectivités territo-riales, notamment des grandes villes telles Paris,Rennes, Toulouse ou Nantes. Nous accompa-gnons les clients sur les besoins et les bonnespratiques de l’open data.

Cerema – Sign@ture n°66 41

La réutilisationRencontre avec

Jean-Marc Lazard

Entretien

Jean-Marc Lazard

Fondateur et CEO de OpenDataSoft

« L'objectif était de rendre le plus

simple et rapide possible la

réutilisation de données issues

d'applications métiers diverses »

Page 42: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

Pourquoi distinguer open data etSmartCity ?

Lorsque l’on parle opendata, les interlocuteursne se sentent pas tousconcernés. Pour eux, leterme « données ou-vertes » n’est pas forcé-ment synonyme de quali-té et de sécurité des don-

nées. On a donc créé l’offre SmartCity pour untype de clients. C’est la même plate-forme tech-nique mais pas le même champ d’utilisations. Demême pour le partage interne de données, lesclients sont sensibles à notre capacité à gérer etvaloriser leurs données en toute sécurité et desgaranties de services élevées. Cela reste cepen-dant la même plate-forme technique, disponibleen "multi-clouds" pour répondre à des casd’usages et architectures techniques variés.

Votre démarche est centrée sur laréutilisation. Pouvez-vous nous en

dire plus ?

Les données de nos premiers clients étaient is-sues de capteurs. La question a rapidement étéde savoir comment faciliter la réutilisation de cesdonnées techniques par le grand public et tousceux qui n’appartiennent pas au domaine métierinitial.

Notre différence d’approche : nous ne sommespas partis de la donnée mais nous nous sommesintéressés aux besoins des (ré)utilisateurs poten-tiels, du grand public, en essayant de savoir quelétait leur niveau de compétence, de culture de ladonnée ? On s’est rendu compte que l’approchepar les API permettait de standardiser, d’apporterun accès performant, “à la demande”, à tout unensemble de données (pas uniquement géogra-phiques), pour par exemple intégrer très simple-ment des réutilisations, des visualisations inter-actives dans un site web.

La mise en avant des réutilisations est allée desoi, en favorisant, comme tout contenu sur leweb, la viralité de telle ou telle donnée à succès.

Et comme ces réutilisations sont “branchées” surdes API, on peut savoir à n’importe quel momentquelle donnée est la plus consultée à traversl’usage d’une visualisation cartographique parexemple. Cela permet au producteur de la don-née de connaître ce qui intéresse les gens, et defaire ainsi une sorte de marketing de ses don-nées.

Également, en s’inspirant de ce que font lesautres, une petite commune, avec ses propresdonnées, pourra elle-même disposer des outilsqu’une grande ville comme Paris. Cela contribueà rendre autonomes et agiles des petites villespour créer leur proprebase de connaissance.

En bref, notre credo estqu’il ne faut pas réserverla donnée aux spécia-listes d’un domaine.Nous faisons évoluernotre plate-forme continuellement pour présenterles données le plus simplement possible, pourdémocratiser leur accès.

Pouvez-vous nous indiquer desexemples phares de réutilisations quien sont faites par les entreprises, les

citoyens, les collectivités ?

Une jeune pousse Symaps.io a par exemple misen place un service en ligne, pour les profession-nels du commerce et les franchises, afin de lesaider à identifier les zones idéales pour l’implan-tation de magasins. À partir d’un algorithme quileur est propre, cette solution utilise, notammentà travers les API, des données open data : statis-tiques, socio-démographiques et celles propres àun territoire. Elle n’utilise pas que des donnéesopen data, mais sans données open data misesà disposition de manière industrielle, elle nepourrait pas offrir ce type de services.

Cerema – Sign@ture n°66 42

« notre crédo est qu'il ne faut pas

réserver la donnée aux spécialistes d'un domaine »

« Lorsque l'on parle open data, les interlocuteurs ne se sentent pas tous concernés »

La réutilisationRencontre avec

Jean-Marc Lazard

Page 43: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

La société Handisco développe une canneblanche connectée pour les personnes nonvoyantes. La canne a un boîtier qui délivre desvibrations au niveau de la main et permet la loca-lisation exacte ainsi que les principaux pointsd’intérêt à proximité comme les magasins, res-taurants, lieux publics, arrêts de transports encommun et leurs horaires des prochains pas-sages. Le prototypage de ce genre de solution etla création de l’entreprise n’est possible qu’avecdes données ouvertes et si possible en tempsréel comme les horaires des transports en com-mun.

Il y a des réutilisationspossibles par la collectivitéelle-même, même si les“puristes” expliquent quece n’est pas au producteurde la donnée de la rendreintelligible. La communed’Issy-les-Moulineaux parexemple fait de la pédago-gie sur son rapport d’acti-vités qu’elle met à disposi-tion depuis 4 ans. Elle

complète les données par des analyses, paspour des professionnels mais pour ses citoyensdans une démarche participative. Il reste tou-jours la possibilité aux plus aguerris d’allerconsulter les données sources en cas de besoin.

D’une manière générale les services indiquentque la démarche est très positive, car elle les ex-pose et les oblige à avoir des relations diffé-rentes avec leurs administrés.

Votre livre blanc sur les 10 pointsessentiels pour ouvrir ses données

propose « Pensez qualité, pasquantité ». N’est-ce pas à contre

courant des obligationsréglementaires d’ouverture de

l’ensemble des données ?

À l’époque de la création du livre blanc, les gensne cessaient de se comparer sur la quantité dejeux de données publiés, alors qu’il faut penseravant tout à la réutilisation qui va en être faite. Laquantité n’est pas le critère de succès. Si la miseà disposition coûte que coûte peut être une pre-mière phase, dans un second temps, il faut pas-ser à la montée en qualité des données. Un cri-tère de succès c’est lorsque les collaborateursd’une entreprise ou d’une collectivité utilisentleurs propres données ouvertes pour être plusefficace, pour innover. Là on peut alors direqu’on a réussi, qu’on a franchi un pallier.

Quelles sont selon vous lesévolutions futures de l’open data et

celles de votre produit ?

On vient d’en parler, c’est quand on commence àfermer la boucle : on met à disposition des don-nées de qualité moyenne, on est challengé pourles améliorer, on progresse en interne sur la qua-lité, et cette montée en qualité fait qu’on utilisesoi-même les données mises à disposition. Noustravaillons par exemple à la mise en place de for-mulaires de saisie des données auprès des utili-sateurs afin de pouvoir faire remonter les pro-blèmes et les erreurs, et du côté des agents afinde faire un retour sur les remarques mais ausside les corriger. On entre ainsi dans le cercle ver-tueux du collaboratif interne et externe. D’ailleurs

la distinction entre in-terne et externe s’es-tompe. On pense sur-tout réutilisateurs :quand une société ou unpartenaire utilise de ma-

nière professionnelle desdonnées, il y a une sorte de contrat de service

Cerema – Sign@ture n°66 43

« Il y a des réutilisations possibles par la collectivité elle-même, même si les "puristes" expliquent que ce n'est pas au producteur de la donnée de la rendre intelligible »

« On entre ainsi dans le cercle vertueux du collaboratif interne et externe »

La réutilisationRencontre avec

Jean-Marc Lazard

Page 44: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

implicite qui se met en place, à la manière duservice publique de la donnée que met en placel’État français.

Nous avons également de plus en plus de clientspour lesquels le sujet est l’automatisation de lamise à disposition de données est prioritaire,dans cet esprit de “contrat de service” justement.Nous sommes au début d’un autre cercle ver-tueux grâce à la standardisation de la donnée,qui nous permet de travailler sur des APId’alertes à partir des flux de données, lors dechangements ou de dépassement de seuils : j'aicomme exemple les personnes qui commencentà nous demander des API de "push" pour desalertes Météo France. La plate-forme ne metdonc plus seulement à disposition des données,mais elle est capable d’envoyer des alertes à unsystème tiers. L’open data doit devenir proactif etnous prévient quand il y a changement significa-tif de la donnée ou d’un état de la donnée.

Entretien réalisé par Christophe Badol

Cerema – Sign@ture n°66 44

La réutilisationRencontre avec

Jean-Marc Lazard

Page 45: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

Encart réalisé par Mathieu Rajerison, à partir des échanges ayant eu lieu lors de la COTITAMéditerranée du 27 mars 2018, consacrée à l’ « Ouverture des données pour les territoires ».

La réutilisation des données open data peut s'illustrer avec l'exemple de LKSpatialist, une startupmontpelliéraine de 34 salariés née en 2015 dans le giron de l’open data de l’État et de lamétropole de Montpellier. Voici trois exemples de services qu’elle développe autour du foncier etqui montrent la diversité des développements, et des cibles potentielles de l’open data, dans uncadre entrepreunarial.

En savoir plus sur la COTITA Méditerranée « Ouverture des données pour les territoires ».

https://www.cerema.fr/fr/actualites/retour-journee-ouverture-donnees-territoires-du-27-mars-2018

Cerema – Sign@ture n°66 45

L’ application appelée LINA®

qui accélère la prospection foncière en cartographiant le potentiel parcellaire bâti et non bâti sur un territoire, en donnant accès à des informations telles que les documents d'urbanisme, la forme de la parcelle, la réglementation, certaines contraintes liées à l'habitat ; cette application est plutôt à destination des professionnels de l'immobilier (promoteurs, aménageur, etc..)

NOAM®, une application gratuite et à destination des particuliers

Nouvelle Offre pour Acheter-Louer Malin, permet de rechercher un bien immobilier selon ses caractéristiques et sa proximité vis-à-vis de certains lieux (mobilité, commerces, loisirs, services et équipements)

L’ application FARA® DPE+

qui permettra de connaître le gisement d'énergies renouvelables identifié sur une parcelle, qu'elle soit solaire ou géothermique

La réutilisationExemple entrepreunarial avec LKSpatialist

Page 46: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

Petit glossaire réglementaire autour de l'open dataLa loi pour la croissance, l'activité et l'égalité des chances économiques (dite loi Macron) du 6 août 2015

Elle a rendu déjà obligatoire, dans son article 4, l'ouverture des données sur les transports publics et les services à la mobilité.

La loi pour une République numérique (dite loi Lemaire) du 7 octobre 2016

Elle acte le principes de l'ouverture par défaut des données publiques, et liste des jeux de données de référence via le service public de la donnée.

En savoir plus : https://www.economie.gouv.fr/republique-numerique

Le Règlement général de la protection des données (RGPD)

Il est un règlement européen entré en vigueur le 24 mai 2016. Il réglemente la protection des données personnelles, en renforçant les droits des personnes (droit à la portabilité des données personnelles), et responsabilisant les acteurs traitant des données.

En savoir plus : https://www.cnil.fr/fr/comprendre-le-reglement-europeen

Page 47: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

L’Internet des objets dans la smart city

Le Cerema a commandé à l’Ecole desPonts ParisTech un rapport sur les usagesde l’Internet des objets dans les villes in-telligentes françaises

L’étude propose un état des lieux desusages et des technologies, analyse lespremiers retours d’expériences et formuledes préconisations pour bien démarrer unprojet.

A retrouver sur le site du Cerema :https://www.cerema.fr/fr/actualites/internet-objets-smart-city

« Instaurer des données, instau-rer des publics : une enquête so-ciologique dans les coulisses del'open data »

Une thèse de Samuel Goeta sur « l’émer-gence et la mise en œuvre des politiquesd’open data »

A lire au format PDF sur le site du CCSD(Centre pour la Communication Scienti-fique Directe) :https://pastel.archives-ouvertes.fr/tel-01458098

« Ouvir, partager, réutiliser - re-gards critiques sur les donnéesnumériques »

Sous la direction de Laurence Monnoyer-Smith, Clément Mabi et Jean-ChristophePlantin, cet ouvrage interroge « de ma-nière critique les multiples processus so-ciotechniques au sein desquels les don-nées s’insèrent, de leur production à leurusage »

Éditions de la Maison des sciences del’homme :h ttps://books.openedition.org/editionsmsh/9026?lang=es

« Open data : où va-t-on ? »

16 min d’entretien avec Paula Forza, dé-puté LREM et Séverin Naudet, ancienconseiller numérique du Premier Ministre.

A écouter en podcast sur France Culture :https://www.franceculture.fr/emissions/le-numerique-est-politique/le-numerique-est-politique-du-dimanche-08-avril-2018*

Cerema – Sign@ture n°66 47

2

Transformer et produire

Comparer et améliorerCartographier et visualiser

33

Lectures

Page 48: OPEN DATA · des données sur les transports publics et les services à la mobilité. Sur la demande du Ministère des Transports, le Cerema ... ou « IoT » pour « Internet of things

Salon de la data

le 12 septembre 2018 – Cité des congrèsde Nantes

Cette année les thématiques seront :– Maîtriser ses données : gouvernancesdes données, open data, sécurité des don-nées, stockage des données…– Communiquer et diffuser ses données :visualisation de données, cartographie,données géographiques, data journalism,– Exploiter et valoriser ses données: BigData, IoT, Data Science, Smart City,

Toutes les infos à retrouver sur :https://salondata.fr/

#OpenGov Forum Open d’Etatn°3 et 4

n°3 le 9 juillet et le n°4 le 17 septembre

« Conçus et impulsés par Etalab, Datacti-vist et Vraiment Vraiment dans le cadre dela démarche de gouvernement ouvert enFrance, les forums « Open d’État » ontpour but de faire se rencontrer régulière-ment des agents publics impliqués dansdes projets d’innovation, mais aussi desacteurs de la société civile (acteurs privés,associations, ONG…) lors de forums ou-verts. »

Pour en savoir plus :https://www.etalab.gouv.fr/les-rencontres-open-detat-le-forum-du-gouvernement-

ouvert

Cerema – Sign@ture n°66 48

Calendrier

Sign@ture 66

Directeurde la publication

Pascal BERTEAUD

Directeur déléguéde publication

Christian CURÉ

Rédacteur en chefBernard ALLOUCHE

Equipe de rédactionAntoine LEMOT

Christophe BADOLMathieu RAJERISONStéphane LÉVÊQUE

www.cerema.fr

Photo couverture : Carte de France de l’ouverture des

données – OpenDataFrance

https://bit.ly/2u78XN7