4
60 Géomatique Expert|N° 98|Mai-Juin 2014 S i l’on en croit les dern- ières courbes publiées, le nombre de contribu- teurs, ainsi que le nombre de données ajoutées, du projet OpenStreetMap (OSM) ne cesse d’augmenter : environ quatre milliards d’informations enregis- trées dans la base de données pour un peu plus d’un million cinq cents mille utilisateurs (cf. graphique). La matière premi- ère brute est donc abondante, mais, à la différence des réfé- rentiels SIG qui se présen- tent sous forme de tables bien structurées, OpenStreetMap propose des données « brutes », où les informations géométr- iques sont associées à des tags dont les noms ne sont pas toujours homogènes, et les valeurs souvent disparates (par exemple, pour un même tag, on pourra trouver des valeurs en français ou en anglais. Une nomenclature des tags les plus fréquents et devant être utili- sés existe, toutefois : http:// wiki.openstreetmap.org/wiki/ Map_features.) Un traitement de fond est donc nécessaire avant même de commencer à utiliser les informations. Chez Makina Corpus , SSLL toulousaine spécialisée en géomatique, OpenStreetMap est utilisé à différents niveaux. « Le premier niveau, pour ainsi dire, explique Frédéric Bonifas, consiste à contribuer person- nellement à l’enrichissement de la base ; nous incitons tous les salariés de Makina Corpus à contribuer au projet. Au niveau suivant, nous dispensons des formations pour initier les person- nes qui souhaitent devenir contrib- uteurs, afin de leur enseigner à la fois les techniques de relevé et les outils de saisie. Le public intéressé est très divers, depuis des enfants jusqu’à des retraités, en passant par les agents des différentes collectivités territori- ales. Parfois, nous intervenons nous-même dans la complétion de certaines zones ; par exemple, Un point sur OpenStreetMap Quel est l’état du projet OpenStreetMap et comment participe-t-il au développement de la géomatique en général ? Éléments de ré- ponse au travers de l’expérience de la SSLL toulousaine Makina Corpus. Figure 1 : Croissance du nombre d’utilisateurs enregistrés sur la plate-forme Open Street Map. Source : Wikipedia. Figure 2 : Extrait du catalogue des tags disponible à l’adresse http://wiki.openstreetmap.org/wiki/Map_features. 1. Voir le numéro précédent de Géomatique Expert.

Makina Corpus dans Geomatique Expert

Embed Size (px)

DESCRIPTION

Un point sur OpenStreetMap avec Jean-PIerre Oliva et Frédéric Bonifas

Citation preview

Page 1: Makina Corpus dans Geomatique Expert

60 Géomatique Expert|N° 98|Mai-Juin 2014

Si l’on en croit les dern-ières courbes publiées, le nombre de contribu-

teurs, ainsi que le nombre de données ajoutées, du projet OpenStreetMap (OSM) ne cesse d’augmenter : environ quatre milliards d’informations enregis-trées dans la base de données pour un peu plus d’un million cinq cents mille utilisateurs (cf. graphique). La matière premi-ère brute est donc abondante, mais, à la différence des réfé-rentiels SIG qui se présen-

tent sous forme de tables bien structurées, OpenStreetMappropose des données « brutes », où les informations géométr-iques sont associées à des tags dont les noms ne sont pas toujours homogènes, et les valeurs souvent disparates (par exemple, pour un même tag, on pourra trouver des valeurs en français ou en anglais. Une nomenclature des tags les plus fréquents et devant être utili-sés existe, toutefois : http://wiki.openstreetmap.org/wiki/Map_features.) Un traitement de fond est donc nécessaire avant même de commencer à utiliser les informations.

Chez Makina Corpus, SSLL toulousaine spécial isée en

géomatique, OpenStreetMapest utilisé à différents niveaux. « Le premier niveau, pour ainsi dire, explique Frédéric Bonifas, consiste à contribuer person-nellement à l’enrichissement de la base ; nous incitons tous les salariés de Makina Corpus à contribuer au projet. Au niveau suivant, nous dispensons des formations pour initier les person-nes qui souhaitent devenir contrib-uteurs, afin de leur enseigner à la fois les techniques de relevé et les outils de saisie. Le public intéressé est très divers, depuis des enfants jusqu’à des retraités, en passant par les agents des différentes collectivités territori-ales. Parfois, nous intervenons nous-même dans la complétion de certaines zones ; par exemple,

Un point sur OpenStreetMap

Quel est l’état du projet OpenStreetMap et comment participe-t-il au développement de la géomatique en général ? Éléments de ré-ponse au travers de l’expérience de la SSLL toulousaine Makina Corpus.

Figure 1 : Croissance du nombre d’utilisateurs enregistrés sur la plate-forme Open Street Map. Source : Wikipedia.

Figure 2 : Extrait du catalogue des tags disponible à l’adresse http://wiki.openstreetmap.org/wiki/Map_features.

1. Voir le numéro précédent de Géomatique Expert.

Page 2: Makina Corpus dans Geomatique Expert

Géomatique Expert|N° 98|Mai-Juin 2014 61

dans le cadre du projet Vu du ciel du Conseil général de Loire-Atlantique1, nous avons enrichi les données de certaines communes de l’agglomération nantaise. Mais au-delà de cet aspect “contribu-tion”, Makina Corpus travaille naturellement sur les aspects gestion et réutilisation. »

Personnalisation et réutilisation

La première uti l isation des données OSM consiste en la réalisation de plans de ville personnalisés, ou de fonds de carte spéciaux. Beaucoup de services techniques en mairie travaillent encore avec des outils de dessin vectoriel type Adobe Illustrator®, sans aucun lien avec une base de données géographiques. Avec les données OSM et des outils libres de type Mapnik, il est désormais possible de réal-iser des plans qui n’ont rien à envier à la qualité obtenue avec les logiciels de dessin traditionnels, tout en liant les mises à jour à celle d’une base de données, éventuellement centralisée. OSM permet égale-ment de répondre à des besoins très particuliers, par exemple la réalisation de plans qui ne requièrent pas de connexion à des serveurs Internet externes, souvent pour des questions de sécurité (grandes entreprises avec des données sensibles, défense).

Se pose cependant la ques-tion du traitement préalable des données : « Une partie des prestations que nous effectuons consiste précisément à filtrer ces données pour constituer des bases plus conformes à ce qu’attendent les logiciels

SIG, poursuit Frédéric Bonifas. Une partie des traitements est automatisable en créant des règles que l’on injecte ensuite dans des logiciels ETL, par exemple Talend ou GeoKettle. On peut, par exemple rassem-bler des tags, ou encore détecter les habitudes des contributeurs en analysant leurs ajouts.

Les problèmes de qualité sont réels, mais il ne faut pas les surestimer. La BD Adresse®de l’IGN, avec laquelle il nous arrive également de travailler, montre parfois des lacunes ou des hétérogénéités semblables à celles d’OSM, et pourtant elle est commercialisée un bon prix. Heureusement, un grand nombre de développeurs travail-lent spécifiquement à la concep-tion d’applications d’évaluation ou d’amélioration de la qualité des données, on peut donc dire que celle-ci augmente avec le temps. »

Un autre aspect des données OSM est la possibilité de les enrichir à volonté. L’ajout de données dans la base est particulièrement prisé par les collectivités locales qui y voient la possibilité de valoriser immédi-atement des données publiques, plutôt que de les publier sur un serveur Open Data et d’attendre que des volontaires effec-tuent le transfert vers la base géographique. Ces opérations d’insertion vont de l’ajout de

ponctuels correspondant aux adresses, jusqu’à l’insertion de voies oubliées ou récemment créées.

Hors du cadre de l’Open Data, des opérateurs privés peuvent également utiliser et modifier les données OSM, par exemple un grand groupe qui, dans le cadre de son programme de fidélisation, souhaite rédiger une carte personnalisée faisant apparaître ses propres points d’intérêt et disparaître ceux de ses concurrents. Les applica-tions orientées défense utilisent également leurs propres enri-chissements (évidemment sans que ceux-ci ne soient reversés dans la base commune !) « Le régime juridique de la base de données n’est finalement pas si contraignant que certains veulent bien le présenter. L’idée est que le reversement n’est obligatoire que si les nouvelles données sont “intimement” liées aux données d’origine. Un concept, j’avoue, assez flou, admet Frédéric Bonifas. Suffisamment, en tout cas, pour que certaines sociétés, comme MapBox considèrent que les points d’adresse présents dans la base ne sont pas utilisables en raison des implications légales de la licence choisie. »

Bien que les données OSM soient gratuites, il est possible de les enrichir et de les revendre avec des données dérivées,

Figure 3 : Visualisation de la base des arbres du Conseil général des Hauts-de-Seine sur un fond de plan OpenStreetMap.

Page 3: Makina Corpus dans Geomatique Expert

62 Géomatique Expert|N° 98|Mai-Juin 2014

soit sous forme de fichiers, soit sous forme d’abonnement à un service Internet de type WMS/WFS. C’est également le cas d’un atlas papier entièrement conçu avec les données OSM, et enrichi de différents points d’intérêt.

Les données OSM son t cependant suffisantes pour un grand nombre d’usages, particulièrement quand il s’agit d’exploiter des extractions dans les centres-ville des grandes métropoles, où OpenStreetMap possède souvent un temps d’avance sur les autres four-nisseurs. À l’inverse, dans les régions « moins peuplées », OSM présente souvent un aspect de « zone blanche ». « C’est la raison pour laquelle nous encoura-geons les collectivités territori-ales à reverser leurs données, explique Frédéric Bonifas. OSM ne peut pas financer des sala-riés pour aller couvrir tous les recoins de la France. De plus, cette information existe, dans les communes, les communautés, les parcs naturels, les dépar-

tements, les régions. Si ces structures acceptent de reverser leurs bases dans le projet, c’est gagné ! »

Doper l’utilisation ?Le format des données OSM, écrites en XML, est particu-lièrement souple : il n’y a pas de syntaxe véritable, chacun peut attacher un nombre de tags arbitraire à une donnée. L’inconvénient du XML demeure sa grande verbosité, qui oblige à transférer une quantité de non-informations aux côtés de la donnée utile. Cet inconvé-nient peut être partiellement résolu, soit en adoptant des formats plus compacts, comme le GeoJSON, soit en constitu-ant des bases extraites dont on élimine les tags inutiles, soit à la volée, soit par pré-traitement. Pour les exports, un format binaire dit « ProtoBuf » est également disponible ; compact, il n’est cependant pas lisible facilement par un humain. « Nous ne travaillons jamais avec

le format XML, poursuit Frédéric Bonifas. Nous avons dével-oppé une chaîne de traitements qui nous permet d’injecter les données OSM dans PostGIS. Le résultat de nos requêtes est fourni en GeoJSON. De toute manière, il n’est pas possible d’attaquer la base principale OSM pour effectuer des traite-ments massifs. Cette dernière est essentiellement conçue pour gérer les actualisations, c’est-à-dire des transactions de faible volume. La donnée OSM doit être répliquée sur des serveurs adéquats pour être utilisée dans des applications à grand succès. Il existe pour cela des sources en lecture seule, qui proposent le télécharge-ment en masse, ce qui permet d’alimenter des serveurs secon-daires sur lesquels peuvent tourner des bases de données spatiales à la PostGIS. »

Les données OSM vont-elles, à plus ou moins long terme, finir par supplanter les données IGN ? Dans les collectivités locales, qui bénéficient de la gratuité des données IGN, l’heure n’est pas au changement. « On peut cependant s’attendre à ce qu’OSM s’impose sur un certain nombre d’usages bien particuli-ers. La donnée IGN est encore très attractive, ne serait-ce que pour sa couverture homogène du territoire. En revanche, de plus en plus d’entreprises ou de collectivités territoriales utilisent OSM pour constituer des fonds de plans hautement person-nalisés, ce que ne permet pas, par exemple, Google Maps. En géomatique pure, il ne faut pas se voiler la face : les données OSM ne sont que rarement exploitées pour autre chose que de la représentation ; leur usage en analyse demeure marginal. Il y a certaines exceptions :

Figure 4 : Image de la densité de traces OSM sur l’Europe. Source : Wikipedia.

Page 4: Makina Corpus dans Geomatique Expert

Géomatique Expert|N° 98|Mai-Juin 2014 63

on peut se servir des données OpenStreetMap pour constituer, par exemple, une base des chemins de halage et connaître ainsi les berges d’un cours d’eau qui sont mal desservies. »

« J’ai l’impression, confie Anne Monteils, que la situation dans les collectivités locales est un peu disparate. D’un côté, nous avons les géomaticiens férus d’Open Source, qui utilisent des logiciels comme QGis, et qui connaissent OpenStreetMap et l’utilisent. De l’autre côté, nous avons les géomaticiens plus “classiques”, qui ne connaissent pas OSM, ou s’en méfient, et qui préfèrent la donnée IGN et d’autres réfé-rentiels comme le cadastre pour placer leurs données dérivées. Tout n’est pas non plus figé. Je connais au moins une mairie où le service communication, responsable du plan municipal, a accepté d’utiliser OSM comme source, et pour lequel nous avons développé une passerelle vers Illustrator™. Mais ce n’est pas la majorité. »

Si la contribution à OpenStreetMap ne demande aucune compé-tence particulière, ni en géog-raphie, ni en informatique, du fait du développement d’outils de saisie très conviviaux, ce n’est pas le cas de l’exploitation qui demeure, de facto, une prérogative d’informaticien. L’extraction, la manipulation des données XML, leur trans-formation dans un format plus commode ou leur stockage en base de données sont encore largement au-delà des compé-tences du grand public. En revanche, les informaticiens créent des applications intui-tives qui exploitent les données OpenStreetMap, comme le réseau social Foursquare, par exemple. Toutefois, la commu-

nauté essaie de faciliter la réuti-lisation en proposant des outils ergonomiques et conviviaux comme uMap : http://umap.openstreetmap.fr/fr/.

Quel avenir pour OSM ?

La base de données nécessite toujours des enrichissements, car de multiples applications se font jour. Mais l’un des problèmes à résoudre tient dans le processus de création de la base : chaque amélioration, par exemple l’ajout d’un tag, doit faire l’objet d’une campagne d’évangélisation. Il faut qu’une majorité de contributeurs l’adoptent, pour que son utilisation devienne envisageable. « Il y a un certain temps, reprend Frédéric Bonifas, nous souhaitions ajouter des informations d’accessibilité pour les handicapés. Nous avons bien créé une nomenclature, mais il fallait derrière convaincre la communauté de l’intérêt d’une telle démarche, faute de quoi elle serait restée vaine.

Quel avenir pour les données OSM ? Si j’en crois les dernières statistiques, le nombre de contrib-

uteurs poursuit sa croissance, et la base de données contient de plus en plus d’informations. C’est vrai que cette envolée était plus marquante il y a quelques temps, et tend à se calmer un peu. Mais ce n’est pas pour cela que le projet patine, ni que l’on peut relier OSM à un phénomène de mode. Il faut entretenir le cercle vertueux : plus les développeurs utiliseront les données OSM, plus cela encouragera les contribu-teurs, donc plus les données seront complètes, etc. Il n’y a pas de raison que cela cesse, tant que les utilisateurs finaux en tirent bénéfice. »

« Pour ma part, ajoute Jean-Pierre Oliva, P.-D.G. de Makina Corpus, je dirais que le jour où Google Maps a, pour la première fois, proposé une API web cartographique gratuite, le paysage géomatique a été révo-lutionné d’un coup. Il est possible qu’une autre révolution détrône les données OSM, mais, comme toutes les révolutions, elle n’est pas prévisible. Et, jusqu’à cette hypothétique bouleversement, OpenStreetMap a encore de beaux jours devant lui. » |

Figure 5 : Le site UMAP permet de réutiliser très facilement les données OSM pour constituer ses propres cartes. Sa page d’accueil affiche, par zone géographique, le nombre de cartes ainsi réalisées.