4
Intégration et visualisation de données thématiques sur un référentiel topographique de support Contexte De récentes démarches politiques et avancées technologiques ont conduit à la mise à disposition de jeux de données produits par les administrations et les collectivités locales (ex : http://www.data.gouv.fr/ , http://data.lacub.fr/ ) afin de favoriser l’information des citoyens et la création de nouveaux services. La valorisation de ces diverses sources de données nécessite de faciliter leur réutilisation au sein d’applications, en particulier leur croisement entre elles. Sur le Web, l’initiative du LOD (Linked Open Data : http://linkeddata.org/ , [1] [2] [3] [4]) encourage la publication de jeux de données libres conformes à un modèle permettant le croisement de données entre elles. Ce modèle technique est utilisé par exemple en France, pour la publication de jeux de données de l’IGN (http://data.ign.fr/ ), de l’INSEE (http://rdf.insee.fr/ ), ou encore de la BNF (http://data.bnf.fr/ ). Parmi les données disponibles, de nombreuses ressources font référence, de façon directe ou indirecte, à une localisation. Cette composante spatiale des données constitue l’un des critères privilégiés pour leur interconnexion avec d’autres sources de données ou encore leur valorisation au travers d’applications cartographiques (citons par exemple le site réalisé à l’aide de données issues de data.gouv.fr: http://www.hicnunc.mobi/j_aime_ma_gare/ ). Rendre accessibles et utilisables ensemble des données décrivant les territoires a conduit la Commission Européenne à instaurer la directive INSPIRE [5] pour la mise en place d’une infrastructure de données géographiques européenne (SDI, Spatial Data Infrastructures) [6]. Par rapport à l’approche Linked Data, l’approche adoptée dans le cadre d’INSPIRE a d’avantage mis l’accent sur l’harmonisation des schémas et le traitement des géométries, afin de permettre la création d’un jeu de données géographiques harmonisé. Sujet Dans ce contexte, permettre l’intégration de données au modèle Linked data avec un référentiel géographique (le Référentiel à Grande Échelle de l’IGN) constitue un enjeu important pour favoriser l’interconnexion et la valorisation des données ainsi publiées. Ce travail de thèse consistera donc dans un premier temps à proposer et mettre en œuvre une approche pour l’intégration de données au modèle Linked data avec le Référentiel à Grande Échelle : - Mise à profit des ontologies décrivant les données afin d’en tirer des indications sur le type de géoréférencement utilisé, la représentation éventuelle des géométries, ou encore le système de coordonnées utilisé.

Intégration et visualisation de données thématiques sur un ...recherche.ign.fr/theses_2013/TheseIGN_2013_LinkedData.pdf · Intégration et visualisation de données thématiques

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Intégration et visualisation de données thématiques sur un ...recherche.ign.fr/theses_2013/TheseIGN_2013_LinkedData.pdf · Intégration et visualisation de données thématiques

Intégration et visualisation de données thématiques sur un référentiel

topographique de support

Contexte

De récentes démarches politiques et avancées technologiques ont conduit à la mise à

disposition de jeux de données produits par les administrations et les collectivités locales

(ex : http://www.data.gouv.fr/, http://data.lacub.fr/) afin de favoriser l’information des

citoyens et la création de nouveaux services. La valorisation de ces diverses sources de

données nécessite de faciliter leur réutilisation au sein d’applications, en particulier leur

croisement entre elles. Sur le Web, l’initiative du LOD (Linked Open Data :

http://linkeddata.org/, [1] [2] [3] [4]) encourage la publication de jeux de données libres

conformes à un modèle permettant le croisement de données entre elles. Ce modèle

technique est utilisé par exemple en France, pour la publication de jeux de données de l’IGN

(http://data.ign.fr/), de l’INSEE (http://rdf.insee.fr/), ou encore de la BNF

(http://data.bnf.fr/).

Parmi les données disponibles, de nombreuses ressources font référence, de façon directe

ou indirecte, à une localisation. Cette composante spatiale des données constitue l’un des

critères privilégiés pour leur interconnexion avec d’autres sources de données ou encore

leur valorisation au travers d’applications cartographiques (citons par exemple le site réalisé

à l’aide de données issues de data.gouv.fr: http://www.hicnunc.mobi/j_aime_ma_gare/).

Rendre accessibles et utilisables ensemble des données décrivant les territoires a conduit la

Commission Européenne à instaurer la directive INSPIRE [5] pour la mise en place d’une

infrastructure de données géographiques européenne (SDI, Spatial Data Infrastructures) [6].

Par rapport à l’approche Linked Data, l’approche adoptée dans le cadre d’INSPIRE a

d’avantage mis l’accent sur l’harmonisation des schémas et le traitement des géométries,

afin de permettre la création d’un jeu de données géographiques harmonisé.

Sujet

Dans ce contexte, permettre l’intégration de données au modèle Linked data avec un

référentiel géographique (le Référentiel à Grande Échelle de l’IGN) constitue un enjeu

important pour favoriser l’interconnexion et la valorisation des données ainsi publiées. Ce

travail de thèse consistera donc dans un premier temps à proposer et mettre en œuvre une

approche pour l’intégration de données au modèle Linked data avec le Référentiel à Grande

Échelle :

- Mise à profit des ontologies décrivant les données afin d’en tirer des indications sur

le type de géoréférencement utilisé, la représentation éventuelle des géométries, ou

encore le système de coordonnées utilisé.

Page 2: Intégration et visualisation de données thématiques sur un ...recherche.ign.fr/theses_2013/TheseIGN_2013_LinkedData.pdf · Intégration et visualisation de données thématiques

- Reconstitution de géométries cartographiables à partir de ces données (géométries

fournies par les données ou géocodage)

- Intégration de ces données à des données géographiques « classiques » :

appariement, recalage.

Un verrou important au croisement des sources de données disponibles sur le Web est la

bonne représentation formelle du positionnement, ce que nous appelons "la sémantique du

X, Y". Il conviendra donc de proposer une représentation efficace de l’information de

positionnement : quel est le lien entre une géométrie et l’élément du terrain réel qu’elle

représente (contour d’un bâtiment, centre d’un carrefour) ou encore quelle est la relation

qui lie un objet thématique à un objet topographique (un service public hébergé dans un

bâtiment) ? Ces connaissances ainsi formalisées devront ensuite être mises à profit dans le

cadre d’une approche d’interconnexion de données utilisant le Référentiel à Grande Échelle

comme source de données de support.

Enfin, parmi les applications découlant de cette intégration de linked data avec un

référentiel géographique, leur visualisation cartographique permet leur mise en valeur en

fournissant aux utilisateurs un moyen de découverte convivial de ces données. Quelques

applications de ce type existent déjà, mais se limitent à positionner des points sur un fond

cartographique (voir figures 1 et 2). La mise à profit des ontologies décrivant les données

pour proposer des solutions de visualisation cartographique adaptées sera donc étudiée. On

s’intéressera en particulier à l’utilisation de la sémantique des données pour leur

généralisation.

Page 3: Intégration et visualisation de données thématiques sur un ...recherche.ign.fr/theses_2013/TheseIGN_2013_LinkedData.pdf · Intégration et visualisation de données thématiques

Figure 1: Visualisation de Linked Data sur un fond cartographique (Open Street Map) :

http://browser.linkedgeodata.org/?

Figure 2: Visualisation de Linked Data sur un fond cartographique (Google Maps) :

http://geo.linkeddata.es/web/guest/visualizacion-beta

Page 4: Intégration et visualisation de données thématiques sur un ...recherche.ign.fr/theses_2013/TheseIGN_2013_LinkedData.pdf · Intégration et visualisation de données thématiques

Compétences particulières et formation requise

Informatique, linked data, une compétence en SIG est un plus.

Titulaire d’un Master 2 ou d’un diplôme d’ingénieur en géomatique,

Titulaire d’un Master 2 ou d’un diplôme d’ingénieur en informatique avec un intérêt pour la

géomatique.

Accueil et encadrement

La thèse sera réalisée au Laboratoire COGIT de l’IGN, Saint-Mandé (limitrophe Paris), en

partenariat avec le CNAM. La direction et l’encadrement de la thèse seront réalisés par

Nathalie Abadie (IGN), Bénédicte Bucher (IGN), et Fayçal Hamdi (CNAM). Le contrat doctoral,

de trois ans, pourra être réalisé avec ou sans charge de cours, selon le profil du candidat et

les besoins de l’Ecole Nationale des Sciences Géographiques.

Contact et candidature

Contact pour tout renseignement: Nathalie Abadie (nathalie-f.abadie[at]ign.fr, 01 43 98 80

03) et Fayçal Hamdi (faycal.hamdi[at]cnam.fr)

Pour candidater : envoyer par E-mail a minima CV, lettre de motivation, notes de l’année en

cours et passée, à Nathalie Abadie (nathalie-f.abadie[at]ign.fr), avec copie à la DRH de l’IGN

([email protected]), avant le 30 avril 2013.

Bibliographie

[1] Berners-Lee, T.: Design Issues: Linked Data. Online, Retrieved May 25, 2009, from http://www.w3.org/DesignIssues/LinkedData.html

[2] Bizer, C., Heath, T., Berners-Lee, T.: Linked data - the story so far. Journal on Semantic Web and Information Systems (in press) (2009).

[3] Resource Description Framework (RDF): Concepts and Abstract Syntax, Graham Klyne and Jeremy J. Carroll, Editors, W3C Recommendation, 10 février 2004, http://www.w3.org/TR/2004/REC-rdf-concepts-20040210/. Dernière version : http://www.w3.org/TR/rdf-concepts/.

[4] SPARQL Query Language for RDF, Eric Prud'hommeaux and Andy Seaborne, Editors, W3C Recommendation, 15 janvier 2008, Dernière version: http://www.w3.org/TR/rdf-sparql-query/

[5] Parlement Européen et Conseil de l’Union Européenne. Directive 2007/2/CE du Parlement Européen et du Conseil du 14 mars 2007 établissant une infrastructure d’information géographique dans la Communauté européenne (INSPIRE) *en ligne+. Journal officiel de l’Union Européenne du 25 avril 2007, L108/1, Disponible sur : http://eur-lex.europa.eu/LexUriServ/LexUriServ.do?uri=OJ:L:2007:108:0001:0014:FR:PDF (Consulté le 08.07.2011). 2007

[6] Nebert, D.D. Developing Spatial Data Infrastructures: The SDI cookbook. Douglas D. Nebert, Technical Working Group Chair, G. S. D. I. (ed.). 2004, pp. 171