Upload
data-tuesday
View
857
Download
4
Embed Size (px)
Citation preview
20/11/2012
Franck CottonSecrétariat général informatique
Datalift à l’INSEEData Tuesday – 20 novembre 2012
20/11/2012
Le projet Datalift
Objectif : construction d’une plate-forme de production et de publication de données liées (linked data)
Cofinancé par l’Agence Nationale de la Recherche Durée : 3 ans et demi (fin en mars 2014) Partenaires :
Enseignement / rechercheEURECOM (Institut Mines-Telecom), INRIA (EXMO, WIMMICS),
LIRMM (Université de Montpellier)
IndustrielsAtos, Mondeca
Fournisseurs de donnéesIGN, INSEE
Think tankFING (Fondation Internet nouvelle génération)
20/11/2012
Des données directement sur le web Un modèle de données de base simple et souple (RDF)
Des assertions sur des ressources :
Utilisation de standards du web Pour nommer les ressources : URI Pour accéder aux ressources : HTTP
Des langages pour construire des modèles de données de plus haut niveau
Un langage de requête puissant : SPARQL
Données liées ?
Ressource sujet
Ressource objetPrédicat
Valeurou
20/11/2012
La plate-forme Datalift
Logiciel open source Java Modulaire et intégrée Des modules qui outillent les différentes étapes (les
« étages de l’ascenseur ») de la donnée brute à la donnée « pub-liée » Conversion des formats bruts (CSV, SQL, XML) vers RDF Choix de vocabulaires pour construire les modèles de
données métier Transformations sur les données RDF Interconnexion des données avec le « LOD Cloud » Accès contrôlé Visualisation Requêtage
20/11/2012
Datalift et l’INSEE
Un projet aux objectifs conformes aux missions de l’Institut
Un intérêt ancien pour le domaine Publication RDF du Code Officiel Géographique depuis
2005 L’occasion d’une collaboration enrichissante
Le rôle de l’INSEE dans Datalift Fournisseur de données Fournisseur de modèles Utilisateur Demandeur Développeur
20/11/2012
Datalift à l’INSEE
Organisation retenue Une plate-forme orientée diffusion pour commencer
Calendrier Janvier 2013 :
Mise en production de la plate-forme Code officiel géographique, nomenclatures
Mi-2013 : données statistiques du recensement À l’étude :
Base permanente des équipements Séries temporelles
À moyen terme Intégration de cette filière dans le projet de refonte de notre
diffusion web