20

Glossaire et cadre général de l'opendata

  • Upload
    voxuyen

  • View
    219

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Glossaire et cadre général de l'opendata
Page 2: Glossaire et cadre général de l'opendata

Guide open data pour les communes - « Glossaire de la donnée publique » - produit & édité par opendata France sous lycence cc by- sa

2

« L’informatique doit être au service de chaque citoyen.

Son développement doit s’opérer dans le cadre de la coopération internationale.

Elle ne doit porter atteinte ni à l’identité humaine, ni aux droits de l’homme,

ni à la vie privée, ni aux libertés individuelles ou publiques. »

Loi Informatique et Libertés : Article 1er

Ce guide et toutes les publications d’Opendata France sont téléchargeables sur :http://www.opendatafrance.net/ressources/

Le présent document « Guide Open Data pour les communes / Glossaire de la donnée publique » est produit et édité par Opendata France.

Il est mis à disposition sous licence Creative Commons : CC By-SA (paternité et partage à l’identique).Rédaction et coordination : Armelle Gilliard, chef de projet en innovations et opendata, La reine Merlin (lareinemerlin.org), avec la participation de Bordeaux Métropole pour les questions juridiques via AEC / Cédric Favre, expert juridique TIC

Comité de lecture : Opendata France et Etalab. Mise en page : Cyrille de Villèle (Ville de Digne-les-Bains).Remerciements : Bertrand Serp (Toulouse métropole), Alain Turby (Bordeaux métropole), Jean-Marie Bourgogne (ODF), Bernadette Kessler (Rennes métropole), Sandrine Mathon (Toulouse métropole), Laure Lucchesi (Etalab), Simon Chignard (Etalab), Charles Népote (La Fing), Sarah Labelle (Université Paris 13), Loic Haÿ (La Fonderie), Hervé Guérin (Carbon Blanc), Jean-François Laplume (AEC), Laurent-Pierre Gilliard (AEC) et tous les membres d’Opendata France.

Page 3: Glossaire et cadre général de l'opendata

Guide open data pour les communes - « Glossaire de la donnée publique » - produit & édité par opendata France sous lycence cc by- sa

3

Edito ....................................................................................................................................................................................... 4

Préface ................................................................................................................................................................................... 5

Préambule ............................................................................................................................................................................. 6

Rappels sur les notions de services publics ........................................................................................................................ 7

1 - Quelles sont les différences entre une information et une donnée ? .......................................................................... 8

2 - Qu’est-ce qu’une donnée publique pour la loi française ? ........................................................................................... 9

3 - Qu’est-ce qu’une donnée numérique ? ........................................................................................................................ 10

4 - Qu’est-ce qu’une donnée ouverte ou libre ? ................................................................................................................ 12

5 - Qu’est-ce qu’une donnée publique ouverte ?............................................................................................................. 12

6 - Qu’est-ce qu’une donnée chaude, une donnée froide ? ............................................................................................. 13

7 - Qu’est-ce qu’une donnée pivot ou de base ou de référence ? .................................................................................... 13

8 - Qu’est-ce qu’une donnée personnelle, une donnée sensible ? .................................................................................. 13

9 - Qu’est-ce qu’une donnée brute, une donnée primaire, une donnée enrichie ? ....................................................... 13

10 - Qu’est-ce qu’une donnée contextualisée, une métadonnée ? ................................................................................. 13

11 - Qu’est-ce qu’une donnée liée ? ................................................................................................................................... 14

Résumé du chapitre : tableau récapitulatif des différentes définitions ......................................................................... 15

SOMMAIRE

Page 4: Glossaire et cadre général de l'opendata

Guide open data pour les communes - « Glossaire de la donnée publique » - produit & édité par opendata France sous lycence cc by- sa

4

ÉDITO

Lorsque les premières collectivités françaises se sont lancées dans l’ouverture des données publiques, il y a plus de 5 ans, elles sont parties d’une feuille blanche et elles ont inventé une démarche. Elles se sont très vite entraidées pour partager leurs

expériences, leurs succès et leurs difficultés. De là est née l’association Opendata France pour mutualiser les efforts, transmettre les bonnes pratiques, rassembler et défendre les acteurs publics.

Aujourd’hui, notre association regroupe près d’une centaine de collectivités. Elle les représente devant les pouvoirs publics et elle accompagne la maturité de l’open data en France par de multiples travaux : capitalisation, normalisation des données, évo-lution et interprétation des licences, sensibilisation des acteurs, rédaction des lois, etc.

Le volet pédagogique nous a semblé un axe d’action prioritaire : accompagner les acteurs publics ou parapublics pour respecter les obligations légales, traduire ces contraintes en de véritables opportunités pour la modernisation de l’action publique, participer à la transformation numérique des territoires. Notre expérience, notre neutralité et notre pluralité nous donnent la légitimité et le devoir d’être au côté des collectivités qui s’intéressent à l’open data.

Ainsi, j’espère que ces guides publiés par Opendata France aideront les acteurs publics désireux de se lancer dans l’ouverture des données publiques et qu’ils trouveront des réponses claires à leurs questions sur un sujet soulevant de nombreuses interrogations d’ordre juridique, technique ou organisationnel.

Je souhaite que cette publication fournisse un guide pratique et simple pour la mise en œuvre d’un projet open data, à partir de l’expérience réussie d’acteurs publics ayant déjà fait cette démarche.

Enfin, comme il s’agit d’un projet dont la dimension politique doit être prioritaire au re-gard des contraintes opérationnelles, j’invite les élus des collectivités à s’emparer de cette superbe opportunité pour se rapprocher des citoyens et des entreprises, pour conduire la modernisation de leur administration et pour témoigner du dynamisme de leur territoire.

Je remercie pour cela les acteurs publics qui ont participé à la rédaction de cet ouvrage et qui ont su traduire nos expériences par des explications claires et des conseils utiles.

Bertrand SerpPrésident d’Opendata France

Vice-président de Toulouse Métropole

ÉDITO

Page 5: Glossaire et cadre général de l'opendata

Guide open data pour les communes - « Glossaire de la donnée publique » - produit & édité par opendata France sous lycence cc by- sa

55

PRÉFACE

Les territoires jouent un rôle moteur dans l’ouverture des données publiques en France. Dès 2010 des villes pionnières (Rennes, Paris, Nantes) ont commencé à ouvrir les premiers portails open data en France. La mission Etalab a été créée l’année suivante. Ces deux

dynamiques se sont enrichies mutuellement. Six ans plus tard, le mouve-ment s’étend à tous les échelons territoriaux, de la commune à la région.Les communes de plus de 3500 habitants sont maintenant tenues par la loi d’ouvrir leurs données. Plus qu’une obligation, c’est une opportunité. Une opportunité pour encourager l’ouverture des données publiques sur l’ensemble du territoire car l’on sait que plus les données seront disponibles de manière homogène, plus leur réutilisation sera aisée pour les citoyens, les associations et les en-treprises. Mais aussi, concrètement, une opportunité pour les élus et les décideurs des communes d’expérimenter de nouvelles relations, plus ouvertes et plus transparentes, de nouvelles formes de dialogue et de concertation avec leurs administrés.

Pour que l’ambition du législateur devienne une réalité, il fallait aussi que les communes disposent d’une vision claire des enjeux et d’une réponse pratique à leurs questions tant techniques que juridiques. Ce guide fait ainsi oeuvre utile en traitant le sujet de l’ouver-ture des données de manière exhaustive.

La mission Etalab, rattachée au Premier ministre, accompagne les territoires qui souhaitent se lancer dans l’ouverture des données publiques. La plateforme ouverte des données publiques data.gouv.fr leur permet ainsi de créer, facilement et gratuitement, un espace pour publier des jeux de données. De Monacia d’Aullène (Corse du Sud, 467 habitants) à Metz Métropole ou Lorient Agglomération (Morbihan, 200 000 habitants), nombre de territoires ont ainsi lancé leur démarche open data à l’aide de notre plateforme. L’initia-tive territoires.data.gouv.fr facilite les premiers pas dans l’open data en proposant, pour chaque commune de France, une première sélection de jeux de données et de référen-tiels nationaux. Data.gouv.fr vise ainsi à fournir un point d’entrée et un catalogue le plus complet possible des données déjà ouvertes, à les mettre en résonance, et renvoie vers les plateformes des collectivités lorsqu’elles existent.

Nos collaborations avec Opendata France sont nombreuses et utiles, nous avons beau-coup à apprendre les uns des autres.

Au moment où la France va prendre, courant 2016, la présidence du Partenariat pour un gouvernement ouvert, il est important de rappeler l’importance de ce partage d’expé-riences, et que la force de notre pays est précisément de combiner une approche natio-nale et une multitude d’initiatives locales. Puisse la lecture de ce guide vous aider à y prendre toute votre part.

Laure Lucchesi Directrice de la mission Etalab

Page 6: Glossaire et cadre général de l'opendata

Guide open data pour les communes - « Glossaire de la donnée publique » - produit & édité par opendata France sous lycence cc by- sa

6

PRÉAMBULEDes cahiers pour un guide open data pour les communes

Ce guide est composé de plusieurs cahiers thématiques ; ce cahier sur la thématique des données en précise les différents termes.

Les autres cahiers abordent la loi et la réutilisation des don-nées publiques, les questions récurrentes et basiques sur l’ouverture des données publiques, la manière de répondre à une demande de données faite à sa commune ou encore comment ouvrir simplement ses données pour une com-mune. L’assemblage de ces différents cahiers constituera un guide qui se veut un corpus pratique, pour les communes, pour saisir les enjeux, opportunités et obligations liés à l’ouverture des données publiques.

Introduction à l’open data

Depuis quelques années, pour peu que vous soyez attentifs aux débats, réflexions et initiatives concernant le numérique en général et l’innovation en particulier, vous n’avez pas pu y échapper : le mot « data » est partout. Il est souvent combiné à d’autres mots (souvent anglais) tels que big data, open data, data science, data centers, forfait data…

À l’origine, data est le pluriel du mot latin « datum » qui se traduit par « cadeau, présent ». Dans notre monde moderne, la langue anglaise l’utilise pour désigner les informations issues d’un environnement informatique, en français on dit simplement « données ».

Dans la suite de ce document, nous privilégierons le mot « donnée » au mot « data », nous ferons une exception pour l’expression « open data ».Les données représentent des informations considérables par leur volume autant que par leurs valeurs et variétés : mé-téo, horaires des transports, nombre de naissances, nombre et emplacement des bacs poubelles, cartes routières et plans de ville, résultats des élections, PIB, PNB et autres indicateurs économiques, etc. Les données sont devenues indispensables et couvrent tous les champs d’activités. Sans elles, pas de statistique, pas de comptabilité, pas d’analyse économique, pas de prospective ni même de commerces en ligne ou de réseaux sociaux !

Collectées et gérées par des entreprises privées ou des insti-tutions publiques, les données sont aussi produites par tout un chacun. Il est difficile d’évaluer toutes les données que nous générons tous les jours : des données sont produites volontairement et involontairement. A chaque utilisation d’un téléphone portable, à chaque connexion sur internet, à chaque inscription sur un service en ligne, de notre nais-sance à notre mort, nous laissons des traces directement ou indirectement et renseignons des données sur nos compor-tements, nos situations familiales, nos achats… Des millions d’informations sont ainsi générées. Leur collecte, stockage et traitement sont amplifiés et favorisés par les avancées technologiques de l’informatique et des sciences de l’infor-mation.

Dans notre monde contemporain profondément transformé par l’économie de la connaissance, être capable d’acquérir, de traiter, de diffuser ces données est devenu un enjeu stra-tégique majeur tant les données elles-mêmes constituent le carburant indispensable à l’innovation et la création de valeur.

C’est bien dans ce cadre général que s’inscrit le mouvement d’open data.

L’open data par l’exemple Données de transport à Bordeaux Métropole

La métropole a ouvert ses données sur la circulation, sur les vélos en libre service, sur les parkings en 2013. La société Qucit (www.qucit.com), crée en 2014, est spécialisée sur l’analyse pré-dictive des données. Elle prédit notamment, le temps pour trou-ver un stationnement dans les rues de Bordeaux. Kéolis, le délé-gataire métropolitain aux transports, a intégré l’offre Quicit à son calculateur d’itinéraire qui permet désormais de comparer le temps de déplacement en transport en commun au temps de déplacement en voiture augmenté du temps prévu pour trou-ver une place de stationnement. Et de montrer qu’ainsi, bien des fois, le transport en commun est gagnant. Ce qui va dans le sens des orientations de la métropole. En libérant de la donnée, la collectivité a favorisé l’innovation, la création d’entreprise et la prise de conscience de l’intérêt du transport collectif.

Page 7: Glossaire et cadre général de l'opendata

Guide open data pour les communes - « Glossaire de la donnée publique » - produit & édité par opendata France sous lycence cc by- sa

77

Rappels sur les notions de services publicsLe service public concerne l’accomplissement de toute acti-vité prise en charge par une personne publique pour satis-faire l’intérêt général. L’intérêt général est la volonté de la population tout entière, elle dépasse la somme des intérêts particuliers et s’impose à l’ensemble des individus. Ainsi, le service public apparaît comme une notion évolutive. De ce fait son périmètre est flou. Toutefois, il y a des services publics dits obligatoires pour les communes sont générale-ment les services nécessaires à la sécurité et à l’hygiène : > Le système d’assainissement collectif : le tout à l’égout et l’installation d’épuration > L’entretien des voies communales, > La collecte et l’élimination des déchets1

> Le service des pompes funèbres

Tous les autres services publics sont facultatifs. Ils ne peuvent être créés que s’ils remplissent les conditions suivantes > bénéficier à l’intérêt local, > respecter les attributions des autres personnes publiques, > ne pas porter atteinte au principe de la liberté du commerce et de l’industrie, sauf carence de l’initiative privée.

Les missions de services publiques portent généralement sur les autres thématiques suivantes : l’action sociale et la santé, l’aménagement du territoire et l’urbanisme, la cut-lure, le développement économique, l’enfance et l’ensei-gnement, l’environnement et le développement durable, la sécurité, les transports…

1Code général des collectivités territoriales, Art. L. 2321-2, http://frama.link/CGCT_L2321-22http://frama.link/competences_collterr

L’open data par l’exemple Lancement de l’open data

à Brocas, 770 habitants

Pour Brocas, commune de 773 habitants dans les Landes (40), en avril 2013, l’ouverture des données lancée sur un week end a été l’occasion de gagner en notoriété et en visi-bilité (Datacon-nexion 5, Interconnectés 2015…), d’ouvrir 25 jeux de données sur les 100 fichiers communaux recensés, de renseigner avec les habitants la carte Open Street Map et de créer le plan de la commune, de se mettre en capacité de mettre à disposition son Plan Local d’Urbanisme qui facilite l’étude de l’extension de l’habitat des particuliers et de mettre à disposition toutes les délibérations du conseil municipal.

Compétences des communes2

Pour une compréhension rapide des compétences des collectivités territoriales.

Page 8: Glossaire et cadre général de l'opendata

Guide open data pour les communes - « Glossaire de la donnée publique » - produit & édité par opendata France sous lycence cc by- sa

88

1 - Quelles sont les diffé-rences entre une informa-tion et une donnée ?Dans bien des situations du langage usuel les mots informa-tions et données sont interchangeables. Par exemple : « En regardant par la fenêtre, l’information était claire, la météo ne nous permettait plus de sortir en sandales » est équivalente à la phrase « En regardant par la fenêtre, les données étaient claires, la météo ne nous permettait plus de sortir en sandales. »

« Les dernières données de l’économie rendent la France opti-miste » est une phrase interchangeable avec « Les dernières informations de l’économie rendent la France optimiste. »…« Une information est un ensemble de données agrégées en vue d’une utilisation par l’homme.3»

Lorsqu’on s’intéresse plus spécifiquement aux données, les deux notions sont distinctes : « il fait beau » est une infor-mation. Elle est construite à partir d’une ou plusieurs don-nées : la température, la pression atmosphérique, la force et l’orientation du vent, le degré d’humidité. Il est à noter, que dans cet exemple, la géolocalisation des données, ne four-nira pas toujours la même information.

3Administrateur général des données Rapport au Premier ministre sur la gou-vernance de la donnée 2015, page 13, http://frama.link/AGD_2015 4Illustration issue de l’article « Quel sens donner aux mots « Données », « Infor-mations », « Connaissances » et « Compétences » ? », http://frama.link/Redsen_voc_data

« Il fait beau » en Alaska ou à Tahiti, des données différentes, une même information.

Page 9: Glossaire et cadre général de l'opendata

Guide open data pour les communes - « Glossaire de la donnée publique » - produit & édité par opendata France sous lycence cc by- sa

99

2 - Qu’est-ce qu’une donnée publique pour la loi française ?Une « donnée publique » est nécessairement contenue dans des documents administratifs. La loi ne parle pas de don-née publique mais de « documents administratifs » et « d’informations publiques5 » . Au sens du Code des rela-tions entre le public et l’administration (CRPA)6 , la seule condition légale à la qualification juridique de « documents publics » réside dans le fait que ceux-ci soient « produits ou reçus, dans le cadre de leur mission de service public ».Ceci vaut « quels que soient leur date, leur lieu de conserva-tion, leur forme et leur support », qu’ils soient produits ou reçus « par l’État, les collectivités territoriales ainsi que par les autres personnes de droit public ou les personnes de droit privé chargées d’une telle mission. »L’article précise enfin que cela concerne notamment des documents tels que « les dossiers, rapports, études, comptes rendus, procès-verbaux, statistiques, instructions, circulaires, notes et réponses ministérielles, correspondances, avis, prévisions et décisions. »Par exemple, le code source d’un logiciel développé par une administration est considéré par la Commission aux

Documents Administratifs7 comme un document adminis-tratif.Tel que cela est détaillé dans l’illustration ci-contre, les docu-ments administratifs sont composés des documents com-municables et non-communicables. Les documents non communicables sont ceux qui contiennent des données personnelles, des documents sur lesquels des droits de propriétés intellectuelles s’appliquent, des documents présentant des risques pour la sécurité publique et celle des personnes.Il peut y avoir plusieurs cas de figures pour qu’un document non-communicable le deviennent : il bénéficie d’une autori-sation en vertu d’une loi, les données qui font obstruction à sa communicabilité sont occultées.Ces points sont vus d’une façon plus approfondie dans le cahier « Les lois régulant la donnée publique ».

Souvent les personnes pensent qu’une donnée publique est une donnée produite par le public ou une donnée sur une ou des personnes ; non, une donnée publique est une donnée en lien avec les missions de services publics. Ce sont les missions produites par des acteurs tels l’Etat, les col-lectivités territoriales (régions, départements, métropoles, communautés de communes…), les Etablissements Publics de Coopération Intercommunale (EPCI), les syndicats mixtes, les Etablissements Publics Administratifs (EPA), les institu-tions publiques…

Documents non communicables

Type de documents

• Présence de données personnelles

• Présence de droits de propriété

intellectuelle détenus par des tiers

• Données présentant un risque

pour la sûreté de l’État,

la sécurité publique ou la sécurité

des personnes

Documentsadministratifs

communicablesau sens de la loi Cada

Situation des documents• Documents rendus publics en vertu

d’une loi• Documents déjà rendus publics (sans prise en compte du support)• Documents publiés par leur(s propriétaire(s)• Documents disponibles auprès de leur(s) détenteur(s)

Formats de diffusion possibles• Présentation publique

• Publication papier• Téléchargement dans des formats

numériques fermés (souvent auformat.pdf...)

• Téléchargement dans des formatsnumériques ouverts (selon les

principes de l’open data - souventsur un portail dédié)

D o c u m e n t s a D m i n i s t r at i f s *

5 Guide de demande de données publiques auprès des collectivités » édité par Bordeaux métropole et AEC, version 1, octobre 2014, page 7, http://frama.link/GuideOD_reutilisateurs 6 Code des relations entre le public et l’administration, article L300-2 :

http://frama.link/CRPA_L300-2 7Voir par exemple l’avis de la Cada N° 2012-4254 rendu le 06 décembre 2012 (http://cada.data.gouv.fr/20124254/) et avis N° 2014-4758 rendu le 08 janvier 2015 (http://cada.data.gouv.fr/20144578/)

* Schéma expliqué dans le document : Glossaire de la donnée publique de l’as-sociation Open Data France, page 9,http://www.opendatafrance.net/ressources/

Source du schéma : Guide de demande de données publiques auprès des collec-tivités » édité par Bordeaux métropole et AEC, version 1, octobre 2014, page 7, http://frama.link/GuideOD_reutilisateurs

Page 10: Glossaire et cadre général de l'opendata

Guide open data pour les communes - « Glossaire de la donnée publique » - produit & édité par opendata France sous lycence cc by- sa

10

Les missions de services publics concernent les activités dé-volues à l’Etat (administration générale, sécurité intérieure, justice, défense, monnaie, finances publiques, affaires étran-gères et diplomatie). Ces missions sont dites régaliennes car ce sont les missions détenues anciennement par le roi.A ces missions régaliennes s’ajoutent les missions d’état-civil, d’action sociale et de santé, d’administration locale, d’aménagement du territoire, de développement écono-mique, de domanialité, d’enfance et d’enseignement, d’envi-ronnement, d’énergie, de développement durable, de police et de sécurité locale, de recensement démographique, d’in-cendies et de secours, de transports publics, de gestion de réseaux, de gestion de déchets ménagers, de communica-tion audiovisuelle.

3 - Qu’est-ce qu’une donnée numérique ?L’enrichissement du vocabulaire informatique8 définit la donnée comme la « représentation d’une information sous une forme conventionnelle destinée à faciliter son traite-ment (en anglais : data). »

A cette définition officielle, nous préférons celle de l’admi-nistrateur général des données9 : « une donnée numérique est la description élémentaire de nature numérique, repré-sentée sous forme codée, d’une réalité (chose, évènement, mesure, transaction, etc.) en vue d’être : > collectée, enregistrée, > traitée, manipulée, transformée > conservée, archivée > échangée, diffusée, communiquée.Selon leurs destinations, les données peuvent être « fermées » (réservées à quelques personnes ou à des organisations), « partagées » ou « ouvertes » à tous utilisateurs. Qu’elles soient partagées ou ouvertes, les conditions d’utilisation des données doivent être contractuellement claires : licences, conditions générales d’utilisation…

Une autre confusion usuelle se fait entre une information numérisée et une donnée : > une information numérisée peut être copiée et collée informatiquement ; c’est le cas pour un texte dans une page internet ou l’extrait d’un document au format PDF. Cependant, sous cette forme, les informations ne peuvent pas directement être traitées dans un logiciel pour en obtenir de nouveaux résultats (calculs, représentations graphiques…). Les informations sous forme numérisée ne sont donc pas nécessairement des données. > une donnée peut faire l’objet d’un traitement automatisé. Par exemple, elle peut être classée et stockée dans une base de données ou un tableau. Dans ce cas, les données seront organisées dans un tableur (Excel, Calc) dans lequel la première ligne est dédiée aux en-têtes de colonnes et les lignes successives contiennent toutes des informations. Chacune des cellules du tableur a une coordonnée (ligne, colonne), chacune de ces cellules contient une donnée.

Lorsque l’information est organisée en donnée, son inter-prétation peut prendre plusieurs formes : des points sur une carte, un affichage de chiffres ou de lettres dans un texte… Dans l’illustration page suivante, vous avez à gauche un fi-chier de type tableur, au-dessous des points sur une carte. Il s’agit de la même donnée qui, une fois est traitée par un logiciel de type tableur (image du haut), une autre fois est traitée avec un logiciel de représentations cartographiques (image du bas).Si je décide de modifier dans l’un de ces logiciels une donnée, les traitements informatiques, qui en résultent, se feront au-tomatiquement. Admettons que j’utilise un logiciel de type tableur et que je change le texte de la cellule « Maison de convalescence des Lauriers » par « Maison de convalescence des Cerises », la mise à jour de toutes mes cartes se fera auto-matiquement avec l’entrée de cette nouvelle donnée.Ainsi, une donnée peut être dans des fichiers de différents formats (ou extensions) : .csv (tableur)10, .dwg (cartographie), ods (tableur)… Cela dépend du logiciel dont elle est issue11.

10

8Arrêté du 22 décembre 1981 relatif à l’enrichissement du vocabulaire informa-tique : http://frama.link/VOC_arrete_22dec1981 9« L’administrateur général des données (AGD) coordonne l’action des administrations en matière d’inventaire, de gouvernance, de production, de circulation et d’exploitation des données par les administrations », http://agd.data.gouv.fr/la-fonction/

10« Fichier contenant des données dans un format textuel. Les données sont ainsi lisibles par un très grand nombre d’outils, - les tableurs, mais aussi de simples éditeurs de texte - et plus faciles à traiter par des programmes ». 11Vous trouverez une liste pratiquement exhaustive des extensions de fichiers dans cet article : http://frama.link/Wikipedia_ext_fichiers

Page 11: Glossaire et cadre général de l'opendata

Guide open data pour les communes - « Glossaire de la donnée publique » - produit & édité par opendata France sous lycence cc by- sa

1111

Un Système d’Information Géographique (SIG) contient généralement plusieurs sortes d’objets géographiques qui sont organisés en thèmes que l’on affiche souvent sous forme de couches. Chaque couche contient des objets de même type (routes, bâtiments, cours d’eau, limites de communes, entreprises,...). Chaque objet est constitué d’une forme (géométrie de l’objet) et d’une description, appelé aussi sémantique. Source : j.mp/DefinitionCouche

Données en open Data sur une couche D’équipements publics

Données au format .csV

Un fichier .CSV est un fichier texte. Chaque ligne du texte correspond à une ligne du tableau et les virgules corres-pondent aux séparations entre les colonnes. Les portions de texte séparées par une virgule correspondent ainsi aux contenus des cellules du tableau (http ://fr.wikipedia.org/wiki/.csv).

Ident Nom Thème Sous thème

249B0041 Maison de convalescence des Lauriers

B : Santé et action sociale B1 : Hôpital ou clinique

249B0042 Clinique des Gravières du C.H.S. de Cadillac

B : Santé et action sociale B1 : Hôpital ou clinique

249B0043 IME Les Joualles - Association du Prado 33

A : Enseignements divers et formation

A11 : Enseignement spécialisé

249B0044 Association des Oeuvres Girondines de Protection de l’Enfance (AOGPE) Service de tutelle

B : Santé et action sociale B3 : Association à caractère social ou médico-social

Source : équipements publics, data.bordeaux-metropole.fr

Données au format .DWG

Un fichier .DWG est un fichier de format binaire utilisé pour stocker des données et métadonnées, 2D et 3D.C’est le format natif de AutoCAD. Le .DWG est également supporté de manière non native par beaucoup d’applications DAO (Dessin Assisté par Ordinateur) (http ://fr.wikipedia.org/wiki/DWG).

Source : équipements publics, data.bordeaux-metropole.fr

Page 12: Glossaire et cadre général de l'opendata

Guide open data pour les communes - « Glossaire de la donnée publique » - produit & édité par opendata France sous lycence cc by- sa

12

12OpenDataSupport « Licences pour les données et les métadonnées » : http://frama.link/OpenDataSupport_Licences 13Idem à la précédente.

14OpenDefinition – « that is, it can be freely used, reused and redistributed by anyone », http://frama.link/VOC_open_data15OpenDataSupport « Données Publiques Ouvertes & la directive “PSI” », http://frama.link/OpenDataSupport_Donnees_publiques

4 - Qu’est-ce qu’une donnée ouverte ou libre ?« Donnée ouverte » est la traduction littérale de l’expression « open data ». Cette notion n’est pas juridique, mais plutôt un standard de fait dans la communauté internationale des producteurs et usagers de données.« Une donnée ou un contenu est ouvert si n’importe qui peut librement l’utiliser, le réutiliser, et le redistribuer – à condition seulement, et au maximum, de devoir en attribuer la source »12. Une utilisation libre n’est pas synonyme d’une utilisation gratuite comme nous le verrons plus tard.

« Selon l’ “Open Knowledge Foundation” cela signifie: > « Disponibilité et accès : les données doivent être disponibles dans leur ensemble et à un tarif ne dépassant pas le coût raisonnable de reproduction, de préférence par téléchargement sur Internet. Les données doivent également être disponibles sous une forme commode et modifiable. > La réutilisation et la redistribution : les données doivent être fournies dans des conditions qui permettent la réutilisation, la redistribution, ainsi que la possibilité de mélanger celles-ci avec d’autres ensembles de données. »13

> Participation universelle : chacun doit être en mesure d’utiliser, réutiliser et redistribuer. Il ne doit y avoir aucune discrimination sur des thématiques ou des personnes, comme, par exemple, des restrictions « non commerciales » ou des restrictions d’utilisation à certaines fins (par exemple uniquement dans l’éducation).

5 - Qu’est-ce qu’une donnée publique ouverte ?Il s’agit d’une part d’une terminologie standard de fait uti-lisée par la communauté internationale de l’open data, d’autre part d’une formulation juridique et européenne.En ce qui concerne la terminologie standard de fait, les don-nées publiques ouvertes ont les trois critères suivants : > des données produites ou reçues dans le cadre d’une mission de service public ; > des données qui sont ouvertes au sens de l’Open définition : « Ce qui peut être utilisé librement, réutilisé et redistribué par tout le monde »14

> des données qui ne sont pas sensibles ou privées15 (Voir dans ce document, le paragraphe 8 : Qu’est-ce qu’une donnée personnelle, une donnée sensible ?).

Avantage pour l’informatique• Rationalisation de l’architecture• Rationalisation des coûts• Pérennité, agilité et modularité du système d’information• Qualité des informations• Architecture du SI et gestion des données plus simples

Objectifs pour le métier• Sensibiliser les acteurs• Identifier les données de réfé-rences et leurs propriétaires• Identifier les processus clés liés à l’entretien de ces données• Identifier les besoins en qualité des utilisateurs de ces données

Objectifs pour l’informatique• Sensibiliser les acteurs• Identifier les applications / référentiels maître des données de références• Identifier les applications qui collectent ces données• Identifier les applications qui exposent ces données, leurs services, leurs formats...

Avantages pour le métier• Des informations pertinentes, au bon niveau de qualité et à jour• Efficacité opérationnelle et meilleur pilotage des activités• Collaboration simplifiée• Meilleure exploitation de l’information

aVantaGe et objectifs D’une GouVernance Des Données

Page 13: Glossaire et cadre général de l'opendata

Guide open data pour les communes - « Glossaire de la donnée publique » - produit & édité par opendata France sous lycence cc by- sa

13

6 - Qu’est-ce qu’une donnée chaude, une donnée froide ? Une donnée « froide » est « une donnée dont la valeur ne change pas dans le temps. Par exemple : une liste électorale [du passé] est une donnée froide. La circulation à un instant t dans une ville est, par opposition, une donnée « chaude ».16

7 - Qu’est-ce qu’une donnée pivot ou de base ou de référence ?Les données de référence, aussi appelées « données pivots » ou « données de base », sont « des données utilisées par un grand nombre d’acteurs, qui y recourent fréquemment, comme par exemple le code officiel géographique, le ré-pertoire SIRENE, le cadastre, etc.) »17. Ce sont des données « ayant valeur de référence pour plusieurs métiers/écosys-tèmes, permettant ainsi de croiser ou relier des données. Le code postal est une donnée pivot. »18

« La donnée de référence possède des similarités avec la monnaie, qui est produite et garantie par l’État, pour per-mettre des échanges entre acteurs et le bon fonctionne-ment de l’économie. »19 A ce sujet, voir l’illustration donnée pour le cadastre.

Avantages et objectifs d’une gouvernance des données20

8 - Qu’est-ce qu’une donnée personnelle, une donnée sensible ?Une donnée personnelle est une donnée qui permet d’iden-tifier, directement ou indirectement, une personne phy-sique. Il s’agit d’une catégorie de données protégées par la loi informatique et libertés21 ce sont les « données à carac-tère personnel ». Cela comprend entre autres données, nom, adresse, numéro de téléphone, famille, vie sociale, géolocalisation…

Une donnée sensible est une donnée personnelle qui concerne l’intimité d’une personne physique. C’est égale-ment un type de données protégées par la loi informatique

et libertés22. Cela comprend les données sur les origines ra-ciales ou ethniques, les opinions politiques, philosophiques ou religieuses, l’appartenance syndicale des personnes, la santé ou à la vie sexuelle. Une donnée sensible n’est publiable dans aucun cas de figure.

Les données personnelles et sensibles appartiennent à la vie privée d’une personne.

9 - Qu’est-ce qu’une donnée brute, une donnée primaire, une donnée enrichie ?Les données brutes (aussi appelées données primaires) sont « les données non interprétées émanant d’une source pri-maire, ayant des caractéristiques liées à celle-ci et qui n’ont été soumises à aucun traitement ou toute autre manipul-tion.23» Une donnée enrichie est une donnée dont la pertinence s’est vue améliorée par un traitement : > Amélioration du jeu de données par l’ajout d’un autre jeu de données, > Retraitement de la donnée suite à expertises, > Croisement de différentes données…

« Pour autant, parce qu’elle est construite par l’homme, une donnée est forcément le résultat d’un traitement, d’une ac-tion. Il est donc toujours important d’interroger le mode de production de chaque donnée.24»

10 - Qu’est-ce qu’une donnée contextualisée, une métadonnée ?Les données sont parfois enrichies par des informations de contextes qui peuvent être portées à connaissance dans un fichier texte : les critères de construction du jeu de don-nées sont clairement expliqués, les différents intitulés de colonnes sont expliqués, les codes utilisés sont traduits…

Mais le travail sera d’autant plus exploitable s’il est traduit en métadonnées (littéralement des données sur les données).« Les métadonnées fournissent des informations permettant de comprendre des données (documents, images, bases de

13

16http://infolabs.io/mots-infolab17Administrateur général des données Rapport au Premier ministre sur la gouvernance de la donnée 2015, page 17, http://frama.link/AGD_2015 18http://infolabs.io/mots-infolab 19Administrateur général des données Rapport au Premier ministre sur la gouvernance de la donnée 2015, page 17, http://frama.link/AGD_2015 20Cadre Commun d’Architecture des Référentiels de données, http://frama.link/GOUV_archi_ref_donnees21Loi relative à l’informatique, aux fichiers et aux libertés, n° 78-17 du 6 janvier 1978, article 2, modifié par Loi n°2004-801 du 6 août 2004 - art. 1 JORF 7 août 2004, http://frama.link/LIL_2

22Loi relative à l’informatique, aux fichiers et aux libertés, n° 78-17 du 6 janvier 1978, article 8, Modifié par LOI n°2016-41 du 26 janvier 2016 - art. 193, http://frama.link/LIL_823http://frama.link/Wikipedia_format_donnees 24http://infolabs.io/mots-infolab 25OpenDataSupport « Introduction à la gestion des données » : http://frama.link/OpenDataSupport_Gestion_donnees 26Idem à la précédente27http://frama.link/Wikipedia_donnees_ref

Page 14: Glossaire et cadre général de l'opendata

Guide open data pour les communes - « Glossaire de la donnée publique » - produit & édité par opendata France sous lycence cc by- sa

14

28Parfois appelée Linked data.29OpenDataSupport « Données Publiques Ouvertes & la directive “PSI” », http://frama.link/OpenDataSupport_Donnees_publiques 30Illustration issue de la présentation de Mathieu d’Aquin, « Le Web séman-tique et les données liées : principes et applications », dec. 2012, http://frama.link/M_Aquin_donnees_liees

données), des concepts (par exemple, les systèmes de classi-fication) et des entités du monde réel (par exemple, les per-sonnes, les organisations, les lieux, peintures, produits). »25

Elles peuvent être des : > « Métadonnées descriptives, décrivant une ressource à des fins de découverte et d’identification. > Métadonnées structurelles, par exemple, des modèles de données et des données de référence. > Métadonnées administratives, qui renseignent afin d’aider à la gestion d’une ressource.26» Les données de références sont des métadonnées offi-cielles27. Il existe différentes façons de faire pour produire ces métadonnées, généralement on s’appuie sur des recom-mandations existantes, des normalisations. Il existe de nom-breuses formes de normalisations (Dcat, W3C, ISO…).

11 - Qu’est-ce qu’une donnée liée ? « Les données liées28 consistent en la publication et la connexion de données structurées sur le web, en utilisant des technologies web standards pour créer des connexions lisibles par ordinateur, permettant aux données provenant de différentes sources d’être connectées et interrogées, contribuant ainsi à une meilleure interprétation et analyse.29»

Le lien se fait par les métadonnées ou les en-têtes de colonne.

Linked Data / Le Web des données liées

Internet / Le réseau

Le Web

les Données liées30

Page 15: Glossaire et cadre général de l'opendata

Guide open data pour les communes - « Glossaire de la donnée publique » - produit & édité par opendata France sous lycence cc by- sa

1515

Tableau récapitulatif des différentes définitions :

notions clés explications

Donnée / Information 22° / il fait beau

Donnée publique (CRPA) Document produit ou reçu dans le cadre d’une mission de service public (terme juridique français)

Donnée numérique ou informatique Le contenu d’une cellule informatique qui a des coordonnées (x,y)

Donnée ouverte ou libre Donnée à minimum disponible, accessible, et librement réutilisable (pas de définition officielle, traduction littérale d’« open data » ; peut couvrir plusieurs notions ; terme à dimension internationale). L’avantage de ce terme est qu’il est générique, le désavantage est qu’il recouvre un périmètre flou.

Donnée publique ouverte Donnée ouverte issue d’une administration (terme à dimension internationale)

Donnée froide / chaude Donnée statique / dynamique (terme informatique)

Donnée pivot, de base, de référence Donnée utilisée par un grand nombre d’acteurs ayant valeur de référence pour plusieurs métiers/écosystèmes

Donnée personnelle / sensible Donnée qui identifie une personne de manière générale ou intime (termes juridiques français)

Donnée brute, primaire, enrichie Donnée sans traitement / avec traitement (terme technique et peu précis)

Donnée contextualisée et métadonnée Les deux termes sont des données documentées. Les métadonnées sont une forme de documentation technique de la donnée (terme technique)

Données liées Des données qui ont des métadonnées reliées entre elles

Résumé du chapitre

Page 16: Glossaire et cadre général de l'opendata

Guide open data pour les communes - « Glossaire de la donnée publique » - produit & édité par opendata France sous lycence cc by- sa

16

.....................................................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................

. . .. . .. . .. . .. . .. . .. . .. . .. . .. . .. . .. . NOTES

Page 17: Glossaire et cadre général de l'opendata

Guide open data pour les communes - « Glossaire de la donnée publique » - produit & édité par opendata France sous lycence cc by- sa

17

.....................................................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................

. . .. . .. . .. . .. . .. . .. . .. . .. . .. . .. . .. . NOTES

Page 18: Glossaire et cadre général de l'opendata

18

Guide open data pour les communes - « Glossaire de la donnée publique » - produit & édité par opendata France sous lycence cc by- sa

ASSOCIATIONOPENDATA FRANCE

L’association Opendata France, créée le 9 octobre 2013 à Toulouse, a pour but de regrou-per et soutenir les collectivités engagées activement dans une démarche d’ouverture des données publiques et de favoriser toutes les démarches entreprises par ces collectivités dans le but de la promotion de l’open data.

L’association Opendata France (ODF) se donne comme objectifs :

> d’apporter à ses membres les informations, conseils ou autres soutiens nécessaires à l’ouverture des données publiques ; > de favoriser les négociations avec l’ensemble des partenaires nationaux ou internationaux, notamment avec les ministères concernés, les instances de régulation et les différents acteurs économiques du secteur ; > de favoriser les productions communes par des groupes de travail ou ateliers sur des thèmes définis en commun comme devant apporter des éléments de réponse aux questions qui se posent sur l’open data et sa mise en œuvre ; > de participer au développement du mouvement open data par toutes actions de communication (conférence…), valorisation, formation et accompagnement ; > de représenter ses membres auprès de toute autorité publique et privée dans le but d’assurer la défense des intérêts matériels et moraux de ses membres ; > et de mettre en œuvre tous les autres moyens susceptibles d’être utilisés pour concourir à la réalisation de l’objet de l’association.

Points communs entre les collectivités :

> Toutes les collectivités membres d’ODF et celles qui vont rejoindre l’association ont pour volonté d’ouvrir leurs données. > Des membres associés (non collectivités mais actifs dans l’ouverture des données) peuvent adhérer à ODF. > Tout membre affiche la même volonté de développer l’ouverture des données publiques à des fins de transparence démocratique et de développement économique. > Tout membre travaille à ouvrir le plus de jeux de données similaires dans la mesure du possible.

Page 19: Glossaire et cadre général de l'opendata
Page 20: Glossaire et cadre général de l'opendata