Transcript

38

01bu

sin

ess

&te

chn

oI8

/03/

2012

I01n

et-e

ntre

pris

es.fr

opInIons

CARTE BLANCHE à…

administrations dans le monde, maispeut-être plus encore à cause d’une orga-nisation hiérarchique et d’un fort soucide confidentialité, l’Administration fran-çaise n’est ni préparée, ni organisée, ni,a fortiori, équipée pour difuser et/ourendre réutilisables ses informations.Cela n’entre pas dans la mission pourlaquelle elle a été créée. Il y a donc unabîme entre la réalité et les désirs desacteurs politiques européens ou français,relayés par de nombreuses associationsen France, de disposer de données dansun « format lisible par la machine etaccompagnées de métadonnées ».Comment, alors, permettre aux admi-nistrations de diffuser – rapidement,dans un format réutilisable et au plusjuste coût – leurs informations ? Pourrésorber ce goulet d’étranglement consti-tué par la question du format, nousproposons la création d’une structuretechnique centralisée, sorte de « datafactory mutualisée », chargée de collecterles données en l’état, c’est-à-dire sansimposer à l’Administration un quelcon-que changement ou investissement, puis

Comment exploiter la mine d’ordes données publiques

« Nous proposons une usineinterministérielle d’extractionet de conversion des données »

dr

Denis Berthault, coanimateur du groupe« donnéespubliques »auGroupementfran-çaisdesindustriesdel’information,s’interrogesur les moyens d’améliorer, au moindre coût,la qualité des données sans attendre quel’administration ait les outils nécessaires.

Avec la création d’Etalab, la tarificationdes données publiques devient un sujettabou. Certes, les textes encadrant laréutilisation des informations publiques,qu’ils soient actuels (directive de 2003,loi de 1978, décret de mai 2011) ou à venir(projet de révision de la Commissioneuropéenne), autorisent explicitementcette tarification. Toutefois, nombreuxsont ceux qui pensent que, l’impôt ayantdéjà payé la production des données, ilest anormal que la réutilisation des in-formations publiques soit tarifée.Hélas, si l’impôt a bien financé la produc-tion, il n’a que très rarement subventionnéla difusion et encore moins les moyensde rendre réutilisables ces données. Pourcomprendre le problème, il suffit de re-garder les sites publics (ministères, établis-sements publics, autorités administra-tives...) : les informations textuelles sontrestituées en PDF, un format propriétairequi interdit toute réutilisation, les don-nées tabulaires, en format propriétaire(Excel). Cette tendance se retrouve, biensûr, sur Data.gouv.fr où moins de 1 % desdonnées est en format ouvert.

Une structure centralisée pourrésoudre le problème du formatCe constat soufre, évidemment, d’ex-ceptions : des administrations dont ladifusion a toujours fait partie intégrantede la mission (Dila, IGN, Inpi, Insee,Météo France…) se sont depuis unevingtaine d’années organisées pour re-diffuser leurs données. Quelquesadministrations traditionnelles s’y sontrécemment essayées (Finances, Intérieur,Justice…), avec des bonheurs divers etaprès des investissements trop impor-tants. Comme l’immense majorité des

de les convertir, à moindre coût, dansdes formats correspondant aux besoinsdes réutilisateurs. Cette usine de conver-sion de données serait interministérielle,permettant à la fois aux administrations,qu’elles soient centrales ou décentrali-sées, riches ou pauvres, de développer denouvelles applications répondant à leursbesoins propres, tout en favorisant laréutilisation de leurs informations.Pour traiter et élever le niveau de servicesur les données – qu’elles soient ou nondéjà difusées –, cette structure devraiten priorité s’interfacer avec les sitespublics existants à l’échelon national(dont Data.gouv.fr), voire à l’échelonlocal. La « data factory » proposerait desfonctionnalités « à la demande » detransformation de format, d’ajout demétadonnées, voire d’anonymisation oude nettoyage d’informations. Elle seraitaussi en mesure de proposer des servicesde stockage, d’intégration et d’accès auxdonnées (API, services web…).

Le financement par la taxe ?Ainsi, cette « data factory » permettraità la sphère publique de disposer d’unestructure habilitée à stocker, amélioreret difuser les données publiques ou-vertes françaises. Comment financerune telle structure? Très simplement !En prélevant une taxe (25 % ?) sur lechifre d’afaires perçu par les adminis-trations qui vendent leurs informations.Il est en efet paradoxal que seules lesadministrations disposant de donnéesvendables retirent 100 % des revenusalors qu’une vraie politique d’open dataconsiste justement à mettre à dispositionun maximum d’informations, en lais-sant au marché (entreprises, associa-tions, développeurs…) le soin de déve-lopper des services autour.La France aurait alors l’opportunité de sedoter de modalités d’accès communes àtoutes les données libérées dans l’Hexa-gone, gage d’efficacité et d’économiesd’échelle pour tous les réutilisateurs. M

Denis berthault

01H_2120_038_Op4.indd 38 01/03/12 10:52