1
38 01BUSINESS & TECHNO I 8/03/2012 I 01net-entreprises.fr OPINIONS CARTE BLANCHE à… administrations dans le monde, mais peut-être plus encore à cause d’une orga- nisation hiérarchique et d’un fort souci de confidentialité, l’Administration fran- çaise n’est ni préparée, ni organisée, ni, a fortiori, équipée pour difuser et/ou rendre réutilisables ses informations. Cela n’entre pas dans la mission pour laquelle elle a été créée. Il y a donc un abîme entre la réalité et les désirs des acteurs politiques européens ou français, relayés par de nombreuses associations en France, de disposer de données dans un « format lisible par la machine et accompagnées de métadonnées » . Comment, alors, permettre aux admi- nistrations de diffuser – rapidement, dans un format réutilisable et au plus juste coût – leurs informations? Pour résorber ce goulet d’étranglement consti- tué par la question du format, nous proposons la création d’une structure technique centralisée, sorte de « data factory mutualisée », chargée de collecter les données en l’état, c’est-à-dire sans imposer à l’Administration un quelcon- que changement ou investissement, puis Comment exploiter la mine d’or des données publiques « Nous proposons une usine interministérielle d’extraction et de conversion des données » DR DENIS BERTHAULT, coanimateur du groupe « données publiques » au Groupement fran- çaisdesindustriesdel’information,s’interroge sur les moyens d’améliorer, au moindre coût, la qualité des données sans attendre que l’Administration ait les outils nécessaires. Avec la création d’Etalab, la tarification des données publiques devient un sujet tabou. Certes, les textes encadrant la réutilisation des informations publiques, qu’ils soient actuels (directive de 2003, loi de 1978, décret de mai 2011) ou à venir (projet de révision de la Commission européenne), autorisent explicitement cette tarification. Toutefois, nombreux sont ceux qui pensent que, l’impôt ayant déjà payé la production des données, il est anormal que la réutilisation des in- formations publiques soit tarifée. Hélas, si l’impôt a bien financé la produc- tion, il n’a que très rarement subventionné la difusion et encore moins les moyens de rendre réutilisables ces données. Pour comprendre le problème, il suffit de re- garder les sites publics (ministères, établis- sements publics, autorités administra- tives...): les informations textuelles sont restituées en PDF, un format propriétaire qui interdit toute réutilisation, les don- nées tabulaires, en format propriétaire (Excel). Cette tendance se retrouve, bien sûr, sur Data.gouv.fr où moins de 1 % des données est en format ouvert. Une structure centralisée pour résoudre le problème du format Ce constat soufre, évidemment, d’ex- ceptions: des administrations dont la difusion a toujours fait partie intégrante de la mission (Dila, IGN, Inpi, Insee, Météo France…) se sont depuis une vingtaine d’années organisées pour re- diffuser leurs données. Quelques administrations traditionnelles s’y sont récemment essayées (Finances, Intérieur, Justice…), avec des bonheurs divers et après des investissements trop impor- tants. Comme l’immense majorité des de les convertir, à moindre coût, dans des formats correspondant aux besoins des réutilisateurs. Cette usine de conver- sion de données serait interministérielle, permettant à la fois aux administrations, qu’elles soient centrales ou décentrali- sées, riches ou pauvres, de développer de nouvelles applications répondant à leurs besoins propres, tout en favorisant la réutilisation de leurs informations. Pour traiter et élever le niveau de service sur les données – qu’elles soient ou non déjà difusées –, cette structure devrait en priorité s’interfacer avec les sites publics existants à l’échelon national (dont Data.gouv.fr), voire à l’échelon local. La « data factory » proposerait des fonctionnalités « à la demande » de transformation de format, d’ajout de métadonnées, voire d’anonymisation ou de nettoyage d’informations. Elle serait aussi en mesure de proposer des services de stockage, d’intégration et d’accès aux données (API, services web…). Le financement par la taxe ? Ainsi, cette « data factory » permettrait à la sphère publique de disposer d’une structure habilitée à stocker, améliorer et difuser les données publiques ou- vertes françaises. Comment financer une telle structure? Très simplement! En prélevant une taxe (25 %?) sur le chifre d’afaires perçu par les adminis- trations qui vendent leurs informations. Il est en efet paradoxal que seules les administrations disposant de données vendables retirent 100 % des revenus alors qu’une vraie politique d’open data consiste justement à mettre à disposition un maximum d’informations, en lais- sant au marché (entreprises, associa- tions, développeurs…) le soin de déve- lopper des services autour. La France aurait alors l’opportunité de se doter de modalités d’accès communes à toutes les données libérées dans l’Hexa- gone, gage d’efficacité et d’économies d’échelle pour tous les réutilisateurs. M DENIS BERTHAULT 01H_2120_038_Op4.indd 38 01/03/12 10:52

Tribune Denis Berthault 01

Embed Size (px)

Citation preview

38

01bu

sin

ess

&te

chn

oI8

/03/

2012

I01n

et-e

ntre

pris

es.fr

opInIons

CARTE BLANCHE à…

administrations dans le monde, maispeut-être plus encore à cause d’une orga-nisation hiérarchique et d’un fort soucide confidentialité, l’Administration fran-çaise n’est ni préparée, ni organisée, ni,a fortiori, équipée pour difuser et/ourendre réutilisables ses informations.Cela n’entre pas dans la mission pourlaquelle elle a été créée. Il y a donc unabîme entre la réalité et les désirs desacteurs politiques européens ou français,relayés par de nombreuses associationsen France, de disposer de données dansun « format lisible par la machine etaccompagnées de métadonnées ».Comment, alors, permettre aux admi-nistrations de diffuser – rapidement,dans un format réutilisable et au plusjuste coût – leurs informations ? Pourrésorber ce goulet d’étranglement consti-tué par la question du format, nousproposons la création d’une structuretechnique centralisée, sorte de « datafactory mutualisée », chargée de collecterles données en l’état, c’est-à-dire sansimposer à l’Administration un quelcon-que changement ou investissement, puis

Comment exploiter la mine d’ordes données publiques

« Nous proposons une usineinterministérielle d’extractionet de conversion des données »

dr

Denis Berthault, coanimateur du groupe« donnéespubliques »auGroupementfran-çaisdesindustriesdel’information,s’interrogesur les moyens d’améliorer, au moindre coût,la qualité des données sans attendre quel’administration ait les outils nécessaires.

Avec la création d’Etalab, la tarificationdes données publiques devient un sujettabou. Certes, les textes encadrant laréutilisation des informations publiques,qu’ils soient actuels (directive de 2003,loi de 1978, décret de mai 2011) ou à venir(projet de révision de la Commissioneuropéenne), autorisent explicitementcette tarification. Toutefois, nombreuxsont ceux qui pensent que, l’impôt ayantdéjà payé la production des données, ilest anormal que la réutilisation des in-formations publiques soit tarifée.Hélas, si l’impôt a bien financé la produc-tion, il n’a que très rarement subventionnéla difusion et encore moins les moyensde rendre réutilisables ces données. Pourcomprendre le problème, il suffit de re-garder les sites publics (ministères, établis-sements publics, autorités administra-tives...) : les informations textuelles sontrestituées en PDF, un format propriétairequi interdit toute réutilisation, les don-nées tabulaires, en format propriétaire(Excel). Cette tendance se retrouve, biensûr, sur Data.gouv.fr où moins de 1 % desdonnées est en format ouvert.

Une structure centralisée pourrésoudre le problème du formatCe constat soufre, évidemment, d’ex-ceptions : des administrations dont ladifusion a toujours fait partie intégrantede la mission (Dila, IGN, Inpi, Insee,Météo France…) se sont depuis unevingtaine d’années organisées pour re-diffuser leurs données. Quelquesadministrations traditionnelles s’y sontrécemment essayées (Finances, Intérieur,Justice…), avec des bonheurs divers etaprès des investissements trop impor-tants. Comme l’immense majorité des

de les convertir, à moindre coût, dansdes formats correspondant aux besoinsdes réutilisateurs. Cette usine de conver-sion de données serait interministérielle,permettant à la fois aux administrations,qu’elles soient centrales ou décentrali-sées, riches ou pauvres, de développer denouvelles applications répondant à leursbesoins propres, tout en favorisant laréutilisation de leurs informations.Pour traiter et élever le niveau de servicesur les données – qu’elles soient ou nondéjà difusées –, cette structure devraiten priorité s’interfacer avec les sitespublics existants à l’échelon national(dont Data.gouv.fr), voire à l’échelonlocal. La « data factory » proposerait desfonctionnalités « à la demande » detransformation de format, d’ajout demétadonnées, voire d’anonymisation oude nettoyage d’informations. Elle seraitaussi en mesure de proposer des servicesde stockage, d’intégration et d’accès auxdonnées (API, services web…).

Le financement par la taxe ?Ainsi, cette « data factory » permettraità la sphère publique de disposer d’unestructure habilitée à stocker, amélioreret difuser les données publiques ou-vertes françaises. Comment financerune telle structure? Très simplement !En prélevant une taxe (25 % ?) sur lechifre d’afaires perçu par les adminis-trations qui vendent leurs informations.Il est en efet paradoxal que seules lesadministrations disposant de donnéesvendables retirent 100 % des revenusalors qu’une vraie politique d’open dataconsiste justement à mettre à dispositionun maximum d’informations, en lais-sant au marché (entreprises, associa-tions, développeurs…) le soin de déve-lopper des services autour.La France aurait alors l’opportunité de sedoter de modalités d’accès communes àtoutes les données libérées dans l’Hexa-gone, gage d’efficacité et d’économiesd’échelle pour tous les réutilisateurs. M

Denis berthault

01H_2120_038_Op4.indd 38 01/03/12 10:52