54
& Informat on stratég e Big data – Open data Quelles valeurs ? Quels enjeux ? Sous la direction de Evelyne Broudoux et Ghislaine Chartron Actes du colloque « Document numérique et société », Rabat, 2015

EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

&Informat onstratég e

Big data – Open dataQuelles valeurs ? Quels enjeux ?

Sous la direction de Evelyne Broudoux

et Ghislaine Chartron

WWW.DEBOECKSUPERIEUR.COM

OPEDATISBN 978-2-8073-0031-6

ISSN 2295-3825

Depuis 2006, la conférence « Document numérique et société » se donne pour mission d’apporter des éclairages sur les transformations des dispositifs d’information à l’ère numérique, en privilégiant la dimension sociale.

Cette 5e édition se focalise sur l’effervescence autour du Big data et de l’Open data qui anime autant les milieux d’affaires que les gouvernements et les scientifi ques. Elle s’explique par l’interconnexion généralisée transformant l’économie des services et les internautes en fournisseurs de données, mais également par l’importance grandissante de l’internet des objets et, d’une manière générale, par les capacités computationnelles qui traitent désormais l’information sur toute sa chaîne de production-diffusion et transformation.

Cet ouvrage rassemble les textes présentés lors du colloque de Rabat les 4 et 5 mai 2015, des recherches théoriques, expérimentales et des analyses critiques qui s’inscrivent dans la perspective des études sur le phénomène du Big data et de l’Open data en termes d’enjeux pour nos sociétés et de création de valeurs.

EVELYNE BROUDOUX est maître de conférences en Sciences de l’information et de la communication au CNAM et membre de l’équipe de recherche DICEN-IDF. Ses travaux de recherche portent sur l’évolution des pratiques auctoriales, éditoriales et des mesures d’autorité à l’heure du web et du Big data, dans les champs intéressés par la création et l’innovation. Elle est co-fondatrice de la conférence « Document numérique et société ».

GHISLAINE CHARTRON est professeur en Sciences de l’information et de la communication au CNAM. Elle est titulaire de la chaire d’ingénierie documentaire et dirige un institut de formation aux métiers de l’information (INTD). Ses travaux concernent les transformations des modes de production et de diffusion de l’information ainsi que l’évolution des modèles économiques des industries des contenus. Elle est co-fondatrice du laboratoire DICEN-IDF et de la conférence « Document numérique et société ».

Créée en 1963, l’ADBS (Association des Professionnels de l’information) fédère une grande variété de professionnels de l’information numérique (veilleurs, knowledge managers, gestionnaires de contenus numériques, documentalistes, records managers, etc.). Elle compte plus de 4000 membres en France. En 2013, l’ADBS s’associe aux éditions De Boeck pour créer la collection « Information & Stratégie » qui allie les savoir-faire des deux partenaires.

&Informat onstratég e

Big

dat

a –

Ope

n da

taEv

elyn

e Br

oudo

ux |

Ghi

slai

ne C

hart

ron

Desi

gn c

eris

e.be

Actes du colloque « Document numérique et société », Rabat, 2015

Pour les professionnels de l’information ; pour les chercheurs, enseignants et étudiants en information, documentation et humanités numériques.

Page 2: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning
Page 3: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

Big data – Open data

Page 4: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

regroupe des ouvrages pratiques et de réflexion destinés à l’entreprise et à ses professionnels, aux enseignants et aux étudiants concernés par la gestion de l’information et toutes les problématiques stratégiques qui y sont liées.

La collection s’adresse tant aux responsables marketing, communication, business analysts, RH, documen-talistes, ingénieurs, chercheurs, bibliothécaires ou journalistes qu’aux étudiants et enseignants de ces filières. Elle fournit des outils et analyses de qualité, au contenu complet bien que concis, avec des exemples concrets et des illustrations. Des encadrés thématiques et une structure bien découpée permettent, au choix, une lecture fragmentée ou continue des ouvrages, toujours opérationnelle.

« Information & Stratégie » porte le label de l’ADBS, l’Association des professionnels de l’information et de la documentation, la plus importante association professionnelle de France dans le domaine des métiers de l’information. Créée en 1963, l’ADBS compte plus de 4000 membres actifs.

La collection est dirigée par Stéphane Cottin, chargé de mission pour le développement des systèmes d’information et la valorisation des ressources documentaires auprès du cabinet du Secrétaire général du Gouvernement, et Ghislaine Chartron, professeur au Conservatoire national des arts et métiers de Paris (CNAM) et directrice d’un institut de formation des professionnels de l’information (INTD). Tous deux lui apportent leur expertise dans les domaines de l’information et de la documentation.

DéJà PARUS :

Joumana Boustany, Evelyne Broudoux, Ghislaine Chartron (dir.), La médiation numérique : renouvellement et diversification des pratiques. Actes du colloque « Document numérique et société », Zagreb, 2013

Franck Bulinge Maîtriser l’information stratégique. Méthodes et techniques d’analyse

Lisette Calderan, Pascale Laurent, Hélène Lowinger et Jacques Millet (coord.), BIG DATA. Nouvelles partitions de l’information. Actes du séminaire IST Inria, octobre 2014

Véronique Mesguich, Armelle Thomas Net Recherche 2013. Surveiller le web et trouver l’information utile

Jean-Michel Salaün, Benoît Habert (dir.), Architecture de l’information. Méthodes, outils, enjeux

Evelyne Broudoux, Ghislaine Chartron (dir.), Big data – Open data. Quelles valeurs ? Quels enjeux ? Actes du colloque « Document numérique et société », Rabat, 2015

&Informat onstratég e

Page 5: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

&Informat onstratég e

Big data – Open dataQuelles valeurs ? Quels enjeux ?

Actes du colloque « Document numérique et société », Rabat, 2015

Sous la direction de Evelyne Broudoux

et Ghislaine Chartron

s u p é r i e u r

Page 6: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

Couverture et maquette intérieure : cerise.beMise en page : Nord Compo

© De Boeck Supérieur s.a., 2015 1re édition Fond Jean Pâques, 4 – B-1348 Louvain-la-Neuve Tous droits réservés pour tous pays. Il est interdit, sauf accord préalable et écrit de l’éditeur, de reproduire (notamment par photocopie) partielle-

ment ou totalement le présent ouvrage, de le stocker dans une banque de données ou de le communiquer au public, sous quelque forme et de quelque manière que ce soit.

Imprimé en Belgique Dépôt légal :

Bibliothèque nationale, Paris : octobre 2015 ISSN 2295-3825 Bibliothèque royale de Belgique, Bruxelles : 2015/13647/123 ISBN 978-2-8073-0031-6

Pour toute information sur notre fonds et les nouveautés dans votre domaine de spécialisation, consultez notre site web : www.deboecksuperieur.com

Page 7: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

5

Sommaire

IntroductIon 9

PartIe 1

enjeux épistémologiques 15

open, Big, collaboration : trois utopies de l’innovation au xxie siècle

Fidelia IBeKWe-SanJuan, Françoise PaQuIenSeGuY 17

Big data, médiation symbolique et gouvernementalitéMaude BonenFant, Marc Menard, andré MondouX, Maxime oueLLet 31

L’ambiguïté épistémologique des big data : le cas de la donnée web en sciences sociales

eglantine ScHMItt 43

transparence et big data : revers et infortunesHélène JeannIn 55

PartIe 2

enjeux politiques et économiques 65

enjeux géopolitiques des données, asymétries déterminantesGhislaine cHartron, evelyne BroudouX 67

La plateforme de diffusion de données, un modèle de gouvernement urbain ?

antoine courMont 85

Management de l’information publique et innovation numérique de services urbains : l’intelligence territoriale en perspective

Jean-Baptiste Le corF 97

Valorisation des données ouvertes : acteurs, enjeux et modèles d’affaires

Slim turKI, Muriel FouLonneau 113

Page 8: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

6

Som

mai

re |

Big data for improving open e-government services Fouad naFIS, Siham YouSFI 127

La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs métier en entreprise

anna neSVIJeVSKaIa 137

PartIe 3

enjeux sociétaux 151

datavisualisation : Principes, enjeux et perspectives pour des utilisateurs non experts

Béatrice arruaBarrena 153

La datavisualisation comme outil de pilotage de la recherche scientifique médicale au sein de la Faculté de Médecine et de Pharmacie de casablanca

Hanae LrHouL, Ghislaine cHartron, ahmed BacHr, othman BenaMMar 165

urban data et stratégies dans le secteur des services : le cas de la métropole lyonnaise

Valérie LarrocHe, Martine VILa-raIMondI 183

adaptation normative des Big data et du Learning analytics

Mokhtar Ben Henda 197

reconstruire le sens associé à l’archive : mobilisations sémiotique et documentaire du Linked open data

Lénaïk LeYoudec 213

PartIe 4

enjeux techniques 227

datacite au service des données scientifiques – identifier pour valoriser

Herbert GrutteMeIer 229

un modèle Big data orienté vers la cyberdémocratieYoussef taHer 241

Page 9: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

7

Big

Dat

a –

Ope

n D

ata

Vers une stratégie collaborative centrée sur les apprenants et les données du Big data pour améliorer le processus d’apprentissage en ligne

Boubker SBIHI, Imad BeLGHIt, Badr eLHaIL, rachid GouartI 251

Mapreduce for optimizing Big electronic records indexing process

Siham YouSFI, Maryem rHanouI, Mounia MIKraM 265

Page 10: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning
Page 11: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

9

introductionEvelyne BROUDOUX, MCF, CNAM, DICEN-Idf (EA7339), [email protected] Ghislaine CHARTRON, Professeur, CNAM, DICEN-Idf (EA7339), [email protected]

L’internet des objets, l’ouverture des données et leur accessibilité, l’interconnexion généralisée transformant les internautes en four-nisseurs de données personnelles et d’une manière générale les évolutions technologiques liées aux capacités computationnelles qui traitent l’information sur toute sa chaîne de transformation sont constitutifs du « big data » et de l’« open data ». Ces deux termes – relativement nouveaux – que nous avons souhaité investiguer ont déjà généré de multiples colloques et initiatives entrepreneuriales intéressant les communautés universitaires et les professionnels des domaines et secteurs concernés.

Alors que nous lancions l’appel à communications sur ce thème en juillet 2014, les derniers soins étaient portés au premier Que Sais-je ? intitulé « Big Data » qui paraîtra en avril 2015, moins d’un mois avant la tenue de la 5e conférence « Document numérique et Société ». Est-ce un hasard si son auteur est président de l’Asso-ciation nationale des directeurs des systèmes d’informations ? La problématique intéresse effectivement en premier lieu les compé-tences informatiques, statistiques, commerciales, indispensables à la réorganisation des entreprises et des administrations souhaitant entrer dans cette dynamique. Pierre Delort y constate cependant, dès les premières pages, que la technologie « big data » serait sur la courbe descendante de la « désillusion » matérialisée par la « Hype Cycle1 » du Cabinet Gartner.

Le regard critique dénote-t-il forcément des désillusions ? C’est très clairement à cette attitude distanciée que nous avons offert la possibilité d’une expression scientifique en suscitant des analyses épistémologiques. Mais, plus que la « création de valeur », concept que nous avions proposé à l’interrogation, c’est l’injonction à la « transparence » qui a rencontré le plus d’échos.

Fidelia Ibekwe-SanJuan et Françoise Paquienséguy revisitent ainsi trois idéaux ou utopies ayant semblé stimuler l’innovation au xxie siècle : l’ouverture (open), la participation (crowd) et le gigan-tisme (big). Si ces trois utopies rencontrent des échos positifs, elles contribuent aussi au développement de technologies disruptives qui déstructurent des secteurs en accroissant les déséquilibres économiques et sociétaux. Maude Bonenfant et al. se penchent sur la gouvernementalité algorithmique sous l’angle sémiotique et analysent le processus de « naturalisation de la donnée », son impact sur les promesses de « dévoilement du réel » débarrassé de

1 http://www.gartner.com/newsroom/id/2819918

Page 12: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

10

Intr

oduc

tion

|

la subjectivité du social et les risques d’asservissement sémiotique machinique qui en découlent. Ce mythe du « big data », nouvelle source de connaissances possibles, qui reconstruirait une nouvelle forme d’objectivité est également mis en perspective par Eglantine Schmitt, qui interroge le statut épistémologique des matériaux issus du web et leurs utilisations par des communautés disciplinaires dont les approches peuvent être vues comme contradictoires. Enfin, l’idéologie de la transparence est creusée par Hélène Jeannin qui oppose la revendication hacker de la transparence à celle issue de l’idéologie sécuritaire.

Les enjeux politiques et économiques de cette accessibilité ouverte et massive sont ensuite mis en perspective sous l’angle des désé-quilibres et des asymétries à la fois technologiques, juridiques, et entre acteurs technologiques et acteurs des contenus par Ghislaine Chartron et Evelyne Broudoux. Est mis en évidence la supréma-tie innovante d’un nombre réduit d’entreprises qui captent les données produites par des milliards de personnes dans des États qui cherchent à reprendre la main sur ce qui est fabriqué sur leur propre territoire. La gouvernementalité est à nouveau interrogée par Antoine Courmont avec le modèle de la plateforme qui devient un nouvel instrument de gouvernement urbain ; c’est l’exemple du Grand Lyon avec sa définition et mise en œuvre d’une politique d’open data. Le volet des collectivités territoriales est ainsi ouvert : Jean-Baptiste Le Corf analyse les stratégies éditoriales de sept portails territoriaux mis en œuvre par cinq agglomérations (Nantes, Paris, Rennes, Montpellier et Grand Toulouse) et deux départe-ments (Saône et Loire, Gironde) en matière de données publiques et souligne leur nouveau rôle de gestionnaire de l’information dans un contexte de rationalisation du politique. Slim Turki et Muriel Foulonneau analysent l’écosystème sous-jacent à la publication et à la valorisation des données ouvertes pour proposer une lecture du réseau de valeurs associé, questionnant la viabilité et la péren-nité des modèles économiques. Enfin, la plateforme Data.gov.ma issue du Plan numérique marocain est traitée par Fouad Nafis et al., qui détaillent son architecture et ses e-services. Au sein des entreprises, de nombreux projets ont vu le jour dont les visées vont d’une simple optimisation des performances à une transformation profonde des modèles d’affaires. Anna Nesvijevskaia présente trois études de cas de « big data » réalisées dans le domaine de la pré-vention-santé, l’analyse de campagnes publicitaires et l’assistance inter-mutuelles.

La partie Enjeux sociétaux s’ouvre avec deux articles sur la data-visualisation qui englobe un empan large d’usages : le premier de Béatrice Arruabarrena présente son utilisation par des utili-sateurs non experts et la nouvelle littératie à développer qui en découle ; le second d’Hanae Lrhoul et al. concerne sa place prise comme outil d’aide au pilotage de la recherche scientifique médi-cale, avec l’exemple de la Faculté de Médecine et de Pharmacie de Casablanca. Enfin, l’open data peut être aussi l’opportunité de tester l’innovation participative des citoyens érigés en profession-nels, l’opportunité également d’émergence de nouvelles formes de médiations comme celles associées à la plateforme Data GrandLyon, acteur-réseau étudié par Valérie Larroche et Martine Vila-Raimondi.

Page 13: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

11

Big

Dat

a –

Ope

n D

ata

En matière d’éducation, on attend beaucoup de l’analyse des big data dans les dispositifs d’E-learning, Mokhtar Ben Henda rappelle le rôle grandissant que les Learning analytics vont être amenés à jouer dans les années qui viennent et les enjeux des processus normatifs associés aux données dans ce domaine, notamment en termes d’interopérabilité. Autre enjeu sociétal, celui de la redocu-mentarisation de l’archive opérée potentiellement par les données liées (linked data), Lénaïk Leyoudec propose un modèle de recons-truction de sens à l’aide d’un dispositif éditorial expérimental dédié à la recontextualisation de l’archive.

Du côté des Enjeux techniques, quatre communications s’inté-ressent à des domaines différents. La présentation par Herbert Gruttemeier du Consortium international DataCite, dans lequel l’Inist-CNRS représente la France, rend compte du schéma spé-cifique de métadonnées associé aux données de la recherche et des fonctionnalités qui favorisent le partage et leur réutilisation. Youssef Taher cherche un idéal big data orienté vers la « cyber-démocratie » et en propose une adaptation issue du modèle IMC. Boubker Sbihi et al. proposent un modèle de conception de dis-positif d’E-learning utilisant des données massives et variées en ligne afin de contribuer à l’amélioration du processus d’apprentis-sage. La technologie MapReduce est présentée par Siham Yousfi et al. dans l’objectif d’optimiser les enregistrements d’indexation sémantique.

On le voit, qu’il s’agisse d’une rupture technologique comme le laissent entendre les discours des acteurs promoteurs d’un nouvel écosystème, d’une innovation en termes de modèles économiques et sociaux, d’une évolution de la performance des outils existants, les phénomènes du « big data » et de l’« open data » sont bien trans-verses et s’inscrivent au cœur de nombreux travaux de recherche en sciences de l’information et de la communication, mais aussi plus généralement dans les sciences dont les expérimentations quantitatives font appel à des volumes de données significatifs comme celles de la gestion, ou des « digital humanities » nais-santes.

La prétention du « big data » et de l’« open data » est grande à pro-curer une observabilité de « réels » cachés, à trouver des solutions à tout type de problèmes en croisant des masses de données. Une des contributions majeures de cet ouvrage est certainement d’insister sur la nécessaire distance critique à préserver car la construction de savoirs est un processus exigeant qui ne saurait se satisfaire de cette seule dimension, certes inédite, des données massives ou/et ouvertes.

Page 14: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

12

Intr

oduc

tion

|

1. REsponsablEs dE la confÉREncE

Evelyne Broudoux (CNAM, Paris)Ghislaine Chartron (CNAM, Paris)

2. comitÉ dE lEctuRE

Driss Aboutajdine (CNRST, Maroc)Bruno Bachimont (UTC-Paris)Ahmed Bachr (ESI-Maroc)Mostafa Bellafkih (INPT, Maroc)Mohamed Ben Romdhane (ISD, Université de Manouba, Tunisie)Michel Bera (CNAM, Paris)Joumana Boustany (Université de Paris Descartes)Eric Boutin (Université de Toulon)Evelyne Broudoux CNAM, Paris)Maryse Carmes (CNAM, Paris)Ghislaine Chartron (CNAM, Paris)Stéphane Chaudiron (Université Lille 3)Dominique Cotte (Université Lille 3)Benoit Epron (ENSSIB-Lyon)El Moustapha Fayad (ESI-Maroc)Dominic Forest (EBSI-Montreal)Stéphane Frenot (INSA-Lyon)Gabriel Gallezot (Urfist de Nice)Khaled Habchi (ISD, Université de la Manouba, Tunisie)Seth van Hooland (Université Libre de Bruxelles)Charles Huot (Temis, France)Fidelia Ibekwe-SanJuan (Université Aix-Marseille)Madjid Ihadjadene (Université Paris 8)El Hassan Lemallem (ESI-Maroc)Hervé Le Crosnier (Université de Caen)Maria Mercanti-Guérin (CNAM, Paris)Pierre Mercklé (ENS-Lyon)Véronique Mesguisch (ADBS, Paris) Vincent Meyer (Université de Nice-Sophia Antipolis)Valérie Peugeot (Orange Labs, France)Bernhard Rieder (Amsterdam University)Jean-Michel Salaün (ENS-Lyon)Michael Seadle (Humboldt-Universität Berlin)Mohamed Slassi Sennou (Confédération Générale des Entreprises du Maroc)Peter Stockinger (MSH-Paris)Imad Saleh (Université Paris 8)Gabriella Salzano (Université Paris-Est)Nathalie Sonnac (IFP, Paris 2)

Page 15: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

13

Big

Dat

a –

Ope

n D

ata

3. REmERciEmEnts

Nous remercions l’École des Sciences de l’Information (ESI) de Rabat pour l’organisation du colloque ainsi que le Labex HASTEC (Laboratoire d’Excellence, Histoire et anthropologie des savoirs, des techniques et des croyances), le CNAM, le laboratoire DICEN-IDF, le laboratoire Paragraphe et l’ADBS pour leur soutien à cette mani-festation.

Page 16: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning
Page 17: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

Partie 1

enjeux éPiStémologiqueS

Sommaireopen, Big, collaboration : trois utopies de l’innovation au xxie siècle 17

Big data, médiation symbolique et gouvernementalité 31

L’ambiguïté épistémologique des big data : le cas de la donnée web en sciences sociales 43

transparence et big data : revers et infortunes 55

Page 18: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning
Page 19: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

17

Open, Big, COllaBOratiOn : trOis utOpies de l’innOvatiOn au xxie sièCle Fidelia IBEkwE-SANJUAN, IRSIC – EA 4262, Aix-Marseille Université, [email protected]çoise PAqUIENSÉGUY, ELICO – EA 4147, Sciencespo Lyon, [email protected]

résuméTrois idéaux ou utopies semblent stimuler l’innovation au xxie siècle : l’ouverture (Open) ; la participation et le gigantisme (Big). Si ces trois utopies rencontrent autant d’échos positifs auprès d’acteurs inscrits dans des logiques différentes, c’est que beaucoup pensent qu’elles ont la capacité d’instaurer un triangle vertueux et de devenir un levier libérant les énergies et accélérant le rythme des innovations. Elles puisent essen-tiellement dans la cybernétique de Norbert wiener (1948) et s’organisent autour de trois courants : libertaire, libéral et régalien. Si les deux idéo-logies – libertaire et ultralibérale, sous-jacentes à ces trois utopies de l’innovation paraissent de prime abord contradictoires, il n’en demeure pas moins que sur le terrain de l’innovation, leurs modalités de mise en œuvre se conjuguent. L’ouverture implique la participation tout en accrois-sant le phénomène du gigantisme, tandis que la participation de la foule contribue à alimenter les algorithmes du Big Data en corpus d’appren-tissage qui leur permet de s’affiner et d’améliorer leurs performances.Cette communication examine les modalités de mise en œuvre de ces trois utopies sur le terrain et analyse certaines des dérives auxquelles conduit leur conjugaison.

mots-clés : Open Data, Big Data, web 2.0, participation, collaboration.

Page 20: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

18

ope

n, B

ig, c

olla

bora

tion

 : tr

ois

utop

ies

de l’

inno

vati

on a

u xxie  s

iècl

e

intRoduction : vERs un REnouvEau cybERnÉtiquE ?

Trois idéaux ou utopies semblent stimuler l’innovation au xxie siècle : l’ouverture (Open) ; la participation et le gigantisme (Big). Si ces trois utopies rencontrent autant d’échos positifs auprès d’acteurs inscrits dans des logiques différentes, c’est que beaucoup pensent qu’elles ont la capacité d’instaurer un triangle vertueux et de devenir un levier libérant les énergies et accélérant le rythme des innovations. Pourtant, elles mêlent, en apparence, des idéo-logies contradictoires.

Breton et Proulx (2005) offrent une grille d’analyse des idéologies sous-jacentes au développement des technologies de l’informa-tion : elles puisent essentiellement dans la cybernétique de Norbert wiener (1948) et s’organisent autour de trois courants : libertaire, libéral et régalien. Au vu des effets dévastateurs des deux guerres mondiales, wiener considérait que la fermeture et le secret étaient synonymes de sclérose des systèmes (organiques ou artificiels), qui s’en trouvaient figés. Il posait donc l’ouverture, la libre circulation de l’information et la libre communication comme des remparts contre le retour de la dictature et du chaos.

Le courant libertaire prône l’ouverture et la collaboration comme doc-trines pour l’élaboration des biens et des connaissances. Au plan politique, l’idéal de l’ouverture est en toile de fond des mouvements citoyens et altermondialistes qui depuis les années 1980, militent pour la protection des biens communs et mondiaux, pour une société sans contrôle étatique où la circulation des biens et des personnes se ferait sans entraves et qui s’autorégulerait grâce aux nouvelles techno-logies. Il s’agit donc d’une forme de démocratie directe dont le Parti Pirate1 est une illustration. Soutenu par des mouvements politiques et citoyens, ce courant a permis l’essor d’une série de technologies de l’information dont l’ouverture des codes sources et des contenus devient la raison d’être, comme le témoigne l’inflation du préfixe « open » (Open Source, Open Archives, Open Journal, Open Edition, Open Education, Open Data, Open Innovation, Open Science…).

Le deuxième courant (ultra)libéral s’oppose au premier dans la mesure où il valorise une marchandisation généralisée. Les technologies de l’information deviennent ici une opportunité pour investir dans des domaines jusque-là protégés des lois du marché tels que la santé, l’éducation, les données personnelles, etc. Les offensives des géants du web, via l’emprise de leurs plateformes numériques, parviennent peu à peu à reprendre aux États de nombreuses prérogatives. Les innovations promises autour de l’Internet des objets comme les appa-reils de self-tracking ou de quantified-self collectent des données sur chaque aspect quantifiable de nos vies. Ces données ne man-queront pas d’alimenter des algorithmes utilisés par des sociétés commerciales pour calculer ensuite des grilles tarifaires d’assurance individuelle dans tous ces secteurs. À terme, c’est la notion même de social ou de solidarité qui risque d’être remise en question. Dans certains secteurs, le modèle de l’ouverture est devenu la modalité

1 http://partipirate.org, consulté le 15 mai 2015.

Page 21: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

19

Big

Dat

a –

Ope

n D

ata

principale de production des biens numériques. Ce modèle négocie désormais des formes de cohabitation avec l’idéologie libérale et mar-chande caractérisée par la fermeture et le brevetage.

Le troisième courant, régalien, représente les intérêts des États souhaitant contrôler l’évolution et les usages des technologies de l’information, d’abord vues comme un moyen d’assurer leur souverai-neté et de sauvegarder leur suprématie. Il tente donc d’arbitrer entre les effets des courants libertaire et ultra-libéral, alors que ces deux courants sont « scellés dans une alliance » militant pour l’absence totale de régulation étatique (Breton et Proulx, 2005). Les déclara-tions de certains dirigeants des industries du numérique accréditent cette thèse tant ils ne cachent pas leur immense mépris pour les politiques : « In Silicon Valley, government is considered slow, staffed by mediocrities and ridden with obsolete rules and inefficiencies2 ». Mis à part la Chine, la plupart des États semblent avoir perdu la bataille du contrôle des technologies de l’information au profit du courant ultra-libéral qui doit néanmoins composer avec le courant libertaire lui résistant par diverses formes, regroupées dans l’utopie de l’ouverture.

Conjuguées, ces trois utopies constituent-elles vraiment un triangle vertueux et un formidable accélérateur d’innovations comme certains discours médiatiques le laissent entendre ? Ou bien recèlent-elles des effets pervers, non désirés, qui vont à l’encontre du progrès social qu’elles assurent amener ? Examinons plus en détail leur mise en œuvre sur le terrain.

1. l’ouvERtuRE (opEn)

Dans le domaine de l’informatique, l’idéal de l’ouverture a été traduit par des principes ou des « grandes idées » qui ont guidé le design des systèmes d’information que Zittrain (2008 : 27) a bien analysés.

Le premier grand principe de design, le verkeersbordvrif, littérale-ment « libre de presque tout panneau routier », correspond à une expérimentation faite dans certains pays nordiques supprimant presque toute la signalisation routière. Le résultat fut contre-intui-tif : les conducteurs faisaient plus attention aux piétons en utilisant éventuellement un signe de la main et se regardaient. Ce principe traduit l’idée que moins on impose des restrictions et de contrôle sur des inventions techniques, plus ces inventions résisteront face au rythme accéléré de changements et donc plus elles seront capables d’auto-évolution si nécessaire. Appliqué à l’invention de l’Internet et du Wikipédia, ce principe surpassa toutes les attentes. En effet, c’est bien cette ouverture à la fois initiale et génératrice qui permet ensuite de décliner possibilités, spécifications, fonctionnalités au moment de la concrétisation de l’artefact, car seul le processus de concrétisation réduirait progressivement, mais jamais totalement, la part d’abstraction des objets techniques en établissant « une

2 « Dans la Silicon Valley, le gouvernement est considéré comme lent, peuplé par des médiocres, infesté de règles obsolètes et d’inefficacité », Packer G., « Change the world » The New Yorker, 27 mai 2013. Visité le 9/05/2015, http://www.newyorker.com/magazine/2013/05/27/change-the-world.

Page 22: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

20

ope

n, B

ig, c

olla

bora

tion

 : tr

ois

utop

ies

de l’

inno

vati

on a

u xxie  s

iècl

e

coordination opératoire entre les éléments de la machine et les élé-ments du milieu extérieur » (Guchet, 2008 : 9). Autrement dit, les finitions et définitions des fonctionnalités et les modalités d’usages prescrites dans les objets techniques ne le sont ni totalement, ni antérieurement, par l’offre industrielle comme Lacroix, Tremblay et Mœglin l’ont démontré depuis longtemps (1992) et restent en partie aux mains des usagers (les contributeurs de wikipédia) et des producteurs (les initiateurs porteurs du projet). La concrétisation, pro-cessus incessant et évolutif, se faisant dans une triple dialectique : lecteurs, contributeurs, organisateurs. Soulignons l’intérêt industriel, et donc économique, de ce design, que Simondon3 évoquait déjà cinquante ans plutôt. Pour lui en effet, le premier état d’un futur objet industriel restait celui de l’objet technique abstrait, principalement constitué de potentiels y compris pour les usages.

Le projet politique déjà décennal de l’ouverture des données publiques (Open Data) semble également adhérer à ce principe de spécification minimaliste. L’exigence politique porte sur la libérali-sation des données publiques, sans restriction, et dans un format interopérable. À l’instar de l’information et la communication de wiener qui devaient circuler sans entraves, l’Open Data ressus-cite la métaphore des « autoroutes » de l’information, vulgarisée par le projet de National Information Infrastructure (NII) présenté par Al Gore en 1991 ; autoroutes sur lesquelles les données cette fois, sont appelées à circuler désormais librement et pour le progrès de la société.

La deuxième grande idée du design, issue de la première, est dans l’incitation à construire des technologies génératives. Selon Zittrain (2008, p. 150), « la générativité est la capacité d’un système à pro-duire des changements non anticipés grâce à des contributions non filtrées/contrôlées d’une audience large et diverse ». Ces technologies génératives se caractérisent par le fait qu’elles sont « ambitieuses dans leurs desseins, mais modestes ou simples dans leur exécution » (Zittrain, 2008, p. 134), ce qui sous-entend deux autres principes : (i) la procrastination, temporiser et ne résoudre les problèmes que lorsqu’ils surviennent et ; (ii) la robustesse, principe posé par Jon Postel, un des fondateurs de l’Internet Protocol (IP) qui l’a résumé ainsi : « Soyez conservateur dans ce que vous faites : soyez libéral dans ce que vous acceptez des autres4 ».

Cet idéal de l’ouverture n’est pas né avec le développement de l’infor-matique de contenu (les logiciels). Il constitue l’un des piliers de la science que le sociologue fonctionnaliste américain Robert Merton (1973) formalisa en quatre impératifs constituant l’éthos de la science moderne : Communisme, Universalisme, Désintéressement et scep-ticisme organisé (Organized skepticism), connu sous l’acronyme « CUDOS ». L’idéal scientifique voudrait que toutes les données ayant servi à réaliser une étude soient accessibles dans un format ouvert pour permettre à d’autres scientifiques de s’en saisir. Le secret et la fermeture sont incompatibles avec l’éthos scientifique alors que

3 Simondon, G. Du mode d’existence des objets techniques, Aubier, 1958.4 Postel, J. « Be conservative in what you do: be liberal in what you accept from others », Transmission Control Protocol (TCP), janvier 1980 http://en.wikipedia.org/wiki/Robustness_principle

Page 23: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

21

Big

Dat

a –

Ope

n D

ata

l’ouverture et la publication des résultats sont ses impératifs. La com-munauté de la Digital Data Curation5 voudrait promouvoir au rang d’une exigence la production d’un « data paper » à côté de chaque publication scientifique (Tedds et Callaghan, 2014), sorte de compa-gnon de l’article scientifique décrivant les données utilisées et les conditions de collecte. L’ultime but rêvé étant l’interconnexion de toutes les données scientifiques, afin que les chercheurs puissent passer de la lecture d’un article scientifique, à la méthode de collecte des données utilisées et vice versa. Au niveau sociétal, l’utopie de l’ou-verture traduit l’hypothèse que l’exhibition permanente et planétaire de nos actes et la participation massive dans l’accomplissement d’une activité ont la capacité d’accélérer le rythme des innovations parce que, quelque part dans le monde, quelqu’un peut rectifier des infor-mations ou données erronées en temps réel. Le succès de wikipédia semble d’ailleurs accréditer cette utopie. Le revers de la médaille est que l’ouverture s’est accompagnée par le rétrécissement de la sphère privée et par la montée de l’exhibitionnisme, conséquences qu’Éric Schmidt, ancien PDG de la société Google admet sans détour : « If you have something that you don’t want anyone to know, maybe you shouldn’t be doing it in the first place »6.

2. lE GiGantismE (biG)

L’immensité des données numériques disponibles a évidemment un impact considérable sur la conduite des affaires non seulement en science, mais aussi dans la société. À l’horizon 2020, il est prévu7 que le volume de données numériques disponibles sur les réseaux atteigne 40 zetta-octets (un zetta-octets = 1021).

Les technologies de l’information et de la communication numé-riques (TICN) s’accompagnent de discours promotionnels qui visent à en faciliter la diffusion et l’appropriation. Dans ce dis-cours, la métaphore joue un rôle important. Pushmann et Burgess (2014, p. 1698) montrent que ces discours sont révélateurs des tenta-tives de naturalisation du phénomène des données, devenu quelque chose d’inéluctable, de « donné » justement ou de préexistant, tout en obscurcissant par là son aspect social et construit. Ainsi, les données sont-elles parfois présentées comme un phénomène naturel potentiellement dévastateur si sa force n’était pas contenue, d’où la surenchère dans l’emploi de substantifs tels « océan, torrent, vague, déluge, tsunami » accolés aux données. Mais à l’inverse, les données sont également présentées comme des ressources naturelles brutes et précieuses dont la valeur n’apparaîtra qu’au prix d’efforts impor-tants de forage que seules les machines sont désormais en mesure de fournir. Comme les discours d’accompagnement liés à l’émer-gence de la fouille de données et de textes dans les années 1990, on retrouve les qualificatifs de « pétrole, d’or, de minéraux ou de liquides précieux ». Ce discours vulgarisateur et médiatique sur la

5 http://www.dcc.ac.uk/digital-curation/why-preserve-digital-data. 6 « Si vous avez quelque chose que vous ne voulez pas que personne sache, peut-être ne devriez-vous pas le faire du tout. », Google CEO on privacy VIDEO. http://www.huffingtonpost.com/2009/12/07/google-ceo-on-privacy-if_n_383105.html, consulté le 7 mai 20157 http://fr.wikipedia.org/wiki/Big_data consulté le 8 mai 2015

Page 24: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

22

ope

n, B

ig, c

olla

bora

tion

 : tr

ois

utop

ies

de l’

inno

vati

on a

u xxie  s

iècl

e

toute-puissance des algorithmes du Big Data commence à susciter une attitude de plus en plus critique, en particulier outre-Atlantique.

En remontant à l’origine du terme Big Data, Pushmann et Burgess (2014, p. 1698) observent qu’il s’est réellement imposé dans le milieu du business. Au fond, le Big Data reste une affaire de com-merce et de contrôle. Avare de concentrations et de monopoles, le courant ultralibéral a tout intérêt à maintenir l’illusion que le gigantisme constitue désormais la seule échelle valable pour innover au xxie siècle. Or, seules les très grandes firmes (GAFA) dotées de puissantes infrastructures informatiques robustes sont en mesure de capter et exploiter le Big Data. Grâce à leur position de gate keeper de l’univers numérique, elles partagent le web en de multiples espaces numériques fermés et sous leur contrôle. Dans cet écosystème, les données des internautes, qu’elles ont captées gratuitement et cryptées dans des formats propriétaires deviennent des monnaies d’échange grâce auxquelles le commerce électronique s’impose comme mode principal de transactions commerciales.

Ce courant ultralibéral exploite d’ailleurs frénétiquement les données personnelles massives afin de générer des recettes publi-citaires, au risque d’induire des usages immoraux ou illégaux. C’est ainsi que l’application Google Education « lisait » les courriels des jeunes usagers aux États-Unis afin de leur envoyer une publicité individualisée8. Plus inquiétant encore, des start-up de l’économie numérique ont mis au point des applications aux noms évocateurs de Whisper9, Creepy10, PleaseRobMe.com11, The Girls Around Me12. Celles-ci agrègent automatiquement des données individuelles à partir de différentes plateformes de réseaux sociaux et autres dis-positifs électroniques (cartes de transport urbain dotées de puces numériques, smartphones). Une fois agrégées, ces données géolo-calisent des individus à un instant t, retracent l’historique de leurs déplacements et situent leurs domiciles (Ben Goldcare, 2014). Même lorsque ces applications affichent de soi-disant bonnes intentions, leur potentiel d’usages déviants reste non négligeable. Samaritan13, conçue pour prévenir les suicides en alertant la personne suivie sur Twitter de l’état moral de ses followers en fonction de l’emploi de certaines expressions, pouvait également traquer les individus vulnérables. kosinski et al. (2013) ont montré qu’il était possible de prédire les principaux attributs des usagers de Facebook à partir des données de leurs comptes (orientations sexuelle, politique et reli-gieuse, origines ethniques). Ils ont ainsi calculé l’orientation sexuelle d’un échantillon de 58 000 utilisateurs de Facebook alors que ceux-ci n’avaient pas fourni cette information, la jugeant trop personnelle. Il est en effet devenu beaucoup moins coûteux de surveiller les individus grâce aux dispositifs électroniques que d’engager des détectives humains (Bankston et Soltani, 2014).

8 Jérôme Hourdeaux, Google accusé de ficher les élèves et étudiants, Médiapart, 25 mars 2014.9 http://www.theguardian.com/world/2014/oct/16/-sp-revealed-whisper-app-tracking-users10 http://www.itproportal.com/2011/03/30/creepy-app-warns-end-privacy/11 http://mashable.com/2010/02/17/pleaserobme/12 http://www.cultofmac.com/157641/this-creepy-app-isnt-just-stalking-women-without-their-knowledge-its-a-wake-up-call-about-facebook-privacy/13 http://www.theguardian.com/society/2014/nov/04/samaritans-twitter-app-mental-health- depression

Page 25: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

23

Big

Dat

a –

Ope

n D

ata

Dans le secteur scientifique, le phénomène du Big Data peut engendrer de profonds changements. L’ère de la e-Science ou du Big Science implique une culture de collaboration à l’échelle inter-nationale. S’il n’est pas question de nier les avancées permises par l’automatisation et la disponibilité des données massives au bénéfice de la science et de la société, il paraît tout aussi important de prendre conscience que la recherche à l’échelle du Big Data représente un changement épistémologique car non seulement elle déplace le focus sur ce qui est comptable ou mesurable, mais elle place l’étude des phénomènes sur une échelle macroscopique. Plusieurs auteurs avertissent des dangers de cette « data science ». Jeffery Bowker (2013, p. 170) craint ainsi que « nos interactions avec le monde » ne se réduisent à « des épiphénomènes aux côtés des algorithmes de traitement de données. N’existerait alors que ce qui est quantifiable. Les collectivités et communautés qui ne sont pas quantifiées ou modélisées ne seraient préservées que de manière accidentelle. En tant que peuple, nous deviendrons, selon la formule mémorable d’Olga Kuchinskaya, nos propres données. Si vous n’êtes pas une donnée, vous n’existez pas ; et comme le malheureux Doc Daneeka dans Catch 22, peu importe le nombre de fois où vous clamez que vous êtes vivant ».

L’abandon du savoir causal au profit d’une science des objets consti-tue un autre risque pour la science à l’échelle du Big Data car les scientifiques pourraient perdre à la fois la capacité d’expliquer les corrélations trouvées au sein des données massives par les algorithmes et celle de comprendre le pourquoi des phénomènes observés (Ibekwe-SanJuan, 2014).

L’engouement actuel pour une science orientée « données » semble opportunément balayer trois évidences que l’on croyait pourtant acquises au fil des siècles de recherche empirique :

1. Aucune collection de données, aussi grande soit-elle ne peut être exhaustive. Il existerait par conséquent, toujours des « choses » en dehors de ces vastes collections des données. D’ailleurs, l’acte même de collecter des données n’est pas neutre car « chaque acte visant à intégrer les données dans une archive est simultanément un acte d’occultation d’autres manières d’être, d’autres réalités. L’archive ne peut en principe contenir le monde en petit ; sa fini-tude signifie que la plupart des morceaux de réalité ne seront pas représentés. La question pour la théorie est quelles sont les formes d’exclusion et comment peut-on tirer des généralisations à leur propos ? » (Bowker, 2014, p. 1797)

2. Le mode algorithmique de découverte imposé par l’investigation à l’échelle du Big Data ne conduit pas à des vérités irréfutables. Certaines études médiatisées, fondées sur le Big Data ont même produit des erreurs flagrantes. Les estimations erronées du pic de la grippe hivernale par Google Flu Trends (Auerbach, 2014) sont symptomatiques des errements de la « data science ». Crawford, Milner et Gray (2014) observaient à juste titre que « les promesses célébrant le Big Data comme “assez bonnes” pour prédire le comportement social ignorent une propriété fondamentale de la théorie sociale : les actions agrégées des individus ne peuvent pas, en elles-mêmes, illustrer la dynamique complexe qui engendre

Page 26: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

24

ope

n, B

ig, c

olla

bora

tion

 : tr

ois

utop

ies

de l’

inno

vati

on a

u xxie  s

iècl

e

l’interaction sociale – l’ensemble de la société est plus grand que la somme de ses parties. » ;

3. les connaissances ne sont pas immanentes aux données, prêtes à être prélevées par la quantification et le calcul algorithmique. La connaissance nécessite une participation active des humains.

Thatcher (2014, p. 1777) préconise que le discours sur le Big Data soit dépouillé « de ses prétentions hyperboliques à atteindre la vérité absolue (…). Le Big Data doit être recontextualisé et réinséré dans le cadre des corps de savoirs socio-économique, culturel et politique ».

3. la paRticipation

La « participation » mieux connue sous le terme anglais de crowd-sourcing, renvoie la plupart du temps à la contribution d’un public nombreux versant des apports sous forme de métadonnées ou de données élémentaires, sur une plateforme numérique dans le cadre de programmes de science participative ou d’initiatives citoyennes visant la création de biens communs numériques. Ces contributions du public sont encadrées. Les participants se trouvent alors dans une situation de subordination à une autorité détentrice de la plate-forme qui valide les contributions. C’est la forme la plus répandue de participation en ligne et c’est dans ce sens que nous l’employons ici. On peut également parler de collaboration.

Troisième « grande idée » du design des technologies de l’infor-mation, la participation apparaît comme la troisième utopie de l’innovation au xxie siècle tant elle rencontre de succès et séduit de plus en plus d’acteurs inscrits dans des idéologies et logiques différentes. Elle traduit l’idée d’une confiance accordée aux ama-teurs et au grand public dans la production de biens et de services numériques. Souvent cité comme témoin de la réussite du modèle participatif, le succès de l’expérience du Wikipédia s’expliquerait également par l’inscription du principe de verkeersbordvrif (spéci-fication minimaliste) dans son design. L’objectif de ses inventeurs était de construire une encyclopédie dotée de peu règles sinon celles de maintenir un point de vue neutre ; d’éliminer des contenus qui enfreignent les lois du copyright ; d’ignorer celles qui interfèrent avec l’objectif premier de construire l’encyclopédie et enfin de sup-primer les gatekeepers (Zittrain, 2008 : 109).

Dans son célèbre essai « The Cathedral and The Bazaar », référence de la philosophie « open source », Raymond (1999) oppose deux approches de software design. La cathédrale, classique en économie politique, se caractérise par un excès de centralisation et de hié-rarchie, elle définit soigneusement le rôle et la place de chacun et les fait s’enchaîner. La deuxième, plus coopérative, a une structure de type réseau au sein duquel les rôles ne sont ni clairement définis, ni même assignés. Elle réunit des gens ayant éventuellement des approches et des agendas différents au sein d’un même projet où règne une sorte de désordre organisé. Ce deuxième modèle du Grand Bazar s’est révélé propice à l’innovation sociale et bénéfique à l’innovation industrielle car il provoque d’une part un brassage qui fait barrière à la routine et de l’autre, des associations improbables

Page 27: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

25

Big

Dat

a –

Ope

n D

ata

ou opportunités hasardeuses qui ne sauraient résulter de calculs ou de modes opératoires conceptualisés.

Les soirées hackathon autour des projets de l’Open Data illustrent ce modèle de développement. Notons de plus que le double accès à ce processus d’innovation d’abord par des professionnels puis par des amateurs au xxe siècle, tel que Leadbeater et Miller l’analysent (Demos, 2004) confirme à la fois le succès et la faisabilité de la mise en œuvre de ce principe. Cependant, sur le terrain, le modèle de développement des logiciels libres n’est pas aussi horizontal ni aussi hasardeux que Raymond le lais-sait entendre. Le développement des logiciels libres et pas seulement, se caractérise quasiment toujours par un « noyau dur » de développeurs déterminant les grandes orientations du projet et autour duquel gra-vitent une communauté d’usagers et de contributeurs occasionnels comme l’ont montré Leadbeater et Miller en parlant de nébuleuse d’innovation. Il s’agit donc d’une autre utopie qui doit composer avec des paramètres de type organisationnels, nécessaires à l’innovation.

Le modèle de la participation et le crowdsourcing déjà actés comme modèles économiques (Bouquillion, Matthews, 2010) sont en passe de devenir également des modes de gestion usuels des affaires publiques, à côté des algorithmes informatiques, sur un principe issu des industries créatives. Le crowdsourcing constitue une alternative sérieuse et complémentaire à l’automatisation et apparaît de plus en plus déterminant dans certains domaines d’activités, confrontés à des problèmes que les algorithmes du Big Data sont (encore) incapables de résoudre. Pour le courant libertaire, cette participation du public dans la co-construction des connaissances est un gage que les biens et les services ainsi produits resteront ouverts et dans le domaine public.

La recherche en génomique fait appel de plus en plus au crowd-sourcing pour annoter et reconnaître des motifs. Les algorithmes travaillent ensuite sur ces annotations faites par les volontaires afin de chercher des corrélations en toutes directions. L’enjeu n’est rien moins que le brevetage du vivant14. Le premier à trouver un séquen-çage ou un lien entre un gène et une maladie peut le breveter, d’où une course entre recherche publique et privée, les acteurs publics tentant de mobiliser très largement les citoyens bénévoles non pas pour révolutionner la génomique, mais pour que les applications potentielles de ces recherches restent dans le domaine public. Selon Atal Butte (2014), l’industrie pharmaceutique est en crise à cause du coût élevé de la fabrication de nouveaux médicaments. Dans le même temps, le volume de données biomédicales en accès libre dépasse les capacités de traitement des chercheurs et scientifiques du domaine. Désormais, des entreprises se mettent à commercialiser des tests de laboratoires en ligne15, à partir d’échan-tillons jetés par les hôpitaux américains par manque de capacités de stockage. Pour continuer à disposer de nouveaux médicaments à un prix abordable, il pourrait bien échoir au grand public d’explorer ces masses de données pour tenter de découvrir de nouvelles molé-cules ou de nouveaux diagnostics. Ainsi, la participation du public

14 https://fr.wikipedia.org/wiki/Brevetage_du_vivant15 https://www.assaydepot.com/about

Page 28: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

26

ope

n, B

ig, c

olla

bora

tion

 : tr

ois

utop

ies

de l’

inno

vati

on a

u xxie  s

iècl

e

est déterminante dans ce secteur. En astronomie, le projet SDSS a donné lieu au projet de science participative Galaxy Zoo16 qui met à contribution les amateurs afin de classifier les images d’objets célestes collectées par le télescope SDSS. Lancé en 2007, il a suscité l’aide de plus de 150 000 participants qui ont conduit les scientifiques à détecter plus de 230 millions d’objets célestes.

De même, le projet eBird17 mené par l’Université de Cornell sollicite la participation des amateurs dans l’immense tâche de recensement et de description de toutes les espèces d’oiseaux, mission impossible pour les scientifiques au regard de leur temps et moyens. Cette initiative a permis de recueillir jusqu’à 160 millions observations venant de plus de 1000 observateurs et couvrant plus de 95 % des espèces d’oiseaux. Nous sommes bien loin du temps où l’expert patenté ou le scientifique étaient les seuls habilités à accomplir certaines tâches et surtout à s’y intéresser.Des centaines d’autres projets de science participative sont recensés (Heaton & Proulx, 2015). Plusieurs observateurs sont persuadés que les connaissances, les biens et les services seront de plus en plus co-construits par des amateurs qui sont de plus en plus jeunes (Butte, 2014).

4. opEn, biG, paRticipation : un tRianGlE vERtuEux ou viciEux ?

Si les deux idéologies – libertaire et ultralibérale, sous-jacentes à ces trois utopies de l’innovation paraissent de prime abord contra dictoires, il n’en demeure pas moins que sur le terrain de l’innovation, leurs modalités de mise en œuvre se conjuguent. L’ouverture implique la participation tout en accroissant le phénomène du gigantisme, tandis que la participation de la foule contribue à alimenter les algorithmes du Big Data en corpus d’apprentissage qui leur permet de s’affiner et d’améliorer leurs performances. L’image d’un triangle semble mieux rendre compte des interactions entre ces trois utopies.

figure 1. interactions entre les trois utopies : ouverture, participation et gigantisme

16 http://www.galaxyzoo.org/ 17 http://ebird.org/content/ebird/

Page 29: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

27

Big

Dat

a –

Ope

n D

ata

Cette alliance qui semble contre nature entre libertaires et ultra-libéraux n’est pourtant pas nouvelle. Dans « Aux Sources de l’utopie numérique. De la contre-culture à la cyberculture, Stewart Brand, un homme d’influence », Fred Turner (2006) montre qu’elle était déjà à l’œuvre dans la conception même de l’Internet, fruit de la rencontre de la contre-culture et des néo-communalistes américains dans les années 1960, porteurs d’une idéologie libertaire avec l’idéologie libérale et capitaliste des pionniers de la Silicon Valley. Ces deux mouvements s’unissaient dans leur affirmation de la liberté indivi-duelle créative, le rejet de la politique considérée comme étant le problème, leur amour pour la technologie numérique vue comme moyen d’émanciper l’homme et de changer la société.

Dans « L’Âge de faire », Lallement (2015) constate également qu’« un même appétit de liberté fonde la doctrine anarchiste et celle d’un capitalisme plus débridé ». L’idéologie libérale supplante l’idéologie libertaire lorsque l’attrait du marché devient trop fort. Cependant, ces deux courants idéologiques – libertaire et ultralibéral – captent les fruits du crowdsourcing, selon des objectifs opposés.

Ces trois utopies constituent-elles pour autant un triangle ver-tueux pour la science et la société ? Conjuguées, elles participent à l’émergence de ces technologies disruptives qui érodent peu à peu les monopoles des expertises dans plusieurs secteurs. L’entrée de la plateforme AirBnB dans le secteur de l’hôtellerie et de la société Über dans le secteur des transports urbains illustre la capacité qu’ont ces trois utopies à déstructurer l’équilibre entre acteurs économiques traditionnels d’un secteur par l’accroissement de l’entropie (désordre et incertitude). Pour le moment, seul le courant régalien est en mesure de juguler les effets de cette entro-pie par la recherche d’équilibre ou d’homéostasie ; les récentes législations pour le droit à l’oubli numérique18 par exemple ou d’autres législations visant à contraindre les sociétés du web à expliciter les termes et usages de leur collecte passive des données individuelles. Fondée sur l’écosystème des données, l’économie numérique a besoin d’un public massif qui est devenu tour à tour la matière première qui nourrit gratuitement cette économie en données personnelles sans contrepartie ; une main-d’œuvre gra-tuite via le crowdsourcing et les contributions en ligne ; la cible d’un marketing profilé grâce aux traces numériques fournies par ce même public et analysées par les algorithmes du Big Data.

Cependant, les participants ne sont pas devenus pour autant les nouveaux esclaves de l’économie numérique et du courant ultra-libéral. Ceux qui participent à une initiative de création de biens numériques le font soit par idéologie libertaire (pour protéger les « communs de la connaissance » contre la logique ultralibérale mar-chande), soit par pulsion épistémique (par désir de partager leurs connaissances et obtenir une reconnaissance auprès de leurs pairs).

Cette capacité qu’a le numérique à être à la fois source d’émanci-pation sociale et politique pour les citoyens, mais en même temps, source d’aliénation ou de soumission, est qualifiée de « paradoxical

18 Martin Untersinger, Internet : du devoir de mémoire au « droit à l’oubli », Le Monde, 24.09.2014

Page 30: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

28

ope

n, B

ig, c

olla

bora

tion

 : tr

ois

utop

ies

de l’

inno

vati

on a

u xxie  s

iècl

e

empowerment » par Proulx et Heaton (2015). Ce paradoxe engendre à la fois des « technologies génératives » et des évolutions sociétales inattendues qui seront à étudier attentivement.

Bibliographie

– andreJeviC (M.), « The Big Data Divide », dans International Journal of Com-munication, vol. 8 2014, pp. 1673-1689.

– auerbaCH (D.), « The Mystery of the Exploding Tongue. How reliable is Google Flu Trends? », Slate.com, 19 mars 2014. Consulté le 8 mars 2015. http://www.slate.com/articles/technology/bitwise/2014/03/google_flu_trends_reliability_a_new_study_questions_its_methods.html

– bankson (k. S.) et Soltani (A.), « Tiny constables and the cost of surveil-lance: Making cents out of United States v. Jones », Yale Law Journal, 123, 9 janvier 2013. http://yalelawjournal.org/forum/tiny-constables-and-the-cost-of-surveillance-making-cents-out-of-united-states-v-jones

– bouQuiLLon (Ph.) et MaTTHews (J.), Le Web collaboratif : mutations des indus-tries de la culture et de la communication, Grenoble, P.U.G., 2010.

– bowker (J.), « The Theory/Data Thing. Commentary », dans International Journal of Communication, vol. 8, 2014, pp. 1795-1799.

– bowker (G. C.), « Data flakes: An afterword to “raw data” is an oxymoron », dans L. Gitelman (dir.), « Raw data » is an oxymoron, Cambridge, MA, MIT Press, 2013, pp. 167-171.

– breTon (Ph.) et ProuLx (S.), L’Explosion de la communication : introduction aux théories et aux pratiques de la communication, Paris, La Découverte, 2005.

– busCH (L.), « A Dozen ways to Get Lost in Translation: Inherent Challenges in Large-Scale Data Sets », dans International Journal of Communication, vol. 8, 2014, pp. 1727-1744.

– CrawFord (k.), MiLner (k.), graY (M.L.), « Critiquing Big Data: Politics, Ethics, Epistemology », International Journal of Communication, 8, 2014, pp. 1663-1672. http://ijoc.org.

– CrawFord (k.) (2013, 1er avril), « The hidden biases in Big Data ». Consulté le 5 janvier 2015 http://blogs.hbr.org/cs/2013/04/the_hidden_biases_in_big_data.html.

– goLdaCre (B.) (2014, 5 déc.), « when data gets creepy: the secrets we don’t realise we’re giving away », The Guardian Technology. http://www.theguardian.com/technology/2014/dec/05/when-data-gets-creepy-secrets-were-giving-away.

– guCHeT (X.), « Évolution technique et objectivité technique chez Leroi- Gourhan et Simondon », Appareil, 2008. Consulté le 5 janvier 2015. http://appareil.revues.org/580.

– ibekwe-sanJuan (F.), « Big Data, Big machines, Big Science : vers une société sans sujet et sans causalité ? », 19e Congrès de la SFSIC, Toulon 4-6 juin 2014, 9 pages. http://sfsic2014.sciencesconf.org/browse/session?sessionid=5409.

– kosinski (M.), sTiLLweLL (D.), graePeL (T.), « Private traits and attributes are predictable from digital records of human behavior », dans Proceedings of the National Academy of Sciences (PNAS), 9/04/2013, vol. 110, no 15, pp. 5802-5805. http://www.pnas.org/cgi/doi/10.1073/pnas.1218772110.

Bibliographie

andreJeviC

munication (D.), « The Mystery of the Exploding Tongue. How reliable is

Google Flu Trends? », http://www.slate.com/articles/technology/bitwise/2014/03/google_flu_trends_reliability_a_new_study_questions_its_methods.html

(k. S.) et Soltani (A.), « Tiny constables and the cost of surveil-lance: Making cents out of 9 janvier 2013. http://yalelawjournal.org/forum/tiny-constables-and-the-cost-of-surveillance-making-cents-out-of-united-states-v-jones bouQuiLLon

tries de la culture et de la communication (J.), « The Theory/Data Thing. Commentary »

Journal of Communication (G. C.), «

dans L. Gitelman (dir.), Press, 2013, pp. 167-171.

(Ph.) et théories et aux pratiques de la communication,

(L.), « A Dozen ways to Get Lost in Translation: Inherent Challenges in Large-Scale Data Sets », dans vol. 8, 2014, pp. 1727-1744. CrawFord

Ethics, Epistemology », pp. 1663-1672. http://ijoc.org.CrawFord

le 5 janvier 2015 http://blogs.hbr.org/cs/2013/04/the_hidden_biases_in_big_data.html. goLdaCre (B.) (2014, 5 déc.), «don’t realise we’re giving away », theguardian.com/technology/2014/dec/05/when-data-gets-creepy-secrets-were-giving-away.

(X.), « Évolution technique et objectivité technique chez Leroi- Gourhan et Simondon », appareil.revues.org/580.

sanJuan

société sans sujet et sans causalité ? », Toulon 4-6 juin 2014, 9 pages. http://sfsic2014.sciencesconf.org/browse/session?sessionid=5409.

(M.), predictable from digital records of human behavior », dans of the National Academy of Sciencespp. 5802-5805. http://www.pnas.org/cgi/doi/10.1073/pnas.1218772110.

Page 31: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

29

Big

dat

a –

ope

n d

ata

– HeaTon (L.) et ProuLx (S.), « Paradoxical Empowerment: Immaterial Labor Translated in a web of Affective Connections », dans The Information Society: An International Journal, 2015, 31:1, pp. 28-35, http://dx.doi.org/10.1080/01972243.2015.977629.

– Janier (J.), Who Owns the Future?, Simon & Schuster, 2014. – LaCroix (J.-G.), TreMbLaY (G.), MoegLin (P.), Usages de la notion d’usages dans Les nouveaux espaces de l’information et de la communication, Inforcom, 8e Congrès de la SFSIC, Lille, 1992, pp. 241-248.

– MerTon (R. k.), « The Normative Structure of Science », dans R.k. Merton, The Sociology of science. Theoretical and empirical investigations, Univer-sity of Chicago Press, 1973, pp. 267-278.

– MoroZov (E.), To Save Everything, Click Here: The Folly of Technological Solutionism, PublicAffairs, 2014.

– ProuLx (S.), « Usages participatifs des technologies et désir d’émancipa-tion : une articulation fragile et paradoxale ». À paraître dans Communiquer. Revue internationale de communication sociale et publique, numéro sur les « Perspectives en communication », Montréal, hiver 2015, pp. 35-45.

– PusHMann (C.) et burgess (J.), « Metaphors of Big Data », International Journal of Communication, vol. 8, 2014, pp. 1690-1709.

– sHirkY (C.), Power Laws, Weblogs, and Inequality, 2003. http://www.shirky.com/writings/powerlaw_weblog.html.

– THaTCHer (J.), « Living on Fumes: Digital Footprints, Data Fumes, and the Limitations of Spatial Big Data », International Journal of Communication, vol. 8, 2014, pp. 1765-1783.

– Tedds (J.) et CaLLagHan (S.), « Guidelines on recommending data reposito-ries as partners in data publication », dans 9th International Digital Data Curation Conference, 24-27 février 2014, San Francisco, http://www.dcc.ac.uk/events/idcc14/day-two-papers.

– Turner (F.), Aux sources de l’utopie numérique. De la contre-culture à la cyberculture, Stewart Brand, un homme d’influence, C & F Éditions, 2012.

– ZiTTrain (J.), The Future of the Internet, Penguin Books, 2008.http://futureoftheinternet.org/files/2013/06/ZittrainTheFutureoftheInternet.pdf.

(L.) et Translated in a web of Affective Connections », dans Society: An International Journal0.1080/01972243.2015.977629.

(J.), (J.-G.),

Les nouveaux espaces de l’information et de la communicationCongrès de la SFSIC, Lille, 1992, pp. 241-248.

(R. k.), « The Normative Structure of Science », dans R.k. Merton, The Sociology of science. Theoretical and empirical investigationssity of Chicago Press, 1973, pp. 267-278.

(E.), Solutionism

(S.), « Usages participatifs des technologies et désir d’émancipa-tion : une articulation fragile et paradoxale ». À paraître dans Revue internationale de communication sociale et publiqueles « Perspectives en communication », Montréal, hiver 2015, pp. 35-45.PusHMann (C.) et of Communication

(C.), http://www.shirky.com/writings/powerlaw_weblog.html.

(J.), « Living on Fumes: Digital Footprints, Data Fumes, and the Limitations of Spatial Big Data », vol. 8, 2014, pp. 1765-1783.

(J.) et ries as partners in data publication », dans Curation Conferenceac.uk/events/idcc14/day-two-papers.

(F.), cyberculture, Stewart Brand, un homme d’influence

(J.), http://futureoftheinternet.org/files/2013/06/ZittrainTheFutureoftheInternet.pdf.

Page 32: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning
Page 33: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

31

Big data, médiatiOn symBOlique et gOuvernementalitéPr. Maude BONENFANT, [email protected] Pr. André MONDOUX, [email protected] Pr. Marc MÉNARD, [email protected] Pr. Maxime OUELLET, [email protected] Université du québec à Montréal, Canada

résuméLe Big Data s’inscrit, pour reprendre l’expression foucaldienne, dans la « volonté à disposer des hommes et des choses » et représente une gouvernementalité algorithmique (Rouvroy et Berns, 2014). Si les ana-lyses foucaldiennes se sont beaucoup centrées autour de problématiques institutionnelles, il est moins fréquent d’aborder la gouvernementalité sous l’angle de la sémiotique. Pourtant, en tant que forme de gouverne-mentalité, le Big Data s’y prête bien puisque, d’une part, il s’inscrit dans une logique de production du sens qui va de la donnée, à l’information et au savoir (kitchin 2014). D’autre part, cette logique de production se déploie par le biais d’une économie politique du signe, ne serait-ce que par ses modalités sociopolitiques et techniques qui à la base déterminent ce qui est capté et ce qui ne l’est pas (Vris, 2013). En ce sens, nous nous proposons dans cet article d’analyser la dynamique de gouvernementalité algorithmique associée au Big Data par le biais de ses dimensions sémiotiques. Plus concrètement, nous dissèquerons celle-ci en ses deux moments constitutifs, soit le mode de légitimation de cette gouvernementalité et ses modalités de subjectivation pour ainsi éclairer comment le Big Data peut produire une « action sur l’action ».

mots-clés : Big Data, sémiotique, gouvernementalité, symbolique, sub-jectivation.

Depuis les dernières années, le phénomène du Big Data occupe l’avant-scène de la « révolution numérique ». Sur le plan strictement informatique, le Big Data est généralement défini comme l’amal-game de quantités massives de données (volume) structurées et non structurées (variété), en temps réel ou quasi réel (vélocité) (Laney, 2001 ; Zikopoulos et al., 2012). L’analyse de ces quantités massives de données exige de nouvelles stratégies de traitement informatique, notamment des techniques de visualisation et surtout la mise en

Page 34: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

32

Big

dat

a, m

édia

tion

sym

boliq

ue e

t go

uver

nem

enta

lité

corrélation des données afin de produire des séries stochastiques permettant ainsi de prédire les états futurs des séquences étudiées (Finley, 2014). Sur le plan sociopolitique, le Big Data se caractérise également, en amont, par une dynamique de surveillance induite par la captation continue des données et, en aval, par une volonté de produire de la gouvernementalité (kitchin 2014) et une dyna-mique de médiation (Morozov 2013) s’appuyant sur un exercice de rationalisation du monde et de prétendues capacités de prédiction. Le Big Data se présente effectivement comme une gouvernementa-lité algorithmique (Rouvroy et Berns, 2014) désignant « un certain type de rationalité (a)normative ou (a)politique reposant sur la récolte, l’agrégation et l’analyse automatisée de données en quan-tité massive de manière à modéliser, anticiper et affecter par avance les comportements possibles » (Rouvroy et Berns, 2014 p. 10). En inspirant l’adhésion plutôt que de la forcer, cette gouvernementalité algorithmique participe d’une forme de subjectivité.

En outre, si les analyses foucaldiennes se sont beaucoup centrées autour de problématiques institutionnelles, il est moins fréquent d’aborder la gouvernementalité sous l’angle de la sémiotique. Pourtant, en tant que forme de gouvernementalité, le Big Data s’y prête bien puisque, d’une part, il s’inscrit dans une logique de pro-duction du sens qui va de la donnée, à l’information et au savoir (kitchin 2014). D’autre part, cette logique de production se déploie par le biais d’une économie politique du signe, ne serait-ce que par ses modalités sociopolitiques et techniques qui à la base déter-minent ce qui est capté et ce qui ne l’est pas (Vris, 2013) insufflant ainsi une « direction » certaine.

Nous nous proposons dans cet article d’analyser la dynamique de gouvernementalité algorithmique associée au Big Data par le biais de ses dimensions sémiotiques, sur la base de la théorie peircéenne du signe et de sa définition de l’indice et du symbole (1857-1892, Collected Papers). Plus concrètement, nous dissèquerons la gouver-nementalité algorithmique en ses deux moments constitutifs, soit son mode de légitimation et ses modalités de subjectivation pour ainsi éclairer comment le Big Data peut produire une « action sur l’action » et « […] de ce fait signer l’aboutissement d’un processus de dissipation des conditions spatiales, temporelles et langagières de la subjectivation et de l’individuation au profit d’une régulation objective, opérationnelle des conduites possibles, et ce, au départ de “données brutes” en elles-mêmes a-signifiantes […] » (Rouvroy et Berns, 2014, p. 16).

1. GouvERnEmEntalitÉ Et sÉmiotiquE

Sur le plan de la sémiotique sociale, la gouvernementalité algo-rithmique ne peut faire l’économie de son procès de légitimation. L’humain a un potentiel de néosémie, c’est-à-dire la capacité de créer ses propres signifiants. Du coup, voici simultanément instaurés l’ar-bitraire du signe et, surtout, la menace de polysémie. Voilà pourquoi, à l’instar de Lazzarato (2011), nous croyons que tout déploiement du sens exige de mettre frein à l’élan néosémique et polysémique par un nécessaire « asservissement sémiotique » (conventionalité

Page 35: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

33

Big

Dat

a –

Ope

n D

ata

et normalisation), un rapport de pouvoir marquant car « dans toute société la production de discours est à la fois contrôlée, sélectionnée, organisée et redistribuée par un certain nombre de procédures qui ont pour rôle d’en conjurer les pouvoirs et les dangers, d’en maî-triser l’évènement aléatoire, d’en esquiver la lourde, la redoutable matérialité » (Foucault, 1999, p. 11). Nous verrons comment à la base des dynamiques sémiotiques du Big Data prédominent non pas la médiation ou représentation symbolico-politique, mais bien les « traces » en tant que résultats d’opérations et d’actions. Cette emphase sur l’opérativité est ce que Lazzarato, à la suite des travaux de Guattari, nomme « signes a-signifiants » (Lazazrato, 2011) : des signes fondés sur des rapports « diagrammatiques », c’est-à-dire des liens de causalité de fonctionnement d’une machine – d’où le terme « asservissement machinique » proposé par l’auteur. Alors que la légitimation moderne (sociopolitique) était un procès ouvert sur sa propre remise en question de par l’arbitraire du signe, la gou-vernementalité algorithmique établit une rupture apparente avec le lien symbolique en lui substituant des logiques opératoires qui se légitiment par et en elles-mêmes, le diagramme faisant office de degré zéro, voire d’ontologie1.

Conformément au cadre foucaldien de gouvernementalité, cette dynamique d’asservissement, en plus d’induire la conventionalité nécessaire à la production du sens, participe également au déploie-ment d’une forme d’assujettissement d’où émerge une forme de subjectivité. Avec le Big Data, cet assujettissement ne s’adresse pas à la conscience individuelle : « [les signes a-signifiants] se branchent directement sur le corps (sur les affects, les désirs, les émotions et les perceptions) par des signes qui, au lieu de produire une signification, déclenchent une action, une réaction, un comporte-ment, une attitude, une posture. Ces sémiotiques ne signifient pas, mais mettent en mouvement, activent »2. Le sujet devient ainsi un « dividu » deleuzien : seules comptent ses opérations qui viennent s’ajouter aux autres actions afin d’individuer et faire fonctionner un ensemble machinique sur la base de réactions à des signaux3.

La gouvernementalité cesse ici d’être un rapport de pouvoir socio-politique et devient effectivement une puissance où le sujet n’a aucune emprise directe sur ce qui est ultimement présenté comme le « Réel » en soi (les données « brutes ») : il s’adapte simplement à des signes a-signifiants. Cette « misère symbolique » (Stiegler, 2004) est aussi une dépossession politique dans la mesure où le fonctionnement machinique est celui du temps dit réel, le temps de l’impulsion où la diade signal/action se fait stimuli/réponse – ce que certains n’hésitent pas à qualifier de « béhaviorisme cyber-nétique » (Edwards, 1996) ou d’occultation de l’expérience par le

1 Comme en témoignent à cet égard les travaux menés en informatique où l’ontologie s’actualise en « ontologies » : toutes relatives (« ontologie » au pluriel), mais à l’intérieur desquelles il y a un horizon indépassable (le propre d’une ontologie).2 Maurizio Lazzarato, « Le “pluralisme sémiotique” et le nouveau gouvernement des signes Hom-mage à Félix Guattari », European Institute for Progressive Cultural Policies, juin 2006, accédé en ligne à http://eipcp.net/transversal/0107/lazzarato/fr le 31 décembre 2014.3 Ainsi, les « Likes » de Facebook réduisent-ils la représentation des possibilités sémantiques à une simple binarité « action-clic “j’aime” »/ « Absence de clic-action » et où au final ne sera intégré que le nombre d’actions « j’aime », donnée qui elle-même engendra une autre action au sein des rapports diagrammatiques/machiniques.

Page 36: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

34

Big

dat

a, m

édia

tion

sym

boliq

ue e

t go

uver

nem

enta

lité

conditionnement (Stiegler, 2004). Nous voici alors en présence d’un sujet qui voit sa praxis troquée pour l’adaptabilité et la conformité à un ensemble machinique ; la prise en charge délibérative de sa vie collective est occultée par des impératifs fonctionnels.

2. biG data Et GouvERnEmEntalitÉ : lE modE dE lÉGitimation

En effet, la migration d’une multiplicité de nos activités quotidiennes vers le numérique entraîne désormais la production massive de traces, autant de résidus de nos opérations sans cesse plus nom-breuses dans un monde de plus en plus numérisé. Ces traces sont en partie volontairement produites par les usagers qui bloguent, postent, éditent des écrits, des bandes sonores, des images fixes et animées. Dans ces cas, les utilisateurs « veulent » laisser une trace, « volontaire » signifiant « qui résulte d’un acte de volonté, et non de l’automatisme, des réflexes ou des impulsions » (Le Grand Robert de la langue française, 2001). Or, la vaste majorité des traces est produite involontairement puisque, naviguant sur le web, utilisant notre cellulaire ou allant à un guichet bancaire, nous ne « voulons » pas laisser de traces. Cet effet est plutôt une conséquence acceptée, plus ou moins consciemment, de l’usage des technologies numé-riques qui génèrent de facto des traces4. Au contraire, refuser de produire des traces exige des compétences informatiques certaines – voire suspectes (comme l’encryptage). Participer à la production massive de traces est alors inéluctable pour la très grande majorité des utilisateurs.

L’usage des technologies numériques génère donc des traces qui s’accumulent dans d’immenses fermes de serveurs où elles sont stockées sous forme de « données ». Ces données deviennent ainsi décontextualisées, c’est-à-dire qu’elles sont extraites de leur contexte pragmatique de production pour devenir pré- analytiques et pré-factuelles. Décontextualisées, les données sont en outre désaf-fectées, c’est-à-dire qu’elles ne sont plus affectées (affects) d’une valeur, au sens éthique du terme : elles sont ne plus ni bonnes, ni mauvaises, ni vraies, ni fausses. Elles sont alors qualifiées de données « latentes et brutes » : « latentes », car elles sont en attente d’un sens, et « brutes », car pour les rendre signifiantes, il faut procéder à du « forage de données » – métaphore minière expri-mant l’extraction de données des entrepôts de stockage. Dans ce contexte, les données ne sont plus vues comme le produit d’une médiation symbolique ; au contraire, elles sont perçues comme préalables à l’information elle-même (kitchin, 2014) qui perd ainsi son statut de mètre étalon. Les données ne sont pas présentées comme le fruit d’une production symbolico-politique, mais bien comme des données « naturelles » – plus précisément comme des traces d’opérations. En apparence, la médiation symbolique semble être disparue au profit d’un rapport indiciaire référant à des rapports de fonctionnement où les sémiotiques a-signifiantes

4 Nous reconduisons ainsi la conception de Stiegler pour qui la technique est essentiellement mé-moire ; ici, mémoire de ses propres opérations.

Page 37: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

35

Big

Dat

a –

Ope

n D

ata

ne s’adressent pas à la conscience humaine qui ainsi n’est plus directement impliquée dans la production du sens ; la produc-tion survient après sa mise en relation avec les autres opérations (analyses corrélatives, visualisation et pronostiques prévisionnels) composant l’assemblage machinique du Big Data.

Vu l’occultation de la médiation symbolique, cette production du sens apparaît alors comme le dévoilement du réel lui-même. Nous retrouvons ici la précession des simulacres chers à Baudrillard, une dynamique où « nous ne pouvons plus imaginer d’autre univers [car] la grâce de la transcendance nous a été ôtée aussi » (Baudrillard, 1981 p. 180). Les données deviennent le réel, lui qui a été mis à plat dans de gigantesques bases des données : « il s’agit d’une substitution au réel des signes du réel, c’est-à-dire d’une opération de dissuasion de tout processus réel par son double opératoire, machine signalétique métastable, programmatique, impeccable, qui offre tous les signes du réel et en court-circuite toutes les péripéties » (Baudrillard, 1981 p. 11). Cette prétention du Big Data n’est pas sans rappeler une autre notion de Baudrillard, soit celle d’hyperréel comme le « produit de synthèse irradiant de modèles combinatoires dans un hyperespace sans atmosphère » (Baudrillard, 1981 p. 11). L’hyperréel est la carte qui n’a plus besoin du territoire pour exister : « le territoire ne précède plus la carte, ni le lui survit » (Baudrillard, 1981 p. 10). En ce sens, les technologies prédictives du Big Data fonctionnent également sur la prémisse de révéler le devenir de ce qui n’est pas encore advenu et ainsi « plus jamais le réel n’aura l’occasion de se produire » (Baudrillard, 1981 p. 11). Baudrillard ajoute : « ici le double a disparu, il n’y a plus de double, on est toujours déjà dans l’autre monde, qui n’en est plus un autre, sans miroir ni projection ni utopie qui puisse le réfléchir – la simula-tion est infranchissable, indépassable, mate, sans extériorité – nous ne passerons même plus “de l’autre côté du miroir”, ceci était encore l’âge d’or de la transcendance » (1981 p. 11).

Infranchissable et indépassable. Voilà bien la grande distinction du mode de légitimation de la gouvernementalité qui se déploie par le Big Data. Nous sommes passés d’une forme symbolico-politique de production du sens, qui impliquait une prise en charge délibé-rative et collective de la destinée du vivre-ensemble (praxis), à une dynamique opérationnelle autoréférentielle. La gouvernementalité pré-algorithmique était fondée sur un rapport de transcendance à l’Autre ; une dynamique d’inachèvement perpétuel (le symbolique a pour propriété ontologique de ne jamais coïncider avec l’objet de la représentation) garante de la liberté et possibilité d’une produc-tion continuelle devant ainsi, pour reprendre l’expression de Lefort (1986), toujours refaire l’épreuve de son institution (c’est-à-dire sa mise en rapport avec d’autres formes symbolico-politiques). En d’autres termes, les liens entre les pratiques symboliques et l’ins-titutionnalisation de la société étaient explicites et mutuellement nécessaires. Sous le régime sémiotique machinique, au contraire, émerge un mode de légitimation qui écarte le rapport au transcen-dantal au profit de ce que Freitag (1986) appelait, en parlant de la reproduction et régulation des « pratiques significatives », le mode décisionnel-opérationnel, soit une dynamique de désymbolisation du monde sur la base d’un rapport d’objectivation du social qui

Page 38: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

36

Big

dat

a, m

édia

tion

sym

boliq

ue e

t go

uver

nem

enta

lité

occulte les liens entre pratiques symboliques et société au profit d’une technocratisation de la société. Se projetant comme « naturel » et porteur du « Réel » lui-même, le Big Data se présente ainsi en monde « achevé » ; conséquence lourde puisqu’il n’est plus possible de contester cette représentation, car celle-ci n’est plus considérée comme une construction (comme un discours symbolico-politique). Par cette naturalisation des traces numériques, c’est le social lui-même qui est « oublié », rendu caduque. Il faut alors se questionner si non seulement une telle société est démocratique, mais si elle est toujours politique en soi.

3. l’assERvissEmEnt sÉmiotiquE : foRmE sociohistoRiquE

Définir l’asservissement sémiotique propre à la gouvernementa-lité algorithmique nécessite deux axes d’interrogation. Le premier consiste à dévoiler le « biais » inhérent à son individuation, c’est-à-dire la nécessité d’avoir à revêtir une forme plutôt qu’une autre. Autrement dit, malgré les prétentions et projections, les sémio-tiques machiniques ne sont pas neutres et relèvent également d’une construction symbolico-politique. Le second vise à identifier la forme de subjectivité qui participe à l’individuation des rapports de gouvernementalité en agissant de façon à (re)produire ceux-ci (l’action sur l’action).

Malgré son apparente naturalisation, les technologies et données du Big Data ont toujours été des constructions symbolico-poli-tiques, ne serait-ce, comme le souligne Vris (2013), que par ce qui est choisi d’être capté et valorisé en données et l’horizon de ce qui est alors technologiquement possible de capter. Or, il s’agit également d’une dynamique d’accumulation de données, car plus celles-ci sont nombreuses, meilleure sera la fiabilité statistique de l’assemblage machinique en ce qui a trait à la qualité de l’échan-tillonnage et au taux de réussite des prévisions. Ici, sur le plan des représentations, le fantasme sous-jacent est d’obtenir toutes les données5 pour ainsi coïncider effectivement avec le « Réel » : « This fantasy furthers our sense that our contribution to circulating content matter by locating them in the most significant of possible spaces – the global. […] Networked communications materialize specific fantasies of unity and wholeness as the global. These fan-tasies in turn secure networked transactions as the Real of global capitalism » (Dean, 2009 p. 42).

Cette dynamique d’accumulation induit la numérisation d’une immense quantité d’actions de la vie quotidienne autrefois hors repérage statistique (emprunter un livre à la bibliothèque, acheter un pain, etc.) et qui acquièrent ainsi le potentiel de devenir « significatives » après traitement dans l’assemblage machinique. À son paroxysme, il s’agit d’une dynamique de surproduction de données informant la construction symbolique de l’asservissement

5 La généalogie du Big Data comprend notamment le programme Total Information Awareness du Pentagone (2000 – 2003) dont le legs a été retransmis aux programmes de la NSA révélés par Snowden.

Page 39: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

37

Big

Dat

a –

Ope

n D

ata

machinique à l’excès ; une « hypersymbolisation », c’est-à-dire une traduction conventionnelle en données et langages informatiques d’une part de plus en plus large du monde. Cette hypersymbolisa-tion du monde entraine une « hyperréalité », comme en témoigne la notion de « réalité augmentée » proposant de faire l’expérience d’un « Réel » plus efficient, plus performant et – néolibéralisme oblige – plus personnalisé.

Nous pouvons observer les vecteurs d’individuation de cette dynamique d’accumulation dans la sphère politico-économique où, par exemple, la marchandisation des données – on songe en particulier aux opérations de profilage au cœur du média socionumérique Facebook – alimente désormais les circuits du Big Data et où effectivement les médias socionumériques contri-buent significativement à l’apport de données « non structurées ». Ainsi, les circuits du Big Data participent-ils aux flux marchands : les usagers- consommateurs génèrent des traces (opérations de navigation, de choix et de préférences manifestés, etc.) qui sont amalgamées en profils afin d’accroitre la précision du ciblage publicitaire et qui sont, par la suite, traitées algorithmiquement afin de modéliser les futures traces (opérations) des usagers et ainsi (re)produire la dynamique du Big Data dans son ensemble. Cette même dynamique s’observe également sur le plan politique où le déploiement de mesures de sécurité (lutte au terrorisme) induit les mêmes nécessités de collecte de données à des fins de profilage et de prévision. Ces similitudes entre captation de données en temps réel, profilage, stockage, traitement algorithmique et projections anticipatrices favorisent en retour la dynamique néolibérale de privatisation des prérogatives étatiques par les transferts socio-techniques entre l’État et le marché6.

Le circuit du Big Data n’est donc jamais une instrumentalisation neutre, au contraire. L’individuation du Big Data se fait par et dans un environnement socioéconomique qui l’informe de cer-taines nécessités. Voilà pourquoi, en tant que circuit de production du sens, le Big Data constitue bel et bien un asservissement sémiotique spécifique relevant d’un ordre symbolico-politique seulement en apparence occulté. La question est donc mainte-nant d’identifier quelle forme de subjectivité cet asservissement conduit à produire.

4. la subjEctivitÉ alGoRithmiquE

Au sein de l’asservissement traditionnel ou pré-machinique et pré-algorithnmique, il y a toujours un écart entre le signe et le « Réel ». Voilà pourquoi les pratiques sémiotiques sont ainsi à la fois « fermées », la conventionalité induisant des usages prescrits, et « ouvertes », c’est-à-dire appropriables. Comme le souligne De Certeau (1990), les pratiques deviennent ainsi le lieu de micro

6 Transferts qui datent, rappelons-le, dès le début des technologies numériques (1940) alors que l’armée américaine était simultanément bailleur de fonds de la recherche qui était transférée aux entreprises privées (dont et principalement IBM) qui trouvaient en ce même État leur principal client pour leurs produits numériques (Mondoux 2011).

Page 40: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

38

Big

dat

a, m

édia

tion

sym

boliq

ue e

t go

uver

nem

enta

lité

pouvoirs et micro libertés où le braconnage tactique peut devenir un usage prescrit futur (comme l’a démontré l’histoire du format de musique MP3). La situation est différente avec les sémiotiques machiniques où la médiation, soit l’opération de représentation, est occultée au profit de la projection d’un lien direct avec le « Réel » présenté sous forme de données brutes devenues autant d’indices sur le monde.

C’est ainsi que les traces générées acquièrent une valeur indiciaire. L’indice, en effet, est le « signe qui renvoie à son objet par une relation physique, par une connexion et par action sur le signe » (Grand Robert de la langue française, 2001). Selon la théorie peir-céenne du signe, l’indice entretient un rapport de contigüité entre le signe et l’objet : « [les signes indiciels] provoquent un renvoi vers leur source. Ils fonctionnent alors selon le principe de l’indi-cation »7. La source, ici, est l’opération, l’origine des traces et, au sein des rapports diagrammatiques de l’assemblage machinique, s’établira alors la production d’un « sens » qui se traduira par un lien de fonctionnement entre cette opération et une nouvelle action pour ainsi produire une dynamique sémiotique a-signifiante. Telle est la gouvernementalité algorithmique à laquelle participe le Big Data : les actions (utilisation d’outils numériques) génèrent des traces dont le traitement induit machiniquement et automatique-ment d’autres actions par les « réponses » envoyées aux usagers sous forme de signaux. Ainsi, les amateurs de la quantification de soi (soit la valorisation de la représentation de soi sous forme de données numériques quantifiables) utilisent des bracelets ou montres pour générer automatiquement des données biométriques (poids, calories brulées, nombre de pas parcourus, etc.) dont l’ana-lyse algorithmique consiste à renvoyer aux usagers – toujours automatiquement – des signes a-signifiants se posant en impéra-tifs à l’action sous forme de stratégies permettant d’atteindre des objectifs (nombre de calories supplémentaires à bruler, nombre de pas additionnels à parcourir, etc.). Il s’agit bien d’une sémio-tique machinique puisque, d’une part, le sens ici est constitué par l’automatisation de rapports de fonctionnement (opérativité) et cela, d’autre part, au nom d’une efficience instrumentale (la technè comme moyen pour atteindre un résultat).

La forme de subjectivité produite par l’asservissement sémiotique machinique ne permet donc pas une interprétation et réappro-priation du sens qui ici devient, de par les liens d’opérativité, l’équivalent, en effet, d’un signal, soit un « signe naturel ou fabriqué qui fait agir le récepteur d’une certaine façon ; signe volontaire-ment produit pour être un indice » (Le Grand Robert de la langue française, 2001). Dans le contexte des technologies numériques, le signal véhicule une information jusqu’à l’interface de l’utilisateur qui ainsi le « reçoit » et y « répond » en conséquence. Il y a lieu de souligner ici que cette « mise en signal » des signes avait été perçue et annoncée par Henri Lefebvre (1967). Selon lui, la vie quotidienne est caractérisée par un champ sémantique qui, vu la technocratisation croissante de la société, se déploie sous forme

7 Bernard Darras, « Sémiotique pragmatique et photographie numérique. Le cas de la retouche pho-tographique », Recherches sémiotiques/Semiotic Inquiry, vol. 28, no 1-2, 2008, pp. 153-175.

Page 41: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

39

Big

Dat

a –

Ope

n D

ata

d’un système où, « lorsque les référentiels s’estompent, le méta-langage l’emporte »8. Au final, « on passe d’une philosophie de la liberté […] à une philosophie des contraintes »9 et ce, selon une dynamique où « […] les appareils et institutions, tout en assurant la reproduction des rapports de production et de domination, assurent également leur propre reconduction »10.

Au sein de cette signalétique, le sujet n’est plus en posture de réflexivité face à un social ainsi « oublié » et qui revêt la forme d’une logique de stimuli-réponses, soit une dynamique visant à induire des comportements pulsionnels (Stiegler, 2004). En effet, ces comportements pulsionnels sont fondés sur des rapports opé-rationnels (d’action à action) en temps réel, sans parler du fait que les sémiotiques a-signifiantes ne s’adressent effectivement plus à la conscience11. Il faut retracer l’origine de cet ordre sym-bolico-politique « machinique » à la pensée cybernétique pour qui la dynamique communicationnelle consiste essentiellement à convertir les messages entrants en messages sortants (wiener, 1966) pour ainsi former un véritable « béhaviorisme cybernétique » (Edwards, 1996 ; Mondoux, 2011). Face à cette signalétique, le sujet n’a d’autre choix que de s’adapter au signal considéré comme le « Réel », toute résistance ne pouvant se déployer qu’au risque de se voir exclu du monde (le malade, le barbare ou le terroriste).

Au sein de cet asservissement sémiotique machinique, l’individu y trouve en quelque sorte son compte puisque (enfin) délié des liens symbolico-politico, « l’empowerment » tant célébré dans les médias socionumériques comme émancipation face aux grandes idéologies, il peut alors s’abandonner dans la libre gratification, car il est libéré du social et de sa conventionalité « restrictive » (Lipovetsky, 1982). Ne recevant plus son statut de l’altérité sociale, le sujet non seulement peut, mais doit alors se dire, forger – et surtout – exprimer sa subjectivité, ce que permettent juste-ment les médias socionumériques en favorisant les quêtes et expressions identitaires (Mondoux, Ménard et Bonenfant, 2014). Ainsi la boucle est-elle bouclée : les sujets utilisent des médias numériques pour se dire et se représenter, usages générant des traces dont la captation et le traitement induisent un mode de gouvernementalité (les actions « programmant » d’autres actions) caractérisé par une forme de subjectivité fondée sur l’autodivulga-tion et représentation de soi par le biais d’actions effectuées avec les médias numériques qui ainsi acquièrent le statut de « social », c’est-à-dire formant une dynamique d’institutionnalisation des rapports de gouvernementalité.

8 Henri Lefebvre, Vers le cybernanthrope, Paris, Denoël/Gonthier, 1967, p. 88.9 Ibid., pp. 111-112.10 Henri Lefebvre, De l’État. IV Les contradictions de l’État moderne, Paris, 10/18, 1978, p. 365.11 On songe notamment, non sans effroi, à l’émergence des techniques dites du neuro-marketing…

Page 42: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

273

table des matières

SoMMAiRE 5

intRoDUCtionEvelyne BRoUDoUX, Ghislaine CHARtRon 91. Responsables de la conférence 122. Comité de lecture 12

PARtiE 1 EnjEUX éPiStéMoloGiqUES 15

open, Big, Collaboration : trois utopies de l’innovation au xxie siècle

Fidelia ibekwe-Sanjuan, Françoise Paquienséguy 17 Introduction : vers un renouveau cybernétique ? 181. L’Ouverture (Open) 192. Le Gigantisme (Big) 213. La Participation 244. Open, Big, Participation : un triangle vertueux ou vicieux ? 26 Bibliographie 28

Big Data, médiation symbolique et gouvernementalitéPr. Maude BonEnFAnt, Pr. André MonDoUX, Pr. Marc MénARD, Pr. Maxime oUEllEt 311. Gouvernementalité et sémiotique 322. Big Data et gouvernementalité : le mode de légitimation 343. L’asservissement sémiotique : forme sociohistorique 364. La subjectivité algorithmique 37Bibliographie 40

l’ambiguïté épistémologique des big data : le cas de la donnée web en sciences sociales

Eglantine SCHMitt 43 Introduction 431. Des big data aux matériaux issus du web 45

Page 43: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

274

tabl

e de

s m

atiè

res

|

2. Le matériau du web, entre donnée expérimentale et trace numérique 47

3. Les trois statuts de la donnée construite à partir du web 50 Conclusion 52 Bibliographie 52

transparence et big data : revers et infortunesHélène jEAnnin 55Introduction 551. Acteurs et discours de la transparence :

les hackers et leurs contradictions 562. Comment la figure du « hacker » sert à cautionner

des dispositifs sécuritaires inédits 593. La transparence des corps et la fin de l’intimité 61 Conclusion : une « société transparente »

(Brin, 1998) est-elle souhaitable ? 62 Bibliographie 63

PARtiE 2 EnjEUX PolitiqUES Et éConoMiqUES 65

Enjeux géopolitiques des données, asymétries déterminantesGhislaine CHARtRon, Evelyne BRoUDoUX 671. Pourquoi parler de géopolitique ? Le cyberespace de retour… 682. De la géopolitique du cyberespace

à la géopolitique des données 692.1 La donnée, au cœur de l’économie numérique

et de l’apparente gratuité des services 692.2 Les données au carrefour de l’économie numérique,

de la sécurité, des droits fondamentaux et des diversités culturelles 72

3. Des asymétries déterminantes pour la géopolitique des données 733.1 Le concept d’asymétrie au cœur des enjeux 733.2 Données et asymétries technologiques 733.3 Asymétrie de la captation des données 773.4 Asymétrie, données et cadres législatifs 783.5 Asymétrie contenu/contenant : les opérateurs

techniques (vs) les producteurs des contenus 80

Page 44: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

275

Big

Dat

a –

Ope

n D

ata

Conclusion : Quelle société pour demain ? 81 Bibliographie 82

la plateforme de diffusion de données, un modèle de gouvernement urbain ?

Antoine CoURMont 85Introduction 851. Le modèle de la plateforme participe

à la metropolisation par la centralisation et la standardisation des données urbaines 861.1 La centralisation : construire une plateforme

métropolitaine 871.2 La standardisation : faciliter la circulation des données 881.3 Plateforme et métropolisation 89

2. « Data friction » et transformation du modèle de la plateforme 902.1 Toutes les données ne sont pas mises

à disposition : frictions et alignement des intérêts 902.2 La standardisation est limitée : l’héritage

des données persiste 922.3 Un modèle hybride d’assemblage de données

sur l’espace métropolitain 93 Conclusion 93 Bibliographie 94

Management de l’information publique et innovation numérique de services urbains : l’intelligence territoriale en perspective

jean-Baptiste lE CoRF 97 Introduction 981. L’éditorialisation des données publiques

au sein des portails Open Data 1012. L’organisation de la participation des développeurs

web dans la gouvernance de l’ingénierie documentaire et des services urbains 1052.1 Les développeurs d’applications et de services

urbains : des cibles de l’offre de données 1052.2 Concertation locale et management informationnel 107

Conclusion 110 Bibliographie 111

Page 45: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

276

tabl

e de

s m

atiè

res

|

Valorisation des données ouvertes : acteurs, enjeux et modèles d’affaires

Slim tURKi, Muriel FoUlonnEAU 113 Introduction 1131. Écosystème de la valorisation des données ouvertes 114

1.1 Fournisseurs 115Fournisseurs publics 116Fournisseurs privés 117

1.2 Facilitateurs 1171.3 Développeurs d’applications 1171.4 Enrichisseurs 1191.5 Agrégateurs 119

2. Réseau de valeurs 1203. Service basé sur les données ouvertes :

viabilité et pérennité 122 Conclusion et perspective 123 Bibliographie 124

Big data for improving open e-government servicesFouad nAFiS, Siham YoUSFi, Dalila CHiADMi 127 Introduction 1271. Related works 1282. Big data, Open data, government data: definitions 128

2.1 Characteristics of Big data 128Volume 128Velocity 128Variety 129Veracity 129Value 129

2.2 Open data 1292.3 Government data 130

3. Open data platform in Morocco 130The proposed solution 132

Proposed architecture 1324. Big data to improve E-GOV services 132

4.1 Health sector 1324.2 Education 1334.3 Cartography 133

Page 46: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

277

Big

Dat

a –

Ope

n D

ata

4.4 Meteo 1334.5 Finance 133

Conclusion and perspectives 134 References 134

la controverse épistémologique Big Data face à la réalité de l’appropriation de nouveaux paramètres  par les acteurs métier en entreprise

Anna nESVijEVSKAiA 1371. Contexte et enjeux 2. Posture épistémologique

et approche méthodologique 1393. Cas 1 : le traitement du cancer du sein triple négatif

et l’enrichissement de la méthode hypothético-déductive par l’analyse cluster sans hypothèse préalable 140

4. Cas 2 : L’analyse de campagnes publicitaires M6 et la dynamique de transformation des connaissances métier 142

5. Cas 3 : Le dispositif télématique sur les plateaux d’assistance IMA, la transformation du processus de création de connaissances et les enjeux de responsabilité lors de la prise de décision 144

Conclusion 146 Limites et Perspectives 147 Bibliographie 148

PARtiE 3 EnjEUX SoCiétAUX 151

Datavisualisation : principes, enjeux et perspectives pour des utilisateurs non experts

Béa ARRUABARREnA 153Introduction 1531. Principes 155

1.1 La Datavisualisation, un processus de traitement des données 155

1.2 Typologie et outils 1561.3 Objectif, la médiation Interaction Homme-Données 157

Page 47: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

278

tabl

e de

s m

atiè

res

|

2. Enjeux pour des utilisateurs non experts 1582.1 La datavisualisation, une littératie

info-communicationnelle ? 1582.2 Voir pour comprendre et comprendre pour voir 159

3. Perspectives : penser les systèmes de connaissance de demain pour des utilisateurs non experts 160

Bibliographie 162

la datavisualisation comme outil de pilotage de la recherche scientifique médicale au sein de la Faculté de Médecine et de Pharmacie de Casablanca

Hanae lRHoUl, Ghislaine CHARtRon, Ahmed BACHR, othman BEnAMMAR 1651. Introduction 166

1.1 Contexte 1661.2 Objectif de l’étude 1671.3 Méthodologie 1671.4 Définition des concepts 168

2. Revue de la littérature 1682.1 De la scientométrie à la cartographie de la science 1682.2 Cartographie de la science 1692.3 Cartographie scientifique : pour un meilleur

pilotage de la recherche scientifique 1692.4 Cartographie des collaborations 170

3. Résultat 1713.1 Analyse de la production scientifique de la FMPC 171

Évolution de la production scientifique 171Revues nationales et internationales 171Où publient nos chercheurs ? 171

3.2 Collaborations scientifiques 172Réseaux de collaboration 172Communautés scientifiques internationales 173

Conclusion 173 Remerciements 177 Bibliographie 178 Annexe 1

Les niveaux de la cartographie de données abstraites : de l’information à sa visualisation (Christophe Tricot, 2006) 180

Page 48: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

279

Big

Dat

a –

Ope

n D

ata

Annexe 2 Liste des principales revues nationales et internationales 181

Urban Data et stratégies dans le secteur des services : le cas de la métropole lyonnaise

Valérie lARRoCHE, Martine VilA-RAiMonDi 183 Introduction 1831. L’innovation collective dans les environnements

urbains complexes 1851.1 La plateforme Data GrandLyon comme acteur

pivot de l’écosystème de la smart city de Lyon 1851.2 Les acteurs en présence 186

2. La médiation au cœur des logiques partenariales : l’exemple d’Optimod 1882.1 Le Grand Lyon, médiateur de données 1882.2 Les partenaires, acteurs du projet Optimod 189

3. Les stratégies au service de l’innovation : le cas de Tubà à Lyon 1913.1 Tubà : un lieu ouvert à l’innovation permanente 1913.2 L’usager des services de la smart city

et des data au cœur de l’espace public 192 Conclusion 193 Bibliographie 194

Adaptation normative des Big Data et du learning AnalyticsMokhtar BEn HEnDA 1971. Big Data : un concept pas aussi inédit qu’on le pense ! 197

1.1 Un Big Data de l’imprimé 1981.2 Un pré Big Data numérique 1991.3 Le Big Data du numérique mobile 200

2. Des Big Data sectorielles et besoin de convergence 2012.1 Big Data et Data Analytics :

une nouvelle stratégie informationnelle 2022.2 Vers de nouvelles normes de Big Data 203

3. Big Data et Learning Analytics : l’apport des normes éducatives 2053.1 Learning Analytics et besoins de normes

pour l’éducation en ligne 205

Page 49: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

280

tabl

e de

s m

atiè

res

|

3.2 Le SC36/WG8 : pour une analytique interopérable de l’apprentissage 207

Conclusion 210Bibliographie 211

Reconstruire le sens associé à l’archive : mobilisations sémiotique et documentaire du linked open Data

lénaïk lEYoUDEC 2131. Mobiliser le web des données

dans un cadre patrimonial 2152. L’archive filmique comme matière première

de l’expérimentation sémiotique 2172.1 Présentation du corpus 2182.2 Autour de la méthodologie construite 2182.3 Étude sémiotique du film Vues de Biarritz

et de Bayonne (Inconnu, 1950) 2192.3.1 Description 2192.3.2 Étude du contexte 2212.3.3 Interprétation 221

2.4 Bilan de l’étude sémiotique 2223. Instrumentation documentaire

de l’archive au sein d’un artefact éditorial 224 Conclusion 225 Bibliographie 226

PARtiE 4 EnjEUX tECHniqUES 227

DataCite au service des données scientifiques – identifier pour valoriser

Herbert GRUttEMEiER 229 Introduction – 4e paradigme et open data 2301. Le consortium DataCite 2312. Les services DataCite 2323. Identifiants pérennes 2344. Publication et citation de données 2365. Perspectives 238 Bibliographie 239

Page 50: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

281

Big

Dat

a –

Ope

n D

ata

Un modèle Big Data orienté vers la cyberdémocratieYoussef tAHER 241Introduction 2411. Big Data et la cyberdémocratie 2422. Discussion du modèle Big Data proposé 244

2.1 Premier niveau d’intelligence Big Data 2462.2 Deuxième niveau de modélisation

et de conception d’un programme électoral 2472.3 Troisième niveau de partage

et de publication d’un programme électoral 248 Conclusion 248 Bibliographie 249

Vers une stratégie collaborative centrée sur les apprenants et les données du Big Data pour améliorer le processus d’apprentissage en ligne

Boubker SBiHi, imad BElGHit, Badr ElHAil, Rachid GoUARti 2511. Introduction 2522. Le E-learning comme approche pédagogique interactive 2543. Le rôle des MOOCS dans le E-learning 2554. Les phases de la stratégie pédagogique 2565. Indicateurs et dimensions de la stratégie E-learning 259

5.1 Les indicateurs de base 2595.2 Dimensions de la stratégie 260

6. Apport du Big Data dans la dernière phase de la stratégie 2606.1 Établir les besoins et les priorités 2616.2 Définir les indices de performance 2626.3 Évaluation de la formation 262

Conclusion 262 Bibliographie 263

MapReduce for optimizing Big Electronic Records indexing process

Siham YoUSFi, Maryem RHAnoUi, Mounia MiKRAM 265Introduction 2651. Background 266

1.1 Big data 2661.2 Record management 267

Page 51: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

282

tabl

e de

s m

atiè

res

|

2. Big Electronic Records 2672.1 Case of Study: Judicial Records 2672.2 Big Electronic Record 2682.3 Problem Statement 268

3. Applying MapReduce for indexing BER 2683.1 Mapreduce 2683.2 Indexing with MapReduce 269

Indexing by token 269Indexing by term 269Indexing by document 269

3.3 Semantic analysis of BER using Mapreduce 270 Conclusion & perspectives 272 References 272

Page 52: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning
Page 53: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning
Page 54: EVELYNE BROUDOUX Big data – Open data · La controverse épistémologique Big data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs ... et du Learning

&Informat onstratég e

Big data – Open dataQuelles valeurs ? Quels enjeux ?

Sous la direction de Evelyne Broudoux

et Ghislaine Chartron

WWW.DEBOECKSUPERIEUR.COM

OPEDATISBN 978-2-8073-0031-6

ISSN 2295-3825

Depuis 2006, la conférence « Document numérique et société » se donne pour mission d’apporter des éclairages sur les transformations des dispositifs d’information à l’ère numérique, en privilégiant la dimension sociale.

Cette 5e édition se focalise sur l’effervescence autour du Big data et de l’Open data qui anime autant les milieux d’affaires que les gouvernements et les scientifi ques. Elle s’explique par l’interconnexion généralisée transformant l’économie des services et les internautes en fournisseurs de données, mais également par l’importance grandissante de l’internet des objets et, d’une manière générale, par les capacités computationnelles qui traitent désormais l’information sur toute sa chaîne de production-diffusion et transformation.

Cet ouvrage rassemble les textes présentés lors du colloque de Rabat les 4 et 5 mai 2015, des recherches théoriques, expérimentales et des analyses critiques qui s’inscrivent dans la perspective des études sur le phénomène du Big data et de l’Open data en termes d’enjeux pour nos sociétés et de création de valeurs.

EVELYNE BROUDOUX est maître de conférences en Sciences de l’information et de la communication au CNAM et membre de l’équipe de recherche DICEN-IDF. Ses travaux de recherche portent sur l’évolution des pratiques auctoriales, éditoriales et des mesures d’autorité à l’heure du web et du Big data, dans les champs intéressés par la création et l’innovation. Elle est co-fondatrice de la conférence « Document numérique et société ».

GHISLAINE CHARTRON est professeur en Sciences de l’information et de la communication au CNAM. Elle est titulaire de la chaire d’ingénierie documentaire et dirige un institut de formation aux métiers de l’information (INTD). Ses travaux concernent les transformations des modes de production et de diffusion de l’information ainsi que l’évolution des modèles économiques des industries des contenus. Elle est co-fondatrice du laboratoire DICEN-IDF et de la conférence « Document numérique et société ».

Créée en 1963, l’ADBS (Association des Professionnels de l’information) fédère une grande variété de professionnels de l’information numérique (veilleurs, knowledge managers, gestionnaires de contenus numériques, documentalistes, records managers, etc.). Elle compte plus de 4000 membres en France. En 2013, l’ADBS s’associe aux éditions De Boeck pour créer la collection « Information & Stratégie » qui allie les savoir-faire des deux partenaires.

&Informat onstratég e

Big

dat

a –

Ope

n da

taEv

elyn

e Br

oudo

ux |

Ghi

slai

ne C

hart

ron

Desi

gn c

eris

e.be

Actes du colloque « Document numérique et société », Rabat, 2015

Pour les professionnels de l’information ; pour les chercheurs, enseignants et étudiants en information, documentation et humanités numériques.