129
CNRS – Direction de l’Information Scientifique et Technique 1 « MIEUX PARTAGER LES CONNAISSANCES » Pour une information scientifique et technique claire, interopérable, pérenne Bilan d’étape (2014-2017) Rapport de stage de Louki-Géronimo Richou, SciencesPo Sous la direction de Renaud Fabre, DIST du CNRS Juillet 2017

« MIEUX PARTAGER LES CONNAISSANCES

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

1

« MIEUX PARTAGER LES CONNAISSANCES »

Pour une information scientifique et technique claire, interopérable, pérenne

Bilan d’étape (2014-2017)

Rapport de stage de Louki-Géronimo Richou, SciencesPo Sous la direction de Renaud Fabre, DIST du CNRS

Juillet 2017

Page 2: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

2

Table des matières

Préface ............................................................................................................................. 5

Liste des acronymes ......................................................................................................... 7

0. PREAMBULE : Quelle vision de l’IST ? ................................................................ 13

0.1. À l’heure numérique : Que transforme l’IST ? ................................................... 13

0.2. Définition : La nature de l’IST ............................................................................ 15

0.3. Mutations en cours ............................................................................................ 17

0.3.1. De nouveaux volumes ................................................................................ 18

0.3.2. De nouveaux supports et démarches : plateformes ................................... 19

0.3.3. De nouvelles formes : métaconnaissances… ............................................. 21

0.3.4. De nouveaux usages : recommandation, captation contrôlée .................... 23

0.4. Contexte et objectif du présent document ......................................................... 24

0.5. Une vision d’ensemble fournie par le CNRS aux acteurs de l’IST ..................... 29

1. CONSTAT : Des attentes partagées entre les nouveaux acteurs de l’IST : Une

dynamique pour la science .......................................................................................... 32

1.1. Une nécessité commune : Ouvrir et simplifier les conditions d’accès ............... 32

1.1.1. Le besoin d’être formés à l’interaction avec l’IST, et informés de ses

évolutions ................................................................................................................. 33

1.1.2. Accéder de façon sûre à de larges fonds documentaires et outils d’analyse

au meilleur coût ........................................................................................................ 40

1.1.3. Le paysage de l’IST française : un territoire en interaction forte mais

morcelé, proposant des solutions inégalement ouvertes.......................................... 42

1.2. Des besoins d’IST spécifiques à certains acteurs ............................................. 52

1.2.1. Les spécificités des Unités de Recherche et Instituts ................................. 52

1.2.2. Les besoins différenciés des Universités, Organismes et Grandes Ecoles 57

1.2.3. L’action de l’Etat au service du citoyen (agences, APUL, ODAC, mission

Etalab) 58

1.2.4. Les besoins des entreprises ....................................................................... 65

Page 3: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

3

2. VISION : Faire évoluer les services d’IST vers l’interopérabilité ....................... 69

2.1. Développer une politique nationale de formation de soutien pour la recherche et

l’éducation .................................................................................................................... 71

2.1.1. Fluidifier l’utilisation des outils en répondant aux difficultés rencontrées .... 71

2.1.2. Optimiser les savoirs et compétences pour la transition numérique ........... 73

2.1.3. Connecter les chercheurs de l’IST française entre eux .............................. 78

2.2. Développer de nouveaux circuits économiques ................................................ 80

2.2.1. Poursuivre la coordination les efforts de négociation et d’acquisition des

établissements au sein de partenariats européens pour les stratégies d’achat ....... 81

2.2.2. Concevoir une offre soutenable pour les établissements, en repenser les

périmètres d’accès ................................................................................................... 84

2.2.3. Etablir un nouveau modèle économique de valorisation (recommandation,

etc.) au cœur d’une Science Ouverte fonctionnant sur le principe de Libre Accès .. 88

2.2.4. Mettre en place les structures (agences, charte éthique) à même d’assurer

l’application des principes juridiques contenus dans la LPRN (loyauté des

plateformes, lisibilité, exhaustivité) ........................................................................... 93

2.3. Proposer un point d’entrée unique, tenant compte de la grande diversité de

ressources et de plateformes ....................................................................................... 98

2.3.1. Faire appliquer les principes juridiques de protection des données (secret

dans la recherche, confidentialité, anonymat simple ou coordonné) ........................ 99

2.3.2. Tenir compte des évolutions vers l’interopérabilité des outils de l’industrie et

des voisins européens ............................................................................................ 103

2.3.3. Permettre l’adoption de référentiels et standards normés communs ........ 105

2.3.4. Rendre le dispositif modulable pour s’adapter aux différents besoins ...... 110

2.3.5. Bibliométrie et outils assimilés : vers la curation et la facilitation de

l’exploitation des données de la recherche............................................................. 111

2.4. Sauvegarder la pérennité et la compétitivité de l’IST française ....................... 114

2.4.1. Construire un programme national cohérent et interdisciplinaire de

préservation du patrimoine scientifique incluant un archivage pérenne (HAL, ISTEX)

114

2.4.2. Apporter un appui logistique et linguistique à la visibilité internationale des

publications (notamment en OA) du CNRS et de ses partenaires, en assistant la

rédaction et la traduction ........................................................................................ 118

Page 4: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

4

2.4.3. Anticiper les partenariats pour réguler les relations entre les producteurs,

les intermédiaires et les usagers finaux d’IST ........................................................ 122

3. SYNTHESE ET ACTUALISATION STRATEGIQUE : Vers l’interopérabilité des

outils et des usages .................................................................................................... 125

4. ANNEXE BIBLIOGRAPHIQUE .............................................................................. 129

Page 5: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

5

Préface

La Stratégie "Mieux partager les connaissances" proposée par Alain FUCHS,

Président du CNRS, est désormais un objet familier de l'IST nationale, puisqu'elle a

effectivement conduit à un ensemble de résultats concrétisant son intitulé et ses axes

moteurs : faire le bilan d'étape de cette démarche nationale s'imposait d'autant plus

qu'une nouvelle étape, tout aussi importante pour le travail de la science à l'heure

numérique, est devant nous pour utiliser ce "fluide" numérique qu'est l'IST.

Grâce à l'investissement personnel exceptionnel de Louki-Géronimo RICHOU, Stagiaire

à la DIST de SciencesPo Paris et auteur de ce rapport, une vue d'ensemble, élaborée

sous ma responsabilité, est désormais accessible tant sur les éléments essentiels du

travail accompli que sur les priorités de l'étape qui s'ouvre.

Qu'a-t-on accompli depuis 2014 et quels sont les thèmes porteurs des évolutions en

cours ? Nous avons pris le parti dans ce rapport, d'une approche strictement

pragmatique et "documentaire" : quels sont les changements dans les faits, les

pratiques, les règles et ceci quels que soient par ailleurs les indispensables adaptations

de l'éthique et des comportements, sur lesquels, à mes yeux, seule une réflexion

collective s'impose, et qui a été initiée pour cet automne entre le Conseil scientifique du

CNRS et des Instituts, d'une part, et la DIST, d'autre part.

La période 2014-2017

Elle a permis de construire un certain nombre de convergences inédites des usages et

des règles visant à "Mieux partager les connaissances" et à penser ces mutations en

partageant les pratiques professionnelles des acteurs nationaux (CNRS, CPU, ADBU,

Couperin, ABES, EPRIST): l'exigence d'interopérabilité est la primordiale tant pour le

CNRS lui-même, où sont représentées toutes les approches disciplinaires, que pour tous

les travaux de recherche conduits à l'heure numérique quels qu'en soient les disciplines

et les laboratoires d'origine, dans la recherche publique nationale et en dehors. L'optique

de Science Ouverte a ainsi été recherchée par un ensemble cohérent de démarches et

de projets visant ;

- le repérage des atouts et handicaps des pratiques existantes : documents

stratégiques de la DIST, de l'INIST, de PERSEE, du CCSD ;

- la connaissance fine des pratiques nationales des laboratoires et des

Etablissements de recherche : enquêtes en 2014, puis en 2015 et 2016 avec le

COPIST ;

Page 6: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

6

- l'adaptation des règles garantissant l'optimisation du partage des connaissances :

refontes réglementaires et législatives sur les données, et bien sûr, loi "Pour une

République numérique".

La période 2017-2020

Pour reprendre un découpage temporel européen, la période qui s'ouvre est au moins

aussi porteuse d'acquis et de défis et ouvre à la fois :

- à la stabilisation des pratiques numériques nouvelles de la recherche sous la

forme de services à la science et à ses usagers,

- au développement d'applications nouvelles des résultats scientifiques aux

besoins de la société ;

- à l'articulation dans les deux cas entre les projets développés en France et les

projets internationaux.

Un tableau synthétique et comparatif à la fin du rapport présente l'essentiel des

évolutions détectées par le rapport, enregistrées et attendues dans ces deux phases,

passée et à venir.

La phase à venir repose sur une série très dense de chantiers d'organisation et de

construction de services : création et homogénéisation de réseaux de plateformes

dotées de règles et langages interopérables, normalisation des "grammaires "et

"vocabulaires" de l'IST à grande échelle et dans des formes stabilisées, développements

des échanges et interactions de données à très grande échelle, mise en place de

nouvelles formes contractuelles pour accompagner des formes inédites de création de

valeur, pour ne citer qu'un échantillon des changements en cours de préparation.

Bien entendu, ces changements seront accompagnés de nouveaux modèles de création

de valeur, de nouveaux services à la recherche, et d'une structuration nationale du

potentiel de l'INIST enfin stabilisée, et accompagnée d'un développement dynamique.

Comme cela fut le cas ces dernières années, ces changements vont s'accompagner

d'une intense activité de discussion et de débats entre les parties prenantes de l'IST

nationale, de sa construction et de ses usages : je forme le vœu que ce court rapport

permette d'esquisser un balisage et un éclairage sur les choix futurs dont l'IST a besoin

dans cette période d'intense transformation.

Renaud FABRE, juillet 2017

Page 7: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

7

Liste des acronymes

Voici une liste exhaustive des acronymes employés dans le présent document, conçue

pour servir de référentiel au lecteur, qui peut s’y reporter à tout moment afin de mieux s’y

retrouver parmi un écosystème IST pourvu d’un très grand nombre d’abréviations.

AAF : association des archivistes français

ABES : agence bibliographique de l’Enseignement supérieur

ADAE : agence pour le développement de l’administration électronique (2003)

ADBU : association des directeurs et personnels de direction des bibliothèques universitaires et de la

documentation

ADELE : plan d’administration électronique de l’ADAE

AMUE : agence de mutualisation des universités et établissements

ANF : action nationale de formation

APC : articles processing charges (frais de publication des éditeurs)

API : application programming interface

ARPIST : réseau des professionnels de l’IST de la région Aquitaine

ASSO : secteur sécurité sociale

ATICA : agence NTIC française (2002)

ATILF : analyse et traitement informatique de la langue française

BAP : branche d’activités professionnelles

BBEES : bases de données Biodiversité, Ecologie, Environnements Sociétés

BibCNRS : service de documentation interne du CNRS

BNF : Bibliothèque Nationale de France

BOAI : initiative de Budapest sur l’open access

BSN : Bibliothèque scientifique numérique

BU : bibliothèque universitaire

CCSD : Centre pour la communication scientifique directe

CDEFI : Conférence des Directeurs des Ecoles Françaises d'Ingénieurs

CDS : centre de données astronomiques de Strasbourg

CEDRAM : centre de diffusion des revues académiques de mathématiques

Page 8: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

8

CERN : centre européen de recherche nucléaire

CGE : conférence des grandes écoles

CGI : commissariat général à l’investissement

CGU/CGV : conditions générales d’utilisation / de vente

CIRAD : centre de coopération internationale en recherche agronomique pour le développement

CLEO : centre pour l’édition électronique ouverte

CNN (ou CNNum) : Conseil national du numérique

CNRS : centre national de la recherche scientifique

COAR : confederation of Open Access repositories

CODORNUM : comité d’orientation du numérique

COLLEX : collection d’excellence

COMETS : comité d’éthique du CNRS

COPIST : catalogue d’offre partagée IST

CPU : conférence des présidents d’universités

CREM : centre de recherche en ethnomusicologie

CS : conseil scientifique (du CNRS)

DAJ : direction des affaires juridiques

DARIAH : digital research infrastructure for the Arts and Humanities

DASTR : Direction d’appui à la structuration territoriale de la Recherche

DCC : Digital curation center

DDAI : direction déléguée aux achats et à l’innovation (du CNRS)

DFG : Deutsche Forschungsgemeinschaft

DGME : Direction Générale de la Modernisation de l'Etat

DIST : direction de l’information scientifique et technique (du CNRS)

DMP : data management plan (= PGD) ou dossier médical personnalisé

DOI : digital object identifier

DORANUM : Données de la Recherche : Apprentissage NUMérique à la gestion et au partage

(URFIST, INIST-CNRS, BSN)

DSFIM : direction de la stratégie financière, de l'immobilier et de la modernisation

DU : directeur d’unité (de recherche) ou directeur d’université

EGU : European Geosciences Union

Page 9: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

9

EIG : entrepreneurs d’intérêt général

ENSSIB : École nationale supérieure des sciences de l'information et des bibliothèques

EOSC : European Open Science Cloud

EPRIST : association des responsables IST des organismes de recherche

EPST : établissement public à caractère scientifique et technologique

ESR : enseignement supérieur et recherche (secteur)

ETPT : équivalent temps plein travaillé

EzPAARSE : « easy » Progiciel d'Analyse des Accès aux RessourceS Electroniques

FEI : fonctionnement et investissement

FEVAD : fédération du e-commerce et de la vente à distance

FOSTER : Facilitate Open Science Training for European Research

FRéDoc : formations des réseaux de la documentation (rencontre annuelle nationale)

GAFAM : grands groupes du secteur des plateformes (Google, Amazon, Facebook, Apple, Microsoft)

GBIF : Global Biodiversity Information Facility

GED : gestion électronique des documents

H2020 : planification des politiques publiques pour l’horizon 2020

HAL : Hyper Articles en Ligne (archive ouverte)

IDEX : initiative d’excellence (PIA)

IEEE : Institute of Electrical and Electronics Engineers

IFP : Institut français de presse

IFREMER : Institut Français de Recherche pour l'Exploitation de la Mer

IFSTTAR : Institut français des sciences et technologies des transports, de l’aménagement et des

réseaux

IN2P3 : Institut national de physique nucléaire et de physique des particules

INC : Institut national de chimie

INEE : Institut national de l’écologie et de l’environnement

INIST : Institut national de l’information scientifique et technique

INP : Institut national de physique

INRIA : Institut national de recherche en informatique et en automatique

INS2I : Institut national des sciences de l’information et de leurs interactions

INSB : Institut des sciences biologiques

Page 10: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

10

INSEE : Institut national de la statistique et des études économiques

INSERM : Institut national de la santé et de la recherche médicale

INSHS : Institut national des sciences humaines et sociales

INSIS : Institut national des sciences de l’ingénierie et des systèmes

INSMI : Institut national des sciences mathématiques et de leurs interactions

INSPIRE : directive de 2007 sur l’infrastructure d'information géographique dans la Communauté

européenne

INSU : Institut national des sciences de l’univers

IPE : ingénieur projet européen

IRD : Institut de recherche pour le développement

IST : information scientifique et technique

ISTEX : Initiative d’excellence de l’Information Scientifique et Technique

LABEX : laboratoire d’excellence (PIA)

LCEN : Loi pour la confiance dans l’économie numérique

LORIA : laboratoire lorrain de recherche en informatique et ses applications

LPRN : Loi pour une République numérique

MI : mission pour l’interdisciplinarité

NUMDAM : numérisation de documents anciens mathématiques (bibliothèque)

OA : Open Access

OCDE : Organisation de Coopération et de Développement Économiques

ODAC : organismes divers d'administration centrale

OGP : Open Government Partnership

OMES : Observatoire des Métiers et de l'Emploi Scientifique

OPECST : Office parlementaire d'évaluation des choix scientifiques et technologiques (de l’Assemblée

Nationale)

OPIDoR : Optimisation du Partage et de l'Interopérabilité des Données de la Recherche

ORCID : Open Researcher and Contributor ID

OSPP : Open Science Policy Platform (conseil auprès de la Commission européenne)

OST : Observatoire des Sciences et techniques

PAO : publication assistée par ordinateur

PAP : plans d’action partagée (du CNRS)

Page 11: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

11

PDF : portable document format

PGD : plan de gestion de données (= DMP)

PIA : programme d’investissements d’avenir

PIAAC : Programme for the International Assessment of Adult Competencies

PPSI : politique de protection des systèmes d’information

PSL : Paris Sciences et Lettres (réseau universitaire)

RBDD : réseau bases de données

RGI : référentiel général d’interopérabilité

RNBM : réseau national des bibliothèques de mathématiques

RRC : ressources de représentation des connaissances

RRI : label responsible research and innovation

RSI : responsable des services informatiques

RSNR : répertoire national des structures de recherche

SAPPS : Service d’appui à la politique et à la prospective

SCAR-MarBIN : Scientific Committee on Antarctic Research - Marine Biodiversity Information Network

SCD : service commun de la documentation

SCOAP3 : Sponsoring Consortium for Open Access Publishing in Particle Physics

SGMAP : Secrétariat Général pour la Modernisation de l’Action publique

SHS : sciences humaines et sociales

SINAPS : solution intégrée de gestion des données de référence et d’orchestration des processus

métier (logiciel)

SIST : analyse stratégique de l’IST

SPV : service de prospective et de valorisation

STAR : signalement des thèses d’archivage (ABES)

SUDOC : système universitaire de documentation

SWORD : Simple Web-service Offering Repository Deposit

TAL : traitement automatique du langage

TDM : text and data mining

TEL : Thèses en ligne

TermITH : terminologie et indexation de textes en sciences humaines

TGIR : très grande infrastructure de recherche

Page 12: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

12

UMR : unité mixte de recherche

UMS : unité mixte de service

UPS : unité propre de service

URFIST : unité régionale de formation à l’IST

URL : Uniform Resource Locator

VAE : validation des acquis de l’expérience

WoS : Web of Science

ZbMATH : service Zentralblatt (par Springer)

Page 13: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

13

0. PREAMBULE : Quelle vision de l’IST ?

0.1. À l’heure numérique : Que transforme l’IST ?

De nouveaux supports ont donc émergé pour héberger l’IST. Il s’agit notamment

de vastes plateformes, mettant en relation une (ou plusieurs) offre(s) avec une (ou

plusieurs) demande(s), dans des systèmes multifaces qui fonctionnent essentiellement

comme des organes de référencement produisant à partir de larges listings des résultats

selon les filtres appliqués par l’utilisateur. Ces plateformes font l’objet de démarches

nouvelles s’inscrivant dans la digitalisation de la science, qui fonctionnent en « couches

de cycle » interactives entre des users et des items. Cette digitalisation s’appuie sur

deux grands objectifs indissociables ; l’interopérabilité et la réduction des

déformations induites par les nécessaires opérations de traduction entre le langage

humain verbal et les langages machine.

Plateformes et régulation dynamique des contenus

Page 14: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

14

Les plateformes proposent des services IST qui sont des outils de documentation,

de recherche, d’analyse et de mise en relation. Ces services sont construits à l’amont

par différents acteurs privés et publics, et encadrés par les règles issues de la Loi pour

une République Numérique et les lignes de conduite adoptées par les organismes et

agences d’Etat tels que la mission Etalab. L’Etat et les différents acteurs situés dans les

organismes mûrissent de façon partagée les grandes orientations financières et

réglementaires en vue d’établir des principes qui ouvrent et sécurisent les possibilités

d’usage des outils par les chercheurs. Les principes viennent à l’amont, et conditionnent

les usages des services par les chercheurs, tandis que les règles forment un cadre rigide

mais en constante adaptation, dans lequel les usages peuvent s’épanouir sans danger.

Le CNRS et les études COPIST jouent un rôle prépondérant dans la définition des

conditions d’accès des chercheurs aux services IST, et l’expression de leurs besoins

influe à son tour sur le développement de ces services, de la programmation

informatique à l’ergonomie en passant par les ressources inclues. Il s’agit donc d’une

interaction tripartite à variables multiples, où chaque action d’un acteur rétroagit sur

celles des autres.

Une approche systémique : vers l’interopérabilité

Page 15: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

15

0.2. Définition : La nature de l’IST

L’information scientifique et technique (IST) désigne l'ensemble des informations

nécessaires à l'activité scientifique comme à l'industrie. Bien qu’elle fût originellement

principalement représentée par des formats papier, elle recoupe aujourd’hui

grandement l’information produite par les recherches simples faites par les citoyens,

c’est-à-dire les données sur les utilisateurs et les usages, harmonisées dans de grands

fichiers par les moteurs de recherche et les plateformes. En ce sens, l’IST se définit

plutôt par ses modalités de partage et ses destinataires que par ses producteurs ;

son champ étendu couvre donc toute information dont le contenu spécialisé permet de

développer des modèles scientifiques ou d’élaborer des applications commerciales ayant

trait à un domaine scientifique à terme. L’IST peut se lire comme une matière ayant

plusieurs dénominateurs communs ;

Une caractérisation de la nature et du périmètre de l’IST

■ Au premier abord, l’IST est pareille à un fluide en ce qu’elle se constitue par les

apports infimes et constants de diverses sources, qui se déversent dans de petits

affluents (les matériels informatiques particuliers et locaux), confluant vers de grands

bassins (les serveurs et centres de stockage), puis qui communiquent tous entre eux à la

manière des océans. Ces sources sont notamment des chercheurs, des universités, des

citoyens, et des entreprises.

Page 16: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

16

■ Ce fluide connaît aussi ses cycles et protocoles, et à l’image des nuages qui se

forment de minuscules gouttelettes et redeviennent à leur tour pluie, celui qui émet des

données personnelles par ses recherches et activités (cookies, historique) reçoit à son

tour, et absorbe, des données organisées, suggérées et adaptées en provenance des

plateformes. La catégorie de ceux qui ont besoin d’IST recouvre une réalité très large ; il

peut s’agir de chercheurs, d’institutions, d’entreprises, mais encore d’associations, et

plus globalement la société civile en général.

■ Sont-ce les données qui « font » la science, comme le suggère le mouvement pour un

« Quatrième Pilier » de la science ou bien, comme l’avance la Contribution du CNRS à la

Stratégie nationale de la Recherche, la science possède-t-elle des fondements

numériques complexes ?

1er fil rouge : Adapter les compétences et usages à l’évolution de l’IST par la

formation

■ En ce sens, un premier « fil rouge » du présent document doit se focaliser sur la

définition inchangée de l’IST, ce qui en constitue sa base, et les moyens d’adapter les

réalités de ceux qui ont besoin d’IST à cette base, en les préparant et en les formant. Ce

processus a déjà été largement engagé, et mérite une réflexion quant à ses voies de

pérennisation.

2nd fil rouge : Rechercher et publier pour un coût modeste et en toute sécurité

■ Ensuite, l’IST dépasse cependant cette métaphore simplifiée, car contrairement à l’eau

terrestre, qui toujours demeure égale à elle-même et dont on ne peut que disperser,

répartir les molécules sans en ajouter, son volume total est en constante et exponentielle

augmentation. Le second « fil rouge » doit donc s’attacher à permettre à celui qui

recherche, qui fonde ses espoirs sur l’acquisition de nouvelles connaissances parmi ce

nombre croissant de publications et bases de données, de pouvoir explorer les chemins

les plus larges (potentialisation par l’acquisition de fonds documentaires), sans pour

autant s’y perdre (référencement, loyauté des plateformes), ni encourir de dangers

(protection des droits d’auteur, des données, de la vie privée, droit à l’oubli). En effet, si

nul ne peut affecter cette production exponentielle d’IST, car elle dépend de chaque

individu et se nourrit d’elle-même en recoupant les données entre elles dans un monde

numérique peuplé d’interactions, un cadre coopéré par tous les acteurs nationaux doit

permettre à l’usager des plateformes et services IST de ne pas se perdre, ni encourir le

moindre danger en les utilisant.

Page 17: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

17

3ème fil rouge : Simplifier le point d’entrée, les conditions d’usage et de partage

■ Enfin, cette croissance exponentielle de l’IST a eu comme corolaire la création par des

ingénieurs et programmeurs de nouveaux outils et services (services partagés

d’organisation du travail, fouille de textes avancée (TDM), bibliométrie) pour la traiter. Le

troisième « fil rouge » concerne donc les besoins exprimés par les chercheurs

d’unification d’outils aujourd’hui disparates et aux utilités se recoupant pourtant souvent.

Ces besoins doivent trouver une réponse maximisant l’efficacité des outils sous la

contrainte de prise en main par ceux auxquels ces derniers sont destinés ; le non-

recours et les mauvais usages seraient ainsi diminués. En outre, ces points d’entrée

simplifiés vers l’IST doivent présenter, pour plus de commodité, un caractère

interopérable, et être adaptables facilement à chaque domaine de la science.

■ Pour synthétiser le déroulement ces trois fils rouges à chaque étape, ce tableau de

trois colonnes évoluera en début de chaque partie ;

Une définition inchangée Un changement d'échelle (big

data)

De nouveaux outils pour la

traiter (smart data)

0.3. Mutations en cours

Des externalités positives au cœur d’une formidable prise de volume

L’IST connaît des externalités positives générant une multiplication endogène des

potentiels ; plus il y a de volume d’IST mis en relation sur une même plateforme, un

même outil de traitement, plus il y a de potentielle IST générée. Métaphoriquement,

l’IST est un monde où 1 + 1 est égal à 3. Plus encore, ce phénomène est exponentiel ;

(2 + 2) > 6. Les chercheurs, les citoyens et les entreprises produisent de l’IST en publiant

des articles et textes (voie classique), mais également en générant des données par

leurs recherches bibliométriques et leurs propres travaux (voie périphérique). Elle a

connu, sur les 20 dernières années, une progression exponentielle comparable à celle

connue par la puissance des processeurs décrite par la loi de Moore. Cette prise de

volume a été accompagnée et encadrée par une évolution majeure dans 3 domaines ;

les supports, les usages et les outils de traitement de l’IST.

Page 18: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

18

0.3.1. De nouveaux volumes

La constante est le volume de ces données, réparties sous divers formats dans

des endroits physiques très éparpillés et avec des conditions sécuritaires très

hétérogènes ; entre 1980 et 2015, le volume total des données a connu une prise de

masse sans précédent, à tel point qu’il est estimé1 que l’Humanité produit aujourd’hui

en 2 jours autant de données brutes que pendant les 2 millions d’années

précédant l’avènement de l’informatique.

Bernard Benhamou, délégué aux usages d’Internet auprès du ministère de

l’Enseignement supérieur et de la Recherche : « L’essentiel du volume d’informations

généré aujourd’hui l’est encore par des humains, mais, dans les prochaines années, il

sera produit par des capteurs.»

■ Ces capteurs peuvent notamment être des outils de précision utilisés par les sciences

dures, comme des outils statistiques chers à la sociologie, ou encore des détections

automatiques issues de larges fouilles de textes concernant les SHS.

Serge Abiteboul, de l’Institut national de recherche en informatique et en automatique

(Inria), dans une interview pour Libération : « La nouveauté, c’est la capacité à croiser

toutes les données en provenance des capteurs, du Web et de l’Open Data

gouvernementale. »

■ Le téraoctet est couramment utilisé par les unités de recherche voire les particuliers,

et les entreprises connaissent le pétaoctet depuis plusieurs années déjà. Ces volumes

1 INSEE et Eurostat, 2015.

Page 19: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

19

sont hors de toute mesure humaine, et les consciences ne peuvent donc plus les traiter,

ni même avec l’aide d’outils traditionnels. C’est en cela que l’algorithmique et le

traitement par l’intelligence artificielle sertie du deep-learning prend son sens, afin de

rétablir du sens et de permettre aux chercheurs ou aux citoyens de s’y retrouver au beau

milieu de cet océan, de ces torrents d’IST se déversant sans jamais discontinuer.

Jean-Yves Pronier : « C’est bien d’avoir des données, mais c’est mieux de les faire

parler. Et, pour cela, les technologies traditionnelles ne suffisent plus. »

0.3.2. De nouveaux supports et démarches : plateformes

Quels rôles pour les plateformes de l’IST ?

■ Certaines plateformes sont commerciales, d’autres non. Certaines ont un nombre de

filtres restreint, d’autres beaucoup. Certaines encore hébergent des biens et capacités

de service en leur possession, d’autres présentent simplement des biens et services de

prestataires extérieurs. Enfin, certaines ont une matière bien définie, et d’autres sont

généralistes. Des articles papier s’additionnant au sein de journaux eux-mêmes compris

dans des cercles de diffusion, l’IST a éclaté en des bribes d’information disséminées et

rapprochables par la recherche voire le text and data mining (TDM), qui forment à

chaque nouvelle recherche une nouvelle galaxie de possibles, un nouveau texte qui se lit

différemment et associe plusieurs auteurs, plusieurs contributeurs. Les données

personnelles issues de ces recherches ont bien évidemment trouvé une place plus

discrète pour le grand public, et constituent la matière première des plateformes.

■ Dire « plateforme », c’est comprendre, avec une pondération différente selon le

contexte, trois grands rôles fonctionnels qui interviennent dans la chaîne fléchant

cette information vers l’utilisateur final ;

HEBERGEUR Stocke des data sets bruts

(matériellement)

EDITEUR Sélectionne des portions de données

AFFICHEUR Gère l’ordre et les modalités de listing des

résultats

Page 20: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

20

La situation du marché actuel des plateformes : entre hégémonie et

reconfiguration

■ De grandes plateformes anglo-saxonnes monopolisent les marchés, pour trois

grandes raisons ;

1. d’abord car cette économie est automatisée, dématérialisée et

désintermédiée, ses coûts fixes de lancement très forts, et ses coûts

marginaux quasi-nuls

2. ensuite, car les effets de réseaux y dominent (plus il y a d’utilisateurs sur une

plateforme donnée, plus le coût d’opportunité de la quitter est fort, et plus elle

croît)

3. et enfin et surtout parce que les plateformes réalisent de larges marges et

bénéfices, en offrant souvent un modèle « Premium », en plus de revendre la

valeur publicitaire générée par l’agrégation des audiences (vues, clics, temps

passé, etc.) qu’elle reçoit.

■ Cette hégémonie a généré un questionnement sur ce que devrait être la « loyauté »

de ces plateformes envers leurs utilisateurs ; en effet, le niveau de maîtrise moyen

par les utilisateurs des outils numériques ne permet pas à ces derniers d’appréhender

avec précision la complexité des modèles économiques et du partage des revenus par

les plateformes. La caractéristique du concept anciennement admis de plateforme est

qu’il désigne un aspect pragmatiste, quasi-visuel, de la réalité offerte à l’utilisateur, et

non un rôle précis dans le circuit de la valeur-information.

Un rapport de force que la loi doit arbitrer

■ La particularité de l’IST est qu’elle se cache partout, y compris dans les métadonnées

des moteurs de recherche tels que Google. La trouver relève donc d’une compétence

technique avancée, ou de l’usage des plateformes, qui doivent donc présenter des

conditions d’utilisation simples et ne trompant pas l’utilisateur, le rapport de force réel

étant très déséquilibré entre des expertises serties d’algorithmes et des profanes munis

de leurs seuls ordinateurs personnels. C’est ce rapport de force que la Loi pour une

République Numérique doit tenter d’arbitrer avec des principes tels que la « loyauté des

plateformes ». En outre, la loi pour la confiance dans l'économie numérique (LCEN, juin

2014) prévoyait déjà l'obligation de signaler qu'un contenu est publicitaire, ce qui

s'applique par exemple aux liens sponsorisés. On peut imaginer un système de

labellisation d’Etat, révélant l’information payée, potentiellement complété par un peer-

Page 21: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

21

reviewing en blockchain, révélant quelle information est fiable, afin de permettre à

l’utilisateur de savoir qui est qui.

0.3.3. De nouvelles formes : métaconnaissances…

Les différents niveaux d’IST

■ L’IST regroupe des données brutes pouvant servir dans des études statistiques, des

tests, ou encore l’élaboration d’articles et textes exigeants une réflexion périphérique,

mais elle s’étend également plus loin. Jusqu’à la donnée qui parle de données, la

métadonnée. Il peut s’agir d’informations sur les volumes, les récurrences, les dates, les

contenus spécifiques. Et cela s’inscrit dans plusieurs cadres ; bibliométrie, analyse de la

production scientifique, de la production de données par les consommateurs, les

utilisateurs, les usagers, etc.

■ L’information scientifique et technique, c’est en définitive l’ensemble des données

chiffrées, verbales et/ou picturales, qui abritent le potentiel d’un usage pour améliorer

l’état de connaissance scientifique, ou rendre possible l’application d’un nouveau produit

commercialisable à terme.

QUELQUES EXEMPLES

D’IST

Production Destination

Articles scientifiques Chercheurs Chercheurs, société civile

Données bibliométriques Chercheurs, experts TDM Chercheurs

Big data Consommateurs, citoyens Entreprises, Etat

Algorithmes statistiques Entreprises Entreprises, Etat

Un périmètre large pour comprendre l’IST

■ Aussi, ces données doivent être entendues dans un sens très général, et inclure à la

fois les données issues de la Recherche (collectées par les laboratoires et le CNRS),

celles issues des autres sphères administratives, c’est-à-dire des citoyens en tant

qu’entrepreneurs, contribuables et usagers (collectées par les services de l’Etat), et

enfin celles issues des citoyens en tant que consommateurs (collectées par des

entreprises).

■ Assimiler une méthodologie prend du temps pour le chercheur, émetteur de la

connaissance, comme pour le lecteur de l’article, de la revue, du brevet, qui en est le

Page 22: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

22

récepteur mais aussi le tributaire. Il y a une opposition classique entre deux logiques ;

une première logique, existante semble-t-il depuis toujours, qui veut que l’émetteur de

la connaissance soit docte, assimile la méthode et le langage technique afin de travailler

dans un environnement spécialisé, et que ce dernier soit responsable directement, ou

laisse à des intermédiaires la responsabilité de la vulgarisation vers le récepteur. Une

seconde logique, apparue depuis les années 1990 avec l’émergence d’internet, qui

veut que les rôles d’émetteur et de récepteur soient confondus, et que les deux

maîtrisent le même langage et la même méthodologie, afin de pouvoir communiquer

directement, l’un et l’autre étant tour émetteur et récepteur. L’intermédiaire est dans ce

cas relégué au rôle transitoire du commentateur ponctuel.

Le partage et les circuits de l’IST

■ L’IST peut être considérée comme un produit qui se transmet, mais cette voie

classique de production trouve sa limite dans un fait pas nécessairement intuitif, que les

groupes travaillant dans le secteur numérique connaissent bien comme étant leur source

de revenus la plus importante ; l’IST se génère aussi par les habitudes de recherche, et

d’interaction (ex : réseaux sociaux, peer-reviewing sur les plateformes, etc.) des

utilisateurs.

Voie classique ;

Emetteur de l’info A Récepteur de l’info A, avec différents niveaux d’intermédiation

Voie périphérique ;

Emetteur de l’info A Récepteur recherche info A produit info B Récepteur de

l’info B

■ L'innovation repose surtout sur l'évolution des systèmes d’information, des bases de

données, des systèmes d'archivage, de la gestion électronique des documents (GED),

des traitements linguistiques, de la conceptualisation de l'information, de la connaissance

i.e. tout ce qui peut enrichir les bases de données et accélérer la recherche en ligne. Il

faut être en mesure de s'emparer des technologies novatrices pour optimiser le

traitement ou l'accès à l'information.

Page 23: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

23

0.3.4. De nouveaux usages : recommandation, captation contrôlée

■ En ce sens, les chercheurs en situation de recherche documentaire produisant de l’IST

(par la création de schémas bibliométriques ou leurs propres historiques de recherche)

sont rapprochables des citoyens en situation de consommation ou d’activité sociale.

Cette voie périphérique est donc à protéger et doit faire l’objet de règles différentes de la

voie classique, qui connaît déjà un long passé de techniques de protection juridique

(brevets, contrats, notion de secret). Des indicateurs bibliométriques (répartition par

institut, relations interdisciplinaires, part nationale ou régionale, collaborations

internationales,…) sont produits par le Service d’appui à la politique et à la prospective

scientifique (SAPPS) de la Direction d’appui à la structuration territoriale de la recherche

(DASTR), et sont largement utilisés.

Les nouveaux usages dans l’entreprise

■ A l’échelle collective, au sein de l’entreprise, la voie périphérique se doit d’être encore

plus protégée, en raison des potentielles distorsions de la concurrence qui pourraient

résulter d’une divulgation des informations privées des clientèles et modèles de

management internes.

■ Les entreprises sont un acteur majeur qui, en prenant leur part dans le réemploi de

l’IST à fin commerciale, ont profondément modifié les normes qui la structurent. Elles

produisent de l’IST à plusieurs titres ;

- En recevant et incrémentant l’IST produite par les chercheurs afin de servir les

intérêts de ces derniers, dans des marchés de niche (voie classique spécialisée)

- En développant de nouveaux produits grâce à l’IST (voie classique commerciale)

- En produisant leurs propres données IST (voie périphérique)

De grands axes d’usage IST contemporains

■ Les recherches en IST s'organisent autour de trois axes correspondant à de nombreux

nouveaux usages potentiels : les mathématiques appliquées, les techniques

symboliques et numériques de l'intelligence artificielle et le Traitement Automatique du

Langage (TAL).

■ La recherche d’une donnée précise au sein de corpus de plus en plus larges, la

compilation, le TDM, la citation et la création automatique de bibliographies, sont autant

Page 24: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

24

de nouveaux usages cruciaux qui amènent à des innovations dans la manière de gérer

les supports et outils IST. La gestion des usages de l’IST est répartie, comme suit, en

différentes catégories, avec des volumes différents ;

Source : analyse technico-budgétaire par le cabinet Ourouk

0.4. Contexte et objectif du présent document

Points d’ancrage fixés et limites de la Stratégie 2013

Le document de Stratégie IST 2013 avait souligné plusieurs défaillances

concernant la mise en œuvre d’une cohérence nationale dans les usages et la gestion

de l’IST. Cependant, plusieurs études ont souligné les insuffisances de cette approche,

qui intervient dans le cadre d’évolution rapide et changeante qu’il a été donné de voir

dans le point précédent.

Page 25: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

25

- D’abord, l’enquête UMR auprès des directeurs d’unités (DU) avait mis en

évidence une connaissance des pratiques incertaine et inégale, rendant le non-

recours aux outils numériques de traitement et d’analyse de l’IST très prégnant.

- Ensuite, et du fait de cette connaissance incertaine, l’enquête COPIST avait

souligné la difficulté dans la mise en œuvre concrète d’un partage de l’IST

efficace et élargi.

Page 26: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

26

- Enfin, il manquait des normes d’encadrement juridique de l’IST, prenant en

compte ses spécificités ayant trait au numérique et portant en conséquence des

modifications dans tous les domaines de la Loi.

La résolution des questions ouvertes : marché-cadre, PAP, coopération

européenne

■ La mise en place d’un marché-cadre national pour l’acquisition de ressources

documentaires, ainsi que la communication établie entre les acteurs de l’IST

(établissements, universités, unités mixtes de recherche (UMR), administrations) ont

permis d’amorcer une mise à niveau des connaissances et une relance du partage. La

recherche en IST autour du Pôle Lorrain (Université de Lorraine, LORIA, ATILF…) et de

l’INIST est venue en appui aux projets IST du CNRS et de tout l’Enseignement Supérieur

et Recherche (ESR). Les projets retenus viseront une valorisation économique et

sociale. Un partenariat sur l’IST a été développé par mise en réseau des projets des

organismes de recherche. Les travaux d’amont visant l’interdisciplinarité ont été

développés en partenariat avec la Mission Interdisciplinarité (MI).

■ En 2014, l’analyse stratégique de l’IST française (SIST : « Mieux partager les

connaissances ; Une stratégie ouverte pour une information scientifique et technique

d’avenir ») rappelait les 4 plans d’action partagée (PAP) définis par le Directeur général

délégué pour la science du CNRS, visant à mieux : 1."Se documenter", 2."Publier",

3."Analyser l'information", 4."Accompagner l'IST et sa valorisation". Ces PAP ont porté

leurs fruits dans différentes mesures, et un retour sur les résultats doit être effectué,

comme une reformulation des objectifs à la lumière du recul acquis d’une part et des

nouveaux événements survenus dans le monde de l’économie numérique de l’autre.

Conjointement à cette progression globale de la Recherche et de l’Education pour la

science numérique, la Loi pour une République Numérique (LPRN) a fait émerger les

premières bornes d’un cadre juridique agile et intelligent, qui prend en compte l’apport

économique des grandes entreprises du secteur sans l’ignorer et tout en protégeant les

données pour l’intérêt général. Cette Loi constitue le point de convergence de toutes les

attentes des acteurs de l’IST, et tous les regards convergent donc dans sa direction. Les

objectifs de la Stratégie IST 2013 ont donc été atteints.

■ Ces 4 PAP étaient ensuite reliés parallèlement à 10 grandes orientations (O) pour

l’action concrète visant à faciliter les 4 démarches. D’abord, une conception évolutive

consistant à partager les savoirs et compétences au service de l’IST (O1 ; anticiper et

construire les options globales, O2 ; adapter les savoirs et compétences, O3 ; former par

Page 27: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

27

et dans la recherche). Ensuite, l’ouverture des modalités pour accueillir les besoins de

tous les chercheurs (O4 ; harmoniser l’offre et la demande d’IST, O5 ; partager les

ressources communes HAL et Persée, O6 ; valoriser et partager les données de la

recherche, O7 ; identifier et analyser les publications, O8 ; une stratégie globale pour le

libre accès à la science publique). Enfin, une régulation partagée destinée à dynamiser

les pratiques (O9 ; partager les règles, O10 ; innover dans les démarches). Ces 10

orientations ont connu des développements alternant entre réussites et difficultés de

mise en œuvre, entraînant parfois la « mise en silos » de certaines logiques, alors même

que des fusions et des interactions sont possibles. C’est pourquoi le présent document

stratégique tâche d’adapter les recommandations au paysage de l’IST 2017, avec ses

nouveautés, et fort de l’héritage des stratégies antérieures. La partie II (Vision) détaille

les points d’amélioration proposés, qui sont ensuite repris de façon synthétique dans la

partie III (Résumé et plan de mise en œuvre).

■ A l’échelle européenne également, la déclaration de Berlin (2003), les principes OCDE

d’accès aux données de recherche (2006), les principes des conseils de recherche

britanniques (2011), les recommandations de la Commission européenne (2012) suite au

rapport «Riding the Wave» (2010), les directives de l’OSTP vers les agences fédérales

de recherche américaines (2013), sont autant de recommandations, principes voire

injonctions à partager, rendre accessibles les productions scientifiques de recherche,

tout comme la directive européenne 2007/2/CE du 14 mars 2007 (INSPIRE), qui vise à

établir une infrastructure d’information géographique dans la Communauté européenne

pour favoriser la protection de l’environnement. Son application aux données de la

recherche fait l’objet de soins attentifs de la part de l’Institut Ecologie et Environnement

(INEE) et de l’Institut National des Sciences de l’Univers (INSU).

Explorer les zones de questionnement profondes tout en répondant aux besoins

immédiats

■ Néanmoins, des interrogations majeures demeurent, en raison de la perpétuelle

évolution des attentes et de la technologie y étant associée. Le cabinet Ourouk a été

chargé par la DIST du CNRS d’identifier les grands points de tension empêchant le

partage de l’IST. Au nombre de 6, ces « verrous » sont à lever pour assurer une

meilleure cohérence du système national, et grâce aux activités et entrevues mises en

place à la mi-2017 par Ourouk, ils concentreront les efforts de chacun pour poser la

première brique des objectifs de l’Horizon 2020 (H2020). Un verrou est en général plus

politique que technique : les mathématiciens utilisent par exemple une base de données

IST spécifique, qui pourrait facilement être convertible vers le format employé sur le

Page 28: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

28

Système Universitaire de documentation (SUDOC), mais certaines logiques de chasses

gardées persistent. Par ailleurs, en dehors des « verrous » que les études du cabinet

Ourouk s’emploient à définir, certaines inerties correspondent à des zones d’oubli, qui

n’ont simplement pas recueilli jusqu’alors l’attention nécessaire au changement ; les

thèses en ligne ne sont par exemple pas signalées dans le SUDOC.

■ Un premier pas a été fait, durant l’année 2016-2017, en réunissant dans une liste

claire, exhaustive et cliquable tous les outils et supports participant de l’offre IST

pour les chercheurs. Elle est en ligne sur le site de la DIST, et permet, en amont d’une

simplification des outils eux-mêmes, d’apporter en miroir une simplification de l’accès à

ces ressources.

A la moitié du gué : les objectifs 2017 inscrits dans le projet d’un grand Etat

numérique

■ Le présent document de Stratégie IST 2017 ne prétend pas apporter une réponse

unilatérale et exhaustive à la multitude d’enjeux soulevés par le passage de la France et

de sa Recherche à l’heure numérique. Il s’agit bien plutôt de prendre acte dans un

premier temps des étapes d’ores et déjà franchies pour fournir une vision d’ensemble

claire et synthétique (1), pour ensuite estimer la portée et la direction des actions qui

restent à mener tout en en identifiant les points de tensions (2). Enfin, un bref résumé

établira les circuits de mise en œuvre des préconisations ayant été effectuées (3).

■ L’ensemble de ces événements marquants, dans tous les secteurs de l’IST, ont

jalonné le long sentier vers un grand Etat numérique. La Recherche française, et la

France toute entière, sont à la croisée des chemins. Dans cet état intermédiaire, à la mi-

parcours en quelque sorte, il est nécessaire de préciser la portée normative de la LPRN,

qui doit s’inscrire dans un cadre européen plus large et plus profond, en visant la mise à

niveau de la France vis-à-vis de ses partenaires. Il est nécessaire de développer de

nouvelles pratiques opérationnelles, modifiant les structures et les logiques de la

politique numérique nationale concernant l’IST ; en ce sens, la réforme récente de

l’INIST a ouvert des perspectives d’optimisation des ressources mobilisées. Ces

perspectives s’inscrivent dans un ancrage territorial fort, celui d’un pôle d’excellence IST

en Lorraine. L’INIST, en association avec des partenaires universitaires dont en

particulier l’Université de Lorraine, dispose d'atouts pour développer le pôle d’excellence

en IST qui s’impose au niveau national. Cette conviction s’appuie sur les compétences

qu’a développé l’INIST mais aussi la présence de recherche de qualité sur le traitement

automatique des langues, tant au sein de l’ATILF que du LORIA (plus spécialement dans

Page 29: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

29

son département « Traitement automatique des langues et des connaissances »). La

présence d’un laboratoire de recherche de qualité en sciences de l’information et de la

communication, le Centre de Recherche en Ethnomusicologie (CREM), complète ces

ressources.

■ La stratégie IST doit être considérée comme une politique d’investissement visant

l’intérêt général et l’équité intergénérationnelle. En effet, d’une part les secteurs

intégrant l’IST sont créateurs de connaissances, et à terme de valeurs économiques

réelles, mais ne sont rentables qu’à long terme et avec de fortes incertitudes ; l’Etat doit

donc jouer un rôle de développement des innovations, y compris en sciences humaines

et sociales. D’autre part, des quasi-monopoles ayant émergé grâce de forts coûts fixes et

de faibles coûts marginaux et à l’effet de réseau, une action de sécurisation de l’emploi

et des données IST doit être menée par tous les partenaires français, et ce dès la

formation des personnels produisant et gérant l’IST, évitant parallèlement leur

subordination complète à des méthodes et besoins ne représentant pas l’intérêt général

national.

0.5. Une vision d’ensemble fournie par le CNRS aux acteurs de l’IST

Le positionnement du CNRS en tant qu’acteur coordinateur

Les positions du CNRS sont motrices dans la définition et la promotion des

positions nationales, européennes et internationales en faveur d'une IST partagée.

Comme les constats globaux l'ont mis en évidence, le CNRS est présent dans toutes les

enceintes nationales, européennes et internationales où progresse le projet de la

Science ouverte. Ces positions peuvent s'appuyer sur des ressources et des réflexions

internes qui développent autant de lignes d'actions opérationnelles. Les difficultés à

assurer la cohérence globale des positions en faveur de la science ouverte ne sont pas

sous-estimées, comme le montre les étapes en cours des négociations sur l'Open

Access (cf. Principe d'action 8).

■ Les positions internationales, européennes et nationales du CNRS en faveur de

la Science ouverte sont confortées par l'ampleur des besoins et la qualité des

propositions de mise en œuvre. Ces positions s'appuient à l'amont sur l'action du

Ministère de l’Enseignement Supérieur, de la Recherche et de l’Innovation, dans le cadre

de la Bibliothèque Scientifique Numérique (BSN). Le Schéma d'Orientation stratégique

s'appuie sur le projet national de la BSN, dont le programme observe : "Le secteur de

Page 30: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

30

l’édition scientifique a été totalement bouleversé par les nouveaux modes de diffusion du

savoir, à la fois sur les plans économique et heuristique.(…) Aux médiations

traditionnelles a succédé un ensemble d’usages qui méritent d’être encouragés tout en

conservant la liberté indispensable à l’exercice scientifique et la qualité des protocoles de

validation de la production scientifique". Le Chantier BSN 7 mène dans ce sens une

veille globale sur l'Edition scientifique numérique et a mis en place la ressource nationale

qu'est le Collège de l'Edition numérique scientifique. Une enquête nationale est lancée

sur l'Edition scientifique : le CNRS y participera activement.

Une vision générale à l’écoute des chercheurs et qui sert leurs intérêts

■ Le CNRS, en tant qu’acteur possédant une vision globale de l’écosystème scientifique

des chercheurs, producteurs et consommateurs d’IST français, adresse donc à tous ses

partenaires ce document afin de focaliser les attentions sur les points stratégiques qui

constitueront les leviers numériques et éthiques d’encadrement de l’IST dans les années

à venir. Le champ d’action de la Direction de l’Information Scientifique et

Technique du CNRS est donc orienté vers la collecte des requêtes émanant des

différents acteurs de l’IST, la définition des limites des périmètres de cette dernière, ainsi

que la formulation de recommandations dans la mise en œuvre de la formation, des

outils eux-mêmes, et de l’application des normes juridiques. Cette approche, fondée sur

l’interdépendance des communautés de chercheurs et la mutualisation de l’IST

dans les UMR, par-delà les frontières des institutions, repose à l’amont sur la BSN,

l’Association des directeurs et personnels de direction des bibliothèques universitaires

(ADBU), le Consortium Couperin, sur l’Agence bibliographique de l’Enseignement

Supérieur (ABES), qui acquièrent les ressources et analysent l’évolution des modèles de

collaboration et de publication. Ces partenaires sont en relation étroite avec le CNRS,

notamment à travers le projet ISTEX.

Contre l’effet « page blanche » : une méthode tenant compte de l’existant, des

efforts déjà entrepris

■ Le projet stratégique du CNRS doit prendre en compte et s’inclure dans les projets

déjà réalisés à la périphérie dans certaines CMUE, et créer des liens forts évitant les

doubles usages avec les projets de l’administration centrale. Il vise donc à poursuivre et

renforcer la formation et le partage, et à définir l’effort d’ouverture des perspectives qui

doit être mené par le groupe de travail sur le Guide d’Application de la LPRN, afin de

permettre la mise en œuvre forte et complète de cette Loi, et plus largement la mise en

cohérence des démarches entreprises par chaque acteur. En effet, tous ceux qui font

Page 31: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

31

avancer l’état du progrès technique des outils de l’IST doivent pouvoir réfléchir et agir au

sein d’un cadre mettant en commun les intérêts des différents secteurs publics et privés,

dans la sérénité et la coopération.

■ Le CNRS consulte et forme, d’abord, puis il construit lorsque la solution publique est

optimale, et enfin il co-gère si cela est nécessaire. Le principe général de son action

répond en quelque sorte à l’idée selon laquelle donner un poisson ne nourrit qu’une fois,

quand apprendre à pêcher nourrit toute une vie.

■ La problématique de l'accès à l'IST et des services offerts aux communautés de

recherche doit être abordée par une double entrée : celle du national pour offrir une

vision partagée par tous les acteurs de l'ESR et pour offrir des outils mutualisés (dans

leur conception ainsi que leur gouvernance) mais aussi celle du local afin d'exploiter le

potentiel de la proximité de terrain, de la connaissance des champs de recherche et des

besoins exprimés par les chercheurs. Ce dialogue permanent entre local et national doit

s'exprimer dans la notion de "réseau" qui a déjà fait le succès des réussites françaises

en matière d'IST (Couperin, ABES, unités régionales de formation à l’IST (URFIST)...).

Page 32: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

32

1. CONSTAT : Des attentes partagées entre les

nouveaux acteurs de l’IST : Une dynamique pour la

science

Le besoin d'être formés à

l'interaction avec l'IST

Un besoin d'accéder pour

un prix modeste à ces

larges fonds

documentaires

Un besoin d'unification des

outils, aux utilités

aujourd'hui superposées

1.1. Une nécessité commune : Ouvrir et simplifier les conditions

d’accès

La crainte réaliste d’un éparpillement des outils et supports de l’IST

Les utilisateurs principaux de l’IST font état d’une trop grande ramification des

supports, et d’une complexité de certains outils, conçus pour une prise en main

spécialiste plutôt que pour un usage généralisé. La gouvernance des projets d’IST

présente des modalités très différenciées d’une communauté de recherche à l’autre et

s’appuie sur un potentiel de service dont le trio « informaticien, documentaliste,

chercheur » est la forme de base, avec des déclinaisons. Le partage des données de

l’IST et de la somme monumentale de connaissances qu’il suppose ne peut être permis

que dans un environnement de travail où l’offre est modulable, adaptable aux besoins de

chacun, et surtout organisée ; c’est-à-dire que l’ensemble de l’IST disponible à un

moment t pour une personne x doit être visible par x en t.

Un engagement partagé en faveur du libre accès (Open Access) et d’une Science

Ouverte

Par la Déclaration de Berlin, le CNRS s'engageait en 2003 dans la voie du libre-accès

aux résultats de la recherche publique, position réaffirmée par les « Position

statements » dans le cadre de ScienceEurope en 2013. Dans le même sens, la

Recommandation aux états membres de la Commission Européenne en 2012, s'impose,

tout comme la position ministérielle précitée de 2013 et les recommandations du G8.

Depuis dix ans, les déclarations, initiatives, créations d’archives ouvertes et de journaux

en Open Access se sont multipliés. L’INIST a mis en place un outil de veille fort complet,

« Libre accès à l’information scientifique et technique », qui permet de suivre cette

Page 33: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

33

dynamique. Le Centre pour la Communication Scientifique directe (CCSD), dès sa

création, a toujours mené des actions de communication, formation et promotion de

l’Open Access auprès des communautés professionnelles et scientifiques. L'enjeu global

est considérable aussi bien du point de vue du partage des bénéfices de la recherche

que de celui des conditions de production de la science, entravée qu'elle est aujourd'hui

par les multiples péages qu'imposent les entreprises qui contrôlent les divers stades de

la publication d'un grand nombre de disciplines. Cet Open Access doit trouver ses

racines dans une culture de la donnée partagée, qui s’appuie sur la formation et sur des

logiques de coopération entre les différents acteurs.

1.1.1. Le besoin d’être formés à l’interaction avec l’IST, et informés de ses

évolutions

La nécessité de former aux nouveaux usages de l’IST en s’appuyant sur des

ressources humaines fortes et variées organisées en réseaux

Face à tous ces outils et à la possible unification, l’existence de ces dispositifs

n’est d’aucune utilité si elle n’est pas suivie (ou précédée) d’une formation pour les

personnels de l’IST mais surtout de recherche (doctorants, chercheurs…), afin qu’ils

aient connaissance de ces services et qu’ils sachent les utiliser. C’est donc une

sensibilisation qui est nécessaire pour tous les acteurs de la recherche en même temps

que la création du COPIST, ainsi qu’une communication sur ces outils. Cette question

de la formation mène aussi à une interrogation sur les ressources humaines

nécessaires pour le COPIST et son information auprès des personnels : qui le fera ?

Dans quel cadre ? Avec quel personnel ?

■ Le CNRS bénéficie du concours d'un personnel formé aux actions d'IST, et relevant de

plusieurs familles professionnelles, dont la révision est en cours au MESR avec le

concours actif du CNRS (OMES). L'Organisme bénéficie par ailleurs des synergies

qu'occasionne la mise en réseau très dynamique de ces personnels, notamment dans

les réseaux nationaux que sont : Renatis, Medici, RBDD, RNBM, Démocrite et

Docplanets. Ces réseaux ainsi que les divers réseaux régionaux et thématiques des

personnels, sont particulièrement présents dans la réflexion nationale sur le devenir de

l'IST.

Page 34: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

34

Source : analyse technico-budgétaire Ourouk 2015.

■ Cette réflexion, il est vrai, rejoint pour eux la préoccupation professionnelle

d'évolutions de carrière et de qualification qu'impose l'évolution des modèles

économiques et technologiques de l'IST. Dans ce contexte, les Réseaux ont pu apporter

au CNRS, à la fois, l'expérience très riche et diversifiée de personnels présents dans

toutes les communautés de la recherche, mais aussi, de façon particulièrement

opportune et bénéfique, une expertise à jour sur les nouveaux modèles de l'IST,

notamment ceux associés aux données de la recherche.

■ Au 31 décembre 2012, les personnels d'IST travaillant au CNRS présentent un large

éventail de compétences, avec les caractéristiques globales suivantes :

Page 35: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

35

➢ un personnel conséquent (770 ITA CNRS et 132 non CNRS) clairement identifié

IST (familles A et C de la BAP F2)3,

➢ des personnels n’étant pas identifiés IST mais assurant des fonctions

informatiques indispensables à l’IST (certains personnels de la BAP E

notamment) ou travaillant spécifiquement en IST pour un institut scientifique très

spécialisé (certains personnels des familles A, B et C de la BAP D4 par exemple),

➢ des personnels de niveau élevé de qualification (la moitié environ des personnels

CNRS de la famille A de la BAP F est IE-IR) et ayant souvent une double voire

une triple compétence (scientifique, informatique, IST) ; des profils très variés :

certains IR, (mais aussi AI et IE, selon l’INSU), effectuent la saisie des

publications, selon l’INEE ; les correspondants IST en SHS sont le plus souvent

des ITA BAP F mais il y a également des BAP D et des chercheurs.

■ Ce personnel, composé en majorité de femmes, est inégalement réparti au sein des

Instituts comme entre les unités. La moitié environ des personnels engagés dans les

activités d'IST a plus de 50 ans, avec localement des disparitions progressives de la

fonction (dans les UMR INSU notamment). Des exemples pionniers, comme celui du

CDS, montrent l’impact important de documentalistes de la BAP F formés à la prise en

charge des données scientifiques dans la mise à disposition des résultats de la

recherche.

■ Il y a là un chantier stratégique RH à bâtir autour de la formation, de l’évolution des

métiers et du développement des carrières, les trois notions étant liées. La question du

devenir des personnels de moindre qualification est une question sensible et importante.

La difficile mise en place de synergies en raison du localisme des formats et

supports, et de la préférence pour d’autres offres de formation

■ L'enquête de la DIST rejoint l'opinion établie selon laquelle il y a localement une

difficulté à mettre en synergie les compétences des professionnels de l’IST et les

besoins des chercheurs : l'idée a été souvent exprimée que ces deux catégories

d'acteurs de l'IST avaient le besoin d'approfondir, voire de renouer, une relation de

collaboration efficace, à l'initiative des directeurs d’universités (DU). Les personnels

2 BAP F : Documentation, édition, communication. Famille A : IST, collections patrimoniales. Famille C : édition multi supports, impression, graphisme. 3 Source : Labintel au 31/12/2012, traitement CNRS / SAPPS 4 BAP D : SHS. Famille A : traitement et analyse de bases de données. Famille B : traitement, analyse et représentation de l’information spatiale. Famille C : analyse de sources écrites, iconographies et orales.

Page 36: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

36

expriment nettement le souhait de faire évoluer leurs carrières et leurs qualifications au

service de l'IST.

■ A l’heure numérique, il existe en effet une grande diversité de systèmes utilisés pour

traiter l’information ; en découle donc une immense variété de formats, qui rend

l’interopérabilité difficile et empêche l’élaboration aisée de visions d’ensemble claires. La

formation aux usages de l’IST est actuellement assurée par différents acteurs ; le réseau

Renatis, celui des URFIST, avec l’INIST et la DIST au cœur du système. Mais sans

sensibilisation et une meilleure hiérarchisation des méthodes de formation et priorité,

répartissant agilement les charges financières sur les différents acteurs, l’offre de

formation reste largement inutilisée et donc inefficace, ce qui est dommageable étant

donné son coût. Une certaine préférence semble aller aux formations externes Zotero

plutôt que Mendeley. Certains directeurs d’UMR estiment également que la France n’a

pas besoin d’une formation nationale, trop coûteuse, et croient davantage à une offre

basée uniquement sur des formations locales.

L’évidence exigeante d’une formation permettant de déléguer les tâches IST en

amont

■ Pour le moment, des initiatives « manuelles » de mise en cohérence des formulations

ont été élaborées, par exemple par la mission Etalab qui modifie les formats natifs des

données brutes afin de les agréger à l’échelle nationale. Mais une mise en cohérence à

la source, rationnalisée et automatisée le plus possible, constitue l’étape suivante

nécessaire pour obtenir un système national français de collecte des données compétitif.

En 2016, il ressortait de l’enquête conduite auprès des DU que 26% seulement utilisent

conjointement un système de gestion de base de données tel que 4D, Oracle ou Access,

et un tableur tel qu’Excel afin de proportionner l’outil au traitement, tandis que 14%

utilisent un système de gestion complexe seul, et 19% un tableur seul. Il faut encourager

la pratique d’un rapport à la donnée systématique et dénué de craintes quant à la

conformité ou non de la méthodologie utilisée ; en effet, contraindre trop fortement les

normes d’archivage peut conduire à ce qu’une partie importante des opérations d’IST

soit faite en version papier, voire sans laisser de traces.

De l’information...

Page 37: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

37

■ Avant tout, un préalable est donc de faire connaître l’existant ; à l’heure actuelle,

seules 50% des unités de recherche disposent d’un logiciel de traitement spécifique lié à

ses expérimentations, dont une moitié en format propriétaire et l’autre en format

interopérable. Les 50% restants déclarent « ne pas savoir », soulignant le manque

d’information à ce sujet. Le principe même du DMP promu par (CAT)OPIDOR

(Optimisation du Partage et de l’Interopérabilité des Données de la Recherche) est

ignoré de nombreux chercheurs, qui ne parviennent pas à en discerner l’utilité concrète

au vu des informations actuellement communiquées. Aussi un vrai travail

d’intéressement doit-il avoir lieu, en prenant des exemples concrets de l’apport du DMP

pour chacun.

… vers la rationalisation et le partage de standards communs

■ Il convient donc ensuite d’observer à quel point ces usages ont été rationnalisés

autour de formations et de guides encadrant les bonnes pratiques. On observe

également une difficile mise en cohérence des procédures standardisées. Ainsi, lors

de l’enquête auprès des DU, 24% déclaraient partager une procédure élaborée et

partagée par toute la communauté scientifique en ce qui a trait aux formats de données,

mais seulement 5% pour la méthode de collecte, 2% pour les descriptifs (métadonnées),

et 11% pour l’attribution d’identifiants (DOI) et l’usage d’un vocabulaire unique. 45% de

142 unités signalent encore « ne pas collaborer en interne en ce qui concerne les

données et l’IST ».

■ Seules 16% des unités de recherche ont élaboré un plan de gestion de données. Il y a

donc un enjeu dans la construction d’un programme national cohérent et

interdisciplinaire de préservation du patrimoine scientifique, incluant un archivage

pérenne. Ce programme vise deux facettes de la même médaille, qui concourent à l’IST

et en constituent l’essence ; récupérer et sécuriser l’ancien, et sauvegarder

systématiquement le nouveau. Des outils, des guides de pratiques, des sessions de

formation et des ateliers (workshops) communs sont autant de solutions envisagées pour

dépasser la portée normative faible des simples réunions.

■ Les ingénieurs européens et european project managers ainsi que les valorisateurs de

données IST fonctionnant en points-relais nationaux sont actuellement la première ligne

d’assistance lorsqu’un chercheur ne sait pas comment utiliser OPIDOR pour générer un

plan de gestion de données efficace et complet. Il en va de même pour beaucoup de

domaines, où le seul référent (à l’adresse mail / numéro de téléphone parfois peu visible)

Page 38: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

38

est un expert de l’IST très lointain dans l’organigramme socioprofessionnel. Or, cet état

de fait occasionne deux effets négatifs ;

- D’une part, une désincitation (le chercheur ne sait pas qui contacter / n’ose pas

déranger un professionnel expert n’ayant aucun lien direct formel avec lui, et

abandonne sa tâche IST)

- D’autre part, les ingénieurs et managers concernés encourent un risque

d’engorgement de leur temps de travail par des tâches de conseil qui ne figurent

pas sur leurs fiches de poste à la base, si la communication était plus large ou

l’effet désincitatif pour les requérants moins lourd.

■ La formation est un enjeu-clé pour préparer les différents programmes destinés aux

Unités de Recherche et les rendre réalisables ; en effet, ils ne peuvent se fonder que sur

l’action quotidienne et normée, en amont, de chaque chercheur de l’IST, et non sur une

régulation centralisée. A ce titre, les formations à distance sur la gestion, la préservation,

le partage et la diffusion en libre accès des données de rechercher (DoRANum, BSN)

ont porté de premiers résultats encourageants.

En amont : les solutions partielles pour la veille documentaire et le signalement

des ressources

■ La question du signalement des ressources, évoquée fréquemment, semble poser

problème ; le chercheur français ne peut accéder de façon simple, en une action unique,

à l’ensemble des ressources auxquelles il peut prétendre de droit. En effet, ces dernières

sont localisées sur différents supports, qui ne veulent pas toujours voir les résultats

produits par leurs algorithmes de recherche proposés sur une seule et même page,

malgré le risque de doublons que cela comporte. Ce problème de simplicité des usages

est intimement lié aux tensions de concurrence commerciale entre fournisseurs de

support, et s’étend aussi aux usages des citoyens.

■ La veille et la recherche documentaire (service 4.1.) constituent la première étape

de tout travail scientifique approfondi. Pour ce qui est de la veille informationnelle, ce

service existe déjà au niveau local, notamment à l’échelle des Universités, et cette

échelle semble adaptée en raison tant de l’aspect personnalisable du service que de la

forte inertie des habitudes, en dehors de perspectives de mutualisation d’outils de veille

informatique pour permettre des économies d’échelle. L'INIST offre un dispositif de veille

avec notamment deux sites de qualité : http://www.donneesdelarecherche.fr et

http://openaccess.inist.fr. Les évolutions ont visé à situer ce dispositif au cœur de la

Page 39: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

39

démarche IST du CNRS et de ses partenaires, pour en faire l'outil de toutes les

évolutions en cours, vers des "connaissances mieux partagées".

En aval : l’analyse de l’IST, dont la bibliométrie, est encore fragilisée

■ Le service 4.2 réalise des études bibliométriques destinées à caractériser l’activité

scientifique d’une structure de recherche au travers de sa production scientifique, son

réseau de collaboration, son positionnement dans une thématique particulière... Les

services 4.2. à 4.4. ont produit un résultat mitigé dans l’étude COPIST. Les

établissements disposant d’un service d’études bibliométriques (53% d’entre eux)

souhaitent le développer, mais mentionnent que « les seules données quantitatives

Scopus et Wos ne suffisent pas, et doivent même être relativisées ». Nombreux sont

ceux qui travaillent encore avec une majorité d’analyses de l’OST, et les différences et

complémentarités inquiètent. Cependant, pour les structures de recherche qui souhaitent

produire des indicateurs bibliométriques, une assistance peut être fournie à l’installation

et à l’utilisation de l’outil ezVIS, à partir de données propres et consolidées sur la

production scientifique d’un laboratoire ou de toute autre structure, d’un thème

scientifique particulier…

■ Dans cette catégorie d'offre nationale, la très grande infrastructure de recherche

(TGIR) Huma-Num avance l'idée de nouveaux services et d'actions pilotes, reposant sur

des relais de formation pour entrer de plain-pied dans le web des données, le linked

data. Le chantier est essentiel. "Le travail de structuration des acteurs nationaux offrant

des formations sera décisif (Huma-Num, INIST, CCSD notamment). Les initiatives

développant des guides de bonnes pratiques (Huma-Num, Centre pour l’édition

électronique ouverte (Cléo), BSN) doivent être non seulement encouragées mais

également reprises à d'autres échelles" souligne le Cléo.

Des plannings chargés, desquels déduire le postulat d’une formation actualisée,

peu chronophage

■ Il existe donc un vrai besoin d’actualiser sur le long terme les compétences. Les

tutoriels (service 5.6.) sur le libre accès aux résultats de la recherche dans le cadre

d’H2020 sont difficilement intégrés dans les plannings souvent chargés des

chercheurs, d’autant qu’ils se présentent comme une entité optionnelle et formellement

bien distincte des autres domaines de recherche du chercheur, malgré le caractère en

réalité central de l’IST dans tous ces domaines. L’intégration d’un onglet permanent

Page 40: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

40

« Formation IST » renvoyant au répertoire des ressources de formation au sein des

plateformes (supports) d’Open Access serait à ce titre souhaitable.

1.1.2. Accéder de façon sûre à de larges fonds documentaires et outils d’analyse

au meilleur coût

Les chercheurs expriment des besoins forts de recherche, d’analyse et

d’accompagnement dans le champ de l’information, et particulièrement de l’IST. Face à

des besoins en ressources très distincts selon les secteurs de recherche, les besoins en

services sont eux sensiblement similaires.

Les guidelines et le cadrage juridique ; une première brique cruciale

■ Ce besoin d’accéder et de prendre en mains l’IST passe d’abord par la demande d’un

cadre juridique stabilisé. Outre le besoin général de connaître le droit applicable à

chacun, connaître les ayants droits sur les documents et les droits dont ils disposent est

nécessaire, mais également organiser les cessions de droit et assurer les conditions

d’une diffusion en open access. Pour les questions relatives à l’identité numérique, il est

donc nécessaire de disposer de conseil et de directives précises pour les chercheurs :

doit-on proposer de la formation ou encore proposer des outils spécifiques, utiliser des

réseaux sociaux ? Le rôle de l’institution est essentiel pour forger les bases de

production et de partage d’une IST numérique. La DIST soutient le principe d’une action

européenne d’accès à ces outils via des guidelines.

Le non-recours au dépôt dans HAL

■ Les portails individuels apparaissant dans l’archive ouverte HAL sont suffisants,

notamment pour les petites structures comme les grandes écoles par exemple. Le portail

institutionnel est toutefois insuffisant dans certains cas. Les dépôts sont souvent faits sur

des portails spécifiques (tels que les archives ouvertes institutionnelles des

établissements) mais sont ensuite liés à HAL par le protocole de renvoi. La V3 de Hal a

été mise en ligne et apporte des améliorations. Elle permet la mise à disposition de

nouveaux formats de publication (comme les vidéos). Toutefois, HAL est encore sous-

utilisé et fait l’objet d’un non-recours important bien que difficile à estimer. Dans

certaines communautés les chercheurs jugent avoir autre chose à faire que de déposer

leurs publications dans une archive, surtout si des saisies ont déjà été faites par ailleurs

(notamment archives disciplinaires). Ainsi, l’INEE, qui alimente HAL, observe que toute

la production scientifique n'y est pas recensée, que le service rendu se limite

Page 41: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

41

actuellement aux recensements des publications précédemment déposées. De plus, il

est critiqué pour le manque d’homogénéité des dépôts, l’absence de typologie unifiée

des documents, la difficile intégration des métadonnées, et les erreurs d’affiliation (dans

le cas d’une double affiliation réelle d’un chercheur notamment) la mauvaise gestion des

doublons. L'institut national de physique nucléaire et de physique des particules (IN2P3)

exprime, tout comme les autres Instituts, une option de principe favorable au dépôt

dans HAL, (l'institut des sciences de l’ingénierie et des systèmes (INSIS) et l’institut des

sciences biologiques (INSB) expriment des réserves). L’institut des sciences humaines

et sociales (InSHS) soutient quant à lui fermement le dépôt dans HAL.

Une équation sous contraintes financières et budgétaires, ne devant pas prendre

le pas sur la qualité des ressources

■ Le partage des ressources électroniques payantes sur une plateforme est une

équation sous contraintes financières. Les chercheurs utilisent déjà ezPAARSE pour

analyser l’utilisation des ressources auxquelles ils sont abonnés, et donc de restreindre

les dépenses à celles parmi ces ressources qui sont vraiment consultées. Cependant il

faut éviter la formation d’un fait majoritaire absolu, et tenir compte d’une lacune dans

le sens inverse, c’est-à-dire les ressources qui répondraient à un besoin existant mais

ne sont pas présentes dès le début, voire celles qui pourraient permettre de former de

nouveaux besoins.

■ Certains établissements aimeraient des améliorations (retrait des documents,

moissonnage, fonctionnalité de dépôt plus légère pour le chercheur). Le coût d’entrée

fort est aussi mis en avant comme un obstacle et un poids. En matière de statistiques

approfondies, la plupart des acteurs précisent qu’ils seraient intéressés fortement pour

être utilisateurs de tels outils, mais n’ont en aucun cas la capacité financière de

participer à leur construction ou à leur gestion. Cependant, à côté de ce constat amer, la

connaissance du public Ifsttar par certains partenaires a créé des réticences à

l’ouverture de l’analyse IST à la concurrence.

■ Le service IST est généralement considéré cher par rapport à l’efficacité des délais.

Conjointement, il est également nécessaire de faire passer la Recherche française à des

factures, notes et communications dématérialisées, le format papier étant polluant et ne

permettant pas un archivage et une fouille de données approfondie a posteriori.

Une grande variété de plateformes correspondant en partie à une variété de

formats

Page 42: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

42

■ Les résultats des questions 56 à 58 de l’enquête COPIST montrent que les données

les plus recueillies par les chercheurs sont des données brutes d’observation (issues

directement d'instruments scientifiques) (30% du volume total, et la plus grosse part, les

autres types de données étant très diversifiés), et ce qu’elles soient d’enquête,

expérimentales, ou de simulation. Le format le plus commun est la donnée chiffrée

(65%), loin devant les textes (25%), les images et les vidéos (10%), le plus courant étant

concrètement l’association de plusieurs de ces formats au sein d’un même dossier. Ces

raw data sets sont à 24% sous format interopérable, et à 12% sous format

propriétaires ; à noter que 42% des correspondants IST interrogés ne connaissent pas

la nature du format des données hébergées par leur institut ou unité.

■ RefDoc (COPIST, service 1.2., questions 8&9) est un service de fourniture de

documents scientifiques et techniques à la demande. Les interrogés en disent qu’il

« n’est pas énormément utilisé mais est satisfaisant. Il offre une bonne complémentarité

avec l’accès interne ».

■ Le service 5.4. (« Plateforme de services pour le stockage, le traitement, l’exposition,

le signalement, la diffusion et la conservation des données de recherche en SHS »)

soulève une limite, en précisant qu’Huma-Num ne peut combler, sur le long terme,

l’ensemble des besoins relatifs aux données de la recherche de l’établissement. A ce

titre, il pourrait se positionner comme tête de réseau pour la mise en place d’outils et de

plateformes locales. Il serait par ailleurs urgent de développer une offre à destination des

institutions pour le stockage et la conservation, articulée avec l’offre de service

développée localement pour la diffusion. Un verbatim précise : « On sent cependant qu’à

mesure qu’Huma-Num va gagner en visibilité, ces services seront sans doute de plus en

plus sollicités, avec une capacité moindre de ses équipes à répondre aux sollicitations

des partenaires. Par ailleurs, un des éléments forts actuellement de la grille de service

de la TGIR est sa gratuité. Si à terme, devant l’afflux de demandes, tout ou partie de ces

services devenaient payants (notamment le stockage des données), il n’est pas certain

qu’ils ne soient pas délaissés au profit d’autres solutions. »

1.1.3. Le paysage de l’IST française : un territoire en interaction forte mais

morcelé, proposant des solutions inégalement ouvertes

Le paysage français de l’IST est très complexe et s’inclut dans des logiques

européennes comme locales, mais il est possible de le synthétiser comme suit en

prenant en comptes un tryptique regroupant premièrement ceux qui font usage de l’IST

Page 43: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

43

(la recherche), deuxièmement les outils IST et leurs producteurs (les services) et

troisièmement ceux qui légifèrent et réglementent l’IST par des normes d’encadrement

(la régulation).

Une politique nationale de l’IST : le CNRS au cœur d’une gouvernance partagée

Au terme de réflexions et d'évaluations nombreuses auxquelles le CNRS a été

constamment associé, la France s'est dotée d'une politique nationale d'IST numérique.

Sous l'autorité du MESR, la Bibliothèque Scientifique Numérique (BSN), avec ses 10

Page 44: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

44

Chantiers actuels5, permet d'accompagner les développements en cours de l'Edition

scientifique en intégrant ses fonctionnalités complexes dans une approche globale. Le

CNRS, qui est présent dans tous les Chantiers de la BSN à travers 24 experts, a fait

récemment état de son analyse et de ses observations sur l'évolution en cours de la BSN

: le Schéma d'orientation stratégique de l'IST du CNRS prend appui sur ses ressources

et sur ses projets, notamment grâce à l’INIST.

■ La coopération et le partage via le COPIST interroge néanmoins la place du CNRS.

Un côté hégémonique traverse les critiques. C’est donc le dialogue entre acteurs de

l’IST qui doit prédominer dans la constitution d’un tel catalogue. Cette coopération

interroge aussi la différence de taille des établissements. Un seuil critique apparaît

pour les petits établissements. Comment sera-t-il possible de lier les besoins et les

capacités de chacun ? La coopération questionne aussi la gouvernance et le

financement d’un tel partage. Comment s’organise le financement d’un tel projet ? Quel

est le coût individuel pour chaque acteur ? Surtout, qui prend la charge de la gestion du

projet ? Une invitation à une gouvernance partagée est lancée, qui diminuerait le poids

de la gestion centralisée par le CNRS.

Centraliser, décentraliser…

■ L’arbitrage doit s’établir entre les économies d’échelle permises par la centralisation,

et les captations plus efficaces des requêtes et besoins émanant de chaque individu

permises par la décentralisation. Cette présentation de l’arbitrage rejoint les théories de

la zone monétaire optimale et de la taille optimale des organisations. Doivent en être

écartés les sous-arbitrages créés par des tensions particulières entre individus

ralentissant l’optimisation du système IST français. A quoi doit dès lors ressembler la

participation de chaque établissement ? Cette implication concerne les acteurs

nationaux, mais une ouverture européenne, voire internationale ne serait-elle pas

envisageable, voire nécessaire, pour porter un projet plus conséquent et encore plus

pertinent ?

Les convergences de positionnement des Instituts sur certains points

■ Du côté des instituts, les opinions convergent sur certains points et divergent

partiellement sur d’autres ;

5 Le CNRS y est représenté par 24 experts, présents dans tous les Chantiers de la BSN.

Page 45: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

45

- L'INEE l'observe, il y a une surabondance d’informations : il faut bien y distinguer

les flux "entrants" et les flux "sortants" d'IST, pour lesquels les problèmes se

posent de façon distincte. Quelle est la bonne solution d'accès à l'IST aujourd'hui

et demain ? Plusieurs sources d'IST ou une source unique regroupant les

autres ? Il n'y a pas de cohérence d’ensemble et il faut la rechercher : le CNRS a

la capacité d'y contribuer, ce qui nécessite de prendre du recul.

- L'institut de chimie (INC), suivie en cela par une majorité d'Instituts, se montre

favorable à une approche analytique et stratégique des publications des Instituts,

par la mise au point d'outils appropriés de métrique. L'INEE a mené une première

expérimentation dans ce sens.

- L'IN2P3 et l’institut national de physique (INP) préconisent ensemble, à travers

des initiatives comme SCOAP3, le besoin d'aller vers le libre-accès par une

démarche globale construite à partir d'expérimentations immédiates, solides et

partagées.

- A l'institut des sciences de l’information et de leurs interactions (INS2I), on voit se

dessiner l’idée qu’il faudrait une fonction d’appui à l’ensemble de la recherche

d’outils et de modélisation des sources de données et de publications.

- L'INSIS souligne la nécessité d'explorer de nouveaux domaines scientifiques à

l’échelle du monde, de développer une veille et de la bibliométrie pour entrer en

profondeur dans la maîtrise des outils de la valorisation, des brevets notamment,

et de remettre à plat pour cela l'analyse des dispositifs nationaux existants.

- L'INSB fait état d'une relation construite à la fois sur le recours aux archives

ouvertes (PubMedCentral), sur la publication systématique dans les grandes

revues internationales, sur l'accès à de grandes bases de données : de

nombreuses questions éthiques et juridiques posées dans les sciences de la vie

mériteraient une approche construite au niveau du CNRS.

- L'INSHS souligne le besoin de repères partagés, de règles communes, dosant

l'incitation et l'obligation, fondant le partage de l'IST sur une vision claire des

modèles disponibles et accessibles à court et à moyen terme sur les grands

thèmes stratégiques de l'IST. Une feuille de route est nécessaire, pour les

chercheurs comme pour les professionnels de l'IST, par-delà les affirmations de

principe, de façon à faire progresser les grands dossiers comme le libre-accès,

l’accès à l’information scientifique et la valorisation de la production scientifique.

- L'institut national des sciences mathématiques et de leurs interactions (INSMI),

qui recommande la construction d'une approche numérique intégrée et globale de

l'IST (de l’édition à la recherche de données), constate qu'il y a nécessité de faire

Page 46: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

46

progresser et de partager les connaissances sur les structures de données, sur

l'hétérogénéité des observations, condition de base pour le développement des

informations produites par l'IST. Pour autant, il est nécessaire de faire cohabiter

dans la durée (et donc de financer) les bibliothèques papier et les spécialistes de

ces documents avec les nouvelles bibliothèques numériques sous leurs diverses

formes.

- Pour l'INSU, il faut construire des « piliers solides » pour faire vivre la

transversalité et l’adhésion des disciplines. Il organise par exemple ses services

de données des Sciences de la Planète en "pôles de données" thématiques, en

collaboration avec les autres organismes impliqués (CNES, Ifremer, etc…), et a

nommé un chargé de mission pour suivre la problématique des données à

l’échelle de l’Institut.

Une carte des réseaux se superposant à la carte des acteurs

■ Des réseaux métier très actifs existent :

➢ au niveau national (Renatis, Medici, RBDD, URFIST)

➢ au niveau régional (ARPIST, GO!Doc, Isidora, Mistral, Doccitanist, etc…),

➢ thématique (Démocrite, RNBM, Docplanets…).

Ces Réseaux se concentrent sur les problèmes relevant des évolutions du métier, de la

prospective en IST et de l'adaptation des outils, des compétences et des services

proposés aux chercheurs. Ces aspects sont notamment traités à travers les actions de

formations, comme les FRéDoc6, les ANF ou les groupes de travail. Les offres de

formation sont nombreuses et diversifiées sur le plan interne au CNRS (INSHS,

opérateurs IST) comme externe (URFIST notamment). Les Instituts ont une pratique de

formation qui peut être partagée, comme celle de l'InSHS, qui met en place 4 à 5 ANF

par an.

■ Le CCSD a été créé en 2000 pour permettre la communication directe entre

chercheurs. Par le dépôt de sa communication scientifique sous forme d’article dans

l’archive ouverte HAL, le chercheur met l'IST à disposition de la communauté globale. Le

CCSD a évolué d’UPS en UMS et le dispositif d’archive institutionnelle HAL (hyper article

en ligne) a été redéfini dans la convention inter-établissements signée le 2 avril 2013 par

un ensemble de partenaires représentatifs de tout l'ESR. Le CCSD a comme fonction de

mettre en œuvre la stratégie du CNRS en termes d’archives ouvertes et son expertise à

6 FRéDoc 2013, par exemple, sur le thème de "Gestion et valorisation des données de la recherche".

Page 47: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

47

disposition des établissements de l’ESR. Sa mission principale est centrée sur le

développement, l’exploitation et l’évolution des archives ouvertes HAL, Thèses en Ligne

(TEL) ou encore MédiHAL. Le CCSD entretient de forts partenariats avec l’ABES, le

CINES, Huma-Num, Le Cleo, l'INRIA. Les projets du CCSD sont conçus et menés dans

l’optique de favoriser le développement de l’Open Access. La France a fait le choix de

soutenir fortement la voie verte et HAL répond à cette politique en respectant notamment

les recommandations de l’initiative de Budapest (BOAI) dans la mise en œuvre de ses

archives ouvertes.

■ L'Agence Bibliographique de l'Enseignement supérieur (ABES), est un acheteur

public et un expert de premier rang, partenaire de tous les usagers de l'ESR.

■ Le Consortium Couperin offre un cadre stratégique complet pour une démarche

globale de négociation et de conseil dans la relation du monde scientifique (universités et

organismes de recherche) avec ses partenaires et ses fournisseurs.

■ L’UMS Persée a pour objectif d’être un opérateur national pour la mise à disposition

de la production scientifique rétrospective française, au service de la science en train de

se faire (élargissant ainsi le programme PERSEE porté par le MESR qui était initialement

principalement en direction des SHS, qui font elles-mêmes l'objet d'un investissement

spécifique avec la TGIR Huma-Num). Initié en 2003 par le ministère de l’enseignement

supérieur et de la recherche et confirmé en 2007, le programme national Persée a pour

missions la numérisation, le traitement documentaire, la diffusion et l’archivage

pérenne de collections rétrospectives de revues et de publications scientifiques

francophones (publications en série, actes de colloques) en sciences humaines et

sociales (SHS), dans une logique de diffusion gratuite et non exclusive. Le changement

de portage institutionnel et la mise en place d’une UMS réunissant des acteurs nationaux

et locaux offre l’opportunité de franchir une nouvelle étape pour le programme Persée et

de définir une nouvelle stratégie de développement à court et moyen terme, conciliant

des missions de portée nationale et un enracinement fort dans le pôle lyonnais

d’enseignement supérieur. Persée est fortement impliquée au sein de l’IR documentaire

BSN (BSN5) et sera amenée à participer à l’IR CollEX (Collections d’excellence…).

Persée s’attache à développer les Interactions avec les opérateurs français d’IST. L’UMS

partage des valeurs communes avec le CCSD, le Cléo et le programme NUMDAM de la

cellule MathDoc, notamment l’implication dans le mouvement de l’Open Access et par

conséquent, la diffusion ouverte de documents scientifiques ; il existe une

complémentarité forte entre l’UMS Persée et la TGIR Huma-Num.

Page 48: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

48

■ La TGIR Huma-Num met en œuvre une démarche globale pour les SHS : la TGIR

porte en effet l’ERIC (European Research Infrastructure Consortium) de Dariah (Digital

Research Infrastructure for the Arts and Humanities).

■ Des initiatives pionnières ont conduit au développement de politiques d'IST

cohérentes à l'échelle des organismes de recherche publics : regroupés dans

l'association EPRIST, les organismes de recherche mettent en commun leurs

expériences. Plusieurs grands établissements publics nationaux partagent ainsi les

avancées des plus engagés d’entre eux7.

L’arborescence de l’IST ; des services ayant émergé sans coordination globale, de

façon ramifiée, pour répondre à des besoins localisés dans le temps et dans

l’espace

■ De ce paysage morcelé, ont émergé de nombreuses plateformes et outils aux utilités

souvent superposées. L’IST française a grandi progressivement, sans coordination

nationale malgré les supervisions croisées pilotées depuis le CNRS, pour répondre à des

besoins locaux émergeant suite à des avancées techniques puis technologiques. Sa

croissance s’est faite à la manière d’un arbre sans tuteurs, et les différents acteurs et

outils présents aujourd’hui sont autant de branches et de feuilles qui résultent d’une

vie complexe cherchant à s’étirer vers les soleils divergents d’intérêts locaux pour

chaque secteur de la recherche. Aussi, il convient non pas de tailler cet arbre

abruptement et sans considérations particulières, mais bien plutôt de favoriser la

convergence de toutes ces branches en direction d’objectifs communs, en étayant

quelques-unes à la marge, et permettant des divergences de direction lorsqu’elles sont

nécessaires, afin de rééquilibrer la forme générale de cet arbre, pour éviter sa chute due

au déséquilibre de poids entre ses branches.

■ Une réponse à la question 117 du COPIST précise ; « Il y a beaucoup de dispositifs et

projets relatifs aux données de la recherche, aux corpus de recherche, à la numérisation

de sources, à la gestion d'archives... On ne voit pas bien la cohérence de l'ensemble, ni

l'articulation entre les projets proprement CNRS et les programmes ou instances

nationaux d'archivage comme le CINES (pour le MESR). » La coexistence initiale de

périmètres variables d’un établissement à l’autre ne pourrait a priori pas être effacée sauf

à ce que toute acquisition bascule en licence nationale. Un autre verbatim éclaire le sujet

7 L'INRA en particulier, mais également l'INSERM, l’Inria, l'IRD, le CEA, l’Irstea…

Page 49: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

49

de la sorte ; « Même avec un lien facilitant le passage entre les différents portails, le

maintien de deux niveaux d’accès serait indispensable. Le résultat de ce dispositif

risquerait donc de conduire à une complexification de l’accès alors que l’offre de

service actuelle présente déjà des limites en termes de lisibilité et de gestion. Quelle

subsidiarité ? »

De nouveaux projets qui fédèrent des ambitions diverses et méritent

approfondissement

■ La réponse à cette question a déjà été en partie apportée par l’intégration des résultats

bibCNRS et ISTEX dans Google Scholar, via un système de référencement en marque

blanche permettant, lors d’une recherche sur Google, de visualiser également les PDF

ISTEX et bibCNRS. Cette procédure d’intégration par référencement commun suscite

des craintes liées à la propriété et à la sécurité des données, dont certaines ne peuvent

être communiquées sans risque à une entreprise internationale. Néanmoins, elle

constitue un premier pas vers la simplification du point d’accès.

■ Le projet ISTEX (Initiative d’excellence de l’Information Scientifique et Technique),

dont le CNRS (DIST) est le pilote, vise en effet à offrir à l’ensemble de la communauté

de l’enseignement supérieur et de la recherche, "un accès en ligne aux collections

rétrospectives de la littérature scientifique dans toutes les disciplines". Ce projet s’inscrit

dans le programme "Investissements d'Avenir" (PIA) initié par le CGI ; l’ambition directe

d'ISTEX est de "renforcer la recherche et l'enseignement supérieur français sur la scène

mondiale"; ISTEX permettra par ailleurs de valoriser la politique d'acquisitions de

licences nationales, en rendant accessibles les collections courantes et les archives de

façon transparente.

■ Les besoins sont donc très variables au sein des laboratoires et les solutions doivent

être adaptées en conséquence, comme l'observe l'INEE. Certaines communautés

scientifiques sont bien organisées ou s’organisent en matière de gestion de données et

leur expérience peut être d’une grande utilité.

■ Le service Episciences.org (3.2.) condense quelques-unes des remarques les plus

polarisantes du COPIST. Il s’agit de publier des travaux encore en cours, et des résultats

pas totalement publiables en l’état. Beaucoup rappellent qu’il faut « sortir autant que

possible du modèle imposé par les grands éditeurs qui facturent des APC délirantes »,

mais d’autres estiment que les épi-revues ne sont pas prises au sérieux ni reconnues,

justifiant leur envie de pouvoir publier dans les plus grandes revues classiques. Ce

Page 50: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

50

modèle semble prendre difficilement. En sciences du vivant cela semble exclu de

diffuser ses résultats en amont d’une publication empruntant la voie « classique ».

PlosONE a actuellement la faveur de certains chercheurs, selon une observation issue

des études bibliométriques internes à l’Ifremer.

Des portails qui satisfont, mais qui sont appelés à fusionner

■ « Nous faisons le constat de la richesse des services proposés mais également d'une

certaine difficulté de lisibilité qui rend le paysage complexe pour un enseignant-

chercheur. Il serait par exemple intéressant de dépasser certaines segmentations

disciplinaires (SHS, Maths...) pour des objets et des services identiques (numérisation de

corpus de revues, diffusion de revues en ligne...) »8. Les portails actuels de

documentation satisfont les utilisateurs interrogés à 68%, et pourtant 71% sont

favorables à un regroupement et à des fusions de ces derniers ; est-ce-à-dire que les

chercheurs français en demandent trop ? En réalité, ce qu’il faut lire derrière ces chiffres,

et notamment derrière les 20% d’abstention aux deux questions, c’est que les supports

existants sont suffisamment complets en termes de ressources, mais les services

proposés (outils), notamment les filtrages approfondis de recherche sur critères, sont

perçus comme immensément améliorables par la perspective d’un tel regroupement.

Quelle offre apporter : vers une plateforme unifiée ? Selon quelles modalités ?

■ L’offre ne portant que sur les aspects de diffusion n’intéresse que peu les acteurs de

l’IST, qui cherche des supports offrant une palette d’outils intégrés correspondant à une

offre complète, allant de la recherche d’information (gestion des abonnements) à la

diffusion en passant par les PAO et la gestion des relectures. Le service I-Revues

semble faire double emploi avec d’autres plateformes telles que les archives

institutionnelles, Persée, ou encore les épi-revues… Le projet Numdam ne peut se

construire sans articulation avec COLLEX-Persée, et présente des insuffisances du point

de vue de l’ergonomie et de la diffusion.

8 Verbatim d’une réponse à la question 146 de l’enquête COPIST 2016.

Page 51: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

51

■ De façon générale, la sous-traitance est perçue comme une solution moins chère à

court terme mais insuffisante à long terme car ne garantissant pas ni l’autonomie à

moyen terme ni la sécurisation de l’IST locale à long terme. La dépense d’investissement

doit ici être privilégiée sur de menus frais de fonctionnement qui, mis bout à bout,

empêcheront le passage au numérique de la Recherche française. S’il est important que

l’établissement ait la maitrise de ses analyses et développe les compétences suffisantes

pour être autonome, la sous-traitance n’est pas une solution permettant une véritable

appropriation. Le développement d’une expertise commune par la formation et la

mutualisation de méthodes partagées est donc pleinement utile.

■ La mise en place d’une plateforme unique d’accès aux ressources pose cependant

des questions (COPIST, service 1.1., questions 4&6) ;

- « La création d’une telle plateforme rencontre majoritairement des problèmes

techniques et de gouvernance. Quel réalisme pour un accès unique et unifié ? »

- « Comment créer une offre unifiée pour tous les établissements ? »

- « Quelles ressources humaines pour gérer tous ces points ? »

- « Quelle gestion technique : les ressources négociées pour le personnel de

chaque unité sont-elles accessibles grâce à la reconnaissance des adresses

IPs ? »

■ Le projet OPIDOR participe à la migration de deux outils étasuniens permettant de

créer des plans de gestion de données (PGD, ou DMP Data Management Plan en

anglais) ; DMP Tools et DMP Online, vers un seul mutualisé. Le DMP n’est pas une

procédure souvent mise en place pour l’heure, mais il doit aussi être en marque blanche

pour permettre une forte interopérabilité, condition sine qua none d’une unification

fluide des supports.

■ A la question du portail unique, l'INC précise que, face à la nette augmentation de la

production scientifique, le numérique permet la facilité de transmission, l’instantanéité

mais aussi la multiplication des formats possibles (publications dans les revues,

production de données, logiciels, blogs, …). L'INS2I, l'INEE, l'IN2P3, l'INSB, l'INSIS

pratiquent les revues électroniques et n'ont pas d’appétence pour le papier. Mais l’INC

souligne également que les chercheurs ont accès à un nombre parfois trop élevé de

portails : le temps d’accès de recherche et de gestion des portails est une contrainte

supplémentaire dans l’accès à l'information. L'INSB, qui est utilisateur du portail

"BiblioVie" de l'INIST, a fait état des redondances de cet outil avec les portails des

universités et surtout celui de l'INSERM. La réponse apportée pour le moment a été une

fusion dans bibCNRS.

Page 52: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

52

■ La communauté mathématique travaille sur la mise en place d'un portail par le biais de

la cellule MathDoc, du réseau RNBM et du réseau Mathrice (informaticiens des unités de

mathématiques). Ce portail, conçu pour être un "portail à façon", spécifique à la

discipline, s'appuiera sur le hub de métadonnées des collections acquises ou utiles. Il

n'est pas conçu comme un concurrent au portail unique mais bien comme un

complément, s'appuyant sur des bases communes et offrant des services spécifiques à

la discipline plus large que les services documentaires (notamment des services

informatiques et collaboratifs proposés par Mathrice). Ce projet s'appuie sur l'expertise

de la cellule MathDoc qui a joué un rôle moteur dans un projet européen similaire

(EuDML).

Le résultat : une galaxie complexe avec laquelle il faut composer une symphonie

heureuse

■ Les différents acteurs de cette galaxie très complexe et ramifiée sont identifiés par les

branches et secteurs de l’IST qui correspondent à leur zone d’influence, et certaines de

ces zones d’influence se superposent. La difficulté réside donc dans le fait de ne pas

envoyer de signaux contraires, et d’éviter la mise en place d’une concurrence stérile

entre ces acteurs aux sources de financement et de hiérarchie certes divergentes mais

qui auraient bien plus à gagner dans l’application d’un effort commun. Le présent

document vise donc à apporter les premiers éléments d’une coopération horizontale

entre acteurs de l’IST, s’inscrivant au cœur de la stratégie nationale impulsée par le

Gouvernement, et la dépassant en démultipliant l’efficacité des décisions prises par

chacun.

1.2. Des besoins d’IST spécifiques à certains acteurs

En dehors des besoins communs qui peuvent être fusionnés en répartissant

l’effort et en dépassant les antagonismes de surface, certains besoins sont aussi

spécifiques à certains acteurs de l’IST. Il existe en effet des communautés scientifiques

moins organisées quant à l’IST. L’ADBU insiste beaucoup sur ce point ; certaines

communautés de recherche disposent de moins de moyens organisationnels, tandis que

d’autres utilisent les outils d’analyse avancée de l’IST depuis longue date.

1.2.1. Les spécificités des Unités de Recherche et Instituts

Partager le rôle de prestataire d’offres payantes du CNRS avec les COMUE

Page 53: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

53

■ La notion de gouvernance est précisée par les verbatims issus des réponses à la

question n°146 ; « Se pose la question du business model. Est-ce que le CNRS se pose

en prestataire d’une offre payante et se met alors en position de répondre à un appel

d’offres ? Quelle est alors sa plus-value par rapport à des offres existantes sur le

marché ? Le CNRS a-t-il un mandat du MESR pour proposer ce COPIST ? » mentionne

ainsi un répondant. Un autre précise que ; « le CNRS devrait, peut-être, plutôt se

positionner comme centre de ressources, comme pourvoyeur d'outils et comme

organisme dispensant des formations et des conseils pour les établissements et éviter

de se substituer à eux pour proposer des services qui ont tout intérêt à être développés

localement plutôt qu'au niveau national. »

■ Le CNRS a une offre de service mais les établissements proposent eux aussi un

service analogue, d’ailleurs gratuit dans beaucoup d’universités pour les unités de

Page 54: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

54

l’établissement. La question de la gouvernance pour la fourniture de documents est

posée. Elle ne peut être que partagée, et l’initiative des acquisitions pourrait être pilotée

conjointement, par un système en ligne agile, par le CNRS et les COMUE.

Mutualiser la formation de façon intelligente : UFRIST et INIST

■ Si la mutualisation est importante pour monter les formations, avec la place centrale

occupée par l’UFRIST, il faut prendre en compte les spécificités institutionnelles et les

besoins différents. Un verbatim précise ainsi : « Qu’un tel service soit porté par le réseau

des URFIST est très approprié. Que l’INIST en revanche se lance dans des projets de

formation à destination des professionnels de l’IST interroge : il serait probablement plus

pertinent d’articuler autour de cette action le réseau des URFIST et l’ENSSIB de Lyon. »

Les établissements ne disposant pas encore de formations ont par ailleurs formulés le

vœu d’être associés au GTAO de Couperin.

Des divergences fortes de positionnements entre les Instituts

■ Les enquêtes auprès des Instituts ont permis de développer des analyses multivariées

pour affiner des « profils » d’Instituts.

Page 55: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

55

■ L'INEE est partenaire de grandes bases de données internationales (GBIF) et

développe une politique systématique de valorisation. SCAR-MarBIN, par exemple, est

un portail de bases de données interopérables, auquel le CNRS contribue en fournissant

des données et la Belgique offre l’infrastructure. Zookeys et Phytokeys sont des journaux

qui éditent des articles automatiquement à partir de bases de données. Pour l'INEE, il

faut définir une incitation du CNRS à l’ouverture des données avec une obligation à

citer, tout en admettant qu’il existe bien sûr des données sensibles à ne pas diffuser. Les

données "sont les alliées" des publications, qu'elles complètent systématiquement pour

le test et la contre-épreuve du travail scientifique (INEE, INSIS, INSB, INP).

■ L’IN2P3 ne publie pas les données brutes (illisibles pour des tiers) mais les Data

management plans sont connus et utilisés. Le TGIR SOLEIL expose également un

besoin, au-delà de la gestion des données, sur les règles de stockage à long terme.

■ L’INSB avec la bioinformatique, est partenaire d'infrastructures nationales (avec

l'Inria), pour les ressources biologiques et biomédicales (biobanques). L’accès aux

données est par exemple très spécifique, et nécessite un support bien adapté.

■ L’INSU produit des bases de données et est partenaire de bases de données

internationales (Astronomie, sismologie, Géochimie…). Il souhaite à ce titre la

valorisation des publications liées à ces bases de données. D’autres bases nécessitent

une sécurisation dans le temps des données et une valorisation de celles-ci.

■ Pour l’InSHS, il est impératif de sauvegarder les bases de données produites dans les

laboratoires : l'Institut voudrait développer un projet de coopération avec l’INIST pour

répondre aux besoins des laboratoires en matière de sauvegarde et d’interopérabilité

des bases de données et ainsi faciliter à terme la diffusion des données de la recherche.

Il parait nécessaire de créer des triplets documentaliste, informaticien et chercheur

destinés à aider les laboratoires à pérenniser les bases de données SHS : c'est une

demande récurrente des unités ; cela doit être un de nos objectifs prioritaires.

■ Enfin, pour l'InSHS il faut renforcer les infrastructures : Huma-Num, Progedo-réseau

Quételet, programmes d’excellence (Biblissima http://www.biblissima-condorcet.fr/) en

stabilisant le rôle du réseau des MSH. Il faut également accompagner l’évolution des

personnels d’appui en IST dans la gestion des données de la recherche.

■ L’INSMI utilise peu de bases de données généralistes comme Web of Science (WoS)

ou Scopus. En revanche, l'Institut utilise quotidiennement les deux bases dédiées

Page 56: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

56

MathSciNet (alias Math.Reviews, éditée par la société mathématique américaine AMS)

et zbMATH (alias Zentralblatt, produit par le FIZ et commercialisé par Springer). Il existe

des liens anciens entre la France et le zbMATH, dont la première version web a été

développée par la cellule Mathdoc. De façon générale, il y a la volonté de soutenir cette

base européenne pour limiter l'hégémonie (et les tarifs) de la base américaine.

Des difficultés techniques signalées par des utilisateurs spécifiques

■ Concernant SciencesConf.org (service 3.3.), le service est très intéressant et la prise

en main facile par les chercheurs mais le couplage à un outil local de gestion des

paiements en ligne est trop complexe ou impossible à admettre du point de vue

administratif et comptable d'un établissement hors CNRS. Il manque en outre une

fonction « Tout déployer », car aucune vue globale ne peut être affichée. La

concurrence d’outils gratuits ou payants internationaux est forte sur ce segment. Il

conviendrait de renforcer la capacité d’intégration de l’application dans les sites

institutionnels des établissements ainsi que l'intégration dans les environnements

numériques de travail. L’interopérabilité est ainsi l’enjeu central d’un meilleur taux de

recours aux outils nationaux officiels. Calenda (service 3.9) est un outil de planification

commune entre chercheurs. Mais comme en témoigne un verbatim de l’enquête auprès

des DU « les calendriers annonçant un trop grand nombre d’événements ne sont pas

consultés par des collègues surchargés. ».

Un contexte où de grands principes éthiques doivent dominer

■ Le contexte est donc particulièrement favorable à la définition de principes éthiques,

qui soient de nature à transcender les catégories instrumentales et à affirmer les buts de

la recherche publique dans un contexte global de Science Ouverte. Le comité d’éthique

(COMETS) du CNRS a constaté que beaucoup d’acteurs de l’ESR ressentent le besoin

de partager des bonnes pratiques et mène une réflexion autour du data sharing (enjeu

éthique du partage des données scientifiques). Une charte d’éthique nationale de

déontologie des métiers de la recherche avait été signée le 29 janvier 2015. L’objectif de

cette charte était d’expliciter les critères d’une démarche scientifique rigoureuse et

intègre, applicable notamment dans le cadre de tous les partenariats nationaux et

internationaux, afin de consolider le lien de confiance entre la société et les organismes

et établissements publics d’enseignement supérieur et de recherche, dans une société

de la connaissance et de l’innovation.

La charte nationale se déclinait en 6 grands chapitres :

- Respect du dispositif législatif et réglementaire

Page 57: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

57

- Fiabilité des résultats de recherche

- Communication du travail (informer n’est pas communiquer)

- Responsabilité dans le travail collectif

- Travaux collaboratifs et formation à l’éthique

1.2.2. Les besoins différenciés des Universités, Organismes et Grandes Ecoles

L’ADBU représente efficacement les universités et n’est l’objet que de très faibles

contestations de la part de ces dernières ; en ce sens, l’ADBU doit être un partenaire

national majeur. D’autres sont néanmoins développées, mais c’est plus rare.

Indépendance des Grandes Ecoles, réunion des Universités, diversité des

Organismes

■ Les grandes écoles défendent une forme d’indépendance. Les universités sont

ouvertes mais sous de nombreuses conditions. Il est plus difficile de donner une

opinion claire pour les organismes, qui sont souvent différents, n’ont pas la même

renommée donc les mêmes accès, ni les mêmes budgets, etc. Des divergences

distinguent les universités des grandes écoles ; les grandes écoles sont facilement

dotées de services de protection, chose que les universités font porter sur les

SCD. Les bibliothèques universitaires (BU), elles, interviennent déjà beaucoup dans la

partie formation documentaire au droit d’auteur, et de nombreux dispositifs mutualisés

dominent l’échelle régionale. En revanche, les questions d’éthique de la publication

ne sont que peu traitées, aussi bien par les universités que les grandes écoles.

Page 58: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

58

■ Concernant les périmètres d’accès à l’IST, en l’état, il est difficile pour une université

d’avoir accès aux informations sur les ressources (bouquets) disponibles sur les portails

thématiques du CNRS. La liste exhaustive des titres accessibles n’est pas une

information suffisamment souple à exploiter. Toutes les UMR doivent-elles pouvoir

accéder au même périmètre ? Tous les membres de l’établissement ? Car les portails

CNRS s'adressent uniquement aux membres attachés à des unités CNRS (UMR

essentiellement), chercheurs, enseignants-chercheurs et doctorants uniquement, quand

les portails documentaires des établissements desservent aussi les élèves/étudiants qui

constituent leur population de base.

Le particularisme de la recherche médicale

■ Les milieux de la recherche médicale universitaire et les organismes (ASSO et

ODAC) de la fonction publique hospitalière sont aussi de grands utilisateurs d’IST aux

besoins de confidentialité et de sécurisation élevés. Le service MediHAL de dépôt

sécurisé et de consultation de données visuelles et sonores produites dans le cadre de

la recherche scientifique a été critiqué sur plusieurs aspects dans les réponses faites à la

question 115. D’abord, la logique de description à l'unité de MediHAL fait perdre de vue

d'une part la notion de collection, essentielle pour des corpus iconographiques ou

sonores, d'autre part les recherches et articles auxquels ces documents ont servi.

Ensuite, le point de la limite du service POPS sur ce support a été soulevé. Enfin ;

« dans bien des cas, le devenir à long terme des matériaux collectés est une question

non réglée, sinon par stockage de copies multiples. MédiHAL a déjà été envisagé

comme un outil de dépôt externe possible. Un versement massif, par une bibliothèque

universitaire, d'images issues de corpus numérisés pourrait-il être envisagé, ou serait-il

considéré comme un détournement ? De la réponse à cette question dépend l'intérêt de

l'offre. ». Globalement, il est possible de dire que le fond est trop modeste (en termes de

volumétrie comme de diversité) et largement dominé par les SHS. Or, les critères

d’interrogation étant ceux de HAL, il n’y a à l’heure actuelle aucun moyen d’interroger ce

fonds sur des critères pertinents pour les illustrations. Un modèle néerlandais en

matière de gestion et diffusion des données émerge, à même de constituer une source

d’inspiration.

1.2.3. L’action de l’Etat au service du citoyen (agences, APUL, ODAC, mission

Etalab)

L’Etat comme libérateur des forces de réseaux issus des autonomisations

Page 59: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

59

Les requêtes très fréquentes d’autonomisation de certains acteurs ne doivent pas

se lire comme une volonté de pratiquer des communautarismes autarciques ou d’ignorer

les directives nationales, mais bien plutôt comme une manière de renforcer la

crédibilité et les marges de manœuvre de chacun au sein de réseaux d’entraide, par

opposition justement à la granularité forte (chaque acteur devant chercher un prestataire

de services) en situation de dépendance au marché. L’Etat, et en particulier à travers le

CNRS, agit donc pour libérer les forces à même de créer à partir de l’IST, en rendant

possibles tous les usages par la formation. Une communication nationale doit par ailleurs

être assurée en parallèle vers les communautés de recherche (très largement sous-

informées aujourd’hui) et les communautés professionnelles.

Un régulateur également acteur

Ces rôles quasi-régaliens de régulateur, d’arbitre, s’associent à une nouvelle mission de

l’Etat comme acteur à part entière de l’IST.

■ L’Etat en lui-même, on l’oublie trop souvent, est non seulement un financeur de la

recherche, avec notamment plus de 40% des 47 milliards des PIA financés via la

Page 60: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

60

Caisse des Dépôts et la BNP, mais également un client majeur de données issues du

TDM.

■ Une ouverture des droits sur les portails CNRS pour des profils ciblés en-dehors du

CNRS est demandée. Cette ouverture peut s’effectuer dans le cadre de contrats mutuels

de confidentialité, ou dans le cadre d’un paiement ponctuel sur certaines ressources. Le

portail data.gouv.fr de la Mission Etalab va dans le sens d’une co-construction, à partir

de l’IST issue des datasets étatiques, d’applications entre start-ups, entreprises

classiques et développeurs indépendants voire autodidactes.

L’e-administration appuyée sur l’IST : une longue histoire française

■ En vue de souligner l’imbrication forte de l’Etat dans les questions ayant trait au

numérique et donc à la connexion avec la technologie scientifique, un bref rappel doit

être fait. L’« e-administration », que la Commission de Terminologie de l’Académie

française préfère qualifier d’ « administration en ligne », repose principalement sur la

facilitation et la fluidification de procédures courantes, en les dématérialisant.

L’administration électronique par le Gouvernement français ne date pas d’hier ; en

France, en août 1997, soit 19 ans après la toute première Loi Informatique et Liberté,

Lionel Jospin lance le Programme d’Action Gouvernemental pour la Société de

l’Information, visant une généralisation des sites Internet publics et la mise en ligne des

formulaires administratifs sur un Espace Public Numérique. Après le rapport Carcenac

sur les téléprocédures, l’interopérabilité et le logiciel public libre en 2001, celui de la

Délégation interministérielle à la Réforme de l'État sur les sites .gouv et service-public.fr,

on propose en 2002 une Agence NTIC (ATICA), qui donnera l’agence pour le

développement de l’administration électronique (ADAE) en 2003. Entre 2004 et 2007, le

plan ADELE formule 47 propositions, mais plus de 90% d’entre elles concernent en fait

uniquement des dématérialisations de procédures comme le changement d’adresse ou

l’achat public. La DGME coordonne ces efforts. S’ensuit le Plan France Numérique 2008-

2012, concernant notamment la Justice en ligne et la confiance numérique. Depuis 2012,

l’ex-DGME, c’est-à-dire le Secrétariat Général pour la Modernisation de l’Action Publique

(SGMAP), coordonne les projets de réformes. Beaucoup sont restés des projets, des

rapports assez éparses, sans grande vision globale. De grandes idées se développent

dans nombre de pays, comme Allemagne, les Etats-Unis, ou encore au Japon, pays qui

a pris de l’avance, telles que la carte nationale d’identité électronique, un service de

dossier médical personnalisé, « l’université numérique » pour former à l’économie

numérique, ou encore l’adresse mail publique à vie.

Page 61: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

61

Les applications concrètes de l’IST par l’Etat

Ce « state as a service » a déjà donné de premiers éléments de politiques publiques

reposant entièrement sur de l’IST ;

1. Le transport peut simplement faire l’objet de statistiques permettant d’améliorer la

qualité du service rendu via la e-administration ;

2. La sécurité est notoirement améliorée par la création de fichiers de police partagés

par INTERPOL ou les services de renseignement, ou encore le casier judiciaire en

ligne, et des sociétés comme Safran produisent des programmes permettant de

prévenir plus précisément les risques lors des passages de checkpoints, par exemple

aux frontières ;

3. La santé a déjà été changée par la connexion du médecin généraliste aux urgentistes

et spécialistes via le Dossier Médical Personnalisé (DMP), et le puçage des Cartes

Vitales ;

4. On pourrait aussi citer les Ressources et l’énergie ;

5. Ou encore les Prélèvements obligatoires (impôts et taxes), avec les déclarations en

ligne comme on les connaît aujourd’hui.

6. Il y a aussi la délivrance de permis, diplômes et licences, et la poursuite d’une

actualisation de ces derniers personnalisée et surtout efficiente, pour pallier aux

mauvais résultats européens aux tests PIAAC.

7. L’organisation de la vie citoyenne, de l’échelle du quartier à celle du pays, par des

Calendriers fonctionnant selon les choix de chacun comme des matrices est aussi

possible.

Aller plus loin : govtech, civic tech, quand l’IST sert à gouverner autrement

■ Outre cette dématérialisation de l’existant, l’Etat peut aussi gouverner autrement, plus

en profondeur, de façon plus intelligente et coordonnée, grâce à l’IST. La « GOVTECH »,

parfois nommée « CIVIC TECH » est l’infrastructure technologique utilisée pour faire le

travail administratif interne ou innover auprès du citoyen. Il s’agit donc de modifier le

« système opérationnel » du gouvernement, mais les citoyens peuvent se l’approprier

aussi via des initiatives publiques ou privées. Cela n’implique cependant pas

nécessairement de « retrait de l’Etat » au profit d’agences issues des démembrements

administratifs, d’opérateurs extérieurs, ou d’entreprises privées, ni une réponse aux

attentes des usagers ; on peut créer de nouveaux besoins et innover. Il s’agit de mieux

gouverner grâce aux moyens numériques offerts par l’IST.

Page 62: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

62

1. la GovTech peut faire du transport un pilier de développement de villes mieux

dessinées, en étudiant le parcours optimal ou la durée du trajet domicile-travail de

chaque citoyen, notamment à l’échelle européenne avec l’expertise d’EuroCities, ou

en Amérique avec LivingCities ;

2. Cela a aussi à voir avec la surveillance, qui se généralise via la reconnaissance

faciale, et le fléchage de tous les appareils d’usage courant. Les liens entreprises-

gouvernements, donc B2G et G2B, sont ici la zone sensible ;

3. On peut imaginer un monitoring en temps réel des fonctions vitales de chaque

citoyen, contrôlé par Santé Publique France afin de détecter les épidémies, et

d’évaluer les marchés de toxiques à réguler.

4. La mise en place de compteurs électriques automatisés rentre dans ce cadre ;

5. La GovTech permet d’aller d’un prélèvement à la source généralisé, à l’ajustement

automatique des taux d’imposition en temps réel selon l’économie ;

6. La mise en adéquation, par des numerus clausus et des quotas, de l’offre et de la

demande d’emploi

7. Et enfin, la prévision des manifestations, voire des événements violents, et donc un

contrôle policier renforcé par algorithmes, avec des solutions comme Palantir, qui

travaille tous les jours à des outils de GovTech.

■ En réalité, mieux l’Etat est informé, plus il peut gouverner efficacement, comme un

arbre qui croit d’autant plus haut que ses racines vont puiser des ressources dans la

profondeur. Mais une grande partie du chemin est encore à tracer, et aucun « sentier »

historique ne semble restreindre les possibles en la matière, qui est toute neuve. Pour

résumer ce qui a déjà été fait en France ;

▪ 1978 : Première Loi Informatique et Liberté, fondation de la Commission

Nationale Informatique et Libertés (CNIL)

▪ 1997 : Programme d’Action Gouvernemental pour la Société de l’Information

▪ 2000 : Ouverture de service-public.fr et de Légifrance

▪ 2001 : rapport Carcenac (téléprocédures, interopérabilité, logiciel libre)

▪ 2001 : rapport de la Délégation interministérielle à la Réforme de l'État (sites web

publics)

▪ 2003 : Agence pour le Développement de l’Administration Electronique (ADAE)

▪ 2004-2007 : Plan ADELE

▪ 2005 : Direction Générale de la Modernisation de l’Etat (DGME)

▪ 2008-2012 : Plan France Numérique

▪ 2012 : Secrétariat Général pour la Modernisation de l’Action Publique (SGMAP)

Page 63: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

63

La mission Etalab : au cœur d’une Europe des bases de discussion sur l’Open

Data

■ De plus, des forums européens existent également, qui sont la base de discussions

dont l’Etat est un acteur incontournable, mais qui mettent au premier plan la Recherche

: Open Knowledge (UE), Fondation pour les Générations Futures (BEL), Hanns Seidel

Stiftung (ALL), etc. et mondiaux : Govtech Fund (US), NewDemocracy (AUS), etc.

■ La mission Etalab gère de grandes quantités de données en mettant en ligne des

datasets et en administrant la réception de datasets externes sur le site data.gouv, qui

sont amenées à servir de pivot vers d’innovants projets émanant de la société civile et

des entreprises (dont start-ups) souhaitant développer des applications faisant usage de

ces données. Nombre de ces data sets rentrent dans la catégorie IST par leur nature ;

collecte automatisée de renseignements objectifs (cadastre, dénombrements

d’événements récurrents, votes, etc.) ou leurs modes de consultation (API intégrées,

nécessité d’employer le TDM).

■ Néanmoins, de fortes contraintes s’appliquent aux organes décisionnels de

l’Etat :

1ère limite à l’action étatique : économique

■ D’abord, il existe des contraintes économiques, évaluées par le cabinet Ourouk dans

une analyse technico-budgétaire de la stratégie IST conduite en 2015.

Page 64: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

64

- Certains projets publics coûtent très cher dans les premières années, sans

certitude d’amortissement, ce qui constitue donc une dépense d’investissement et

justifie un endettement pour répartir le poids financier sur plusieurs générations ;

or la dette publique est déjà trop élevée presque partout…

- De plus, on peut se demander si ce coût doit être assumé par tous les

contribuables via un impôt, ou seulement par les usagers finaux, auquel cas peu

seraient enclins à payer pour ces options de service (moins de 20% selon un

sondage INSEE 2014).

- Les réformes numériques de l’Etat peinent à se développer lorsqu’elles sortent du

cadre de la simple dématérialisation procédurale. En effet, de grands monopoles

privés sont devenus hégémoniques, pour deux raisons ; d’une part l’absence de

coût marginal, de hauts coûts de recherche et développement, et d’autre part les

effets de réseau.

2ème limite à l’action étatique : technique

■ Parallèlement, il existe des limites techniques ; les pays où moins de 60% des citoyens

possèdent un ordinateur personnel ou ont, à défaut, accès à internet, tels que le Brésil

ou la majorité des pays d’Afrique, ne peuvent que difficilement mettre en place ce genre

de mesures, a fortiori si le taux d’équipements en smartphones est également faible,

sauf pour les mesures n’exigeant que des ordinateurs publics, comme le vote

électronique. En tout cas, la GovTech à proprement parler ne peut s’y installer. Les

initiatives gouvernementales se sont néanmoins structurées lors de la création de l'Open

Government Partnership en 2011, qui regroupe aujourd'hui 69 pays, et qui défend l’Open

Page 65: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

65

Data et la transparence sur les données comme moyen de contrecarrer les éventuelles

dérives éthiques liées aux grands pouvoirs nouveaux que ces données impliquent. La

France est 10ème mondiale en termes d’accès ouvert à ses datasets publics rendus

disponibles par la mission Etalab. La science et la recherche ont donc un rôle à jouer

dans la mise en valeur et en applications de ces données précieuses.

3ème limite à l’action étatique : éthique et morale

■ Car enfin, en effet, coupler ces bases avec des décisions technocratiques

extrêmement complexes à prendre, avec un stress temporel fort, pourrait amener vers

une disparition du décideur humain en bout de chaîne. Pour certains, il s’agit d’un risque

d’aliénation et de perte de liberté, pour d’autres, il s’agit du remède contre les failles du

raisonnement humain, telles que les abus du pouvoir qu’offre la maîtrise des données,

les discriminations ou les erreurs stratégiques.

- La protection des données du citoyen, la confidentialité, le droit à la vie privée

ou à la déconnexion sont autant de traductions juridiques de contraintes

éthiques qui freinent une réforme en profondeur, et qui sont toutes en train

d’évoluer à l’heure où nous parlons.

Le lien avec l’intérêt général : mettre l’IST au service de chacun

■ Le développement des start-ups d’Etat et des entrepreneurs d’intérêt général

ouvre la porte à un emploi de l’IST pour mieux évaluer les attentes et besoins des

citoyens ; le travail législatif doit donc focaliser ses efforts sur le maintien d’un

environnement favorable au réemploi des données IST. Le site data.gouv enregistre de

très bonnes statistiques, et les applications qui y sont créées par des start-ups et des

particuliers à partir des données publiques servent l’intérêt général.

1.2.4. Les besoins des entreprises

Une décorrélation entre la formation initiale et les qualifications professionnelles

attendues à l’heure numérique, que tentent de corriger des initiatives très récentes

Aujourd’hui, le marché réclame des spécialistes capables de décrypter et de

rendre clair pour un dirigeant d’entreprise les résultats issus du TDM, et pourtant seules

4 universités en France proposent cette spécialisation (Lyon 2, Paris 6 et 8, et Nice)...

Cependant, de nouveaux diplômes et filières liées aux problématiques du numérique

Page 66: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

66

(dont le TDM et l’IST en général) sont en train d’être fondés par quelques professeurs

visionnaires sur le territoire, depuis le début de l’année 2017, notamment à Paris.

Quels sont ces nouveaux besoins d’IST des entreprises ?

■ Les entreprises ont besoin de l’IST, tant pour déterminer leurs bases de clientèle que

pour fournir des produits innovants, qui permettent d’augmenter les externalités positives

générées par un progrès endogène, fonctionnant en réseau, autour de grands

monopoles chefs de file. Les plus grandes masses de données produites se situent

dans les champs suivants ; physique, biologico-médical, chimique, linguistique, et

historique dans une plus faible proportion. Nombre de ces données sont à même

d’intéresser des entreprises valorisant ces données à travers des applications,

numériques ou non. Ces applications peuvent aller dans le sens de l’intérêt général ;

c’est l’idée des start-ups d’Etat, renforcée par la mise en place d’une première promotion

des Entrepreneurs d’Intérêt Général en 2017.

■ Globalement, de grandes entreprises ont des besoins extrêmement spécifiques en

innovation et donc en IST pour notamment envisager l’approche de la frontière

technologique dans différents domaines, ce qui se traduit par le volume très lourd de

publications financées ou à destination d’entreprises.

Page 67: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

67

Source : Wos, Scopus, Reseda (données agrégées 2000-2014),

volumes de publications en partenariat.

L’intrapreneuriat et les start-ups : pas seulement à Palo Alto

■ Outre l’essor bien connu des start-ups dans le sillage des GAFAM (Google Amazon

Facebook Apple Microsoft), l’intrapreneuriat s’est également beaucoup développé en

France entre 2010 et 2017, et la plupart des start-ups incubées en interne au sein de

plus grands groupes font reposer leurs facteurs d’innovation technologique sur l’IST.

■ Le ciblage du marché et le calcul de l’opportunité d’innovation doivent se faire en

amont. C’est dans ce sens que va le label Responsible Research and Innovation (RRI)

de la Commission européenne, qui prend en compte l’importance de la recherche pour

l’intérêt général, et permet d’éviter la sélection biaisée des projets à financer, trop

souvent basée sur le profit commercial immédiat.

■ Certains marchés professionnels commerciaux nécessitent des formulations

extrêmement détaillées, qui vont couvrir les besoins d’une mise en œuvre pragmatique,

qui vont aller dans tous les recoins d’un brevet ou d’un descriptif afin d’éviter les failles

dans l’application. Le marché de la recherche, lui, a besoin avant tout d’interactivité,

Page 68: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

68

c’est-à-dire d’une formulation qui prend du recul perpétuellement, un résultat qui, aussitôt

qu’il est posé, appelle sa propre mise en perspective, son propre débat, in fine sa propre

abrogation au profit de son successeur, un résultat qui sera encore plus juste et complet.

Nombre d’initiatives de forums, où le résultat n’est jamais un fait acquis présenté dans un

rapport ayant un lourd coût fixe logistique, mais bien plutôt un bilan, un état des lieux du

chercheur qui souhaite l’avis de ses pairs, fleurissent depuis 10 ans. A la manière d’un

statut Facebook, ou d’un tweet, qui ne vont jamais seuls mais toujours solidement reliés,

à un tel point qu’ils en sont indissociables, avec une fonction de commentaires ouverts.

Cette fonction, qui fut l’une des modalités de la consultation précédant la LPRN, ne doit

pas être ignorée, et les chercheurs sont attachés à sa généralisation sur toutes les

plateformes. Les entreprises doivent donc éviter de faire travailler leurs chercheurs en

vase clos, mais privilégier des logiques d’ouverture et de coopération ; travailler à

plusieurs, de façon interdisciplinaire, et sans repli sur les résultats d’un seul laboratoire.

Une somme d’incompréhension et de court-termismes, pas une guerre

■ La DIST rappelle la nécessité de stabiliser le cadre public des services d’accès et

de partage des résultats de la science publique. Or des services similaires sont proposés

par le privé. Il peut donc y avoir conflit d’intérêts entre le principe d’intérêt général du

service public et la liberté du commerce et de l’industrie. La stabilisation du droit de

l’intervention publique est donc nécessaire pour fournir les services d’Open Process,

nécessaires à la valorisation des résultats de la recherche publique. Cette équation n’est

en tout état de cause pas insolvable, et ne doit pas se faire l’objet de pétitions de

principe.

Page 69: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

69

2. VISION : Faire évoluer les services d’IST vers

l’interopérabilité

Si l’IST a des origines connues et une définition relativement inchangée, sa

direction dépend des décisions stratégiques qui orienteront à la fois les usages de la

Recherche et les politiques publiques dans les années à venir, dans un premier temps à

l’Horizon 2020, puis de façon étendue. C’est donc une matière d’action, une partie du

monde numérique qu’il convient de construire de façon intelligente et avec une vision

dépassant tous les court-termismes politiques, économiques et sociaux.

Un courant proactif, un contre-courant sécurisant, devant porter à un équilibre

■ Il existe deux dynamiques qui doivent être complémentaires afin d’assurer la stabilité

de la stratégie nationale IST ; d’une part, une force motrice, mobile, proactive, visant à

ouvrir et simplifier les conditions d’accès et d’utilisation de l’IST, et d’autre part une

dynamique de conservation, de stabilisation des acquis, de protection des droits, de

défense du chercheur.

Les options explorées par les partenaires européens

■ Plusieurs pays européens tels que l’Estonie (citoyenneté numérique) et la Suisse ont

mis en place des modèles alternatifs de gestion de l’IST, et des comparatifs sont

possibles, tant en matière d’usages (outils, niveau d’imprégnation de l’IST dans la

culture scientifique), que de supports (plateformes). Un débat européen majeur a lieu

autour de plusieurs sujets présentant plusieurs options possibles et parfois

antinomiques, que seule une décision politique forte peut conduire dans une direction

précise. Il peut s’agir par exemple du passage des droits d’auteurs classiques au droit de

l’IST, de l’action fédératrice d’une agence nationale scientifique (CNRS dans l’ESR), ou

encore de la création d’une « plateforme des plateformes » pour simplifier l’accès dans

une époque où le passage à l’intuitivité et la pleine fonctionnalité numérique des

travailleurs n’est pas encore complet.

Développer une politique

nationale de formation pour

la Recherche et l'Education

Coordonner les efforts

d'acquisition au sein de

partenariats européens,

avec de nouveaux modèles

Proposer un point d'entrée

unique vers l'IST, mais qui

soit modulable pour

s'adapter aux différents

Page 70: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

70

économiques et de

valorisation

besoins

Limiter les dépenses de

formation en utilisant le

numérique, et éviter une

décorrélation de l'offre et de

la demande sur le marché

de l'emploi en formant les

élèves

Protéger les droits et la

rémunération des

chercheurs français, faire

appliquer le principe de

loyauté des plateformes de

la LPRN

Ne pas créer un outil

d'ingénieur "déconnecté de

toute réalité", objet d'un

non-recours fort, faire

appliquer les principes de

protection (secret, vie

privée) de la LPRN

Le paradoxe du chercheur : chercheur-cherchant contre chercheur-publiant

■ Le paradoxe majeur qui hante l’IST réside en ce que le chercheur, le citoyen, ou

l’entrepreneur qui est à la recherche d’une information veut disposer d’un seul outil

unifié rassemblant un maximum de données, mais lorsque ce même chercheur,

citoyen ou entrepreneur se voit placé en situation de diffuser ses propres données, celles

qui émanent de lui, de ses travaux, de sa personne ou de son business, il fait montre

d’un désir irascible de se protéger, c’est-à-dire d’en donner le moins possible, et

appelle de ses vœux la spécificité des services par lesquels ces données transitent ou

sur lesquels elles sont stockées, ce qui à l’échelle collective implique une diversité

d’outils.

■ Ce paradoxe a bien été souligné dans les résultats de l’enquête conduite auprès des

Directeurs d’Unités ; 89% des DU se déclarent favorables à une mise en réseau

européenne voire internationale des dépôts de communication en Open Access, mais

seuls 30% ont déjà payé pour qu’un article soit en libre accès, et seuls 16% de ceux

ne l’ayant pas fait se déclarent prêts à le faire.

Comment répondre à ce paradoxe ?

■ Il faut donc implémenter un service (plateforme ou module) unique et public, qui

puisse être sujette à des choix internes (options convenant à chaque domaine d’IST,

personnalisation pour chaque type de secteur/recherche), et qui se serve de la

puissance et du professionnalisme des systèmes privés déjà existants. Cette plateforme

devra garantir un prélèvement algorithmique standardisé de l’information, qui ne

Page 71: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

71

rencontre pas d’opposition forte de la part des usagers, et dont l’Etat puisse garantir la

sécurisation, en partenariat avec le CNRS et la DIST pour gérer la frange « Recherche »

et donc les désirs et besoins des chercheurs.

■ Cette plateforme pourrait être conçue comme un point d’entrée général de tous les

citoyens, chercheurs, entrepreneurs, et donc comme la mise en relation des demandes

et des offres d’IST, avec en parallèle des programmes d’analyse fine qui permettraient

de dégager les grandes tendances statistiques de ces demandes et des offres, afin de

les adapter l’une à l’autre.

■ L’objectif est donc de doter les Unités du CNRS et leurs partenaires, de références sur

l’accès à la documentation, les usages documentaires, la publication, les données, et de

clarifier les alternatives juridiques ouvertes aux publications en Open Access. Un autre

objectif prioritaire est de couvrir le périmètre des services à valeur ajoutée publics,

aujourd’hui mal définis, dans un contexte où l’offre est dominée par le marché.

2.1. Développer une politique nationale de formation de soutien pour la

recherche et l’éducation

La production généralisée de données numériques induit de facto des

besoins importants de formation continue permettant la maîtrise des descriptions,

stockage, traitement, analyse. Ces formations ne se limitent pas à la connaissance des

outils technologiques pour accomplir ces tâches mais englobent également les aspects

méthodologiques, juridiques et organisationnels nécessaires au montage des plans de

gestion de données et fonctionnement des infrastructures. Pour partie, ces formations

devront être communes aux trois corps de métiers qui concourent à la gestion efficace

des infrastructures : scientifique, informaticien et professionnel de l’information. La

description des données met en jeu aussi des connaissances du champ scientifique.

2.1.1. Fluidifier l’utilisation des outils en répondant aux difficultés rencontrées

Rendre les outils intuitifs, informer

Avant tout, des FAQ (Foires aux Questions) solides et exhaustives doivent

être établies sur le site de la DIST, afin de permettre d’apporter un point de recours et de

réponse central et bien aiguillé pour tous les personnels maniant de l’IST. Cette première

Page 72: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

72

dynamique, fondée sur l’envoi, par chaque chef de projet (outil, support), de sa FAQ

locale (une pour ISTEX, une pour OPIDOR, une pour HAL, etc.) combinée à une

nomenclature des questions portant sur l’IST en général, servirait à diminuer le volume

de réponses à apporter.

■ Il faut rendre les outils intuitifs pour limiter les besoins d’assistance récurrents, et

c’est dans ce sens que va l’étude commandée par ISTEX concernant l’ergonomie. Une

expérience utilisateur robuste et facile permet de désengorger les besoins de formation

et les requêtes d’information.

■ Au vu de l’urgence d’une mise à niveau permettant à chacun de déposer dans HAL

et arXiv, il faut d’emblée effectuer un rappel obligatoire sur ce point, sous la forme d’un

atelier géré par les chargés locaux de la formation IST auprès de chaque acteur. L'INP

ainsi que l’INSU font observer la nécessité d’améliorer des "vases communicants"

simples entre HAL et arXiv, afin d'assurer une représentation pertinente et complète des

dépôts et de valoriser ainsi le projet national, soutenu par le MESR et l'Académie des

sciences.

Mettre en relation les bonnes personnes avec les bonnes consignes et

orientations

■ De plus, il convient de mettre en relation les ingénieurs européens et european

project managers servant de répondants aux différentes questions concernant les plans

de gestion de données (OPIDOR) avec les personnels de l’INIST.

■ Sur la suggestion de l'ADBU, il faut articuler les tutoriels et l’offre de formation avec le

programme européen FOSTER, en inscrivant dans chaque module/note/atelier un renvoi

à FOSTER.

■ Donner des ordres de mission concernant la diffusion de l’information en interne à

chaque CORIST pourrait être utile, ce qui permettrait de conférer une autorité plus

grande à chaque correspondant au sein de son milieu de travail, et par là même une plus

grande légitimité et visibilité pour recevoir et identifier les requêtes.

Aller plus loin grâce à la technique

■ L’exigence d’un matériel informatique de qualité est une condition nécessaire pour

rendre possible le passage complet du CNRS au numérique. En effet, la non-conformité

Page 73: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

73

de certains ordinateurs aux prérequis récents, et les inégaux niveaux d’équipement

logiciel existants entre les UMR et établissements, limitent l’utilisation des standards

communs de format de l’IST (simplification).

■ Pour aller plus loin que la veille et la recherche documentaire, certains algorithmes

suggèrent désormais des sujets de recherche aux chercheurs ; cependant, ces

algorithmes doivent veiller à ne pas entretenir des logiques de priorité déjà

existantes, contournant ainsi les nouveaux sujets et réduisant le potentiel d’innovation

de la recherche. Une part d’aléa, qui constitue la base de tout travail sur des documents

papiers dans un environnement de type bibliothèque physique, doit être conservée.

2.1.2. Optimiser les savoirs et compétences pour la transition numérique

■ Outre le flux des questions/réponses ponctuelles, il convient cependant de former

durablement les personnels de la Recherche aux nouveaux supports et usages de l’IST,

sans trop faire reposer d’espoirs sur l’ajustement naturel provoqué par le changement de

classes d’âge et de générations. Il faut donc encourager la mise en œuvre d’un plan de

formation par les personnels de l’INIST notamment, au sein des URFIST.

Pratiques de recrutement et de gestion du personnel prenant en compte les

besoins en IST

■ Cela passe avant tout par des pratiques de recrutement qui tiennent compte de la

stratégie à long-terme de mise à niveau en matière numérique, et plus particulièrement

concernant les pratiques IST. Ce qui doit être recherché n’est pas une compétence

spécifique, mais la capacité d’adaptation ou la résilience permettant à chaque individu de

comprendre les nouveaux enjeux, évoluant en permanence et de plus en plus

rapidement, qui parsèment leur environnement professionnellement.

■ Le chercheur n’est pas toujours disponible, physiquement et mentalement, pour

entendre parler de l’IST, même si cette dernière occupe une place de choix chaque jour

grandissante au sein de ses activités. En effet, de nombreux autres impératifs

s’appliquent à ses journées, et les normes formelles imposées par le cadre européen ne

suffisent pas, pour une grande majorité de travaux fonctionnant en vase clos (étant

encore à l’état de brouillons, documents de travail) ou ne nécessitant pas de

collaborations internationales, à motiver un apprentissage rigoureux des subtilités

d’usage de l’IST.

1ère ligne de formation : en ligne

Page 74: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

74

■ La première ligne de formation aux nouveaux usages de l’IST doit ainsi passer par une

offre de formation en ligne. « Nous ne disposons pas de service de formation à distance

et serions très intéressés par un site qui nous permettrait de développer nos propres

formations à distance ou d’utiliser/faire utiliser celles qui seraient réalisées par d’autres

professionnels de l’information de l’ESR sur des sujets que nous ne maîtrisons pas, ou

sur lesquels nous n’avons pas le temps de développer des outils d’apprentissage. »

Cette offre permet à chacun d’organiser son apprentissage par rapport à ses

disponibilités d’une part, et à ses besoins spécifiques d’autre part, sans contrainte

horaire ou spatiale, et surtout sans donner une information à quelqu’un qui la connaît

déjà. Cette ligne existe dès à présent à travers OPIDOR et DoRANum. Le service 5.5.

(« Formations à distance sur la gestion, la préservation, le partage et la diffusion en libre

accès des données de recherche (DoRANum BSN) ») a été encadré par les réponses

aux questions 120 et 122 notamment, qui mettaient en avant des points à améliorer.

DoRANum a d’ores et déjà commencé à diffuser ses vidéos de formation en ligne. Il

s’agit d’une formation complète, à distance, fondée sur de petits modules de e-learning

s’adaptant à chaque besoin d’apprentissage en fonction non seulement du niveau de

compétence mais aussi du niveau d’intérêt pour l’IST (« en bref », « pour comprendre »,

puis « pour aller plus loin »). Ces modules sont pour certains imprimables et DoRANum

propose également des visuels concernant l’IST (marque-pages et fiches synthétiques)

que chaque unité peut diffuser ou afficher en interne. Cependant, une mise à

disposition d’OPIDOR et de DoRANum sur un site commun serait à ce titre

envisageable. Cependant, cette ligne nécessite d’être associée à une seconde ligne,

permettant le contact humain avec des personnels IST, car il peut être difficile d’accéder

spontanément à la bonne information, les réflexes informatiques n’étant pas toujours

présents parmi les communautés de chercheurs. Cette première ligne numérique doit

donc pleinement dépasser le cadre de l’information pour constituer une véritable

formation.

2nde ligne de formation : ponctuelle, pour les personnels locaux non-spécialistes

■ La seconde ligne, complémentaire, consiste en une formation ponctuelle des

personnels informatiques et des documentalistes locaux, au sein de chaque unité de

recherche ou établissement. On a constaté que les chercheurs, enseignants et étudiants

se tournent en priorité vers eux lorsqu’ils sont confrontés à une interrogation concernant

l’IST. Les former permettrait donc, par ruissellement, d’apporter une information de

qualité jusqu’aux couches académiques et professionnelles les plus éloignées de l’IST

au quotidien, et ce à l’initiative de chacun, ce qui éviterait toute forme de lassitude ou de

Page 75: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

75

non-recours. Cette ligne a pour but de délester la troisième ligne, tout en permettant

d’orienter chacun vers les ressources issues de la première ligne si le désir d’en savoir

plus est manifesté, à titre du droit à la formation continue ouvert pour les salariés et

agents de la fonction publique.

3ème ligne de formation : continue, par et pour des personnels qualifiés en interne

■ La troisième ligne, déjà bien établie mais qui doit poursuivre les efforts engagés, est

celle de formation continue, par des personnels qualifiés rattachés à des organes

centraux du CNRS (DIST et INIST). A ce titre, le nombre de personnels dédiés à ces

tâches de formation en interne pourrait être augmenté afin de pouvoir compter sur ces

agents pour de nouvelles missions auprès des partenaires de l’IST, aux premiers rangs

desquels les établissements et unités de recherche. Il faut harmoniser l’offre de

formation de l’INIST et celle des URFIST par un approfondissement du dialogue entre

les deux. De façon globale, redessiner la structure décisionnelle dédiée à l’IST au

sein du CNRS autour d’une approche utilisateur serait souhaitable, sur le modèle d’un

large « front office » spécialisé en formation et à même de répondre aux questions

formulées en termes profanes, secondé par un « middle office » centré sur la

coordination des acteurs œuvrant dans le même sens, et d’un petit « back office »

impulsant la stratégie et commandant les études nécessaires à la prise de recul sur le

sujet.

Une validation des acquis de l’expérience corrélée à la maîtrise des usages de

l’IST

■ La validation des acquis de l’expérience (VAE) en matière d’IST doit pouvoir se

faire sur la base d’un cahier de critères précis déterminant le degré de maîtrise de

diverses compétences génériques, sans que ce dernier soit trop dépendant des supports

ou outils précis (plateformes, logiciels), qui eux varient perpétuellement.

■ Outre cette VAE, il convient de s’assurer que les actions de base requises par les

chartes de bonne utilisation de l’IST dans la recherche soient effectuées avec précision

et systématisme. Avant tout, il faut assurer le respect des règles de dépôt dans les

archives ouvertes HAL, en mettant en place un mécanisme incitatif adossé pour les

cas d’abus à un mécanisme correctif fermant certains droits de lecture tant qu’une

Page 76: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

76

production rédigée voire publiée n’est pas intégrée ou ses métadonnées pas

suffisamment renseignées.

La dépendance des protocoles au marché

■ Les protocoles d’IST peuvent être développés unilatéralement par les entreprises

ou individus au sein de ces dernières ayant une autorité suffisante, sans prendre en

compte leur légitimité ni l’acceptation préalable de la communauté scientifique. Ainsi,

certaines firmes formulent leurs résultats dans un protocole qui leur est propre, et

imposent leur formulation à ceux qui dépendent de la compréhension de cette

information pour leur développement académique ou professionnel. En revanche, si les

universitaires ou les développeurs d’applications techniques issues de ces projets

« cryptés » doivent apprendre le nouveau protocole par besoin, le profane ou le

passionné simplement intéressé par un résultat ponctuel à propos d’un élément qui le

fascine n’aura ni la motivation (incitative) ni le temps nécessaires. A l’inverse, un acteur

se donnant pour but de vulgariser un résultat peut utiliser des termes totalement

différents de ceux reconnus par le milieu scientifique, voire pire encore, en amalgamer

plusieurs et brouiller les définitions.

Vulgariser l’IST…

■ La vulgarisation est la plus connue des « reformulations » qui prennent en compte le

niveau de prérequis minimal et le contexte social de l’opinion pour enseigner des

techniques d’IST. Le volume de ces formulations destinées au profane représente

20 000 titres cette année ! Permettant une large diffusion et une uniformisation des

résultats, la vulgarisation a pour défaut d’infantiliser le récepteur, et de réduire l’ampleur

de l’information, l’angle par lequel l’IST est abordée empêchant au récepteur de réaliser

tous les potentiels et interconnexions de cette dernière. De plus, il ne faut ni subordonner

l’IST à ses applications les plus spectaculaires, qui de surcroît ne sont pas toujours les

plus utiles, ni masquer ses limites en en faisant une science absolue, effaçant sa nature

instable, ses fragilités nécessaires.

… ou plutôt la simplifier et la spécialiser ?

■ Plus que d’une vulgarisation, c’est donc d’une simplification dont l’IST a besoin à

l’horizon 2020. La LPRN va dans ce sens, et elle a été préfigurée par les travaux sur la

rationalisation, depuis les Lumières. La simplification permet une large diffusion du

résultat, l’atteinte du marché niche souhaité, sans niveler par le bas.

Page 77: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

77

■ Outre cette simplification générale de l’IST, commandée par les besoins exprimés

par tous les acteurs conjointement, un second principe, celui de spécialisation, doit

intervenir ; il faut diriger la bonne quantité et la bonne nature d’IST vers chaque acteur, et

appliquer un niveau de sécurité cohérent avec les réalités de chacun. Proposer la même

arme et la même armure à chaque combattant, qu’il soit tireur d’élite, fantassin, blindé ou

pilote de l’air, serait vouer le combat à l’échec ; il en va de même pour l’IST, où chacun

est différent mais complémentaire, et engagé dans un parcours d’une même intensité

pour faire de la France un grand Etat numérique.

Une formation solide par l’INIST pour H2020 ; comment améliorer les tutoriels

proposés

■ La DIST a sollicité l’Inist pour participer à la mise en place de formations visant à

accompagner les chercheurs ainsi que les ingénieurs projet européens (IPE) sur le volet

IST de H2020. Elles se présentent sous forme de modules en ligne, à destination des

chercheurs, des IPE (Ingénieurs projets européens) et des responsables des SPV

(services de prospective et de valorisation). Ces tutoriels sont disponibles en ligne avec

une documentation associée sur www.inist.fr rubrique « tutoriels libre accès aux résultats

de la recherche » dans le cadre de H2020. Chacun dure environ 10 minutes. Les

tutoriels actuels doivent cependant faire montre d’une meilleure qualité visuelle, à

préférer aux présentations PowerPoint, tout en mettant une voix agréable et un ton

enjoué au service de résumés brefs ponctués d’exemples très concrets, voire de

captures d’écran illustrant les procédures pas-à-pas. Ajouter des thèmes tels que la

propriété intellectuelle ou industrielle et leur encadrement, ou encore l’IST au service de

la robotique, permettrait de susciter un plus vif intérêt chez les individus, et de créer des

motivations supplémentaires pour accéder aux ressources, en faisant de la culture et de

la connaissance personnelle une dynamique prenant le pas sur le simple utilitarisme

pragmatique et professionnel.

D’autres idées complémentaires

■ Le site d’information sur les données de la recherche (service 5.7.) doit être animé par

un acteur (ou un groupe d’acteurs) de l’IST ; en effet, sans cette présence en ligne qui va

au-delà de l’hébergement ou du simple entretien, il ne saurait être autre chose qu’un

vulgaire réservoir de documents, peu opérationnel. Une newsletter IST, copiable et

collable dans chaque newsletter locale, permettrait tant d’informer la communauté

scientifique des nouveautés de l’Open Science que de rappeler en fin de mail les URLs

Page 78: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

78

utiles. Pratiquer un référencement intelligent par l’apposition de tags sur chaque article /

ressource dudit site et sa galaxie de blogs est nécessaire à la navigation fluide côté

visiteur.

2.1.3. Connecter les chercheurs de l’IST française entre eux

Le lien entre l’IST et les chercheurs est donc d’abord une question d’information

et de formation. Néanmoins, le resserrement des liens entre les chercheurs utilisant et

produisant de l’IST permettrait d’ouvrir encore plus les forces en présence aux

externalités positives, et de favoriser des synergies encourageant une acquisition

commune des compétences autour de laboratoire et organismes « chefs de file ».

L’essor de véritables synergies par le bas, horizontalement entre les acteurs de l’IST,

s’est traduit par le formidable essor des revues interdisciplinaires entre 2000 et 2015.

L’existant est déjà bien développé, il faut le recadrer et le partager

■ Partager les règles de régulation et mettre en lumière les outils organisationnels d’ores

et déjà intégrés aux supports est essentiel pour assurer un partage convivial de l’IST.

Ces outils relèvent de l’organisation de conférences, de l’inscription d’événements et

réunions au sein de calendriers collaboratifs, ou encore de l’établissement d’un véritable

« réseau social des chercheurs », intersectoriel, qui se superpose à un réseau social

existant ou complète l’offre de service du point d’accès unique développé.

■ L’INIST est par ailleurs impliqué dans des projets de R&D et investissement d’avenir

intégrant une part importante de fouille de textes pour proposer un accès élaboré aux

connaissances scientifiques décrites dans les publications que l’INIST met à disposition

de la communauté. Les projets actuels sont :

➢ Au sein d’ISTEX : enrichissement des textes par reconnaissance de termes, entités

nommées, citations, nécessaires au développement de services à valeur ajoutée,

Page 79: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

79

➢ Quareo : annotation de textes et développement d’outils d’analyse sémantique de

textes scientifiques ;

➢ ANR TermITH (Terminologie et Indexation de Textes en sciences Humaines) : accès

à l'information des documents numériques par le biais d’une indexation fondée sur les

termes qu’ils contiennent, ce qui suppose reconnaissance, désambiguïsation et analyse

des termes ;

➢ UBIK : détection et caractérisation de vocabulaires transdisciplinaires, approche

complémentaire des travaux sur les terminologies.

■ Lorsqu’un établissement possède un service en ligne d’assistance pour les questions

d’IST (service 6.3.), une collaboration peut être envisagée si la proximité de l’outil

d’assistance avec les acteurs locaux est garantie. Le CNRS doit jouer le rôle d’un

animateur de réseau. Le rôle du CORIST local ou d’une FAQ généraliste facile d’accès

est ici primordial. Les autres réseaux d’assistance, tels que le réseau Boomerang, ne

seront mis de côté que si l’offre nationale est cohérente, consultable librement, conviviale

et surtout utile. Un verbatim résume cette précaution ; « Le guichet d'assistance est

actuellement limité aux archives ouvertes et les autres demandes de documentation

électroniques se font directement par mail et téléphone à la responsable du portail ou

des ressources électroniques. Un service de guichet permettrait de mieux associer les

correspondants dans les laboratoires et de répartir ce service au niveau national pour les

questions d'ordre général. Il ne peut fonctionner qu'en intégrant les professionnels de

l'IST des établissements. »

Apporter des outils utiles sans tenter de rivaliser avec les réseaux sociaux classiques issus du secteur privé

■ En vue de mutualiser les outils terminologiques et de développer et gérer des

ressources terminologiques et des ontologies nécessaires aux processus

d'enrichissement des métadonnées, en construisant et exploitant des ressources de

représentation des connaissances (RRC), il est en outre engageant de ;

- Créer une plateforme unique des vocabulaires de l’ESR

- Alerter (sous forme de notifications) pour informer sur les thésaurus alignés

- Faire du lobbying pour les thésaurus internationaux (Gemet par exemple)

- Assister au traitement ponctuel de vocabulaires

■ Il faut coupler les services tels que I-Revues avec ScienceConf par exemple, pour les

actes de congrès. Les congrès, qui sont autant d’occasions d’aménager les interactions

entre chercheurs et de renforcer les maillages interprofessionnels, doivent trouver leur

Page 80: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

80

extension naturelle dans des comptes-rendus pouvant générer de nouvelles discussions

entre les participants, y compris une fois l’évènement physique terminé.

■ Une politique intelligente de l’IST française doit savoir négocier habilement des

ressources et outils issus de la concurrence privée internationale lorsque le rattrapage

de ces derniers par des outils développés nationalement par une agence de l’Etat est

trop coûteux. Les dépenses d’investissement doivent se focaliser sur les clés de

formation, d’unification de l’accès et de partage. Les équivalents internationaux de

SciencesConf tels qu’EDAS, Azur Colloque et Easychair sont plébiscités par les

chercheurs, et les solutions sont à chercher non pas dans un énième effort de publicité

et communication sur SciencesConf, mais dans la capacité de ce projet à innover en

prenant exemple sur les fonctionnalités phares des deux programmes cités. Un paiement

en ligne pour les frais d’inscription aux colloques serait notamment envisageable sur la

plateforme. La plateforme doit mieux savoir communiquer avec l'archive ouverte HAL (ce

qui n'est pas le cas actuellement) et aligner ses fonctionnalités éditoriales sur les

pratiques en vigueur à l'international pour les grosses conférences (plus de 300 articles à

gérer avec des fonctions automatiques). La possibilité de signaler des « conférences

isolées » sur Calenda serait très appréciée.

■ Un autre enjeu en lien avec cet alignement sur les outils disponibles gratuitement sur

le marché, et qui n'est pas des moindres, est de permettre aux scientifiques, de

conserver la souveraineté sur les données (notamment les rapports de relecture) en ne

les laissant pas à disposition d'entités privées qui les monnaient à des tiers pour des

usages non maîtrisés. Sans vouloir créer un « entre-soi », une certaine proximité et

confiance sont nécessaires à la formation d’un environnement sécure et confortable où

les chercheurs et les amateurs intéressés trouvent de l’intérêt à communiquer et à se

passionner ensemble pour leurs sujets d’étude.

2.2. Développer de nouveaux circuits économiques

“Winner takes all, first come first served” ; une approche publique fine

Entrer dans une concurrence directe et violente avec l’offre privée serait

couronné de peu de succès, dans la mesure où des logiques de monopole (le gagnant

prend tout et premier arrivé, premier servi) priment, et que le coût en argent et en temps

nécessaire pour ne serait-ce qu’espérer égaler ces outils par une offre nationalisée serait

trop élevé, sans maximiser l’utilité générale. Des partenariats doivent donc être mis en

Page 81: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

81

place pour penser le périmètre d’IST nécessaire à chaque acteur, et cette offre

intelligente doit faire l’objet d’une régulation juridique nationale, où l’Etat retrouve toute

sa place de premier plan.

Convergence de principe sur le libre accès, divergence entre voie verte et voie

dorée

Le libre accès, tout comme la recherche elle-même, est une question globale,

traitée par ailleurs à de nombreux niveaux internationaux (Science Europe, Global

Research Council, Knowledge Exchange COAR9 etc), au niveau européen, au niveau

national dans le cadre de la BSN. Cette convergence de principe n'exclut pas les

divergences, avec une opposition portant, notamment sur le modèle d'auto-archivage

(voie verte) et le modèle de publication dans des journaux « Open Access » (voie

dorée). Au sein de cette voie dorée, on peut distinguer deux variantes ; le doré avec frais

de publication réglés par l’auteur ou son institution (dites APC, pour « article processing

charges »), et le doré sans frais, avec de nouvelles formes d’édition. Le lobbying des

grands éditeurs classiques a conduit à décrédibiliser l’Open Access en voie dorée, en

faisant passer les journaux qui le pratiquent pour des prédateurs offrant peu de services

et faisant payer l’auteur. Mais l’incidence du coût ne repose que très rarement sur le

publiant, et n’est que très rarement assumé par l’auteur, mais bien plus souvent par son

organisme de rattachement. Cela ouvre bien des questions, tant sur l’acceptabilité de

nouveaux modèles que sur leur pérennité.

2.2.1. Poursuivre la coordination les efforts de négociation et d’acquisition des

établissements au sein de partenariats européens pour les stratégies d’achat

Le CNRS a une offre de service mais les établissements proposent eux aussi un

service analogue, d’ailleurs gratuit dans beaucoup d’universités pour les unités de

l’établissement. La question de la gouvernance pour la fourniture de documents est

posée.

Un tronc commun, des tailles locales

9 http://www.scienceeurope.org/, http://www.globalresearchcouncil.org/, http://www.knowledge-exchange.info/, http://www.coar-repositories.org/

Page 82: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

82

■ Elle ne peut être que partagée, et l’initiative des acquisitions pourrait être pilotée

conjointement, par un système en ligne agile, par le CNRS et les COMUE. Le partage

de services doit se faire en parallèle d’un partage de ressources. Le CNRS doit fournir

un « tronc commun », un fond de ressource documentaire, complété sur des sujets de

niche ou spécifiques à un territoire par les Universités et acteurs locaux. D’une manière

générale, il est absolument nécessaire que l’offre du CNRS s’articule de manière efficace

avec les acteurs de l’IST en local, en particulier avec les SCD. La mutualisation doit se

penser selon une approche de complémentarité : d’une part le rôle de

l’accompagnement de proximité doit être dédié aux acteurs implantés en local, d’autre

part au niveau national le CNRS doit proposer des outils et des infrastructures dotés

d’une gouvernance partagée. Les outils proposés doivent être en open source et

complètement adaptables en local. Les ressources doivent pouvoir être librement

modifiées et réutilisées.

Intégrer la dimension européenne des politiques d’acquisition

■ Ce qui a été fait dans ce sens est déjà très concluant, et témoigne d’un effort

national important concernant les stratégies d’achat de ressources. Cependant, la

dimension européenne de ces achats est souvent laissée de côté, et il est envisageable

d’impliquer les partenaires européens tels que le réseau Knowledge Exchange au sein

d’acquisitions coordonnées et négociées, permettant les échanges amiables d’articles au

lieu du paiement systématique et parfois doublonné qui existe actuellement.

Aller vers une plateforme européenne commune à terme, dans un horizon plus étendu,

est également imaginable.

Page 83: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

83

Une politique publique polymorphe

■ Pour poursuivre cette coordination de façon plus sereine, il est important de ;

- Décentraliser la collecte des avis et besoins

o collecter les avis (COPIST)

o les synthétiser (DIST)

- Centraliser l’offre de services et la formation

- Intégrer la stratégie IST

o à l’échelle européenne

o au milieu entrepreneurial

L’ingénierie de négociation d’achat des ressources et des outils

■ L'ingénierie de négociation d’achat de ressources numériques est une activité

dans laquelle l'INIST bénéficie d’une expérience acquise depuis presque 10 ans

dans les négociations thématiques (pour les portails) ainsi que de celle acquise dans les

négociations nationales (au côté de Couperin, des EPST et de l’ABES) dans lesquelles

l’INIST représente le CNRS. Ces négociations concernent annuellement plus de 50

éditeurs (70 bouquets de revues ou bases de données) afin d’obtenir des baisses

tarifaires, la pérennité des accès et la mise à disposition de statistiques d’usage. Sur

cette base, l'INIST peut apporter une réflexion et un conseil aux Instituts autour du

besoin du chercheur (I’InSHS souhaite un service au plus près des besoins, l’INSIS

n’exprime pas de besoins (à part IEEE), l’IN2P3 n’a pas de besoins identifiés).

■ Parallèlement aux acquisitions de ressources, existent des acquisitions d’outils. Il

serait intéressant d’agréger les données statistiques des portails CNRS à celle des

portails universitaires afin de produire des statistiques consolidées au niveau d'un type

de ressources, d'un labo, d'un établissement ou d'un groupement. Un dialogue COMUE

– CNRS doit être engagé à ce sujet. Il convient désormais de développer le périmètre

des établissements utilisateurs de la solution ainsi que le nombre de plateformes

analysées. Mettre en commun les coûts de développement de services statistiques

performants en utilisant l’Open Source pour certaines parties du code permettrait de

proposer ces services quasi-gratuitement aux acteurs de l’IST.

La prudence des Instituts quant à l’acquisition

■ L'InSHS choisit de négocier lui-même ses revues avec CAIRN, pour rester ferme sur le

périmètre des revues à acquérir. La suggestion est faite d’inclure au besoin un chercheur

dans le périmètre des négociations. L'INSHS entend définir ses acquisitions et

Page 84: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

84

abonnements au plus près des besoins des chercheurs et des laboratoires. Le RNBM a

tenté de le faire, en se maintenant dans la négociation avec Springer en y amenant un

regard scientifique. Il y a un besoin de soutien juridique aux instituts qui s'engagent dans

les négociations.

■ L’INSMI est en train de monter une organisation de mutualisation afin d’assurer la

pérennité des services offerts par les 3 sociétés savantes (françaises et européenne) les

plus proches de la communauté.

■ En cette période de transition entre les modèles Gold et les abonnements, il est

prudent « d’assurer ses arrières » en conservant un service de fourniture de documents

performant (à ce titre, l’INRA vient de décider de réactiver la fourniture de documents

pour ses équipes de recherche).

2.2.2. Concevoir une offre soutenable pour les établissements, en repenser les

périmètres d’accès

Chaque établissement a des besoins en IST différents, allant de la simple

consultation de titres rapide à des fonctions de suggestion de sujets de recherche

approfondies en passant par des besoins complémentaires de TDM. En dehors des

acquisitions de ressources et d’outils pour les traiter, les frais d’adhésion à un support

sont donc une part majeure du choix complexe que doivent effectuer les décideurs dans

chaque acteur.

1er arbitrage : rechercher sans perdre de temps

■ Un premier arbitrage se fait entre la volonté de pouvoir rechercher l’information

parmi le corpus le plus large possible, sans pour autant consacrer un temps trop

important à cette recherche ; il a été solvé par les puissants outils de TDM qui, en

dépassant largement les fonctions de base d’un simple CTRL+F tapé au clavier,

permettent désormais de rechercher des synonymes, des unités de sens, voire des

motifs iconographiques.

2nd arbitrage : trouver sans trop dépenser

■ Le second arbitrage, en revanche, demeure ; entre cette même volonté d’accéder à

une somme maximale de documents et une possibilité de financement contrainte,

Page 85: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

85

avec l’impossibilité de déterminer, document par document, lequel entre ou non dans le

périmètre d’intérêt.

Un premier possible : consultation de listes et paiement à l’article

■ De surcroît, si privilégier un système où chacun dispose d’une liste a maxima de titres

de documents, puis doit payer pour en lire le contenu exhaustif (à la manière des articles

de presse présentant seulement un résumé et leur titre gratuitement, ou « paiement à

l’article ») a longtemps paru être une piste envisageable, ce n’est plus vraiment le cas.

En effet, les listes de titres constituent en elles-mêmes, étant donné le volume global

d’information que les éditeurs doivent traiter, une IST valorisable, issue d’un long travail

sur les métadonnées et le référencement, qui ne peut donc pas se voir proposer

gratuitement.

■ Ce traitement de l’IST côté éditeurs rejoint aussi un long travail de préparation de

l’environnement de diffusion par les entités de coordination de l’IST, qui a également un

coût ;

Page 86: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

86

Les bouquets d’achats, « packs » et autres acquisitions en lots

■ L’acquisition définitive des droits sur les documents par chaque unité est une option

évacuée d’emblée, car d’une part elle accroît la concurrence et la détention exclusive et

va à l’encontre du partage, et d’autre part elle occasionne des coûts bien trop importants,

sachant qu’aucun directeur d’unité ne peut anticiper exactement quelle est la nature et

l’étendue de l’IST que ses chercheurs nécessiteront durant une année civile.

■ Si les « packs » ou options d’achat proposés par exemple par le consortium Couperin

pour adapter le périmètre documentaire selon les besoins de chaque acteur ont constitué

une première étape de résolution, il faut aller plus loin, car nombre de documents et

volumes d’IST sont encore acquis sans jamais être utilisés. Des doublons et une

double irrigation instituts/universités doivent aussi être supprimés dans une

concertation signalant les opportunités de commandes groupées. Et, si des soutiens

ponctuels de la part de l’Etat (subventions, transferts, aides à l’acquisition) ont été établis

sur les 5 dernières années, ce système n’est pas pérenne et ne peut rendre possible une

gestion sereine à long terme de l’acquisition d’IST.

Au-delà des voies vertes et dorées : imaginer un modèle économique des

micropaiements

Page 87: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

87

■ Aussi, une première solution intéressante serait de mettre en place une tarification qui

voit au-delà des voies vertes et dorées, permettant l’émergence d’un nouveau

workflow, d’un nouveau rapport à la recherche, intégrant totalement les possibles

numériques, sans être le format classique de « paiement à l’article » peu plébiscité par

les grands noms de l’édition, et composée par exemple comme suit :

- Une part forfaitaire, liée au coût logistique pour le fournisseur du service de

recherche centralisé ;

- Une part « sectorielle », liée aux centres d’intérêt scientifique renseignés comme

prioritaires par l’unité ;

- Une part « au volume de recherche », proportionnelle au volume d’IST sollicité

par les recherches de l’unité en question (indépendamment de la lecture effective

des données, il s’agirait d’une compensation du coût de référencement et

d’affichage ordonné, couvrant également la réutilisation-citation de titres) ;

- Enfin, une part « en lecture pleine », concernant les documents (articles,

datasets) lus intégralement ou téléchargés.

■ Une seconde piste non-concurrente, qui reste dans cette approche de l’IST comme un

service partagé payé à l’usage, consiste à rendre disponibles pour un coût moindre les

résultats d’une recherche effectuée préalablement par un chercheur A (en t-1) au

chercheur B en t. L’avantage d’une telle optimisation des recherches serait qu’une partie

du paiement effectué par B (sur la part « en volume ») pourrait être transférée à A au

titre de l’effort de curation qu’il a effectuée sur les données brutes, à la mesure du

nombre d’opérations de filtrage effectuées. L’inconvénient est qu’il faudrait munir chaque

unité, si pas chaque citoyen ou chercheur, d’un compte capable de quantifier l’effort

fourni et reçu, et donc les micropaiements.

Inciter au lieu de contraindre : le principe de confiance contenu dans la blockchain

■ Il faut définir, préalablement avec la DSFIM et la DDAI, les bases budgétaires à retenir

pour encadrer les évolutions possibles. Techniquement toutefois, ces deux options sont

tout à fait envisageables, et rappellent dans leur principe la rémunération interne prévue

lors du « minage » (chiffrement) d’un bloc monétaire (ex : 1 bitcoin) lors du

développement d’une blockchain. En d’autres termes, celui qui permet à l’information

d’exister ou d’être sécurisée reçoit en contrepartie un paiement utilisable seulement

pour acquérir plus d’information. Le principe de fonctionnement en boucle fermée

présuppose que ces micropaiements ne se feraient donc pas nécessairement en

monnaie réelle, mais plutôt sous forme de « points ». De cela résulteraient deux

avantages supplémentaires ; l’incitation à curer les résultats pour en gagner, et

Page 88: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

88

l’incitation à poursuivre ses recherches, ceux gagnés ne pouvant être dépensés

autrement.

■ En termes de gouvernance, la section IST du CNRS doit se recentrer sur les

compétences IST opérationnelles, et prioriser le fait de rendre possible l’accès sur

l’analyse de ce même accès. Cette dynamique se fonde sur le rapport fourni par le

cabinet Ourouk synthétisant les résultats de l’enquête COPIST 2016. De même, une co-

gestion entre la CPU et les organismes, à partir des retours du COPIST, semble la

manière la plus soutenable et légitime d’opérer la mise en œuvre de ces nouveaux

modèles d’achat.

2.2.3. Etablir un nouveau modèle économique de valorisation (recommandation,

etc.) au cœur d’une Science Ouverte fonctionnant sur le principe de Libre Accès

En dehors de ce premier besoin qu’est l’acquisition d’IST, les chercheurs sont

aussi producteurs d’IST et d’articles issus de cette dernière. Leur existence dépend de

revenus générés par cette production. Il convient donc de mieux valoriser les sciences

dures à travers de nouvelles entreprises, et plus largement de redynamiser les systèmes

éditoriaux pour permettre à tous les secteurs scientifiques, y compris les SHS, d’éviter la

précarisation et la marginalisation.

■ Le chercheur se voit proposer de nombreux outils de valorisation de sa production,

nés sur le marché privé dans les communautés du libre, dans les réseaux sociaux

(Research Gate et Orcid, Scopus, ResearchID, LinkedIn…). Ces outils peuvent à la fois

générer des classifications de thématiques des chercheurs et des publications et de

mettre en relation les chercheurs. Mendeley, par exemple, permet de générer des

bibliographies automatiques, de gérer une bibliographie en collaboration avec d’autres

chercheurs, de trier de la bibliographie et d’être en relation avec sa communauté

Les difficultés de mise en place d’un paiement au volume de lecture

■ Le modèle de paiement au volume de recherche permettrait de rémunérer les auteurs

sur un compte associé à la plateforme. Cependant, plusieurs phénomènes concourent à

rendre impossible une parfaite mise en équivalence entre les paiements effectués et les

Page 89: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

89

rémunérations reçues par la communauté scientifique sur une période donnée (1 an, 1

mois, 1 jour) :

- D’abord, certains des auteurs dont les ressources sont consultées sont

morts, et les paiements sont difficilement répartissables entre les auteurs vivants,

y compris lorsque ces derniers ont permis la remise au goût du jour des travaux

de leurs prédécesseurs ; en effet, des fondations et éditeurs récupèrent une partie

des droits, et le reste éventuel est moralement impossible à diviser entre les

vivants ;

- Ensuite, certains auteurs sont peu lus, mais leurs travaux n’en sont pas moins

cruciaux, puisqu’ils apportent un regard neuf pour une « niche » de recherche, ou

parce qu’ils permettent de générer, à travers des chaînes causales longues, des

externalités positives en grand volume : on ne peut donc pas mettre leurs travaux

en danger en ne les rémunérant pas à la hauteur de leurs compétences ;

- Enfin, il est difficile de mesurer l’effet du piratage et de la copie illégale de

ressources pour des diffusions internes notamment, floutant le réel usage de

chacun. Le taux d’équipement informatique ainsi que les habitudes du format

papier, combinées à des difficultés techniques majeures (possibilité de faire des

captures d’écran même lorsque le copié-collé est interdit, voire de photographier

l’écran) ne permettent pas aujourd’hui d’envisager une individualisation pure et

parfaitement traçable des points d’accès.

La Science doit trouver des solutions ; à défaut, le marché privé le fera pour elle et

sans prendre en compte les paramètres d’éthique et de service de l’intérêt général

identiquement

■ Néanmoins, le constat demeure le même : la science doit s’ouvrir, et même si elle ne

le veut pas, elle sera ouverte de façon abrupte par le partage sauvage et les pratiques

de peer-to-peer et de téléchargement illégal, la régulation sur le format d’Hadopi ne

pouvant porter ses fruits. Alors, plutôt que de subir cette modalité du partage, mieux vaut

en comprendre les subtilités et en faire un principe-phare

■ Aux tarifs actuellement demandés par l'Edition, le pur doré est difficilement soutenable

comme voie de généralisation du Libre-Accès pour les organismes qui publient

beaucoup. On ne sait évaluer les usages liés au "doré auteur-payeur", qui est représenté

par le projet SCOAP3 (IN2P3 et INP) et les journaux de l’EGU soutenus par l’INSU.

■ Des projets de nouvelles formes d’édition existent, déjà avancés ou mûrs, comme

Open Edition (InSHS), ou ayant émergé plus récemment, tels que le projet

Page 90: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

90

episciences.org avec les épijournaux en maths et informatique. Il en existe encore

d’autres comme par exemple de nouvelles méthodes d’évaluation du type « open peer

review ». Globalement en France, il existe trois types de projets menés pour renouveler

les modèles économiques ;

Les épirevues (Bordeaux) (IDEX) (OpenEdition)

■ Concernant les épi-revues, une répartition intelligente des fonctions entre les

différents projets (Episcience, I-revues) serait indiquée, passant soit par une véritable

différentiation des offres, soit par une fusion, en vertu du principe de non-

superposition. Par ailleurs, pour que des projets locaux de publication scientifique en

libre accès puissent voir le jour, il faut que les établissements disposent d'une

cartographie leur permettant de s'orienter et de choisir rapidement parmi les possibilités

qui s'offrent, celle qui convient à leur projet et aux moyens dont ils disposent. Le listing

de l’offre de services aux chercheurs établi et diffusé par la DIST du CNRS trouve ici

toute sa place, et doit faire l’objet d’une communication renforcée.

La valorisation par le peer-reviewing

■ La pratique de la recommandation par les pairs, plus connue sous le terme de peer-

reviewing, doit se généraliser pour permettre une présélection des ressources de

confiance dans des supports aux accès plus ouverts et aux volumes sans précédents.

Cependant, des procédures de filtrage manuel doivent continuer à se développer en

parallèle, pour éviter que les sujets les moins recherchés ou les publiants les moins

connus soient discriminés et demeurent en fin de listes perpétuellement.

■ Les chercheurs doivent à ce titre pouvoir disposer d’un Curriculum Vitae (CV)

complet, retraçant avec précision toutes leurs publications, distinctions et participations

à des colloques. Un générateur automatisé de CV, fondé sur un algorithme établissant

des « filtres d’alerte » sur chaque plateforme d’IST, qui se déclenchant à l’apparition du

nom du chercheur, serait utile tant pour les chercheurs que pour les investisseurs et

organisateurs souhaitant opérer une recherche de personnes compétentes sur un point

précis. Pour ce faire, les identifiants nationaux doivent servir de base au dépôt dans

HAL. Pour servir de référence en lien avec IdRef, afin d'identifier et signaler la production

des chercheurs, nourrir et créer les fédérations et réseaux de recherche, l’idée du CV

semble utile. Elle offre une motivation supplémentaire pour déposer dans HAL.

Cependant, le CV doit pouvoir intégrer sous un format interopérable les autres

publications externes certifiées (par exemple par ORCID).

Page 91: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

91

Une API agile pour automatiser les tâches répétitives qui occupent le chercheur

■ Pour faire simple, en amont (versement automatique des articles dans HAL, aidant

et remplaçant en partie le dépôt manuel) comme en aval (inclusion automatique de la

ligne de cet article dans le CV du/des publiant(s), une API agile et fonctionnelle doit

effectuer les tâches répétitives de publication et post-publication des travaux, l’objectif

étant in fine de laisser le chercheur focaliser sa précieuse attention sur ses travaux de

recherche, et non sur les aspects logistiques d’une machinerie informatique IST étant

devenue trop complexe pour qu’il sache la programmer de A à Z. Cette complexité doit

néanmoins servir l’efficacité au service des chercheurs et des citoyens, et ne pas exister

« pour elle-même ». En ce sens, si la comparaison avec le monde entrepreneurial est

permise, il faut que le « back office » développe des API d’une grande technicité pour

que le « front office », ou en d’autres termes l’expérience utilisateur, soit fluide, simple et

intuitive.

De nouveaux types de contrats d’édition et de formats de publication auxquels la

LPRN ouvre la voie

■ Sertis de grilles tarifaires plus fluides, de nouveaux contrats d’édition permettent de

diminuer le seuil critique de vues à atteindre pour enclencher un paiement, tout en

diminuant la durée des embargos. Ces contrats ont souvent vocation à être complétés

par des revenus fixes, tels que ceux des chercheurs, revenus financés à travers des

organismes tels que le CNRS par les prélèvements obligatoires.

■ En outre, la publication conjointe d’articles avec les données de recherche ayant servi à les rédiger se développe, voire la publication des données elles-mêmes, les « data journals » (Nature, RDJHSS, etc.). Les « mega-journals », s’ils relèvent aujourd’hui du « pur doré » n’en sont pas moins des initiatives originales dont l’arrivée peut bousculer le paysage de l’édition savante de manière importante. En outre, la publication conjointe d’articles avec les données de recherche ayant servi à

les rédiger se développe, voire la publication des données elles-mêmes, les « data

journals ». Les « mega-journals », s’ils relèvent aujourd’hui du « pur doré » n’en sont

pas moins des initiatives originales dont l’arrivée peut bousculer le paysage de l’édition

savante de manière importante. Il ne s’agit plus vraiment de journaux, mais de sortes

d’archives ouvertes payantes et au contenu certifié.

Des modèles commerciaux innovants basés sur l’algorithmique et des indicateurs

Page 92: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

92

■ Globalement, outre le paiement par l’auteur, divers modèles sont envisageables ; le

financement d’une plateforme par la publicité, l’accès libre conditionné à un

volume de peer-reviewing à effectuer chaque mois (entretenant ainsi une boucle

vertueuse), ou encore le crédit « d’autorité », ajoutant de la force aux reviews d’un

auteur lorsque celui-ci a lui-même reçu beaucoup de reviews positives, avec

cependant le risque de formation de « groupes de soutiens » fonctionnant en vase clos…

Il est évident que les indicateurs comme le facteur d’impact développé par Thomson-

Reuters doivent aussi être agrégés à d’autres indicateurs concernant par exemple

l’audience réelle (nombre de lecteurs) ou la labellisation par des tiers certificateurs

concernant la qualité / respect des données. Plusieurs de ces modèles, rendus possibles

par la science algorithmique, peuvent être combinés afin de limiter les risques de

chacun.

■ Quoiqu’il arrive, même si le modèle de l’éditeur en ligne, basé sur l’éditeur papier

aujourd’hui largement dépassé dans la recherche, doit céder du terrain à des modèles

d’agrégateurs et de référenceurs, le rôle d’hébergeur demeure, avec des volumes de

données de plus en plus importants à mesure que l’exigence de publication conjointe

article + données se renforce. Aussi, l’hébergement coûtant de l’électricité, du

matériel et des ressources diverses, le paiement ne peut totalement être laissé à la

publicité en raison du fait que, contrairement à des plateformes comme Facebook ou

Google, dont les données constituent la valeur, certaines données reliées à des articles

n’ont qu’une valeur marginale lors d’éventuelles vérifications de méthodologie ou de

fiabilité, et non une valeur commerciale brute.

Le règne de l’actualité et des sujets en vogue, à compenser par la suggestion de

sujets

■ Le risque cependant est que le règne du plus intelligent soit parfois remplacé par un

règne du plus visible ; celui qui produit le plus de résultats ou emploie des formulations

allant toujours dans le sens d’une surenchère médiatique emporte la visibilité maximale

et déséquilibre l’attribution des bons résultats aux bons marchés-cibles. Enfin, on assiste

à un règne de certains « sujets du moment », qu’il fait bon étudier pour recevoir des

subventions ou un afflux d’audience, dans une vision très politiquement populiste et

court-termiste de la recherche. Ce côté « auto-entretenu » des logiques de publication en

raison des indicateurs fixes et de l’actualité doit être contrebalancé par l’introduction de

suggestions algorithmiques de sujets de recherche fondées sur les mots-clés les

moins traités, et qui reste insondable et donc imprévisible en étant en partie aléatoire.

Page 93: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

93

2.2.4. Mettre en place les structures (agences, charte éthique) à même d’assurer

l’application des principes juridiques contenus dans la LPRN (loyauté des

plateformes, lisibilité, exhaustivité)

Enfin, les fonctions d’acquisition et de production d’IST doivent être placées plus

largement au cœur d’un cadre juridique stabilisé et sûr, cocon protecteur respectant les

spécificités liées à certaines données sans ignorer les exigences de partage et celles du

marché, qui ne sont pas nécessairement antinomiques.

Inciter les chercheurs à utiliser les outils publics en soulignant les défaillances

ailleurs, en vue de rationaliser les dépenses publiques

■ Pour les établissements ne disposant pas d’un service d’études bibliométriques, la

voie des partenariats a historiquement été employée comme correctif. Une tension est

perceptible entre les outils promus par le CNRS (Web of Science (WoS), Scopus) et

l’offre externe existante, qui est jugée par certains établissements comme plus

adéquate. Il n’est donc pas possible de lutter frontalement, par orgueil, contre des

outils qui ont fait leurs preuves et en tirent un quasi-plébiscite. Bien plutôt, il convient de

souligner auprès des chercheurs les défaillances de tels outils en matière de sécurité, et

leur coût fort sur le long terme, mettant en comparaison ces modèles privés avec le

modèle de la science publique, coûtant cher dans sa phase R&D, mais beaucoup plus

stable et moins chère à long-terme. L’idée est de sensibiliser le chercheur à l’Open

Science, tout en lui faisant comprendre que le modèle vers lequel tous les efforts privés

tendent aujourd’hui n’est possible qu’avec un Etat fort assurant des revenus aux

innovateurs et chercheurs. Or, ceci passe forcément par l’allocation de produits issus de

prélèvements obligatoires à la recherche (produits dont les vagues de PIA témoignent) ;

ce financement issu des impôts et des taxes pesant sur les ménages et les entreprises

dans un contexte de dégonflement de la dette doit trouver des sources de diversification

via la valorisation (recherche appliquée), mais une part structurelle ne peut être financée

que par l’Etat, notamment en SHS, en raison de la compétitivité culturelle et non-

commerciale engendrée. Ainsi, il n’est ni souhaitable ni soutenable de financer des outils

de traitement de l’IST et des plateformes privées avec l’argent du contribuable, lorsqu’un

modèle d’outils et de supports public est concevable à l’échelle nationale et en

concertation avec l’Europe. Ces incohérences économiques et en matière de

protection des données doivent être mises en lumière et l’arbitrage en résultant de la part

des chercheurs se fera sentir.

Harmoniser les rythmes et délais : vers une concertation nationale

Page 94: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

94

■ Un verbatim de l’enquête COPIST relevait avec justesse ; « Si la feuille de route HAL

est arrêtée dans le courant du 2ème trimestre 2016, alors il est peu probable que les

demandes formulées par les établissements au cours de cette enquête puissent être

prise en compte dans cette feuille de route. ». Une harmonisation des rythmes et une

synchronisation des consultations à l’échelle nationale entre tous les acteurs de l’IST est

donc nécessaire. En effet, les individus se désintéressent du sujet en l’absence de

prise en compte de leurs avis, et ce durablement.

■ L’arbitrage de la voie partenariale trouve sa source dans la voie éthique ; il faut mettre

en place une concertation nationale des acteurs suffisamment large et englobante pour

être représentative et coller aux réalités du terrain, mais suffisamment peu nombreuse

pour éviter des inerties freinant la créativité ainsi que des lourdeurs occasionnant des

longueurs dans les délais.

Prendre en compte tous les positionnements sous l’exigence absolue d’intérêt

général

■ Il convient d’opter pour un positionnement englobant suffisamment le milieu de la

Recherche et les organismes directement rattachés à l’Etat, sans pour autant céder trop

de terrain à la volonté des GAFAM, qui peuvent avoir des intérêts divergents mais

occupent une place suffisamment importante et mature sur le marché pour pouvoir être à

même de négocier.

Renforcer les agences existantes et en créer de nouvelles

Page 95: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

95

■ La création d’une centrale de services à l'INIST, en réseau avec PERSEE et le

CCSD est nécessaire.

■ La création d'une Agence nationale de valorisation numérique du travail

scientifique est indiquée afin d’obtenir un interlocuteur unique à même de négocier les

données avec Etalab.

■ La LPRN établit, dans sa Section 3, le principe de « loyauté des plateformes ». La

notion de plateforme telle que le Conseil National du Numérique l'envisage, englobe

toujours un hébergeur et un afficheur, comme Google qui stocke des liens et détermine

algorithmiquement leur ordre d’affichage. Une plateforme peut englober des réalités

aussi variées qu’un moteur de recherche, un comparateur, un site de petites annonces,

une place de marché, un site de crowdfunding, ou encore un réseau social.

La loyauté des plateformes : faire respecter un principe complexe et contesté

■ Les premières versions du projet de LPRN définissaient, en article 22, la plateforme

comme le référencement de biens ou services mis en ligne par des tiers, et la mise en

relation de la demande et de l’offre pour une transaction de vente, de partage ou

d’échange. L’article 19 fondait le principe de « loyauté envers le consommateur ».

Cette notion est à rapprocher de celle d’« exécution de bonne foi du contrat »,

auparavant définie par l’article 1134-3 du Code Civil, mais qui se limitait à la phase

d’exécution, là où le nouvel article 1104 du Code Civil dispose que « les contrats doivent

être négociés, formés et exécutés de bonne foi », en faisant une disposition d’ordre

public. Cela passe par plusieurs leviers de politiques publiques ; apprendre la

programmation informatique à l’école dès le jeune âge, sanctionner les pratiques

anticoncurrentielles, et combler les vides juridiques existants entre les CGU/CGV des

plateformes et les droits de propriété et de travail émergents pour les producteurs et

récepteurs d’IST via l’économie numérique.

La LPRN pose l’obligation de loyauté en ces termes : « Tout opérateur de plateforme en

ligne est tenu de délivrer au consommateur une information loyale, claire et

transparente sur les CGU et sur les modalités de référencement, de classement et de

déréférencement des contenus […] ».

De manière globale, l’objectif de la loyauté est d’empêcher l’existence de plateformes

abusant, au détriment du libre arbitre du client et/ou des droits des producteurs de

données (par exemple les chercheurs), des données mises en ligne par le biais de

Page 96: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

96

termes de services complexes et trop chronophages pour être lus, dans un monde

où chaque consommateur utilise des dizaines de plateformes.

■ Pour répondre efficacement aux enjeux économiques des plateformes, la LPRN a

adopté une vision transversale du sujet, prenant en compte les aspects suivants, qui

relèvent de différents aspects du droit ;

▪ Asymétrie d’information (en la corrigeant en faveur du consommateur)

▪ Règles de concurrence (en faisant une lecture compréhensive sans

négliger les métiers existants)

▪ Concentration des fonctions et des circuits (en tentant de diviser

juridiquement ces fonctions)

▪ Fonctionnements des marchés multifaces (en formulant des définitions

larges et englobantes)

■ La division des rôles d’une plateforme conduit à établir les frontières de la

« loyauté » autour de l’idée d’afficheur : ce dernier doit dès lors être transparent sur

ce que fait la plateforme : comment choisit-elle les items affichés, quelles règles

régissent l’ordre de classement, qui la finance ?

Elle doit également permettre ;

- à l’utilisateur de modifier les critères de sa recherche

- de garantir l’interopérabilité et la portabilité des données pour changer de

plateforme sans perdre de données

Et cela sans confronter l’utilisateur à un plafond de verre technique limitant ses choix ;

- il doit pouvoir choisir l’usage de toute application, même non certifiée (à ses

risques et périls)

- en créer, pour reprendre le mot de Steve Jobs, et in fine ne pas être contraint

d’utiliser une application.

■ Empêcher les concurrences déloyales et les biais informationnels, tout en rendant

visibles les « empilements hiérarchiques » entre sociétés, constitue le cœur de cette

exigence. Les travaux préparatoires des lois Macron et Hamon désignaient l’obligation

de « faire apparaître clairement l’existence ou non d’une relation contractuelle ou de

liens capitalistiques avec les personnes referencees, [ainsi que] l’impact de celle-ci sur

le classement des contenus proposés » : il est nécessaire de rendre clairs tous les liens

financiers pour garantir le consentement éclairé de l’utilisateur.

Page 97: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

97

■ Les politiques publiques visant à garantir la loyauté des plateformes relèvent d’une

distorsion de la concurrence, et donc d’une défavorisation des leaders « naturels » ;

en ce sens, les entreprises gérant les principales plateformes n’ont que peu d’intérêts

dans la révélation de leurs modèles économiques, et par conséquent un fort lobbying

anti-LPRN s’applique de la part notamment des GAFAM.

Traces laissées par les personnes dans les systèmes : l’urgence d’un cadrage

éthique

■ L’InSHS souligne l’importance et l’urgence de fournir un cadre éthique au travail sur

les données relatives à la personne, aux opinions et aux préférences. Les SHS elles-

mêmes peuvent contribuer à construire des références. La réflexion est étendue et

pluridisciplinaire. Le TGIR Huma-Num a mis en place une démarche éthique interne sur

les données ethnologiques et sociologiques. Comment traiter la question des traces

laissées par les personnes (les chercheurs) dans les systèmes d’information ? Le Cléo

souligne que les choix éthiques ne peuvent être abordés de façon unilatérale et sans

débat. L’obligation de révéler les données devrait toutefois devenir la règle, et le secret

l’exception nécessaire, afin de permettre la reproductibilité et la « confrontabilité » du

travail de la science. L’INIST émet également une demande dans ces sens. RENATIS

indique disposer d’un Code de déontologie rédigé par des professionnels des réseaux

(2004-2005) à remettre à jour, diffuser et promouvoir auprès des professionnels de l’IST ;

porter à la connaissance des directions d’Instituts, des directions des laboratoires, des

chercheurs.

■ Afin de restreindre les conflits d’intérêt et de leur fournir un cadre d’expression sur

lequel le législateur peut poser un regard informé, une Agence d’Ethique fondatrice et

protectrice d’un texte définissant des normes de discussion et des critères d’acceptabilité

mutuels entre les entreprises et l’Etat pourrait être mise en place. Ce texte,

complémentaire à la Loi qui corrige les attitudes pénalement répréhensibles telles que

le piratage, et qui pourrait s’inspirer de ceux de Renatis et de l’INSB tout en intégrant les

nouvelles variables, serait une Charte Ethique d’application de la LPRN, qui aurait

vocation à faire éclore des décrets d’application facilement acceptables par le Conseil

d’Etat, car issus d’une concertation entre les acteurs concernés, chapeautée par des

juristes spécialisés.

Les axes de réflexion éthique au service de l’IST, et les avancées respectives

■ Parmi les sujets-clés à traiter, figurent ;

Page 98: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

98

- quel statut donner aux données « brutes » ? Aux données « interprétées » ?

Quelle est la frontière ? La question se pose avec la caractérisation d’échantillons et la

part que peut y laisser la trace laissée par l’outil d’analyse….

- le plagiat

- les données erronées

- la diffusion interne/externe : quels doivent en être les délais ? L’INSU par exemple,

en particulier en astronomie, a une pratique très positive de l’accès ouvert aux données,

tempéré par une période propriétaire – souvent un an – qui permet aux chercheurs ayant

obtenu du temps d’observation sur appel d’offre d’étudier les données avant la mise à

disposition de tous.

■ L’article 29 du Code des contrats européens oblige le dépôt de l’ensemble des

publications financées par le contrat dans des archives ouvertes et de les rendre

accessibles (un embargo est possible en fonction des disciplines). Les coûts générés par

ces dépôts sont éligibles à la justification financière. Il en va de même pour les données

de la recherche (sous-jacentes ou ayant été utilisées pour obtenir les résultats). Elles

doivent être déposées dans un réservoir (sauf dérogations) et rendues accessibles avec

des outils permettant de les utiliser.

- à partir de quel critère les données deviennent publiques ? L’INEE fait observer que

la frontière est difficile à établir : les recherches sur contrat peuvent dans leurs clauses,

prohiber la mise à disposition des résultats et/ou des données : quels critères appliquer

au regard de la libre disposition des résultats de la recherche publique ?

■ L’INSB dispose d’une Cellule Ethique qui veille au respect des réglementations en

vigueur concernant les organismes génétiquement modifiés, les tissus humains,

l’utilisation des animaux, y compris les primates non-humains et toute recherche sur

l’homme. Il pourra être intéressant de partager cette expérience avec les autres Instituts.

Le TGIR SOLEIL souligne que les questions techniques et juridiques doivent répondre à

des règles pas seulement françaises mais européennes. En somme, il faut mettre à

contribution les pratiques existantes en France (Alliances, Organismes de recherche),

comme au plan international (Europe, Grands organismes étrangers…) en examinant les

besoins de Chartes IST spécifiques par domaine ou projets de recherche en vue d’une

contribution au dispositif public Etalab.

2.3. Proposer un point d’entrée unique, tenant compte de la grande

diversité de ressources et de plateformes

Page 99: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

99

Un certain nombre de réponses revient sur la crainte d’un éparpillement des

outils. Les cinq sections proposées par le COPIST semblent parfois détachées,

disjointes et un manque de cohésion de tous ces outils porte le risque d’un mauvais

usage. Cette lisibilité est aussi liée aux acteurs qui proposent ces services. C’est la

question de l’articulation entre le niveau national (le CNRS notamment) et le niveau

local (les SCD des établissements). Comment le COPIST pourra-t-il prendre en compte

les réalisations locales déjà implantées ? Va-t-il les supprimer ? Le manque de

cohérence viendrait donc d’un risque de doublons dans tous ces services. C’est encore

plus vrai avec les autres dispositifs existants, comme ceux proposés par l’ADBU ou

Couperin. Comment penser la convergence des outils ? Cette cohérence tient enfin à

la matière qui paraît proposée par le COPIST. La prédominance des SHS et le manque

d’accès à des outils utiles pour certaines formations scientifiques apportent le risque d’un

manque d’implication des acteurs concernés. L’interdisciplinarité apparaît aussi

comme un élément de lecture essentiel.

2.3.1. Faire appliquer les principes juridiques de protection des données (secret

dans la recherche, confidentialité, anonymat simple ou coordonné)

La sécurité des données issues de l’IST : aspects matériels et logiciels

■ Les chercheurs, à l’avant-garde des consommateurs interagissant quotidiennement

sans le savoir avec de l’IST (soit qu’ils soient producteurs ou récepteurs), tiennent à la

sécurité de leurs données. Cette sécurité est d’abord informatique. Elle est ensuite

nationale ; une des nouvelles missions de l’Etat est de garantir un niveau de

confidentialité réelle adéquat à chaque situation ; du secret au public, chaque information

doit pouvoir se prémunir d’éventuelles attaques extérieures ou intérieures, de toute

spéculation, et le cas échéant conserver un caractère destructible que la nature même

d’internet rend difficile à assurer. En mettant ces deux premières exigences en vis-à-vis,

il ne faut pas omettre le caractère matériel des installations (serveurs, data centers)

rendant possible le fonctionnement d’internet.

■ L’enjeu de la territorialité du stockage et du traitement des données IST est majeur.

ArXiv est très utilisé par les mathématiciens mais il y a une nécessité que le CNRS ait

une relation forte et construite avec ArXiv. Ainsi, il existe, pour l'INSMI, un risque d'une

relation de dépendance mal contrôlée : la publication scientifique ne peut être placée

dans les mains d’une entité indépendante comme ArXiv, hébergée à l’université Cornell.

Le problème est d’ordre stratégique car cette base est unique. Les miroirs qui existaient

Page 100: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

100

en Europe sont en train de disparaître. Si l’accès à ArXiv rencontre des difficultés, le

patrimoine scientifique peut se trouver menacé. Pour l’INSU et l’INSMI le maintien de la

relation à arXiv est important : une convention paraît nécessaire. Il faudrait une

négociation globale et siéger au conseil d’administration. Heureusement, le CCSD

gère un des rares miroirs pour les dépôts français d’arXiv.

■ Elle est, enfin, éthique ; en effet, chaque règle établie ne doit pas l’être pour elle-

même, mais en vertu d’un raisonnement humain et juridique complet, qui intègre la

possibilité de sa propre transgression si la sauvegarde d’un intérêt ultérieur et supérieur

l’impose. Pour l’INEE, la sécurité ne doit pas être conçue comme une « action IST »,

mais comme une condition de cette action.

De la PPSI à la LPRN : affiner la définition des matières à protéger et des manières

de le faire…

■ Comment gérer les contenus générés par les utilisateurs ? Comment contrôler les

cookies, les pop-ups qui peuvent autoriser des tiers à s’introduire dans le réseau ? Les

textes de la LPRN sur la sécurité en IST reprennent largement des éléments définis dans

la Politique de Protection des Systèmes d’Information (PPSI) notamment ceux relatifs à

la protection des jeux de données. Il définit des maîtrises de risques et ce que l’on

protège. Des rappels sont faits sur la sécurité en matière de dépôt de brevet, de

responsabilisation des DU et des responsables de projets, ainsi que 3 niveaux de

diffusion : public, interne, confidentiel. Afin d’éviter les attaques informatiques, il faut

encourager l’utilisation d’un cloud privé et appliquer des règles d’hygiène informatique

disponibles auprès des RSI. Les unités doivent non seulement faire signer et appliquer la

charte informatique mais aussi faire remonter les incidents au niveau national

(piratage…).

De la LPRN à une intégration forte des paramètres numériques de l’IST dans

chaque domaine juridique ?

■ Une fois les grandes lignes stratégiques de l’application de la LPRN établies, le

dilemme réside dans l’attitude normative à adopter ; continuer de forger, dans le sillage

de la LPRN d’Axelle Lemaire, une structure dédiée au numérique incluant les

obligations des plateformes… ou plutôt développer le droit des plateformes comme une

extension des domaines de droits existants à un nouvel objet ?

Page 101: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

101

- La première solution, absolue et monobloc, est séduisante ; elle permet de

regrouper tous les nouveaux problèmes émergents, et leurs réponses correctives,

dans un même texte, sur une page blanche, et donc de sensibiliser tous les

acteurs à peu de frais.

- Néanmoins, dans le texte finalement adopté de la LPRN, on observe une

méthodologie intéressante ; par exemple, l’article 49, définissant les plateformes,

porte modification de l’article L. 111-7 du Code de la Consommation, et le suivant

modifie le Code du Tourisme pour les plateformes telles qu’AirBnb. On assiste

donc dans les faits à un redécoupage des frontières de lois déjà existantes.

- De surcroît, beaucoup de paramètres, tels que les seuils d’audience à partir

desquels la plateforme se voit ajouter de nouvelles obligations, sont laissés à des

décrets ultérieurs, ce qui donne une large marge de manœuvre à

l’administration.

■ Le Conseil National du Numérique a désigné, dans un rapport consultatif, comme

urgent « le renouvellement de la définition de 1996 », mais également « l’adaptation

des lois existantes au numérique », soulignant en filigrane le mirage que représente

un domaine « numérique » unifié et cohérent. En effet, l’évolution des NTIC porte sur

tous les pans de la société, et affecte donc tous les Codes législatifs (travail, propriété

intellectuelle, impôts, etc.).

■ La loi Hamon sur la régulation des comparateurs, puis la loi Macron sur les

marketplaces et les plateformes collaboratives, sont allées dans le sens de la

répercussion de principes généraux sur les différents domaines de droit qu’emprunte le

chemin du consommateur/utilisateur.

■ Il faut cependant veiller à éviter la superposition des normes concernant la loyauté

des plateformes, un « téléscopage » selon le mot de Marc Lolivier, délégué général de

la FEVAD, afin d’éviter une confusion préjudiciable pour les utilisateurs. Ces derniers

représentent plus de 85% des citoyens selon l’INSEE.

Informer sur les droits et les possibles

■ 73% des directeurs d’université n’ont jamais été confrontés à des questions juridiques

concernant la valorisation de données de la recherche. Les 27% restants l’ont tous été

concernant notamment les données à caractère personnel. On observe un score

exactement identique pour les questions juridiques concernant l’ouverture de données

Page 102: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

102

(open data, données administratives par exemple), ce qui pourrait indiquer une mauvaise

appréhension du découpage sectoriel du droit relatif à l’IST. Concernant l'autorisation

donnée à des tiers d'utiliser et ou de réutiliser des contenus créés dans votre unité et le

dépôt de publications dans une archive ouverte alors qu’un contrat est conclu avec un

éditeur, ou encore le partage de responsabilité entre coauteurs, le nombre d’unités

confrontées à des questionnements sur l’état de la Loi monte à 32% ; aussi, l’angle de

lecture à adopter est un faible degré d’information à mesure que le sujet devient plus

technique et porte non plus sur les individus, mais sur des droits collectifs (de

laboratoire, d’université). Il convient donc de mieux informer, sans vouloir faire de chacun

un juriste.

Gradualité du secret et degrés de confidentialité

■ Une certaine défiance parfois envers les "archives institutionnelles" qui ne servent pas

uniquement à rendre la littérature accessible, mais aussi à faire de la bibliométrie, est

présente. D’une part, il faut donc rendre la bibliométrie plus attrayante et compréhensible

dans le travail quotidien du chercheur, et d’autre part il faut obtenir la préséance d’une

notion de secret graduel. Cette notion de secret doit être articulée algorithmiquement

avec une possibilité de rechercher les données de l’archive via les moteurs de

recherche en utilisant le nom de l’établissement comme critère de requête, en vue

d’obtenir une visualisation des résultats qui respecte les plafonds d’audience définis

localement sans aller en-dessous des planchers d’audience tolérés par les auteurs.

■ Lorsqu’un acteur souhaite enregistrer sur HAL (ou tout autre plateforme publique)

uniquement les métadonnées d’un document confidentiel et en réserver la

consultation à certains secteurs/agents, il faut qu’il puisse le faire techniquement. Cela

n’est actuellement pas le cas, contrairement aux offres proposées par d’autres supports

privés tels que le célèbre Google Drive. Le retrait définitif de fichiers, sans préjudice

de l’archivage pérenne, doit aussi être rendu possible, tout comme une autre

fonctionnalité qui paraît évidente sur le marché privé, à savoir l’empilement automatique

(le nouveau fichier écrasant l’ancien) lors de l’ajout d’une nouvelle version d’un même

document ou source d’IST.

■ Sur cette « gradualité du secret », la confidentialité relative des données échangées

dans le cadre par exemple d’Hypothèses.org (service 3.7.) revient souvent dans les

propos des chercheurs. Il est essentiel d’en assurer la réalité en privilégiant cette

discrétion nécessaire à la finalisation de travaux, qui n’est pas un secret absolu (de

Page 103: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

103

nouvelles mains et de nouveaux regards sur le travail pouvant être utiles) ni un partage

en Open Access absolu (une trop large audience endommageant la finition du document

tant sur le plan économique que sur celui du contenu).

Un service rendu « pour le » et non « au » chercheur

■ Il faut donc légiférer de façon agile, c’est-à-dire mettre en place des règles claires,

faisant appel au bon sens, qui ne nécessitent pas de lourdes campagnes d’information

pour être respectées. En d’autres termes, la loi doit définir l’étendue des possibles

techniques des outils et supports, qui conditionnent à leur tour les usages. Car tenter de

conditionner directement, par voie législative, les usages et habitudes (voire les

traditions) ancrés dans le milieu de la recherche française est voué à l’incompréhension,

et donc à l’échec. Pour faire bref, il faut envisager l’exigence juridique et technique

comme un service rendu non pas au chercheur mais pour le chercheur.

2.3.2. Tenir compte des évolutions vers l’interopérabilité des outils de l’industrie

et des voisins européens

Il faut tirer le meilleur parti d’un fonds documentaire d’une richesse inédite pour

rendre l’IST française compétitive.

Retravailler l’interopérabilité et la complémentarité de divers services

■ Il paraît essentiel de signaler les thèses en ligne dans le SUDOC, dans cette

perspective de mise en relation de toutes les sources d’IST afin d’éviter un dispersement

superficiel qui entrave la maximisation des fruits de la recherche sur l’IST.

■ Il faut notamment retravailler l’interopérabilité et la complémentarité de services

tels que Cedram ou I-Revues, qui possèdent une interface un peu dépassée et

doublonnent d’une part entre eux et d’autre part avec les services existants tel que

Gallica, Persée pour les fonds patrimoniaux, revues.org ou des plateformes développées

au sein des établissements.

■ Le mode d’intégration automatique des notices dans la collection n’est pas toujours

clair ni efficace et génère lui aussi beaucoup de travail de vérification. De surcroît, en

l’état, la fonctionnalité permettant à n’importe qui de créer une collection dans HAL

entraîne une cacophonie des intitulés, parfois inintelligibles, ou similaires à ceux d’une

collection institutionnelle. La solution semble être d’intégrer plus de peer-reviewing, et de

Page 104: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

104

classer la visibilité des collections en fonction de l’aval, de la validation par chaque

secteur de ces dernières. L’administrateur d’une collection institutionnelle devrait être

informé par des notifications push et mail lorsqu’une collection identique ou semblable à

la sienne est créée dans le domaine d’activité auquel il appartient. Un niveau d’astuce

supplémentaire consisterait à doter ce peer-reviewing, idéalement fonctionnant sur le

principe de la blockchain, de pondérations des « points de confiance » accordés selon

des paramètres tels que la proximité du votant avec le publiant (corrélé négativement),

ou l’appartenance du votant au milieu de recherche concerné par la collection (corrélé

positivement).

■ L’articulation de ces différents niveaux de service pourrait se faire autour de fonctions

« sociales » ; par exemple, la possibilité d’annoter des textes au sein de collections qui

correspondraient à des « éditions critiques ».

Le projet ISTEX se réoriente afin de pouvoir constituer un exemple

d’interopérabilité

■ L’accès aux ressources documentaires est aujourd’hui très diversifié, et passe par

divers points d’accès. Le projet ISTEX porté par la DIST, d’abord focalisé sur le stock

documentaire, se tourne désormais vers l’acquisition du flux, des nouvelles ressources,

en s’organisant autour d’outils d’analyse approfondie, et vers une méthode

d’interopérabilité permettant d’adapter ISTEX aux supports et usages de chaque acteur.

Page 105: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

105

2.3.3. Permettre l’adoption de référentiels et standards normés communs

A l’heure actuelle, il existe une grande diversité de systèmes utilisés pour traiter

l’information ; en découle donc une immense variété de formats, qui rend

l’interopérabilité difficile et empêche l’élaboration aisée de visions d’ensemble claires.

Normes communes de formulation : un bref rappel de la situation

■ Des normes communes de présentation et formulation existaient déjà avant

l’invention de l’imprimerie pour communiquer le fruit d’une pensée, le résultat d’un

long et abouti travail de recherche. L’imprimerie, pour permettre la diffusion uniforme

d’un même contenu équivalent et vidé le plus possible du caractère aléatoire de

l’interprétation individuelle, de la « mauvaise lecture », en d’autres termes, a rendu

nécessaire l’émergence de standards de typographie, tels que la police, la hauteur de

caractère, l’empâtement Serif ou encore la justification des colonnes de texte.

■ Parallèlement, des standards de référencement bibliographiques communs

tentent d’émerger, notamment avec les universités britanniques et celles de la Ivy

Page 106: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

106

League. Tout le monde a entendu parler de la bibliographie « à la française », « à

l’anglaise », ou de la « méthode Harvard ». On constate donc que bien souvent, il existe

une variété de standards, selon les pays, les écoles, voire les maisons d’édition. La

formulation des résultats semble donc ne pas pouvoir être universelle in fine car il existe

une concurrence entre les producteurs de connaissance, qui veulent voir leur standard

privilégié. L’Etat ou l’autorité indépendante gérant un domaine défini doit donc pouvoir en

établir des normes, dans un contexte où la part des brevets dont les inventeurs sont

localisés dans deux pays différents ou plus est passée de 3,5% en 1994-1995 à

7,1% en 2004-2005 selon l’OCDE. Il faut organiser prioritairement le recueil (avec une

estimation de la complétude des données recueillies) et la mise à disposition des

données de publication en estimant la complétude des dispositifs de

référencements/Instituts ou sur un échantillon d'unités en partant de l'exploitation de la

question suivante de l'enquête des DU : « Ce référencement est-il exhaustif par rapport à

la production de l’unité ? », en mesurant le lien, s'il existe, de cette valeur de complétude

avec la manière dont le référencement est effectué : saisie manuelle ou téléchargement

à partir de bases de données existante.

Les exigences dans la formulation des résultats par le chercheur : unicité,

hiérarchisation, scalability

■ Formuler un résultat, c’est accepter sa continuité et son interprétation dans les

mains d’autrui, et rejeter radicalement sa déformation en revanche. Pour superposer ces

deux objectifs, il faut être clair, mais ne pas fermer la boucle. A titre d’exemple, la

direction scientifique du CIRAD, le Centre de coopération International en Recherche

Agronomique pour le Développement, possède une section dédiée aux protocoles de

formulation du résultat scientifique dans sa délégation à l’IST, qui propose dans son

rapport de 2015 plusieurs procédés afin de rendre extensibles la portée comme les effets

d’un résultat.

■ Il y a d’abord une exigence d’unicité ; les figures et tableaux doivent se lire

indépendamment des textes, et rien ne doit se répéter. Les mêmes mots ou expressions

doivent être employés pour désigner le même objet, traitement, variable, ou concept.

■ Il y a, ensuite, une exigence de hiérarchisation : commencer par le résultat majeur de

votre recherche, puis ceux qui s’y rapportent en arborescence, et éliminez ceux qui n’ont

qu’un lien infime voire pas de lien du tout.

Page 107: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

107

■ Et il y a, enfin, une exigence sur laquelle l’anglais, le premier, a mis un mot :

scalability, qui englobe et recoupe en français les sens d’évolutivité, de capacité à

monter en charge, d’extensibilité et de facilité à changer d’échelle.

Le correctif apporté par le TDM doit être complété en raison de l’augmentation, de

la diversification et de l’interconnexion croissantes de l’IST

■ Le TDM est un correctif partiel pour ces failles, ces défauts de longueur qui rendent

difficile la sédimentation pour l’individu d’une somme à chaque instant exponentiellement

plus grande de résultats, mais en tant que chercheur, intégrer l’idée que l’on n’est pas

tout seul à devoir être lu ou écouté dès la formulation du résultat est encore mieux.

■ Du niveau « recherche universitaire » au niveau « école primaire », le même résultat

doit être reformulable sans perdre son sens général. La fluidité de cette mise à l’échelle

permet de connecter par un lien permanent et perpétuel les différentes sphères de

l’apprentissage, et c’est en cela que sont porteurs des projets comme la très grande

infrastructure de recherche (TGIR) Huma-Num, porté par le CNRS, l’Université d’Aix-

Marseille et le Campus Condorcet, et qui s’inscrit dans le projet européen DARIAH

(Digital Infrastructure for Art and Humanities).

■ L’émergence relativement récente de l’ère numérique a renforcé cette nécessité

d’universaliser la manière standard de présenter un résultat afin de le rendre facilement

transférable, transposable, et de faciliter son commentaire. En effet, trois facteurs ont

transformé la production des connaissances, et ont accru cette nécessité ;

- la multiplication de la quantité de sources, qui malgré des outils de TDM

avancés ne permet pas d’échapper au brouillage de l’information.

L’universalisation des formulations par les auteurs, les producteurs de

connaissances, dès la source, permettrait d’automatiser ces procédés coûteux

en temps et sous-optimaux car soumis à trop d’aléas. Basiquement, désigner le

même objet « x » par le même terme « y » partout où il est mentionné permet de

rendre le TDM plus efficace ;

- la diversification de ces sources ; le spécialiste est désormais partout, sur les

forums et sur la section commentaires, prêt à contredire ou documenter un

argument, et à l’inverse l’amateur éclairé ou le profane peuvent désormais

formuler des résultats à leur échelle, qu’il convient de vérifier. Cette diversité

Page 108: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

108

socio-professionnelle se combine à une diversité linguistique incroyable, qui

rendent nécessaire la pratique de formulations communes ;

- enfin, internet, en ce qu’il est internet, a connecté entre eux les concepts, puis

les objets, et désormais les intelligences artificielles. Ces systèmes

fonctionnent avec un langage informatique rationnalisé, binaire, qui est formé à

partir de langages intermédiaires comportant des commandes arbitraires fixées

par l’homme et pouvant s’apprendre. Ces langages de programmation, qui

ressemblent au langage mathématique en ce qu’ils existent de façon exogène

aux langues verbales nationales, est une réponse partielle aux divergences

linguistiques mentionnées plus tôt, et une porte ouverte aux collaborations

internationales.

Mise en commun normative : initiatives prises et contraintes de chaque langage

■ C’est dans le sens de cette universalisation que va le Référentiel Général

d’Interopérabilité, officialisé par l’arrêté du 20 avril 2016 (JORF N°0095 du 22 avril 2016),

et ayant pour but de permettre aux conservateurs de données de les fournir dans un

format universel, opérable par tous les acteurs.

■ Il existe cependant plusieurs contraintes à cette adaptation. En effet, pour employer

le langage du code informatique comme socle commun, encore faudrait-il qu’il soit unifié,

car l’existence de différents codes selon le type de firmes ou de produit nuit à

l’universalisation aisée de la formulation de résultats. De plus, les chercheurs en

sciences sociales, et plus largement toutes les sciences dites « non-dures », rechignent

encore à apprendre, utiliser ou même jeter un œil à ces formes de langages nouveaux,

notamment car il s’agit pour eux d’une réduction au tout-chiffré, d’un avilissement de la

langue classique d’une part, et d’autre part car ils considèrent que l’effort

d’apprentissage à fournir n’en vaut pas la peine. Peut-on imaginer un monde où chacun

apprendrait une langue universelle verbale (l’anglais par exemple) et un langage de code

scientifique, un langage logique universel en parallèle dès le plus jeune âge de la vie ?

■ On peut même rêver d’une formulation universelle, qui aurait la rigueur des

mathématiques et l’intelligence prospective de la logique philosophique, qui permettrait

de mettre tous les résultats dans un même système de registre. Cependant peu

d’initiatives vont dans ce sens. A titre d’exemple crucial et marquant, l’identifiant

idHAL est lié à la plateforme. Le lien entre « structure » et « objet » n’est pas le bon.

Page 109: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

109

Vers la complète universalisation des normes ; référentiel national d’autorité,

signature monoligne

■ Une stratégie unique et internationale est attendue, car la multiplication des

référentiels de structures et d’auteurs appelle à conduire une réflexion globale sur la

production et le partage de ces référentiels, ainsi que sur leur alignement, dans une

logique Web de données : ce travail a certes commencé à être engagé par le CCSD

avec idHAL, mais aussi par la BnF (data.bnf.fr) et l’ABES (IdRef), lesquelles projettent la

création d’un référentiel national d’autorité, ouvert à d’autres partenaires (INIST-CNRS,

CCSD, Archives de France, …), et qui a vocation à favoriser l’utilisation de normes et

standards internationaux (standard ISO International Standard Name Identifier (ISNI),

ORCID). C’est dans ce cadre partagé internationalement que doit s’inscrire la stratégie

de HAL, plutôt que de proposer HAL, outil spécifique à l’ESR français, comme un cadre

national. Il faudrait plutôt renforcer les projets comme CONDITOR, qui vont dans le

sens d’une universalité du standard, ou employer les identifiants ORCID sur HAL.

■ Adopter un langage commun dans l’écriture de l’information, des références et

métadonnées semble essentiel ; c’est à ce prix, par un effort partagé et réparti sur

chacun « à l’amont », qu’un système IST cohérent peut se mettre en place, et cela ne

peut passer que par la formation. En effet, une politique « à l’aval », consistant à modifier

les erreurs de format de chacun de manière centralisée, ne peut assumer un rôle

national aussi lourd, et n’agit que comme palliatif du facteur « erreur humaine ». En effet,

si l’informatique peut fonctionner en réseau, c’est grâce au caractère universel du

langage binaire, et semi-universel des langages humains produisant ce langage machine

(langages de programmation ou « codes »). Il en va de même pour l’IST.

■ Le principe de la signature monoligne est retenu avec :

- Nom du laboratoire (sigle)

- Tutelles (pas d’importance sur leur ordre)

Ne pas indiquer l’appartenance à des Labex, Idex… mais l’indiquer dans les

remerciements

- Terminer avec l’adresse contenant le nom de la ville

Le document correspondant a été préparé par la DASTR qui est en charge de ce

dossier, et validé en comité de direction. Reste le cas particulier de personnes membres

du laboratoire dont l’employeur n’est pas tutelle, dans ce cas on ajoute l’employeur de la

personne si c’est un établissement public. Ce document a obtenu de larges réutilisations

(Sorbonne, Université Pierre et Marie Curie (UPMC), etc.).

Page 110: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

110

2.3.4. Rendre le dispositif modulable pour s’adapter aux différents besoins

Tenir compte des usages pour fournir un outil approprié que le chercheur a envie

d’utiliser

Il faut tenir compte des usages (étude COPIST) et des types de données les plus

employés dans chaque domaine scientifique afin de ne pas proposer d’outils totalement

inappropriés qui découragent par la suite le contact du chercheur à l’IST. Cette « non-

appropriation », qui prend tout son sens dans son étymologie, par opposition à

l’appropriation permise par le don d’un outil adéquat à chacun, que chacun prendrait en

main avec enthousiasme et soulagement, peut relever soit de l’excès soit de

l’insuffisance vis-à-vis du besoin réel de l’individu. En effet, un excès dans l’offre conduit

à devoir remplir de longs et fastidieux protocoles, ou à avoir accès à trop de données

pour des travaux qui ne les nécessitent pas, et une insuffisance conduit à trouver des

protocoles/sources dérogatoires, le protocole/source proposé ne suffisant pas. Bref, le

modèle de la plateforme (tel qu’on entend ce terme lorsqu’on qualifie les GAFA de «

plateformes ») gagne aujourd’hui l’IST. La bonne réponse à cette situation ne réside pas

dans le schéma-type du « portail », solution phare des années 2000, mais plutôt dans

l’idée de construire la réflexion à partir d’une analyse de la situation actuelle, plutôt que

d’essayer d’adapter les outils hérités d’hier à une situation qui a profondément évolué, et

va continuer de le faire dans les années à venir.

4 catégories d’activités pour le chercheur : un document résumant l’offre de

services

■ Un premier pas nécessaire, peu coûteux et non-contraignant pour l’usager consiste

en la création d’une « plateforme des plateformes d'IST » à partir de la DIST et sous la

forme d'un aiguillage selon 4 catégories correspondant aux activités du chercheur (#1.

Me documenter. #2. Publier. #3. Être accompagné.e. #4. Analyser.). Il s’agirait d’une

forme d’annuaire en ligne, très simple, réutilisant le pointeur sur les services déjà

disponible en version PDF sur le site de la DIST, afin de permettre une vision

d’ensemble des outils disponibles et dont les droits sont ouverts pour chaque chercheur,

en s’inspirant du modèle étatique de site permettant de déterminer l’étendue des droits

ouverts pour un citoyen ou un foyer fiscal (aides au logement, bourses, réductions et

crédits d’impôts, etc.).

Le nœud gordien du dilemme centralisation/décentralisation peut être tranché par

la technologie et une communication forte

Page 111: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

111

■ L’exigence la plus élémentaire est de ne pas créer un outil d’ingénieur « déconnecté

de la réalité de travail du chercheur ». La technique de la marque blanche, consistant à

programmer une API ou un outil dans un langage permettant son intégration à n’importe

quel site local, afin de rapprocher les options de personnalisation d’un portail commun de

chaque utilisateur final, est à privilégier pour assurer l’interopérabilité, en sus des

référentiels communs. Le paradoxe apparent entre la centralisation et la décentralisation

de la gestion de l’IST nationale est un nœud gordien que seule la technologie est à

même de trancher. En faisant de ce point d’entrée unique un outil interopérable et

intégrable à chaque support local, on en fait une barre de recherche améliorée, munie de

nombreux filtres et outils d’analyse, et donc un format adaptable facilement adoptable.

■ Le principe ayant été éprouvé avec, à sa base, la formation d’un consensus dans le

sillage des premières réunions et expérimentations, la réflexion technique doit aussi tenir

compte de la démarche conduite au sein de l’AMUE dans le cadre du projet SINAPS qui

propose des briques logicielles à tous les acteurs de l’ESR pour permettre aux

établissements de gérer en interne leurs propres référentiels et qui prévoit

l’interopérabilité avec des référentiels communs nationaux.

2.3.5. Bibliométrie et outils assimilés : vers la curation et la facilitation de

l’exploitation des données de la recherche

Outre l’utilisation des données issues de l’IST, l’analyse de cette utilisation

constitue à elle-seule un nouveau champ disciplinaire, intéressant tant la recherche que

les entreprises. A la marge de cette analyse en profondeur des volumes et directions de

l’utilisation, des services de curation permettent de faciliter l’accès à l’IST en renforçant

les logiques d’identification des contenus (tagging), de notation (marking) et de

classement (ranking).

Mettre à disposition un service plutôt que fournir systématiquement, en analysant

les besoins grâce aux indicateurs du SAPPS notamment

■ L’intérêt pour les services d’études bibliométriques se trouve dans la mise à

disposition des outils d’analyse plus que dans la fourniture directe du service. Ce dernier

est néanmoins difficile à externaliser, et il convient encore une fois de former à l’analyse

de l’IST, afin de passer d’un modèle profanes-spécialistes à un modèle de capacitation

généralisée des chercheurs, puis dans un second temps de la société civile. L’idée n’est

pas de faire de chacun un expert de l’IST, mais bien de rendre chacun capable

Page 112: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

112

d’analyser l’IST qu’il a à sa disposition. Il faut par exemple prendre en compte les

spécificités SHS en sortant du panel d’indicateurs quantitatifs existants afin de mettre en

œuvre une bibliométrie qui corresponde à chaque domaine de la recherche et aux

formats particuliers de leurs IST. Des indicateurs bibliométriques (répartition par institut,

relations interdisciplinaires, part nationale ou régionale, collaborations internationales,…)

sont produits par le SAPPS et sont largement utilisés. Toutefois, les instituts ne

disposent pas toujours d’une vision complète de leur production scientifique (l'INC par

exemple, le fait observer) et apprécieraient la mise à disposition d’outils de gestion

bibliographique optimisés et partagés. Dans ce sens, apparait la demande d'une

exploitation plus ciblée, de la base issue du WoS, par repérage des unités CNRS dans

les affiliations. La demande en est exprimée par certains instituts (INSB par exemple).

D’autres méthodes de mesure complémentaires sont souhaitées dans les cas où,

dans le cadre des métriques existantes, la France n’apparaît pas à la place qui est la

sienne dans le travail des communautés scientifiques correspondantes (c’est le cas de

l’IN2P3 qui observe la nécessité de faire mieux ressortir la place qu’il occupe dans les

publications au CERN).

■ Concernant la mise à disposition de ressources terminologiques scientifiques et

techniques, l’ADBU signale qu’une articulation avec les initiatives des autres opérateurs

nationaux qui interviennent sur les questions de signalement serait très souhaitable et

permettrait de mieux valoriser la plus-value de l’INIST dans ce domaine. Ainsi, une mise

à disposition des outils peut passer par ;

- Une plateforme des vocabulaires de l’ESR

- Des alertes pour informer sur les thésaurus alignés

- Un lobbying pour les thésaurus internationaux (Gemet par exemple)

- Une assistance au traitement ponctuel de vocabulaires

■ Les sites de veille d’actualité en IST (service 6.1.) manquent de notoriété et de

visibilité. Ce sont des sites d’accès à l’IST et à ses réflexions, mais pas à de la veille

disciplinaire. La LIST suit un éventail trop important de sujets, difficiles à suivre dans leur

totalité et avec le même approfondissement. Les sites doivent donc aller vers une fusion

progressive.

Disposer d'une politique cohérente d'affiliation

■ Cette politique, à laquelle travaille la DASTR par le biais du SAPPS, est un facteur

majeur d’optimisation pour toutes les étapes de construction de l'action d'IST. Il a déjà

Page 113: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

113

été préconisé à plusieurs reprises que, notamment dans les contrats entre le CNRS et

ses partenaires, la mention de CNRS soit obligatoire : en pratique ce n’est pas toujours

le cas ; or, de la précision des affiliations de chaque papier dépend la précision des

indicateurs et des classements au sein d’outils tels que Google scholar, Publish or

perish, Research Gate, H-Index du WoS : il faut inciter à la discipline collective sur ce

point !

Accompagner les chercheurs dans la valorisation des données et la création de

DMP

■ L’accompagnement des chercheurs pour la gestion et la valorisation des

données de recherche (service 5.1.) doit être effectué de façon permanente, sans pour

autant interférer avec les initiatives locales. L’ADBU abonde également dans le sens

d’une formation coordonnée par l’INIST mais dont la responsabilité repose sur les

professionnels locaux qui sont les personnels d’appui naturels des communautés

locales. Créer une forme de « SUDOC des données IST », sur la base d’un service

centralisé décliné de DMP Online et fonctionnant grâce au réseau des archivistes de

terrain est une option. L'INS2I suggère la mise en place d'une structure de DMP avec

diverses étapes, ce qui permettrait de posséder non pas simplement des modes d’emploi

mais aussi des normes communes en termes de curation. Le CNRS est quant à lui

globalement attendu pour son appui technologique et logistique (ex : le stockage) et

pour la sécurisation des données. Le modèle du Digital Curation Center (DCC) en

Grande-Bretagne paraît un bon moyen d’impulser une politique coordonnée au niveau

national et efficace sur le plan local. Créer un partenariat sur ce point avec le projet

d’entrepôt national de métadonnées de l’ABES est aussi indiqué.

Développer des métriques alternatives, récupérer les métriques existantes pour

forger des bases de données cogérées et publiques

■ Enfin, une démarche en cours grandissante met l'accent sur les métriques

"alternatives" (Altmetrics), qui s'appuient sur les pratiques des chercheurs et les analyses

(préférences et opinions, notamment). Des alternatives aux indicateurs historiques

tels que le Facteur d’impact apparaissent ainsi, et sont proposées à l’échelle

internationale. Il y a place également pour les analyses heuristiques et leurs

développements en cours (Méta et Hyper-heuristiques nées dans les applications

industrielles de la recherche). Le colloque Innometrics constitue pour la seconde

année consécutive un grand rassemblement destiné à approfondir ces sujets avec tout

l’ESR.

Page 114: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

114

■ Certaines infos bibliographiques passent aujourd'hui sur les réseaux sociaux de type

Mendeley ou Academia. Il serait intéressant de les récupérer. L'idée de proposer des

outils de gestion d'éventuelles bases documentaires est bonne, mais la récupération de

notices depuis les catalogues de bibliothèques, les bases de données ou les bouquets

électroniques doit être facile. De toutes les manières, ce service demeure parfois

inadapté selon la nature de certains établissements, comme en témoigne l’un des

verbatims de l’étude COPIST ; « Notre institution ne souhaite pas encourager ce type de

démarche individuelle de constitution de bases de données parallèles à la base de

données institutionnelles. ». Le développement d’outils d’analyse en open source et

avec le concours des bonnes volontés locales doit donc au fur et à mesure remplacer le

développement en version propriétaire ou en version centralisée publique.

2.4. Sauvegarder la pérennité et la compétitivité de l’IST française

Il est donc nécessaire de garantir la production d’IST, mais il ne faut pas négliger

d’assurer l’archivage pérenne des documents anciens (numérisation) et récents

(système de dépôt central). En outre, fournir un cadre complet d’assistance à la

publication pour les chercheurs, au sein d’un environnement juridique évolutif et

protecteur, constitue une démarche cruciale qui compense les manques structurels

irréductibles des politiques de formation et de changement de modèle économique.

2.4.1. Construire un programme national cohérent et interdisciplinaire de

préservation du patrimoine scientifique incluant un archivage pérenne (HAL,

ISTEX)

Il y a donc aujourd'hui un important besoin d’archivage pérenne, de recensement

de l’existant et par la suite de pouvoir faire des choix quant à ce qu’il faut garder ou pas.

Les universités et les instituts de recherche sont intéressés par la gestion et l’exposition

des bases de données produites dans leurs établissements, mais ne relevant pas du

champ d’application d’entrepôts thématiques ou institutionnels. Ce spectre étant très

large, des coopérations sont à valoriser, par exemple avec Huma-Num (très grande

infrastructure dédiée à la recherche en SHS) travaillant sur l’objet des humanités

numériques ou l’UMS 3468 « Bases de données Biodiversité, Ecologie, Environnements

Sociétés (BBEES) ». Mettre en place prioritairement un dispositif de

recensement/signalement des bases de données produites par les unités en menant une

enquête avec un site de dépôt (similaire à l’action BBEES) à démarrer avec un institut

Page 115: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

115

pilote, en vue de définir les métadonnées nécessaires au signalement et à l’identification

(DOI) des jeux de données en recensant les pratiques existantes par des schémas de

métadonnées disciplinaires.

La perte sèche de données : une hémorragie pas tout à fait arrêtée

■ Cristinel Diaconu (IN2P3) parle également de la perte sèche, en termes de données,

qu’occasionne la suppression des données inutiles, trop massives ou contraires, à l’issue

d’un projet par les chercheurs. Cette perte sèche demande de fournir à nouveau les

efforts de recherche si un projet semblable qui aurait pu les utiliser s’ouvre dix ans après.

Elle estime à 1 millième du coût total l’épargne réalisée en ne conservant pas tous

les résultats, alors que la rentabilité de ces données sur 5 ans est en moyenne de

10%.

■ On pourrait donc envisager la sauvegarde d’un maximum de données comme un

enjeu national pour l’Etat, qui jouerait un rôle d’arbitre répartissant vers les bons marchés

ces résultats, aujourd’hui voués à la corbeille faute de visibilité. L’article 30 de la LPRN

institue un allégement juridique progressif de la protection des résultats, pour aller vers

l’Open Science, qui en diminuant le coût marginal pour une entreprise de recevoir un set

de données, augmenterait les possibilités d’optimiser les découvertes de la science dans

l’économie.

■ Pour les disciplines qui relèvent des Big Data (HEP par exemple), les infrastructures

de calcul assurent les fonctions de base de gestion des données (stockage,

sauvegarde), mais rarement très au-delà de la vie des projets. Une infrastructure de

données se doit d’inclure dans ses services les dimensions archivage pérenne, règles de

partage et de réutilisation, gestion des accès, … Il n’en est pas de même des nombreux

projets « small data » qui présentent des solutions de gestion de données moins sûres

et moins pérennes. Il s’agit donc de mettre en place une offre de services, en liaison ou

non avec l’offre de calcul, s’appuyant sur les moyens des laboratoires, les centres de

type CC-IN2P3, CINES, mais aussi INIST et cloud CNRS.

Prendre en compte les archives locales au sein de HAL

■ Il faut que les archives institutionnelles locales soient prises en compte. Au sein de

HAL, il faut développer la précision des statistiques déjà existantes, et ne plus rendre

obligatoire le passage par le protocole SWORD, très long et très développé. Il

manque un dépôt rapide pour les chercheurs, ainsi que pour les bases de données. Un

Page 116: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

116

répondant va jusqu’à dire ; « Il est insensé que le dépôt masqué ne soit pas encore

proposé, alors que c’est une fonctionnalité techniquement basique, maintes fois

demandée, standard dans les archives ouvertes du monde entier et qu’elle est la

condition de possibilité technique d’une politique de dépôt systématique ». Une

interrogation annexe porte sur la capacité de HAL à produire des statistiques sur

mesure concernant le nombre d’auteurs, le rang, les quartiles… Un nombre important de

chercheurs comparent HAL à ResearchGate (« pourquoi est-ce si compliqué dans HAL

alors que dans ResearchGate, il suffit d'un clic pour dire si c'est notre publication ou non

et celle-ci est intégrée »). Les arguments de pérennité pour le dépôt et le CV chercheur,

de transparence (porteur de Hal CNRS) dénuée de business caché, de facilité de dépôt

grâce au DOI et au PDF etc. doivent faire l’objet d’un regain d’attention.

■ HAL doit effectivement viser l’exhaustivité, et donc prendre en compte les structures

rigides de certaines disciplines. Les pistes envisageables rejoignent toutes l'élaboration

d'une procédure accélérée/allégée de dépôt ou de pré-dépôt, d'un "dépôt rapide" ou d'un

"dépôt en trois clics" sur le modèle des expériences existant déjà, telles que DISSEMIN,

permettant de revenir compléter le dépôt a posteriori. Cette exhaustivité passe par

une automatisation des interactions entre les échelles ; à ce titre, l’Ifremer souligne :

« Il serait intéressant d’avoir des droits liés aux affiliations Ifremer présentent dans les

références de HAL sans pour autant s’engager à entretenir un portail parallèle à notre

archive. HAL améliorerait ainsi la qualité et la complétude de son contenu et les

établissements pourraient agir directement sur leurs références sans demander un

partage de propriété référence par référence au contributeur. »

Quelques pistes complémentaires

■ Les autres pistes complémentaires pour répondre à l’utilisation encore fragile et

incomplète du dépôt dans HAL sont, outre une intégration de DISSEMIN ;

- Un fichier d’autorité des laboratoires

- Un réseau social des chercheurs intégré à HAL

- Un site ergonomique, attrayant et design

- Un lien pour le référentiel, avec RNSR

- Une amélioration de la saisie du dépôt

- Des exports paramétrés

- Une récupération automatique depuis le WoS ou Scopus

- Un lien avec les bases de financement ou d’appels à projets

- Un service de traduction

- Une fonction « request a copy »

Page 117: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

117

- Une gestion d’accès réservés en intranet

- Établir des tables de correspondance entre autorités HAL et autorités des

archives institutionnelles qui versent dans HAL est indispensable pour que les

administrateurs HAL ne passent plus leur temps à corriger dans AureHAL les

doublons générés par ces imports

- Une traduction des interfaces en anglais plus précise

- Ouvrir HAL aux mémoires est également une idée qui revient régulièrement

dans les débats, afin d’augmenter le « mandat réel » de la plateforme, et la portée

de son audience tout à la fois.

- Enfin, une promotion et communication enjouée et continue sur HAL !

■ En ce qui concerne le cas particulier des thèses en ligne dans HAL (TEL), étant donné

l’existence de la passerelle permettant le versement depuis le dépôt légal STAR vers

TEL, il semble contreproductif de laisser ouvert un dépôt direct des thèses sur TEL (avec

le risque de confusion sur la nature canonique ou non de la version déposée, alors que

la version déposée via le dispositif STAR est la seule valide). L’ADBU propose aussi que

d'autres documents puissent être déposés sur TEL directement par leurs auteurs est tout

à fait défendable, mais en ce qui concerne les thèses de doctorat, le principe du dépôt

automatique à l'issue d'un processus de validation interne est plus fiable. Cela pourrait

faire l'objet d'une précision sur TEL, renvoyant les docteurs à leur BU et empêchant le

dépôt direct, OU éventuellement, proposant la fusion de leur dépôt personnel avec le

dépôt institutionnel, que celui-ci soit antérieur ou postérieur. Une mise en cohérence

avec theses.fr est absolument et radicalement nécessaire ; un positionnement de TEL

comme une surcouche officielle exhaustive de theses.fr semble optimal, à défaut

d’une fusion bienvenue. Les établissements délivrant des thèses ont souligné qu’il est

urgent de mettre en place une fonction « embargo » sur les PDF des thèses, afin de

respecter les délais prescrits.

Laisser les chercheurs autoévaluer l’importance de leurs données et en définir les

modalités de sauvegarde en favorisant les collaborations

■ La pérennisation de la sauvegarde des données issues de la recherche passe aussi

par la mise en place de plans de gestion de données (via OPIDOR) pour tout dataset

considéré comme important. Cette notion d’importance intergénérationnelle est à

laisser à la discrétion de chaque unité, qui doit être à même d’évaluer quelle IST vaut

la peine de passer 1 heure à élaborer un DMP, et quelle IST peut être stockée sur des

disques durs externes locaux voire supprimée. Ce principe d’action vise à ce que, dès la

Page 118: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

118

genèse des projets, les chercheurs prennent en compte les aspects des modalités de

stockage, de description, de mise à disposition et d’archivage des données qui seront

amenées à être collectées et traitées. L’établissement d’un DMP est de plus en plus

fréquemment demandé dans les appels à projet. Il s’appuie sur la prise en compte du

cycle de vie des données et décrit les règles applicables en termes de normes de

métadonnées, format des bases de données, méthode et sécurité d’accès, durée

d’archivage, ainsi que les coûts associés. Une mention particulière doit être apportée aux

données venant en appui des publications et qui doivent à ce titre rester disponibles et

accessibles le plus largement possible

■ A l'InSHS, le programme Persée du MESR qui était consacré à la numérisation

d’archives scientifiques en sciences humaines et sociales est élargi avec le portage du

CNRS, de l’ENS et du CUE de Lyon, sous l’égide de BSN 5. L'INSU a également des

besoins, notamment avec les revues géologiques. Cette catégorie de besoin ne

concerne pas que les publications : l'INSB, par exemple, participe aux bio-banques

européennes de stockage et aux bases de données de séquençage.

■ A l'IN2P3, à l’InSHS, et à l'INP, mais aussi à l’INSMI et le RNBM, le papier reste un

support recherché : il est de moins en moins essentiel de « conserver un voire deux

exemplaires papiers pour la France entière » (préconisation de la SIST 2014).

2.4.2. Apporter un appui logistique et linguistique à la visibilité internationale des

publications (notamment en OA) du CNRS et de ses partenaires, en assistant la

rédaction et la traduction

La traduction, l’assistance rédactionnelle, l’accompagnement de l’évolution

du dispositif de fournitures de documents primaires, ainsi que la mise en œuvre

d’un conseil en négociations sont autant d’instruments au service de la visibilité

internationale de la recherche française.

Les publications du CNRS en font un acteur incontournable du paysage mondial

de la science, dont il s’agit d’améliorer la visibilité

■ Le CNRS produit en moyenne 40 000 articles par an, ce qui représente 1.50% des

publications mondiales, avec 26% d’impact en plus par article rapporté à la moyenne

mondiale.

Page 119: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

119

Analyse d’impact (en nombre de citations),

un indicateur supérieur à 1 révèle un impact supérieur à la moyenne.

■ Les deux principaux supports de publication du CNRS sont le WoS (Thomson-

Reuters) et Scopus (Elsevier), avec respectivement 420 000 et 540 000 publications

françaises entre 2000 et 2014. Malgré cela, le taux de croissance du CNRS et de ses

partenaires ralentit (4.6% en France contre 6.3% mondialement), et c’est en partie en

raison de barrières à l’exportation de l’IST française.

■ Persée.fr (service 3.4.) permet d’améliorer la visibilité des publications en revues de la

recherche SHS française. Cependant, du point de vue de l'utilisateur chercheur, un

rapprochement avec une autre plateforme, un peu en retrait techniquement ;

Revues.org (quand ce ne serait que par moissonnage mutuel) serait très souhaitable, en

dépit de contraintes institutionnelles et humaines fortes. Au sein du programme

COLLEX, il est absolument nécessaire de clarifier l’articulation entre Persée et les

autres acteurs opérateurs de numérisation, BNF en tête. En effet, une cohésion

nationale est le premier ingrédient d’une intégration internationale accrue.

■ La présence de plus de contenus images, et donc de fonctionnalités de retouche

d’image (rogner, cadrer, etc.) est nécessaire par exemple dans le domaine des revues

d’Art. Sur l’aspect iconographique de l’IST, la France accuse en effet un retard

international : il faut donc ouvrir l’IST aux formats image.

Page 120: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

120

■ Le service de numérisation et d’océrisation (3.15.) doit être articulé avec le

COLLEX-Persée et l’offre de service BNF pour être efficace pleinement et permettre un

passage au numérique de l’IST française. PSL précise que ce service sera utilisé « à la

double condition que la qualité des prestations soit au même niveau que celles des

prestataires privés avec lesquels PSL travaille actuellement, et que le coût soit

concurrentiel. ». Il serait par ailleurs très utile de disposer d'une plateforme qui

permettre de travailler sur la sémantisation des données issues des catalogues et des

programmes de numérisation en établissant de façon scientifique des relations

structurées entre les entités. A ce titre, le service POPS ne paraît pas prioritaire, et

semble dépendre de sa capacité à se différencier des autres outils et à présenter des

coûts modérés.

Augmenter une interaction déjà prégnante avec les pays partenaires implique

d’avoir un service de qualité pour traduire et internationaliser les productions de la

recherche

■ Voici les principaux pays avec lesquels le CNRS entretient des partenariats de

publication entre chercheurs forts ;

Page 121: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

121

■ Ces pays ont bien entendu vocation à voir leur liste développée et renforcée de

nouveaux arrivants au fur et à mesure du développement de services

d’internationalisation performants, dépassant la simple traduction anglais-français et un

annuaire basique des supports étrangers de publication de l’IST. En surchappement de

portails tels que iPubli, cogéré par l’INIST et le CNRS-INSERM, un service d’appui à la

publication de bases de données documentaires concourrait à ce renforcement, ce long

et fastidieux travail d’obturation des fuites du système IST national. PSL mentionne que

ses plateformes seront utilisées sous Omeka-s et Cubicweb pour proposer le même type

de services. L’interopérabilité avec ce service 3.13. du CNRS permettrait de viser

l’exhaustivité.

■ En matière de langues, il conviendrait que le service d’assistance à la rédaction de

documents scientifiques en anglais (3.14.) soit axé sur les chercheurs et enseignants-

chercheurs juniors et ouvert aux doctorants. La difficulté réside dans le fait de proposer

des traducteurs compétents dans toutes les spécialités (terminologie et usages

communicationnels). Cette prestation doit être dématérialisée entièrement pour éviter

tout déplacement inutile vers l’INIST à Nancy. Si l’on veut développer la dimension

interculturelle, importante en SHS, l’anglais et l’allemand ne sont pas les seules langues

à prendre en considération. Il faut donc envisager son ouverture vers d’autres

langues, avec des partenariats locaux. Ces partenariats pourraient s’établir avec des

centres d’apprentissage de la langue de niveau professionnel agréés par l’Etat, au

moyen de crédits « assistance linguistique » alloués à chaque unité en prévision de

l’ouverture de commandes publiques de petite taille. En effet, cela permettrait de

contourner la réticence unique qui préoccupe les chercheurs, à savoir que le partage

d’un tel service risquerait de remettre en cause les partenariats existant au sein des

unités de recherche avec des traducteurs réguliers.

■ Il faut rendre les publications scientifiques françaises disponibles sur des plateformes

en OA plus visibles (HAL, Persée, Open Editions, I-Revues, etc.) en traduisant leurs

métadonnées et plus particulièrement les résumés, « quatrièmes de couverture » dans

des langues de communication internationales, en premier chef l'anglais. Conjointement,

il convient de définir des processus d'assurance qualité scientifique pour les traductions,

et de construire un processus permettant de collecter, traiter et traduire ces éléments et

les réintégrer dans leur environnement original de diffusion.

Assister les tâches quotidiennes de rédaction et de mise en document des

données IST

Page 122: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

122

■ La fourniture de document permet de fournir des articles rares et difficilement

identifiables et localisables. Le service de fourniture de document de l’INIST permet

aujourd’hui d’atteindre plus de 96% de satisfaction des commandes (notamment grâce à

un réseau de 280 bibliothèques partenaires). Sous des conditions nouvelles à définir,

cette activité portant sur des demandes de documents rares ou nécessitant des

compléments d’identification pourrait apporter une véritable valeur ajoutée au

dispositif académique géré par l’ABES. L’intégration de ressources en accès libre

devrait également être un levier de signalement renforcé. BSN 8 a retenu parmi ses

priorités une meilleure articulation entre les ressources des Cadist et la plateforme

RefDoc.

■ Enfin, le service 3.16., à savoir le secrétariat de rédaction, est utile lorsqu’un acteur

monte en puissance et décide d’éditer ses propres revues / documents. Ce service doit

être couplé à l’hébergement de sites web IST, avec l’aide à la réalisation et à la mise en

ligne pour les acteurs qui souhaitent en disposer. Localement, les questions d'image et

de communication attachées à la gestion des sites web sont essentielles (charte

graphique, gabarits web, identité visuelle, ligne éditoriale...). Aucune externalisation

complète n’est donc possible, et les conseils doivent se limiter à la technique, laissant

chacun remplir ses textes et compléter son imagerie officielle. Les CRI ou DSI proposent

déjà des services d’hébergement web. Il serait intéressant d’établir clairement et

publiquement les conditions tarifaires de ce service et sa plus-value par rapport aux

services internes des universités.

2.4.3. Anticiper les partenariats pour réguler les relations entre les producteurs,

les intermédiaires et les usagers finaux d’IST

Continuer à privilégier les études de faisabilité préalables pour produire mieux

■ L’UMS Persée est également moteur d’innovation juridique car elle opère dans un

cadre juridique complexe à anticiper et à faire évoluer. En effet, l’UMS ne limite pas son

action aux corpus libres de droit et prend en charge des documents qui peuvent être

soumis au droit d’auteur. Les aspects juridiques occupent en conséquence une place

centrale. Il convient non seulement de connaître les ayants droits sur les documents et

les droits dont ils disposent mais également d’organiser les cessions de droit

nécessaires et d’assurer les conditions d’une diffusion en Open Access. Cela se traduit

par des études de faisabilité préalables et une réflexion sur l’évolution du droit d’auteur.

La mise en réseaux diminue le paradoxe du chercheur

Page 123: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

123

■ Fort de nouveaux modèles économiques pour rechercher et publier l’IST, le chercheur

français a tout intérêt à s’appuyer également en amont sur la formation et les outils

d’analyse, et en aval sur les assistances proposées pour le dépôt et la rédaction-

traduction tant des données que des métadonnées. Celui qui produit de l’IST trouve donc

le paradoxe de son positionnement double (producteur et chercheur) réduit par cette

mise en réseau, voire en rhizomes pour reprendre Deleuze, des compétences et des

offres d’outils et de supports. En d’autres termes, le producteur d’IST doit trouver

dans les avantages portés à sa recherche d’IST l’équivalence compensatoire des

inconvénients trouvés dans la production, sur les plans économiques et

techniques (ce qui revient au final au même, le dénominateur commun étant le temps

investi pour comprendre le fonctionnement des systèmes et normes IST, étant traduit en

argent ou non).

L’effacement de l’intermédiaire

■ De son côté, l’intermédiaire doit s’effacer le plus possible pour éviter les logiques de

silo et fonctionner en marque blanche, se rendant donc invisible par l’automatisation et

l’interopérabilité. Le support de recherche idéal combine agilement un moteur de

recherche doté d’outils d’analyse, de bibliométrie et de TDM approfondis, et des

algorithmes permettant un dépôt des documents facile, avec inscription automatisée des

métadonnées lorsque c’est possible, voire des suggestions de sujets de recherche.

L’expérience doit être pensée côté utilisateur, sur la voie qu’a ouvert l’Etat avec sa

refonte du CNN, de l’Agence du Numérique et le lancement de la Mission Etalab,

qui met la donnée publique au niveau d’intéressement minimal de chaque citoyen.

De nouveaux questionnements émergents, source de futurs travaux juridiques

■ Concernant l’assistance et le conseil juridique en matière d’IST, le SCD est déjà en

mesure de répondre à une partie des questions juridiques. En revanche, un service

spécialisé centralisé au niveau national pourrait permettre la prise en charge des

questions les plus complexes. Parmi ces questions, on peut déjà entrevoir le profil qu’en

adopteront certaines ;

- Comment répartir les bénéfices des articles publiés en se basant sur des

données partagées, voire en Open Access ? Le producteur d’IST originel doit-il

Page 124: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

124

percevoir une forme de « royalties » sur chaque vente/lecture, ou un paiement

forfaitaire de début ? En effet, il apparaît clair que les droits classiques, celui de

l’auteur et celui du brevet, sont déjà submergés par les nouvelles interconnexions

possibles.

- Comment garantir un revenu au chercheur, et faire valoir sa propriété

intellectuelle, par exemple dans le cadre de projets à plusieurs mains basés en

partie sur de l’open source en matière de programmation ?

- Jusqu’où la sécurisation étatique contre le piratage doit-elle aller pour garantir

la sécurité des données issues de l’IST, sans être ni trop encombrante (discrète)

ni trop envahissante pour la vie privée (subtile) ? Ceci s’inscrivant bien sûr dans

un cadre légal bien plus général, qui a tout à voir avec les lignes de force

majeures des politiques publiques mises en œuvre durant le mandat présidentiel

en cours.

- Comment assurer la vérification de fiabilité de l’information ? Le peer-

reviewing apporte des réponses, mais il vient aussi avec ses limites liées au

social scamming et aux intéressements financiers des audiences (paying e-

reputation). Dès lors, une labellisation officielle est-elle possible ? Si oui, quelles

peuvent en être les modalités de contestation pour le chercheur s’estimant

injustement exclu de son champ ?

- Comment rentabiliser l’achat de fonds documentaires dans le cadre d’un

paiement « à l’usage » si l’usage s’avère plus faible que les estimations prises en

compte ?

Bien entendu, il ne s’agit que de quelques exemples, et ce triangle de tensions amènera

bien d’autres questionnements sur le devant de la scène, qui doivent être anticipés.

Page 125: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

125

3. SYNTHESE ET ACTUALISATION STRATEGIQUE :

Vers l’interopérabilité des outils et des usages

Des tutoriels et des

personnels facilement

joignables pour les

chercheurs à travers un

guichet unique

Un plan de communication

sur les nouveaux fonds

documentaires et les

nouveaux outils à grande

échelle

Continuer à rester en

contact avec les universités

et les UMR via des

procédures telles que le

COPIST

Afin de faire de cette vision stratégique une réalité commune et acceptée de tous,

il faut communiquer dessus, et établir des règles et des chemins d’application concrets,

dans les champs sociaux, politiques, juridiques et économiques. Cette troisième partie,

plus courte, est consacrée à une synthèse des étapes franchies et à franchir, une sorte

de témoin du gué sur lequel toute la troupe IST française s’est engagée, sur une longue

rivière aux forts courants contraires dont le franchissement portera des conséquences

sur l’ensemble des ménages et des entreprises. Cette mise en place stratégique, en tant

qu’elle est le fruit d’une réflexion commune, doit se fondre dans les cadres rigides qui ont

été dessinés en certains endroits, dans certaines entreprises, laboratoires, voire dans

certains secteurs de la recherche, de la science, tout y apportant une fraîcheur et une

praticité inédite, mais qui n’ont pas ce caractère éphémère et grandiloquent des

« nouveautés nouvelles », car ce serait là une démarche bien inconsciente après tous

les efforts d’analyse et le recul pris durant ces 5 dernières années. Le mot d’ordre en est

donc la prévoyance et l’interopérabilité.

Récapitulatif des progrès faits et à faire, par angle de traitement

2014 2017 2020

■ L’acceptation d’une éthique et de principes

- par la recherche

- par la société civile

Logiciels et données

propriétaires

Open Access Open Science

Sécurisation des

données entravant

l’innovation

Libéralisation relative de

certaines données, dans

une optique

contractualiste

Dépasser l’optique contractualiste

et établir un droit agile de l’IST

issue des plateformes

Chartes éthiques Concertation des Agence éthique de l’IST et de la

Page 126: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

126

rédigées par plusieurs

acteurs

principes autour de la

sémantique LPRN

Science Ouverte

■ L’application de principes juridiques et économiques adaptés au monde numérique

- par le parlement, conseil d’Etat, pour et par l’Etat

Données éparpillées,

sécurisées localement ou

pas du tout le plus souvent

Innovation technique au

service de l’Etat et de la

recherche

Sécurité des données

garantie par l’Etat

Mise en place des marchés

multifaces sur les

plateformes

Bases du principe de

loyauté des plateformes

Application de la loyauté par

un dialogue avec les GAFAM

notamment

Augmentation des volumes

d’écrits anciens numérisés,

et des catégories d’écrits

courants déposés en ligne,

développement d’une

science TDM

Bases de l’autorisation du

TDM, développement des

possibilités techniques,

notamment algorithmiques,

Application d’un TDM large et

partagé grâce à un modèle

économique fin, négocié avec

les éditeurs sans

Modèles de contrats

d’édition, de brevets

classiques, débuts de

l’open access

Diminution des délais

d’embargos, volonté de

modernisation de l’open

access

Vers un nouveau modèle (par

exemple les micropaiements)

Achat de bouquets

documentaires,

négociations avec les

éditeurs

Meilleure concertation des

négociations pour se

rapprocher des besoins

réels, parallèlement à la

modernisation des logiciels

économiques des éditeurs

Vers un nouveau modèle (par

exemple les micropaiements)

■ Le suivi des demandes émanant des chercheurs via les enquêtes et études associées

Premiers résultats de

l’enquête COPIST

Résultats COPIST

améliorés et recompilés,

avec une analyse en

profondeur effectuée

COPIST à poursuivre, avec la

possibilité de confier des

missions plus précises aux

CORISTs

Début des réflexions

nationales, consultation

LPRN

Intensification des réunions

et rencontres des différents

acteurs de l’IST

Rationalisation du système de

dialogue multilatéral

pour limiter les forces d’inertie

du consensus

Page 127: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

127

■ La simplification des outils et services

Emergence d’une grande

diversité d’outils pour

répondre aux besoins qui

émergent

Renforcement des

coopérations et des

réseaux

Mise en cohérence des

réseaux avec l’échelle

européenne, mise en avance

de la France numérique

Haute technicité des outils,

inadaptation aux besoins

locaux

Mise à niveau des

personnels, plans de

formation et mise en ligne

de l’information (approche

« en aval »)

Prise en compte de

l’ergonomie, de l’intuitivité de

l’expérience utilisateur

(approche « en amont »)

■ Un plan de communication et de formation à destination de la recherche

Livrables de la DIST Livrables mis en ligne par

tous les réseaux, la DIST

prend un rôle de répertoire

et de centralisation de

l’information

Livrables imprimés et/ou

diffusés par les partenaires

(universités, UMR, etc.)

Peu de formation

généraliste, existence de

« silos » spécialisés dans

un seul domaine, avec

début de communication

entre les personnels

Accompagnement par des

personnels du CNRS, en

tant qu’interlocuteurs

privilégiés, formation

centrée sur la formation

initiale

Faire reposer les appuis de la

formation sur une plus large

frange de personnels locaux

en reconnaissant leurs

compétences par une VAE

fondée sur un cahier de

critères plus pertinent, leur

permettre le suivi et l’entretien

du niveau de compétences

des chercheurs pour

s’assurer d’une corrélation

avec la vitesse de progrès

technique

L’IST est réservée à un

public assez confidentiel,

cantonné à certains

domaines de la Recherche

particulièrement bien

développés sur le sujet

Ouverture de l’IST à tous

les chercheurs grâce à

l’effort des CORIST et aux

projets DORANUM et

OPIDOR

Faire participer les étudiants

et les citoyens à l’IST en tant

que récepteurs et en tant

qu’utilisateurs des

fonctionnalités secondaires

des outils IST

Page 128: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

128

Page 129: « MIEUX PARTAGER LES CONNAISSANCES

CNRS – Direction de l’Information Scientifique et Technique

129

4. ANNEXE BIBLIOGRAPHIQUE

Dans une approche évolutive générale du partage de l’information scientifique et

technique, et afin de donner une trame à la coordination de tous ses acteurs -notamment

en vue de l’application des mesures de la Loi pour une République Numérique- les

documents suivants ont été repris, combinés, et réorganisés dans le présent document ;

▪ Stratégie IST 2014

▪ Livre blanc et guide stratégique d’application (« Une Science ouverte dans une

République numérique : études et propositions en vue de l’application de la Loi »)

▪ Enquête COPIST (premiers résultats d’octobre, version du 14 mars 2016)

▪ Enquête auprès des DU (« Mieux partager l’information scientifique », résultats de

mars 2015 de l’enquête sur les usages et besoins d’IST des Unités de Recherche,

réalisée auprès des Directrices et Directeurs d’Unités du CNRS)

▪ Actes du Colloque de Meudon ;

o « Dynamiques de l’édition scientifique, de l’industrie, de l’information, de la

documentation » (4 et 5 novembre 2014)

o « Publication scientifique, innovation et services à la recherche » (9 et 10

novembre 2015)

o « La Loi Numérique : et après ? » (9 et 10 novembre 2016)

▪ Rapport de mission sur les systèmes de recommandation (Elsevier, 6 avril 2017)

▪ Schéma opérationnel (Panorama de l’écosystème IST 2017)

▪ Ouverture des données de recherche : cadre juridique (INRA)

▪ Rapport 2017 au MESR « Les enjeux du numérique concernant les ressources

documentaires en SHS »

▪ Rapports d’activité des segments 4 et 7 de la BSN (2016)

▪ Etude technico-budgétaire Ourouk

▪ Travaux sur les indicateurs IST des EPST et des Epic (séminaire ADBU 2012,

Dominique Cavet)