CNRS – Direction de l’Information Scientifique et Technique
1
« MIEUX PARTAGER LES CONNAISSANCES »
Pour une information scientifique et technique claire, interopérable, pérenne
Bilan d’étape (2014-2017)
Rapport de stage de Louki-Géronimo Richou, SciencesPo Sous la direction de Renaud Fabre, DIST du CNRS
Juillet 2017
CNRS – Direction de l’Information Scientifique et Technique
2
Table des matières
Préface ............................................................................................................................. 5
Liste des acronymes ......................................................................................................... 7
0. PREAMBULE : Quelle vision de l’IST ? ................................................................ 13
0.1. À l’heure numérique : Que transforme l’IST ? ................................................... 13
0.2. Définition : La nature de l’IST ............................................................................ 15
0.3. Mutations en cours ............................................................................................ 17
0.3.1. De nouveaux volumes ................................................................................ 18
0.3.2. De nouveaux supports et démarches : plateformes ................................... 19
0.3.3. De nouvelles formes : métaconnaissances… ............................................. 21
0.3.4. De nouveaux usages : recommandation, captation contrôlée .................... 23
0.4. Contexte et objectif du présent document ......................................................... 24
0.5. Une vision d’ensemble fournie par le CNRS aux acteurs de l’IST ..................... 29
1. CONSTAT : Des attentes partagées entre les nouveaux acteurs de l’IST : Une
dynamique pour la science .......................................................................................... 32
1.1. Une nécessité commune : Ouvrir et simplifier les conditions d’accès ............... 32
1.1.1. Le besoin d’être formés à l’interaction avec l’IST, et informés de ses
évolutions ................................................................................................................. 33
1.1.2. Accéder de façon sûre à de larges fonds documentaires et outils d’analyse
au meilleur coût ........................................................................................................ 40
1.1.3. Le paysage de l’IST française : un territoire en interaction forte mais
morcelé, proposant des solutions inégalement ouvertes.......................................... 42
1.2. Des besoins d’IST spécifiques à certains acteurs ............................................. 52
1.2.1. Les spécificités des Unités de Recherche et Instituts ................................. 52
1.2.2. Les besoins différenciés des Universités, Organismes et Grandes Ecoles 57
1.2.3. L’action de l’Etat au service du citoyen (agences, APUL, ODAC, mission
Etalab) 58
1.2.4. Les besoins des entreprises ....................................................................... 65
CNRS – Direction de l’Information Scientifique et Technique
3
2. VISION : Faire évoluer les services d’IST vers l’interopérabilité ....................... 69
2.1. Développer une politique nationale de formation de soutien pour la recherche et
l’éducation .................................................................................................................... 71
2.1.1. Fluidifier l’utilisation des outils en répondant aux difficultés rencontrées .... 71
2.1.2. Optimiser les savoirs et compétences pour la transition numérique ........... 73
2.1.3. Connecter les chercheurs de l’IST française entre eux .............................. 78
2.2. Développer de nouveaux circuits économiques ................................................ 80
2.2.1. Poursuivre la coordination les efforts de négociation et d’acquisition des
établissements au sein de partenariats européens pour les stratégies d’achat ....... 81
2.2.2. Concevoir une offre soutenable pour les établissements, en repenser les
périmètres d’accès ................................................................................................... 84
2.2.3. Etablir un nouveau modèle économique de valorisation (recommandation,
etc.) au cœur d’une Science Ouverte fonctionnant sur le principe de Libre Accès .. 88
2.2.4. Mettre en place les structures (agences, charte éthique) à même d’assurer
l’application des principes juridiques contenus dans la LPRN (loyauté des
plateformes, lisibilité, exhaustivité) ........................................................................... 93
2.3. Proposer un point d’entrée unique, tenant compte de la grande diversité de
ressources et de plateformes ....................................................................................... 98
2.3.1. Faire appliquer les principes juridiques de protection des données (secret
dans la recherche, confidentialité, anonymat simple ou coordonné) ........................ 99
2.3.2. Tenir compte des évolutions vers l’interopérabilité des outils de l’industrie et
des voisins européens ............................................................................................ 103
2.3.3. Permettre l’adoption de référentiels et standards normés communs ........ 105
2.3.4. Rendre le dispositif modulable pour s’adapter aux différents besoins ...... 110
2.3.5. Bibliométrie et outils assimilés : vers la curation et la facilitation de
l’exploitation des données de la recherche............................................................. 111
2.4. Sauvegarder la pérennité et la compétitivité de l’IST française ....................... 114
2.4.1. Construire un programme national cohérent et interdisciplinaire de
préservation du patrimoine scientifique incluant un archivage pérenne (HAL, ISTEX)
114
2.4.2. Apporter un appui logistique et linguistique à la visibilité internationale des
publications (notamment en OA) du CNRS et de ses partenaires, en assistant la
rédaction et la traduction ........................................................................................ 118
CNRS – Direction de l’Information Scientifique et Technique
4
2.4.3. Anticiper les partenariats pour réguler les relations entre les producteurs,
les intermédiaires et les usagers finaux d’IST ........................................................ 122
3. SYNTHESE ET ACTUALISATION STRATEGIQUE : Vers l’interopérabilité des
outils et des usages .................................................................................................... 125
4. ANNEXE BIBLIOGRAPHIQUE .............................................................................. 129
CNRS – Direction de l’Information Scientifique et Technique
5
Préface
La Stratégie "Mieux partager les connaissances" proposée par Alain FUCHS,
Président du CNRS, est désormais un objet familier de l'IST nationale, puisqu'elle a
effectivement conduit à un ensemble de résultats concrétisant son intitulé et ses axes
moteurs : faire le bilan d'étape de cette démarche nationale s'imposait d'autant plus
qu'une nouvelle étape, tout aussi importante pour le travail de la science à l'heure
numérique, est devant nous pour utiliser ce "fluide" numérique qu'est l'IST.
Grâce à l'investissement personnel exceptionnel de Louki-Géronimo RICHOU, Stagiaire
à la DIST de SciencesPo Paris et auteur de ce rapport, une vue d'ensemble, élaborée
sous ma responsabilité, est désormais accessible tant sur les éléments essentiels du
travail accompli que sur les priorités de l'étape qui s'ouvre.
Qu'a-t-on accompli depuis 2014 et quels sont les thèmes porteurs des évolutions en
cours ? Nous avons pris le parti dans ce rapport, d'une approche strictement
pragmatique et "documentaire" : quels sont les changements dans les faits, les
pratiques, les règles et ceci quels que soient par ailleurs les indispensables adaptations
de l'éthique et des comportements, sur lesquels, à mes yeux, seule une réflexion
collective s'impose, et qui a été initiée pour cet automne entre le Conseil scientifique du
CNRS et des Instituts, d'une part, et la DIST, d'autre part.
La période 2014-2017
Elle a permis de construire un certain nombre de convergences inédites des usages et
des règles visant à "Mieux partager les connaissances" et à penser ces mutations en
partageant les pratiques professionnelles des acteurs nationaux (CNRS, CPU, ADBU,
Couperin, ABES, EPRIST): l'exigence d'interopérabilité est la primordiale tant pour le
CNRS lui-même, où sont représentées toutes les approches disciplinaires, que pour tous
les travaux de recherche conduits à l'heure numérique quels qu'en soient les disciplines
et les laboratoires d'origine, dans la recherche publique nationale et en dehors. L'optique
de Science Ouverte a ainsi été recherchée par un ensemble cohérent de démarches et
de projets visant ;
- le repérage des atouts et handicaps des pratiques existantes : documents
stratégiques de la DIST, de l'INIST, de PERSEE, du CCSD ;
- la connaissance fine des pratiques nationales des laboratoires et des
Etablissements de recherche : enquêtes en 2014, puis en 2015 et 2016 avec le
COPIST ;
CNRS – Direction de l’Information Scientifique et Technique
6
- l'adaptation des règles garantissant l'optimisation du partage des connaissances :
refontes réglementaires et législatives sur les données, et bien sûr, loi "Pour une
République numérique".
La période 2017-2020
Pour reprendre un découpage temporel européen, la période qui s'ouvre est au moins
aussi porteuse d'acquis et de défis et ouvre à la fois :
- à la stabilisation des pratiques numériques nouvelles de la recherche sous la
forme de services à la science et à ses usagers,
- au développement d'applications nouvelles des résultats scientifiques aux
besoins de la société ;
- à l'articulation dans les deux cas entre les projets développés en France et les
projets internationaux.
Un tableau synthétique et comparatif à la fin du rapport présente l'essentiel des
évolutions détectées par le rapport, enregistrées et attendues dans ces deux phases,
passée et à venir.
La phase à venir repose sur une série très dense de chantiers d'organisation et de
construction de services : création et homogénéisation de réseaux de plateformes
dotées de règles et langages interopérables, normalisation des "grammaires "et
"vocabulaires" de l'IST à grande échelle et dans des formes stabilisées, développements
des échanges et interactions de données à très grande échelle, mise en place de
nouvelles formes contractuelles pour accompagner des formes inédites de création de
valeur, pour ne citer qu'un échantillon des changements en cours de préparation.
Bien entendu, ces changements seront accompagnés de nouveaux modèles de création
de valeur, de nouveaux services à la recherche, et d'une structuration nationale du
potentiel de l'INIST enfin stabilisée, et accompagnée d'un développement dynamique.
Comme cela fut le cas ces dernières années, ces changements vont s'accompagner
d'une intense activité de discussion et de débats entre les parties prenantes de l'IST
nationale, de sa construction et de ses usages : je forme le vœu que ce court rapport
permette d'esquisser un balisage et un éclairage sur les choix futurs dont l'IST a besoin
dans cette période d'intense transformation.
Renaud FABRE, juillet 2017
CNRS – Direction de l’Information Scientifique et Technique
7
Liste des acronymes
Voici une liste exhaustive des acronymes employés dans le présent document, conçue
pour servir de référentiel au lecteur, qui peut s’y reporter à tout moment afin de mieux s’y
retrouver parmi un écosystème IST pourvu d’un très grand nombre d’abréviations.
AAF : association des archivistes français
ABES : agence bibliographique de l’Enseignement supérieur
ADAE : agence pour le développement de l’administration électronique (2003)
ADBU : association des directeurs et personnels de direction des bibliothèques universitaires et de la
documentation
ADELE : plan d’administration électronique de l’ADAE
AMUE : agence de mutualisation des universités et établissements
ANF : action nationale de formation
APC : articles processing charges (frais de publication des éditeurs)
API : application programming interface
ARPIST : réseau des professionnels de l’IST de la région Aquitaine
ASSO : secteur sécurité sociale
ATICA : agence NTIC française (2002)
ATILF : analyse et traitement informatique de la langue française
BAP : branche d’activités professionnelles
BBEES : bases de données Biodiversité, Ecologie, Environnements Sociétés
BibCNRS : service de documentation interne du CNRS
BNF : Bibliothèque Nationale de France
BOAI : initiative de Budapest sur l’open access
BSN : Bibliothèque scientifique numérique
BU : bibliothèque universitaire
CCSD : Centre pour la communication scientifique directe
CDEFI : Conférence des Directeurs des Ecoles Françaises d'Ingénieurs
CDS : centre de données astronomiques de Strasbourg
CEDRAM : centre de diffusion des revues académiques de mathématiques
CNRS – Direction de l’Information Scientifique et Technique
8
CERN : centre européen de recherche nucléaire
CGE : conférence des grandes écoles
CGI : commissariat général à l’investissement
CGU/CGV : conditions générales d’utilisation / de vente
CIRAD : centre de coopération internationale en recherche agronomique pour le développement
CLEO : centre pour l’édition électronique ouverte
CNN (ou CNNum) : Conseil national du numérique
CNRS : centre national de la recherche scientifique
COAR : confederation of Open Access repositories
CODORNUM : comité d’orientation du numérique
COLLEX : collection d’excellence
COMETS : comité d’éthique du CNRS
COPIST : catalogue d’offre partagée IST
CPU : conférence des présidents d’universités
CREM : centre de recherche en ethnomusicologie
CS : conseil scientifique (du CNRS)
DAJ : direction des affaires juridiques
DARIAH : digital research infrastructure for the Arts and Humanities
DASTR : Direction d’appui à la structuration territoriale de la Recherche
DCC : Digital curation center
DDAI : direction déléguée aux achats et à l’innovation (du CNRS)
DFG : Deutsche Forschungsgemeinschaft
DGME : Direction Générale de la Modernisation de l'Etat
DIST : direction de l’information scientifique et technique (du CNRS)
DMP : data management plan (= PGD) ou dossier médical personnalisé
DOI : digital object identifier
DORANUM : Données de la Recherche : Apprentissage NUMérique à la gestion et au partage
(URFIST, INIST-CNRS, BSN)
DSFIM : direction de la stratégie financière, de l'immobilier et de la modernisation
DU : directeur d’unité (de recherche) ou directeur d’université
EGU : European Geosciences Union
CNRS – Direction de l’Information Scientifique et Technique
9
EIG : entrepreneurs d’intérêt général
ENSSIB : École nationale supérieure des sciences de l'information et des bibliothèques
EOSC : European Open Science Cloud
EPRIST : association des responsables IST des organismes de recherche
EPST : établissement public à caractère scientifique et technologique
ESR : enseignement supérieur et recherche (secteur)
ETPT : équivalent temps plein travaillé
EzPAARSE : « easy » Progiciel d'Analyse des Accès aux RessourceS Electroniques
FEI : fonctionnement et investissement
FEVAD : fédération du e-commerce et de la vente à distance
FOSTER : Facilitate Open Science Training for European Research
FRéDoc : formations des réseaux de la documentation (rencontre annuelle nationale)
GAFAM : grands groupes du secteur des plateformes (Google, Amazon, Facebook, Apple, Microsoft)
GBIF : Global Biodiversity Information Facility
GED : gestion électronique des documents
H2020 : planification des politiques publiques pour l’horizon 2020
HAL : Hyper Articles en Ligne (archive ouverte)
IDEX : initiative d’excellence (PIA)
IEEE : Institute of Electrical and Electronics Engineers
IFP : Institut français de presse
IFREMER : Institut Français de Recherche pour l'Exploitation de la Mer
IFSTTAR : Institut français des sciences et technologies des transports, de l’aménagement et des
réseaux
IN2P3 : Institut national de physique nucléaire et de physique des particules
INC : Institut national de chimie
INEE : Institut national de l’écologie et de l’environnement
INIST : Institut national de l’information scientifique et technique
INP : Institut national de physique
INRIA : Institut national de recherche en informatique et en automatique
INS2I : Institut national des sciences de l’information et de leurs interactions
INSB : Institut des sciences biologiques
CNRS – Direction de l’Information Scientifique et Technique
10
INSEE : Institut national de la statistique et des études économiques
INSERM : Institut national de la santé et de la recherche médicale
INSHS : Institut national des sciences humaines et sociales
INSIS : Institut national des sciences de l’ingénierie et des systèmes
INSMI : Institut national des sciences mathématiques et de leurs interactions
INSPIRE : directive de 2007 sur l’infrastructure d'information géographique dans la Communauté
européenne
INSU : Institut national des sciences de l’univers
IPE : ingénieur projet européen
IRD : Institut de recherche pour le développement
IST : information scientifique et technique
ISTEX : Initiative d’excellence de l’Information Scientifique et Technique
LABEX : laboratoire d’excellence (PIA)
LCEN : Loi pour la confiance dans l’économie numérique
LORIA : laboratoire lorrain de recherche en informatique et ses applications
LPRN : Loi pour une République numérique
MI : mission pour l’interdisciplinarité
NUMDAM : numérisation de documents anciens mathématiques (bibliothèque)
OA : Open Access
OCDE : Organisation de Coopération et de Développement Économiques
ODAC : organismes divers d'administration centrale
OGP : Open Government Partnership
OMES : Observatoire des Métiers et de l'Emploi Scientifique
OPECST : Office parlementaire d'évaluation des choix scientifiques et technologiques (de l’Assemblée
Nationale)
OPIDoR : Optimisation du Partage et de l'Interopérabilité des Données de la Recherche
ORCID : Open Researcher and Contributor ID
OSPP : Open Science Policy Platform (conseil auprès de la Commission européenne)
OST : Observatoire des Sciences et techniques
PAO : publication assistée par ordinateur
PAP : plans d’action partagée (du CNRS)
CNRS – Direction de l’Information Scientifique et Technique
11
PDF : portable document format
PGD : plan de gestion de données (= DMP)
PIA : programme d’investissements d’avenir
PIAAC : Programme for the International Assessment of Adult Competencies
PPSI : politique de protection des systèmes d’information
PSL : Paris Sciences et Lettres (réseau universitaire)
RBDD : réseau bases de données
RGI : référentiel général d’interopérabilité
RNBM : réseau national des bibliothèques de mathématiques
RRC : ressources de représentation des connaissances
RRI : label responsible research and innovation
RSI : responsable des services informatiques
RSNR : répertoire national des structures de recherche
SAPPS : Service d’appui à la politique et à la prospective
SCAR-MarBIN : Scientific Committee on Antarctic Research - Marine Biodiversity Information Network
SCD : service commun de la documentation
SCOAP3 : Sponsoring Consortium for Open Access Publishing in Particle Physics
SGMAP : Secrétariat Général pour la Modernisation de l’Action publique
SHS : sciences humaines et sociales
SINAPS : solution intégrée de gestion des données de référence et d’orchestration des processus
métier (logiciel)
SIST : analyse stratégique de l’IST
SPV : service de prospective et de valorisation
STAR : signalement des thèses d’archivage (ABES)
SUDOC : système universitaire de documentation
SWORD : Simple Web-service Offering Repository Deposit
TAL : traitement automatique du langage
TDM : text and data mining
TEL : Thèses en ligne
TermITH : terminologie et indexation de textes en sciences humaines
TGIR : très grande infrastructure de recherche
CNRS – Direction de l’Information Scientifique et Technique
12
UMR : unité mixte de recherche
UMS : unité mixte de service
UPS : unité propre de service
URFIST : unité régionale de formation à l’IST
URL : Uniform Resource Locator
VAE : validation des acquis de l’expérience
WoS : Web of Science
ZbMATH : service Zentralblatt (par Springer)
CNRS – Direction de l’Information Scientifique et Technique
13
0. PREAMBULE : Quelle vision de l’IST ?
0.1. À l’heure numérique : Que transforme l’IST ?
De nouveaux supports ont donc émergé pour héberger l’IST. Il s’agit notamment
de vastes plateformes, mettant en relation une (ou plusieurs) offre(s) avec une (ou
plusieurs) demande(s), dans des systèmes multifaces qui fonctionnent essentiellement
comme des organes de référencement produisant à partir de larges listings des résultats
selon les filtres appliqués par l’utilisateur. Ces plateformes font l’objet de démarches
nouvelles s’inscrivant dans la digitalisation de la science, qui fonctionnent en « couches
de cycle » interactives entre des users et des items. Cette digitalisation s’appuie sur
deux grands objectifs indissociables ; l’interopérabilité et la réduction des
déformations induites par les nécessaires opérations de traduction entre le langage
humain verbal et les langages machine.
Plateformes et régulation dynamique des contenus
CNRS – Direction de l’Information Scientifique et Technique
14
Les plateformes proposent des services IST qui sont des outils de documentation,
de recherche, d’analyse et de mise en relation. Ces services sont construits à l’amont
par différents acteurs privés et publics, et encadrés par les règles issues de la Loi pour
une République Numérique et les lignes de conduite adoptées par les organismes et
agences d’Etat tels que la mission Etalab. L’Etat et les différents acteurs situés dans les
organismes mûrissent de façon partagée les grandes orientations financières et
réglementaires en vue d’établir des principes qui ouvrent et sécurisent les possibilités
d’usage des outils par les chercheurs. Les principes viennent à l’amont, et conditionnent
les usages des services par les chercheurs, tandis que les règles forment un cadre rigide
mais en constante adaptation, dans lequel les usages peuvent s’épanouir sans danger.
Le CNRS et les études COPIST jouent un rôle prépondérant dans la définition des
conditions d’accès des chercheurs aux services IST, et l’expression de leurs besoins
influe à son tour sur le développement de ces services, de la programmation
informatique à l’ergonomie en passant par les ressources inclues. Il s’agit donc d’une
interaction tripartite à variables multiples, où chaque action d’un acteur rétroagit sur
celles des autres.
Une approche systémique : vers l’interopérabilité
CNRS – Direction de l’Information Scientifique et Technique
15
0.2. Définition : La nature de l’IST
L’information scientifique et technique (IST) désigne l'ensemble des informations
nécessaires à l'activité scientifique comme à l'industrie. Bien qu’elle fût originellement
principalement représentée par des formats papier, elle recoupe aujourd’hui
grandement l’information produite par les recherches simples faites par les citoyens,
c’est-à-dire les données sur les utilisateurs et les usages, harmonisées dans de grands
fichiers par les moteurs de recherche et les plateformes. En ce sens, l’IST se définit
plutôt par ses modalités de partage et ses destinataires que par ses producteurs ;
son champ étendu couvre donc toute information dont le contenu spécialisé permet de
développer des modèles scientifiques ou d’élaborer des applications commerciales ayant
trait à un domaine scientifique à terme. L’IST peut se lire comme une matière ayant
plusieurs dénominateurs communs ;
Une caractérisation de la nature et du périmètre de l’IST
■ Au premier abord, l’IST est pareille à un fluide en ce qu’elle se constitue par les
apports infimes et constants de diverses sources, qui se déversent dans de petits
affluents (les matériels informatiques particuliers et locaux), confluant vers de grands
bassins (les serveurs et centres de stockage), puis qui communiquent tous entre eux à la
manière des océans. Ces sources sont notamment des chercheurs, des universités, des
citoyens, et des entreprises.
CNRS – Direction de l’Information Scientifique et Technique
16
■ Ce fluide connaît aussi ses cycles et protocoles, et à l’image des nuages qui se
forment de minuscules gouttelettes et redeviennent à leur tour pluie, celui qui émet des
données personnelles par ses recherches et activités (cookies, historique) reçoit à son
tour, et absorbe, des données organisées, suggérées et adaptées en provenance des
plateformes. La catégorie de ceux qui ont besoin d’IST recouvre une réalité très large ; il
peut s’agir de chercheurs, d’institutions, d’entreprises, mais encore d’associations, et
plus globalement la société civile en général.
■ Sont-ce les données qui « font » la science, comme le suggère le mouvement pour un
« Quatrième Pilier » de la science ou bien, comme l’avance la Contribution du CNRS à la
Stratégie nationale de la Recherche, la science possède-t-elle des fondements
numériques complexes ?
1er fil rouge : Adapter les compétences et usages à l’évolution de l’IST par la
formation
■ En ce sens, un premier « fil rouge » du présent document doit se focaliser sur la
définition inchangée de l’IST, ce qui en constitue sa base, et les moyens d’adapter les
réalités de ceux qui ont besoin d’IST à cette base, en les préparant et en les formant. Ce
processus a déjà été largement engagé, et mérite une réflexion quant à ses voies de
pérennisation.
2nd fil rouge : Rechercher et publier pour un coût modeste et en toute sécurité
■ Ensuite, l’IST dépasse cependant cette métaphore simplifiée, car contrairement à l’eau
terrestre, qui toujours demeure égale à elle-même et dont on ne peut que disperser,
répartir les molécules sans en ajouter, son volume total est en constante et exponentielle
augmentation. Le second « fil rouge » doit donc s’attacher à permettre à celui qui
recherche, qui fonde ses espoirs sur l’acquisition de nouvelles connaissances parmi ce
nombre croissant de publications et bases de données, de pouvoir explorer les chemins
les plus larges (potentialisation par l’acquisition de fonds documentaires), sans pour
autant s’y perdre (référencement, loyauté des plateformes), ni encourir de dangers
(protection des droits d’auteur, des données, de la vie privée, droit à l’oubli). En effet, si
nul ne peut affecter cette production exponentielle d’IST, car elle dépend de chaque
individu et se nourrit d’elle-même en recoupant les données entre elles dans un monde
numérique peuplé d’interactions, un cadre coopéré par tous les acteurs nationaux doit
permettre à l’usager des plateformes et services IST de ne pas se perdre, ni encourir le
moindre danger en les utilisant.
CNRS – Direction de l’Information Scientifique et Technique
17
3ème fil rouge : Simplifier le point d’entrée, les conditions d’usage et de partage
■ Enfin, cette croissance exponentielle de l’IST a eu comme corolaire la création par des
ingénieurs et programmeurs de nouveaux outils et services (services partagés
d’organisation du travail, fouille de textes avancée (TDM), bibliométrie) pour la traiter. Le
troisième « fil rouge » concerne donc les besoins exprimés par les chercheurs
d’unification d’outils aujourd’hui disparates et aux utilités se recoupant pourtant souvent.
Ces besoins doivent trouver une réponse maximisant l’efficacité des outils sous la
contrainte de prise en main par ceux auxquels ces derniers sont destinés ; le non-
recours et les mauvais usages seraient ainsi diminués. En outre, ces points d’entrée
simplifiés vers l’IST doivent présenter, pour plus de commodité, un caractère
interopérable, et être adaptables facilement à chaque domaine de la science.
■ Pour synthétiser le déroulement ces trois fils rouges à chaque étape, ce tableau de
trois colonnes évoluera en début de chaque partie ;
Une définition inchangée Un changement d'échelle (big
data)
De nouveaux outils pour la
traiter (smart data)
0.3. Mutations en cours
Des externalités positives au cœur d’une formidable prise de volume
L’IST connaît des externalités positives générant une multiplication endogène des
potentiels ; plus il y a de volume d’IST mis en relation sur une même plateforme, un
même outil de traitement, plus il y a de potentielle IST générée. Métaphoriquement,
l’IST est un monde où 1 + 1 est égal à 3. Plus encore, ce phénomène est exponentiel ;
(2 + 2) > 6. Les chercheurs, les citoyens et les entreprises produisent de l’IST en publiant
des articles et textes (voie classique), mais également en générant des données par
leurs recherches bibliométriques et leurs propres travaux (voie périphérique). Elle a
connu, sur les 20 dernières années, une progression exponentielle comparable à celle
connue par la puissance des processeurs décrite par la loi de Moore. Cette prise de
volume a été accompagnée et encadrée par une évolution majeure dans 3 domaines ;
les supports, les usages et les outils de traitement de l’IST.
CNRS – Direction de l’Information Scientifique et Technique
18
0.3.1. De nouveaux volumes
La constante est le volume de ces données, réparties sous divers formats dans
des endroits physiques très éparpillés et avec des conditions sécuritaires très
hétérogènes ; entre 1980 et 2015, le volume total des données a connu une prise de
masse sans précédent, à tel point qu’il est estimé1 que l’Humanité produit aujourd’hui
en 2 jours autant de données brutes que pendant les 2 millions d’années
précédant l’avènement de l’informatique.
Bernard Benhamou, délégué aux usages d’Internet auprès du ministère de
l’Enseignement supérieur et de la Recherche : « L’essentiel du volume d’informations
généré aujourd’hui l’est encore par des humains, mais, dans les prochaines années, il
sera produit par des capteurs.»
■ Ces capteurs peuvent notamment être des outils de précision utilisés par les sciences
dures, comme des outils statistiques chers à la sociologie, ou encore des détections
automatiques issues de larges fouilles de textes concernant les SHS.
Serge Abiteboul, de l’Institut national de recherche en informatique et en automatique
(Inria), dans une interview pour Libération : « La nouveauté, c’est la capacité à croiser
toutes les données en provenance des capteurs, du Web et de l’Open Data
gouvernementale. »
■ Le téraoctet est couramment utilisé par les unités de recherche voire les particuliers,
et les entreprises connaissent le pétaoctet depuis plusieurs années déjà. Ces volumes
1 INSEE et Eurostat, 2015.
CNRS – Direction de l’Information Scientifique et Technique
19
sont hors de toute mesure humaine, et les consciences ne peuvent donc plus les traiter,
ni même avec l’aide d’outils traditionnels. C’est en cela que l’algorithmique et le
traitement par l’intelligence artificielle sertie du deep-learning prend son sens, afin de
rétablir du sens et de permettre aux chercheurs ou aux citoyens de s’y retrouver au beau
milieu de cet océan, de ces torrents d’IST se déversant sans jamais discontinuer.
Jean-Yves Pronier : « C’est bien d’avoir des données, mais c’est mieux de les faire
parler. Et, pour cela, les technologies traditionnelles ne suffisent plus. »
0.3.2. De nouveaux supports et démarches : plateformes
Quels rôles pour les plateformes de l’IST ?
■ Certaines plateformes sont commerciales, d’autres non. Certaines ont un nombre de
filtres restreint, d’autres beaucoup. Certaines encore hébergent des biens et capacités
de service en leur possession, d’autres présentent simplement des biens et services de
prestataires extérieurs. Enfin, certaines ont une matière bien définie, et d’autres sont
généralistes. Des articles papier s’additionnant au sein de journaux eux-mêmes compris
dans des cercles de diffusion, l’IST a éclaté en des bribes d’information disséminées et
rapprochables par la recherche voire le text and data mining (TDM), qui forment à
chaque nouvelle recherche une nouvelle galaxie de possibles, un nouveau texte qui se lit
différemment et associe plusieurs auteurs, plusieurs contributeurs. Les données
personnelles issues de ces recherches ont bien évidemment trouvé une place plus
discrète pour le grand public, et constituent la matière première des plateformes.
■ Dire « plateforme », c’est comprendre, avec une pondération différente selon le
contexte, trois grands rôles fonctionnels qui interviennent dans la chaîne fléchant
cette information vers l’utilisateur final ;
HEBERGEUR Stocke des data sets bruts
(matériellement)
EDITEUR Sélectionne des portions de données
AFFICHEUR Gère l’ordre et les modalités de listing des
résultats
CNRS – Direction de l’Information Scientifique et Technique
20
La situation du marché actuel des plateformes : entre hégémonie et
reconfiguration
■ De grandes plateformes anglo-saxonnes monopolisent les marchés, pour trois
grandes raisons ;
1. d’abord car cette économie est automatisée, dématérialisée et
désintermédiée, ses coûts fixes de lancement très forts, et ses coûts
marginaux quasi-nuls
2. ensuite, car les effets de réseaux y dominent (plus il y a d’utilisateurs sur une
plateforme donnée, plus le coût d’opportunité de la quitter est fort, et plus elle
croît)
3. et enfin et surtout parce que les plateformes réalisent de larges marges et
bénéfices, en offrant souvent un modèle « Premium », en plus de revendre la
valeur publicitaire générée par l’agrégation des audiences (vues, clics, temps
passé, etc.) qu’elle reçoit.
■ Cette hégémonie a généré un questionnement sur ce que devrait être la « loyauté »
de ces plateformes envers leurs utilisateurs ; en effet, le niveau de maîtrise moyen
par les utilisateurs des outils numériques ne permet pas à ces derniers d’appréhender
avec précision la complexité des modèles économiques et du partage des revenus par
les plateformes. La caractéristique du concept anciennement admis de plateforme est
qu’il désigne un aspect pragmatiste, quasi-visuel, de la réalité offerte à l’utilisateur, et
non un rôle précis dans le circuit de la valeur-information.
Un rapport de force que la loi doit arbitrer
■ La particularité de l’IST est qu’elle se cache partout, y compris dans les métadonnées
des moteurs de recherche tels que Google. La trouver relève donc d’une compétence
technique avancée, ou de l’usage des plateformes, qui doivent donc présenter des
conditions d’utilisation simples et ne trompant pas l’utilisateur, le rapport de force réel
étant très déséquilibré entre des expertises serties d’algorithmes et des profanes munis
de leurs seuls ordinateurs personnels. C’est ce rapport de force que la Loi pour une
République Numérique doit tenter d’arbitrer avec des principes tels que la « loyauté des
plateformes ». En outre, la loi pour la confiance dans l'économie numérique (LCEN, juin
2014) prévoyait déjà l'obligation de signaler qu'un contenu est publicitaire, ce qui
s'applique par exemple aux liens sponsorisés. On peut imaginer un système de
labellisation d’Etat, révélant l’information payée, potentiellement complété par un peer-
CNRS – Direction de l’Information Scientifique et Technique
21
reviewing en blockchain, révélant quelle information est fiable, afin de permettre à
l’utilisateur de savoir qui est qui.
0.3.3. De nouvelles formes : métaconnaissances…
Les différents niveaux d’IST
■ L’IST regroupe des données brutes pouvant servir dans des études statistiques, des
tests, ou encore l’élaboration d’articles et textes exigeants une réflexion périphérique,
mais elle s’étend également plus loin. Jusqu’à la donnée qui parle de données, la
métadonnée. Il peut s’agir d’informations sur les volumes, les récurrences, les dates, les
contenus spécifiques. Et cela s’inscrit dans plusieurs cadres ; bibliométrie, analyse de la
production scientifique, de la production de données par les consommateurs, les
utilisateurs, les usagers, etc.
■ L’information scientifique et technique, c’est en définitive l’ensemble des données
chiffrées, verbales et/ou picturales, qui abritent le potentiel d’un usage pour améliorer
l’état de connaissance scientifique, ou rendre possible l’application d’un nouveau produit
commercialisable à terme.
QUELQUES EXEMPLES
D’IST
Production Destination
Articles scientifiques Chercheurs Chercheurs, société civile
Données bibliométriques Chercheurs, experts TDM Chercheurs
Big data Consommateurs, citoyens Entreprises, Etat
Algorithmes statistiques Entreprises Entreprises, Etat
Un périmètre large pour comprendre l’IST
■ Aussi, ces données doivent être entendues dans un sens très général, et inclure à la
fois les données issues de la Recherche (collectées par les laboratoires et le CNRS),
celles issues des autres sphères administratives, c’est-à-dire des citoyens en tant
qu’entrepreneurs, contribuables et usagers (collectées par les services de l’Etat), et
enfin celles issues des citoyens en tant que consommateurs (collectées par des
entreprises).
■ Assimiler une méthodologie prend du temps pour le chercheur, émetteur de la
connaissance, comme pour le lecteur de l’article, de la revue, du brevet, qui en est le
CNRS – Direction de l’Information Scientifique et Technique
22
récepteur mais aussi le tributaire. Il y a une opposition classique entre deux logiques ;
une première logique, existante semble-t-il depuis toujours, qui veut que l’émetteur de
la connaissance soit docte, assimile la méthode et le langage technique afin de travailler
dans un environnement spécialisé, et que ce dernier soit responsable directement, ou
laisse à des intermédiaires la responsabilité de la vulgarisation vers le récepteur. Une
seconde logique, apparue depuis les années 1990 avec l’émergence d’internet, qui
veut que les rôles d’émetteur et de récepteur soient confondus, et que les deux
maîtrisent le même langage et la même méthodologie, afin de pouvoir communiquer
directement, l’un et l’autre étant tour émetteur et récepteur. L’intermédiaire est dans ce
cas relégué au rôle transitoire du commentateur ponctuel.
Le partage et les circuits de l’IST
■ L’IST peut être considérée comme un produit qui se transmet, mais cette voie
classique de production trouve sa limite dans un fait pas nécessairement intuitif, que les
groupes travaillant dans le secteur numérique connaissent bien comme étant leur source
de revenus la plus importante ; l’IST se génère aussi par les habitudes de recherche, et
d’interaction (ex : réseaux sociaux, peer-reviewing sur les plateformes, etc.) des
utilisateurs.
Voie classique ;
Emetteur de l’info A Récepteur de l’info A, avec différents niveaux d’intermédiation
Voie périphérique ;
Emetteur de l’info A Récepteur recherche info A produit info B Récepteur de
l’info B
■ L'innovation repose surtout sur l'évolution des systèmes d’information, des bases de
données, des systèmes d'archivage, de la gestion électronique des documents (GED),
des traitements linguistiques, de la conceptualisation de l'information, de la connaissance
i.e. tout ce qui peut enrichir les bases de données et accélérer la recherche en ligne. Il
faut être en mesure de s'emparer des technologies novatrices pour optimiser le
traitement ou l'accès à l'information.
CNRS – Direction de l’Information Scientifique et Technique
23
0.3.4. De nouveaux usages : recommandation, captation contrôlée
■ En ce sens, les chercheurs en situation de recherche documentaire produisant de l’IST
(par la création de schémas bibliométriques ou leurs propres historiques de recherche)
sont rapprochables des citoyens en situation de consommation ou d’activité sociale.
Cette voie périphérique est donc à protéger et doit faire l’objet de règles différentes de la
voie classique, qui connaît déjà un long passé de techniques de protection juridique
(brevets, contrats, notion de secret). Des indicateurs bibliométriques (répartition par
institut, relations interdisciplinaires, part nationale ou régionale, collaborations
internationales,…) sont produits par le Service d’appui à la politique et à la prospective
scientifique (SAPPS) de la Direction d’appui à la structuration territoriale de la recherche
(DASTR), et sont largement utilisés.
Les nouveaux usages dans l’entreprise
■ A l’échelle collective, au sein de l’entreprise, la voie périphérique se doit d’être encore
plus protégée, en raison des potentielles distorsions de la concurrence qui pourraient
résulter d’une divulgation des informations privées des clientèles et modèles de
management internes.
■ Les entreprises sont un acteur majeur qui, en prenant leur part dans le réemploi de
l’IST à fin commerciale, ont profondément modifié les normes qui la structurent. Elles
produisent de l’IST à plusieurs titres ;
- En recevant et incrémentant l’IST produite par les chercheurs afin de servir les
intérêts de ces derniers, dans des marchés de niche (voie classique spécialisée)
- En développant de nouveaux produits grâce à l’IST (voie classique commerciale)
- En produisant leurs propres données IST (voie périphérique)
De grands axes d’usage IST contemporains
■ Les recherches en IST s'organisent autour de trois axes correspondant à de nombreux
nouveaux usages potentiels : les mathématiques appliquées, les techniques
symboliques et numériques de l'intelligence artificielle et le Traitement Automatique du
Langage (TAL).
■ La recherche d’une donnée précise au sein de corpus de plus en plus larges, la
compilation, le TDM, la citation et la création automatique de bibliographies, sont autant
CNRS – Direction de l’Information Scientifique et Technique
24
de nouveaux usages cruciaux qui amènent à des innovations dans la manière de gérer
les supports et outils IST. La gestion des usages de l’IST est répartie, comme suit, en
différentes catégories, avec des volumes différents ;
Source : analyse technico-budgétaire par le cabinet Ourouk
0.4. Contexte et objectif du présent document
Points d’ancrage fixés et limites de la Stratégie 2013
Le document de Stratégie IST 2013 avait souligné plusieurs défaillances
concernant la mise en œuvre d’une cohérence nationale dans les usages et la gestion
de l’IST. Cependant, plusieurs études ont souligné les insuffisances de cette approche,
qui intervient dans le cadre d’évolution rapide et changeante qu’il a été donné de voir
dans le point précédent.
CNRS – Direction de l’Information Scientifique et Technique
25
- D’abord, l’enquête UMR auprès des directeurs d’unités (DU) avait mis en
évidence une connaissance des pratiques incertaine et inégale, rendant le non-
recours aux outils numériques de traitement et d’analyse de l’IST très prégnant.
- Ensuite, et du fait de cette connaissance incertaine, l’enquête COPIST avait
souligné la difficulté dans la mise en œuvre concrète d’un partage de l’IST
efficace et élargi.
CNRS – Direction de l’Information Scientifique et Technique
26
- Enfin, il manquait des normes d’encadrement juridique de l’IST, prenant en
compte ses spécificités ayant trait au numérique et portant en conséquence des
modifications dans tous les domaines de la Loi.
La résolution des questions ouvertes : marché-cadre, PAP, coopération
européenne
■ La mise en place d’un marché-cadre national pour l’acquisition de ressources
documentaires, ainsi que la communication établie entre les acteurs de l’IST
(établissements, universités, unités mixtes de recherche (UMR), administrations) ont
permis d’amorcer une mise à niveau des connaissances et une relance du partage. La
recherche en IST autour du Pôle Lorrain (Université de Lorraine, LORIA, ATILF…) et de
l’INIST est venue en appui aux projets IST du CNRS et de tout l’Enseignement Supérieur
et Recherche (ESR). Les projets retenus viseront une valorisation économique et
sociale. Un partenariat sur l’IST a été développé par mise en réseau des projets des
organismes de recherche. Les travaux d’amont visant l’interdisciplinarité ont été
développés en partenariat avec la Mission Interdisciplinarité (MI).
■ En 2014, l’analyse stratégique de l’IST française (SIST : « Mieux partager les
connaissances ; Une stratégie ouverte pour une information scientifique et technique
d’avenir ») rappelait les 4 plans d’action partagée (PAP) définis par le Directeur général
délégué pour la science du CNRS, visant à mieux : 1."Se documenter", 2."Publier",
3."Analyser l'information", 4."Accompagner l'IST et sa valorisation". Ces PAP ont porté
leurs fruits dans différentes mesures, et un retour sur les résultats doit être effectué,
comme une reformulation des objectifs à la lumière du recul acquis d’une part et des
nouveaux événements survenus dans le monde de l’économie numérique de l’autre.
Conjointement à cette progression globale de la Recherche et de l’Education pour la
science numérique, la Loi pour une République Numérique (LPRN) a fait émerger les
premières bornes d’un cadre juridique agile et intelligent, qui prend en compte l’apport
économique des grandes entreprises du secteur sans l’ignorer et tout en protégeant les
données pour l’intérêt général. Cette Loi constitue le point de convergence de toutes les
attentes des acteurs de l’IST, et tous les regards convergent donc dans sa direction. Les
objectifs de la Stratégie IST 2013 ont donc été atteints.
■ Ces 4 PAP étaient ensuite reliés parallèlement à 10 grandes orientations (O) pour
l’action concrète visant à faciliter les 4 démarches. D’abord, une conception évolutive
consistant à partager les savoirs et compétences au service de l’IST (O1 ; anticiper et
construire les options globales, O2 ; adapter les savoirs et compétences, O3 ; former par
CNRS – Direction de l’Information Scientifique et Technique
27
et dans la recherche). Ensuite, l’ouverture des modalités pour accueillir les besoins de
tous les chercheurs (O4 ; harmoniser l’offre et la demande d’IST, O5 ; partager les
ressources communes HAL et Persée, O6 ; valoriser et partager les données de la
recherche, O7 ; identifier et analyser les publications, O8 ; une stratégie globale pour le
libre accès à la science publique). Enfin, une régulation partagée destinée à dynamiser
les pratiques (O9 ; partager les règles, O10 ; innover dans les démarches). Ces 10
orientations ont connu des développements alternant entre réussites et difficultés de
mise en œuvre, entraînant parfois la « mise en silos » de certaines logiques, alors même
que des fusions et des interactions sont possibles. C’est pourquoi le présent document
stratégique tâche d’adapter les recommandations au paysage de l’IST 2017, avec ses
nouveautés, et fort de l’héritage des stratégies antérieures. La partie II (Vision) détaille
les points d’amélioration proposés, qui sont ensuite repris de façon synthétique dans la
partie III (Résumé et plan de mise en œuvre).
■ A l’échelle européenne également, la déclaration de Berlin (2003), les principes OCDE
d’accès aux données de recherche (2006), les principes des conseils de recherche
britanniques (2011), les recommandations de la Commission européenne (2012) suite au
rapport «Riding the Wave» (2010), les directives de l’OSTP vers les agences fédérales
de recherche américaines (2013), sont autant de recommandations, principes voire
injonctions à partager, rendre accessibles les productions scientifiques de recherche,
tout comme la directive européenne 2007/2/CE du 14 mars 2007 (INSPIRE), qui vise à
établir une infrastructure d’information géographique dans la Communauté européenne
pour favoriser la protection de l’environnement. Son application aux données de la
recherche fait l’objet de soins attentifs de la part de l’Institut Ecologie et Environnement
(INEE) et de l’Institut National des Sciences de l’Univers (INSU).
Explorer les zones de questionnement profondes tout en répondant aux besoins
immédiats
■ Néanmoins, des interrogations majeures demeurent, en raison de la perpétuelle
évolution des attentes et de la technologie y étant associée. Le cabinet Ourouk a été
chargé par la DIST du CNRS d’identifier les grands points de tension empêchant le
partage de l’IST. Au nombre de 6, ces « verrous » sont à lever pour assurer une
meilleure cohérence du système national, et grâce aux activités et entrevues mises en
place à la mi-2017 par Ourouk, ils concentreront les efforts de chacun pour poser la
première brique des objectifs de l’Horizon 2020 (H2020). Un verrou est en général plus
politique que technique : les mathématiciens utilisent par exemple une base de données
IST spécifique, qui pourrait facilement être convertible vers le format employé sur le
CNRS – Direction de l’Information Scientifique et Technique
28
Système Universitaire de documentation (SUDOC), mais certaines logiques de chasses
gardées persistent. Par ailleurs, en dehors des « verrous » que les études du cabinet
Ourouk s’emploient à définir, certaines inerties correspondent à des zones d’oubli, qui
n’ont simplement pas recueilli jusqu’alors l’attention nécessaire au changement ; les
thèses en ligne ne sont par exemple pas signalées dans le SUDOC.
■ Un premier pas a été fait, durant l’année 2016-2017, en réunissant dans une liste
claire, exhaustive et cliquable tous les outils et supports participant de l’offre IST
pour les chercheurs. Elle est en ligne sur le site de la DIST, et permet, en amont d’une
simplification des outils eux-mêmes, d’apporter en miroir une simplification de l’accès à
ces ressources.
A la moitié du gué : les objectifs 2017 inscrits dans le projet d’un grand Etat
numérique
■ Le présent document de Stratégie IST 2017 ne prétend pas apporter une réponse
unilatérale et exhaustive à la multitude d’enjeux soulevés par le passage de la France et
de sa Recherche à l’heure numérique. Il s’agit bien plutôt de prendre acte dans un
premier temps des étapes d’ores et déjà franchies pour fournir une vision d’ensemble
claire et synthétique (1), pour ensuite estimer la portée et la direction des actions qui
restent à mener tout en en identifiant les points de tensions (2). Enfin, un bref résumé
établira les circuits de mise en œuvre des préconisations ayant été effectuées (3).
■ L’ensemble de ces événements marquants, dans tous les secteurs de l’IST, ont
jalonné le long sentier vers un grand Etat numérique. La Recherche française, et la
France toute entière, sont à la croisée des chemins. Dans cet état intermédiaire, à la mi-
parcours en quelque sorte, il est nécessaire de préciser la portée normative de la LPRN,
qui doit s’inscrire dans un cadre européen plus large et plus profond, en visant la mise à
niveau de la France vis-à-vis de ses partenaires. Il est nécessaire de développer de
nouvelles pratiques opérationnelles, modifiant les structures et les logiques de la
politique numérique nationale concernant l’IST ; en ce sens, la réforme récente de
l’INIST a ouvert des perspectives d’optimisation des ressources mobilisées. Ces
perspectives s’inscrivent dans un ancrage territorial fort, celui d’un pôle d’excellence IST
en Lorraine. L’INIST, en association avec des partenaires universitaires dont en
particulier l’Université de Lorraine, dispose d'atouts pour développer le pôle d’excellence
en IST qui s’impose au niveau national. Cette conviction s’appuie sur les compétences
qu’a développé l’INIST mais aussi la présence de recherche de qualité sur le traitement
automatique des langues, tant au sein de l’ATILF que du LORIA (plus spécialement dans
CNRS – Direction de l’Information Scientifique et Technique
29
son département « Traitement automatique des langues et des connaissances »). La
présence d’un laboratoire de recherche de qualité en sciences de l’information et de la
communication, le Centre de Recherche en Ethnomusicologie (CREM), complète ces
ressources.
■ La stratégie IST doit être considérée comme une politique d’investissement visant
l’intérêt général et l’équité intergénérationnelle. En effet, d’une part les secteurs
intégrant l’IST sont créateurs de connaissances, et à terme de valeurs économiques
réelles, mais ne sont rentables qu’à long terme et avec de fortes incertitudes ; l’Etat doit
donc jouer un rôle de développement des innovations, y compris en sciences humaines
et sociales. D’autre part, des quasi-monopoles ayant émergé grâce de forts coûts fixes et
de faibles coûts marginaux et à l’effet de réseau, une action de sécurisation de l’emploi
et des données IST doit être menée par tous les partenaires français, et ce dès la
formation des personnels produisant et gérant l’IST, évitant parallèlement leur
subordination complète à des méthodes et besoins ne représentant pas l’intérêt général
national.
0.5. Une vision d’ensemble fournie par le CNRS aux acteurs de l’IST
Le positionnement du CNRS en tant qu’acteur coordinateur
Les positions du CNRS sont motrices dans la définition et la promotion des
positions nationales, européennes et internationales en faveur d'une IST partagée.
Comme les constats globaux l'ont mis en évidence, le CNRS est présent dans toutes les
enceintes nationales, européennes et internationales où progresse le projet de la
Science ouverte. Ces positions peuvent s'appuyer sur des ressources et des réflexions
internes qui développent autant de lignes d'actions opérationnelles. Les difficultés à
assurer la cohérence globale des positions en faveur de la science ouverte ne sont pas
sous-estimées, comme le montre les étapes en cours des négociations sur l'Open
Access (cf. Principe d'action 8).
■ Les positions internationales, européennes et nationales du CNRS en faveur de
la Science ouverte sont confortées par l'ampleur des besoins et la qualité des
propositions de mise en œuvre. Ces positions s'appuient à l'amont sur l'action du
Ministère de l’Enseignement Supérieur, de la Recherche et de l’Innovation, dans le cadre
de la Bibliothèque Scientifique Numérique (BSN). Le Schéma d'Orientation stratégique
s'appuie sur le projet national de la BSN, dont le programme observe : "Le secteur de
CNRS – Direction de l’Information Scientifique et Technique
30
l’édition scientifique a été totalement bouleversé par les nouveaux modes de diffusion du
savoir, à la fois sur les plans économique et heuristique.(…) Aux médiations
traditionnelles a succédé un ensemble d’usages qui méritent d’être encouragés tout en
conservant la liberté indispensable à l’exercice scientifique et la qualité des protocoles de
validation de la production scientifique". Le Chantier BSN 7 mène dans ce sens une
veille globale sur l'Edition scientifique numérique et a mis en place la ressource nationale
qu'est le Collège de l'Edition numérique scientifique. Une enquête nationale est lancée
sur l'Edition scientifique : le CNRS y participera activement.
Une vision générale à l’écoute des chercheurs et qui sert leurs intérêts
■ Le CNRS, en tant qu’acteur possédant une vision globale de l’écosystème scientifique
des chercheurs, producteurs et consommateurs d’IST français, adresse donc à tous ses
partenaires ce document afin de focaliser les attentions sur les points stratégiques qui
constitueront les leviers numériques et éthiques d’encadrement de l’IST dans les années
à venir. Le champ d’action de la Direction de l’Information Scientifique et
Technique du CNRS est donc orienté vers la collecte des requêtes émanant des
différents acteurs de l’IST, la définition des limites des périmètres de cette dernière, ainsi
que la formulation de recommandations dans la mise en œuvre de la formation, des
outils eux-mêmes, et de l’application des normes juridiques. Cette approche, fondée sur
l’interdépendance des communautés de chercheurs et la mutualisation de l’IST
dans les UMR, par-delà les frontières des institutions, repose à l’amont sur la BSN,
l’Association des directeurs et personnels de direction des bibliothèques universitaires
(ADBU), le Consortium Couperin, sur l’Agence bibliographique de l’Enseignement
Supérieur (ABES), qui acquièrent les ressources et analysent l’évolution des modèles de
collaboration et de publication. Ces partenaires sont en relation étroite avec le CNRS,
notamment à travers le projet ISTEX.
Contre l’effet « page blanche » : une méthode tenant compte de l’existant, des
efforts déjà entrepris
■ Le projet stratégique du CNRS doit prendre en compte et s’inclure dans les projets
déjà réalisés à la périphérie dans certaines CMUE, et créer des liens forts évitant les
doubles usages avec les projets de l’administration centrale. Il vise donc à poursuivre et
renforcer la formation et le partage, et à définir l’effort d’ouverture des perspectives qui
doit être mené par le groupe de travail sur le Guide d’Application de la LPRN, afin de
permettre la mise en œuvre forte et complète de cette Loi, et plus largement la mise en
cohérence des démarches entreprises par chaque acteur. En effet, tous ceux qui font
CNRS – Direction de l’Information Scientifique et Technique
31
avancer l’état du progrès technique des outils de l’IST doivent pouvoir réfléchir et agir au
sein d’un cadre mettant en commun les intérêts des différents secteurs publics et privés,
dans la sérénité et la coopération.
■ Le CNRS consulte et forme, d’abord, puis il construit lorsque la solution publique est
optimale, et enfin il co-gère si cela est nécessaire. Le principe général de son action
répond en quelque sorte à l’idée selon laquelle donner un poisson ne nourrit qu’une fois,
quand apprendre à pêcher nourrit toute une vie.
■ La problématique de l'accès à l'IST et des services offerts aux communautés de
recherche doit être abordée par une double entrée : celle du national pour offrir une
vision partagée par tous les acteurs de l'ESR et pour offrir des outils mutualisés (dans
leur conception ainsi que leur gouvernance) mais aussi celle du local afin d'exploiter le
potentiel de la proximité de terrain, de la connaissance des champs de recherche et des
besoins exprimés par les chercheurs. Ce dialogue permanent entre local et national doit
s'exprimer dans la notion de "réseau" qui a déjà fait le succès des réussites françaises
en matière d'IST (Couperin, ABES, unités régionales de formation à l’IST (URFIST)...).
CNRS – Direction de l’Information Scientifique et Technique
32
1. CONSTAT : Des attentes partagées entre les
nouveaux acteurs de l’IST : Une dynamique pour la
science
Le besoin d'être formés à
l'interaction avec l'IST
Un besoin d'accéder pour
un prix modeste à ces
larges fonds
documentaires
Un besoin d'unification des
outils, aux utilités
aujourd'hui superposées
1.1. Une nécessité commune : Ouvrir et simplifier les conditions
d’accès
La crainte réaliste d’un éparpillement des outils et supports de l’IST
Les utilisateurs principaux de l’IST font état d’une trop grande ramification des
supports, et d’une complexité de certains outils, conçus pour une prise en main
spécialiste plutôt que pour un usage généralisé. La gouvernance des projets d’IST
présente des modalités très différenciées d’une communauté de recherche à l’autre et
s’appuie sur un potentiel de service dont le trio « informaticien, documentaliste,
chercheur » est la forme de base, avec des déclinaisons. Le partage des données de
l’IST et de la somme monumentale de connaissances qu’il suppose ne peut être permis
que dans un environnement de travail où l’offre est modulable, adaptable aux besoins de
chacun, et surtout organisée ; c’est-à-dire que l’ensemble de l’IST disponible à un
moment t pour une personne x doit être visible par x en t.
Un engagement partagé en faveur du libre accès (Open Access) et d’une Science
Ouverte
Par la Déclaration de Berlin, le CNRS s'engageait en 2003 dans la voie du libre-accès
aux résultats de la recherche publique, position réaffirmée par les « Position
statements » dans le cadre de ScienceEurope en 2013. Dans le même sens, la
Recommandation aux états membres de la Commission Européenne en 2012, s'impose,
tout comme la position ministérielle précitée de 2013 et les recommandations du G8.
Depuis dix ans, les déclarations, initiatives, créations d’archives ouvertes et de journaux
en Open Access se sont multipliés. L’INIST a mis en place un outil de veille fort complet,
« Libre accès à l’information scientifique et technique », qui permet de suivre cette
CNRS – Direction de l’Information Scientifique et Technique
33
dynamique. Le Centre pour la Communication Scientifique directe (CCSD), dès sa
création, a toujours mené des actions de communication, formation et promotion de
l’Open Access auprès des communautés professionnelles et scientifiques. L'enjeu global
est considérable aussi bien du point de vue du partage des bénéfices de la recherche
que de celui des conditions de production de la science, entravée qu'elle est aujourd'hui
par les multiples péages qu'imposent les entreprises qui contrôlent les divers stades de
la publication d'un grand nombre de disciplines. Cet Open Access doit trouver ses
racines dans une culture de la donnée partagée, qui s’appuie sur la formation et sur des
logiques de coopération entre les différents acteurs.
1.1.1. Le besoin d’être formés à l’interaction avec l’IST, et informés de ses
évolutions
La nécessité de former aux nouveaux usages de l’IST en s’appuyant sur des
ressources humaines fortes et variées organisées en réseaux
Face à tous ces outils et à la possible unification, l’existence de ces dispositifs
n’est d’aucune utilité si elle n’est pas suivie (ou précédée) d’une formation pour les
personnels de l’IST mais surtout de recherche (doctorants, chercheurs…), afin qu’ils
aient connaissance de ces services et qu’ils sachent les utiliser. C’est donc une
sensibilisation qui est nécessaire pour tous les acteurs de la recherche en même temps
que la création du COPIST, ainsi qu’une communication sur ces outils. Cette question
de la formation mène aussi à une interrogation sur les ressources humaines
nécessaires pour le COPIST et son information auprès des personnels : qui le fera ?
Dans quel cadre ? Avec quel personnel ?
■ Le CNRS bénéficie du concours d'un personnel formé aux actions d'IST, et relevant de
plusieurs familles professionnelles, dont la révision est en cours au MESR avec le
concours actif du CNRS (OMES). L'Organisme bénéficie par ailleurs des synergies
qu'occasionne la mise en réseau très dynamique de ces personnels, notamment dans
les réseaux nationaux que sont : Renatis, Medici, RBDD, RNBM, Démocrite et
Docplanets. Ces réseaux ainsi que les divers réseaux régionaux et thématiques des
personnels, sont particulièrement présents dans la réflexion nationale sur le devenir de
l'IST.
CNRS – Direction de l’Information Scientifique et Technique
34
Source : analyse technico-budgétaire Ourouk 2015.
■ Cette réflexion, il est vrai, rejoint pour eux la préoccupation professionnelle
d'évolutions de carrière et de qualification qu'impose l'évolution des modèles
économiques et technologiques de l'IST. Dans ce contexte, les Réseaux ont pu apporter
au CNRS, à la fois, l'expérience très riche et diversifiée de personnels présents dans
toutes les communautés de la recherche, mais aussi, de façon particulièrement
opportune et bénéfique, une expertise à jour sur les nouveaux modèles de l'IST,
notamment ceux associés aux données de la recherche.
■ Au 31 décembre 2012, les personnels d'IST travaillant au CNRS présentent un large
éventail de compétences, avec les caractéristiques globales suivantes :
CNRS – Direction de l’Information Scientifique et Technique
35
➢ un personnel conséquent (770 ITA CNRS et 132 non CNRS) clairement identifié
IST (familles A et C de la BAP F2)3,
➢ des personnels n’étant pas identifiés IST mais assurant des fonctions
informatiques indispensables à l’IST (certains personnels de la BAP E
notamment) ou travaillant spécifiquement en IST pour un institut scientifique très
spécialisé (certains personnels des familles A, B et C de la BAP D4 par exemple),
➢ des personnels de niveau élevé de qualification (la moitié environ des personnels
CNRS de la famille A de la BAP F est IE-IR) et ayant souvent une double voire
une triple compétence (scientifique, informatique, IST) ; des profils très variés :
certains IR, (mais aussi AI et IE, selon l’INSU), effectuent la saisie des
publications, selon l’INEE ; les correspondants IST en SHS sont le plus souvent
des ITA BAP F mais il y a également des BAP D et des chercheurs.
■ Ce personnel, composé en majorité de femmes, est inégalement réparti au sein des
Instituts comme entre les unités. La moitié environ des personnels engagés dans les
activités d'IST a plus de 50 ans, avec localement des disparitions progressives de la
fonction (dans les UMR INSU notamment). Des exemples pionniers, comme celui du
CDS, montrent l’impact important de documentalistes de la BAP F formés à la prise en
charge des données scientifiques dans la mise à disposition des résultats de la
recherche.
■ Il y a là un chantier stratégique RH à bâtir autour de la formation, de l’évolution des
métiers et du développement des carrières, les trois notions étant liées. La question du
devenir des personnels de moindre qualification est une question sensible et importante.
La difficile mise en place de synergies en raison du localisme des formats et
supports, et de la préférence pour d’autres offres de formation
■ L'enquête de la DIST rejoint l'opinion établie selon laquelle il y a localement une
difficulté à mettre en synergie les compétences des professionnels de l’IST et les
besoins des chercheurs : l'idée a été souvent exprimée que ces deux catégories
d'acteurs de l'IST avaient le besoin d'approfondir, voire de renouer, une relation de
collaboration efficace, à l'initiative des directeurs d’universités (DU). Les personnels
2 BAP F : Documentation, édition, communication. Famille A : IST, collections patrimoniales. Famille C : édition multi supports, impression, graphisme. 3 Source : Labintel au 31/12/2012, traitement CNRS / SAPPS 4 BAP D : SHS. Famille A : traitement et analyse de bases de données. Famille B : traitement, analyse et représentation de l’information spatiale. Famille C : analyse de sources écrites, iconographies et orales.
CNRS – Direction de l’Information Scientifique et Technique
36
expriment nettement le souhait de faire évoluer leurs carrières et leurs qualifications au
service de l'IST.
■ A l’heure numérique, il existe en effet une grande diversité de systèmes utilisés pour
traiter l’information ; en découle donc une immense variété de formats, qui rend
l’interopérabilité difficile et empêche l’élaboration aisée de visions d’ensemble claires. La
formation aux usages de l’IST est actuellement assurée par différents acteurs ; le réseau
Renatis, celui des URFIST, avec l’INIST et la DIST au cœur du système. Mais sans
sensibilisation et une meilleure hiérarchisation des méthodes de formation et priorité,
répartissant agilement les charges financières sur les différents acteurs, l’offre de
formation reste largement inutilisée et donc inefficace, ce qui est dommageable étant
donné son coût. Une certaine préférence semble aller aux formations externes Zotero
plutôt que Mendeley. Certains directeurs d’UMR estiment également que la France n’a
pas besoin d’une formation nationale, trop coûteuse, et croient davantage à une offre
basée uniquement sur des formations locales.
L’évidence exigeante d’une formation permettant de déléguer les tâches IST en
amont
■ Pour le moment, des initiatives « manuelles » de mise en cohérence des formulations
ont été élaborées, par exemple par la mission Etalab qui modifie les formats natifs des
données brutes afin de les agréger à l’échelle nationale. Mais une mise en cohérence à
la source, rationnalisée et automatisée le plus possible, constitue l’étape suivante
nécessaire pour obtenir un système national français de collecte des données compétitif.
En 2016, il ressortait de l’enquête conduite auprès des DU que 26% seulement utilisent
conjointement un système de gestion de base de données tel que 4D, Oracle ou Access,
et un tableur tel qu’Excel afin de proportionner l’outil au traitement, tandis que 14%
utilisent un système de gestion complexe seul, et 19% un tableur seul. Il faut encourager
la pratique d’un rapport à la donnée systématique et dénué de craintes quant à la
conformité ou non de la méthodologie utilisée ; en effet, contraindre trop fortement les
normes d’archivage peut conduire à ce qu’une partie importante des opérations d’IST
soit faite en version papier, voire sans laisser de traces.
De l’information...
CNRS – Direction de l’Information Scientifique et Technique
37
■ Avant tout, un préalable est donc de faire connaître l’existant ; à l’heure actuelle,
seules 50% des unités de recherche disposent d’un logiciel de traitement spécifique lié à
ses expérimentations, dont une moitié en format propriétaire et l’autre en format
interopérable. Les 50% restants déclarent « ne pas savoir », soulignant le manque
d’information à ce sujet. Le principe même du DMP promu par (CAT)OPIDOR
(Optimisation du Partage et de l’Interopérabilité des Données de la Recherche) est
ignoré de nombreux chercheurs, qui ne parviennent pas à en discerner l’utilité concrète
au vu des informations actuellement communiquées. Aussi un vrai travail
d’intéressement doit-il avoir lieu, en prenant des exemples concrets de l’apport du DMP
pour chacun.
… vers la rationalisation et le partage de standards communs
■ Il convient donc ensuite d’observer à quel point ces usages ont été rationnalisés
autour de formations et de guides encadrant les bonnes pratiques. On observe
également une difficile mise en cohérence des procédures standardisées. Ainsi, lors
de l’enquête auprès des DU, 24% déclaraient partager une procédure élaborée et
partagée par toute la communauté scientifique en ce qui a trait aux formats de données,
mais seulement 5% pour la méthode de collecte, 2% pour les descriptifs (métadonnées),
et 11% pour l’attribution d’identifiants (DOI) et l’usage d’un vocabulaire unique. 45% de
142 unités signalent encore « ne pas collaborer en interne en ce qui concerne les
données et l’IST ».
■ Seules 16% des unités de recherche ont élaboré un plan de gestion de données. Il y a
donc un enjeu dans la construction d’un programme national cohérent et
interdisciplinaire de préservation du patrimoine scientifique, incluant un archivage
pérenne. Ce programme vise deux facettes de la même médaille, qui concourent à l’IST
et en constituent l’essence ; récupérer et sécuriser l’ancien, et sauvegarder
systématiquement le nouveau. Des outils, des guides de pratiques, des sessions de
formation et des ateliers (workshops) communs sont autant de solutions envisagées pour
dépasser la portée normative faible des simples réunions.
■ Les ingénieurs européens et european project managers ainsi que les valorisateurs de
données IST fonctionnant en points-relais nationaux sont actuellement la première ligne
d’assistance lorsqu’un chercheur ne sait pas comment utiliser OPIDOR pour générer un
plan de gestion de données efficace et complet. Il en va de même pour beaucoup de
domaines, où le seul référent (à l’adresse mail / numéro de téléphone parfois peu visible)
CNRS – Direction de l’Information Scientifique et Technique
38
est un expert de l’IST très lointain dans l’organigramme socioprofessionnel. Or, cet état
de fait occasionne deux effets négatifs ;
- D’une part, une désincitation (le chercheur ne sait pas qui contacter / n’ose pas
déranger un professionnel expert n’ayant aucun lien direct formel avec lui, et
abandonne sa tâche IST)
- D’autre part, les ingénieurs et managers concernés encourent un risque
d’engorgement de leur temps de travail par des tâches de conseil qui ne figurent
pas sur leurs fiches de poste à la base, si la communication était plus large ou
l’effet désincitatif pour les requérants moins lourd.
■ La formation est un enjeu-clé pour préparer les différents programmes destinés aux
Unités de Recherche et les rendre réalisables ; en effet, ils ne peuvent se fonder que sur
l’action quotidienne et normée, en amont, de chaque chercheur de l’IST, et non sur une
régulation centralisée. A ce titre, les formations à distance sur la gestion, la préservation,
le partage et la diffusion en libre accès des données de rechercher (DoRANum, BSN)
ont porté de premiers résultats encourageants.
En amont : les solutions partielles pour la veille documentaire et le signalement
des ressources
■ La question du signalement des ressources, évoquée fréquemment, semble poser
problème ; le chercheur français ne peut accéder de façon simple, en une action unique,
à l’ensemble des ressources auxquelles il peut prétendre de droit. En effet, ces dernières
sont localisées sur différents supports, qui ne veulent pas toujours voir les résultats
produits par leurs algorithmes de recherche proposés sur une seule et même page,
malgré le risque de doublons que cela comporte. Ce problème de simplicité des usages
est intimement lié aux tensions de concurrence commerciale entre fournisseurs de
support, et s’étend aussi aux usages des citoyens.
■ La veille et la recherche documentaire (service 4.1.) constituent la première étape
de tout travail scientifique approfondi. Pour ce qui est de la veille informationnelle, ce
service existe déjà au niveau local, notamment à l’échelle des Universités, et cette
échelle semble adaptée en raison tant de l’aspect personnalisable du service que de la
forte inertie des habitudes, en dehors de perspectives de mutualisation d’outils de veille
informatique pour permettre des économies d’échelle. L'INIST offre un dispositif de veille
avec notamment deux sites de qualité : http://www.donneesdelarecherche.fr et
http://openaccess.inist.fr. Les évolutions ont visé à situer ce dispositif au cœur de la
CNRS – Direction de l’Information Scientifique et Technique
39
démarche IST du CNRS et de ses partenaires, pour en faire l'outil de toutes les
évolutions en cours, vers des "connaissances mieux partagées".
En aval : l’analyse de l’IST, dont la bibliométrie, est encore fragilisée
■ Le service 4.2 réalise des études bibliométriques destinées à caractériser l’activité
scientifique d’une structure de recherche au travers de sa production scientifique, son
réseau de collaboration, son positionnement dans une thématique particulière... Les
services 4.2. à 4.4. ont produit un résultat mitigé dans l’étude COPIST. Les
établissements disposant d’un service d’études bibliométriques (53% d’entre eux)
souhaitent le développer, mais mentionnent que « les seules données quantitatives
Scopus et Wos ne suffisent pas, et doivent même être relativisées ». Nombreux sont
ceux qui travaillent encore avec une majorité d’analyses de l’OST, et les différences et
complémentarités inquiètent. Cependant, pour les structures de recherche qui souhaitent
produire des indicateurs bibliométriques, une assistance peut être fournie à l’installation
et à l’utilisation de l’outil ezVIS, à partir de données propres et consolidées sur la
production scientifique d’un laboratoire ou de toute autre structure, d’un thème
scientifique particulier…
■ Dans cette catégorie d'offre nationale, la très grande infrastructure de recherche
(TGIR) Huma-Num avance l'idée de nouveaux services et d'actions pilotes, reposant sur
des relais de formation pour entrer de plain-pied dans le web des données, le linked
data. Le chantier est essentiel. "Le travail de structuration des acteurs nationaux offrant
des formations sera décisif (Huma-Num, INIST, CCSD notamment). Les initiatives
développant des guides de bonnes pratiques (Huma-Num, Centre pour l’édition
électronique ouverte (Cléo), BSN) doivent être non seulement encouragées mais
également reprises à d'autres échelles" souligne le Cléo.
Des plannings chargés, desquels déduire le postulat d’une formation actualisée,
peu chronophage
■ Il existe donc un vrai besoin d’actualiser sur le long terme les compétences. Les
tutoriels (service 5.6.) sur le libre accès aux résultats de la recherche dans le cadre
d’H2020 sont difficilement intégrés dans les plannings souvent chargés des
chercheurs, d’autant qu’ils se présentent comme une entité optionnelle et formellement
bien distincte des autres domaines de recherche du chercheur, malgré le caractère en
réalité central de l’IST dans tous ces domaines. L’intégration d’un onglet permanent
CNRS – Direction de l’Information Scientifique et Technique
40
« Formation IST » renvoyant au répertoire des ressources de formation au sein des
plateformes (supports) d’Open Access serait à ce titre souhaitable.
1.1.2. Accéder de façon sûre à de larges fonds documentaires et outils d’analyse
au meilleur coût
Les chercheurs expriment des besoins forts de recherche, d’analyse et
d’accompagnement dans le champ de l’information, et particulièrement de l’IST. Face à
des besoins en ressources très distincts selon les secteurs de recherche, les besoins en
services sont eux sensiblement similaires.
Les guidelines et le cadrage juridique ; une première brique cruciale
■ Ce besoin d’accéder et de prendre en mains l’IST passe d’abord par la demande d’un
cadre juridique stabilisé. Outre le besoin général de connaître le droit applicable à
chacun, connaître les ayants droits sur les documents et les droits dont ils disposent est
nécessaire, mais également organiser les cessions de droit et assurer les conditions
d’une diffusion en open access. Pour les questions relatives à l’identité numérique, il est
donc nécessaire de disposer de conseil et de directives précises pour les chercheurs :
doit-on proposer de la formation ou encore proposer des outils spécifiques, utiliser des
réseaux sociaux ? Le rôle de l’institution est essentiel pour forger les bases de
production et de partage d’une IST numérique. La DIST soutient le principe d’une action
européenne d’accès à ces outils via des guidelines.
Le non-recours au dépôt dans HAL
■ Les portails individuels apparaissant dans l’archive ouverte HAL sont suffisants,
notamment pour les petites structures comme les grandes écoles par exemple. Le portail
institutionnel est toutefois insuffisant dans certains cas. Les dépôts sont souvent faits sur
des portails spécifiques (tels que les archives ouvertes institutionnelles des
établissements) mais sont ensuite liés à HAL par le protocole de renvoi. La V3 de Hal a
été mise en ligne et apporte des améliorations. Elle permet la mise à disposition de
nouveaux formats de publication (comme les vidéos). Toutefois, HAL est encore sous-
utilisé et fait l’objet d’un non-recours important bien que difficile à estimer. Dans
certaines communautés les chercheurs jugent avoir autre chose à faire que de déposer
leurs publications dans une archive, surtout si des saisies ont déjà été faites par ailleurs
(notamment archives disciplinaires). Ainsi, l’INEE, qui alimente HAL, observe que toute
la production scientifique n'y est pas recensée, que le service rendu se limite
CNRS – Direction de l’Information Scientifique et Technique
41
actuellement aux recensements des publications précédemment déposées. De plus, il
est critiqué pour le manque d’homogénéité des dépôts, l’absence de typologie unifiée
des documents, la difficile intégration des métadonnées, et les erreurs d’affiliation (dans
le cas d’une double affiliation réelle d’un chercheur notamment) la mauvaise gestion des
doublons. L'institut national de physique nucléaire et de physique des particules (IN2P3)
exprime, tout comme les autres Instituts, une option de principe favorable au dépôt
dans HAL, (l'institut des sciences de l’ingénierie et des systèmes (INSIS) et l’institut des
sciences biologiques (INSB) expriment des réserves). L’institut des sciences humaines
et sociales (InSHS) soutient quant à lui fermement le dépôt dans HAL.
Une équation sous contraintes financières et budgétaires, ne devant pas prendre
le pas sur la qualité des ressources
■ Le partage des ressources électroniques payantes sur une plateforme est une
équation sous contraintes financières. Les chercheurs utilisent déjà ezPAARSE pour
analyser l’utilisation des ressources auxquelles ils sont abonnés, et donc de restreindre
les dépenses à celles parmi ces ressources qui sont vraiment consultées. Cependant il
faut éviter la formation d’un fait majoritaire absolu, et tenir compte d’une lacune dans
le sens inverse, c’est-à-dire les ressources qui répondraient à un besoin existant mais
ne sont pas présentes dès le début, voire celles qui pourraient permettre de former de
nouveaux besoins.
■ Certains établissements aimeraient des améliorations (retrait des documents,
moissonnage, fonctionnalité de dépôt plus légère pour le chercheur). Le coût d’entrée
fort est aussi mis en avant comme un obstacle et un poids. En matière de statistiques
approfondies, la plupart des acteurs précisent qu’ils seraient intéressés fortement pour
être utilisateurs de tels outils, mais n’ont en aucun cas la capacité financière de
participer à leur construction ou à leur gestion. Cependant, à côté de ce constat amer, la
connaissance du public Ifsttar par certains partenaires a créé des réticences à
l’ouverture de l’analyse IST à la concurrence.
■ Le service IST est généralement considéré cher par rapport à l’efficacité des délais.
Conjointement, il est également nécessaire de faire passer la Recherche française à des
factures, notes et communications dématérialisées, le format papier étant polluant et ne
permettant pas un archivage et une fouille de données approfondie a posteriori.
Une grande variété de plateformes correspondant en partie à une variété de
formats
CNRS – Direction de l’Information Scientifique et Technique
42
■ Les résultats des questions 56 à 58 de l’enquête COPIST montrent que les données
les plus recueillies par les chercheurs sont des données brutes d’observation (issues
directement d'instruments scientifiques) (30% du volume total, et la plus grosse part, les
autres types de données étant très diversifiés), et ce qu’elles soient d’enquête,
expérimentales, ou de simulation. Le format le plus commun est la donnée chiffrée
(65%), loin devant les textes (25%), les images et les vidéos (10%), le plus courant étant
concrètement l’association de plusieurs de ces formats au sein d’un même dossier. Ces
raw data sets sont à 24% sous format interopérable, et à 12% sous format
propriétaires ; à noter que 42% des correspondants IST interrogés ne connaissent pas
la nature du format des données hébergées par leur institut ou unité.
■ RefDoc (COPIST, service 1.2., questions 8&9) est un service de fourniture de
documents scientifiques et techniques à la demande. Les interrogés en disent qu’il
« n’est pas énormément utilisé mais est satisfaisant. Il offre une bonne complémentarité
avec l’accès interne ».
■ Le service 5.4. (« Plateforme de services pour le stockage, le traitement, l’exposition,
le signalement, la diffusion et la conservation des données de recherche en SHS »)
soulève une limite, en précisant qu’Huma-Num ne peut combler, sur le long terme,
l’ensemble des besoins relatifs aux données de la recherche de l’établissement. A ce
titre, il pourrait se positionner comme tête de réseau pour la mise en place d’outils et de
plateformes locales. Il serait par ailleurs urgent de développer une offre à destination des
institutions pour le stockage et la conservation, articulée avec l’offre de service
développée localement pour la diffusion. Un verbatim précise : « On sent cependant qu’à
mesure qu’Huma-Num va gagner en visibilité, ces services seront sans doute de plus en
plus sollicités, avec une capacité moindre de ses équipes à répondre aux sollicitations
des partenaires. Par ailleurs, un des éléments forts actuellement de la grille de service
de la TGIR est sa gratuité. Si à terme, devant l’afflux de demandes, tout ou partie de ces
services devenaient payants (notamment le stockage des données), il n’est pas certain
qu’ils ne soient pas délaissés au profit d’autres solutions. »
1.1.3. Le paysage de l’IST française : un territoire en interaction forte mais
morcelé, proposant des solutions inégalement ouvertes
Le paysage français de l’IST est très complexe et s’inclut dans des logiques
européennes comme locales, mais il est possible de le synthétiser comme suit en
prenant en comptes un tryptique regroupant premièrement ceux qui font usage de l’IST
CNRS – Direction de l’Information Scientifique et Technique
43
(la recherche), deuxièmement les outils IST et leurs producteurs (les services) et
troisièmement ceux qui légifèrent et réglementent l’IST par des normes d’encadrement
(la régulation).
Une politique nationale de l’IST : le CNRS au cœur d’une gouvernance partagée
Au terme de réflexions et d'évaluations nombreuses auxquelles le CNRS a été
constamment associé, la France s'est dotée d'une politique nationale d'IST numérique.
Sous l'autorité du MESR, la Bibliothèque Scientifique Numérique (BSN), avec ses 10
CNRS – Direction de l’Information Scientifique et Technique
44
Chantiers actuels5, permet d'accompagner les développements en cours de l'Edition
scientifique en intégrant ses fonctionnalités complexes dans une approche globale. Le
CNRS, qui est présent dans tous les Chantiers de la BSN à travers 24 experts, a fait
récemment état de son analyse et de ses observations sur l'évolution en cours de la BSN
: le Schéma d'orientation stratégique de l'IST du CNRS prend appui sur ses ressources
et sur ses projets, notamment grâce à l’INIST.
■ La coopération et le partage via le COPIST interroge néanmoins la place du CNRS.
Un côté hégémonique traverse les critiques. C’est donc le dialogue entre acteurs de
l’IST qui doit prédominer dans la constitution d’un tel catalogue. Cette coopération
interroge aussi la différence de taille des établissements. Un seuil critique apparaît
pour les petits établissements. Comment sera-t-il possible de lier les besoins et les
capacités de chacun ? La coopération questionne aussi la gouvernance et le
financement d’un tel partage. Comment s’organise le financement d’un tel projet ? Quel
est le coût individuel pour chaque acteur ? Surtout, qui prend la charge de la gestion du
projet ? Une invitation à une gouvernance partagée est lancée, qui diminuerait le poids
de la gestion centralisée par le CNRS.
Centraliser, décentraliser…
■ L’arbitrage doit s’établir entre les économies d’échelle permises par la centralisation,
et les captations plus efficaces des requêtes et besoins émanant de chaque individu
permises par la décentralisation. Cette présentation de l’arbitrage rejoint les théories de
la zone monétaire optimale et de la taille optimale des organisations. Doivent en être
écartés les sous-arbitrages créés par des tensions particulières entre individus
ralentissant l’optimisation du système IST français. A quoi doit dès lors ressembler la
participation de chaque établissement ? Cette implication concerne les acteurs
nationaux, mais une ouverture européenne, voire internationale ne serait-elle pas
envisageable, voire nécessaire, pour porter un projet plus conséquent et encore plus
pertinent ?
Les convergences de positionnement des Instituts sur certains points
■ Du côté des instituts, les opinions convergent sur certains points et divergent
partiellement sur d’autres ;
5 Le CNRS y est représenté par 24 experts, présents dans tous les Chantiers de la BSN.
CNRS – Direction de l’Information Scientifique et Technique
45
- L'INEE l'observe, il y a une surabondance d’informations : il faut bien y distinguer
les flux "entrants" et les flux "sortants" d'IST, pour lesquels les problèmes se
posent de façon distincte. Quelle est la bonne solution d'accès à l'IST aujourd'hui
et demain ? Plusieurs sources d'IST ou une source unique regroupant les
autres ? Il n'y a pas de cohérence d’ensemble et il faut la rechercher : le CNRS a
la capacité d'y contribuer, ce qui nécessite de prendre du recul.
- L'institut de chimie (INC), suivie en cela par une majorité d'Instituts, se montre
favorable à une approche analytique et stratégique des publications des Instituts,
par la mise au point d'outils appropriés de métrique. L'INEE a mené une première
expérimentation dans ce sens.
- L'IN2P3 et l’institut national de physique (INP) préconisent ensemble, à travers
des initiatives comme SCOAP3, le besoin d'aller vers le libre-accès par une
démarche globale construite à partir d'expérimentations immédiates, solides et
partagées.
- A l'institut des sciences de l’information et de leurs interactions (INS2I), on voit se
dessiner l’idée qu’il faudrait une fonction d’appui à l’ensemble de la recherche
d’outils et de modélisation des sources de données et de publications.
- L'INSIS souligne la nécessité d'explorer de nouveaux domaines scientifiques à
l’échelle du monde, de développer une veille et de la bibliométrie pour entrer en
profondeur dans la maîtrise des outils de la valorisation, des brevets notamment,
et de remettre à plat pour cela l'analyse des dispositifs nationaux existants.
- L'INSB fait état d'une relation construite à la fois sur le recours aux archives
ouvertes (PubMedCentral), sur la publication systématique dans les grandes
revues internationales, sur l'accès à de grandes bases de données : de
nombreuses questions éthiques et juridiques posées dans les sciences de la vie
mériteraient une approche construite au niveau du CNRS.
- L'INSHS souligne le besoin de repères partagés, de règles communes, dosant
l'incitation et l'obligation, fondant le partage de l'IST sur une vision claire des
modèles disponibles et accessibles à court et à moyen terme sur les grands
thèmes stratégiques de l'IST. Une feuille de route est nécessaire, pour les
chercheurs comme pour les professionnels de l'IST, par-delà les affirmations de
principe, de façon à faire progresser les grands dossiers comme le libre-accès,
l’accès à l’information scientifique et la valorisation de la production scientifique.
- L'institut national des sciences mathématiques et de leurs interactions (INSMI),
qui recommande la construction d'une approche numérique intégrée et globale de
l'IST (de l’édition à la recherche de données), constate qu'il y a nécessité de faire
CNRS – Direction de l’Information Scientifique et Technique
46
progresser et de partager les connaissances sur les structures de données, sur
l'hétérogénéité des observations, condition de base pour le développement des
informations produites par l'IST. Pour autant, il est nécessaire de faire cohabiter
dans la durée (et donc de financer) les bibliothèques papier et les spécialistes de
ces documents avec les nouvelles bibliothèques numériques sous leurs diverses
formes.
- Pour l'INSU, il faut construire des « piliers solides » pour faire vivre la
transversalité et l’adhésion des disciplines. Il organise par exemple ses services
de données des Sciences de la Planète en "pôles de données" thématiques, en
collaboration avec les autres organismes impliqués (CNES, Ifremer, etc…), et a
nommé un chargé de mission pour suivre la problématique des données à
l’échelle de l’Institut.
Une carte des réseaux se superposant à la carte des acteurs
■ Des réseaux métier très actifs existent :
➢ au niveau national (Renatis, Medici, RBDD, URFIST)
➢ au niveau régional (ARPIST, GO!Doc, Isidora, Mistral, Doccitanist, etc…),
➢ thématique (Démocrite, RNBM, Docplanets…).
Ces Réseaux se concentrent sur les problèmes relevant des évolutions du métier, de la
prospective en IST et de l'adaptation des outils, des compétences et des services
proposés aux chercheurs. Ces aspects sont notamment traités à travers les actions de
formations, comme les FRéDoc6, les ANF ou les groupes de travail. Les offres de
formation sont nombreuses et diversifiées sur le plan interne au CNRS (INSHS,
opérateurs IST) comme externe (URFIST notamment). Les Instituts ont une pratique de
formation qui peut être partagée, comme celle de l'InSHS, qui met en place 4 à 5 ANF
par an.
■ Le CCSD a été créé en 2000 pour permettre la communication directe entre
chercheurs. Par le dépôt de sa communication scientifique sous forme d’article dans
l’archive ouverte HAL, le chercheur met l'IST à disposition de la communauté globale. Le
CCSD a évolué d’UPS en UMS et le dispositif d’archive institutionnelle HAL (hyper article
en ligne) a été redéfini dans la convention inter-établissements signée le 2 avril 2013 par
un ensemble de partenaires représentatifs de tout l'ESR. Le CCSD a comme fonction de
mettre en œuvre la stratégie du CNRS en termes d’archives ouvertes et son expertise à
6 FRéDoc 2013, par exemple, sur le thème de "Gestion et valorisation des données de la recherche".
CNRS – Direction de l’Information Scientifique et Technique
47
disposition des établissements de l’ESR. Sa mission principale est centrée sur le
développement, l’exploitation et l’évolution des archives ouvertes HAL, Thèses en Ligne
(TEL) ou encore MédiHAL. Le CCSD entretient de forts partenariats avec l’ABES, le
CINES, Huma-Num, Le Cleo, l'INRIA. Les projets du CCSD sont conçus et menés dans
l’optique de favoriser le développement de l’Open Access. La France a fait le choix de
soutenir fortement la voie verte et HAL répond à cette politique en respectant notamment
les recommandations de l’initiative de Budapest (BOAI) dans la mise en œuvre de ses
archives ouvertes.
■ L'Agence Bibliographique de l'Enseignement supérieur (ABES), est un acheteur
public et un expert de premier rang, partenaire de tous les usagers de l'ESR.
■ Le Consortium Couperin offre un cadre stratégique complet pour une démarche
globale de négociation et de conseil dans la relation du monde scientifique (universités et
organismes de recherche) avec ses partenaires et ses fournisseurs.
■ L’UMS Persée a pour objectif d’être un opérateur national pour la mise à disposition
de la production scientifique rétrospective française, au service de la science en train de
se faire (élargissant ainsi le programme PERSEE porté par le MESR qui était initialement
principalement en direction des SHS, qui font elles-mêmes l'objet d'un investissement
spécifique avec la TGIR Huma-Num). Initié en 2003 par le ministère de l’enseignement
supérieur et de la recherche et confirmé en 2007, le programme national Persée a pour
missions la numérisation, le traitement documentaire, la diffusion et l’archivage
pérenne de collections rétrospectives de revues et de publications scientifiques
francophones (publications en série, actes de colloques) en sciences humaines et
sociales (SHS), dans une logique de diffusion gratuite et non exclusive. Le changement
de portage institutionnel et la mise en place d’une UMS réunissant des acteurs nationaux
et locaux offre l’opportunité de franchir une nouvelle étape pour le programme Persée et
de définir une nouvelle stratégie de développement à court et moyen terme, conciliant
des missions de portée nationale et un enracinement fort dans le pôle lyonnais
d’enseignement supérieur. Persée est fortement impliquée au sein de l’IR documentaire
BSN (BSN5) et sera amenée à participer à l’IR CollEX (Collections d’excellence…).
Persée s’attache à développer les Interactions avec les opérateurs français d’IST. L’UMS
partage des valeurs communes avec le CCSD, le Cléo et le programme NUMDAM de la
cellule MathDoc, notamment l’implication dans le mouvement de l’Open Access et par
conséquent, la diffusion ouverte de documents scientifiques ; il existe une
complémentarité forte entre l’UMS Persée et la TGIR Huma-Num.
CNRS – Direction de l’Information Scientifique et Technique
48
■ La TGIR Huma-Num met en œuvre une démarche globale pour les SHS : la TGIR
porte en effet l’ERIC (European Research Infrastructure Consortium) de Dariah (Digital
Research Infrastructure for the Arts and Humanities).
■ Des initiatives pionnières ont conduit au développement de politiques d'IST
cohérentes à l'échelle des organismes de recherche publics : regroupés dans
l'association EPRIST, les organismes de recherche mettent en commun leurs
expériences. Plusieurs grands établissements publics nationaux partagent ainsi les
avancées des plus engagés d’entre eux7.
L’arborescence de l’IST ; des services ayant émergé sans coordination globale, de
façon ramifiée, pour répondre à des besoins localisés dans le temps et dans
l’espace
■ De ce paysage morcelé, ont émergé de nombreuses plateformes et outils aux utilités
souvent superposées. L’IST française a grandi progressivement, sans coordination
nationale malgré les supervisions croisées pilotées depuis le CNRS, pour répondre à des
besoins locaux émergeant suite à des avancées techniques puis technologiques. Sa
croissance s’est faite à la manière d’un arbre sans tuteurs, et les différents acteurs et
outils présents aujourd’hui sont autant de branches et de feuilles qui résultent d’une
vie complexe cherchant à s’étirer vers les soleils divergents d’intérêts locaux pour
chaque secteur de la recherche. Aussi, il convient non pas de tailler cet arbre
abruptement et sans considérations particulières, mais bien plutôt de favoriser la
convergence de toutes ces branches en direction d’objectifs communs, en étayant
quelques-unes à la marge, et permettant des divergences de direction lorsqu’elles sont
nécessaires, afin de rééquilibrer la forme générale de cet arbre, pour éviter sa chute due
au déséquilibre de poids entre ses branches.
■ Une réponse à la question 117 du COPIST précise ; « Il y a beaucoup de dispositifs et
projets relatifs aux données de la recherche, aux corpus de recherche, à la numérisation
de sources, à la gestion d'archives... On ne voit pas bien la cohérence de l'ensemble, ni
l'articulation entre les projets proprement CNRS et les programmes ou instances
nationaux d'archivage comme le CINES (pour le MESR). » La coexistence initiale de
périmètres variables d’un établissement à l’autre ne pourrait a priori pas être effacée sauf
à ce que toute acquisition bascule en licence nationale. Un autre verbatim éclaire le sujet
7 L'INRA en particulier, mais également l'INSERM, l’Inria, l'IRD, le CEA, l’Irstea…
CNRS – Direction de l’Information Scientifique et Technique
49
de la sorte ; « Même avec un lien facilitant le passage entre les différents portails, le
maintien de deux niveaux d’accès serait indispensable. Le résultat de ce dispositif
risquerait donc de conduire à une complexification de l’accès alors que l’offre de
service actuelle présente déjà des limites en termes de lisibilité et de gestion. Quelle
subsidiarité ? »
De nouveaux projets qui fédèrent des ambitions diverses et méritent
approfondissement
■ La réponse à cette question a déjà été en partie apportée par l’intégration des résultats
bibCNRS et ISTEX dans Google Scholar, via un système de référencement en marque
blanche permettant, lors d’une recherche sur Google, de visualiser également les PDF
ISTEX et bibCNRS. Cette procédure d’intégration par référencement commun suscite
des craintes liées à la propriété et à la sécurité des données, dont certaines ne peuvent
être communiquées sans risque à une entreprise internationale. Néanmoins, elle
constitue un premier pas vers la simplification du point d’accès.
■ Le projet ISTEX (Initiative d’excellence de l’Information Scientifique et Technique),
dont le CNRS (DIST) est le pilote, vise en effet à offrir à l’ensemble de la communauté
de l’enseignement supérieur et de la recherche, "un accès en ligne aux collections
rétrospectives de la littérature scientifique dans toutes les disciplines". Ce projet s’inscrit
dans le programme "Investissements d'Avenir" (PIA) initié par le CGI ; l’ambition directe
d'ISTEX est de "renforcer la recherche et l'enseignement supérieur français sur la scène
mondiale"; ISTEX permettra par ailleurs de valoriser la politique d'acquisitions de
licences nationales, en rendant accessibles les collections courantes et les archives de
façon transparente.
■ Les besoins sont donc très variables au sein des laboratoires et les solutions doivent
être adaptées en conséquence, comme l'observe l'INEE. Certaines communautés
scientifiques sont bien organisées ou s’organisent en matière de gestion de données et
leur expérience peut être d’une grande utilité.
■ Le service Episciences.org (3.2.) condense quelques-unes des remarques les plus
polarisantes du COPIST. Il s’agit de publier des travaux encore en cours, et des résultats
pas totalement publiables en l’état. Beaucoup rappellent qu’il faut « sortir autant que
possible du modèle imposé par les grands éditeurs qui facturent des APC délirantes »,
mais d’autres estiment que les épi-revues ne sont pas prises au sérieux ni reconnues,
justifiant leur envie de pouvoir publier dans les plus grandes revues classiques. Ce
CNRS – Direction de l’Information Scientifique et Technique
50
modèle semble prendre difficilement. En sciences du vivant cela semble exclu de
diffuser ses résultats en amont d’une publication empruntant la voie « classique ».
PlosONE a actuellement la faveur de certains chercheurs, selon une observation issue
des études bibliométriques internes à l’Ifremer.
Des portails qui satisfont, mais qui sont appelés à fusionner
■ « Nous faisons le constat de la richesse des services proposés mais également d'une
certaine difficulté de lisibilité qui rend le paysage complexe pour un enseignant-
chercheur. Il serait par exemple intéressant de dépasser certaines segmentations
disciplinaires (SHS, Maths...) pour des objets et des services identiques (numérisation de
corpus de revues, diffusion de revues en ligne...) »8. Les portails actuels de
documentation satisfont les utilisateurs interrogés à 68%, et pourtant 71% sont
favorables à un regroupement et à des fusions de ces derniers ; est-ce-à-dire que les
chercheurs français en demandent trop ? En réalité, ce qu’il faut lire derrière ces chiffres,
et notamment derrière les 20% d’abstention aux deux questions, c’est que les supports
existants sont suffisamment complets en termes de ressources, mais les services
proposés (outils), notamment les filtrages approfondis de recherche sur critères, sont
perçus comme immensément améliorables par la perspective d’un tel regroupement.
Quelle offre apporter : vers une plateforme unifiée ? Selon quelles modalités ?
■ L’offre ne portant que sur les aspects de diffusion n’intéresse que peu les acteurs de
l’IST, qui cherche des supports offrant une palette d’outils intégrés correspondant à une
offre complète, allant de la recherche d’information (gestion des abonnements) à la
diffusion en passant par les PAO et la gestion des relectures. Le service I-Revues
semble faire double emploi avec d’autres plateformes telles que les archives
institutionnelles, Persée, ou encore les épi-revues… Le projet Numdam ne peut se
construire sans articulation avec COLLEX-Persée, et présente des insuffisances du point
de vue de l’ergonomie et de la diffusion.
8 Verbatim d’une réponse à la question 146 de l’enquête COPIST 2016.
CNRS – Direction de l’Information Scientifique et Technique
51
■ De façon générale, la sous-traitance est perçue comme une solution moins chère à
court terme mais insuffisante à long terme car ne garantissant pas ni l’autonomie à
moyen terme ni la sécurisation de l’IST locale à long terme. La dépense d’investissement
doit ici être privilégiée sur de menus frais de fonctionnement qui, mis bout à bout,
empêcheront le passage au numérique de la Recherche française. S’il est important que
l’établissement ait la maitrise de ses analyses et développe les compétences suffisantes
pour être autonome, la sous-traitance n’est pas une solution permettant une véritable
appropriation. Le développement d’une expertise commune par la formation et la
mutualisation de méthodes partagées est donc pleinement utile.
■ La mise en place d’une plateforme unique d’accès aux ressources pose cependant
des questions (COPIST, service 1.1., questions 4&6) ;
- « La création d’une telle plateforme rencontre majoritairement des problèmes
techniques et de gouvernance. Quel réalisme pour un accès unique et unifié ? »
- « Comment créer une offre unifiée pour tous les établissements ? »
- « Quelles ressources humaines pour gérer tous ces points ? »
- « Quelle gestion technique : les ressources négociées pour le personnel de
chaque unité sont-elles accessibles grâce à la reconnaissance des adresses
IPs ? »
■ Le projet OPIDOR participe à la migration de deux outils étasuniens permettant de
créer des plans de gestion de données (PGD, ou DMP Data Management Plan en
anglais) ; DMP Tools et DMP Online, vers un seul mutualisé. Le DMP n’est pas une
procédure souvent mise en place pour l’heure, mais il doit aussi être en marque blanche
pour permettre une forte interopérabilité, condition sine qua none d’une unification
fluide des supports.
■ A la question du portail unique, l'INC précise que, face à la nette augmentation de la
production scientifique, le numérique permet la facilité de transmission, l’instantanéité
mais aussi la multiplication des formats possibles (publications dans les revues,
production de données, logiciels, blogs, …). L'INS2I, l'INEE, l'IN2P3, l'INSB, l'INSIS
pratiquent les revues électroniques et n'ont pas d’appétence pour le papier. Mais l’INC
souligne également que les chercheurs ont accès à un nombre parfois trop élevé de
portails : le temps d’accès de recherche et de gestion des portails est une contrainte
supplémentaire dans l’accès à l'information. L'INSB, qui est utilisateur du portail
"BiblioVie" de l'INIST, a fait état des redondances de cet outil avec les portails des
universités et surtout celui de l'INSERM. La réponse apportée pour le moment a été une
fusion dans bibCNRS.
CNRS – Direction de l’Information Scientifique et Technique
52
■ La communauté mathématique travaille sur la mise en place d'un portail par le biais de
la cellule MathDoc, du réseau RNBM et du réseau Mathrice (informaticiens des unités de
mathématiques). Ce portail, conçu pour être un "portail à façon", spécifique à la
discipline, s'appuiera sur le hub de métadonnées des collections acquises ou utiles. Il
n'est pas conçu comme un concurrent au portail unique mais bien comme un
complément, s'appuyant sur des bases communes et offrant des services spécifiques à
la discipline plus large que les services documentaires (notamment des services
informatiques et collaboratifs proposés par Mathrice). Ce projet s'appuie sur l'expertise
de la cellule MathDoc qui a joué un rôle moteur dans un projet européen similaire
(EuDML).
Le résultat : une galaxie complexe avec laquelle il faut composer une symphonie
heureuse
■ Les différents acteurs de cette galaxie très complexe et ramifiée sont identifiés par les
branches et secteurs de l’IST qui correspondent à leur zone d’influence, et certaines de
ces zones d’influence se superposent. La difficulté réside donc dans le fait de ne pas
envoyer de signaux contraires, et d’éviter la mise en place d’une concurrence stérile
entre ces acteurs aux sources de financement et de hiérarchie certes divergentes mais
qui auraient bien plus à gagner dans l’application d’un effort commun. Le présent
document vise donc à apporter les premiers éléments d’une coopération horizontale
entre acteurs de l’IST, s’inscrivant au cœur de la stratégie nationale impulsée par le
Gouvernement, et la dépassant en démultipliant l’efficacité des décisions prises par
chacun.
1.2. Des besoins d’IST spécifiques à certains acteurs
En dehors des besoins communs qui peuvent être fusionnés en répartissant
l’effort et en dépassant les antagonismes de surface, certains besoins sont aussi
spécifiques à certains acteurs de l’IST. Il existe en effet des communautés scientifiques
moins organisées quant à l’IST. L’ADBU insiste beaucoup sur ce point ; certaines
communautés de recherche disposent de moins de moyens organisationnels, tandis que
d’autres utilisent les outils d’analyse avancée de l’IST depuis longue date.
1.2.1. Les spécificités des Unités de Recherche et Instituts
Partager le rôle de prestataire d’offres payantes du CNRS avec les COMUE
CNRS – Direction de l’Information Scientifique et Technique
53
■ La notion de gouvernance est précisée par les verbatims issus des réponses à la
question n°146 ; « Se pose la question du business model. Est-ce que le CNRS se pose
en prestataire d’une offre payante et se met alors en position de répondre à un appel
d’offres ? Quelle est alors sa plus-value par rapport à des offres existantes sur le
marché ? Le CNRS a-t-il un mandat du MESR pour proposer ce COPIST ? » mentionne
ainsi un répondant. Un autre précise que ; « le CNRS devrait, peut-être, plutôt se
positionner comme centre de ressources, comme pourvoyeur d'outils et comme
organisme dispensant des formations et des conseils pour les établissements et éviter
de se substituer à eux pour proposer des services qui ont tout intérêt à être développés
localement plutôt qu'au niveau national. »
■ Le CNRS a une offre de service mais les établissements proposent eux aussi un
service analogue, d’ailleurs gratuit dans beaucoup d’universités pour les unités de
CNRS – Direction de l’Information Scientifique et Technique
54
l’établissement. La question de la gouvernance pour la fourniture de documents est
posée. Elle ne peut être que partagée, et l’initiative des acquisitions pourrait être pilotée
conjointement, par un système en ligne agile, par le CNRS et les COMUE.
Mutualiser la formation de façon intelligente : UFRIST et INIST
■ Si la mutualisation est importante pour monter les formations, avec la place centrale
occupée par l’UFRIST, il faut prendre en compte les spécificités institutionnelles et les
besoins différents. Un verbatim précise ainsi : « Qu’un tel service soit porté par le réseau
des URFIST est très approprié. Que l’INIST en revanche se lance dans des projets de
formation à destination des professionnels de l’IST interroge : il serait probablement plus
pertinent d’articuler autour de cette action le réseau des URFIST et l’ENSSIB de Lyon. »
Les établissements ne disposant pas encore de formations ont par ailleurs formulés le
vœu d’être associés au GTAO de Couperin.
Des divergences fortes de positionnements entre les Instituts
■ Les enquêtes auprès des Instituts ont permis de développer des analyses multivariées
pour affiner des « profils » d’Instituts.
CNRS – Direction de l’Information Scientifique et Technique
55
■ L'INEE est partenaire de grandes bases de données internationales (GBIF) et
développe une politique systématique de valorisation. SCAR-MarBIN, par exemple, est
un portail de bases de données interopérables, auquel le CNRS contribue en fournissant
des données et la Belgique offre l’infrastructure. Zookeys et Phytokeys sont des journaux
qui éditent des articles automatiquement à partir de bases de données. Pour l'INEE, il
faut définir une incitation du CNRS à l’ouverture des données avec une obligation à
citer, tout en admettant qu’il existe bien sûr des données sensibles à ne pas diffuser. Les
données "sont les alliées" des publications, qu'elles complètent systématiquement pour
le test et la contre-épreuve du travail scientifique (INEE, INSIS, INSB, INP).
■ L’IN2P3 ne publie pas les données brutes (illisibles pour des tiers) mais les Data
management plans sont connus et utilisés. Le TGIR SOLEIL expose également un
besoin, au-delà de la gestion des données, sur les règles de stockage à long terme.
■ L’INSB avec la bioinformatique, est partenaire d'infrastructures nationales (avec
l'Inria), pour les ressources biologiques et biomédicales (biobanques). L’accès aux
données est par exemple très spécifique, et nécessite un support bien adapté.
■ L’INSU produit des bases de données et est partenaire de bases de données
internationales (Astronomie, sismologie, Géochimie…). Il souhaite à ce titre la
valorisation des publications liées à ces bases de données. D’autres bases nécessitent
une sécurisation dans le temps des données et une valorisation de celles-ci.
■ Pour l’InSHS, il est impératif de sauvegarder les bases de données produites dans les
laboratoires : l'Institut voudrait développer un projet de coopération avec l’INIST pour
répondre aux besoins des laboratoires en matière de sauvegarde et d’interopérabilité
des bases de données et ainsi faciliter à terme la diffusion des données de la recherche.
Il parait nécessaire de créer des triplets documentaliste, informaticien et chercheur
destinés à aider les laboratoires à pérenniser les bases de données SHS : c'est une
demande récurrente des unités ; cela doit être un de nos objectifs prioritaires.
■ Enfin, pour l'InSHS il faut renforcer les infrastructures : Huma-Num, Progedo-réseau
Quételet, programmes d’excellence (Biblissima http://www.biblissima-condorcet.fr/) en
stabilisant le rôle du réseau des MSH. Il faut également accompagner l’évolution des
personnels d’appui en IST dans la gestion des données de la recherche.
■ L’INSMI utilise peu de bases de données généralistes comme Web of Science (WoS)
ou Scopus. En revanche, l'Institut utilise quotidiennement les deux bases dédiées
CNRS – Direction de l’Information Scientifique et Technique
56
MathSciNet (alias Math.Reviews, éditée par la société mathématique américaine AMS)
et zbMATH (alias Zentralblatt, produit par le FIZ et commercialisé par Springer). Il existe
des liens anciens entre la France et le zbMATH, dont la première version web a été
développée par la cellule Mathdoc. De façon générale, il y a la volonté de soutenir cette
base européenne pour limiter l'hégémonie (et les tarifs) de la base américaine.
Des difficultés techniques signalées par des utilisateurs spécifiques
■ Concernant SciencesConf.org (service 3.3.), le service est très intéressant et la prise
en main facile par les chercheurs mais le couplage à un outil local de gestion des
paiements en ligne est trop complexe ou impossible à admettre du point de vue
administratif et comptable d'un établissement hors CNRS. Il manque en outre une
fonction « Tout déployer », car aucune vue globale ne peut être affichée. La
concurrence d’outils gratuits ou payants internationaux est forte sur ce segment. Il
conviendrait de renforcer la capacité d’intégration de l’application dans les sites
institutionnels des établissements ainsi que l'intégration dans les environnements
numériques de travail. L’interopérabilité est ainsi l’enjeu central d’un meilleur taux de
recours aux outils nationaux officiels. Calenda (service 3.9) est un outil de planification
commune entre chercheurs. Mais comme en témoigne un verbatim de l’enquête auprès
des DU « les calendriers annonçant un trop grand nombre d’événements ne sont pas
consultés par des collègues surchargés. ».
Un contexte où de grands principes éthiques doivent dominer
■ Le contexte est donc particulièrement favorable à la définition de principes éthiques,
qui soient de nature à transcender les catégories instrumentales et à affirmer les buts de
la recherche publique dans un contexte global de Science Ouverte. Le comité d’éthique
(COMETS) du CNRS a constaté que beaucoup d’acteurs de l’ESR ressentent le besoin
de partager des bonnes pratiques et mène une réflexion autour du data sharing (enjeu
éthique du partage des données scientifiques). Une charte d’éthique nationale de
déontologie des métiers de la recherche avait été signée le 29 janvier 2015. L’objectif de
cette charte était d’expliciter les critères d’une démarche scientifique rigoureuse et
intègre, applicable notamment dans le cadre de tous les partenariats nationaux et
internationaux, afin de consolider le lien de confiance entre la société et les organismes
et établissements publics d’enseignement supérieur et de recherche, dans une société
de la connaissance et de l’innovation.
La charte nationale se déclinait en 6 grands chapitres :
- Respect du dispositif législatif et réglementaire
CNRS – Direction de l’Information Scientifique et Technique
57
- Fiabilité des résultats de recherche
- Communication du travail (informer n’est pas communiquer)
- Responsabilité dans le travail collectif
- Travaux collaboratifs et formation à l’éthique
1.2.2. Les besoins différenciés des Universités, Organismes et Grandes Ecoles
L’ADBU représente efficacement les universités et n’est l’objet que de très faibles
contestations de la part de ces dernières ; en ce sens, l’ADBU doit être un partenaire
national majeur. D’autres sont néanmoins développées, mais c’est plus rare.
Indépendance des Grandes Ecoles, réunion des Universités, diversité des
Organismes
■ Les grandes écoles défendent une forme d’indépendance. Les universités sont
ouvertes mais sous de nombreuses conditions. Il est plus difficile de donner une
opinion claire pour les organismes, qui sont souvent différents, n’ont pas la même
renommée donc les mêmes accès, ni les mêmes budgets, etc. Des divergences
distinguent les universités des grandes écoles ; les grandes écoles sont facilement
dotées de services de protection, chose que les universités font porter sur les
SCD. Les bibliothèques universitaires (BU), elles, interviennent déjà beaucoup dans la
partie formation documentaire au droit d’auteur, et de nombreux dispositifs mutualisés
dominent l’échelle régionale. En revanche, les questions d’éthique de la publication
ne sont que peu traitées, aussi bien par les universités que les grandes écoles.
CNRS – Direction de l’Information Scientifique et Technique
58
■ Concernant les périmètres d’accès à l’IST, en l’état, il est difficile pour une université
d’avoir accès aux informations sur les ressources (bouquets) disponibles sur les portails
thématiques du CNRS. La liste exhaustive des titres accessibles n’est pas une
information suffisamment souple à exploiter. Toutes les UMR doivent-elles pouvoir
accéder au même périmètre ? Tous les membres de l’établissement ? Car les portails
CNRS s'adressent uniquement aux membres attachés à des unités CNRS (UMR
essentiellement), chercheurs, enseignants-chercheurs et doctorants uniquement, quand
les portails documentaires des établissements desservent aussi les élèves/étudiants qui
constituent leur population de base.
Le particularisme de la recherche médicale
■ Les milieux de la recherche médicale universitaire et les organismes (ASSO et
ODAC) de la fonction publique hospitalière sont aussi de grands utilisateurs d’IST aux
besoins de confidentialité et de sécurisation élevés. Le service MediHAL de dépôt
sécurisé et de consultation de données visuelles et sonores produites dans le cadre de
la recherche scientifique a été critiqué sur plusieurs aspects dans les réponses faites à la
question 115. D’abord, la logique de description à l'unité de MediHAL fait perdre de vue
d'une part la notion de collection, essentielle pour des corpus iconographiques ou
sonores, d'autre part les recherches et articles auxquels ces documents ont servi.
Ensuite, le point de la limite du service POPS sur ce support a été soulevé. Enfin ;
« dans bien des cas, le devenir à long terme des matériaux collectés est une question
non réglée, sinon par stockage de copies multiples. MédiHAL a déjà été envisagé
comme un outil de dépôt externe possible. Un versement massif, par une bibliothèque
universitaire, d'images issues de corpus numérisés pourrait-il être envisagé, ou serait-il
considéré comme un détournement ? De la réponse à cette question dépend l'intérêt de
l'offre. ». Globalement, il est possible de dire que le fond est trop modeste (en termes de
volumétrie comme de diversité) et largement dominé par les SHS. Or, les critères
d’interrogation étant ceux de HAL, il n’y a à l’heure actuelle aucun moyen d’interroger ce
fonds sur des critères pertinents pour les illustrations. Un modèle néerlandais en
matière de gestion et diffusion des données émerge, à même de constituer une source
d’inspiration.
1.2.3. L’action de l’Etat au service du citoyen (agences, APUL, ODAC, mission
Etalab)
L’Etat comme libérateur des forces de réseaux issus des autonomisations
CNRS – Direction de l’Information Scientifique et Technique
59
Les requêtes très fréquentes d’autonomisation de certains acteurs ne doivent pas
se lire comme une volonté de pratiquer des communautarismes autarciques ou d’ignorer
les directives nationales, mais bien plutôt comme une manière de renforcer la
crédibilité et les marges de manœuvre de chacun au sein de réseaux d’entraide, par
opposition justement à la granularité forte (chaque acteur devant chercher un prestataire
de services) en situation de dépendance au marché. L’Etat, et en particulier à travers le
CNRS, agit donc pour libérer les forces à même de créer à partir de l’IST, en rendant
possibles tous les usages par la formation. Une communication nationale doit par ailleurs
être assurée en parallèle vers les communautés de recherche (très largement sous-
informées aujourd’hui) et les communautés professionnelles.
Un régulateur également acteur
Ces rôles quasi-régaliens de régulateur, d’arbitre, s’associent à une nouvelle mission de
l’Etat comme acteur à part entière de l’IST.
■ L’Etat en lui-même, on l’oublie trop souvent, est non seulement un financeur de la
recherche, avec notamment plus de 40% des 47 milliards des PIA financés via la
CNRS – Direction de l’Information Scientifique et Technique
60
Caisse des Dépôts et la BNP, mais également un client majeur de données issues du
TDM.
■ Une ouverture des droits sur les portails CNRS pour des profils ciblés en-dehors du
CNRS est demandée. Cette ouverture peut s’effectuer dans le cadre de contrats mutuels
de confidentialité, ou dans le cadre d’un paiement ponctuel sur certaines ressources. Le
portail data.gouv.fr de la Mission Etalab va dans le sens d’une co-construction, à partir
de l’IST issue des datasets étatiques, d’applications entre start-ups, entreprises
classiques et développeurs indépendants voire autodidactes.
L’e-administration appuyée sur l’IST : une longue histoire française
■ En vue de souligner l’imbrication forte de l’Etat dans les questions ayant trait au
numérique et donc à la connexion avec la technologie scientifique, un bref rappel doit
être fait. L’« e-administration », que la Commission de Terminologie de l’Académie
française préfère qualifier d’ « administration en ligne », repose principalement sur la
facilitation et la fluidification de procédures courantes, en les dématérialisant.
L’administration électronique par le Gouvernement français ne date pas d’hier ; en
France, en août 1997, soit 19 ans après la toute première Loi Informatique et Liberté,
Lionel Jospin lance le Programme d’Action Gouvernemental pour la Société de
l’Information, visant une généralisation des sites Internet publics et la mise en ligne des
formulaires administratifs sur un Espace Public Numérique. Après le rapport Carcenac
sur les téléprocédures, l’interopérabilité et le logiciel public libre en 2001, celui de la
Délégation interministérielle à la Réforme de l'État sur les sites .gouv et service-public.fr,
on propose en 2002 une Agence NTIC (ATICA), qui donnera l’agence pour le
développement de l’administration électronique (ADAE) en 2003. Entre 2004 et 2007, le
plan ADELE formule 47 propositions, mais plus de 90% d’entre elles concernent en fait
uniquement des dématérialisations de procédures comme le changement d’adresse ou
l’achat public. La DGME coordonne ces efforts. S’ensuit le Plan France Numérique 2008-
2012, concernant notamment la Justice en ligne et la confiance numérique. Depuis 2012,
l’ex-DGME, c’est-à-dire le Secrétariat Général pour la Modernisation de l’Action Publique
(SGMAP), coordonne les projets de réformes. Beaucoup sont restés des projets, des
rapports assez éparses, sans grande vision globale. De grandes idées se développent
dans nombre de pays, comme Allemagne, les Etats-Unis, ou encore au Japon, pays qui
a pris de l’avance, telles que la carte nationale d’identité électronique, un service de
dossier médical personnalisé, « l’université numérique » pour former à l’économie
numérique, ou encore l’adresse mail publique à vie.
CNRS – Direction de l’Information Scientifique et Technique
61
Les applications concrètes de l’IST par l’Etat
Ce « state as a service » a déjà donné de premiers éléments de politiques publiques
reposant entièrement sur de l’IST ;
1. Le transport peut simplement faire l’objet de statistiques permettant d’améliorer la
qualité du service rendu via la e-administration ;
2. La sécurité est notoirement améliorée par la création de fichiers de police partagés
par INTERPOL ou les services de renseignement, ou encore le casier judiciaire en
ligne, et des sociétés comme Safran produisent des programmes permettant de
prévenir plus précisément les risques lors des passages de checkpoints, par exemple
aux frontières ;
3. La santé a déjà été changée par la connexion du médecin généraliste aux urgentistes
et spécialistes via le Dossier Médical Personnalisé (DMP), et le puçage des Cartes
Vitales ;
4. On pourrait aussi citer les Ressources et l’énergie ;
5. Ou encore les Prélèvements obligatoires (impôts et taxes), avec les déclarations en
ligne comme on les connaît aujourd’hui.
6. Il y a aussi la délivrance de permis, diplômes et licences, et la poursuite d’une
actualisation de ces derniers personnalisée et surtout efficiente, pour pallier aux
mauvais résultats européens aux tests PIAAC.
7. L’organisation de la vie citoyenne, de l’échelle du quartier à celle du pays, par des
Calendriers fonctionnant selon les choix de chacun comme des matrices est aussi
possible.
Aller plus loin : govtech, civic tech, quand l’IST sert à gouverner autrement
■ Outre cette dématérialisation de l’existant, l’Etat peut aussi gouverner autrement, plus
en profondeur, de façon plus intelligente et coordonnée, grâce à l’IST. La « GOVTECH »,
parfois nommée « CIVIC TECH » est l’infrastructure technologique utilisée pour faire le
travail administratif interne ou innover auprès du citoyen. Il s’agit donc de modifier le
« système opérationnel » du gouvernement, mais les citoyens peuvent se l’approprier
aussi via des initiatives publiques ou privées. Cela n’implique cependant pas
nécessairement de « retrait de l’Etat » au profit d’agences issues des démembrements
administratifs, d’opérateurs extérieurs, ou d’entreprises privées, ni une réponse aux
attentes des usagers ; on peut créer de nouveaux besoins et innover. Il s’agit de mieux
gouverner grâce aux moyens numériques offerts par l’IST.
CNRS – Direction de l’Information Scientifique et Technique
62
1. la GovTech peut faire du transport un pilier de développement de villes mieux
dessinées, en étudiant le parcours optimal ou la durée du trajet domicile-travail de
chaque citoyen, notamment à l’échelle européenne avec l’expertise d’EuroCities, ou
en Amérique avec LivingCities ;
2. Cela a aussi à voir avec la surveillance, qui se généralise via la reconnaissance
faciale, et le fléchage de tous les appareils d’usage courant. Les liens entreprises-
gouvernements, donc B2G et G2B, sont ici la zone sensible ;
3. On peut imaginer un monitoring en temps réel des fonctions vitales de chaque
citoyen, contrôlé par Santé Publique France afin de détecter les épidémies, et
d’évaluer les marchés de toxiques à réguler.
4. La mise en place de compteurs électriques automatisés rentre dans ce cadre ;
5. La GovTech permet d’aller d’un prélèvement à la source généralisé, à l’ajustement
automatique des taux d’imposition en temps réel selon l’économie ;
6. La mise en adéquation, par des numerus clausus et des quotas, de l’offre et de la
demande d’emploi
7. Et enfin, la prévision des manifestations, voire des événements violents, et donc un
contrôle policier renforcé par algorithmes, avec des solutions comme Palantir, qui
travaille tous les jours à des outils de GovTech.
■ En réalité, mieux l’Etat est informé, plus il peut gouverner efficacement, comme un
arbre qui croit d’autant plus haut que ses racines vont puiser des ressources dans la
profondeur. Mais une grande partie du chemin est encore à tracer, et aucun « sentier »
historique ne semble restreindre les possibles en la matière, qui est toute neuve. Pour
résumer ce qui a déjà été fait en France ;
▪ 1978 : Première Loi Informatique et Liberté, fondation de la Commission
Nationale Informatique et Libertés (CNIL)
▪ 1997 : Programme d’Action Gouvernemental pour la Société de l’Information
▪ 2000 : Ouverture de service-public.fr et de Légifrance
▪ 2001 : rapport Carcenac (téléprocédures, interopérabilité, logiciel libre)
▪ 2001 : rapport de la Délégation interministérielle à la Réforme de l'État (sites web
publics)
▪ 2003 : Agence pour le Développement de l’Administration Electronique (ADAE)
▪ 2004-2007 : Plan ADELE
▪ 2005 : Direction Générale de la Modernisation de l’Etat (DGME)
▪ 2008-2012 : Plan France Numérique
▪ 2012 : Secrétariat Général pour la Modernisation de l’Action Publique (SGMAP)
CNRS – Direction de l’Information Scientifique et Technique
63
La mission Etalab : au cœur d’une Europe des bases de discussion sur l’Open
Data
■ De plus, des forums européens existent également, qui sont la base de discussions
dont l’Etat est un acteur incontournable, mais qui mettent au premier plan la Recherche
: Open Knowledge (UE), Fondation pour les Générations Futures (BEL), Hanns Seidel
Stiftung (ALL), etc. et mondiaux : Govtech Fund (US), NewDemocracy (AUS), etc.
■ La mission Etalab gère de grandes quantités de données en mettant en ligne des
datasets et en administrant la réception de datasets externes sur le site data.gouv, qui
sont amenées à servir de pivot vers d’innovants projets émanant de la société civile et
des entreprises (dont start-ups) souhaitant développer des applications faisant usage de
ces données. Nombre de ces data sets rentrent dans la catégorie IST par leur nature ;
collecte automatisée de renseignements objectifs (cadastre, dénombrements
d’événements récurrents, votes, etc.) ou leurs modes de consultation (API intégrées,
nécessité d’employer le TDM).
■ Néanmoins, de fortes contraintes s’appliquent aux organes décisionnels de
l’Etat :
1ère limite à l’action étatique : économique
■ D’abord, il existe des contraintes économiques, évaluées par le cabinet Ourouk dans
une analyse technico-budgétaire de la stratégie IST conduite en 2015.
CNRS – Direction de l’Information Scientifique et Technique
64
- Certains projets publics coûtent très cher dans les premières années, sans
certitude d’amortissement, ce qui constitue donc une dépense d’investissement et
justifie un endettement pour répartir le poids financier sur plusieurs générations ;
or la dette publique est déjà trop élevée presque partout…
- De plus, on peut se demander si ce coût doit être assumé par tous les
contribuables via un impôt, ou seulement par les usagers finaux, auquel cas peu
seraient enclins à payer pour ces options de service (moins de 20% selon un
sondage INSEE 2014).
- Les réformes numériques de l’Etat peinent à se développer lorsqu’elles sortent du
cadre de la simple dématérialisation procédurale. En effet, de grands monopoles
privés sont devenus hégémoniques, pour deux raisons ; d’une part l’absence de
coût marginal, de hauts coûts de recherche et développement, et d’autre part les
effets de réseau.
2ème limite à l’action étatique : technique
■ Parallèlement, il existe des limites techniques ; les pays où moins de 60% des citoyens
possèdent un ordinateur personnel ou ont, à défaut, accès à internet, tels que le Brésil
ou la majorité des pays d’Afrique, ne peuvent que difficilement mettre en place ce genre
de mesures, a fortiori si le taux d’équipements en smartphones est également faible,
sauf pour les mesures n’exigeant que des ordinateurs publics, comme le vote
électronique. En tout cas, la GovTech à proprement parler ne peut s’y installer. Les
initiatives gouvernementales se sont néanmoins structurées lors de la création de l'Open
Government Partnership en 2011, qui regroupe aujourd'hui 69 pays, et qui défend l’Open
CNRS – Direction de l’Information Scientifique et Technique
65
Data et la transparence sur les données comme moyen de contrecarrer les éventuelles
dérives éthiques liées aux grands pouvoirs nouveaux que ces données impliquent. La
France est 10ème mondiale en termes d’accès ouvert à ses datasets publics rendus
disponibles par la mission Etalab. La science et la recherche ont donc un rôle à jouer
dans la mise en valeur et en applications de ces données précieuses.
3ème limite à l’action étatique : éthique et morale
■ Car enfin, en effet, coupler ces bases avec des décisions technocratiques
extrêmement complexes à prendre, avec un stress temporel fort, pourrait amener vers
une disparition du décideur humain en bout de chaîne. Pour certains, il s’agit d’un risque
d’aliénation et de perte de liberté, pour d’autres, il s’agit du remède contre les failles du
raisonnement humain, telles que les abus du pouvoir qu’offre la maîtrise des données,
les discriminations ou les erreurs stratégiques.
- La protection des données du citoyen, la confidentialité, le droit à la vie privée
ou à la déconnexion sont autant de traductions juridiques de contraintes
éthiques qui freinent une réforme en profondeur, et qui sont toutes en train
d’évoluer à l’heure où nous parlons.
Le lien avec l’intérêt général : mettre l’IST au service de chacun
■ Le développement des start-ups d’Etat et des entrepreneurs d’intérêt général
ouvre la porte à un emploi de l’IST pour mieux évaluer les attentes et besoins des
citoyens ; le travail législatif doit donc focaliser ses efforts sur le maintien d’un
environnement favorable au réemploi des données IST. Le site data.gouv enregistre de
très bonnes statistiques, et les applications qui y sont créées par des start-ups et des
particuliers à partir des données publiques servent l’intérêt général.
1.2.4. Les besoins des entreprises
Une décorrélation entre la formation initiale et les qualifications professionnelles
attendues à l’heure numérique, que tentent de corriger des initiatives très récentes
Aujourd’hui, le marché réclame des spécialistes capables de décrypter et de
rendre clair pour un dirigeant d’entreprise les résultats issus du TDM, et pourtant seules
4 universités en France proposent cette spécialisation (Lyon 2, Paris 6 et 8, et Nice)...
Cependant, de nouveaux diplômes et filières liées aux problématiques du numérique
CNRS – Direction de l’Information Scientifique et Technique
66
(dont le TDM et l’IST en général) sont en train d’être fondés par quelques professeurs
visionnaires sur le territoire, depuis le début de l’année 2017, notamment à Paris.
Quels sont ces nouveaux besoins d’IST des entreprises ?
■ Les entreprises ont besoin de l’IST, tant pour déterminer leurs bases de clientèle que
pour fournir des produits innovants, qui permettent d’augmenter les externalités positives
générées par un progrès endogène, fonctionnant en réseau, autour de grands
monopoles chefs de file. Les plus grandes masses de données produites se situent
dans les champs suivants ; physique, biologico-médical, chimique, linguistique, et
historique dans une plus faible proportion. Nombre de ces données sont à même
d’intéresser des entreprises valorisant ces données à travers des applications,
numériques ou non. Ces applications peuvent aller dans le sens de l’intérêt général ;
c’est l’idée des start-ups d’Etat, renforcée par la mise en place d’une première promotion
des Entrepreneurs d’Intérêt Général en 2017.
■ Globalement, de grandes entreprises ont des besoins extrêmement spécifiques en
innovation et donc en IST pour notamment envisager l’approche de la frontière
technologique dans différents domaines, ce qui se traduit par le volume très lourd de
publications financées ou à destination d’entreprises.
CNRS – Direction de l’Information Scientifique et Technique
67
Source : Wos, Scopus, Reseda (données agrégées 2000-2014),
volumes de publications en partenariat.
L’intrapreneuriat et les start-ups : pas seulement à Palo Alto
■ Outre l’essor bien connu des start-ups dans le sillage des GAFAM (Google Amazon
Facebook Apple Microsoft), l’intrapreneuriat s’est également beaucoup développé en
France entre 2010 et 2017, et la plupart des start-ups incubées en interne au sein de
plus grands groupes font reposer leurs facteurs d’innovation technologique sur l’IST.
■ Le ciblage du marché et le calcul de l’opportunité d’innovation doivent se faire en
amont. C’est dans ce sens que va le label Responsible Research and Innovation (RRI)
de la Commission européenne, qui prend en compte l’importance de la recherche pour
l’intérêt général, et permet d’éviter la sélection biaisée des projets à financer, trop
souvent basée sur le profit commercial immédiat.
■ Certains marchés professionnels commerciaux nécessitent des formulations
extrêmement détaillées, qui vont couvrir les besoins d’une mise en œuvre pragmatique,
qui vont aller dans tous les recoins d’un brevet ou d’un descriptif afin d’éviter les failles
dans l’application. Le marché de la recherche, lui, a besoin avant tout d’interactivité,
CNRS – Direction de l’Information Scientifique et Technique
68
c’est-à-dire d’une formulation qui prend du recul perpétuellement, un résultat qui, aussitôt
qu’il est posé, appelle sa propre mise en perspective, son propre débat, in fine sa propre
abrogation au profit de son successeur, un résultat qui sera encore plus juste et complet.
Nombre d’initiatives de forums, où le résultat n’est jamais un fait acquis présenté dans un
rapport ayant un lourd coût fixe logistique, mais bien plutôt un bilan, un état des lieux du
chercheur qui souhaite l’avis de ses pairs, fleurissent depuis 10 ans. A la manière d’un
statut Facebook, ou d’un tweet, qui ne vont jamais seuls mais toujours solidement reliés,
à un tel point qu’ils en sont indissociables, avec une fonction de commentaires ouverts.
Cette fonction, qui fut l’une des modalités de la consultation précédant la LPRN, ne doit
pas être ignorée, et les chercheurs sont attachés à sa généralisation sur toutes les
plateformes. Les entreprises doivent donc éviter de faire travailler leurs chercheurs en
vase clos, mais privilégier des logiques d’ouverture et de coopération ; travailler à
plusieurs, de façon interdisciplinaire, et sans repli sur les résultats d’un seul laboratoire.
Une somme d’incompréhension et de court-termismes, pas une guerre
■ La DIST rappelle la nécessité de stabiliser le cadre public des services d’accès et
de partage des résultats de la science publique. Or des services similaires sont proposés
par le privé. Il peut donc y avoir conflit d’intérêts entre le principe d’intérêt général du
service public et la liberté du commerce et de l’industrie. La stabilisation du droit de
l’intervention publique est donc nécessaire pour fournir les services d’Open Process,
nécessaires à la valorisation des résultats de la recherche publique. Cette équation n’est
en tout état de cause pas insolvable, et ne doit pas se faire l’objet de pétitions de
principe.
CNRS – Direction de l’Information Scientifique et Technique
69
2. VISION : Faire évoluer les services d’IST vers
l’interopérabilité
Si l’IST a des origines connues et une définition relativement inchangée, sa
direction dépend des décisions stratégiques qui orienteront à la fois les usages de la
Recherche et les politiques publiques dans les années à venir, dans un premier temps à
l’Horizon 2020, puis de façon étendue. C’est donc une matière d’action, une partie du
monde numérique qu’il convient de construire de façon intelligente et avec une vision
dépassant tous les court-termismes politiques, économiques et sociaux.
Un courant proactif, un contre-courant sécurisant, devant porter à un équilibre
■ Il existe deux dynamiques qui doivent être complémentaires afin d’assurer la stabilité
de la stratégie nationale IST ; d’une part, une force motrice, mobile, proactive, visant à
ouvrir et simplifier les conditions d’accès et d’utilisation de l’IST, et d’autre part une
dynamique de conservation, de stabilisation des acquis, de protection des droits, de
défense du chercheur.
Les options explorées par les partenaires européens
■ Plusieurs pays européens tels que l’Estonie (citoyenneté numérique) et la Suisse ont
mis en place des modèles alternatifs de gestion de l’IST, et des comparatifs sont
possibles, tant en matière d’usages (outils, niveau d’imprégnation de l’IST dans la
culture scientifique), que de supports (plateformes). Un débat européen majeur a lieu
autour de plusieurs sujets présentant plusieurs options possibles et parfois
antinomiques, que seule une décision politique forte peut conduire dans une direction
précise. Il peut s’agir par exemple du passage des droits d’auteurs classiques au droit de
l’IST, de l’action fédératrice d’une agence nationale scientifique (CNRS dans l’ESR), ou
encore de la création d’une « plateforme des plateformes » pour simplifier l’accès dans
une époque où le passage à l’intuitivité et la pleine fonctionnalité numérique des
travailleurs n’est pas encore complet.
Développer une politique
nationale de formation pour
la Recherche et l'Education
Coordonner les efforts
d'acquisition au sein de
partenariats européens,
avec de nouveaux modèles
Proposer un point d'entrée
unique vers l'IST, mais qui
soit modulable pour
s'adapter aux différents
CNRS – Direction de l’Information Scientifique et Technique
70
économiques et de
valorisation
besoins
Limiter les dépenses de
formation en utilisant le
numérique, et éviter une
décorrélation de l'offre et de
la demande sur le marché
de l'emploi en formant les
élèves
Protéger les droits et la
rémunération des
chercheurs français, faire
appliquer le principe de
loyauté des plateformes de
la LPRN
Ne pas créer un outil
d'ingénieur "déconnecté de
toute réalité", objet d'un
non-recours fort, faire
appliquer les principes de
protection (secret, vie
privée) de la LPRN
Le paradoxe du chercheur : chercheur-cherchant contre chercheur-publiant
■ Le paradoxe majeur qui hante l’IST réside en ce que le chercheur, le citoyen, ou
l’entrepreneur qui est à la recherche d’une information veut disposer d’un seul outil
unifié rassemblant un maximum de données, mais lorsque ce même chercheur,
citoyen ou entrepreneur se voit placé en situation de diffuser ses propres données, celles
qui émanent de lui, de ses travaux, de sa personne ou de son business, il fait montre
d’un désir irascible de se protéger, c’est-à-dire d’en donner le moins possible, et
appelle de ses vœux la spécificité des services par lesquels ces données transitent ou
sur lesquels elles sont stockées, ce qui à l’échelle collective implique une diversité
d’outils.
■ Ce paradoxe a bien été souligné dans les résultats de l’enquête conduite auprès des
Directeurs d’Unités ; 89% des DU se déclarent favorables à une mise en réseau
européenne voire internationale des dépôts de communication en Open Access, mais
seuls 30% ont déjà payé pour qu’un article soit en libre accès, et seuls 16% de ceux
ne l’ayant pas fait se déclarent prêts à le faire.
Comment répondre à ce paradoxe ?
■ Il faut donc implémenter un service (plateforme ou module) unique et public, qui
puisse être sujette à des choix internes (options convenant à chaque domaine d’IST,
personnalisation pour chaque type de secteur/recherche), et qui se serve de la
puissance et du professionnalisme des systèmes privés déjà existants. Cette plateforme
devra garantir un prélèvement algorithmique standardisé de l’information, qui ne
CNRS – Direction de l’Information Scientifique et Technique
71
rencontre pas d’opposition forte de la part des usagers, et dont l’Etat puisse garantir la
sécurisation, en partenariat avec le CNRS et la DIST pour gérer la frange « Recherche »
et donc les désirs et besoins des chercheurs.
■ Cette plateforme pourrait être conçue comme un point d’entrée général de tous les
citoyens, chercheurs, entrepreneurs, et donc comme la mise en relation des demandes
et des offres d’IST, avec en parallèle des programmes d’analyse fine qui permettraient
de dégager les grandes tendances statistiques de ces demandes et des offres, afin de
les adapter l’une à l’autre.
■ L’objectif est donc de doter les Unités du CNRS et leurs partenaires, de références sur
l’accès à la documentation, les usages documentaires, la publication, les données, et de
clarifier les alternatives juridiques ouvertes aux publications en Open Access. Un autre
objectif prioritaire est de couvrir le périmètre des services à valeur ajoutée publics,
aujourd’hui mal définis, dans un contexte où l’offre est dominée par le marché.
2.1. Développer une politique nationale de formation de soutien pour la
recherche et l’éducation
La production généralisée de données numériques induit de facto des
besoins importants de formation continue permettant la maîtrise des descriptions,
stockage, traitement, analyse. Ces formations ne se limitent pas à la connaissance des
outils technologiques pour accomplir ces tâches mais englobent également les aspects
méthodologiques, juridiques et organisationnels nécessaires au montage des plans de
gestion de données et fonctionnement des infrastructures. Pour partie, ces formations
devront être communes aux trois corps de métiers qui concourent à la gestion efficace
des infrastructures : scientifique, informaticien et professionnel de l’information. La
description des données met en jeu aussi des connaissances du champ scientifique.
2.1.1. Fluidifier l’utilisation des outils en répondant aux difficultés rencontrées
Rendre les outils intuitifs, informer
Avant tout, des FAQ (Foires aux Questions) solides et exhaustives doivent
être établies sur le site de la DIST, afin de permettre d’apporter un point de recours et de
réponse central et bien aiguillé pour tous les personnels maniant de l’IST. Cette première
CNRS – Direction de l’Information Scientifique et Technique
72
dynamique, fondée sur l’envoi, par chaque chef de projet (outil, support), de sa FAQ
locale (une pour ISTEX, une pour OPIDOR, une pour HAL, etc.) combinée à une
nomenclature des questions portant sur l’IST en général, servirait à diminuer le volume
de réponses à apporter.
■ Il faut rendre les outils intuitifs pour limiter les besoins d’assistance récurrents, et
c’est dans ce sens que va l’étude commandée par ISTEX concernant l’ergonomie. Une
expérience utilisateur robuste et facile permet de désengorger les besoins de formation
et les requêtes d’information.
■ Au vu de l’urgence d’une mise à niveau permettant à chacun de déposer dans HAL
et arXiv, il faut d’emblée effectuer un rappel obligatoire sur ce point, sous la forme d’un
atelier géré par les chargés locaux de la formation IST auprès de chaque acteur. L'INP
ainsi que l’INSU font observer la nécessité d’améliorer des "vases communicants"
simples entre HAL et arXiv, afin d'assurer une représentation pertinente et complète des
dépôts et de valoriser ainsi le projet national, soutenu par le MESR et l'Académie des
sciences.
Mettre en relation les bonnes personnes avec les bonnes consignes et
orientations
■ De plus, il convient de mettre en relation les ingénieurs européens et european
project managers servant de répondants aux différentes questions concernant les plans
de gestion de données (OPIDOR) avec les personnels de l’INIST.
■ Sur la suggestion de l'ADBU, il faut articuler les tutoriels et l’offre de formation avec le
programme européen FOSTER, en inscrivant dans chaque module/note/atelier un renvoi
à FOSTER.
■ Donner des ordres de mission concernant la diffusion de l’information en interne à
chaque CORIST pourrait être utile, ce qui permettrait de conférer une autorité plus
grande à chaque correspondant au sein de son milieu de travail, et par là même une plus
grande légitimité et visibilité pour recevoir et identifier les requêtes.
Aller plus loin grâce à la technique
■ L’exigence d’un matériel informatique de qualité est une condition nécessaire pour
rendre possible le passage complet du CNRS au numérique. En effet, la non-conformité
CNRS – Direction de l’Information Scientifique et Technique
73
de certains ordinateurs aux prérequis récents, et les inégaux niveaux d’équipement
logiciel existants entre les UMR et établissements, limitent l’utilisation des standards
communs de format de l’IST (simplification).
■ Pour aller plus loin que la veille et la recherche documentaire, certains algorithmes
suggèrent désormais des sujets de recherche aux chercheurs ; cependant, ces
algorithmes doivent veiller à ne pas entretenir des logiques de priorité déjà
existantes, contournant ainsi les nouveaux sujets et réduisant le potentiel d’innovation
de la recherche. Une part d’aléa, qui constitue la base de tout travail sur des documents
papiers dans un environnement de type bibliothèque physique, doit être conservée.
2.1.2. Optimiser les savoirs et compétences pour la transition numérique
■ Outre le flux des questions/réponses ponctuelles, il convient cependant de former
durablement les personnels de la Recherche aux nouveaux supports et usages de l’IST,
sans trop faire reposer d’espoirs sur l’ajustement naturel provoqué par le changement de
classes d’âge et de générations. Il faut donc encourager la mise en œuvre d’un plan de
formation par les personnels de l’INIST notamment, au sein des URFIST.
Pratiques de recrutement et de gestion du personnel prenant en compte les
besoins en IST
■ Cela passe avant tout par des pratiques de recrutement qui tiennent compte de la
stratégie à long-terme de mise à niveau en matière numérique, et plus particulièrement
concernant les pratiques IST. Ce qui doit être recherché n’est pas une compétence
spécifique, mais la capacité d’adaptation ou la résilience permettant à chaque individu de
comprendre les nouveaux enjeux, évoluant en permanence et de plus en plus
rapidement, qui parsèment leur environnement professionnellement.
■ Le chercheur n’est pas toujours disponible, physiquement et mentalement, pour
entendre parler de l’IST, même si cette dernière occupe une place de choix chaque jour
grandissante au sein de ses activités. En effet, de nombreux autres impératifs
s’appliquent à ses journées, et les normes formelles imposées par le cadre européen ne
suffisent pas, pour une grande majorité de travaux fonctionnant en vase clos (étant
encore à l’état de brouillons, documents de travail) ou ne nécessitant pas de
collaborations internationales, à motiver un apprentissage rigoureux des subtilités
d’usage de l’IST.
1ère ligne de formation : en ligne
CNRS – Direction de l’Information Scientifique et Technique
74
■ La première ligne de formation aux nouveaux usages de l’IST doit ainsi passer par une
offre de formation en ligne. « Nous ne disposons pas de service de formation à distance
et serions très intéressés par un site qui nous permettrait de développer nos propres
formations à distance ou d’utiliser/faire utiliser celles qui seraient réalisées par d’autres
professionnels de l’information de l’ESR sur des sujets que nous ne maîtrisons pas, ou
sur lesquels nous n’avons pas le temps de développer des outils d’apprentissage. »
Cette offre permet à chacun d’organiser son apprentissage par rapport à ses
disponibilités d’une part, et à ses besoins spécifiques d’autre part, sans contrainte
horaire ou spatiale, et surtout sans donner une information à quelqu’un qui la connaît
déjà. Cette ligne existe dès à présent à travers OPIDOR et DoRANum. Le service 5.5.
(« Formations à distance sur la gestion, la préservation, le partage et la diffusion en libre
accès des données de recherche (DoRANum BSN) ») a été encadré par les réponses
aux questions 120 et 122 notamment, qui mettaient en avant des points à améliorer.
DoRANum a d’ores et déjà commencé à diffuser ses vidéos de formation en ligne. Il
s’agit d’une formation complète, à distance, fondée sur de petits modules de e-learning
s’adaptant à chaque besoin d’apprentissage en fonction non seulement du niveau de
compétence mais aussi du niveau d’intérêt pour l’IST (« en bref », « pour comprendre »,
puis « pour aller plus loin »). Ces modules sont pour certains imprimables et DoRANum
propose également des visuels concernant l’IST (marque-pages et fiches synthétiques)
que chaque unité peut diffuser ou afficher en interne. Cependant, une mise à
disposition d’OPIDOR et de DoRANum sur un site commun serait à ce titre
envisageable. Cependant, cette ligne nécessite d’être associée à une seconde ligne,
permettant le contact humain avec des personnels IST, car il peut être difficile d’accéder
spontanément à la bonne information, les réflexes informatiques n’étant pas toujours
présents parmi les communautés de chercheurs. Cette première ligne numérique doit
donc pleinement dépasser le cadre de l’information pour constituer une véritable
formation.
2nde ligne de formation : ponctuelle, pour les personnels locaux non-spécialistes
■ La seconde ligne, complémentaire, consiste en une formation ponctuelle des
personnels informatiques et des documentalistes locaux, au sein de chaque unité de
recherche ou établissement. On a constaté que les chercheurs, enseignants et étudiants
se tournent en priorité vers eux lorsqu’ils sont confrontés à une interrogation concernant
l’IST. Les former permettrait donc, par ruissellement, d’apporter une information de
qualité jusqu’aux couches académiques et professionnelles les plus éloignées de l’IST
au quotidien, et ce à l’initiative de chacun, ce qui éviterait toute forme de lassitude ou de
CNRS – Direction de l’Information Scientifique et Technique
75
non-recours. Cette ligne a pour but de délester la troisième ligne, tout en permettant
d’orienter chacun vers les ressources issues de la première ligne si le désir d’en savoir
plus est manifesté, à titre du droit à la formation continue ouvert pour les salariés et
agents de la fonction publique.
3ème ligne de formation : continue, par et pour des personnels qualifiés en interne
■ La troisième ligne, déjà bien établie mais qui doit poursuivre les efforts engagés, est
celle de formation continue, par des personnels qualifiés rattachés à des organes
centraux du CNRS (DIST et INIST). A ce titre, le nombre de personnels dédiés à ces
tâches de formation en interne pourrait être augmenté afin de pouvoir compter sur ces
agents pour de nouvelles missions auprès des partenaires de l’IST, aux premiers rangs
desquels les établissements et unités de recherche. Il faut harmoniser l’offre de
formation de l’INIST et celle des URFIST par un approfondissement du dialogue entre
les deux. De façon globale, redessiner la structure décisionnelle dédiée à l’IST au
sein du CNRS autour d’une approche utilisateur serait souhaitable, sur le modèle d’un
large « front office » spécialisé en formation et à même de répondre aux questions
formulées en termes profanes, secondé par un « middle office » centré sur la
coordination des acteurs œuvrant dans le même sens, et d’un petit « back office »
impulsant la stratégie et commandant les études nécessaires à la prise de recul sur le
sujet.
Une validation des acquis de l’expérience corrélée à la maîtrise des usages de
l’IST
■ La validation des acquis de l’expérience (VAE) en matière d’IST doit pouvoir se
faire sur la base d’un cahier de critères précis déterminant le degré de maîtrise de
diverses compétences génériques, sans que ce dernier soit trop dépendant des supports
ou outils précis (plateformes, logiciels), qui eux varient perpétuellement.
■ Outre cette VAE, il convient de s’assurer que les actions de base requises par les
chartes de bonne utilisation de l’IST dans la recherche soient effectuées avec précision
et systématisme. Avant tout, il faut assurer le respect des règles de dépôt dans les
archives ouvertes HAL, en mettant en place un mécanisme incitatif adossé pour les
cas d’abus à un mécanisme correctif fermant certains droits de lecture tant qu’une
CNRS – Direction de l’Information Scientifique et Technique
76
production rédigée voire publiée n’est pas intégrée ou ses métadonnées pas
suffisamment renseignées.
La dépendance des protocoles au marché
■ Les protocoles d’IST peuvent être développés unilatéralement par les entreprises
ou individus au sein de ces dernières ayant une autorité suffisante, sans prendre en
compte leur légitimité ni l’acceptation préalable de la communauté scientifique. Ainsi,
certaines firmes formulent leurs résultats dans un protocole qui leur est propre, et
imposent leur formulation à ceux qui dépendent de la compréhension de cette
information pour leur développement académique ou professionnel. En revanche, si les
universitaires ou les développeurs d’applications techniques issues de ces projets
« cryptés » doivent apprendre le nouveau protocole par besoin, le profane ou le
passionné simplement intéressé par un résultat ponctuel à propos d’un élément qui le
fascine n’aura ni la motivation (incitative) ni le temps nécessaires. A l’inverse, un acteur
se donnant pour but de vulgariser un résultat peut utiliser des termes totalement
différents de ceux reconnus par le milieu scientifique, voire pire encore, en amalgamer
plusieurs et brouiller les définitions.
Vulgariser l’IST…
■ La vulgarisation est la plus connue des « reformulations » qui prennent en compte le
niveau de prérequis minimal et le contexte social de l’opinion pour enseigner des
techniques d’IST. Le volume de ces formulations destinées au profane représente
20 000 titres cette année ! Permettant une large diffusion et une uniformisation des
résultats, la vulgarisation a pour défaut d’infantiliser le récepteur, et de réduire l’ampleur
de l’information, l’angle par lequel l’IST est abordée empêchant au récepteur de réaliser
tous les potentiels et interconnexions de cette dernière. De plus, il ne faut ni subordonner
l’IST à ses applications les plus spectaculaires, qui de surcroît ne sont pas toujours les
plus utiles, ni masquer ses limites en en faisant une science absolue, effaçant sa nature
instable, ses fragilités nécessaires.
… ou plutôt la simplifier et la spécialiser ?
■ Plus que d’une vulgarisation, c’est donc d’une simplification dont l’IST a besoin à
l’horizon 2020. La LPRN va dans ce sens, et elle a été préfigurée par les travaux sur la
rationalisation, depuis les Lumières. La simplification permet une large diffusion du
résultat, l’atteinte du marché niche souhaité, sans niveler par le bas.
CNRS – Direction de l’Information Scientifique et Technique
77
■ Outre cette simplification générale de l’IST, commandée par les besoins exprimés
par tous les acteurs conjointement, un second principe, celui de spécialisation, doit
intervenir ; il faut diriger la bonne quantité et la bonne nature d’IST vers chaque acteur, et
appliquer un niveau de sécurité cohérent avec les réalités de chacun. Proposer la même
arme et la même armure à chaque combattant, qu’il soit tireur d’élite, fantassin, blindé ou
pilote de l’air, serait vouer le combat à l’échec ; il en va de même pour l’IST, où chacun
est différent mais complémentaire, et engagé dans un parcours d’une même intensité
pour faire de la France un grand Etat numérique.
Une formation solide par l’INIST pour H2020 ; comment améliorer les tutoriels
proposés
■ La DIST a sollicité l’Inist pour participer à la mise en place de formations visant à
accompagner les chercheurs ainsi que les ingénieurs projet européens (IPE) sur le volet
IST de H2020. Elles se présentent sous forme de modules en ligne, à destination des
chercheurs, des IPE (Ingénieurs projets européens) et des responsables des SPV
(services de prospective et de valorisation). Ces tutoriels sont disponibles en ligne avec
une documentation associée sur www.inist.fr rubrique « tutoriels libre accès aux résultats
de la recherche » dans le cadre de H2020. Chacun dure environ 10 minutes. Les
tutoriels actuels doivent cependant faire montre d’une meilleure qualité visuelle, à
préférer aux présentations PowerPoint, tout en mettant une voix agréable et un ton
enjoué au service de résumés brefs ponctués d’exemples très concrets, voire de
captures d’écran illustrant les procédures pas-à-pas. Ajouter des thèmes tels que la
propriété intellectuelle ou industrielle et leur encadrement, ou encore l’IST au service de
la robotique, permettrait de susciter un plus vif intérêt chez les individus, et de créer des
motivations supplémentaires pour accéder aux ressources, en faisant de la culture et de
la connaissance personnelle une dynamique prenant le pas sur le simple utilitarisme
pragmatique et professionnel.
D’autres idées complémentaires
■ Le site d’information sur les données de la recherche (service 5.7.) doit être animé par
un acteur (ou un groupe d’acteurs) de l’IST ; en effet, sans cette présence en ligne qui va
au-delà de l’hébergement ou du simple entretien, il ne saurait être autre chose qu’un
vulgaire réservoir de documents, peu opérationnel. Une newsletter IST, copiable et
collable dans chaque newsletter locale, permettrait tant d’informer la communauté
scientifique des nouveautés de l’Open Science que de rappeler en fin de mail les URLs
CNRS – Direction de l’Information Scientifique et Technique
78
utiles. Pratiquer un référencement intelligent par l’apposition de tags sur chaque article /
ressource dudit site et sa galaxie de blogs est nécessaire à la navigation fluide côté
visiteur.
2.1.3. Connecter les chercheurs de l’IST française entre eux
Le lien entre l’IST et les chercheurs est donc d’abord une question d’information
et de formation. Néanmoins, le resserrement des liens entre les chercheurs utilisant et
produisant de l’IST permettrait d’ouvrir encore plus les forces en présence aux
externalités positives, et de favoriser des synergies encourageant une acquisition
commune des compétences autour de laboratoire et organismes « chefs de file ».
L’essor de véritables synergies par le bas, horizontalement entre les acteurs de l’IST,
s’est traduit par le formidable essor des revues interdisciplinaires entre 2000 et 2015.
L’existant est déjà bien développé, il faut le recadrer et le partager
■ Partager les règles de régulation et mettre en lumière les outils organisationnels d’ores
et déjà intégrés aux supports est essentiel pour assurer un partage convivial de l’IST.
Ces outils relèvent de l’organisation de conférences, de l’inscription d’événements et
réunions au sein de calendriers collaboratifs, ou encore de l’établissement d’un véritable
« réseau social des chercheurs », intersectoriel, qui se superpose à un réseau social
existant ou complète l’offre de service du point d’accès unique développé.
■ L’INIST est par ailleurs impliqué dans des projets de R&D et investissement d’avenir
intégrant une part importante de fouille de textes pour proposer un accès élaboré aux
connaissances scientifiques décrites dans les publications que l’INIST met à disposition
de la communauté. Les projets actuels sont :
➢ Au sein d’ISTEX : enrichissement des textes par reconnaissance de termes, entités
nommées, citations, nécessaires au développement de services à valeur ajoutée,
CNRS – Direction de l’Information Scientifique et Technique
79
➢ Quareo : annotation de textes et développement d’outils d’analyse sémantique de
textes scientifiques ;
➢ ANR TermITH (Terminologie et Indexation de Textes en sciences Humaines) : accès
à l'information des documents numériques par le biais d’une indexation fondée sur les
termes qu’ils contiennent, ce qui suppose reconnaissance, désambiguïsation et analyse
des termes ;
➢ UBIK : détection et caractérisation de vocabulaires transdisciplinaires, approche
complémentaire des travaux sur les terminologies.
■ Lorsqu’un établissement possède un service en ligne d’assistance pour les questions
d’IST (service 6.3.), une collaboration peut être envisagée si la proximité de l’outil
d’assistance avec les acteurs locaux est garantie. Le CNRS doit jouer le rôle d’un
animateur de réseau. Le rôle du CORIST local ou d’une FAQ généraliste facile d’accès
est ici primordial. Les autres réseaux d’assistance, tels que le réseau Boomerang, ne
seront mis de côté que si l’offre nationale est cohérente, consultable librement, conviviale
et surtout utile. Un verbatim résume cette précaution ; « Le guichet d'assistance est
actuellement limité aux archives ouvertes et les autres demandes de documentation
électroniques se font directement par mail et téléphone à la responsable du portail ou
des ressources électroniques. Un service de guichet permettrait de mieux associer les
correspondants dans les laboratoires et de répartir ce service au niveau national pour les
questions d'ordre général. Il ne peut fonctionner qu'en intégrant les professionnels de
l'IST des établissements. »
Apporter des outils utiles sans tenter de rivaliser avec les réseaux sociaux classiques issus du secteur privé
■ En vue de mutualiser les outils terminologiques et de développer et gérer des
ressources terminologiques et des ontologies nécessaires aux processus
d'enrichissement des métadonnées, en construisant et exploitant des ressources de
représentation des connaissances (RRC), il est en outre engageant de ;
- Créer une plateforme unique des vocabulaires de l’ESR
- Alerter (sous forme de notifications) pour informer sur les thésaurus alignés
- Faire du lobbying pour les thésaurus internationaux (Gemet par exemple)
- Assister au traitement ponctuel de vocabulaires
■ Il faut coupler les services tels que I-Revues avec ScienceConf par exemple, pour les
actes de congrès. Les congrès, qui sont autant d’occasions d’aménager les interactions
entre chercheurs et de renforcer les maillages interprofessionnels, doivent trouver leur
CNRS – Direction de l’Information Scientifique et Technique
80
extension naturelle dans des comptes-rendus pouvant générer de nouvelles discussions
entre les participants, y compris une fois l’évènement physique terminé.
■ Une politique intelligente de l’IST française doit savoir négocier habilement des
ressources et outils issus de la concurrence privée internationale lorsque le rattrapage
de ces derniers par des outils développés nationalement par une agence de l’Etat est
trop coûteux. Les dépenses d’investissement doivent se focaliser sur les clés de
formation, d’unification de l’accès et de partage. Les équivalents internationaux de
SciencesConf tels qu’EDAS, Azur Colloque et Easychair sont plébiscités par les
chercheurs, et les solutions sont à chercher non pas dans un énième effort de publicité
et communication sur SciencesConf, mais dans la capacité de ce projet à innover en
prenant exemple sur les fonctionnalités phares des deux programmes cités. Un paiement
en ligne pour les frais d’inscription aux colloques serait notamment envisageable sur la
plateforme. La plateforme doit mieux savoir communiquer avec l'archive ouverte HAL (ce
qui n'est pas le cas actuellement) et aligner ses fonctionnalités éditoriales sur les
pratiques en vigueur à l'international pour les grosses conférences (plus de 300 articles à
gérer avec des fonctions automatiques). La possibilité de signaler des « conférences
isolées » sur Calenda serait très appréciée.
■ Un autre enjeu en lien avec cet alignement sur les outils disponibles gratuitement sur
le marché, et qui n'est pas des moindres, est de permettre aux scientifiques, de
conserver la souveraineté sur les données (notamment les rapports de relecture) en ne
les laissant pas à disposition d'entités privées qui les monnaient à des tiers pour des
usages non maîtrisés. Sans vouloir créer un « entre-soi », une certaine proximité et
confiance sont nécessaires à la formation d’un environnement sécure et confortable où
les chercheurs et les amateurs intéressés trouvent de l’intérêt à communiquer et à se
passionner ensemble pour leurs sujets d’étude.
2.2. Développer de nouveaux circuits économiques
“Winner takes all, first come first served” ; une approche publique fine
Entrer dans une concurrence directe et violente avec l’offre privée serait
couronné de peu de succès, dans la mesure où des logiques de monopole (le gagnant
prend tout et premier arrivé, premier servi) priment, et que le coût en argent et en temps
nécessaire pour ne serait-ce qu’espérer égaler ces outils par une offre nationalisée serait
trop élevé, sans maximiser l’utilité générale. Des partenariats doivent donc être mis en
CNRS – Direction de l’Information Scientifique et Technique
81
place pour penser le périmètre d’IST nécessaire à chaque acteur, et cette offre
intelligente doit faire l’objet d’une régulation juridique nationale, où l’Etat retrouve toute
sa place de premier plan.
Convergence de principe sur le libre accès, divergence entre voie verte et voie
dorée
Le libre accès, tout comme la recherche elle-même, est une question globale,
traitée par ailleurs à de nombreux niveaux internationaux (Science Europe, Global
Research Council, Knowledge Exchange COAR9 etc), au niveau européen, au niveau
national dans le cadre de la BSN. Cette convergence de principe n'exclut pas les
divergences, avec une opposition portant, notamment sur le modèle d'auto-archivage
(voie verte) et le modèle de publication dans des journaux « Open Access » (voie
dorée). Au sein de cette voie dorée, on peut distinguer deux variantes ; le doré avec frais
de publication réglés par l’auteur ou son institution (dites APC, pour « article processing
charges »), et le doré sans frais, avec de nouvelles formes d’édition. Le lobbying des
grands éditeurs classiques a conduit à décrédibiliser l’Open Access en voie dorée, en
faisant passer les journaux qui le pratiquent pour des prédateurs offrant peu de services
et faisant payer l’auteur. Mais l’incidence du coût ne repose que très rarement sur le
publiant, et n’est que très rarement assumé par l’auteur, mais bien plus souvent par son
organisme de rattachement. Cela ouvre bien des questions, tant sur l’acceptabilité de
nouveaux modèles que sur leur pérennité.
2.2.1. Poursuivre la coordination les efforts de négociation et d’acquisition des
établissements au sein de partenariats européens pour les stratégies d’achat
Le CNRS a une offre de service mais les établissements proposent eux aussi un
service analogue, d’ailleurs gratuit dans beaucoup d’universités pour les unités de
l’établissement. La question de la gouvernance pour la fourniture de documents est
posée.
Un tronc commun, des tailles locales
9 http://www.scienceeurope.org/, http://www.globalresearchcouncil.org/, http://www.knowledge-exchange.info/, http://www.coar-repositories.org/
CNRS – Direction de l’Information Scientifique et Technique
82
■ Elle ne peut être que partagée, et l’initiative des acquisitions pourrait être pilotée
conjointement, par un système en ligne agile, par le CNRS et les COMUE. Le partage
de services doit se faire en parallèle d’un partage de ressources. Le CNRS doit fournir
un « tronc commun », un fond de ressource documentaire, complété sur des sujets de
niche ou spécifiques à un territoire par les Universités et acteurs locaux. D’une manière
générale, il est absolument nécessaire que l’offre du CNRS s’articule de manière efficace
avec les acteurs de l’IST en local, en particulier avec les SCD. La mutualisation doit se
penser selon une approche de complémentarité : d’une part le rôle de
l’accompagnement de proximité doit être dédié aux acteurs implantés en local, d’autre
part au niveau national le CNRS doit proposer des outils et des infrastructures dotés
d’une gouvernance partagée. Les outils proposés doivent être en open source et
complètement adaptables en local. Les ressources doivent pouvoir être librement
modifiées et réutilisées.
Intégrer la dimension européenne des politiques d’acquisition
■ Ce qui a été fait dans ce sens est déjà très concluant, et témoigne d’un effort
national important concernant les stratégies d’achat de ressources. Cependant, la
dimension européenne de ces achats est souvent laissée de côté, et il est envisageable
d’impliquer les partenaires européens tels que le réseau Knowledge Exchange au sein
d’acquisitions coordonnées et négociées, permettant les échanges amiables d’articles au
lieu du paiement systématique et parfois doublonné qui existe actuellement.
Aller vers une plateforme européenne commune à terme, dans un horizon plus étendu,
est également imaginable.
CNRS – Direction de l’Information Scientifique et Technique
83
Une politique publique polymorphe
■ Pour poursuivre cette coordination de façon plus sereine, il est important de ;
- Décentraliser la collecte des avis et besoins
o collecter les avis (COPIST)
o les synthétiser (DIST)
- Centraliser l’offre de services et la formation
- Intégrer la stratégie IST
o à l’échelle européenne
o au milieu entrepreneurial
L’ingénierie de négociation d’achat des ressources et des outils
■ L'ingénierie de négociation d’achat de ressources numériques est une activité
dans laquelle l'INIST bénéficie d’une expérience acquise depuis presque 10 ans
dans les négociations thématiques (pour les portails) ainsi que de celle acquise dans les
négociations nationales (au côté de Couperin, des EPST et de l’ABES) dans lesquelles
l’INIST représente le CNRS. Ces négociations concernent annuellement plus de 50
éditeurs (70 bouquets de revues ou bases de données) afin d’obtenir des baisses
tarifaires, la pérennité des accès et la mise à disposition de statistiques d’usage. Sur
cette base, l'INIST peut apporter une réflexion et un conseil aux Instituts autour du
besoin du chercheur (I’InSHS souhaite un service au plus près des besoins, l’INSIS
n’exprime pas de besoins (à part IEEE), l’IN2P3 n’a pas de besoins identifiés).
■ Parallèlement aux acquisitions de ressources, existent des acquisitions d’outils. Il
serait intéressant d’agréger les données statistiques des portails CNRS à celle des
portails universitaires afin de produire des statistiques consolidées au niveau d'un type
de ressources, d'un labo, d'un établissement ou d'un groupement. Un dialogue COMUE
– CNRS doit être engagé à ce sujet. Il convient désormais de développer le périmètre
des établissements utilisateurs de la solution ainsi que le nombre de plateformes
analysées. Mettre en commun les coûts de développement de services statistiques
performants en utilisant l’Open Source pour certaines parties du code permettrait de
proposer ces services quasi-gratuitement aux acteurs de l’IST.
La prudence des Instituts quant à l’acquisition
■ L'InSHS choisit de négocier lui-même ses revues avec CAIRN, pour rester ferme sur le
périmètre des revues à acquérir. La suggestion est faite d’inclure au besoin un chercheur
dans le périmètre des négociations. L'INSHS entend définir ses acquisitions et
CNRS – Direction de l’Information Scientifique et Technique
84
abonnements au plus près des besoins des chercheurs et des laboratoires. Le RNBM a
tenté de le faire, en se maintenant dans la négociation avec Springer en y amenant un
regard scientifique. Il y a un besoin de soutien juridique aux instituts qui s'engagent dans
les négociations.
■ L’INSMI est en train de monter une organisation de mutualisation afin d’assurer la
pérennité des services offerts par les 3 sociétés savantes (françaises et européenne) les
plus proches de la communauté.
■ En cette période de transition entre les modèles Gold et les abonnements, il est
prudent « d’assurer ses arrières » en conservant un service de fourniture de documents
performant (à ce titre, l’INRA vient de décider de réactiver la fourniture de documents
pour ses équipes de recherche).
2.2.2. Concevoir une offre soutenable pour les établissements, en repenser les
périmètres d’accès
Chaque établissement a des besoins en IST différents, allant de la simple
consultation de titres rapide à des fonctions de suggestion de sujets de recherche
approfondies en passant par des besoins complémentaires de TDM. En dehors des
acquisitions de ressources et d’outils pour les traiter, les frais d’adhésion à un support
sont donc une part majeure du choix complexe que doivent effectuer les décideurs dans
chaque acteur.
1er arbitrage : rechercher sans perdre de temps
■ Un premier arbitrage se fait entre la volonté de pouvoir rechercher l’information
parmi le corpus le plus large possible, sans pour autant consacrer un temps trop
important à cette recherche ; il a été solvé par les puissants outils de TDM qui, en
dépassant largement les fonctions de base d’un simple CTRL+F tapé au clavier,
permettent désormais de rechercher des synonymes, des unités de sens, voire des
motifs iconographiques.
2nd arbitrage : trouver sans trop dépenser
■ Le second arbitrage, en revanche, demeure ; entre cette même volonté d’accéder à
une somme maximale de documents et une possibilité de financement contrainte,
CNRS – Direction de l’Information Scientifique et Technique
85
avec l’impossibilité de déterminer, document par document, lequel entre ou non dans le
périmètre d’intérêt.
Un premier possible : consultation de listes et paiement à l’article
■ De surcroît, si privilégier un système où chacun dispose d’une liste a maxima de titres
de documents, puis doit payer pour en lire le contenu exhaustif (à la manière des articles
de presse présentant seulement un résumé et leur titre gratuitement, ou « paiement à
l’article ») a longtemps paru être une piste envisageable, ce n’est plus vraiment le cas.
En effet, les listes de titres constituent en elles-mêmes, étant donné le volume global
d’information que les éditeurs doivent traiter, une IST valorisable, issue d’un long travail
sur les métadonnées et le référencement, qui ne peut donc pas se voir proposer
gratuitement.
■ Ce traitement de l’IST côté éditeurs rejoint aussi un long travail de préparation de
l’environnement de diffusion par les entités de coordination de l’IST, qui a également un
coût ;
CNRS – Direction de l’Information Scientifique et Technique
86
Les bouquets d’achats, « packs » et autres acquisitions en lots
■ L’acquisition définitive des droits sur les documents par chaque unité est une option
évacuée d’emblée, car d’une part elle accroît la concurrence et la détention exclusive et
va à l’encontre du partage, et d’autre part elle occasionne des coûts bien trop importants,
sachant qu’aucun directeur d’unité ne peut anticiper exactement quelle est la nature et
l’étendue de l’IST que ses chercheurs nécessiteront durant une année civile.
■ Si les « packs » ou options d’achat proposés par exemple par le consortium Couperin
pour adapter le périmètre documentaire selon les besoins de chaque acteur ont constitué
une première étape de résolution, il faut aller plus loin, car nombre de documents et
volumes d’IST sont encore acquis sans jamais être utilisés. Des doublons et une
double irrigation instituts/universités doivent aussi être supprimés dans une
concertation signalant les opportunités de commandes groupées. Et, si des soutiens
ponctuels de la part de l’Etat (subventions, transferts, aides à l’acquisition) ont été établis
sur les 5 dernières années, ce système n’est pas pérenne et ne peut rendre possible une
gestion sereine à long terme de l’acquisition d’IST.
Au-delà des voies vertes et dorées : imaginer un modèle économique des
micropaiements
CNRS – Direction de l’Information Scientifique et Technique
87
■ Aussi, une première solution intéressante serait de mettre en place une tarification qui
voit au-delà des voies vertes et dorées, permettant l’émergence d’un nouveau
workflow, d’un nouveau rapport à la recherche, intégrant totalement les possibles
numériques, sans être le format classique de « paiement à l’article » peu plébiscité par
les grands noms de l’édition, et composée par exemple comme suit :
- Une part forfaitaire, liée au coût logistique pour le fournisseur du service de
recherche centralisé ;
- Une part « sectorielle », liée aux centres d’intérêt scientifique renseignés comme
prioritaires par l’unité ;
- Une part « au volume de recherche », proportionnelle au volume d’IST sollicité
par les recherches de l’unité en question (indépendamment de la lecture effective
des données, il s’agirait d’une compensation du coût de référencement et
d’affichage ordonné, couvrant également la réutilisation-citation de titres) ;
- Enfin, une part « en lecture pleine », concernant les documents (articles,
datasets) lus intégralement ou téléchargés.
■ Une seconde piste non-concurrente, qui reste dans cette approche de l’IST comme un
service partagé payé à l’usage, consiste à rendre disponibles pour un coût moindre les
résultats d’une recherche effectuée préalablement par un chercheur A (en t-1) au
chercheur B en t. L’avantage d’une telle optimisation des recherches serait qu’une partie
du paiement effectué par B (sur la part « en volume ») pourrait être transférée à A au
titre de l’effort de curation qu’il a effectuée sur les données brutes, à la mesure du
nombre d’opérations de filtrage effectuées. L’inconvénient est qu’il faudrait munir chaque
unité, si pas chaque citoyen ou chercheur, d’un compte capable de quantifier l’effort
fourni et reçu, et donc les micropaiements.
Inciter au lieu de contraindre : le principe de confiance contenu dans la blockchain
■ Il faut définir, préalablement avec la DSFIM et la DDAI, les bases budgétaires à retenir
pour encadrer les évolutions possibles. Techniquement toutefois, ces deux options sont
tout à fait envisageables, et rappellent dans leur principe la rémunération interne prévue
lors du « minage » (chiffrement) d’un bloc monétaire (ex : 1 bitcoin) lors du
développement d’une blockchain. En d’autres termes, celui qui permet à l’information
d’exister ou d’être sécurisée reçoit en contrepartie un paiement utilisable seulement
pour acquérir plus d’information. Le principe de fonctionnement en boucle fermée
présuppose que ces micropaiements ne se feraient donc pas nécessairement en
monnaie réelle, mais plutôt sous forme de « points ». De cela résulteraient deux
avantages supplémentaires ; l’incitation à curer les résultats pour en gagner, et
CNRS – Direction de l’Information Scientifique et Technique
88
l’incitation à poursuivre ses recherches, ceux gagnés ne pouvant être dépensés
autrement.
■ En termes de gouvernance, la section IST du CNRS doit se recentrer sur les
compétences IST opérationnelles, et prioriser le fait de rendre possible l’accès sur
l’analyse de ce même accès. Cette dynamique se fonde sur le rapport fourni par le
cabinet Ourouk synthétisant les résultats de l’enquête COPIST 2016. De même, une co-
gestion entre la CPU et les organismes, à partir des retours du COPIST, semble la
manière la plus soutenable et légitime d’opérer la mise en œuvre de ces nouveaux
modèles d’achat.
2.2.3. Etablir un nouveau modèle économique de valorisation (recommandation,
etc.) au cœur d’une Science Ouverte fonctionnant sur le principe de Libre Accès
En dehors de ce premier besoin qu’est l’acquisition d’IST, les chercheurs sont
aussi producteurs d’IST et d’articles issus de cette dernière. Leur existence dépend de
revenus générés par cette production. Il convient donc de mieux valoriser les sciences
dures à travers de nouvelles entreprises, et plus largement de redynamiser les systèmes
éditoriaux pour permettre à tous les secteurs scientifiques, y compris les SHS, d’éviter la
précarisation et la marginalisation.
■ Le chercheur se voit proposer de nombreux outils de valorisation de sa production,
nés sur le marché privé dans les communautés du libre, dans les réseaux sociaux
(Research Gate et Orcid, Scopus, ResearchID, LinkedIn…). Ces outils peuvent à la fois
générer des classifications de thématiques des chercheurs et des publications et de
mettre en relation les chercheurs. Mendeley, par exemple, permet de générer des
bibliographies automatiques, de gérer une bibliographie en collaboration avec d’autres
chercheurs, de trier de la bibliographie et d’être en relation avec sa communauté
Les difficultés de mise en place d’un paiement au volume de lecture
■ Le modèle de paiement au volume de recherche permettrait de rémunérer les auteurs
sur un compte associé à la plateforme. Cependant, plusieurs phénomènes concourent à
rendre impossible une parfaite mise en équivalence entre les paiements effectués et les
CNRS – Direction de l’Information Scientifique et Technique
89
rémunérations reçues par la communauté scientifique sur une période donnée (1 an, 1
mois, 1 jour) :
- D’abord, certains des auteurs dont les ressources sont consultées sont
morts, et les paiements sont difficilement répartissables entre les auteurs vivants,
y compris lorsque ces derniers ont permis la remise au goût du jour des travaux
de leurs prédécesseurs ; en effet, des fondations et éditeurs récupèrent une partie
des droits, et le reste éventuel est moralement impossible à diviser entre les
vivants ;
- Ensuite, certains auteurs sont peu lus, mais leurs travaux n’en sont pas moins
cruciaux, puisqu’ils apportent un regard neuf pour une « niche » de recherche, ou
parce qu’ils permettent de générer, à travers des chaînes causales longues, des
externalités positives en grand volume : on ne peut donc pas mettre leurs travaux
en danger en ne les rémunérant pas à la hauteur de leurs compétences ;
- Enfin, il est difficile de mesurer l’effet du piratage et de la copie illégale de
ressources pour des diffusions internes notamment, floutant le réel usage de
chacun. Le taux d’équipement informatique ainsi que les habitudes du format
papier, combinées à des difficultés techniques majeures (possibilité de faire des
captures d’écran même lorsque le copié-collé est interdit, voire de photographier
l’écran) ne permettent pas aujourd’hui d’envisager une individualisation pure et
parfaitement traçable des points d’accès.
La Science doit trouver des solutions ; à défaut, le marché privé le fera pour elle et
sans prendre en compte les paramètres d’éthique et de service de l’intérêt général
identiquement
■ Néanmoins, le constat demeure le même : la science doit s’ouvrir, et même si elle ne
le veut pas, elle sera ouverte de façon abrupte par le partage sauvage et les pratiques
de peer-to-peer et de téléchargement illégal, la régulation sur le format d’Hadopi ne
pouvant porter ses fruits. Alors, plutôt que de subir cette modalité du partage, mieux vaut
en comprendre les subtilités et en faire un principe-phare
■ Aux tarifs actuellement demandés par l'Edition, le pur doré est difficilement soutenable
comme voie de généralisation du Libre-Accès pour les organismes qui publient
beaucoup. On ne sait évaluer les usages liés au "doré auteur-payeur", qui est représenté
par le projet SCOAP3 (IN2P3 et INP) et les journaux de l’EGU soutenus par l’INSU.
■ Des projets de nouvelles formes d’édition existent, déjà avancés ou mûrs, comme
Open Edition (InSHS), ou ayant émergé plus récemment, tels que le projet
CNRS – Direction de l’Information Scientifique et Technique
90
episciences.org avec les épijournaux en maths et informatique. Il en existe encore
d’autres comme par exemple de nouvelles méthodes d’évaluation du type « open peer
review ». Globalement en France, il existe trois types de projets menés pour renouveler
les modèles économiques ;
Les épirevues (Bordeaux) (IDEX) (OpenEdition)
■ Concernant les épi-revues, une répartition intelligente des fonctions entre les
différents projets (Episcience, I-revues) serait indiquée, passant soit par une véritable
différentiation des offres, soit par une fusion, en vertu du principe de non-
superposition. Par ailleurs, pour que des projets locaux de publication scientifique en
libre accès puissent voir le jour, il faut que les établissements disposent d'une
cartographie leur permettant de s'orienter et de choisir rapidement parmi les possibilités
qui s'offrent, celle qui convient à leur projet et aux moyens dont ils disposent. Le listing
de l’offre de services aux chercheurs établi et diffusé par la DIST du CNRS trouve ici
toute sa place, et doit faire l’objet d’une communication renforcée.
La valorisation par le peer-reviewing
■ La pratique de la recommandation par les pairs, plus connue sous le terme de peer-
reviewing, doit se généraliser pour permettre une présélection des ressources de
confiance dans des supports aux accès plus ouverts et aux volumes sans précédents.
Cependant, des procédures de filtrage manuel doivent continuer à se développer en
parallèle, pour éviter que les sujets les moins recherchés ou les publiants les moins
connus soient discriminés et demeurent en fin de listes perpétuellement.
■ Les chercheurs doivent à ce titre pouvoir disposer d’un Curriculum Vitae (CV)
complet, retraçant avec précision toutes leurs publications, distinctions et participations
à des colloques. Un générateur automatisé de CV, fondé sur un algorithme établissant
des « filtres d’alerte » sur chaque plateforme d’IST, qui se déclenchant à l’apparition du
nom du chercheur, serait utile tant pour les chercheurs que pour les investisseurs et
organisateurs souhaitant opérer une recherche de personnes compétentes sur un point
précis. Pour ce faire, les identifiants nationaux doivent servir de base au dépôt dans
HAL. Pour servir de référence en lien avec IdRef, afin d'identifier et signaler la production
des chercheurs, nourrir et créer les fédérations et réseaux de recherche, l’idée du CV
semble utile. Elle offre une motivation supplémentaire pour déposer dans HAL.
Cependant, le CV doit pouvoir intégrer sous un format interopérable les autres
publications externes certifiées (par exemple par ORCID).
CNRS – Direction de l’Information Scientifique et Technique
91
Une API agile pour automatiser les tâches répétitives qui occupent le chercheur
■ Pour faire simple, en amont (versement automatique des articles dans HAL, aidant
et remplaçant en partie le dépôt manuel) comme en aval (inclusion automatique de la
ligne de cet article dans le CV du/des publiant(s), une API agile et fonctionnelle doit
effectuer les tâches répétitives de publication et post-publication des travaux, l’objectif
étant in fine de laisser le chercheur focaliser sa précieuse attention sur ses travaux de
recherche, et non sur les aspects logistiques d’une machinerie informatique IST étant
devenue trop complexe pour qu’il sache la programmer de A à Z. Cette complexité doit
néanmoins servir l’efficacité au service des chercheurs et des citoyens, et ne pas exister
« pour elle-même ». En ce sens, si la comparaison avec le monde entrepreneurial est
permise, il faut que le « back office » développe des API d’une grande technicité pour
que le « front office », ou en d’autres termes l’expérience utilisateur, soit fluide, simple et
intuitive.
De nouveaux types de contrats d’édition et de formats de publication auxquels la
LPRN ouvre la voie
■ Sertis de grilles tarifaires plus fluides, de nouveaux contrats d’édition permettent de
diminuer le seuil critique de vues à atteindre pour enclencher un paiement, tout en
diminuant la durée des embargos. Ces contrats ont souvent vocation à être complétés
par des revenus fixes, tels que ceux des chercheurs, revenus financés à travers des
organismes tels que le CNRS par les prélèvements obligatoires.
■ En outre, la publication conjointe d’articles avec les données de recherche ayant servi à les rédiger se développe, voire la publication des données elles-mêmes, les « data journals » (Nature, RDJHSS, etc.). Les « mega-journals », s’ils relèvent aujourd’hui du « pur doré » n’en sont pas moins des initiatives originales dont l’arrivée peut bousculer le paysage de l’édition savante de manière importante. En outre, la publication conjointe d’articles avec les données de recherche ayant servi à
les rédiger se développe, voire la publication des données elles-mêmes, les « data
journals ». Les « mega-journals », s’ils relèvent aujourd’hui du « pur doré » n’en sont
pas moins des initiatives originales dont l’arrivée peut bousculer le paysage de l’édition
savante de manière importante. Il ne s’agit plus vraiment de journaux, mais de sortes
d’archives ouvertes payantes et au contenu certifié.
Des modèles commerciaux innovants basés sur l’algorithmique et des indicateurs
CNRS – Direction de l’Information Scientifique et Technique
92
■ Globalement, outre le paiement par l’auteur, divers modèles sont envisageables ; le
financement d’une plateforme par la publicité, l’accès libre conditionné à un
volume de peer-reviewing à effectuer chaque mois (entretenant ainsi une boucle
vertueuse), ou encore le crédit « d’autorité », ajoutant de la force aux reviews d’un
auteur lorsque celui-ci a lui-même reçu beaucoup de reviews positives, avec
cependant le risque de formation de « groupes de soutiens » fonctionnant en vase clos…
Il est évident que les indicateurs comme le facteur d’impact développé par Thomson-
Reuters doivent aussi être agrégés à d’autres indicateurs concernant par exemple
l’audience réelle (nombre de lecteurs) ou la labellisation par des tiers certificateurs
concernant la qualité / respect des données. Plusieurs de ces modèles, rendus possibles
par la science algorithmique, peuvent être combinés afin de limiter les risques de
chacun.
■ Quoiqu’il arrive, même si le modèle de l’éditeur en ligne, basé sur l’éditeur papier
aujourd’hui largement dépassé dans la recherche, doit céder du terrain à des modèles
d’agrégateurs et de référenceurs, le rôle d’hébergeur demeure, avec des volumes de
données de plus en plus importants à mesure que l’exigence de publication conjointe
article + données se renforce. Aussi, l’hébergement coûtant de l’électricité, du
matériel et des ressources diverses, le paiement ne peut totalement être laissé à la
publicité en raison du fait que, contrairement à des plateformes comme Facebook ou
Google, dont les données constituent la valeur, certaines données reliées à des articles
n’ont qu’une valeur marginale lors d’éventuelles vérifications de méthodologie ou de
fiabilité, et non une valeur commerciale brute.
Le règne de l’actualité et des sujets en vogue, à compenser par la suggestion de
sujets
■ Le risque cependant est que le règne du plus intelligent soit parfois remplacé par un
règne du plus visible ; celui qui produit le plus de résultats ou emploie des formulations
allant toujours dans le sens d’une surenchère médiatique emporte la visibilité maximale
et déséquilibre l’attribution des bons résultats aux bons marchés-cibles. Enfin, on assiste
à un règne de certains « sujets du moment », qu’il fait bon étudier pour recevoir des
subventions ou un afflux d’audience, dans une vision très politiquement populiste et
court-termiste de la recherche. Ce côté « auto-entretenu » des logiques de publication en
raison des indicateurs fixes et de l’actualité doit être contrebalancé par l’introduction de
suggestions algorithmiques de sujets de recherche fondées sur les mots-clés les
moins traités, et qui reste insondable et donc imprévisible en étant en partie aléatoire.
CNRS – Direction de l’Information Scientifique et Technique
93
2.2.4. Mettre en place les structures (agences, charte éthique) à même d’assurer
l’application des principes juridiques contenus dans la LPRN (loyauté des
plateformes, lisibilité, exhaustivité)
Enfin, les fonctions d’acquisition et de production d’IST doivent être placées plus
largement au cœur d’un cadre juridique stabilisé et sûr, cocon protecteur respectant les
spécificités liées à certaines données sans ignorer les exigences de partage et celles du
marché, qui ne sont pas nécessairement antinomiques.
Inciter les chercheurs à utiliser les outils publics en soulignant les défaillances
ailleurs, en vue de rationaliser les dépenses publiques
■ Pour les établissements ne disposant pas d’un service d’études bibliométriques, la
voie des partenariats a historiquement été employée comme correctif. Une tension est
perceptible entre les outils promus par le CNRS (Web of Science (WoS), Scopus) et
l’offre externe existante, qui est jugée par certains établissements comme plus
adéquate. Il n’est donc pas possible de lutter frontalement, par orgueil, contre des
outils qui ont fait leurs preuves et en tirent un quasi-plébiscite. Bien plutôt, il convient de
souligner auprès des chercheurs les défaillances de tels outils en matière de sécurité, et
leur coût fort sur le long terme, mettant en comparaison ces modèles privés avec le
modèle de la science publique, coûtant cher dans sa phase R&D, mais beaucoup plus
stable et moins chère à long-terme. L’idée est de sensibiliser le chercheur à l’Open
Science, tout en lui faisant comprendre que le modèle vers lequel tous les efforts privés
tendent aujourd’hui n’est possible qu’avec un Etat fort assurant des revenus aux
innovateurs et chercheurs. Or, ceci passe forcément par l’allocation de produits issus de
prélèvements obligatoires à la recherche (produits dont les vagues de PIA témoignent) ;
ce financement issu des impôts et des taxes pesant sur les ménages et les entreprises
dans un contexte de dégonflement de la dette doit trouver des sources de diversification
via la valorisation (recherche appliquée), mais une part structurelle ne peut être financée
que par l’Etat, notamment en SHS, en raison de la compétitivité culturelle et non-
commerciale engendrée. Ainsi, il n’est ni souhaitable ni soutenable de financer des outils
de traitement de l’IST et des plateformes privées avec l’argent du contribuable, lorsqu’un
modèle d’outils et de supports public est concevable à l’échelle nationale et en
concertation avec l’Europe. Ces incohérences économiques et en matière de
protection des données doivent être mises en lumière et l’arbitrage en résultant de la part
des chercheurs se fera sentir.
Harmoniser les rythmes et délais : vers une concertation nationale
CNRS – Direction de l’Information Scientifique et Technique
94
■ Un verbatim de l’enquête COPIST relevait avec justesse ; « Si la feuille de route HAL
est arrêtée dans le courant du 2ème trimestre 2016, alors il est peu probable que les
demandes formulées par les établissements au cours de cette enquête puissent être
prise en compte dans cette feuille de route. ». Une harmonisation des rythmes et une
synchronisation des consultations à l’échelle nationale entre tous les acteurs de l’IST est
donc nécessaire. En effet, les individus se désintéressent du sujet en l’absence de
prise en compte de leurs avis, et ce durablement.
■ L’arbitrage de la voie partenariale trouve sa source dans la voie éthique ; il faut mettre
en place une concertation nationale des acteurs suffisamment large et englobante pour
être représentative et coller aux réalités du terrain, mais suffisamment peu nombreuse
pour éviter des inerties freinant la créativité ainsi que des lourdeurs occasionnant des
longueurs dans les délais.
Prendre en compte tous les positionnements sous l’exigence absolue d’intérêt
général
■ Il convient d’opter pour un positionnement englobant suffisamment le milieu de la
Recherche et les organismes directement rattachés à l’Etat, sans pour autant céder trop
de terrain à la volonté des GAFAM, qui peuvent avoir des intérêts divergents mais
occupent une place suffisamment importante et mature sur le marché pour pouvoir être à
même de négocier.
Renforcer les agences existantes et en créer de nouvelles
CNRS – Direction de l’Information Scientifique et Technique
95
■ La création d’une centrale de services à l'INIST, en réseau avec PERSEE et le
CCSD est nécessaire.
■ La création d'une Agence nationale de valorisation numérique du travail
scientifique est indiquée afin d’obtenir un interlocuteur unique à même de négocier les
données avec Etalab.
■ La LPRN établit, dans sa Section 3, le principe de « loyauté des plateformes ». La
notion de plateforme telle que le Conseil National du Numérique l'envisage, englobe
toujours un hébergeur et un afficheur, comme Google qui stocke des liens et détermine
algorithmiquement leur ordre d’affichage. Une plateforme peut englober des réalités
aussi variées qu’un moteur de recherche, un comparateur, un site de petites annonces,
une place de marché, un site de crowdfunding, ou encore un réseau social.
La loyauté des plateformes : faire respecter un principe complexe et contesté
■ Les premières versions du projet de LPRN définissaient, en article 22, la plateforme
comme le référencement de biens ou services mis en ligne par des tiers, et la mise en
relation de la demande et de l’offre pour une transaction de vente, de partage ou
d’échange. L’article 19 fondait le principe de « loyauté envers le consommateur ».
Cette notion est à rapprocher de celle d’« exécution de bonne foi du contrat »,
auparavant définie par l’article 1134-3 du Code Civil, mais qui se limitait à la phase
d’exécution, là où le nouvel article 1104 du Code Civil dispose que « les contrats doivent
être négociés, formés et exécutés de bonne foi », en faisant une disposition d’ordre
public. Cela passe par plusieurs leviers de politiques publiques ; apprendre la
programmation informatique à l’école dès le jeune âge, sanctionner les pratiques
anticoncurrentielles, et combler les vides juridiques existants entre les CGU/CGV des
plateformes et les droits de propriété et de travail émergents pour les producteurs et
récepteurs d’IST via l’économie numérique.
La LPRN pose l’obligation de loyauté en ces termes : « Tout opérateur de plateforme en
ligne est tenu de délivrer au consommateur une information loyale, claire et
transparente sur les CGU et sur les modalités de référencement, de classement et de
déréférencement des contenus […] ».
De manière globale, l’objectif de la loyauté est d’empêcher l’existence de plateformes
abusant, au détriment du libre arbitre du client et/ou des droits des producteurs de
données (par exemple les chercheurs), des données mises en ligne par le biais de
CNRS – Direction de l’Information Scientifique et Technique
96
termes de services complexes et trop chronophages pour être lus, dans un monde
où chaque consommateur utilise des dizaines de plateformes.
■ Pour répondre efficacement aux enjeux économiques des plateformes, la LPRN a
adopté une vision transversale du sujet, prenant en compte les aspects suivants, qui
relèvent de différents aspects du droit ;
▪ Asymétrie d’information (en la corrigeant en faveur du consommateur)
▪ Règles de concurrence (en faisant une lecture compréhensive sans
négliger les métiers existants)
▪ Concentration des fonctions et des circuits (en tentant de diviser
juridiquement ces fonctions)
▪ Fonctionnements des marchés multifaces (en formulant des définitions
larges et englobantes)
■ La division des rôles d’une plateforme conduit à établir les frontières de la
« loyauté » autour de l’idée d’afficheur : ce dernier doit dès lors être transparent sur
ce que fait la plateforme : comment choisit-elle les items affichés, quelles règles
régissent l’ordre de classement, qui la finance ?
Elle doit également permettre ;
- à l’utilisateur de modifier les critères de sa recherche
- de garantir l’interopérabilité et la portabilité des données pour changer de
plateforme sans perdre de données
Et cela sans confronter l’utilisateur à un plafond de verre technique limitant ses choix ;
- il doit pouvoir choisir l’usage de toute application, même non certifiée (à ses
risques et périls)
- en créer, pour reprendre le mot de Steve Jobs, et in fine ne pas être contraint
d’utiliser une application.
■ Empêcher les concurrences déloyales et les biais informationnels, tout en rendant
visibles les « empilements hiérarchiques » entre sociétés, constitue le cœur de cette
exigence. Les travaux préparatoires des lois Macron et Hamon désignaient l’obligation
de « faire apparaître clairement l’existence ou non d’une relation contractuelle ou de
liens capitalistiques avec les personnes referencees, [ainsi que] l’impact de celle-ci sur
le classement des contenus proposés » : il est nécessaire de rendre clairs tous les liens
financiers pour garantir le consentement éclairé de l’utilisateur.
CNRS – Direction de l’Information Scientifique et Technique
97
■ Les politiques publiques visant à garantir la loyauté des plateformes relèvent d’une
distorsion de la concurrence, et donc d’une défavorisation des leaders « naturels » ;
en ce sens, les entreprises gérant les principales plateformes n’ont que peu d’intérêts
dans la révélation de leurs modèles économiques, et par conséquent un fort lobbying
anti-LPRN s’applique de la part notamment des GAFAM.
Traces laissées par les personnes dans les systèmes : l’urgence d’un cadrage
éthique
■ L’InSHS souligne l’importance et l’urgence de fournir un cadre éthique au travail sur
les données relatives à la personne, aux opinions et aux préférences. Les SHS elles-
mêmes peuvent contribuer à construire des références. La réflexion est étendue et
pluridisciplinaire. Le TGIR Huma-Num a mis en place une démarche éthique interne sur
les données ethnologiques et sociologiques. Comment traiter la question des traces
laissées par les personnes (les chercheurs) dans les systèmes d’information ? Le Cléo
souligne que les choix éthiques ne peuvent être abordés de façon unilatérale et sans
débat. L’obligation de révéler les données devrait toutefois devenir la règle, et le secret
l’exception nécessaire, afin de permettre la reproductibilité et la « confrontabilité » du
travail de la science. L’INIST émet également une demande dans ces sens. RENATIS
indique disposer d’un Code de déontologie rédigé par des professionnels des réseaux
(2004-2005) à remettre à jour, diffuser et promouvoir auprès des professionnels de l’IST ;
porter à la connaissance des directions d’Instituts, des directions des laboratoires, des
chercheurs.
■ Afin de restreindre les conflits d’intérêt et de leur fournir un cadre d’expression sur
lequel le législateur peut poser un regard informé, une Agence d’Ethique fondatrice et
protectrice d’un texte définissant des normes de discussion et des critères d’acceptabilité
mutuels entre les entreprises et l’Etat pourrait être mise en place. Ce texte,
complémentaire à la Loi qui corrige les attitudes pénalement répréhensibles telles que
le piratage, et qui pourrait s’inspirer de ceux de Renatis et de l’INSB tout en intégrant les
nouvelles variables, serait une Charte Ethique d’application de la LPRN, qui aurait
vocation à faire éclore des décrets d’application facilement acceptables par le Conseil
d’Etat, car issus d’une concertation entre les acteurs concernés, chapeautée par des
juristes spécialisés.
Les axes de réflexion éthique au service de l’IST, et les avancées respectives
■ Parmi les sujets-clés à traiter, figurent ;
CNRS – Direction de l’Information Scientifique et Technique
98
- quel statut donner aux données « brutes » ? Aux données « interprétées » ?
Quelle est la frontière ? La question se pose avec la caractérisation d’échantillons et la
part que peut y laisser la trace laissée par l’outil d’analyse….
- le plagiat
- les données erronées
- la diffusion interne/externe : quels doivent en être les délais ? L’INSU par exemple,
en particulier en astronomie, a une pratique très positive de l’accès ouvert aux données,
tempéré par une période propriétaire – souvent un an – qui permet aux chercheurs ayant
obtenu du temps d’observation sur appel d’offre d’étudier les données avant la mise à
disposition de tous.
■ L’article 29 du Code des contrats européens oblige le dépôt de l’ensemble des
publications financées par le contrat dans des archives ouvertes et de les rendre
accessibles (un embargo est possible en fonction des disciplines). Les coûts générés par
ces dépôts sont éligibles à la justification financière. Il en va de même pour les données
de la recherche (sous-jacentes ou ayant été utilisées pour obtenir les résultats). Elles
doivent être déposées dans un réservoir (sauf dérogations) et rendues accessibles avec
des outils permettant de les utiliser.
- à partir de quel critère les données deviennent publiques ? L’INEE fait observer que
la frontière est difficile à établir : les recherches sur contrat peuvent dans leurs clauses,
prohiber la mise à disposition des résultats et/ou des données : quels critères appliquer
au regard de la libre disposition des résultats de la recherche publique ?
■ L’INSB dispose d’une Cellule Ethique qui veille au respect des réglementations en
vigueur concernant les organismes génétiquement modifiés, les tissus humains,
l’utilisation des animaux, y compris les primates non-humains et toute recherche sur
l’homme. Il pourra être intéressant de partager cette expérience avec les autres Instituts.
Le TGIR SOLEIL souligne que les questions techniques et juridiques doivent répondre à
des règles pas seulement françaises mais européennes. En somme, il faut mettre à
contribution les pratiques existantes en France (Alliances, Organismes de recherche),
comme au plan international (Europe, Grands organismes étrangers…) en examinant les
besoins de Chartes IST spécifiques par domaine ou projets de recherche en vue d’une
contribution au dispositif public Etalab.
2.3. Proposer un point d’entrée unique, tenant compte de la grande
diversité de ressources et de plateformes
CNRS – Direction de l’Information Scientifique et Technique
99
Un certain nombre de réponses revient sur la crainte d’un éparpillement des
outils. Les cinq sections proposées par le COPIST semblent parfois détachées,
disjointes et un manque de cohésion de tous ces outils porte le risque d’un mauvais
usage. Cette lisibilité est aussi liée aux acteurs qui proposent ces services. C’est la
question de l’articulation entre le niveau national (le CNRS notamment) et le niveau
local (les SCD des établissements). Comment le COPIST pourra-t-il prendre en compte
les réalisations locales déjà implantées ? Va-t-il les supprimer ? Le manque de
cohérence viendrait donc d’un risque de doublons dans tous ces services. C’est encore
plus vrai avec les autres dispositifs existants, comme ceux proposés par l’ADBU ou
Couperin. Comment penser la convergence des outils ? Cette cohérence tient enfin à
la matière qui paraît proposée par le COPIST. La prédominance des SHS et le manque
d’accès à des outils utiles pour certaines formations scientifiques apportent le risque d’un
manque d’implication des acteurs concernés. L’interdisciplinarité apparaît aussi
comme un élément de lecture essentiel.
2.3.1. Faire appliquer les principes juridiques de protection des données (secret
dans la recherche, confidentialité, anonymat simple ou coordonné)
La sécurité des données issues de l’IST : aspects matériels et logiciels
■ Les chercheurs, à l’avant-garde des consommateurs interagissant quotidiennement
sans le savoir avec de l’IST (soit qu’ils soient producteurs ou récepteurs), tiennent à la
sécurité de leurs données. Cette sécurité est d’abord informatique. Elle est ensuite
nationale ; une des nouvelles missions de l’Etat est de garantir un niveau de
confidentialité réelle adéquat à chaque situation ; du secret au public, chaque information
doit pouvoir se prémunir d’éventuelles attaques extérieures ou intérieures, de toute
spéculation, et le cas échéant conserver un caractère destructible que la nature même
d’internet rend difficile à assurer. En mettant ces deux premières exigences en vis-à-vis,
il ne faut pas omettre le caractère matériel des installations (serveurs, data centers)
rendant possible le fonctionnement d’internet.
■ L’enjeu de la territorialité du stockage et du traitement des données IST est majeur.
ArXiv est très utilisé par les mathématiciens mais il y a une nécessité que le CNRS ait
une relation forte et construite avec ArXiv. Ainsi, il existe, pour l'INSMI, un risque d'une
relation de dépendance mal contrôlée : la publication scientifique ne peut être placée
dans les mains d’une entité indépendante comme ArXiv, hébergée à l’université Cornell.
Le problème est d’ordre stratégique car cette base est unique. Les miroirs qui existaient
CNRS – Direction de l’Information Scientifique et Technique
100
en Europe sont en train de disparaître. Si l’accès à ArXiv rencontre des difficultés, le
patrimoine scientifique peut se trouver menacé. Pour l’INSU et l’INSMI le maintien de la
relation à arXiv est important : une convention paraît nécessaire. Il faudrait une
négociation globale et siéger au conseil d’administration. Heureusement, le CCSD
gère un des rares miroirs pour les dépôts français d’arXiv.
■ Elle est, enfin, éthique ; en effet, chaque règle établie ne doit pas l’être pour elle-
même, mais en vertu d’un raisonnement humain et juridique complet, qui intègre la
possibilité de sa propre transgression si la sauvegarde d’un intérêt ultérieur et supérieur
l’impose. Pour l’INEE, la sécurité ne doit pas être conçue comme une « action IST »,
mais comme une condition de cette action.
De la PPSI à la LPRN : affiner la définition des matières à protéger et des manières
de le faire…
■ Comment gérer les contenus générés par les utilisateurs ? Comment contrôler les
cookies, les pop-ups qui peuvent autoriser des tiers à s’introduire dans le réseau ? Les
textes de la LPRN sur la sécurité en IST reprennent largement des éléments définis dans
la Politique de Protection des Systèmes d’Information (PPSI) notamment ceux relatifs à
la protection des jeux de données. Il définit des maîtrises de risques et ce que l’on
protège. Des rappels sont faits sur la sécurité en matière de dépôt de brevet, de
responsabilisation des DU et des responsables de projets, ainsi que 3 niveaux de
diffusion : public, interne, confidentiel. Afin d’éviter les attaques informatiques, il faut
encourager l’utilisation d’un cloud privé et appliquer des règles d’hygiène informatique
disponibles auprès des RSI. Les unités doivent non seulement faire signer et appliquer la
charte informatique mais aussi faire remonter les incidents au niveau national
(piratage…).
De la LPRN à une intégration forte des paramètres numériques de l’IST dans
chaque domaine juridique ?
■ Une fois les grandes lignes stratégiques de l’application de la LPRN établies, le
dilemme réside dans l’attitude normative à adopter ; continuer de forger, dans le sillage
de la LPRN d’Axelle Lemaire, une structure dédiée au numérique incluant les
obligations des plateformes… ou plutôt développer le droit des plateformes comme une
extension des domaines de droits existants à un nouvel objet ?
CNRS – Direction de l’Information Scientifique et Technique
101
- La première solution, absolue et monobloc, est séduisante ; elle permet de
regrouper tous les nouveaux problèmes émergents, et leurs réponses correctives,
dans un même texte, sur une page blanche, et donc de sensibiliser tous les
acteurs à peu de frais.
- Néanmoins, dans le texte finalement adopté de la LPRN, on observe une
méthodologie intéressante ; par exemple, l’article 49, définissant les plateformes,
porte modification de l’article L. 111-7 du Code de la Consommation, et le suivant
modifie le Code du Tourisme pour les plateformes telles qu’AirBnb. On assiste
donc dans les faits à un redécoupage des frontières de lois déjà existantes.
- De surcroît, beaucoup de paramètres, tels que les seuils d’audience à partir
desquels la plateforme se voit ajouter de nouvelles obligations, sont laissés à des
décrets ultérieurs, ce qui donne une large marge de manœuvre à
l’administration.
■ Le Conseil National du Numérique a désigné, dans un rapport consultatif, comme
urgent « le renouvellement de la définition de 1996 », mais également « l’adaptation
des lois existantes au numérique », soulignant en filigrane le mirage que représente
un domaine « numérique » unifié et cohérent. En effet, l’évolution des NTIC porte sur
tous les pans de la société, et affecte donc tous les Codes législatifs (travail, propriété
intellectuelle, impôts, etc.).
■ La loi Hamon sur la régulation des comparateurs, puis la loi Macron sur les
marketplaces et les plateformes collaboratives, sont allées dans le sens de la
répercussion de principes généraux sur les différents domaines de droit qu’emprunte le
chemin du consommateur/utilisateur.
■ Il faut cependant veiller à éviter la superposition des normes concernant la loyauté
des plateformes, un « téléscopage » selon le mot de Marc Lolivier, délégué général de
la FEVAD, afin d’éviter une confusion préjudiciable pour les utilisateurs. Ces derniers
représentent plus de 85% des citoyens selon l’INSEE.
Informer sur les droits et les possibles
■ 73% des directeurs d’université n’ont jamais été confrontés à des questions juridiques
concernant la valorisation de données de la recherche. Les 27% restants l’ont tous été
concernant notamment les données à caractère personnel. On observe un score
exactement identique pour les questions juridiques concernant l’ouverture de données
CNRS – Direction de l’Information Scientifique et Technique
102
(open data, données administratives par exemple), ce qui pourrait indiquer une mauvaise
appréhension du découpage sectoriel du droit relatif à l’IST. Concernant l'autorisation
donnée à des tiers d'utiliser et ou de réutiliser des contenus créés dans votre unité et le
dépôt de publications dans une archive ouverte alors qu’un contrat est conclu avec un
éditeur, ou encore le partage de responsabilité entre coauteurs, le nombre d’unités
confrontées à des questionnements sur l’état de la Loi monte à 32% ; aussi, l’angle de
lecture à adopter est un faible degré d’information à mesure que le sujet devient plus
technique et porte non plus sur les individus, mais sur des droits collectifs (de
laboratoire, d’université). Il convient donc de mieux informer, sans vouloir faire de chacun
un juriste.
Gradualité du secret et degrés de confidentialité
■ Une certaine défiance parfois envers les "archives institutionnelles" qui ne servent pas
uniquement à rendre la littérature accessible, mais aussi à faire de la bibliométrie, est
présente. D’une part, il faut donc rendre la bibliométrie plus attrayante et compréhensible
dans le travail quotidien du chercheur, et d’autre part il faut obtenir la préséance d’une
notion de secret graduel. Cette notion de secret doit être articulée algorithmiquement
avec une possibilité de rechercher les données de l’archive via les moteurs de
recherche en utilisant le nom de l’établissement comme critère de requête, en vue
d’obtenir une visualisation des résultats qui respecte les plafonds d’audience définis
localement sans aller en-dessous des planchers d’audience tolérés par les auteurs.
■ Lorsqu’un acteur souhaite enregistrer sur HAL (ou tout autre plateforme publique)
uniquement les métadonnées d’un document confidentiel et en réserver la
consultation à certains secteurs/agents, il faut qu’il puisse le faire techniquement. Cela
n’est actuellement pas le cas, contrairement aux offres proposées par d’autres supports
privés tels que le célèbre Google Drive. Le retrait définitif de fichiers, sans préjudice
de l’archivage pérenne, doit aussi être rendu possible, tout comme une autre
fonctionnalité qui paraît évidente sur le marché privé, à savoir l’empilement automatique
(le nouveau fichier écrasant l’ancien) lors de l’ajout d’une nouvelle version d’un même
document ou source d’IST.
■ Sur cette « gradualité du secret », la confidentialité relative des données échangées
dans le cadre par exemple d’Hypothèses.org (service 3.7.) revient souvent dans les
propos des chercheurs. Il est essentiel d’en assurer la réalité en privilégiant cette
discrétion nécessaire à la finalisation de travaux, qui n’est pas un secret absolu (de
CNRS – Direction de l’Information Scientifique et Technique
103
nouvelles mains et de nouveaux regards sur le travail pouvant être utiles) ni un partage
en Open Access absolu (une trop large audience endommageant la finition du document
tant sur le plan économique que sur celui du contenu).
Un service rendu « pour le » et non « au » chercheur
■ Il faut donc légiférer de façon agile, c’est-à-dire mettre en place des règles claires,
faisant appel au bon sens, qui ne nécessitent pas de lourdes campagnes d’information
pour être respectées. En d’autres termes, la loi doit définir l’étendue des possibles
techniques des outils et supports, qui conditionnent à leur tour les usages. Car tenter de
conditionner directement, par voie législative, les usages et habitudes (voire les
traditions) ancrés dans le milieu de la recherche française est voué à l’incompréhension,
et donc à l’échec. Pour faire bref, il faut envisager l’exigence juridique et technique
comme un service rendu non pas au chercheur mais pour le chercheur.
2.3.2. Tenir compte des évolutions vers l’interopérabilité des outils de l’industrie
et des voisins européens
Il faut tirer le meilleur parti d’un fonds documentaire d’une richesse inédite pour
rendre l’IST française compétitive.
Retravailler l’interopérabilité et la complémentarité de divers services
■ Il paraît essentiel de signaler les thèses en ligne dans le SUDOC, dans cette
perspective de mise en relation de toutes les sources d’IST afin d’éviter un dispersement
superficiel qui entrave la maximisation des fruits de la recherche sur l’IST.
■ Il faut notamment retravailler l’interopérabilité et la complémentarité de services
tels que Cedram ou I-Revues, qui possèdent une interface un peu dépassée et
doublonnent d’une part entre eux et d’autre part avec les services existants tel que
Gallica, Persée pour les fonds patrimoniaux, revues.org ou des plateformes développées
au sein des établissements.
■ Le mode d’intégration automatique des notices dans la collection n’est pas toujours
clair ni efficace et génère lui aussi beaucoup de travail de vérification. De surcroît, en
l’état, la fonctionnalité permettant à n’importe qui de créer une collection dans HAL
entraîne une cacophonie des intitulés, parfois inintelligibles, ou similaires à ceux d’une
collection institutionnelle. La solution semble être d’intégrer plus de peer-reviewing, et de
CNRS – Direction de l’Information Scientifique et Technique
104
classer la visibilité des collections en fonction de l’aval, de la validation par chaque
secteur de ces dernières. L’administrateur d’une collection institutionnelle devrait être
informé par des notifications push et mail lorsqu’une collection identique ou semblable à
la sienne est créée dans le domaine d’activité auquel il appartient. Un niveau d’astuce
supplémentaire consisterait à doter ce peer-reviewing, idéalement fonctionnant sur le
principe de la blockchain, de pondérations des « points de confiance » accordés selon
des paramètres tels que la proximité du votant avec le publiant (corrélé négativement),
ou l’appartenance du votant au milieu de recherche concerné par la collection (corrélé
positivement).
■ L’articulation de ces différents niveaux de service pourrait se faire autour de fonctions
« sociales » ; par exemple, la possibilité d’annoter des textes au sein de collections qui
correspondraient à des « éditions critiques ».
Le projet ISTEX se réoriente afin de pouvoir constituer un exemple
d’interopérabilité
■ L’accès aux ressources documentaires est aujourd’hui très diversifié, et passe par
divers points d’accès. Le projet ISTEX porté par la DIST, d’abord focalisé sur le stock
documentaire, se tourne désormais vers l’acquisition du flux, des nouvelles ressources,
en s’organisant autour d’outils d’analyse approfondie, et vers une méthode
d’interopérabilité permettant d’adapter ISTEX aux supports et usages de chaque acteur.
CNRS – Direction de l’Information Scientifique et Technique
105
2.3.3. Permettre l’adoption de référentiels et standards normés communs
A l’heure actuelle, il existe une grande diversité de systèmes utilisés pour traiter
l’information ; en découle donc une immense variété de formats, qui rend
l’interopérabilité difficile et empêche l’élaboration aisée de visions d’ensemble claires.
Normes communes de formulation : un bref rappel de la situation
■ Des normes communes de présentation et formulation existaient déjà avant
l’invention de l’imprimerie pour communiquer le fruit d’une pensée, le résultat d’un
long et abouti travail de recherche. L’imprimerie, pour permettre la diffusion uniforme
d’un même contenu équivalent et vidé le plus possible du caractère aléatoire de
l’interprétation individuelle, de la « mauvaise lecture », en d’autres termes, a rendu
nécessaire l’émergence de standards de typographie, tels que la police, la hauteur de
caractère, l’empâtement Serif ou encore la justification des colonnes de texte.
■ Parallèlement, des standards de référencement bibliographiques communs
tentent d’émerger, notamment avec les universités britanniques et celles de la Ivy
CNRS – Direction de l’Information Scientifique et Technique
106
League. Tout le monde a entendu parler de la bibliographie « à la française », « à
l’anglaise », ou de la « méthode Harvard ». On constate donc que bien souvent, il existe
une variété de standards, selon les pays, les écoles, voire les maisons d’édition. La
formulation des résultats semble donc ne pas pouvoir être universelle in fine car il existe
une concurrence entre les producteurs de connaissance, qui veulent voir leur standard
privilégié. L’Etat ou l’autorité indépendante gérant un domaine défini doit donc pouvoir en
établir des normes, dans un contexte où la part des brevets dont les inventeurs sont
localisés dans deux pays différents ou plus est passée de 3,5% en 1994-1995 à
7,1% en 2004-2005 selon l’OCDE. Il faut organiser prioritairement le recueil (avec une
estimation de la complétude des données recueillies) et la mise à disposition des
données de publication en estimant la complétude des dispositifs de
référencements/Instituts ou sur un échantillon d'unités en partant de l'exploitation de la
question suivante de l'enquête des DU : « Ce référencement est-il exhaustif par rapport à
la production de l’unité ? », en mesurant le lien, s'il existe, de cette valeur de complétude
avec la manière dont le référencement est effectué : saisie manuelle ou téléchargement
à partir de bases de données existante.
Les exigences dans la formulation des résultats par le chercheur : unicité,
hiérarchisation, scalability
■ Formuler un résultat, c’est accepter sa continuité et son interprétation dans les
mains d’autrui, et rejeter radicalement sa déformation en revanche. Pour superposer ces
deux objectifs, il faut être clair, mais ne pas fermer la boucle. A titre d’exemple, la
direction scientifique du CIRAD, le Centre de coopération International en Recherche
Agronomique pour le Développement, possède une section dédiée aux protocoles de
formulation du résultat scientifique dans sa délégation à l’IST, qui propose dans son
rapport de 2015 plusieurs procédés afin de rendre extensibles la portée comme les effets
d’un résultat.
■ Il y a d’abord une exigence d’unicité ; les figures et tableaux doivent se lire
indépendamment des textes, et rien ne doit se répéter. Les mêmes mots ou expressions
doivent être employés pour désigner le même objet, traitement, variable, ou concept.
■ Il y a, ensuite, une exigence de hiérarchisation : commencer par le résultat majeur de
votre recherche, puis ceux qui s’y rapportent en arborescence, et éliminez ceux qui n’ont
qu’un lien infime voire pas de lien du tout.
CNRS – Direction de l’Information Scientifique et Technique
107
■ Et il y a, enfin, une exigence sur laquelle l’anglais, le premier, a mis un mot :
scalability, qui englobe et recoupe en français les sens d’évolutivité, de capacité à
monter en charge, d’extensibilité et de facilité à changer d’échelle.
Le correctif apporté par le TDM doit être complété en raison de l’augmentation, de
la diversification et de l’interconnexion croissantes de l’IST
■ Le TDM est un correctif partiel pour ces failles, ces défauts de longueur qui rendent
difficile la sédimentation pour l’individu d’une somme à chaque instant exponentiellement
plus grande de résultats, mais en tant que chercheur, intégrer l’idée que l’on n’est pas
tout seul à devoir être lu ou écouté dès la formulation du résultat est encore mieux.
■ Du niveau « recherche universitaire » au niveau « école primaire », le même résultat
doit être reformulable sans perdre son sens général. La fluidité de cette mise à l’échelle
permet de connecter par un lien permanent et perpétuel les différentes sphères de
l’apprentissage, et c’est en cela que sont porteurs des projets comme la très grande
infrastructure de recherche (TGIR) Huma-Num, porté par le CNRS, l’Université d’Aix-
Marseille et le Campus Condorcet, et qui s’inscrit dans le projet européen DARIAH
(Digital Infrastructure for Art and Humanities).
■ L’émergence relativement récente de l’ère numérique a renforcé cette nécessité
d’universaliser la manière standard de présenter un résultat afin de le rendre facilement
transférable, transposable, et de faciliter son commentaire. En effet, trois facteurs ont
transformé la production des connaissances, et ont accru cette nécessité ;
- la multiplication de la quantité de sources, qui malgré des outils de TDM
avancés ne permet pas d’échapper au brouillage de l’information.
L’universalisation des formulations par les auteurs, les producteurs de
connaissances, dès la source, permettrait d’automatiser ces procédés coûteux
en temps et sous-optimaux car soumis à trop d’aléas. Basiquement, désigner le
même objet « x » par le même terme « y » partout où il est mentionné permet de
rendre le TDM plus efficace ;
- la diversification de ces sources ; le spécialiste est désormais partout, sur les
forums et sur la section commentaires, prêt à contredire ou documenter un
argument, et à l’inverse l’amateur éclairé ou le profane peuvent désormais
formuler des résultats à leur échelle, qu’il convient de vérifier. Cette diversité
CNRS – Direction de l’Information Scientifique et Technique
108
socio-professionnelle se combine à une diversité linguistique incroyable, qui
rendent nécessaire la pratique de formulations communes ;
- enfin, internet, en ce qu’il est internet, a connecté entre eux les concepts, puis
les objets, et désormais les intelligences artificielles. Ces systèmes
fonctionnent avec un langage informatique rationnalisé, binaire, qui est formé à
partir de langages intermédiaires comportant des commandes arbitraires fixées
par l’homme et pouvant s’apprendre. Ces langages de programmation, qui
ressemblent au langage mathématique en ce qu’ils existent de façon exogène
aux langues verbales nationales, est une réponse partielle aux divergences
linguistiques mentionnées plus tôt, et une porte ouverte aux collaborations
internationales.
Mise en commun normative : initiatives prises et contraintes de chaque langage
■ C’est dans le sens de cette universalisation que va le Référentiel Général
d’Interopérabilité, officialisé par l’arrêté du 20 avril 2016 (JORF N°0095 du 22 avril 2016),
et ayant pour but de permettre aux conservateurs de données de les fournir dans un
format universel, opérable par tous les acteurs.
■ Il existe cependant plusieurs contraintes à cette adaptation. En effet, pour employer
le langage du code informatique comme socle commun, encore faudrait-il qu’il soit unifié,
car l’existence de différents codes selon le type de firmes ou de produit nuit à
l’universalisation aisée de la formulation de résultats. De plus, les chercheurs en
sciences sociales, et plus largement toutes les sciences dites « non-dures », rechignent
encore à apprendre, utiliser ou même jeter un œil à ces formes de langages nouveaux,
notamment car il s’agit pour eux d’une réduction au tout-chiffré, d’un avilissement de la
langue classique d’une part, et d’autre part car ils considèrent que l’effort
d’apprentissage à fournir n’en vaut pas la peine. Peut-on imaginer un monde où chacun
apprendrait une langue universelle verbale (l’anglais par exemple) et un langage de code
scientifique, un langage logique universel en parallèle dès le plus jeune âge de la vie ?
■ On peut même rêver d’une formulation universelle, qui aurait la rigueur des
mathématiques et l’intelligence prospective de la logique philosophique, qui permettrait
de mettre tous les résultats dans un même système de registre. Cependant peu
d’initiatives vont dans ce sens. A titre d’exemple crucial et marquant, l’identifiant
idHAL est lié à la plateforme. Le lien entre « structure » et « objet » n’est pas le bon.
CNRS – Direction de l’Information Scientifique et Technique
109
Vers la complète universalisation des normes ; référentiel national d’autorité,
signature monoligne
■ Une stratégie unique et internationale est attendue, car la multiplication des
référentiels de structures et d’auteurs appelle à conduire une réflexion globale sur la
production et le partage de ces référentiels, ainsi que sur leur alignement, dans une
logique Web de données : ce travail a certes commencé à être engagé par le CCSD
avec idHAL, mais aussi par la BnF (data.bnf.fr) et l’ABES (IdRef), lesquelles projettent la
création d’un référentiel national d’autorité, ouvert à d’autres partenaires (INIST-CNRS,
CCSD, Archives de France, …), et qui a vocation à favoriser l’utilisation de normes et
standards internationaux (standard ISO International Standard Name Identifier (ISNI),
ORCID). C’est dans ce cadre partagé internationalement que doit s’inscrire la stratégie
de HAL, plutôt que de proposer HAL, outil spécifique à l’ESR français, comme un cadre
national. Il faudrait plutôt renforcer les projets comme CONDITOR, qui vont dans le
sens d’une universalité du standard, ou employer les identifiants ORCID sur HAL.
■ Adopter un langage commun dans l’écriture de l’information, des références et
métadonnées semble essentiel ; c’est à ce prix, par un effort partagé et réparti sur
chacun « à l’amont », qu’un système IST cohérent peut se mettre en place, et cela ne
peut passer que par la formation. En effet, une politique « à l’aval », consistant à modifier
les erreurs de format de chacun de manière centralisée, ne peut assumer un rôle
national aussi lourd, et n’agit que comme palliatif du facteur « erreur humaine ». En effet,
si l’informatique peut fonctionner en réseau, c’est grâce au caractère universel du
langage binaire, et semi-universel des langages humains produisant ce langage machine
(langages de programmation ou « codes »). Il en va de même pour l’IST.
■ Le principe de la signature monoligne est retenu avec :
- Nom du laboratoire (sigle)
- Tutelles (pas d’importance sur leur ordre)
Ne pas indiquer l’appartenance à des Labex, Idex… mais l’indiquer dans les
remerciements
- Terminer avec l’adresse contenant le nom de la ville
Le document correspondant a été préparé par la DASTR qui est en charge de ce
dossier, et validé en comité de direction. Reste le cas particulier de personnes membres
du laboratoire dont l’employeur n’est pas tutelle, dans ce cas on ajoute l’employeur de la
personne si c’est un établissement public. Ce document a obtenu de larges réutilisations
(Sorbonne, Université Pierre et Marie Curie (UPMC), etc.).
CNRS – Direction de l’Information Scientifique et Technique
110
2.3.4. Rendre le dispositif modulable pour s’adapter aux différents besoins
Tenir compte des usages pour fournir un outil approprié que le chercheur a envie
d’utiliser
Il faut tenir compte des usages (étude COPIST) et des types de données les plus
employés dans chaque domaine scientifique afin de ne pas proposer d’outils totalement
inappropriés qui découragent par la suite le contact du chercheur à l’IST. Cette « non-
appropriation », qui prend tout son sens dans son étymologie, par opposition à
l’appropriation permise par le don d’un outil adéquat à chacun, que chacun prendrait en
main avec enthousiasme et soulagement, peut relever soit de l’excès soit de
l’insuffisance vis-à-vis du besoin réel de l’individu. En effet, un excès dans l’offre conduit
à devoir remplir de longs et fastidieux protocoles, ou à avoir accès à trop de données
pour des travaux qui ne les nécessitent pas, et une insuffisance conduit à trouver des
protocoles/sources dérogatoires, le protocole/source proposé ne suffisant pas. Bref, le
modèle de la plateforme (tel qu’on entend ce terme lorsqu’on qualifie les GAFA de «
plateformes ») gagne aujourd’hui l’IST. La bonne réponse à cette situation ne réside pas
dans le schéma-type du « portail », solution phare des années 2000, mais plutôt dans
l’idée de construire la réflexion à partir d’une analyse de la situation actuelle, plutôt que
d’essayer d’adapter les outils hérités d’hier à une situation qui a profondément évolué, et
va continuer de le faire dans les années à venir.
4 catégories d’activités pour le chercheur : un document résumant l’offre de
services
■ Un premier pas nécessaire, peu coûteux et non-contraignant pour l’usager consiste
en la création d’une « plateforme des plateformes d'IST » à partir de la DIST et sous la
forme d'un aiguillage selon 4 catégories correspondant aux activités du chercheur (#1.
Me documenter. #2. Publier. #3. Être accompagné.e. #4. Analyser.). Il s’agirait d’une
forme d’annuaire en ligne, très simple, réutilisant le pointeur sur les services déjà
disponible en version PDF sur le site de la DIST, afin de permettre une vision
d’ensemble des outils disponibles et dont les droits sont ouverts pour chaque chercheur,
en s’inspirant du modèle étatique de site permettant de déterminer l’étendue des droits
ouverts pour un citoyen ou un foyer fiscal (aides au logement, bourses, réductions et
crédits d’impôts, etc.).
Le nœud gordien du dilemme centralisation/décentralisation peut être tranché par
la technologie et une communication forte
CNRS – Direction de l’Information Scientifique et Technique
111
■ L’exigence la plus élémentaire est de ne pas créer un outil d’ingénieur « déconnecté
de la réalité de travail du chercheur ». La technique de la marque blanche, consistant à
programmer une API ou un outil dans un langage permettant son intégration à n’importe
quel site local, afin de rapprocher les options de personnalisation d’un portail commun de
chaque utilisateur final, est à privilégier pour assurer l’interopérabilité, en sus des
référentiels communs. Le paradoxe apparent entre la centralisation et la décentralisation
de la gestion de l’IST nationale est un nœud gordien que seule la technologie est à
même de trancher. En faisant de ce point d’entrée unique un outil interopérable et
intégrable à chaque support local, on en fait une barre de recherche améliorée, munie de
nombreux filtres et outils d’analyse, et donc un format adaptable facilement adoptable.
■ Le principe ayant été éprouvé avec, à sa base, la formation d’un consensus dans le
sillage des premières réunions et expérimentations, la réflexion technique doit aussi tenir
compte de la démarche conduite au sein de l’AMUE dans le cadre du projet SINAPS qui
propose des briques logicielles à tous les acteurs de l’ESR pour permettre aux
établissements de gérer en interne leurs propres référentiels et qui prévoit
l’interopérabilité avec des référentiels communs nationaux.
2.3.5. Bibliométrie et outils assimilés : vers la curation et la facilitation de
l’exploitation des données de la recherche
Outre l’utilisation des données issues de l’IST, l’analyse de cette utilisation
constitue à elle-seule un nouveau champ disciplinaire, intéressant tant la recherche que
les entreprises. A la marge de cette analyse en profondeur des volumes et directions de
l’utilisation, des services de curation permettent de faciliter l’accès à l’IST en renforçant
les logiques d’identification des contenus (tagging), de notation (marking) et de
classement (ranking).
Mettre à disposition un service plutôt que fournir systématiquement, en analysant
les besoins grâce aux indicateurs du SAPPS notamment
■ L’intérêt pour les services d’études bibliométriques se trouve dans la mise à
disposition des outils d’analyse plus que dans la fourniture directe du service. Ce dernier
est néanmoins difficile à externaliser, et il convient encore une fois de former à l’analyse
de l’IST, afin de passer d’un modèle profanes-spécialistes à un modèle de capacitation
généralisée des chercheurs, puis dans un second temps de la société civile. L’idée n’est
pas de faire de chacun un expert de l’IST, mais bien de rendre chacun capable
CNRS – Direction de l’Information Scientifique et Technique
112
d’analyser l’IST qu’il a à sa disposition. Il faut par exemple prendre en compte les
spécificités SHS en sortant du panel d’indicateurs quantitatifs existants afin de mettre en
œuvre une bibliométrie qui corresponde à chaque domaine de la recherche et aux
formats particuliers de leurs IST. Des indicateurs bibliométriques (répartition par institut,
relations interdisciplinaires, part nationale ou régionale, collaborations internationales,…)
sont produits par le SAPPS et sont largement utilisés. Toutefois, les instituts ne
disposent pas toujours d’une vision complète de leur production scientifique (l'INC par
exemple, le fait observer) et apprécieraient la mise à disposition d’outils de gestion
bibliographique optimisés et partagés. Dans ce sens, apparait la demande d'une
exploitation plus ciblée, de la base issue du WoS, par repérage des unités CNRS dans
les affiliations. La demande en est exprimée par certains instituts (INSB par exemple).
D’autres méthodes de mesure complémentaires sont souhaitées dans les cas où,
dans le cadre des métriques existantes, la France n’apparaît pas à la place qui est la
sienne dans le travail des communautés scientifiques correspondantes (c’est le cas de
l’IN2P3 qui observe la nécessité de faire mieux ressortir la place qu’il occupe dans les
publications au CERN).
■ Concernant la mise à disposition de ressources terminologiques scientifiques et
techniques, l’ADBU signale qu’une articulation avec les initiatives des autres opérateurs
nationaux qui interviennent sur les questions de signalement serait très souhaitable et
permettrait de mieux valoriser la plus-value de l’INIST dans ce domaine. Ainsi, une mise
à disposition des outils peut passer par ;
- Une plateforme des vocabulaires de l’ESR
- Des alertes pour informer sur les thésaurus alignés
- Un lobbying pour les thésaurus internationaux (Gemet par exemple)
- Une assistance au traitement ponctuel de vocabulaires
■ Les sites de veille d’actualité en IST (service 6.1.) manquent de notoriété et de
visibilité. Ce sont des sites d’accès à l’IST et à ses réflexions, mais pas à de la veille
disciplinaire. La LIST suit un éventail trop important de sujets, difficiles à suivre dans leur
totalité et avec le même approfondissement. Les sites doivent donc aller vers une fusion
progressive.
Disposer d'une politique cohérente d'affiliation
■ Cette politique, à laquelle travaille la DASTR par le biais du SAPPS, est un facteur
majeur d’optimisation pour toutes les étapes de construction de l'action d'IST. Il a déjà
CNRS – Direction de l’Information Scientifique et Technique
113
été préconisé à plusieurs reprises que, notamment dans les contrats entre le CNRS et
ses partenaires, la mention de CNRS soit obligatoire : en pratique ce n’est pas toujours
le cas ; or, de la précision des affiliations de chaque papier dépend la précision des
indicateurs et des classements au sein d’outils tels que Google scholar, Publish or
perish, Research Gate, H-Index du WoS : il faut inciter à la discipline collective sur ce
point !
Accompagner les chercheurs dans la valorisation des données et la création de
DMP
■ L’accompagnement des chercheurs pour la gestion et la valorisation des
données de recherche (service 5.1.) doit être effectué de façon permanente, sans pour
autant interférer avec les initiatives locales. L’ADBU abonde également dans le sens
d’une formation coordonnée par l’INIST mais dont la responsabilité repose sur les
professionnels locaux qui sont les personnels d’appui naturels des communautés
locales. Créer une forme de « SUDOC des données IST », sur la base d’un service
centralisé décliné de DMP Online et fonctionnant grâce au réseau des archivistes de
terrain est une option. L'INS2I suggère la mise en place d'une structure de DMP avec
diverses étapes, ce qui permettrait de posséder non pas simplement des modes d’emploi
mais aussi des normes communes en termes de curation. Le CNRS est quant à lui
globalement attendu pour son appui technologique et logistique (ex : le stockage) et
pour la sécurisation des données. Le modèle du Digital Curation Center (DCC) en
Grande-Bretagne paraît un bon moyen d’impulser une politique coordonnée au niveau
national et efficace sur le plan local. Créer un partenariat sur ce point avec le projet
d’entrepôt national de métadonnées de l’ABES est aussi indiqué.
Développer des métriques alternatives, récupérer les métriques existantes pour
forger des bases de données cogérées et publiques
■ Enfin, une démarche en cours grandissante met l'accent sur les métriques
"alternatives" (Altmetrics), qui s'appuient sur les pratiques des chercheurs et les analyses
(préférences et opinions, notamment). Des alternatives aux indicateurs historiques
tels que le Facteur d’impact apparaissent ainsi, et sont proposées à l’échelle
internationale. Il y a place également pour les analyses heuristiques et leurs
développements en cours (Méta et Hyper-heuristiques nées dans les applications
industrielles de la recherche). Le colloque Innometrics constitue pour la seconde
année consécutive un grand rassemblement destiné à approfondir ces sujets avec tout
l’ESR.
CNRS – Direction de l’Information Scientifique et Technique
114
■ Certaines infos bibliographiques passent aujourd'hui sur les réseaux sociaux de type
Mendeley ou Academia. Il serait intéressant de les récupérer. L'idée de proposer des
outils de gestion d'éventuelles bases documentaires est bonne, mais la récupération de
notices depuis les catalogues de bibliothèques, les bases de données ou les bouquets
électroniques doit être facile. De toutes les manières, ce service demeure parfois
inadapté selon la nature de certains établissements, comme en témoigne l’un des
verbatims de l’étude COPIST ; « Notre institution ne souhaite pas encourager ce type de
démarche individuelle de constitution de bases de données parallèles à la base de
données institutionnelles. ». Le développement d’outils d’analyse en open source et
avec le concours des bonnes volontés locales doit donc au fur et à mesure remplacer le
développement en version propriétaire ou en version centralisée publique.
2.4. Sauvegarder la pérennité et la compétitivité de l’IST française
Il est donc nécessaire de garantir la production d’IST, mais il ne faut pas négliger
d’assurer l’archivage pérenne des documents anciens (numérisation) et récents
(système de dépôt central). En outre, fournir un cadre complet d’assistance à la
publication pour les chercheurs, au sein d’un environnement juridique évolutif et
protecteur, constitue une démarche cruciale qui compense les manques structurels
irréductibles des politiques de formation et de changement de modèle économique.
2.4.1. Construire un programme national cohérent et interdisciplinaire de
préservation du patrimoine scientifique incluant un archivage pérenne (HAL,
ISTEX)
Il y a donc aujourd'hui un important besoin d’archivage pérenne, de recensement
de l’existant et par la suite de pouvoir faire des choix quant à ce qu’il faut garder ou pas.
Les universités et les instituts de recherche sont intéressés par la gestion et l’exposition
des bases de données produites dans leurs établissements, mais ne relevant pas du
champ d’application d’entrepôts thématiques ou institutionnels. Ce spectre étant très
large, des coopérations sont à valoriser, par exemple avec Huma-Num (très grande
infrastructure dédiée à la recherche en SHS) travaillant sur l’objet des humanités
numériques ou l’UMS 3468 « Bases de données Biodiversité, Ecologie, Environnements
Sociétés (BBEES) ». Mettre en place prioritairement un dispositif de
recensement/signalement des bases de données produites par les unités en menant une
enquête avec un site de dépôt (similaire à l’action BBEES) à démarrer avec un institut
CNRS – Direction de l’Information Scientifique et Technique
115
pilote, en vue de définir les métadonnées nécessaires au signalement et à l’identification
(DOI) des jeux de données en recensant les pratiques existantes par des schémas de
métadonnées disciplinaires.
La perte sèche de données : une hémorragie pas tout à fait arrêtée
■ Cristinel Diaconu (IN2P3) parle également de la perte sèche, en termes de données,
qu’occasionne la suppression des données inutiles, trop massives ou contraires, à l’issue
d’un projet par les chercheurs. Cette perte sèche demande de fournir à nouveau les
efforts de recherche si un projet semblable qui aurait pu les utiliser s’ouvre dix ans après.
Elle estime à 1 millième du coût total l’épargne réalisée en ne conservant pas tous
les résultats, alors que la rentabilité de ces données sur 5 ans est en moyenne de
10%.
■ On pourrait donc envisager la sauvegarde d’un maximum de données comme un
enjeu national pour l’Etat, qui jouerait un rôle d’arbitre répartissant vers les bons marchés
ces résultats, aujourd’hui voués à la corbeille faute de visibilité. L’article 30 de la LPRN
institue un allégement juridique progressif de la protection des résultats, pour aller vers
l’Open Science, qui en diminuant le coût marginal pour une entreprise de recevoir un set
de données, augmenterait les possibilités d’optimiser les découvertes de la science dans
l’économie.
■ Pour les disciplines qui relèvent des Big Data (HEP par exemple), les infrastructures
de calcul assurent les fonctions de base de gestion des données (stockage,
sauvegarde), mais rarement très au-delà de la vie des projets. Une infrastructure de
données se doit d’inclure dans ses services les dimensions archivage pérenne, règles de
partage et de réutilisation, gestion des accès, … Il n’en est pas de même des nombreux
projets « small data » qui présentent des solutions de gestion de données moins sûres
et moins pérennes. Il s’agit donc de mettre en place une offre de services, en liaison ou
non avec l’offre de calcul, s’appuyant sur les moyens des laboratoires, les centres de
type CC-IN2P3, CINES, mais aussi INIST et cloud CNRS.
Prendre en compte les archives locales au sein de HAL
■ Il faut que les archives institutionnelles locales soient prises en compte. Au sein de
HAL, il faut développer la précision des statistiques déjà existantes, et ne plus rendre
obligatoire le passage par le protocole SWORD, très long et très développé. Il
manque un dépôt rapide pour les chercheurs, ainsi que pour les bases de données. Un
CNRS – Direction de l’Information Scientifique et Technique
116
répondant va jusqu’à dire ; « Il est insensé que le dépôt masqué ne soit pas encore
proposé, alors que c’est une fonctionnalité techniquement basique, maintes fois
demandée, standard dans les archives ouvertes du monde entier et qu’elle est la
condition de possibilité technique d’une politique de dépôt systématique ». Une
interrogation annexe porte sur la capacité de HAL à produire des statistiques sur
mesure concernant le nombre d’auteurs, le rang, les quartiles… Un nombre important de
chercheurs comparent HAL à ResearchGate (« pourquoi est-ce si compliqué dans HAL
alors que dans ResearchGate, il suffit d'un clic pour dire si c'est notre publication ou non
et celle-ci est intégrée »). Les arguments de pérennité pour le dépôt et le CV chercheur,
de transparence (porteur de Hal CNRS) dénuée de business caché, de facilité de dépôt
grâce au DOI et au PDF etc. doivent faire l’objet d’un regain d’attention.
■ HAL doit effectivement viser l’exhaustivité, et donc prendre en compte les structures
rigides de certaines disciplines. Les pistes envisageables rejoignent toutes l'élaboration
d'une procédure accélérée/allégée de dépôt ou de pré-dépôt, d'un "dépôt rapide" ou d'un
"dépôt en trois clics" sur le modèle des expériences existant déjà, telles que DISSEMIN,
permettant de revenir compléter le dépôt a posteriori. Cette exhaustivité passe par
une automatisation des interactions entre les échelles ; à ce titre, l’Ifremer souligne :
« Il serait intéressant d’avoir des droits liés aux affiliations Ifremer présentent dans les
références de HAL sans pour autant s’engager à entretenir un portail parallèle à notre
archive. HAL améliorerait ainsi la qualité et la complétude de son contenu et les
établissements pourraient agir directement sur leurs références sans demander un
partage de propriété référence par référence au contributeur. »
Quelques pistes complémentaires
■ Les autres pistes complémentaires pour répondre à l’utilisation encore fragile et
incomplète du dépôt dans HAL sont, outre une intégration de DISSEMIN ;
- Un fichier d’autorité des laboratoires
- Un réseau social des chercheurs intégré à HAL
- Un site ergonomique, attrayant et design
- Un lien pour le référentiel, avec RNSR
- Une amélioration de la saisie du dépôt
- Des exports paramétrés
- Une récupération automatique depuis le WoS ou Scopus
- Un lien avec les bases de financement ou d’appels à projets
- Un service de traduction
- Une fonction « request a copy »
CNRS – Direction de l’Information Scientifique et Technique
117
- Une gestion d’accès réservés en intranet
- Établir des tables de correspondance entre autorités HAL et autorités des
archives institutionnelles qui versent dans HAL est indispensable pour que les
administrateurs HAL ne passent plus leur temps à corriger dans AureHAL les
doublons générés par ces imports
- Une traduction des interfaces en anglais plus précise
- Ouvrir HAL aux mémoires est également une idée qui revient régulièrement
dans les débats, afin d’augmenter le « mandat réel » de la plateforme, et la portée
de son audience tout à la fois.
- Enfin, une promotion et communication enjouée et continue sur HAL !
■ En ce qui concerne le cas particulier des thèses en ligne dans HAL (TEL), étant donné
l’existence de la passerelle permettant le versement depuis le dépôt légal STAR vers
TEL, il semble contreproductif de laisser ouvert un dépôt direct des thèses sur TEL (avec
le risque de confusion sur la nature canonique ou non de la version déposée, alors que
la version déposée via le dispositif STAR est la seule valide). L’ADBU propose aussi que
d'autres documents puissent être déposés sur TEL directement par leurs auteurs est tout
à fait défendable, mais en ce qui concerne les thèses de doctorat, le principe du dépôt
automatique à l'issue d'un processus de validation interne est plus fiable. Cela pourrait
faire l'objet d'une précision sur TEL, renvoyant les docteurs à leur BU et empêchant le
dépôt direct, OU éventuellement, proposant la fusion de leur dépôt personnel avec le
dépôt institutionnel, que celui-ci soit antérieur ou postérieur. Une mise en cohérence
avec theses.fr est absolument et radicalement nécessaire ; un positionnement de TEL
comme une surcouche officielle exhaustive de theses.fr semble optimal, à défaut
d’une fusion bienvenue. Les établissements délivrant des thèses ont souligné qu’il est
urgent de mettre en place une fonction « embargo » sur les PDF des thèses, afin de
respecter les délais prescrits.
Laisser les chercheurs autoévaluer l’importance de leurs données et en définir les
modalités de sauvegarde en favorisant les collaborations
■ La pérennisation de la sauvegarde des données issues de la recherche passe aussi
par la mise en place de plans de gestion de données (via OPIDOR) pour tout dataset
considéré comme important. Cette notion d’importance intergénérationnelle est à
laisser à la discrétion de chaque unité, qui doit être à même d’évaluer quelle IST vaut
la peine de passer 1 heure à élaborer un DMP, et quelle IST peut être stockée sur des
disques durs externes locaux voire supprimée. Ce principe d’action vise à ce que, dès la
CNRS – Direction de l’Information Scientifique et Technique
118
genèse des projets, les chercheurs prennent en compte les aspects des modalités de
stockage, de description, de mise à disposition et d’archivage des données qui seront
amenées à être collectées et traitées. L’établissement d’un DMP est de plus en plus
fréquemment demandé dans les appels à projet. Il s’appuie sur la prise en compte du
cycle de vie des données et décrit les règles applicables en termes de normes de
métadonnées, format des bases de données, méthode et sécurité d’accès, durée
d’archivage, ainsi que les coûts associés. Une mention particulière doit être apportée aux
données venant en appui des publications et qui doivent à ce titre rester disponibles et
accessibles le plus largement possible
■ A l'InSHS, le programme Persée du MESR qui était consacré à la numérisation
d’archives scientifiques en sciences humaines et sociales est élargi avec le portage du
CNRS, de l’ENS et du CUE de Lyon, sous l’égide de BSN 5. L'INSU a également des
besoins, notamment avec les revues géologiques. Cette catégorie de besoin ne
concerne pas que les publications : l'INSB, par exemple, participe aux bio-banques
européennes de stockage et aux bases de données de séquençage.
■ A l'IN2P3, à l’InSHS, et à l'INP, mais aussi à l’INSMI et le RNBM, le papier reste un
support recherché : il est de moins en moins essentiel de « conserver un voire deux
exemplaires papiers pour la France entière » (préconisation de la SIST 2014).
2.4.2. Apporter un appui logistique et linguistique à la visibilité internationale des
publications (notamment en OA) du CNRS et de ses partenaires, en assistant la
rédaction et la traduction
La traduction, l’assistance rédactionnelle, l’accompagnement de l’évolution
du dispositif de fournitures de documents primaires, ainsi que la mise en œuvre
d’un conseil en négociations sont autant d’instruments au service de la visibilité
internationale de la recherche française.
Les publications du CNRS en font un acteur incontournable du paysage mondial
de la science, dont il s’agit d’améliorer la visibilité
■ Le CNRS produit en moyenne 40 000 articles par an, ce qui représente 1.50% des
publications mondiales, avec 26% d’impact en plus par article rapporté à la moyenne
mondiale.
CNRS – Direction de l’Information Scientifique et Technique
119
Analyse d’impact (en nombre de citations),
un indicateur supérieur à 1 révèle un impact supérieur à la moyenne.
■ Les deux principaux supports de publication du CNRS sont le WoS (Thomson-
Reuters) et Scopus (Elsevier), avec respectivement 420 000 et 540 000 publications
françaises entre 2000 et 2014. Malgré cela, le taux de croissance du CNRS et de ses
partenaires ralentit (4.6% en France contre 6.3% mondialement), et c’est en partie en
raison de barrières à l’exportation de l’IST française.
■ Persée.fr (service 3.4.) permet d’améliorer la visibilité des publications en revues de la
recherche SHS française. Cependant, du point de vue de l'utilisateur chercheur, un
rapprochement avec une autre plateforme, un peu en retrait techniquement ;
Revues.org (quand ce ne serait que par moissonnage mutuel) serait très souhaitable, en
dépit de contraintes institutionnelles et humaines fortes. Au sein du programme
COLLEX, il est absolument nécessaire de clarifier l’articulation entre Persée et les
autres acteurs opérateurs de numérisation, BNF en tête. En effet, une cohésion
nationale est le premier ingrédient d’une intégration internationale accrue.
■ La présence de plus de contenus images, et donc de fonctionnalités de retouche
d’image (rogner, cadrer, etc.) est nécessaire par exemple dans le domaine des revues
d’Art. Sur l’aspect iconographique de l’IST, la France accuse en effet un retard
international : il faut donc ouvrir l’IST aux formats image.
CNRS – Direction de l’Information Scientifique et Technique
120
■ Le service de numérisation et d’océrisation (3.15.) doit être articulé avec le
COLLEX-Persée et l’offre de service BNF pour être efficace pleinement et permettre un
passage au numérique de l’IST française. PSL précise que ce service sera utilisé « à la
double condition que la qualité des prestations soit au même niveau que celles des
prestataires privés avec lesquels PSL travaille actuellement, et que le coût soit
concurrentiel. ». Il serait par ailleurs très utile de disposer d'une plateforme qui
permettre de travailler sur la sémantisation des données issues des catalogues et des
programmes de numérisation en établissant de façon scientifique des relations
structurées entre les entités. A ce titre, le service POPS ne paraît pas prioritaire, et
semble dépendre de sa capacité à se différencier des autres outils et à présenter des
coûts modérés.
Augmenter une interaction déjà prégnante avec les pays partenaires implique
d’avoir un service de qualité pour traduire et internationaliser les productions de la
recherche
■ Voici les principaux pays avec lesquels le CNRS entretient des partenariats de
publication entre chercheurs forts ;
CNRS – Direction de l’Information Scientifique et Technique
121
■ Ces pays ont bien entendu vocation à voir leur liste développée et renforcée de
nouveaux arrivants au fur et à mesure du développement de services
d’internationalisation performants, dépassant la simple traduction anglais-français et un
annuaire basique des supports étrangers de publication de l’IST. En surchappement de
portails tels que iPubli, cogéré par l’INIST et le CNRS-INSERM, un service d’appui à la
publication de bases de données documentaires concourrait à ce renforcement, ce long
et fastidieux travail d’obturation des fuites du système IST national. PSL mentionne que
ses plateformes seront utilisées sous Omeka-s et Cubicweb pour proposer le même type
de services. L’interopérabilité avec ce service 3.13. du CNRS permettrait de viser
l’exhaustivité.
■ En matière de langues, il conviendrait que le service d’assistance à la rédaction de
documents scientifiques en anglais (3.14.) soit axé sur les chercheurs et enseignants-
chercheurs juniors et ouvert aux doctorants. La difficulté réside dans le fait de proposer
des traducteurs compétents dans toutes les spécialités (terminologie et usages
communicationnels). Cette prestation doit être dématérialisée entièrement pour éviter
tout déplacement inutile vers l’INIST à Nancy. Si l’on veut développer la dimension
interculturelle, importante en SHS, l’anglais et l’allemand ne sont pas les seules langues
à prendre en considération. Il faut donc envisager son ouverture vers d’autres
langues, avec des partenariats locaux. Ces partenariats pourraient s’établir avec des
centres d’apprentissage de la langue de niveau professionnel agréés par l’Etat, au
moyen de crédits « assistance linguistique » alloués à chaque unité en prévision de
l’ouverture de commandes publiques de petite taille. En effet, cela permettrait de
contourner la réticence unique qui préoccupe les chercheurs, à savoir que le partage
d’un tel service risquerait de remettre en cause les partenariats existant au sein des
unités de recherche avec des traducteurs réguliers.
■ Il faut rendre les publications scientifiques françaises disponibles sur des plateformes
en OA plus visibles (HAL, Persée, Open Editions, I-Revues, etc.) en traduisant leurs
métadonnées et plus particulièrement les résumés, « quatrièmes de couverture » dans
des langues de communication internationales, en premier chef l'anglais. Conjointement,
il convient de définir des processus d'assurance qualité scientifique pour les traductions,
et de construire un processus permettant de collecter, traiter et traduire ces éléments et
les réintégrer dans leur environnement original de diffusion.
Assister les tâches quotidiennes de rédaction et de mise en document des
données IST
CNRS – Direction de l’Information Scientifique et Technique
122
■ La fourniture de document permet de fournir des articles rares et difficilement
identifiables et localisables. Le service de fourniture de document de l’INIST permet
aujourd’hui d’atteindre plus de 96% de satisfaction des commandes (notamment grâce à
un réseau de 280 bibliothèques partenaires). Sous des conditions nouvelles à définir,
cette activité portant sur des demandes de documents rares ou nécessitant des
compléments d’identification pourrait apporter une véritable valeur ajoutée au
dispositif académique géré par l’ABES. L’intégration de ressources en accès libre
devrait également être un levier de signalement renforcé. BSN 8 a retenu parmi ses
priorités une meilleure articulation entre les ressources des Cadist et la plateforme
RefDoc.
■ Enfin, le service 3.16., à savoir le secrétariat de rédaction, est utile lorsqu’un acteur
monte en puissance et décide d’éditer ses propres revues / documents. Ce service doit
être couplé à l’hébergement de sites web IST, avec l’aide à la réalisation et à la mise en
ligne pour les acteurs qui souhaitent en disposer. Localement, les questions d'image et
de communication attachées à la gestion des sites web sont essentielles (charte
graphique, gabarits web, identité visuelle, ligne éditoriale...). Aucune externalisation
complète n’est donc possible, et les conseils doivent se limiter à la technique, laissant
chacun remplir ses textes et compléter son imagerie officielle. Les CRI ou DSI proposent
déjà des services d’hébergement web. Il serait intéressant d’établir clairement et
publiquement les conditions tarifaires de ce service et sa plus-value par rapport aux
services internes des universités.
2.4.3. Anticiper les partenariats pour réguler les relations entre les producteurs,
les intermédiaires et les usagers finaux d’IST
Continuer à privilégier les études de faisabilité préalables pour produire mieux
■ L’UMS Persée est également moteur d’innovation juridique car elle opère dans un
cadre juridique complexe à anticiper et à faire évoluer. En effet, l’UMS ne limite pas son
action aux corpus libres de droit et prend en charge des documents qui peuvent être
soumis au droit d’auteur. Les aspects juridiques occupent en conséquence une place
centrale. Il convient non seulement de connaître les ayants droits sur les documents et
les droits dont ils disposent mais également d’organiser les cessions de droit
nécessaires et d’assurer les conditions d’une diffusion en Open Access. Cela se traduit
par des études de faisabilité préalables et une réflexion sur l’évolution du droit d’auteur.
La mise en réseaux diminue le paradoxe du chercheur
CNRS – Direction de l’Information Scientifique et Technique
123
■ Fort de nouveaux modèles économiques pour rechercher et publier l’IST, le chercheur
français a tout intérêt à s’appuyer également en amont sur la formation et les outils
d’analyse, et en aval sur les assistances proposées pour le dépôt et la rédaction-
traduction tant des données que des métadonnées. Celui qui produit de l’IST trouve donc
le paradoxe de son positionnement double (producteur et chercheur) réduit par cette
mise en réseau, voire en rhizomes pour reprendre Deleuze, des compétences et des
offres d’outils et de supports. En d’autres termes, le producteur d’IST doit trouver
dans les avantages portés à sa recherche d’IST l’équivalence compensatoire des
inconvénients trouvés dans la production, sur les plans économiques et
techniques (ce qui revient au final au même, le dénominateur commun étant le temps
investi pour comprendre le fonctionnement des systèmes et normes IST, étant traduit en
argent ou non).
L’effacement de l’intermédiaire
■ De son côté, l’intermédiaire doit s’effacer le plus possible pour éviter les logiques de
silo et fonctionner en marque blanche, se rendant donc invisible par l’automatisation et
l’interopérabilité. Le support de recherche idéal combine agilement un moteur de
recherche doté d’outils d’analyse, de bibliométrie et de TDM approfondis, et des
algorithmes permettant un dépôt des documents facile, avec inscription automatisée des
métadonnées lorsque c’est possible, voire des suggestions de sujets de recherche.
L’expérience doit être pensée côté utilisateur, sur la voie qu’a ouvert l’Etat avec sa
refonte du CNN, de l’Agence du Numérique et le lancement de la Mission Etalab,
qui met la donnée publique au niveau d’intéressement minimal de chaque citoyen.
De nouveaux questionnements émergents, source de futurs travaux juridiques
■ Concernant l’assistance et le conseil juridique en matière d’IST, le SCD est déjà en
mesure de répondre à une partie des questions juridiques. En revanche, un service
spécialisé centralisé au niveau national pourrait permettre la prise en charge des
questions les plus complexes. Parmi ces questions, on peut déjà entrevoir le profil qu’en
adopteront certaines ;
- Comment répartir les bénéfices des articles publiés en se basant sur des
données partagées, voire en Open Access ? Le producteur d’IST originel doit-il
CNRS – Direction de l’Information Scientifique et Technique
124
percevoir une forme de « royalties » sur chaque vente/lecture, ou un paiement
forfaitaire de début ? En effet, il apparaît clair que les droits classiques, celui de
l’auteur et celui du brevet, sont déjà submergés par les nouvelles interconnexions
possibles.
- Comment garantir un revenu au chercheur, et faire valoir sa propriété
intellectuelle, par exemple dans le cadre de projets à plusieurs mains basés en
partie sur de l’open source en matière de programmation ?
- Jusqu’où la sécurisation étatique contre le piratage doit-elle aller pour garantir
la sécurité des données issues de l’IST, sans être ni trop encombrante (discrète)
ni trop envahissante pour la vie privée (subtile) ? Ceci s’inscrivant bien sûr dans
un cadre légal bien plus général, qui a tout à voir avec les lignes de force
majeures des politiques publiques mises en œuvre durant le mandat présidentiel
en cours.
- Comment assurer la vérification de fiabilité de l’information ? Le peer-
reviewing apporte des réponses, mais il vient aussi avec ses limites liées au
social scamming et aux intéressements financiers des audiences (paying e-
reputation). Dès lors, une labellisation officielle est-elle possible ? Si oui, quelles
peuvent en être les modalités de contestation pour le chercheur s’estimant
injustement exclu de son champ ?
- Comment rentabiliser l’achat de fonds documentaires dans le cadre d’un
paiement « à l’usage » si l’usage s’avère plus faible que les estimations prises en
compte ?
Bien entendu, il ne s’agit que de quelques exemples, et ce triangle de tensions amènera
bien d’autres questionnements sur le devant de la scène, qui doivent être anticipés.
CNRS – Direction de l’Information Scientifique et Technique
125
3. SYNTHESE ET ACTUALISATION STRATEGIQUE :
Vers l’interopérabilité des outils et des usages
Des tutoriels et des
personnels facilement
joignables pour les
chercheurs à travers un
guichet unique
Un plan de communication
sur les nouveaux fonds
documentaires et les
nouveaux outils à grande
échelle
Continuer à rester en
contact avec les universités
et les UMR via des
procédures telles que le
COPIST
Afin de faire de cette vision stratégique une réalité commune et acceptée de tous,
il faut communiquer dessus, et établir des règles et des chemins d’application concrets,
dans les champs sociaux, politiques, juridiques et économiques. Cette troisième partie,
plus courte, est consacrée à une synthèse des étapes franchies et à franchir, une sorte
de témoin du gué sur lequel toute la troupe IST française s’est engagée, sur une longue
rivière aux forts courants contraires dont le franchissement portera des conséquences
sur l’ensemble des ménages et des entreprises. Cette mise en place stratégique, en tant
qu’elle est le fruit d’une réflexion commune, doit se fondre dans les cadres rigides qui ont
été dessinés en certains endroits, dans certaines entreprises, laboratoires, voire dans
certains secteurs de la recherche, de la science, tout y apportant une fraîcheur et une
praticité inédite, mais qui n’ont pas ce caractère éphémère et grandiloquent des
« nouveautés nouvelles », car ce serait là une démarche bien inconsciente après tous
les efforts d’analyse et le recul pris durant ces 5 dernières années. Le mot d’ordre en est
donc la prévoyance et l’interopérabilité.
Récapitulatif des progrès faits et à faire, par angle de traitement
2014 2017 2020
■ L’acceptation d’une éthique et de principes
- par la recherche
- par la société civile
Logiciels et données
propriétaires
Open Access Open Science
Sécurisation des
données entravant
l’innovation
Libéralisation relative de
certaines données, dans
une optique
contractualiste
Dépasser l’optique contractualiste
et établir un droit agile de l’IST
issue des plateformes
Chartes éthiques Concertation des Agence éthique de l’IST et de la
CNRS – Direction de l’Information Scientifique et Technique
126
rédigées par plusieurs
acteurs
principes autour de la
sémantique LPRN
Science Ouverte
■ L’application de principes juridiques et économiques adaptés au monde numérique
- par le parlement, conseil d’Etat, pour et par l’Etat
Données éparpillées,
sécurisées localement ou
pas du tout le plus souvent
Innovation technique au
service de l’Etat et de la
recherche
Sécurité des données
garantie par l’Etat
Mise en place des marchés
multifaces sur les
plateformes
Bases du principe de
loyauté des plateformes
Application de la loyauté par
un dialogue avec les GAFAM
notamment
Augmentation des volumes
d’écrits anciens numérisés,
et des catégories d’écrits
courants déposés en ligne,
développement d’une
science TDM
Bases de l’autorisation du
TDM, développement des
possibilités techniques,
notamment algorithmiques,
Application d’un TDM large et
partagé grâce à un modèle
économique fin, négocié avec
les éditeurs sans
Modèles de contrats
d’édition, de brevets
classiques, débuts de
l’open access
Diminution des délais
d’embargos, volonté de
modernisation de l’open
access
Vers un nouveau modèle (par
exemple les micropaiements)
Achat de bouquets
documentaires,
négociations avec les
éditeurs
Meilleure concertation des
négociations pour se
rapprocher des besoins
réels, parallèlement à la
modernisation des logiciels
économiques des éditeurs
Vers un nouveau modèle (par
exemple les micropaiements)
■ Le suivi des demandes émanant des chercheurs via les enquêtes et études associées
Premiers résultats de
l’enquête COPIST
Résultats COPIST
améliorés et recompilés,
avec une analyse en
profondeur effectuée
COPIST à poursuivre, avec la
possibilité de confier des
missions plus précises aux
CORISTs
Début des réflexions
nationales, consultation
LPRN
Intensification des réunions
et rencontres des différents
acteurs de l’IST
Rationalisation du système de
dialogue multilatéral
pour limiter les forces d’inertie
du consensus
CNRS – Direction de l’Information Scientifique et Technique
127
■ La simplification des outils et services
Emergence d’une grande
diversité d’outils pour
répondre aux besoins qui
émergent
Renforcement des
coopérations et des
réseaux
Mise en cohérence des
réseaux avec l’échelle
européenne, mise en avance
de la France numérique
Haute technicité des outils,
inadaptation aux besoins
locaux
Mise à niveau des
personnels, plans de
formation et mise en ligne
de l’information (approche
« en aval »)
Prise en compte de
l’ergonomie, de l’intuitivité de
l’expérience utilisateur
(approche « en amont »)
■ Un plan de communication et de formation à destination de la recherche
Livrables de la DIST Livrables mis en ligne par
tous les réseaux, la DIST
prend un rôle de répertoire
et de centralisation de
l’information
Livrables imprimés et/ou
diffusés par les partenaires
(universités, UMR, etc.)
Peu de formation
généraliste, existence de
« silos » spécialisés dans
un seul domaine, avec
début de communication
entre les personnels
Accompagnement par des
personnels du CNRS, en
tant qu’interlocuteurs
privilégiés, formation
centrée sur la formation
initiale
Faire reposer les appuis de la
formation sur une plus large
frange de personnels locaux
en reconnaissant leurs
compétences par une VAE
fondée sur un cahier de
critères plus pertinent, leur
permettre le suivi et l’entretien
du niveau de compétences
des chercheurs pour
s’assurer d’une corrélation
avec la vitesse de progrès
technique
L’IST est réservée à un
public assez confidentiel,
cantonné à certains
domaines de la Recherche
particulièrement bien
développés sur le sujet
Ouverture de l’IST à tous
les chercheurs grâce à
l’effort des CORIST et aux
projets DORANUM et
OPIDOR
Faire participer les étudiants
et les citoyens à l’IST en tant
que récepteurs et en tant
qu’utilisateurs des
fonctionnalités secondaires
des outils IST
CNRS – Direction de l’Information Scientifique et Technique
128
CNRS – Direction de l’Information Scientifique et Technique
129
4. ANNEXE BIBLIOGRAPHIQUE
Dans une approche évolutive générale du partage de l’information scientifique et
technique, et afin de donner une trame à la coordination de tous ses acteurs -notamment
en vue de l’application des mesures de la Loi pour une République Numérique- les
documents suivants ont été repris, combinés, et réorganisés dans le présent document ;
▪ Stratégie IST 2014
▪ Livre blanc et guide stratégique d’application (« Une Science ouverte dans une
République numérique : études et propositions en vue de l’application de la Loi »)
▪ Enquête COPIST (premiers résultats d’octobre, version du 14 mars 2016)
▪ Enquête auprès des DU (« Mieux partager l’information scientifique », résultats de
mars 2015 de l’enquête sur les usages et besoins d’IST des Unités de Recherche,
réalisée auprès des Directrices et Directeurs d’Unités du CNRS)
▪ Actes du Colloque de Meudon ;
o « Dynamiques de l’édition scientifique, de l’industrie, de l’information, de la
documentation » (4 et 5 novembre 2014)
o « Publication scientifique, innovation et services à la recherche » (9 et 10
novembre 2015)
o « La Loi Numérique : et après ? » (9 et 10 novembre 2016)
▪ Rapport de mission sur les systèmes de recommandation (Elsevier, 6 avril 2017)
▪ Schéma opérationnel (Panorama de l’écosystème IST 2017)
▪ Ouverture des données de recherche : cadre juridique (INRA)
▪ Rapport 2017 au MESR « Les enjeux du numérique concernant les ressources
documentaires en SHS »
▪ Rapports d’activité des segments 4 et 7 de la BSN (2016)
▪ Etude technico-budgétaire Ourouk
▪ Travaux sur les indicateurs IST des EPST et des Epic (séminaire ADBU 2012,
Dominique Cavet)