52
INITIATION AUX DONNÉES DE LA RECHERCHE URFIST PARIS – 27 ET 28 MARS 2019 CNRS – Inist/DDO/Service Formation

INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

INITIATION AUX DONNÉES DE LA RECHERCHEURFIST PARIS – 27 ET 28 MARS 2019

CNRS – Inist/DDO/Service Formation

Page 2: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

SOMMAIRE2

• Définition, contexte IST, enjeux des données de la recherche, cycle de vie des données de recherche

• Planifier la gestion des données : DMP, principes FAIR…• Collecter les données : identification, organisation, description…• Traiter et analyser les données• Gérer, stocker, archiver à long terme : archivage, protection, éthique…• Partager et publier : droits, licences, identifiants, entrepôts, data

papers…• Découvrir, réutiliser, citer

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 2

Page 3: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

DÉFINITIONS, CONTEXTE IST, ENJEUX DES DONNÉES DE LA RECHERCHE, CYCLE DE VIE DES DONNEES DE RECHERCHEDéfinitionsPourquoi gérer et partager ses données ?Acteurs, contributeursCycle de vie des données de recherche

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 3

Page 4: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

DÉFINITIONS4

• Les données de la recherche sont définies comme• Des enregistrements factuels :

chiffes, textes, images, sons• Utilisés comme sources principales

pour la recherche scientifique• Reconnus par la communauté

scientifique comme nécessaires pour valider des résultats de recherche

• Un ensemble de données de recherche constitue une représentation systématique et partielle du sujet faisant l’objet de la recherche

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 4

Page 5: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

DIVERSITÉ DES DONNÉES DE LA RECHERCHE5

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 5

Page 6: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

POURQUOI GÉRER ET PARTAGER SES DONNÉES ?6

• Gain de temps évident pour les chercheurs• Croisements fertiles issus d’ensembles hétérogènes : analyse des

données• Gisements en pleine expansion• Exhumation de données « fossilisées » : les publications permettent

d’accéder à environ 10 % des données, le reste demeurant disponible mais non utilisé sur les disques durs d’ordinateurs

• Eviter la perte de données uniques, riches en informations…

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 6

Page 7: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

ACTEURS, CONTRIBUTEURS7

• Structures institutionnelles• Universités• Infrastructures et organismes de recherche• Union européenne

• Communautés scientifiques(chercheurs du même domaine)

• Documentalistes (du SCD ou du laboratoire)

• Archivistes orientés IST• Informaticiens spécialisés• Services juridiques• Editeurs

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 7

Page 8: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

CYCLE DE VIE DES DONNÉES DE RECHERCHE8

• Ensemble des étapes de gestion, de conservation et de diffusion des données de recherche associées aux activités de recherche• Planifier la gestion des données• Collecter les données• Traiter et analyser les données• Gérer, stocker, archiver à long

terme• Accéder, partager et publier• Découvrir, réutiliser et citer

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 8

Page 9: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

PLANIFIER LA GESTION DES DONNÉESPlan de gestion des données (DMP)Modèles de DMPPrincipes FAIREstimation des coûts

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 9

Page 10: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

PLAN DE GESTION DES DONNÉES (DMP)10

• Document synthétique aidant à organiser et anticiper toutes les étapes du cycle de vie de la donnée (outil de gestion et planification)

• Politique des financeurs : obligation pour Horizon 2020 et ANR

• Vérifier la politique de son institutionRessources :• Plan de gestion de données• Réaliser un plan de gestion de données FAIR• DMP OPIDoR, outil collaboratif d’aide à la

rédaction en ligne de DMP• Modèles de DMP

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 10

Page 11: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

MODÈLE HORIZON 2020 FAIR DMP11

• Résumé (description des données)• Données FAIR

• Facile à trouver (métadonnées…)• Accessible (entrepôts…)• Interopérable (standards…)• Réutilisable (licences…)

• Allocation des ressources• Sécurité des données• Aspects éthiques• AutresRessources :• Lignes directrices pour la gestion des

données FAIR dans Horizon 2020INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 11

« aussi ouvert que possible, aussi fermé que nécessaire »

Page 12: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

PRINCIPES FAIR12

Se déclinent en un ensemble de caractéristiques que doivent présenter les données et les métadonnées pour faciliter leur découverte et leur utilisation par les hommes et les machines

Ressource : https://www6.inra.fr/datapartage/Produire-des-donnees-FAIR

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 12

Page 13: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

PRINCIPES FAIR (SUITE)13

• Facile à trouver : facilite la découverte des données par les humains et les systèmes informatiques• Données et métadonnées identifiées par un identifiant global

unique et pérenne (ex. DOI)• Métadonnées riches pour décrire les données (standards de

métadonnées disciplinaires)• Données et métadonnées enregistrées et indexées dans un

dispositif permettant de les rechercher (ex. portail de données)• Métadonnées spécifiant l’identifiant de la donnée

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 13

Page 14: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

PRINCIPES FAIR (SUITE)14

• Accessible : stockage durable des données et des métadonnées, accès et/ou téléchargement facilités, en spécifiant les conditions d’accès et d’utilisation• Données et métadonnées accessibles par leur identifiant via un

protocole de communication standardisé (ex. HTTP, API REST)• Protocole ouvert, libre, pouvant être implémenté de manière universelle

(privilégier le dépôt dans un entrepôt certifié proposant un accès ouvert)• Protocole permettant l’authentification et l’autorisation si besoin

• Métadonnées accessibles même quand les données ne le sont plus

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 14

Page 15: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

PRINCIPES FAIR (SUITE)15

• Interopérable : téléchargeable, utilisable, intelligible et combinable avec d'autres données, par des humains et des machines• Données et métadonnées utilisant un langage formel, accessible, partagé et

largement applicable pour la représentation des connaissances (technologies du Web sémantique basées sur RDF, OWL, SKOS pour représenter et lier les données et les métadonnées)

• Données et métadonnées utilisant des vocabulaires qui respectent les principes FAIR (ontologies et vocabulaires contrôlés standards)

• Données et les métadonnées incluant des liens vers d’autres (méta)données (versions antérieures ou plus récentes, données complémentaires, etc.) et vers des publications (articles citant les données, data papers)

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 15

Page 16: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

PRINCIPES FAIR (SUITE)16

• Réutilisable : caractéristiques rendant les données réutilisables pour de futures recherches ou d’autres finalités (enseignement, innovation, reproduction/transparence de la science)• Données et métadonnées ayant des attributs multiples et pertinents• Données et métadonnées mises à disposition selon une licence

explicite et accessible• Données et métadonnées associées à leur provenance• Données et métadonnées correspondant aux standards des

communautés indiquées

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 16

Page 17: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

ESTIMATION DES COÛTS17

• Estimation financière des ressources humaines et des formations : nombre de personnes (en ETP) et type de compétences dédiées, type de formations souhaitées

• Estimation financière des besoins matériel : serveurs dédiés, coût de stockage, traitement, maintenance, sécurité, accès…

• Estimation des coûts de diffusion : création d’un site web, frais de publication…

• Estimation financière des opérations d’archivage

Ressource : • UK Data Service – Data management costing tool and checklist

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 17

Page 18: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

COLLECTER LES DONNÉES DE RECHERCHECollecte et identification des donnéesOutils d’enregistrement et de traçabilitéAttribution des métadonnées

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 18

Page 19: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

COLLECTE ET IDENTIFICATION DES DONNÉES19

• Décrire les données : type, nature des données (d’observation, d’enquêtes, échantillons, code logiciel, données expérimentales…), réutilisation de données existantes

• Décrire la méthode et le processus de production de données pour permettre leur réutilisation et garantir leur intégrité

• Déterminer les responsabilités sur les données et la mise à jour du PGD

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 19

Page 20: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

OUTILS D’ENREGISTREMENT ET DE TRAÇABILITÉ20

• L’ensemble des données produites par la recherche doit être répertorié et enregistré dans l’objectif d’une réutilisation potentielle

• Quelques supports :• Carnets de terrain• Cahiers de laboratoire• Rapports scientifiques et administratifs• Fiches projet• Dossier de publication

Ressource :• Guide Traçabilité des activités de recherche et gestion des connaissances

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 20

Page 21: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

ATTRIBUTION DES MÉTADONNÉES21

• La métadonnée fait corps avec la donnée ; elle lui permet d’exister• Utiliser un schéma de métadonnées pour décrire les métadonnées produites• Pour garantir l’interopérabilité et la réutilisation des données il est important de

documenter avec soin les données produites, tout au long de leur cycle de vie• Utiliser des vocabulaires contrôlés / standards (lexiques, thésaurus…) pour

augmenter la capacité des données à être combinées avec d’autres donnéesRessources :• Les schémas de métadonnées• Les standards de métadonnées : pourquoi, lequel ?• Répertoire de standards de métadonnées en Sciences de la Vie FAIRsharing.org• RDA Metadata Standards Directory ou Disciplinary Metadata• Informations fournies par les entrepôts de données sur les standards de métadonnées

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 21

Page 22: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

TRAITER ET ANALYSER LES DONNÉES DE RECHERCHEEthique des données de rechercheTraitement des donnéesAnalyse des données

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 22

Page 23: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

ETHIQUE DES DONNÉES DE RECHERCHE23• Suivre les principes de l’éthique scientifique

• Reconnaissance de la dignité humaine, respect des personnes, des animaux et de l’environnement

• Absence de discrimination fondée sur l’âge, le sexe, l’origine ethnique, nationale ou sociale, la religion ou la croyance, l’orientation sexuelle, la langue, le handicap, l’opinion politique, la situation sociale ou économique

• Mieux-être de la collectivité• Utilisation honnête et rationnelle des fonds publics• Partage juste et équitable des bénéfices de la recherche

Ressources :• Politique en matière d’éthique et d’intégrité scientifique (ANR)• La diffusion numérique des données en SHS – Guide des bonnes pratiques éthiques et

juridiques• Questions éthique et droit en SHS

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 23

Page 24: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

TRAITEMENT DES DONNÉES24

• Convertir les données aux formats de traitement et d’analyse• Vérifier, valider, nettoyer et normaliser les données• Décrire le processus de contrôle qualité des données• Documenter les activités de traitement de données et les résultats

Ressource : • Modèle de DMP du CIRAD

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 24

Page 25: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

ANALYSE DES DONNÉES25

• Analyser et interpréter les données• Générer de nouvelles données• Produire des résultats de recherche• Préparer les données pour la conservation• Décrire le potentiel de réutilisation des données

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 25

Page 26: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

CONSERVER, ARCHIVER LES DONNÉES DE RECHERCHEStockage et organisation des donnéesProtection, confidentialitéPartage des données entre partenairesArchivage à long terme

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 26

Page 27: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

STOCKAGE ET ORGANISATIONDES DONNÉES27

• Conserver les données produites : anticiper l’obsolescence des supports

• Définir l’hébergement, le stockage des données et la politique de sauvegarde associée : serveurs locaux (machines virtuelles), cloudinstitutionnel…

• Estimer, indiquer la volumétrie prévisionnelle des données

Ressources :• Guide Traçabilité des activités de recherche et gestion des connaissances

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 27

Page 28: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

STOCKAGE ET ORGANISATIONDES DONNÉES (SUITE)28

• Définir les règles de nommage des fichiers de données, de gestion des versions et de classement des données pour un partage intelligible entre partenaires

• Formats et outils de production, de traitement, de conversion des données : privilégier des formats ouverts standardisés et pérennes

Ressources :• Guide Traçabilité des activités de recherche et gestion des connaissances• Choix des formats de fichiers (CINES)

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 28

Page 29: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

PROTECTION, CONFIDENTIALITÉ DES DONNÉES DE RECHERCHE29

• Évaluer les risques et menaces concernant les données : différents facteurs sont susceptibles de menacer l’intégrité, la disponibilité et la confidentialité des données produites au cours du projet

• risques naturels pesant sur les infrastructures (zones sismiques, inondables etc.)

• risques techniques (corruption ou perte de données, problèmes de serveurs etc.)

• risques de confidentialité (accès non autorisés, fuites de données sensibles, etc.)

Ressources :• Guide Traçabilité des activités de recherche et gestion des connaissances

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 29

Page 30: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

PARTAGE DES DONNÉES ENTRE PARTENAIRES30

• Organiser un espace collaboratif dédié au projet pour le stockage, la sauvegarde, l’accès et le partage des données entre les partenaires

• Le contrôle des accès et les modalités de partage des données doivent répondre aux nécessités de protection des données

• Rejoindre une infrastructure de recherche • Exemple en SHS : Huma-Num, PROGEDO• En Sciences et technologies du numérique : RENATER, CC-IN2P3

Ressources :• Infrastructures de recherche nationales• Cat OPIDoR pour repérer des services disciplinaires

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 30

Page 31: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

ARCHIVAGE À LONG TERME31• Sélectionner les données (et métadonnées associées) à conserver à

long terme• Choisir des formats ouverts pérennes et des logiciels (outils de

production et de lecture) associés libres de droit (si possible) : garantie de réutilisation et de conservation des données dans le temps (obsolescence des formats)

• Documenter également les logiciels permettant l’accès aux donnéesRessources :• Stockage et archivage• Référentiel de gestion des archives de la recherche• Le concept d’archivage numérique pérenne• Les formats de fichiers• Software Heritage : archive de logiciels

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 31

Page 32: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

PARTAGER ET PUBLIER LES DONNÉES DE RECHERCHEDroits et communication des donnéesLicences de diffusionIdentifiants pérennesDépôt dans un entrepôtData journal – data paper

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 32

Page 33: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

DROITS ET COMMUNICATION DES DONNÉES33

• Qui a les droits ?• Critères de communication et de

diffusion des données

Ressources :• Ouverture des données de recherche. Guide

d’analyse juridique en France• La diffusion numérique des données en SHS –

Guide des bonnes pratiques éthiques et juridiques• Qui a les droits, quelles obligations ?• Fiches pratiques sur le Règlement Général pour la

Protection des Données

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 33

Page 34: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

RESTRICTIONS34

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 34

Page 35: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

LICENCES DE DIFFUSION35

• Attribuer une licence de diffusion lorsque les données sont communicables permet d’afficher clairement les modalités de réutilisation

Ressources :• Licences de réutilisation• License Selector• Choose an open source license

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 35

Page 36: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

IDENTIFIANTS PÉRENNES36

• Attribuer un identifiant financeur / institution • Attribuer un identifiant auteur (ORCID)• Attribuer un identifiant pérenne à des jeux de

données pour faciliter le suivi, la localisation, l’accès et la citation des données lors de leur publication ou à des fins de réutilisation

Ressource :• PID OPIDoR : service de l’Inist-CNRS, agence nationale

DataCite pour l’attribution de DOI (abonnement annuel de 180 euros / an pour l’attribution de 500 DOI)

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 36

Page 37: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

DÉPÔT DANS UN ENTREPÔT37

• Déposer les données (et métadonnées associées) dans l’entrepôt recommandé par son financeur, son institution, sa communauté scientifique

• Déposer les codes sources liés dans un entrepôt approprié• Publier / exposer sur le web des données Ressources : • Pour les données, annuaires d’entrepôts : re3data, OAD, OpenDOAR• Pour les logiciels, déposer les codes sources dans HAL (lien avec Software

Heritage, archive de logiciels)

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 37

Page 38: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

PRINCIPAUX CRITÈRES DE CHOIX D’UN ENTREPÔT38

• Disciplinarité• Certification (entrepôt de confiance)• Localisation du serveur• Pérennité des données• Type de données acceptées• Modalités d’accès (gestion des accès,

embargo)• Lien avec la publication• Identifiant pérenne• Qualité de la description (métadonnées)• Coûts• Statut (public, privé)• Gestion des versions

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 38

Page 39: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

EXEMPLES D’ENTREPÔTS39Entrepôt généraliste : Zenodo• Permet de déposer des ensembles de donnés et de les lier aux publications• Issu du projet européen OpenAIREplus, développé par le CERN et lié aux projets

pilotes de la Commission européenne en matière de gestion de données• Recherche pouvant se faire sur différents types de documents : jeux de données,

images, posters, présentations, publications, vidéos/audios• Affecte des DOIs aux objets et expose les métadonnées de description pour le

moissonnage à travers le protocole OAI-PMH (protocole d’interopérabilité des archives ouvertes)

• Permet de créer des communautés et de les gérer soi-même en filtrant ce qui peut y être déposé ou non et son niveau d’accès, « open access » ou « restrictedaccess » avec le courriel à contacter pour obtenir le document, « closed access »

Ressource :• Déposer ses données de recherche dans Zenodo

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 39

Page 40: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

EXEMPLES D’ENTREPÔTS (SUITE)40Entrepôt en Sciences de la Vie, Agronomie, Géosciences, Anthropologie et Sciences comportementales : Dryad

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 40

Page 41: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

EXEMPLES D’ENTREPÔTS (SUITE)41Exemple Dryad (suite) : métadonnées

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 41

Page 42: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

EXEMPLES D’ENTREPÔTS (SUITE)42

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 42

Entrepôt en Sciences Humaines et Sociales : Nakala• Permet de déposer, documenter et diffuser les données de recherche• Services d'accès aux données elles-mêmes• Services de présentation des métadonnées• Moissonnable via Isidore• Les producteurs de données soulagés de la gestion purement

technique, peuvent se consacrer à la valorisation scientifique de leurs données

Ressource : • Exposer ses données avec Nakala : https://www.huma-num.fr/services-et-outils/exposer

Page 43: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

EXEMPLES D’ENTREPÔTS (SUITE)42

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 43

Entrepôt certifié en Astronomie : CDS (Strasbourg Astronomical Data Center) intégrant les bases SIMBAD, VizieR et Aladin

• Services d'accès à des données publiques• Prend en charge la conservation des données à long terme• Evolution des métadonnées• Suit le modèle OAIS : les paquets d’informations contiennent les

données et les métadonnées• Identifiants pérennes ORCID et DOI

Page 44: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

DATA JOURNAL – DATA PAPER43

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 44

Publier un data paper (publication qui décrit un jeu de données scientifiques) dans un data journal (revue dédiée à ce type de publication) ou dans une revue classique• Partie descriptive

• Eléments communs aux articles classiques : titre, résumé, mots-clés…• Eléments spécifiques aux données : types de données, formats, processus et

méthodes de production, métadonnées, réutilisation…• Accès aux données : intégrées dans l’article ou déposées dans un entrepôt

L’identifiant des données (exemple DOI) permet d’établir le lien du data paper vers les données

• Exemple de data paper : https://www.nature.com/articles/sdata201828• Exemples de revues publiant des data papersRessource : • Data papers et data journals

Page 45: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

DÉCOUVRIR, RÉUTILISER ET CITER LES DONNÉES Exposition et visualisation des donnéesRéutilisation et citation des données

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 45

Page 46: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

EXPOSITION ET VISUALISATIONDES DONNÉES45

Valorisation des bases de données des laboratoires de recherche• Exemple : plateforme CoReA, bibliothèque

numérique pour la documentation archéologique du Centre Camille Julian

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 46

Page 47: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

RÉUTILISATION ET CITATIONDES DONNÉES46

• Vérifier que la licence de diffusion appliquée par le(s) auteur(s) aux données que l’on souhaite utiliser est adaptée à ses besoinsRespecter la propriété intellectuelle des auteurs telle que mentionnée dans la licence

• Citer les données si la licence l'exige (il est recommandé de toujours citer ses sources)

• Lier les données aux publications• Partager toute nouvelle donnée qui pourrait être générée en utilisant

le travail des auteurs originaux conformément à la licence de diffusionRessources pour rechercher des jeux de données :• Metadata Search, re3data, OAD, OpenDOAR

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 47

Page 48: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

A VOUS DE JOUER !47

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 48

Sur Kahoot !• Quiz « Stockage, archivage et entrepôts de données »• Quiz « Gestion et partage des données de recherche - YL »

Page 49: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

WEBOGRAPHIE

TITRE DU DOCUMENT MOIS 00, 2019 P 49

Page 50: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

WEBOGRAPHIE49

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 50

• Arnould Pierre-Yves, Jacquemot-Perbal Marie-Christine. Guide de bonnes pratiques : Gestion et valorisation des données de recherche. 1er février 2016. https://ordar.otelo.univ-lorraine.fr/record?id=10.24396/ORDAR-1

• Inist-CNRS, GIS Urfist - DoRANum• Durand-Barthez Manuel. Les données de la Recherche. 17 avril 2018.

http://urfist.chartes.psl.eu/ressources/les-donnees-de-la-recherche• Cocaud Sylvie , L’Hostis Dominique. Pourquoi et comment rédiger un plan de gestion de données ? 11

juillet 2018• Delplanque Catherine , Lamrini Nawale, Leclère Fabrice, Maurel Lionel, et al. Fiches pratiques à

destination des chercheurs sur le Règlement Général pour la Protection des Données. http://www.u-plum.fr/actualites/467-fiches-pratiques-sur-le-reglement-general-pour-la-protection-des-donnees

• Ginouvès Véronique, Gras Isabelle, et al. La diffusion numérique des données en SHS – Guide des bonnes pratiques éthiques et juridiques. Octobre 2018 https://hal-amu.archives-ouvertes.fr/page/guide-de-bonnes-pratiques

Page 51: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

WEBOGRAPHIE (SUITE)50

INITIATION AUX DONNÉES DE LA RECHERCHE 27 ET 28 MARS 2019 P 51

• Laï Paolo. Le cycle de vie des données de la recherche. Séminaire Intégrité et partage de la science Université Grenoble Alpes. 10-13 décembre 2018. https://datadoct2018.sciencesconf.org/data/program/UGA_SummerSchool_IPS_20181210_LAI.pdf

• Maurel Lionel. La réutilisation des données de la recherche après la loi pour une République numérique. Décembre 2017. https://hal.archives-ouvertes.fr/hal-01908766

• Rivet Alain, Bachèlerie Marie-Laure, Denis-Meyere Auriane, Tisserand Delphine - Traçabilité des activités de recherche et gestion des connaissances - Guide pratique de mise en place – 2018 -http://qualite-en-recherche.cnrs.fr/IMG/pdf/guide_tracabilite_activites_recherche_gestion_connaissances.pdf

• Stérin Anne-Laure. Diffuser des données de la recherche dans le respect du droit et de l’éthique –Comment faire lorsqu’on n’est pas juriste ? octobre 2018. https://hal-amu.archives-ouvertes.fr/hal-02050510

Page 52: INITIATION AUX DONNÉES DE LA RECHERCHE · Planifier la gestion des données • Collecter les données • Traiter et analyser les données • Gérer, stocker, archiver à long

MERCI DE VOTRE ATTENTION

https://doranum.fr/

[email protected]