16
Les données de recherche : un potentiel insoupçonné Une trousse de sensibilisation réalisée pour l’Association des bibliothèques de recherche du Canada (ABRC)

Les données de recherche : un potentiel insoupçonné

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Les données de recherche : un potentiel insoupçonné

Les données de recherche : un potentiel insoupçonné

Une trousse de sensibilisation réalisée pour l’Association des bibliothèques de recherche du Canada (ABRC)

Page 2: Les données de recherche : un potentiel insoupçonné

Cette trousse , réalisée pour le Sous-comité sur la gestion des données de l’ABRC, contient des renseignements de base sur la gestion des données de recherche au Canada. Elle vise à aider les directeurs membres de l’Association des bibliothèques de recherche du Canada (ABRC) à sensibiliser les administrateurs et les chercheurs sur le campus aux questions entourant la gestion des données. La trousse, conjointement avec un document d’accompagnement qui explique le rôle des bibliothèques dans la gestion des données de recherche, procure aux lecteurs des connaissances générales sur l’état actuel des données de recherche au Canada et à l’étranger, et présente de suggestions pour commencer à trouver des solutions aux problèmes évoqués.

Par Kathleen Shearer

Sous-comité sur la gestion des données de l’ABRCMarnie Swanson (Présidente, University of Victoria)Pam Bjornson (CNRC-ICIST)Lynn Copeland (Simon Fraser University)Michelle Edwards (University of Guelph)Bernie Gloyn (Observateur, Statistique Canada)Margaret Haines (Carleton University)Janine Schmidt (McGill University)Kathleen Shearer ( Attaché de recherche, ABRC)Diego Argáez (Sécretaire, ABRC)

Merci à Diane Sauvé (Université de Montréal) pour son aide avec la traduction au français de ce document.

© 2009 ABRC, Le contenu dans ce document est sujet à une licence de Creative Commons Paternité - Pas d’Utilisation Commerciale 2.5 Canada.

Les données de recherche : un potentiel insoupçonné

2

Page 3: Les données de recherche : un potentiel insoupçonné

Vue d’ensemble

Avantages d’une bonne gestion et d’un partage des données

Le contexte actuel

À l’étranger

Au Canada

Groupes canadiens intéressés à la gestion des données

Études de cas

Lacunes dans la gérance des données au Canada

Politiques de gestion des données au Canada

Organismes subventionnaires

Autres politiques sur les données

Réponses aux préoccupations des chercheurs et des administrateurs

Que peut-on faire sur le campus?

Table des matières

Les données de recherche : un potentiel insoupçonné

3

Page 4: Les données de recherche : un potentiel insoupçonné

4 Vue d’ensembleOn entend ici par données de recherche les enregistrements factuels (par exemple données textuelles, audio, iconographiques, numériques ou de microréseaux) servant de sources de première main pour la recherche et qui sont généralement reconnus comme nécessaires par l’ensemble des chercheurs pour valider les conclusions de la recherche.

Selon la US National Science Foundation, les données numériques sont à la fois les produits de la recherche et, de plus en plus, le point de départ de nouvelles recherches. Dans l’univers numérique, il est possible pour les chercheurs d’adapter les données, c’est à-dire de les utiliser de façons et en combinaisons novatrices non prévues par ceux qui les ont créés. Il est courant également pour des chercheurs d’utiliser les données d’une étude en prenant comme point de départ les conclusions de travaux précédents et de les pousser plus loin; ou encore d’entreprendre des études longitudinales qui consistent à comparer des données d’observations répétées des mêmes éléments sur une longue période — souvent de nombreuses décennies 1.

Au cours des cinq prochaines années, on produira dans le monde plus de données de recherche que tout ce qui a été fait dans toute l’histoire humaine 2. La plus grande partie de ces données auront été créées numériquement et elles seront stockées et gérées électroniquement, de sorte qu’il sera facile de les rendre accessibles, de les reproduire et de les combiner avec d’autres données. Toutefois, en vue de rendre accessibles et de réutiliser des données, elles doivent être créées et gérées de manière à permettre leur conservation à long terme. Il faut donc à cette fin faire une gestion active des données tout au long de leur cycle de vie, dès le moment où l’on envisage pour la première fois leur création.

À l’heure actuelle au Canada, la grande majorité des données de recherche sont perdues. Par exemple, selon une étude sur les projets de recherche subventionnés par le Conseil de recherche en sciences humaines du Canada (CRSH), on a constaté que les données de seulement trois études sur 110 ont été archivées dans un dépôt et que celles de ces trois études ont toutes été hébergées aux États-Unis 3.

Les données de recherche au Canada ne sont pas gérées systématiquement de sorte que des données précieuses sont sous-utilisées. Il existe bien sûr des moyens de gestion des données offerts par des établissements, ou par des organismes nationaux et internationaux pour certaines disciplines et projets de recherche, mais ils ne sont à la disposition que d’une minorité de chercheurs.

Pour créer des données qui pourront être utilisées pendant longtemps, il faut absolument que les documents d’accompagnement soient conviviaux, clairs et compréhensibles. Idéalement, les métadonnées et la documentation devraient être produites dès le début d’un projet de recherche et améliorées tout au long du cycle de vie des données. Grâce au service de planification et de soutien offert par les professionnels des données dès le début d’un projet de recherche, on peut réduire de beaucoup le temps et l’argent nécessaires pour en assurer l’accessibilité à long terme. 1 Community-based Data Interoperability Networks. 2009. National Science Foundation. http://www.nsf.gov/pubs/2007/nsf07565/nsf07565.htm 2 Beagrie, N. Digital Preservation: Setting the Course for a Decade of Change. 2007. www.abd-bvd.be/documents/60/BDA-1107_NB.ppt 3 Humphrey, C. Preserving research data: A Time for Action. In Preservation of Electronic Records: New Knowledge and Decision-making. 2003. Canadian Conservation Institute: Ottawa. pp. 83-89.

Crédit photo : www.curri.miyakyo-u.ac.jp

Page 5: Les données de recherche : un potentiel insoupçonné

5Avantages d’une bonne gestion et d’un partage des données

Accélérer le progrès scientifique. La bonne gestion des données de recherche permettra aux chercheurs d’obtenir et de comprendre les données des autres et de les réutiliser pour leurs propres fins scientifiques, ce qui accélérera les nouvelles découvertes.

Accroître la visibilité et les retombées de la recherche. Les données rendues visibles par l’entremise d’un dépôt de données peuvent de beaucoup accroître les retombées de cette recherche. L’accessibilité des données de recherche est étroitement liée à l’augmentation du nombre de citations. Par exemple, selon une étude sur le nombre de citations dans les publications sur les essais cliniques sur le cancer, on a constaté que les essais cliniques pour lesquels les données avaient été communiquées ont été cités environ 70 fois plus fréquemment que dans les cas où on ne l’avait pas fait 4.

Respecter les politiques des organismes subventionnaires. De plus en plus d’organismes subventionnaires exigent que les chercheurs et les établissements hôtes conservent, gèrent et rendent accessibles leurs données à la fin d’un projet de recherche. Par conséquent, les universités et les chercheurs ont une obligation juridique et éthique d’assurer la pérennité des données de recherche. Certains éditeurs exigent également que les données liées à leurs publications soient conservées.

Éviter la répétition des travaux de recherche. Lorsqu’un ensemble de données est disponible publiquement, il est beaucoup plus probable que ces données ne seront pas créées de nouveau, ce qui évite des travaux coûteux et inutiles de collection et de production des données.

Permettre la reproduction et la validation des résultats de la recherche. Lorsque les données sont archivées et connues, les résultats peuvent être répétés et les données peuvent servir à une nouvelle analyse, ce qui permet de confirmer les premières constatations de la recherche. Elles peuvent aussi servir à faire état d’erreurs ou d’incohérences dans la première analyse des données.

Intensifier la collaboration : Les données disponibles publiquement permettent aux chercheurs de collaborer les uns avec les autres en mettant en commun les ensembles de données, le contexte et les outils de recherche.

4 Piwowar, HA, Day, RS, Fridsma, DB. Sharing Detailed Research Data Is Associated with Increased Citation Rate. 2007. PLoS ONE 2(3): http://dx.doi.org/doi:10.1371/journal.pone.0000308

La banque de données sur les protéines

La banque de données sur les protéines (Protein Data Bank ou PDB) est une base de données en libre accès, permettant d’accélérer le progrès et les découvertes scientifiques. Créée en 1971, la banque a commencé avec sept structures de protéines résolues. Depuis ses débuts, le programme a connu une croissance rapide et il contient actuellement plus de 43 000 structures

résolues. L’utilisation de la banque de données a également connu une croissance importante : de un million de téléchargements par mois au début de 2007, elle est passée à cinq millions par mois en 2008.

www.wwpdb.org

Crédit photo : Bollen J, Van de Sompel H, Hagberg A, Bettencourt L, Chute R, et al. (2009) Clickstream Data Yields High-Resolution Maps of Science. PLoS ONE 4(3): e4803. doi:10.1371/journal.pone.000480

Page 6: Les données de recherche : un potentiel insoupçonné

États-Unis Aux États-Unis, la National Science Foundation (NSF) a annoncé la création d’un programme de subventions de 100 millions de dollars appelé « Sustainable Digital Data Preservation and Access Network Partners (DataNet) » 6. Le programme est en voie d’élaborer de nouvelles méthodes, structures de gestion et technologies pour gérer la diversité, la taille et la complexité des ensembles de données et des flux de données actuels et futurs par la création d’un ensemble d’organismes exemplaires pour l’infrastructure des données de recherche nationales et mondiales.

Aux États-Unis également, un groupe appelé Interagency Working Group on Digital Data a été formé en décembre 2006. Près de 30 organismes, bureaux et conseils gouvernementaux ont été désignés à titre de membres ou de participants, démontrant l’intérêt élargi suscité par les données scientifiques numériques. Dans son rapport final, le groupe propose la stratégie suivante pour les États-Unis : élaborer un cadre global de politiques transparentes, évolutives et extensibles, ainsi que des structures de gestion et d’organisation qui offrent un accès fiable et efficace à toute la gamme des données scientifiques numériques publiques.

Ce cadre se veut un élément moteur pour que les États-Unis puissent jouer un rôle de premier plan dans les sciences et dans une société de l’information marquée par la concurrence et la mondialisation. 7.

5 Science, technologie et innovation pour le 21ème siècle. Réunion du Comité de la politique scientifique et technologique de l’OCDE au niveau ministériel, 29-30 janvier 2004 - Communiqué final. 2004. Organisation de coopération et de développement économiques. http://www.oecd.org/document/0,3343,fr_2649_34487_26006977_1_1_1_1,00.html 6 Community-based Data Interoperability Net¬works. 2009. National Science Foundation, www.nsf.gov/pubs/2007/nsf07565/nsf07565.htm7 Harnessing the Power of Digital Data for Science and Society. Report of the Interagency Working Group on Digital Data to the Committee on Science of the National Science and Technology Council. January 2009. p.2 www.nitrd.gov/about/Harnessing_Power_Web.pdf

Le contexte actuelLes méthodes utilisées pour la gestion des données de recherche varient beaucoup selon les disciplines. Dans certains domaines, comme la génomique, la protéomique, la physique des hautes énergies et l’astronomie, des traditions de longue date existent pour l’archivage et la mise en commun des données, ce qui n’est pas le cas dans d’autres domaines tels que la chimie et les sciences humaines et sociales. Les chercheurs dans certains domaines sont réticents à rendre accessibles leurs données pour les raisons suivantes : inquiétudes au sujet de la propriété des données ou de la propriété intellectuelle; méconnaissance de la valeur ajoutée que représente le partage des données ou manque de connaissance ou de temps pour préparer les données à des fins de diffusion.

À l’étranger

Il existe de plus en plus de grands dépôts d’archives de données par discipline comme PubChem, GenBank, Protein Data Bank, Digital Sky Survey, World Data Centers (données solaires, géophysiques et autres sur l’environnement), Global Biodiversity Information Facility, International Virtual Observatory, Digital Earth et Interuniversity Consortium for Political and Social Research (ICPSR). Ces archives ont une envergure internationale et visent à recueillir des données partout dans le monde. Elles offrent aussi un large accès aux données qu’elles recueillent en vue de faire avancer la recherche et la création du savoir. La vaste majorité de ces archives sont financées par des ministères ou des organismes subventionnaires nationaux dans le pays où elles sont hébergées – bien qu’il existe aussi quelques archives de données internationales gérées par le secteur privé. Outre ces archives internationales par discipline, plusieurs pays ont des archives de données nationales qui ont le mandat de recueillir des données nationales précieuses sur un sujet donné. Par exemple, la plupart des pays recueillent et archivent des données sur la population, sur le climat, sur la santé, etc.

En 2004, 34 pays, dont le Canada, ont signé la Déclaration sur l’accès aux données de la recherche financée par des fonds publics de l’OCDE 5. La déclaration repose sur le postulat selon lequel les données de recherche subventionnées par les fonds publics doivent être à la libre disposition du plus grand nombre possible. C’est ainsi qu’un certain nombre de pays cherchent actuellement à déterminer comment ils peuvent exploiter plus systématiquement les données créées par la recherche subventionnée par les fonds publics. Voici des exemples :

6

Page 7: Les données de recherche : un potentiel insoupçonné

Royaume-Uni Le Royaume-Uni possède déjà une infrastructure très solide de dépôt de données pour la collecte de données de recherche, administrée par plusieurs organismes subventionnaires des Research Councils UK (RCUK). Dans le prolongement de cette initiative, le Consortium of Research Libraries au R.-U. et en Irlande, et le IT Directors Group ont entrepris une étude pour déterminer la faisabilité et les coûts de l’élaboration et du maintien d’un service national commun pour les données de recherche numériques à l’intention du secteur de l’enseignement supérieur au R.-U. Les auteurs ont conclu que des efforts considérables sont faits par d’autres pays pour repérer et exploiter les données à l’échelle nationale ou régionale et que le R.-U. doit adopter une démarche globale pour la gestion des données de recherche afin de ne pas prendre de retard 8.

Australie En septembre 2008, des représentants des grands établissements de recherche de l’Australie ont adopté la déclaration de Brisbane qui affirme notamment que chaque citoyen doit avoir le libre accès gratuit aux données et connaissances provenant de la recherche subventionnée par les fonds publics et que chaque université australienne doit avoir accès à un dépôt numérique. 9

Le gouvernement de l’Australie a annoncé récemment la création du Australian National Data Service (ANDS). L’ANDS a démarré en septembre 2008 et il fait partie d’une stratégie visant une infrastructure nationale commune pour la recherche. Parmi ses buts déclarés, mentionnons qu’il vise à faire en sorte que les données de recherche en Australie soient bien gérées, accessibles et exploitables 10.

8 UK Research Data Service. http://www.ukrds.ac.uk/home9 Open Access and Research Conference 2008. 2008. Queensland University of Technology. www.oar2008.qut.edu.au 10 Australian National Data Service. 2009. Monash University. www.ands.org.au

Au Canada

En octobre 2000, le Conseil de recherches en sciences humaines et l’Archiviste national du Canada ont constitué un groupe de travail comprenant des chercheurs et des spécialistes de la gestion de documents et leur ont demandé d’évaluer les besoins en ce qui a trait à un système national de diffusion, de conservation et de gestion des données de recherche. Le groupe de travail a constaté de vastes lacunes dans l’infrastructure de collecte et de conservation des données. Dans son rapport final publié en 2002, il recommande la création d’un nouveau service national d’archivage des données de recherche 11.

En novembre 2004, le Conseil national de recherches du Canada (CNRC), en collaboration avec la Fondation canadienne pour l’innovation (FCI), les Instituts de recherche en santé du Canada (IRSC) et le Conseil de recherches en sciences naturelles et en génie (CRNSG), a lancé une consultation sur l’accès aux données de recherche au Canada (appelée la Consultation nationale sur l’accès aux données de la recherche scientifique ou CNADRS). Les chercheurs en sciences naturelles et médicales ont exprimé leur avis à cette occasion. Le rapport final a été publié en janvier 2005 et il constitue une « car te routière » pour la mise en œuvre d’un plan national pour le libre accès aux données de la recherche scientifique subventionnée par les fonds publics. Les recommandations du rapport n’ont pas encore été mises en œuvre.

En janvier 2004, le Canada a été signataire de la Déclaration sur l’accès aux données de la recherche financée par des fonds publics de l’OCDE. Mais, contrairement à d’autres pays signataires, le Canada n’a pas encore réagi par des mesures concrètes pour donner suite au protocole d’entente.

11 Savoir, c’est comprendre. Rapport final de la Consultation sur les archives nationales de données. Juin 2002. Conseil de recherches en sciences humaines. www.sshrc-crsh.gc.ca/site/about-crsh/publications/da_finalreport_f.pdf

7

Les données de recherche : un potentiel insoupçonné

Page 8: Les données de recherche : un potentiel insoupçonné

Crédit photo : Bernard O’Hara & Renos Savva, Wellcome Images

Groupe de travail sur la stratégie des données de recherche du Canada

Le 25 janvier 2008, l’Institut canadien de l’information scientifique et technique (ICIST) a organisé une réunion des principales parties intéressées pour examiner de quelle façon commencer à mettre en place les recommandations issues de la consultation nationale sur l’accès aux données de recherche scientifique 12. Un groupe de travail a été établi avec la participation de tous les organismes subventionnaires fédéraux, de l’Association des bibliothèques de recherche du Canada (ABRC), de Compute Canada, de CANARIE et d’un certain nombre de chercheurs à titre individuel. Le groupe a publié à l’automne de 2008 un document portant sur l’analyse des écarts et il cherche actuellement à corriger ces écarts dans la gestion des données de recherche au Canada.

12 Données de recherche Canada. 2009. Institut canadien de l’information scientifique et technique. www.data-donnees.gc.ca

Comité national canadien de CODATA(CNC/CODATA)

Ce comité est la voix canadienne de CODATA (Committee on Data for Science and Technology) 13. CODATA est un comité scientifique interdisciplinaire du Conseil international pour la science ( ICSU), établi il y a 40 ans. Le CNC/CODATA est parrainé par l’ICIST (Institut canadien de l’information scientifique et technique) qui relève de son côté du Conseil national de recherches du Canada. CODATA n’est pas un organisme public comme tel mais il s’efforce par l’intermédiaire de ses membres nationaux et groupes de travail d’ « améliorer la qualité, la fiabilité, la gestion et l’accessibilité des données d’importance dans tous les domaines de la science et de la technologie. »

13 Canadian National Committee for CODATA. 2009. www.codata.org/canada

Groupes canadiens intéressés à la gestion des données

Les données de recherche : un potentiel insoupçonné

8

Page 9: Les données de recherche : un potentiel insoupçonné

Études de cas d’activités de gestion des données au Canada

15 International Polar Year 2007-2008 Data Policy. April 2008. http://classic.ipy.org/Subcommittees/final_ipy_data_policy.pdf

Année polaire internationale

L’Année polaire internationale (API) est un vaste programme scientifique portant sur l’Arctique et l’Antarctique qui s’est déroulé de mars 2007 à mars 2008. Le programme est assorti d’une politique globale qui exige que les données, y compris les données opérationnelles communiquées en temps réel, soient accessibles intégralement, librement, sans frais et dans les plus brefs délais possibles 15. Des douzaines de projets de recherche canadiens ont été subventionnés dans le cadre de l’API par diverses sources dont le gouvernement fédéral, les gouvernements territoriaux, les organismes subventionnaires et des fondations. Chaque projet devait élaborer un plan de gestion des données pour recevoir des subventions. Il est probable que plusieurs projets canadiens auront de la difficulté à respecter la politique de l’API car il y a peu de dépôts au Canada pouvant recueillir et conserver les données qui sont ainsi créées et y donner accès.

Ontario Data Documentation, Extraction Service and Infrastructure Initiative ODESI est un projet subventionné conjointement par le Conseil des bibliothèques universitaires de l’Ontario (CBUO) et OntarioBuys qui offre aux chercheurs universitaires un accès sans précédent à un grand nombre d’ensembles de données. Le projet vise avant tout les ensembles de données de Statistique Canada 14, les fichiers de données de Gallup Canada et d’autres entreprises de sondage, des fichiers du domaine public comme les sondages sur les élections nationales au Canada et certains fichiers de l’Inter-University Consortium for Political and Social Research (ICPSR). Les fichiers sont balisés selon la norme DDI (Initiative de documentation de données), un système international de marquage de métadonnées fondées sur XML permettant la découverte des ensembles de données, l’accès réseauté à ces données, leur extraction et leur analyse.

Les données de recherche : un potentiel insoupçonné

9

14 “Initiative ontarienne en matière de documentation des données, de service d’extraction et d’infrastructure”. 2009. Ontario Council of University Libraries. http://search2.odesi.ca

Page 10: Les données de recherche : un potentiel insoupçonné

10

Les données de recherche : un potentiel insoupçonné

Études de cas d’activités de gestion des données au Canada

Canadian Barcode of Life Canadian Barcode of Life Network, de concert avec le vaste consortium international dont il fait partie, est un réseau en voie d’élaborer un système précis, rapide, rentable et universellement accessible qui s’appuie sur l’ADN pour l’identification des espèces. L’attribution de codes à barres selon l’ADN est une solution très prometteuse pour résoudre l’« obstacle taxonomique » qui limite beaucoup la recherche sur la biodiversité. Tous ces projets d’identification par codes à barres ont comme objectif commun d’établir une base de données en libre accès de codes à barres de référence qui nous permettront de mieux comprendre la biodiversité et permettront aux non-taxonomistes d’identifier les espèces. En août 2009, les chercheurs avaient déposé plus de 670 000 enregistrements de codes à barres provenant de 61 000 espèces de la base de données internationale de codes à barres de la vie (la vaste majorité – soit près de 500 000—proviennent du Centre canadien) 18.

VENUSVictoria Experimental Network Under the Sea (VENUS)16, sous la direction de l’Université de Victoria, est un observatoire océanique câblé. Il communique des données en temps réel provenant du fond de l’océan par câbles en fibre optique reliés à des instruments à l’Université de Victoria, en C.-B., où elles sont archivées. Le portail de VENUS procure aux scientifiques et au grand public le libre accès à un « entrepôt » grandissant d’images, de sons et de données en temps réel provenant du fonds de l’océan 17 pour faciliter la recherche sur les océans partout dans le monde.

16, 17 VENUS: Victoria Network Under the Sea. 2009. University of Victoria. www.venus.uvic.ca

18 Barcode of Life Data Systems. 2009. Biodiversity Institute of Ontario. www.barcodinglife.org/views/login.php

Projet de métadonnées des Centres de données de recherche Ce projet a pour but de produire un ensemble d’outils qui permettront aux chercheurs de fournir de meilleures métadonnées pendant tout le cycle de vie de leurs travaux de recherche au moyen du schéma DDI 3 XML. Le projet, établi à l’Université du Manitoba, permettra de baliser des fichiers dans les centres de données de recherche et de créer des outils pour la migration vers la norme DDI (Initiative de documentation des données) version 3. Il produira un ensemble d’outils qui permettra aux chercheurs de fournir de meilleures métadonnées pour toute la durée de vie de leur projet. Un Centre de métadonnées de recherche a été établi à Gatineau (Québec) pour produire des métadonnées conformes pour les fichiers confidentiels de Statistique Canada dans le Réseau des centres de données de recherche du Canada. Aussi, un consortium international de développement logiciel dirigé par Brechenhill au Canada travaille au développement d’outils pour appliquer la norme DDI 3 à la documentation des données.

Page 11: Les données de recherche : un potentiel insoupçonné

11

Crédit photo : Photo par Joriel Jiménez

Lacunes dans la gérance des données au Canada

Le Groupe de travail sur la stratégie des données de recherche dirigé par l’ICIST a fait à l’automne de 2008 une bonne analyse des écarts dans la gérance des données de recherche au Canada19. L’analyse révèle l’existence d’obstacles importants à l’accessibilité et à la conservation des données de recherche — des obstacles qui, s’ils ne sont pas éliminés, pourraient avoir des répercussions sérieuses sur l’avenir de la recherche et de l’innovation au Canada. Voici les écarts recensés :

Politiques sur les données : Les politiques sur les données au Canada ne portent pas sur tous les types de données de recherche et, dans certains cas, des chercheurs ne se conforment pas aux politiques existantes. Le volet conservation des données est rarement pris en compte dans les politiques.

Financement de la gestion des données : La structure de financement de la recherche au Canada ne prévoit pas la gestion des données au-delà de la durée de vie d’un projet de recherche. Il n’y a pas beaucoup d’établissements au Canada qui offrent un financement durable pour les dépôts de données. En outre, il y a des coûts importants associés à la préparation des données pour diffusion et ces coûts ne sont pas prévus dans les mécanismes de finance- ment actuels (c.-à-d. les subventions ou les budgets universitaires).

Dépôts de données : Il existe seulement quelques dépôts de données actifs au Canada permettant aux chercheurs d’y déposer leurs données. Il y a de vastes écarts tant dans la couverture que dans la capacité des dépôts de données. Il n’existe pas de dépôts pour tous les domaines de recherche et la grande majorité des données de recherche sont encore hébergées sur les disques durs des chercheurs.

Compétences : Les chercheurs ont rarement les compétences nécessaires pour bien gérer leurs données. En outre, il y a peu de scientifiques spécialisés dans les données ou de professionnels de l’information ayant une connaissance du catalogage des données, des normes et des processus relatifs aux métadonnées, de la conservation et de l’évaluation de la pertinence des données pour les chercheurs.

Normes : Ce ne sont pas tous les chercheurs ni toutes les disciplines qui ont adopté les normes internationales. Beaucoup reste à faire pour assurer l’interopérabilité des données provenant de divers projets et touchant plusieurs disciplines. Les normes relatives aux métadonnées, cruciales pour garantir l’accessibilité et l’interopérabilité des différents types d’ensembles de données entre eux, ne sont pas toujours respectées par les créateurs ou les aggrégateurs de données.

Récompenses et reconnaissance : Il y a peu de mesures incitatives favorisant le partage des données par les chercheurs. Des facteurs dissuasifs réels existent même : en effet, les chercheurs sont exhortés à produire le plus de publications possible avec les données de première main qu’ils ont recueillies avant de mettre celles-ci à la disposition de tous.

Rôles et responsabilités : À l’exception de certains ministères, il n’y a pas d’ organisme national chargé de la conservation, de la gestion et de la diffusion des données de recherche ayant l’envergure nécessaire pour répondre aux besoins des différents intervenants.

Temps requis: Il est essentiel pour la création d’un bon ensemble de données pouvant être utilisé de façon pérenne de faire en sorte que les données soient faciles à comprendre et à analyser. Il faut donc à cette fin une description des données et une documentation qui soient conviviales, claires et détaillées, mais aussi complètes. Ceci requiert du temps et la plupart des chercheurs n’en ont pas beaucoup.

19 Groupe de travail sur la stratégie des données de recherche. Gérance des données de recherche au Canada : une analyse des écarts. Octobre 2008. Institut canadien de l’information scientifique et technique. http://data-donnees.gc.ca/docs/AnalyseEcarts.pdf

Les données de recherche : un potentiel insoupçonné

Page 12: Les données de recherche : un potentiel insoupçonné

IRSC Les Instituts de recherche en santé du Canada exigent des bénéficiaires de subventions qu’ils déposent certains types de données – données en matière de bioinformatique, d’atomistique et données de coordonnées moléculaires – dans les bases de données publiques correspondantes dès la publication des résultats de leur recherche. Les IRSC exigent légalement des chercheurs qu’ils conservent les ensembles de données originales découlant de la recherche qu’ils subventionnent pendant au moins cinq ans après la fin de la subvention. Les IRSC ont l’intention de réexaminer cette politique prochainement et peut-être de l’élargir. 20

CRSH Le Conseil de recherches en sciences humaines a une politique d’archivage des données de recherche depuis 1990. Selon cette politique, « Toutes les données de recherche rassemblées grâce au financement du CRSH doivent être conservées et mises à la disposition des autres chercheurs dans des délais raisonnables.» 21 . Selon le CRSH, un délai raisonnable est une période de deux ans après la fin du projet de recherche pour lesquels les données ont été recueillies. Le CRSH n’a pas appliqué cette politique auprès des chercheurs et moins de 10 % des chercheurs s’y sont conformés depuis ses débuts. 22

CRSNG Le Conseil de recherches en sciences naturelles et en génie n’a pas de politique générale relativement aux données de recherches. Il y a cependant des lignes directrices pour les chercheurs subventionnés par l’intermédiaire du Programme de subventions de réseaux stratégiques. On y lit ce qui suit : « Pour encourager le partage et la diffusion des données de recherche et leur utilisation par d’autres dans un délai raisonnable, on doit conclure dès le début des activités de réseau une entente établissant la responsabilité en matière de mise à jour et de conservation de grands ensembles de données.» 23

Les trois Énoncé de politique des trois conseils sur l’éthique de la recherche avec des êtres humains

« Les chercheurs devraient s’assurer que les données obtenues sont conservées avec toutes les précautions nécessaires particulières dues à la nature délicate des renseignements. Les données publiées ne devraient contenir ni nom, ni initiales, ni aucune autre sorte de renseignement pouvant mener à une identification. Il peut s’avérer important de conserver certains types d’identificateurs (p. ex., région de résidence), mais ceux-ci devraient être dissimulés le mieux possible, selon un protocole normalisé, avant que les données ne soient communiquées aux fins de la recherche. » 24

Politiques des organismes subventionnaires

Politiques de gestion des données au CanadaTout un ensemble de politiques établies par le gouvernement fédéral et les gouvernements provinciaux, les organismes subventionnaires, d’autres établissements et même certains projets de recherche régissent les activités de gestion des données au Canada. Ces politiques varient beaucoup et, dans certains cas, portent sur des aspects différents de la gestion des données. Toutefois, la plupart des chercheurs sont tenus par leur établissement, leur organisme subventionnaire ou les deux, de conserver leurs données de recherche jusqu’à cinq ans après avoir terminé un projet.

20 Politique sur l’accès aux résultats de la recherche. Septembre 2007. Instituts de recherche en santé du Canada. www.cihr-irsc.gc.ca/f/34846.html21 Politique du CRSH sur l’archivage des données de recherche. 2009. Conseil de recherches en sciences humaines. www.sshrc.ca/site/apply- demande/policies-politiques/edata-donnees_electroniques-fra.aspx22 Humphrey, C. Preserving research data: A Time for Action. In Preservation of Electronic Records: New Knowledge and Decision-making. 2003. Canadian Conservation Institute: Ottawa. pp. 83-89.23 Programme de subventions de réseaux stratégiques. 2009. Conseil de recherches en sciences naturelles et en génie du Canada. www.nserc-crsng.gc.ca/Professors-Professeurs/RPP-PP/SNG-SRS_fra.asp24 Proposition de la 2e édition de L’Énoncé de politique des trois Conseils : Éthique de la recherche avec des êtres humains. Décembre 2008. Groupe consultatif interagences en éthique de la recherche. http://www.ger.ethique.gc.ca/fra/policy-politique/initiatives/draft-preliminaire/

12

Les données de recherche : un potentiel insoupçonné

Page 13: Les données de recherche : un potentiel insoupçonné

Les données de recherche : un potentiel insoupçonné

13

Université McGill

(Nous n’avons trouvé aucune autre politique universitaire dans la rédaction du présent document.)

Cette politique stipule que les données doivent être organisées de manière à ce qu’elles puissent être facilement vérifiées. Sous réserve d’exceptions fondées sur le devoir de confidentialité et les lois régissant la propriété intellectuelle et l’accès à l’information, et une fois les résultats de la recherche publiés, les données doivent être mises à la disposition de quiconque présente une demande raisonnable de les examiner. Dans les cas de désaccord entre le chercheur et la personne qui demande à voir les données, c’est le bureau du vice-principal à la recherche qui tranchera. La politique indique également que toutes les données originales doivent être conservées pendant un délai raisonnable et recommande une période d’au moins cinq ans après la date de la publication 25.

Pêches et Océans Canada

(Un exemple d’une politique sur les données d’un ministère)

La Politique d’accès aux données scientifiques spécifie ce qui suit : « Les gestionnaires de Pêches et Océans ont la responsabilité de s’assurer que les collecteurs de données sous leur direction transmettent leurs données ainsi que les données recueillies en vertu d’un contrat ou de partenariat avec d’autres organismes au centre de données appropriées de façon opportune. Il est important de s’assurer que les données sont rapidement transférées dans un environnement « géré » où elles seront sauvegardées de façon appropriée et mises à l’abri de toute perte accidentelle ou circonstancielles et où les métadonnées essentielles seront intégrées aux données afin de préserver l’utilité à long terme d’un ensemble de données » 26.

Année polaire internationale (API)

La Politique sur les données de l’API indique qu’en vue de maximiser les bénéfices des données recueillies sous l’égide de l’API, le Comité conjoint de l’API exige que ces données, y compris les données opérationnelles communiquées en temps réel, soient accessibles intégralement, gratuitement, librement et dans le plus bref délai possible 27. En outre, toutes les données de l’API doivent être archivées dans leur forme la plus simple et la plus utile et être accompagnées d’une description complète à l’aide de métadonnées 28.

Gouvernement fédéral : Loi sur la protection des renseignements personnels et les documents électroniques (LPRPDE)

« Les renseignements personnels ne doivent pas être utilisés ou communiqués à des fins autres que celles auxquelles ils ont été recueillis à moins que la personne concernée n’y consente ou que la loi ne l’exige. On ne doit conserver des renseignements personnels que pendant le temps nécessaire pour la réalisation des fins déterminées. [...] On devrait détruire, effacer ou dépersonnaliser les renseignements personnels dont on a plus besoin aux fins précisées. Les organisations doivent élaborer des lignes directrices et appliquer des procédures régissant la destruction des renseignements personnels. » 29

Autres politiques sur les donnéesDes universités, centres de recherche et projets de recherche ont parfois aussi des politiques

régissant les données de recherche. Voici quelques exemples.

25 Policy on Research Ethics. April 7, 2008. McGill University. www.mcgill.ca/files/secretariat/Research-Ethics-Policy-on.pdf26 Politique d’accès aux données scientifiques du MPO. 12 juin 2001. Pêches et Océans Canada. www.osl.gc.ca/sgdo/fr/info-donnees/acces-donnees.html27, 28 International Polar Year 2007-2008 Data Policy. April 2008. http://classic.ipy.org/Subcommittees/final_ipy_data_policy.pdf 29 Loi sur la protection des renseignements personnels et les documents électroniques. 2009. Ministère de la Justice Canada. http://laws.justice.gc.ca/fra/P-8.6/index.html

Page 14: Les données de recherche : un potentiel insoupçonné

14 Réponses aux préoccupations des chercheurs et des administrateurs

Je ne peux pas archiver et communiquer mes données parce qu’elles portent sur des humains.

Le respect des renseignements personnels dans la recherche est une norme internationalement reconnue et un principe d’éthique. Au Canada, les trois principaux conseils subventionnaires ont adopté un énoncé de politique commun régissant toute la recherche avec des êtres humains entreprise au Canada. La politique énonce que les renseignements personnels au sujet des participants de l’étude ne doivent pas être communiqués. Toutefois, la politique recommande aussi ce qui suit :

« D’une façon générale, la meilleure façon de protéger la confidentialité des renseignements personnels passe par l’anonymat. Si les données conservées sont véritablement anonymes, la recherche ne fera l’objet que d’une évaluation minimale du CÉR [Comité d’éthique de la recherche]. » 30

Des procédures bien établies existent pour assurer l’anonymat des données et les chercheurs peuvent consulter les spécialistes des données de leur établissement de recherche pour savoir s’il y a lieu de rendre anonymes les données contenant des renseignements personnels et comment le faire de façon à pouvoir partager ces données. Du travail reste à faire pour bien faire connaître les techniques permettant d’assurer l’anonymat des données au sein des comités d’éthique de la recherche (CÉR). Malgré l’avis des trois conseils relativement à la possibilité de conserver en rendant anonymes les données traitant de sujets humains, beaucoup de CÉR demandent encore souvent aux chercheurs de détruire les données.

30 Énoncé de politique des trois Conseils : Éthique de la recherche avec des êtres humains: 2e édition. Décembre 2008. Groupe consultatif interagences en éthique de la recherche. www.ger.ethique.gc.ca/fra/policy-politique/initiatives/draft-preliminaire/

Si je partage mes données, je limite mes options d’exploitation de brevets et d’autres avantages économiques.

Les bons principes de gestion des données ne sont pas incompatibles avec ceux qui régissent la propriété intellectuelle et la propriété des données. Les chercheurs peuvent choisir de restreindre l’accès à leurs données afin de maximiser leurs avantages professionnels et économiques en reportant la communication des données jusqu’à la publication ou à l’application du brevet, ou en faisant appel à une licence d’utilisation non commerciale pour les données.

L’OCDE recommande de prendre en considération les mesures qui favorisent l’accès et l’exploitation à des fins non commerciales tout en protégeant les intérêts commerciaux, comme la communication différée ou partielle des données ou l’adoption volontaire de mécanismes d’octroi de licences. De telles mesures peuvent permettre aux principaux participants d’exploiter pleinement les données de la recherche, sans en interdire inutilement l’accès.

Les bonnes pratiques de gestion des données sont trop coûteuses.

La gestion des données, comme l’attribution de métadonnées, la gestion de dépôts et les activités de conservation des données ont bien entendu un coût mais les avantages dépassent largement ces coûts. Refaire la recherche pour obtenir les mêmes données est onéreux. De plus, c’est impossible dans de nombreux cas parce que les chercheurs, les sujets, les conditions des tests, etc. n’y sont plus. Le maintien d’un cadre fiable et ordonné pour protéger les investissements considérables consentis par les établissements dans la création de données de recherche représentent un coût relativement modeste comparativement à celui prohibitif de recréer ces données.

Page 15: Les données de recherche : un potentiel insoupçonné

Que peut-on faire sur le campus?Chercheurs

S’engager à communiquer les données de recherche le plus ouvertement possible. Élaborer un plan de gestion des données avant d’entamer un projet de recherche. Comprendre les politiques de gestion des données des organismes subventionnaires et s’y conformer. Faire appel aux spécialistes des données sur le campus pour de l’aide dans la collecte et la gestion des données de recherche. Repérer et utiliser les normes internationales pour la gestion des données.

Administrateurs universitaires

Élaborer des politiques qui favorisent la bonne gestion des données. Appuyer la mise en place de dépôts de données par l’établissement. Donner une formation aux chercheurs au sujet des pratiques de gestion des données. Aider les chercheurs en embauchant des spécialistes ou des bibliothécaires experts en matière de données et faire connaître ces spécialistes aux équipes de recherche (et les y intégrer). Reconnaître l’apport du partage des données dans l’embauche, les promotions et les nominations.

Bibliothèques de recherche

Mettre sur pied et gérer des dépôts de données pour l’établissement. Favoriser la formation des bibliothécaires dans le domaine de la gérance des données. Venir en aide aux chercheurs en embauchant des bibliothécaires experts en matière de données et en mettant ces spécialistes à la disposition de l’ensemble des chercheurs. Assurer la formation des chercheurs au sujet des pratiques de gestion des données.

Page 16: Les données de recherche : un potentiel insoupçonné

65 Université Privé, Pièce 238, Ottawa, (Ontario) K1N 9A5Tél: 613-562-5385 Télécopieur: 613-562-5297

[email protected] • www.carl-abrc.ca

L’Association des bibliothèques de recherche du Canada (ABRC) a été fondée en 1976. Elle regroupe les 28 principales bibliothèques de recherche universitaires au Canada, ainsi que Bibliothèque et Archives Canada, l’Institut canadien de l’information scientifique et technique (ICIST), et la Bibliothèque du Parlement. L’Association ne comprend que ces membres institutionnels et vise surtout à rassembler les bibliothèques des universités canadiennes qui ont des programmes de doctorat dans les arts, les sciences humaines et les sciences.

L’ABRC tâche d’augmenter la capacité des bibliothèques de recherche du Canada d’effectuer des partenariats dans la recherche et les études supérieures, cherchant à encourager un système de communication savante efficace et soutenable et une politique publique qui encourage la recherche et du large accès à l’information scientifique.

L’Association est associée à l’Association des universités et collèges du Canada (AUCC) et constituée en société à but non lucratif selon les dispositions de la Loi sur les corporations canadiennes.

Membres institutionnels de L’ABRC

University of AlbertaBibliothèque et Archives Canada

Bibliothèque du ParlementUniversity of British Columbia

Brock UniversityUniversity of CalgaryCarleton University

Concordia UniversityDalhousie UniversityUniversity of Guelph

ICIST (Institut canadien de l’information scientifique et

technique)

Université LavalUniversity of Manitoba

McGill UniversityMcMaster University

Memorial University of Newfoundland

Université de MontréalUniversity of New Brunswick

Université d’OttawaUniversité du Québec à Montréal

Queen’s UniversityUniversity of Regina

University of SaskatchewanUniversité de SherbrookeSimon Fraser University

University of TorontoUniversity of Victoria

University of WaterlooUniversity of Western Ontario

University of WindsorYork University

Directeur général : Brent Roe Président : Ernie Ingles, MSRC (2009 – 2011)